要闻提示

NEWS REMIND

1.Google DeepMind开源DiffusionGemma,扩散模型文本生成提速4倍

2.Perplexity将Claude Fable 5集成为编排模型,开发者生态扩展

3.Anthropic CEO发表AI指数政策长文,呼吁FAA式监管+0M奖学金计划

4.Meta被欧盟强制允许竞争对手AI在WhatsApp免费运行

5.Cohere Transcribe登顶HuggingFace远场语音识别排行榜

6.xAI拿下首个企业Agent大客户eToro,金融场景落地

7.Oracle Q4超预期但宣布再募200亿美元,股价下跌

8.研究者声称仅用1,500美元从头训练基础模型

今日头条

HEADLINE NEWS

谷歌DeepMind开源DiffusionGemma,扩散文本生成路线挑战自回归

AI文本生成的底层技术路线正在迎来转折。 6月10日,Google DeepMind发布DiffusionGemma,一款采用扩散模型而非传统自回归方法进行文本生成的开源模型。

传统自回归模型受限于串行计算每次只生成一个token,然而DiffusionGemma一次生成256个token,再通过迭代去噪优化输出质量。在 Nvidia GPU 硬件上,该模型每秒可处理多达 1000 个 token。

DeepMind的基准测试显示,在相同算力条件下,DiffusionGemma 的运行速度比此前的 Gemma 自回归模型快 4 倍。另一份基准报告在 Nvidia 硬件上进行的长上下文推理测试中,确认其 token 吞吐量提升达 10 倍。


数据显示,自项目启动以来,团队专注于探索「更快的文本生成方法」。目前DiffusionGemma规模较小,在复杂推理任务上与传统自回归模型仍有差距。但从行业角度看,扩散方法在文本生成中的可行应用,标志着AI效率竞赛从「更大模型」转向「更聪明生成」的新阶段。(Google DeepMind)

硅谷资讯

Silicon Valley News

告别纯聊天时代,马斯克xAI正式进军B端,首个企业级Agent落地金融赛道

xAI从聊天机器人向企业Agent平台迈出了实质性一步。

6月10日,xAI宣布Tori Agent正式上线,这是为全球社交投资平台eToro打造的AI Agent。

Tori利用SpaceXAI的实时数据和模型帮助用户分析市场。eToro拥有数千万用户,其Agent需求天然适合AI驱动的交易分析和市场洞察。

对于xAI而言,这是其首个公开披露的企业客户案例。此前xAI的主要产品是面向消费者的Grok聊天机器人,Tori的落地意味着马斯克的AI帝国正式进入B端赛道。

作为参考,Bloomberg的AI金融分析系统已在华尔街积累了数十年的数据优势。xAI的差异化在于SpaceXAI的实时数据能力和Grok积累的多模态交互经验。(xAI)

Anthropic CEO发表AI指数政策檄文,留给普通人的时间只剩两年?

AI安全竞赛正在从拼技术转向拼政策。

6月10日,Anthropic CEO Dario Amodei发表长文「Policy on the AI Exponential」,系统性阐述他对AI治理的完整框架。Amodei指出,AI的进展速度已远超政策制定体系的承受能力,两者之间的鸿沟正在成为当前最大的公共安全风险。

Amodei从监管与公共安全、宏观经济与税收政策、科技创新、国家与社会之间的权力平衡以及地缘政治等五个方面讨论了人工智能时代需要重新构想的问题和应对策略,同时还公布的还有一项1.5亿美元的全国奖学金计划,专门资助早期职业人才进入AI安全和政策领域。

Amodei在推文中强调,人工智能的扩展规律预测,随着计算能力的提升,其通用认知能力将呈指数级增长,这种扩展规律再持续一两年,很可能会迎来“强大人工智能”,或者说“一个由数据中心里的天才组成的国家”。(darioamodei.com)

Meta被欧盟强制允许竞争对手AI在WhatsApp免费运行

全球科技监管正在从「反垄断」进化到「反AI垄断」。

6月9日,欧盟裁定Meta不得限制竞争对手的AI聊天机器人在WhatsApp免费运行。这一裁决打破了Meta在即时通讯领域通过平台优势排挤竞品的商业策略。

WhatsApp拥有超过20亿月活用户,允许竞品AI进入意味着独立AI创业公司可直接触达全球最大通讯平台的用户。

数据显示,欧盟近年来对大型科技公司的监管力度持续加大。这一裁决被视为数字市场法案在实际执行中的延伸,预计将对其他平台的AI竞争策略产生连锁效应。(Reuters)

Perplexity将Claude Fable 5集成作为编排模型,Anthropic生态加速扩张

Anthropic在商业化道路上迈出关键一步。

6月11日,Perplexity AI宣布将Claude Fable 5集成到其Computer功能中,作为orchestrator模型使用。

Fable 5被描述为「Anthropic最先进的模型」,负责在电脑操控场景中执行任务调度和编排。

Perplexity作为AI搜索领域的新锐力量,选择Anthropic而非OpenAI模型作为编排引擎,表明Fable 5在企业级集成环境中的竞争力正在被验证。Anthropic的双线策略,Mythos展示技术天花板、Fable 5负责商业变现,正在产生实际效果。(Perplexity AI)

Cohere Transcribe登顶HuggingFace远场语音识别,开源ASR赛道迎来强力竞争者

开源语音识别赛道的竞争格局正在被改写。

6月10日,Cohere发布开源语音识别模型Cohere Transcribe,在HuggingFace新推出的远场ASR基准测试中排名第一。

远场ASR解决的是「距离麦克风较远环境下准确识别语音」的难题,适用于会议室、车载、智能家居等场景。与OpenAI Whisper对比,Whisper在近场场景表现优异,但在远场场景下准确率下降明显。目前Cohere Transcribe已完全开源,开发者可自托管部署。

此前Cohere以Command系列大模型闻名,专注企业级文本AI。这款开源模型的发布标志着公司从纯语言模型向多模态战略的正式扩展,开源语音识别领域的进入壁垒正在被此类高质量开源项目持续降低。(Cohere)

Oracle Q4超预期但数据中心扩张成本引发市场担忧

AI基础设施的超大规模投资正在接受华尔街的重新审视。

6月10日,Oracle公布Q4财报,营收和利润均超出市场预期。然而公司同时宣布计划再融资200亿美元用于数据中心扩张。这一消息导致股价在盘后交易中下跌。

Oracle在AI基础设施领域的激进投入并非孤例。CoreWeave等AI算力租赁公司的融资成本在信用评级反弹后有所下降,但市场对AI基础设施投入过度的担忧正在积累。

Oracle的「超预期收益+大规模再融资」模式,反映出AI算力投资的典型困境:需求真实存在,但供给端的资本投入规模已大到足以引发回报率质疑。

Bloomberg报道多家华尔街机构正在探索「算力期货」等新型金融工具来对冲AI基础设施的融资风险。(CNBC)

研究者声称仅用1500美元从头训练基础模型,算力门槛争论再起

AI行业的「算力门槛」正在受到系统性挑战。6月10日,VentureBeat报道一组研究人员声称仅用约1500美元的计算成本就从头训练了一个基础模型。

这一声明在开发者社区引发激烈争论。支持者认为,算力成本降低有利于AI民主化,让更多小型团队和个人研究者能够参与基础模型研发。反对者则质疑该模型的基准测试完整性和泛化能力,指出低预算训练的模型在实际场景中的表现可能与大型模型存在显著差距。

从历史数据看,主流大模型的训练成本从GPT-3的约460万美元到GPT-4的约1亿美元,呈持续上升趋势。如果1,500美元训练模型的声明得到同行验证,意味着算力叙事发生根本性转折(VentureBeat)

Warner Music收购AI归因创业公司Sureel AI,版权技术成音乐巨头必争之地

AI音乐版权正在从一个法律问题变成一个技术问题。

6月10日,TechCrunch报道华纳音乐收购了AI内容归因创业公司Sureel AI。Sureel AI的核心技术是识别和追踪AI生成音乐中的内容来源,帮助版权方在AI训练数据中追溯原始作品的使用情况。

华纳音乐是三大唱片集团之一,其在AI归因技术上的布局意味着大型版权方正在从「起诉侵权」转向「技术管控」。AI音乐生成市场规模在2025年已突破10亿美元,与之相关的版权追索技术被视为下一波音乐科技投资的重点方向。(TechCrunch)

长期征集爆料线索:关于科技互联网公司的最新内幕动向或传闻、业务调整、人事变动等消息,当然,如果你想吐槽一些科技公司的奇闻趣事,也请尽管砸过来,欢迎爆料,随时在线等。

今日热门视频