AI 日报 | 2026-06-05 周五

1. 今日核心动态

Anthropic 发布递归自改进（RSI）重磅报告，AI 正在加速构建 AI

Anthropic Institute 发布了一篇题为《When AI builds itself》的重要文章，系统性地展示了 AI 正在加速自身开发的证据。这是迄今为止最详细的 AI 自我加速发展公开报告。

关键数据：
- Anthropic 工程师现在每季度提交的代码量是 2021-2025 年平均水平的 8 倍，其中 超过 80% 的代码由 Claude 编写
- Claude Mythos Preview 在代码优化任务中实现了 52 倍速度提升（2025 年 5 月 Claude Opus 4 为 3 倍）
- 在开放性任务上，Claude 的成功率从 2025 年 11 月的 26% 跃升至 2026 年 5 月的 76%
- 在研究判断力测试中，Mythos Preview 在 64% 的情况下做出了比人类更好的下一步决策（Opus 4.5 为 51%）

核心论点： Anthropic 认为完整的递归自改进"尚未到来，但可能比大多数机构准备得更快"。报告提出了三种未来情景，呼吁建立全球协调机制以应对 RSI 风险。

来源：Anthropic Institute - When AI builds itself

Anthropic 提交 IPO 申请，估值近万亿美元

Anthropic 已向美国 SEC 提交保密 S-1 注册声明，正式启动 IPO 流程。此前 Anthropic 在 Series H 融资中筹集了 650 亿美元，估值达到 9650 亿美元。公司收入 run-rate 已超过 470 亿美元（2025 年底为 90 亿美元）。

同期，SpaceX 计划以 1.77 万亿美元估值上市，OpenAI 也在等待 IPO 时机。Alphabet 刚刚完成了创纪录的 850 亿美元股票发售（其中伯克希尔·哈撒韦购入 100 亿美元），资金将投入 AI 基础设施建设。

来源：TechCrunch, TechCrunch

2. 模型发布与更新

Google 发布 Gemma 4 12B：16GB RAM 笔记本即可运行

Google 发布 Gemma 4 系列的新成员——Gemma 4 12B，填补了移动端与专业模型之间的空白。该模型采用 Apache 2.0 开源许可，核心特性包括：

120 亿参数，仅需 16GB 系统内存或显存即可本地运行
内置 Multi-Token Prediction (MTP)，首次在 Gemma 4 系列中默认启用推测解码
全新的多模态处理方式：图像采用精简嵌入模块（单矩阵乘法+位置编码），音频直接投影为文本 token 向量，无需独立编码器
性能接近 260 亿参数的 Gemma 4 26B MoE 版本
模型权重约 18GB，已在 Kaggle 和 Hugging Face 开放下载

来源：Ars Technica

Anthropic 扩大 Claude Mythos Preview 访问范围

Anthropic 将 Claude Mythos Preview 扩展到约 150 家组织，覆盖电力、水务、医疗等关键基础设施行业，通过 Project Glasswing 计划用于发现安全漏洞。METR 测试显示 Mythos Preview 可以持续工作至少 16 小时。

来源：The Verge

NVIDIA 发布 Cosmos 3：首个面向物理 AI 推理与行动的开放全模态模型

NVIDIA 在 Hugging Face 博客发布 Cosmos 3，定位为首个面向物理 AI 的开放全模态模型，支持推理和行动任务。

来源：Hugging Face Blog

JetBrains 发布 Mellum2：12B MoE 代码模型

JetBrains 发布 Mellum2，一个 120 亿参数的 Mixture-of-Experts 代码模型，定位为编程辅助。

来源：Hugging Face Blog

Hcompany 发布 Holo 3.1：本地化 Computer Use Agent

Holo 3.1 是一个本地运行的 Computer Use Agent，支持在端侧执行 GUI 操作自动化任务。

来源：Hugging Face Blog

Black Forest Labs 发布 FLUX.2 [klein] LoRA 微调方案

支持在 60 分钟内完成 LoRA 微调，降低图像生成模型的定制化门槛。

来源：Hugging Face Blog

3. 工具与产品

Microsoft Build 2026：Scout 助手与 Project Solara

Microsoft 在 Build 2026 开发者大会上发布了一系列重要产品和功能：

Microsoft Scout：基于 OpenClaw 构建的 AI 个人助手，集成在 Windows 生态中
Project Solara：专为 AI Agent 设计的操作系统（基于 Android），以 Agent 取代传统 App 交互范式
Microsoft Execution Containers：为 OpenClaw 提供 Windows 安全沙箱环境
MAI Thinking 1：微软首个高级推理 AI 模型
AI 行为测试工具：开发者可通过文本描述生成 AI 行为测试
Agent 行为控制框架：提供更好的 AI Agent 行为约束方案

与此同时，Microsoft 和 OpenAI 的竞争关系进一步公开化。The Verge 报道称"Microsoft and OpenAI broke up — now they're ready to fight"。

来源：The Verge, Ars Technica

ChatGPT 记忆系统升级全面推出

OpenAI 将升级版的 ChatGPT 记忆系统向所有用户推出。新版本基于"做梦"功能，可在后台整理对话并保存信息，更好地更新记忆和"记住"用户偏好。ChatGPT Plus 和 Pro 用户已可用，免费用户将在未来几周内获得访问。

来源：The Verge

OpenAI Codex 拓展至非编程场景

OpenAI 宣布 Codex 拥有 500 万周活用户，并推出新插件和面向企业客户的预览版，支持构建交互式托管网站和应用。Codex 正从一个编程工具扩展为通用知识工作平台。

来源：The Verge

Meta 发布 Creator Assistant 和 WhatsApp Business AI Agent

Creator Assistant：Facebook 平台上的 AI 创作者助手
WhatsApp Business AI Agent：正式面向全球市场推出
Meta 采用帐篷式数据中心架构（借鉴 Tesla 模式）加速算力部署

来源：TechCrunch

Google 发布 Dreambeans AI 工具

Google 的 Dreambeans 可将用户的生活照片转化为卡通风格，是其最新推出的 AI 创意工具。

来源：TechCrunch

Apple 批准首个 Messages for Business AI Agent

Apple 批准 Poke 成为 Messages for Business 平台上的首个 AI Agent。WWDC 2026 即将到来，市场高度期待 Siri 的全面改版和 Apple Intelligence 更新。

来源：TechCrunch

Hugging Face 发布面向 Agent 的 CLI 工具

Hugging Face 推出专为 AI Agent 优化的 CLI 工具，旨在让 Agent 更高效地与 Hugging Face Hub 交互。

来源：Hugging Face Blog

4. 行业动态

ChatGPT 月活突破 10 亿，创史上最快纪录

据 Sensor Tower 数据，ChatGPT 在上线约三年后月活跃用户突破 10 亿，成为达到这一里程碑最快的应用，超过了 Google Maps、TikTok、Instagram 和 YouTube。

来源：Reuters via The Verge

美国两党推出 AI 监管框架草案，可能先发制各州法律

众议员 Jay Obernolte (R-CA) 和 Lori Trahan (D-MA) 发布了 269 页的 AI 监管草案，可能先发制人地冻结各州 AI 法律三年。这是美国联邦层面 AI 立法的重要进展。

来源：Politico via The Verge

Suno 完成 4 亿美元融资，估值翻倍至 54 亿美元

AI 音乐生成公司 Suno 在 D 轮融资中筹集 4 亿美元，估值从 6 个月前的 24.5 亿美元翻倍至 54 亿美元。尽管面临版权诉讼，投资者依然看好。

来源：The Verge

TSMC 承认难以跟上 AI 算力需求

台积电表示"我们只能支持这么多"，美国本土产能满足客户需求可能需要"很长时间"。

来源：The Verge

数据中心建设引发广泛社区反弹

美国多地居民反对数据中心建设：
- Kevin O'Leary 的犹他州 Project Stratos 被要求缩减 75%
- 共和党议员要求 FBI 调查外国势力是否在煽动反数据中心情绪
- 华尔街日报报道美国数据中心建设严重落后于计划

来源：The Verge

Google 隐秘购买 Android 开发者代码训练 AI

据 404 Media 报道，Google 正在悄悄向 Google Play 开发者付费购买代码，用于训练 AI 编程模型。

来源：404 Media via The Verge

Google 被要求允许出版商退出 AI Search

英国监管机构裁定 Google 必须在 AI Overviews 中提供更清晰的来源链接，并允许英国出版商选择退出 AI 搜索功能。

来源：Ars Technica

佛罗里达州起诉 OpenAI

佛罗里达州总检察长在多起与 ChatGPT 相关的谋杀案后起诉 OpenAI 和 Sam Altman，指控其对人类生命"完全漠视"。

来源：Ars Technica

国内动态

字节、阿里、腾讯 AI 平台战争：36氪报道三大巨头正在争夺 AI 平台的时间窗口
比亚迪官宣自研人形机器人："尧舜禹"计划曝光，已秘密研发 4 年
Anthropic 95% 业务分析交给 Claude：新智元报道 Anthropic 内部方法论
开源模型 Ideogram 4.0：93 亿参数击败 800 亿参数模型，解决 AI 生图文字难题
倒卖 AI Token 灰色产业链：月入百万的隐秘生意引发关注

来源：36氪

重要学术/研究

爱沙尼亚政府 benchmark：测试各 LLM 对抗俄罗斯宣传的能力，不同模型表现差异显著
OpenAI 数学突破：OpenAI 模型解决了困扰人类 80 年的数学问题
Hugging Face Agentic RL：发布 Token-In, Token-Out (TITO) 方法论文
Ted Chiang 在《大西洋月刊》发文："AI 不是有意识的"，引发广泛讨论

来源：Ars Technica, The Atlantic via The Verge

5. 值得关注

Anthropic 递归自改进报告 — 迄今最详细的 AI 自加速发展证据，必读文献
Ted Chiang: AI 不是有意识的 — 著名科幻作家对 AI 意识问题的清晰反驳
The Verge: Microsoft 和 OpenAI 分手了 — AI 行业最大联盟的破裂深度报道
As AI gets better, it reveals an empty promise — The Verge 编辑部对 AI 承诺与现实的反思
GitHub Copilot 新定价引发开发者愤怒 — Token 计费模式下有用户一天耗尽月度额度

以上信息基于 2026 年 6 月 3-5 日的公开报道汇总。部分内容未经独立验证。