1. 今日核心动态

Anthropic 发布递归自改进(RSI)重磅报告,AI 正在加速构建 AI

Anthropic Institute 发布了一篇题为《When AI builds itself》的重要文章,系统性地展示了 AI 正在加速自身开发的证据。这是迄今为止最详细的 AI 自我加速发展公开报告。

关键数据:
- Anthropic 工程师现在每季度提交的代码量是 2021-2025 年平均水平的 8 倍,其中 超过 80% 的代码由 Claude 编写
- Claude Mythos Preview 在代码优化任务中实现了 52 倍速度提升(2025 年 5 月 Claude Opus 4 为 3 倍)
- 在开放性任务上,Claude 的成功率从 2025 年 11 月的 26% 跃升至 2026 年 5 月的 76%
- 在研究判断力测试中,Mythos Preview 在 64% 的情况下做出了比人类更好的下一步决策(Opus 4.5 为 51%)

核心论点: Anthropic 认为完整的递归自改进"尚未到来,但可能比大多数机构准备得更快"。报告提出了三种未来情景,呼吁建立全球协调机制以应对 RSI 风险。

来源:Anthropic Institute - When AI builds itself

Anthropic 提交 IPO 申请,估值近万亿美元

Anthropic 已向美国 SEC 提交保密 S-1 注册声明,正式启动 IPO 流程。此前 Anthropic 在 Series H 融资中筹集了 650 亿美元,估值达到 9650 亿美元。公司收入 run-rate 已超过 470 亿美元(2025 年底为 90 亿美元)。

同期,SpaceX 计划以 1.77 万亿美元估值上市,OpenAI 也在等待 IPO 时机。Alphabet 刚刚完成了创纪录的 850 亿美元股票发售(其中伯克希尔·哈撒韦购入 100 亿美元),资金将投入 AI 基础设施建设。

来源:TechCrunch, TechCrunch


2. 模型发布与更新

Google 发布 Gemma 4 12B:16GB RAM 笔记本即可运行

Google 发布 Gemma 4 系列的新成员——Gemma 4 12B,填补了移动端与专业模型之间的空白。该模型采用 Apache 2.0 开源许可,核心特性包括:

  • 120 亿参数,仅需 16GB 系统内存或显存即可本地运行
  • 内置 Multi-Token Prediction (MTP),首次在 Gemma 4 系列中默认启用推测解码
  • 全新的多模态处理方式:图像采用精简嵌入模块(单矩阵乘法+位置编码),音频直接投影为文本 token 向量,无需独立编码器
  • 性能接近 260 亿参数的 Gemma 4 26B MoE 版本
  • 模型权重约 18GB,已在 Kaggle 和 Hugging Face 开放下载

来源:Ars Technica

Anthropic 扩大 Claude Mythos Preview 访问范围

Anthropic 将 Claude Mythos Preview 扩展到约 150 家组织,覆盖电力、水务、医疗等关键基础设施行业,通过 Project Glasswing 计划用于发现安全漏洞。METR 测试显示 Mythos Preview 可以持续工作至少 16 小时。

来源:The Verge

NVIDIA 发布 Cosmos 3:首个面向物理 AI 推理与行动的开放全模态模型

NVIDIA 在 Hugging Face 博客发布 Cosmos 3,定位为首个面向物理 AI 的开放全模态模型,支持推理和行动任务。

来源:Hugging Face Blog

JetBrains 发布 Mellum2:12B MoE 代码模型

JetBrains 发布 Mellum2,一个 120 亿参数的 Mixture-of-Experts 代码模型,定位为编程辅助。

来源:Hugging Face Blog

Hcompany 发布 Holo 3.1:本地化 Computer Use Agent

Holo 3.1 是一个本地运行的 Computer Use Agent,支持在端侧执行 GUI 操作自动化任务。

来源:Hugging Face Blog

Black Forest Labs 发布 FLUX.2 [klein] LoRA 微调方案

支持在 60 分钟内完成 LoRA 微调,降低图像生成模型的定制化门槛。

来源:Hugging Face Blog


3. 工具与产品

Microsoft Build 2026:Scout 助手与 Project Solara

Microsoft 在 Build 2026 开发者大会上发布了一系列重要产品和功能:

  • Microsoft Scout:基于 OpenClaw 构建的 AI 个人助手,集成在 Windows 生态中
  • Project Solara:专为 AI Agent 设计的操作系统(基于 Android),以 Agent 取代传统 App 交互范式
  • Microsoft Execution Containers:为 OpenClaw 提供 Windows 安全沙箱环境
  • MAI Thinking 1:微软首个高级推理 AI 模型
  • AI 行为测试工具:开发者可通过文本描述生成 AI 行为测试
  • Agent 行为控制框架:提供更好的 AI Agent 行为约束方案

与此同时,Microsoft 和 OpenAI 的竞争关系进一步公开化。The Verge 报道称"Microsoft and OpenAI broke up — now they're ready to fight"。

来源:The Verge, Ars Technica

ChatGPT 记忆系统升级全面推出

OpenAI 将升级版的 ChatGPT 记忆系统向所有用户推出。新版本基于"做梦"功能,可在后台整理对话并保存信息,更好地更新记忆和"记住"用户偏好。ChatGPT Plus 和 Pro 用户已可用,免费用户将在未来几周内获得访问。

来源:The Verge

OpenAI Codex 拓展至非编程场景

OpenAI 宣布 Codex 拥有 500 万周活用户,并推出新插件和面向企业客户的预览版,支持构建交互式托管网站和应用。Codex 正从一个编程工具扩展为通用知识工作平台。

来源:The Verge

Meta 发布 Creator Assistant 和 WhatsApp Business AI Agent

  • Creator Assistant:Facebook 平台上的 AI 创作者助手
  • WhatsApp Business AI Agent:正式面向全球市场推出
  • Meta 采用帐篷式数据中心架构(借鉴 Tesla 模式)加速算力部署

来源:TechCrunch

Google 发布 Dreambeans AI 工具

Google 的 Dreambeans 可将用户的生活照片转化为卡通风格,是其最新推出的 AI 创意工具。

来源:TechCrunch

Apple 批准首个 Messages for Business AI Agent

Apple 批准 Poke 成为 Messages for Business 平台上的首个 AI Agent。WWDC 2026 即将到来,市场高度期待 Siri 的全面改版和 Apple Intelligence 更新。

来源:TechCrunch

Hugging Face 发布面向 Agent 的 CLI 工具

Hugging Face 推出专为 AI Agent 优化的 CLI 工具,旨在让 Agent 更高效地与 Hugging Face Hub 交互。

来源:Hugging Face Blog


4. 行业动态

ChatGPT 月活突破 10 亿,创史上最快纪录

据 Sensor Tower 数据,ChatGPT 在上线约三年后月活跃用户突破 10 亿,成为达到这一里程碑最快的应用,超过了 Google Maps、TikTok、Instagram 和 YouTube。

来源:Reuters via The Verge

美国两党推出 AI 监管框架草案,可能先发制各州法律

众议员 Jay Obernolte (R-CA) 和 Lori Trahan (D-MA) 发布了 269 页的 AI 监管草案,可能先发制人地冻结各州 AI 法律三年。这是美国联邦层面 AI 立法的重要进展。

来源:Politico via The Verge

Suno 完成 4 亿美元融资,估值翻倍至 54 亿美元

AI 音乐生成公司 Suno 在 D 轮融资中筹集 4 亿美元,估值从 6 个月前的 24.5 亿美元翻倍至 54 亿美元。尽管面临版权诉讼,投资者依然看好。

来源:The Verge

TSMC 承认难以跟上 AI 算力需求

台积电表示"我们只能支持这么多",美国本土产能满足客户需求可能需要"很长时间"。

来源:The Verge

数据中心建设引发广泛社区反弹

美国多地居民反对数据中心建设:
- Kevin O'Leary 的犹他州 Project Stratos 被要求缩减 75%
- 共和党议员要求 FBI 调查外国势力是否在煽动反数据中心情绪
- 华尔街日报报道美国数据中心建设严重落后于计划

来源:The Verge

Google 隐秘购买 Android 开发者代码训练 AI

据 404 Media 报道,Google 正在悄悄向 Google Play 开发者付费购买代码,用于训练 AI 编程模型。

来源:404 Media via The Verge

Google 被要求允许出版商退出 AI Search

英国监管机构裁定 Google 必须在 AI Overviews 中提供更清晰的来源链接,并允许英国出版商选择退出 AI 搜索功能。

来源:Ars Technica

佛罗里达州起诉 OpenAI

佛罗里达州总检察长在多起与 ChatGPT 相关的谋杀案后起诉 OpenAI 和 Sam Altman,指控其对人类生命"完全漠视"。

来源:Ars Technica

国内动态

  • 字节、阿里、腾讯 AI 平台战争:36氪报道三大巨头正在争夺 AI 平台的时间窗口
  • 比亚迪官宣自研人形机器人:"尧舜禹"计划曝光,已秘密研发 4 年
  • Anthropic 95% 业务分析交给 Claude:新智元报道 Anthropic 内部方法论
  • 开源模型 Ideogram 4.0:93 亿参数击败 800 亿参数模型,解决 AI 生图文字难题
  • 倒卖 AI Token 灰色产业链:月入百万的隐秘生意引发关注

来源:36氪

重要学术/研究

  • 爱沙尼亚政府 benchmark:测试各 LLM 对抗俄罗斯宣传的能力,不同模型表现差异显著
  • OpenAI 数学突破:OpenAI 模型解决了困扰人类 80 年的数学问题
  • Hugging Face Agentic RL:发布 Token-In, Token-Out (TITO) 方法论文
  • Ted Chiang 在《大西洋月刊》发文:"AI 不是有意识的",引发广泛讨论

来源:Ars Technica, The Atlantic via The Verge


5. 值得关注

  1. Anthropic 递归自改进报告 — 迄今最详细的 AI 自加速发展证据,必读文献
  2. Ted Chiang: AI 不是有意识的 — 著名科幻作家对 AI 意识问题的清晰反驳
  3. The Verge: Microsoft 和 OpenAI 分手了 — AI 行业最大联盟的破裂深度报道
  4. As AI gets better, it reveals an empty promise — The Verge 编辑部对 AI 承诺与现实的反思
  5. GitHub Copilot 新定价引发开发者愤怒 — Token 计费模式下有用户一天耗尽月度额度

以上信息基于 2026 年 6 月 3-5 日的公开报道汇总。部分内容未经独立验证。