AI 日报 | 2026-06-03 周三
1. 今日核心动态
Microsoft Build 2026:7款新模型 + AI Agent 操作系统
Microsoft Build 2026 开发者大会成为今日最密集的 AI 发布平台:
- MAI-Code-1-Flash:Microsoft 全新自研编码模型,专为 GitHub Copilot 打造,在 SWE-Bench Pro 上以 51.2% vs 35.2% 大幅领先 Claude Haiku 4.5,且 token 用量减少最多 60%。已在 VS Code 向 Copilot 个人用户推出。(来源:microsoft.ai)
- MAI-Thinking-1:Microsoft 首个高级推理 AI 模型,定位为处理复杂问题的中量级价格模型,在 SWE-Bench Pro 上取得顶尖成绩。(来源:The Verge)
- Project Solara:Microsoft 发布面向 AI Agent 而非 App 设计的 Android 操作系统,被视为"后 App 时代"的重要布局。(来源:Ars Technica)
- Microsoft Scout:基于 OpenClaw 构建的 AI 个人助手,同时推出 Microsoft Execution Containers 增强安全运行能力。(来源:TechCrunch)
- AI 行为测试工具:新工具让开发者通过文本描述自动生成 AI 行为测试。(来源:TechCrunch)
- 共发布 7 款新模型,涵盖编码、推理、图像生成、语音转录等方向。(来源:microsoft.ai)
Anthropic 正式提交 IPO 申请
Anthropic 已正式提交上市申请,这是 AI 基础模型领域最大的一起 IPO。与此同时,Claude Mythos 安全模型扩展至 15+ 国家的关键基础设施领域,Project Glasswing 新增约 150 家组织。(来源:TechCrunch、The Verge)
OpenAI Codex 与 ChatGPT 合体
OpenAI 宣布将 Codex 整合进 ChatGPT,推出三大核心升级。Codex 周活跃用户已达 500 万,定位从编程工具扩展到白领知识工作。新增插件和企业功能,支持创建可托管的交互式网站和应用。(来源:36氪/新智元、The Verge)
2. 模型发布与更新
| 模型 | 厂商 | 要点 |
|---|---|---|
| MAI-Code-1-Flash | Microsoft | 自研编码模型,SWE-Bench Pro 51.2%,token 用量减少 60% |
| MAI-Thinking-1 | Microsoft | 首个高级推理模型,中量级价格 |
| MAI-Image-2.5 | Microsoft | 图像生成,Arena 编辑榜第 2 |
| MAI-Voice-2 | Microsoft | 10 语言语音合成 |
| MAI-Transcribe-1.5 | Microsoft | 领先 FLEURS 语音转录 |
| GPT-5.5 系列(持续更新) | OpenAI | GPT-5.5 Instant 优化回复长度,Canvas 接口随旧模型逐步退役 |
| Opus 4.8 | Anthropic | ARC-AGI 断崖领先 GPT-5.5 近 4 倍,但价格昂贵引发争议 |
| MAI-Code-1-Flash | Microsoft | 186 题对抗性基准测试达 85.8% 调整准确率 |
开源动态:
- Stanford Law 研究显示 AI 在法律任务中表现超越法学教授(来源:HN/Stanford)
- Paseo:开源编码 Agent 界面,在 HN 引起关注(来源:GitHub)
3. 工具与产品
GitHub Copilot 按量计价引发争议
GitHub Copilot 新的 token 计费模式遭到开发者强烈反弹。有用户报告一天内耗尽整月 AI 额度。Token-based billing 被称为"toxenmaxxing",Amazon 已因员工滥用 AI Agent 刷榜而紧急关闭内部排行榜。(来源:Ars Technica、TechCrunch)
Google Gemini Spark 及产品更新
- Gemini Spark:Google 24/7 AI 助手获多方好评,实测体验"令人印象深刻但也令人不安"(来源:The Verge)
- Google 假电话检测:Android Phone 应用新增 AI deepfake 语音冒充检测(来源:The Verge)
- Google Photos 数字衣橱:AI 虚拟穿搭功能上线(来源:The Verge)
豆包即将收费
字节跳动旗下豆包 AI 宣布即将启动付费模式,最高档 5088 元/年。这标志着国产 AI 聊天机器人的免费时代正在终结。(来源:36氪)
其他工具更新
- Copilot Health:Microsoft 健康AI进入预览,可分析医疗记录(来源:The Verge)
- DLSS 4.5 Ray Reconstruction:Nvidia 新 AI 渲染技术,支持所有 RTX GPU(来源:The Verge)
4. 行业动态
芯片与硬件
- Nvidia RTX Spark:Nvidia 发布 ARM 架构 CPU+GPU 超级芯片,联合 Microsoft、Dell、HP 推出 AI Agent PC,直指 $2000 亿 CPU 市场。首批 RTX Spark 笔记本已在 Computex 展出。(来源:TechCrunch)
- Intel Crescent Island:Intel 宣布即将推出比 Nvidia/AMD 更便宜、更凉快的 AI 芯片,采用 LPDDR5 内存。(来源:Ars Technica)
- Nvidia 投资$1500 亿/年在台湾打造 AI 中心(来源:Ars Technica)
融资与并购
| 公司 | 金额 | 要点 |
|---|---|---|
| Anthropic | IPO | 正式提交上市申请 |
| Alphabet | $800 亿融资 | 用于 AI 数据中心、TPU 芯片和 Gemini 训练 |
| SoftBank | €750 亿 | 在法国建设数据中心 |
| 千寻智能 | 45 亿(3个月) | 具身智能融资纪录,硬刚英伟达 |
| 星尘智能 | 超 10 亿 B 轮 | 深圳具身智能公司,估值破百亿 |
| Cyera | $120 亿估值 | AI 安全公司,80x ARR |
| Impulse | $5 亿 | 火箭发动机,明确"招人不用 AI" |
| ZeroDrift | $1000 万 | 保护 AI 模型免受自身错误影响 |
政策法规
- 特朗普签署缩水版 AI 行政令:原计划更严格的 AI 模型发布前审查令在行业反对后大幅缩水,是否向政府共享信息由 AI 公司自行决定。(来源:TechCrunch、Politico/HN)
- 佛罗里达州起诉 OpenAI:因多起与 ChatGPT 相关的暴力事件,佛罗里达 AG 起诉 OpenAI 和 Sam Altman,指控其"对人类生命完全漠视"。(来源:Ars Technica)
- Amazon 面临集体诉讼:Ring 面部识别功能被起诉(来源:TechCrunch)
国内动态
- 字节 AI 大将顾全全离职:从 AlphaFold 3 打爆到 LLM 基建,顶尖学者离开字节跳动引发关注。(来源:36氪/新智元)
- 微信扛旗 AI 总攻:微信在腾讯 AI 战略中地位凸显。(来源:36氪)
- DeepSeek 降本潜力:分析认为 DeepSeek 的优化技术可能为中国 AI 基建节省万亿美元。(来源:36氪)
安全与伦理
- Meta AI 客服机器人被利用盗取名人 Instagram 账号:黑客利用 Meta AI 支持聊天机器人劫持知名账号后转售。(来源:Ars Technica)
- 数学界警告 AI 威胁:国际数学联盟发布 AI 对数学职业的威胁警告。(来源:Ars Technica)
- OpenAI 数学突破:OpenAI 模型解决了困扰人类 80 年的数学问题。(来源:Ars Technica)
5. 值得关注
深度阅读
- Agentic Mfw — 对当下"万物皆 Agent"炒作潮的辛辣讽刺(来源:HN)
- AI 精神病辩论 — TechCrunch 深度分析 AI 精神病争议(来源:TechCrunch)
- 如何为 RAG 索引图像 — 实用技术指南,HN 热门(来源:HN)
- Coders 拒绝在没有 AI 的情况下工作 — AI 依赖的隐患分析(来源:TechCrunch)
- Can A.I. produce writing that we want to read? — 《纽约客》对 AI 写作质量的反思(来源:HN)
社区热议
- Hacker News Top: MAI-Code-1-Flash(418 points, 178 comments)、Anthropic Glasswing 扩展(163 points)、特朗普 AI 行政令(188 points, 133 comments)
- AI 在法律考试中超越法学教授:Stanford Law 研究引发 HN 热议(129 points, 120 comments)
- Uber 4 个月烧完 AI 预算后紧急设限:企业 AI 支出失控的典型案例(来源:TechCrunch)
- Martin Scorsese 与 AI:大导演用 Black Forest Labs 做故事板预览,被视为好莱坞对 AI 态度软化的信号(来源:TechCrunch)
即将发生
- Apple WWDC 2026(6 月 8 日):Siri 大升级 + iOS 27 预计发布,Apple 正在尝试将 Google 万亿参数 Gemini 蒸馏到 iPhone 本地运行(来源:Ars Technica)
- OpenAI GPT-5.6:传闻本周发布,奥特曼亲自上阵(来源:36氪/新智元)
信息截止时间:2026-06-03 12:00 CST。信息主要来源为 TechCrunch、The Verge、Ars Technica、Hacker News、36氪等公开渠道。未经特别标注的国内信息来源于 36氪 AI 频道。