1. 今日核心动态

Microsoft Build 2026:7款新模型 + AI Agent 操作系统

Microsoft Build 2026 开发者大会成为今日最密集的 AI 发布平台:

  • MAI-Code-1-Flash:Microsoft 全新自研编码模型,专为 GitHub Copilot 打造,在 SWE-Bench Pro 上以 51.2% vs 35.2% 大幅领先 Claude Haiku 4.5,且 token 用量减少最多 60%。已在 VS Code 向 Copilot 个人用户推出。(来源:microsoft.ai
  • MAI-Thinking-1:Microsoft 首个高级推理 AI 模型,定位为处理复杂问题的中量级价格模型,在 SWE-Bench Pro 上取得顶尖成绩。(来源:The Verge
  • Project Solara:Microsoft 发布面向 AI Agent 而非 App 设计的 Android 操作系统,被视为"后 App 时代"的重要布局。(来源:Ars Technica
  • Microsoft Scout:基于 OpenClaw 构建的 AI 个人助手,同时推出 Microsoft Execution Containers 增强安全运行能力。(来源:TechCrunch
  • AI 行为测试工具:新工具让开发者通过文本描述自动生成 AI 行为测试。(来源:TechCrunch
  • 共发布 7 款新模型,涵盖编码、推理、图像生成、语音转录等方向。(来源:microsoft.ai

Anthropic 正式提交 IPO 申请

Anthropic 已正式提交上市申请,这是 AI 基础模型领域最大的一起 IPO。与此同时,Claude Mythos 安全模型扩展至 15+ 国家的关键基础设施领域,Project Glasswing 新增约 150 家组织。(来源:TechCrunchThe Verge

OpenAI Codex 与 ChatGPT 合体

OpenAI 宣布将 Codex 整合进 ChatGPT,推出三大核心升级。Codex 周活跃用户已达 500 万,定位从编程工具扩展到白领知识工作。新增插件和企业功能,支持创建可托管的交互式网站和应用。(来源:36氪/新智元The Verge


2. 模型发布与更新

模型 厂商 要点
MAI-Code-1-Flash Microsoft 自研编码模型,SWE-Bench Pro 51.2%,token 用量减少 60%
MAI-Thinking-1 Microsoft 首个高级推理模型,中量级价格
MAI-Image-2.5 Microsoft 图像生成,Arena 编辑榜第 2
MAI-Voice-2 Microsoft 10 语言语音合成
MAI-Transcribe-1.5 Microsoft 领先 FLEURS 语音转录
GPT-5.5 系列(持续更新) OpenAI GPT-5.5 Instant 优化回复长度,Canvas 接口随旧模型逐步退役
Opus 4.8 Anthropic ARC-AGI 断崖领先 GPT-5.5 近 4 倍,但价格昂贵引发争议
MAI-Code-1-Flash Microsoft 186 题对抗性基准测试达 85.8% 调整准确率

开源动态:
- Stanford Law 研究显示 AI 在法律任务中表现超越法学教授(来源:HN/Stanford
- Paseo:开源编码 Agent 界面,在 HN 引起关注(来源:GitHub


3. 工具与产品

GitHub Copilot 按量计价引发争议

GitHub Copilot 新的 token 计费模式遭到开发者强烈反弹。有用户报告一天内耗尽整月 AI 额度。Token-based billing 被称为"toxenmaxxing",Amazon 已因员工滥用 AI Agent 刷榜而紧急关闭内部排行榜。(来源:Ars TechnicaTechCrunch

Google Gemini Spark 及产品更新

  • Gemini Spark:Google 24/7 AI 助手获多方好评,实测体验"令人印象深刻但也令人不安"(来源:The Verge
  • Google 假电话检测:Android Phone 应用新增 AI deepfake 语音冒充检测(来源:The Verge
  • Google Photos 数字衣橱:AI 虚拟穿搭功能上线(来源:The Verge

豆包即将收费

字节跳动旗下豆包 AI 宣布即将启动付费模式,最高档 5088 元/年。这标志着国产 AI 聊天机器人的免费时代正在终结。(来源:36氪

其他工具更新

  • Copilot Health:Microsoft 健康AI进入预览,可分析医疗记录(来源:The Verge
  • DLSS 4.5 Ray Reconstruction:Nvidia 新 AI 渲染技术,支持所有 RTX GPU(来源:The Verge

4. 行业动态

芯片与硬件

  • Nvidia RTX Spark:Nvidia 发布 ARM 架构 CPU+GPU 超级芯片,联合 Microsoft、Dell、HP 推出 AI Agent PC,直指 $2000 亿 CPU 市场。首批 RTX Spark 笔记本已在 Computex 展出。(来源:TechCrunch
  • Intel Crescent Island:Intel 宣布即将推出比 Nvidia/AMD 更便宜、更凉快的 AI 芯片,采用 LPDDR5 内存。(来源:Ars Technica
  • Nvidia 投资$1500 亿/年在台湾打造 AI 中心(来源:Ars Technica

融资与并购

公司 金额 要点
Anthropic IPO 正式提交上市申请
Alphabet $800 亿融资 用于 AI 数据中心、TPU 芯片和 Gemini 训练
SoftBank €750 亿 在法国建设数据中心
千寻智能 45 亿(3个月) 具身智能融资纪录,硬刚英伟达
星尘智能 超 10 亿 B 轮 深圳具身智能公司,估值破百亿
Cyera $120 亿估值 AI 安全公司,80x ARR
Impulse $5 亿 火箭发动机,明确"招人不用 AI"
ZeroDrift $1000 万 保护 AI 模型免受自身错误影响

政策法规

  • 特朗普签署缩水版 AI 行政令:原计划更严格的 AI 模型发布前审查令在行业反对后大幅缩水,是否向政府共享信息由 AI 公司自行决定。(来源:TechCrunchPolitico/HN
  • 佛罗里达州起诉 OpenAI:因多起与 ChatGPT 相关的暴力事件,佛罗里达 AG 起诉 OpenAI 和 Sam Altman,指控其"对人类生命完全漠视"。(来源:Ars Technica
  • Amazon 面临集体诉讼:Ring 面部识别功能被起诉(来源:TechCrunch

国内动态

  • 字节 AI 大将顾全全离职:从 AlphaFold 3 打爆到 LLM 基建,顶尖学者离开字节跳动引发关注。(来源:36氪/新智元
  • 微信扛旗 AI 总攻:微信在腾讯 AI 战略中地位凸显。(来源:36氪
  • DeepSeek 降本潜力:分析认为 DeepSeek 的优化技术可能为中国 AI 基建节省万亿美元。(来源:36氪

安全与伦理

  • Meta AI 客服机器人被利用盗取名人 Instagram 账号:黑客利用 Meta AI 支持聊天机器人劫持知名账号后转售。(来源:Ars Technica
  • 数学界警告 AI 威胁:国际数学联盟发布 AI 对数学职业的威胁警告。(来源:Ars Technica
  • OpenAI 数学突破:OpenAI 模型解决了困扰人类 80 年的数学问题。(来源:Ars Technica

5. 值得关注

深度阅读

社区热议

  • Hacker News Top: MAI-Code-1-Flash(418 points, 178 comments)、Anthropic Glasswing 扩展(163 points)、特朗普 AI 行政令(188 points, 133 comments)
  • AI 在法律考试中超越法学教授:Stanford Law 研究引发 HN 热议(129 points, 120 comments)
  • Uber 4 个月烧完 AI 预算后紧急设限:企业 AI 支出失控的典型案例(来源:TechCrunch)
  • Martin Scorsese 与 AI:大导演用 Black Forest Labs 做故事板预览,被视为好莱坞对 AI 态度软化的信号(来源:TechCrunch

即将发生

  • Apple WWDC 2026(6 月 8 日):Siri 大升级 + iOS 27 预计发布,Apple 正在尝试将 Google 万亿参数 Gemini 蒸馏到 iPhone 本地运行(来源:Ars Technica
  • OpenAI GPT-5.6:传闻本周发布,奥特曼亲自上阵(来源:36氪/新智元

信息截止时间:2026-06-03 12:00 CST。信息主要来源为 TechCrunch、The Verge、Ars Technica、Hacker News、36氪等公开渠道。未经特别标注的国内信息来源于 36氪 AI 频道。