Anthropic Institute: When AI Builds Itself — 递归自我改进研究报告
- 来源: https://www.anthropic.com/institute/recursive-self-improvement
- 日期: 2026-06-04
- 评分: 9.5/10 — 2026 年最重要的 AI 文章之一,第一次大规模披露前沿 AI 公司的内部数据
一句话版本
Anthropic 首次公开披露:Claude 已经写了 Anthropic 超过 80% 的代码,人类工程师的角色正在从"写代码的人"缩小为"定方向的人"——递归自我改进(AI 自己设计下一代 AI)可能比大多数政府和企业预期的来得更快。
核心发现
1. 加速的时间线
Anthropic 首次以时间线形式披露了 AI 参与自身开发的演进:
| 时期 | 阶段 | 特征 |
|---|---|---|
| 2021–2023 | 构建第一代 Claude | 人在笔记本电脑上写代码 |
| 2023–2025 | 聊天机器人时代 | 用 AI 生成短代码片段,手动复制 |
| 2025–2026 | Coding Agents | AI 自主编写和编辑整个文件 |
| 今天 (2026) | 自主 Agent | Agent 自己运行代码、委派工作给其他 Agent |
| 20XX? | 闭环 | Agent 能自己构建和训练下一代模型 |
2. 关键数据(来自 Anthropic 内部)
工程效率:
- 80%+ 的合并代码由 Claude 编写(2025年2月前还是个位数百分比)
- 工程师人均每日合并代码量是 2024 年的 8 倍
- 130 名研究人员调查中位数自评:产出提升 4 倍
- Claude 在 2026年4月自动修复了 800+ 个 API 错误,将错误率降低 1000 倍——人类工程师估计需要 4 年 才能完成
- 最开放性问题成功率:76%(6 个月内提升 50 个百分点)
代码质量演进:
- 2025 年末:Claude 写的代码仍然差于人类
- 2026 年中:与人类持平
- 预期:一年内超越人类
代码审查:
- Anthropic 现在用 Claude 做自动化 Code Review
- 回顾分析显示:如果全程使用 Claude 审查,可以阻止 claude.ai 约 1/3 的生产事故
研究能力:
- 模型优化实验:Opus 4(2025年5月)→ 3x 加速;Mythos Preview(2026年4月)→ 52x 加速(人类熟练研究员需 4-8 小时才能达到 4x)
- 首次端到端自主研究实验(2026年4月):AI Agent 恢复了弱监督 vs 强监督之间差距的 97%(人类研究员:23%),耗时 800 小时,消耗 $18,000 计算资源
- "下一步决策"判断力:Opus 4.5(2025年11月)51% 优于人类 → Mythos Preview(2026年4月)64% 优于人类
3. 外部基准验证
| 指标 | 进展 |
|---|---|
| 自主任务时长 | 每 **4 个月**翻倍(此前是 7 个月) |
| Claude Opus 3 (2024.3) | ~4 分钟任务 |
| Claude Sonnet 3.7 (2025.3) | ~1.5 小时任务 |
| Claude Opus 4.6 (2026.3) | **12 小时**任务 |
| 2026 年预期 | 数天的任务可达 |
| 2027 年预期 | 数周的任务可达 |
| SWE-bench | 2 年从个位数→饱和 |
| CORE-Bench | 15 个月从 20%→饱和 |
| METR 评估 | Mythos Preview "至少 16 小时",超出 METR 现有测量能力 |
4. 人类角色的演变
文章提出了一个清晰的结论:"做"(写代码、跑实验、出结果)现在几乎不消耗人类时间。人类的比较优势正在收窄到:
- 研究品味和判断力:选择哪些问题值得做
- 哪些结果值得信任
- 什么方向是死路
一位 Anthropic 员工的直白感受:
> "好日子时,我不禁觉得我做什么都不重要,一切都自动化了,比我做得更快更好。但到了什么事情都崩坏的日子,我不明白为什么,我意识到我已经不知道自己在做什么了。"
5. "如果我们错了?"
文章坦诚讨论了两种解读:
保守解读: 即使 Claude 永远无法获得好的研究品味,只要人类负责方向设定、Claude 处理其余,复利式的加速仍然成立。
非保守解读: 早期证据表明 Claude 的判断力正在快速提升——这个差距也可能会消失。
分析与关联
与我们项目的关联
1. Claude Code 是我们日常工具 — 这篇文章直接解释了我们正在经历的一切:代码量暴增、审查成为瓶颈、人类从写代码转向定方向
2. Dreaming / 自我改进概念 — 我们之前跟踪过的 Anthropic "Dreaming" 功能(Agent 自动清理和优化记忆文件)正是这篇文章中"闭环"的早期信号。Dreaming 是让 AI Agent 自我反思、持续改进的第一步
3. Multiagent 编排 — 文章提到 Agent 可以委派工作给其他 Agent,这在 Anthropic 的 Managed Agents 平台已经可用。对于 Jay 的 Agent 平台(OpenClaw)来说,这是一个值得关注的方向
4. OpenClaw 的定位 — 文章反复提到"人类选择方向,AI 执行"是最有效的模式,这正是 OpenClaw 代理系统所擅长的。Jay 的 Agent 体系天然符合这种分工模式
5. 总结/记忆工具的重要性 — 文章提到"人类难以在脑中同时处理大量陌生上下文"正是我们使用 lossless-claw、memory 等工具的原因。AI 在上下文管理上的优势越来越明显
值得关注的信号
- GitHub 激增:2025 年全年约 10 亿次代码提交;2026 年中每周 2.75 亿次(全年约 140 亿)。GitHub COO 表示正在"拼命扩容"
- Government engagement:Anthropic 计划在未来数月与政策制定者、研究人员、民间社会和其他 AI 公司举办对话,讨论递归自我改进带来的治理问题
- 文章的语调:焦虑与兴奋并存。它是 Anthropic 在"我们加速了但我们也可能失去控制"之间的坦诚陈述
评分
| 维度 | 评分 | 说明 |
|---|---|---|
| 信息密度 | ⭐⭐⭐⭐⭐ | 前所未见的内部数据,密度极高 |
| 透明度 | ⭐⭐⭐⭐⭐ | 自愿披露内部指标,包含大量真实数字 |
| 实用性 | ⭐⭐⭐⭐⭐ | 对我们日常使用 Claude Code 有直接意义 |
| 时效性 | ⭐⭐⭐⭐⭐ | 2026年6月4日发布,今天(6月5日)研究 |
| 客观性 | ⭐⭐⭐⭐ | 坦率讨论了局限性和不确定性,但毕竟是自我披露 |
| **总分** | **9.5/10** |
参考文献
- 原文: https://www.anthropic.com/institute/recursive-self-improvement
- Interesting Engineering 分析: https://interestingengineering.com/ai-robotics/anthropic-self-improvement-ai-models
- Benzinga 报道: https://www.benzinga.com/markets/private-markets/26/06/53018519/anthropic-says-ai-may-soon-upgrade-itself-without-human-help
- 相关:Anthropic Managed Agents / Dreaming (2026-05-07) — 我们之前的报告已覆盖
- Dario Amodei 关于 Machines of Loving Grace: https://www.darioamodei.com/essay/machines-of-loving-grace
- Dario Amodei 关于技术青春期: https://www.darioamodei.com/essay/the-adolescence-of-technology