Anthropic Institute: When AI Builds Itself — 递归自我改进研究报告

一句话版本

Anthropic 首次公开披露：Claude 已经写了 Anthropic 超过 80% 的代码，人类工程师的角色正在从"写代码的人"缩小为"定方向的人"——递归自我改进（AI 自己设计下一代 AI）可能比大多数政府和企业预期的来得更快。

Anthropic 首次以时间线形式披露了 AI 参与自身开发的演进：

工程效率：

代码质量演进：

代码审查：

研究能力：

模型优化实验：Opus 4（2025年5月）→ 3x 加速；Mythos Preview（2026年4月）→ 52x 加速（人类熟练研究员需 4-8 小时才能达到 4x）
首次端到端自主研究实验（2026年4月）：AI Agent 恢复了弱监督 vs 强监督之间差距的 97%（人类研究员：23%），耗时 800 小时，消耗 $18,000 计算资源
"下一步决策"判断力：Opus 4.5（2025年11月）51% 优于人类 → Mythos Preview（2026年4月）64% 优于人类

指标	进展
自主任务时长	每 4 个月翻倍（此前是 7 个月）
Claude Opus 3 (2024.3)	~4 分钟任务
Claude Sonnet 3.7 (2025.3)	~1.5 小时任务
Claude Opus 4.6 (2026.3)	12 小时任务
2026 年预期	数天的任务可达
2027 年预期	数周的任务可达
SWE-bench	2 年从个位数→饱和
CORE-Bench	15 个月从 20%→饱和
METR 评估	Mythos Preview "至少 16 小时"，超出 METR 现有测量能力

文章提出了一个清晰的结论："做"（写代码、跑实验、出结果）现在几乎不消耗人类时间。人类的比较优势正在收窄到：

一位 Anthropic 员工的直白感受：

> "好日子时，我不禁觉得我做什么都不重要，一切都自动化了，比我做得更快更好。但到了什么事情都崩坏的日子，我不明白为什么，我意识到我已经不知道自己在做什么了。"

文章坦诚讨论了两种解读：

保守解读： 即使 Claude 永远无法获得好的研究品味，只要人类负责方向设定、Claude 处理其余，复利式的加速仍然成立。

非保守解读： 早期证据表明 Claude 的判断力正在快速提升——这个差距也可能会消失。

1. Claude Code 是我们日常工具 — 这篇文章直接解释了我们正在经历的一切：代码量暴增、审查成为瓶颈、人类从写代码转向定方向

2. Dreaming / 自我改进概念 — 我们之前跟踪过的 Anthropic "Dreaming" 功能（Agent 自动清理和优化记忆文件）正是这篇文章中"闭环"的早期信号。Dreaming 是让 AI Agent 自我反思、持续改进的第一步

3. Multiagent 编排 — 文章提到 Agent 可以委派工作给其他 Agent，这在 Anthropic 的 Managed Agents 平台已经可用。对于 Jay 的 Agent 平台（OpenClaw）来说，这是一个值得关注的方向

4. OpenClaw 的定位 — 文章反复提到"人类选择方向，AI 执行"是最有效的模式，这正是 OpenClaw 代理系统所擅长的。Jay 的 Agent 体系天然符合这种分工模式

5. 总结/记忆工具的重要性 — 文章提到"人类难以在脑中同时处理大量陌生上下文"正是我们使用 lossless-claw、memory 等工具的原因。AI 在上下文管理上的优势越来越明显

GitHub 激增：2025 年全年约 10 亿次代码提交；2026 年中每周 2.75 亿次（全年约 140 亿）。GitHub COO 表示正在"拼命扩容"
Government engagement：Anthropic 计划在未来数月与政策制定者、研究人员、民间社会和其他 AI 公司举办对话，讨论递归自我改进带来的治理问题
文章的语调：焦虑与兴奋并存。它是 Anthropic 在"我们加速了但我们也可能失去控制"之间的坦诚陈述

原文: https://www.anthropic.com/institute/recursive-self-improvement
Interesting Engineering 分析: https://interestingengineering.com/ai-robotics/anthropic-self-improvement-ai-models
Benzinga 报道: https://www.benzinga.com/markets/private-markets/26/06/53018519/anthropic-says-ai-may-soon-upgrade-itself-without-human-help
相关：Anthropic Managed Agents / Dreaming (2026-05-07) — 我们之前的报告已覆盖
Dario Amodei 关于 Machines of Loving Grace: https://www.darioamodei.com/essay/machines-of-loving-grace
Dario Amodei 关于技术青春期: https://www.darioamodei.com/essay/the-adolescence-of-technology