Anthropic Institute: When AI Builds Itself — 递归自我改进研究报告

一句话版本

Anthropic 首次公开披露:Claude 已经写了 Anthropic 超过 80% 的代码,人类工程师的角色正在从"写代码的人"缩小为"定方向的人"——递归自我改进(AI 自己设计下一代 AI)可能比大多数政府和企业预期的来得更快。

核心发现

1. 加速的时间线

Anthropic 首次以时间线形式披露了 AI 参与自身开发的演进:

时期阶段特征
2021–2023构建第一代 Claude人在笔记本电脑上写代码
2023–2025聊天机器人时代用 AI 生成短代码片段,手动复制
2025–2026Coding AgentsAI 自主编写和编辑整个文件
今天 (2026)自主 AgentAgent 自己运行代码、委派工作给其他 Agent
20XX?闭环Agent 能自己构建和训练下一代模型

2. 关键数据(来自 Anthropic 内部)

工程效率:

代码质量演进:

代码审查:

研究能力:

3. 外部基准验证

指标进展
自主任务时长每 **4 个月**翻倍(此前是 7 个月)
Claude Opus 3 (2024.3)~4 分钟任务
Claude Sonnet 3.7 (2025.3)~1.5 小时任务
Claude Opus 4.6 (2026.3)**12 小时**任务
2026 年预期数天的任务可达
2027 年预期数周的任务可达
SWE-bench2 年从个位数→饱和
CORE-Bench15 个月从 20%→饱和
METR 评估Mythos Preview "至少 16 小时",超出 METR 现有测量能力

4. 人类角色的演变

文章提出了一个清晰的结论:"做"(写代码、跑实验、出结果)现在几乎不消耗人类时间。人类的比较优势正在收窄到:

一位 Anthropic 员工的直白感受:

> "好日子时,我不禁觉得我做什么都不重要,一切都自动化了,比我做得更快更好。但到了什么事情都崩坏的日子,我不明白为什么,我意识到我已经不知道自己在做什么了。"

5. "如果我们错了?"

文章坦诚讨论了两种解读:

保守解读: 即使 Claude 永远无法获得好的研究品味,只要人类负责方向设定、Claude 处理其余,复利式的加速仍然成立。

非保守解读: 早期证据表明 Claude 的判断力正在快速提升——这个差距也可能会消失。

分析与关联

与我们项目的关联

1. Claude Code 是我们日常工具 — 这篇文章直接解释了我们正在经历的一切:代码量暴增、审查成为瓶颈、人类从写代码转向定方向

2. Dreaming / 自我改进概念 — 我们之前跟踪过的 Anthropic "Dreaming" 功能(Agent 自动清理和优化记忆文件)正是这篇文章中"闭环"的早期信号。Dreaming 是让 AI Agent 自我反思、持续改进的第一步

3. Multiagent 编排 — 文章提到 Agent 可以委派工作给其他 Agent,这在 Anthropic 的 Managed Agents 平台已经可用。对于 Jay 的 Agent 平台(OpenClaw)来说,这是一个值得关注的方向

4. OpenClaw 的定位 — 文章反复提到"人类选择方向,AI 执行"是最有效的模式,这正是 OpenClaw 代理系统所擅长的。Jay 的 Agent 体系天然符合这种分工模式

5. 总结/记忆工具的重要性 — 文章提到"人类难以在脑中同时处理大量陌生上下文"正是我们使用 lossless-claw、memory 等工具的原因。AI 在上下文管理上的优势越来越明显

值得关注的信号

评分

维度评分说明
信息密度⭐⭐⭐⭐⭐前所未见的内部数据,密度极高
透明度⭐⭐⭐⭐⭐自愿披露内部指标,包含大量真实数字
实用性⭐⭐⭐⭐⭐对我们日常使用 Claude Code 有直接意义
时效性⭐⭐⭐⭐⭐2026年6月4日发布,今天(6月5日)研究
客观性⭐⭐⭐⭐坦率讨论了局限性和不确定性,但毕竟是自我披露
**总分****9.5/10**

参考文献