OpenAI 推翻 Erdős 单位距离猜想
> AI 首次自主解决一个数学领域的核心开放问题,80 年悬赏难题被通用推理模型拿下。
问题本身:平面上放 n 个点,最多有多少对相距 1?
这是组合几何学中最著名的问题之一,由 Paul Erdős 在 1946 年提出,Erdős 为此设立了奖金。
定义:设 \( u(n) \) 为平面上 n 个点中恰好相距 1 个单位的点对的最大数量。
| 构造方式 | 点对数 | 说明 |
|---|---|---|
| 直线排列 | \( n-1 \) | 线性增长,太弱 |
| 方格子 | \( \approx 2n \) | 两倍线性,还是弱 |
| Erdős 方格子改进(1946) | \( n^{1 + C / \log \log n} \) | 指数逼近 1,但永远不到多项式级 |
80 年来的共识:方格子结构基本是最优的,不可能取得多项式级别的改进。
Brass、Moser、Pach 的 2005 年经典教材《Research Problems in Discrete Geometry》称之为"组合几何中最好理解的问题"。Noga Alon 说它是"Erdős 最爱的几个问题之一"。
OpenAI 的模型做了什么
一个通用推理模型 — 不是专用数学系统,没有定向优化,只是被放到"Erdős 问题集"里做测试时命中的。
结果:
- ✅ 自动找到 无穷多组反例,证明方格子远非最优
- ✅ 构造产生了 多项式级别的改进
- ✅ 证明引入了来自代数数论的复杂思想 — 数学家们评价"意想不到"
- ✅ 思维链 125 页,已公开发布
验证团队(重量级)
| 数学家 | 背景 | 原话 |
|---|---|---|
| **Noga Alon** | 普林斯顿大学组合数学泰斗 | "正确答案不是 \( n^{1+o(1)} \) 是令人惊讶的。构造及其分析运用了来自代数数论中的相当复杂的工具,既优雅又巧妙。" |
| **Tim Gowers** 🏅 | **菲尔兹奖得主** | "AI 数学的里程碑" |
| **Arul Shankar** | 顶级数论学家 | "这个工作表明当前 AI 模型不仅仅是人类数学家的助手——它们有能力产生原创的巧妙想法,并付诸实践。" |
| **Jacob Tsimerman** | 多伦多大学教授 | — |
四位外部数学家联合撰写了 companion 论文,解释并验证了证明。
为什么意义重大
1. AI 第一次自主解决主流数学开放问题
之前 AlphaGo/AlphaFold 解决的是围棋和蛋白质折叠——AI 擅长但本质不同的领域。这是数学最核心的游戏:猜想 → 证明,AI 自己完成了。
2. 模型是通用推理模型
不是专门训练来搞数学的。没有策略搜索脚手架、没有定向数据增强。就是一个通用推理模型,被拿来测 Erdős 问题集,结果直接写出了一个领域内 80 年悬而未决的证明。
3. 方法论透明
OpenAI 完整公开了三份材料:
| 材料 | 链接 |
|---|---|
| 📄 **完整证明 PDF** | https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf |
| 📝 **数学家 Companion Remarks** | https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf |
| 🧠 **模型思维链(125 页)** | https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf |
HN 社区反应(560 条评论)
🏅 顶评 - 数学博士后 @trostaft
> "相当让人兴奋。这是我领域之外的问题,但 companion remarks 文档很好读。证明思想上受文献启发,但调整非平凡——至少在我看来足以让整篇论文算新颖和激动人心。"
他提到两个重要观点:
1. 实用价值: 他自己和同事们都在用 LLM 做研究。虽然很少能让模型直接解决整个研究问题,但多轮讨论的效率远高于传统的文献查阅+自我迭代。推理模型的出现让这个效率进一步提升。
2. 引用问题: 模型原始输出中没有标注对前人工作的引用。他在思维链文档里找到了部分引用,但认为数学界非常需要模型输出自动包含引用——既是信用,也是未来研究者构建抽象的方式。
> "如果 OpenAI 的人在读:这些信息出现在模型实际输出中对我来说非常重要。"
🤯 存在主义辩论
@umanwizard:
> "为什么兴奋而不是恐惧?LLM 越擅长数学,你毕生建立的专家知识就越接近一文不值。"
这条引发了深入的哲学讨论:
| 用户 | 立场 |
|---|---|
| **@cman1444** | 推进全人类知识本身就是奖励,不管是通过 AI 还是人类自己 |
| **@mathgradthrow** | 当你的工作不再被需要时你会后悔这种想法 |
| **@fartfeatures** | 到那时人类必须讨论工作和金钱的本质 |
| **@dekhn** | 乐观:每 6 个月 automate 自己→后稀缺时代,所有人自由追求任何兴趣 |
🧮 数学哲学插曲
有一条评论引用了 Ayer 和早期 Wittgenstein 的观点:数学真理不是报告世界的新事实,而是展开公理/定义/符号/规则中已隐含的东西。证明只是让隐含变显式。
反直觉地:如果这个哲学立场成立,AI 做数学比 AI 做科学更"安全"——数学不涉及新事实的发现。但 AI 自主证明的能力仍然挑战了"只有人类才能理解数学"的信念。
媒体评论
TechCrunch(标题自带调侃):
> "OpenAI 称其解决了一个 80 年的数学问题——这次是真的"
副标题补充:上次尴尬的数学成果被戳穿后,这次数学家们背书了。
确实——2025 年关于"o3 解决 IMO 难题"的报道后来被数学家指出夸大其词。这次是真正的经过同行验证的成果。
Autogpt.net:
> "OpenAI 终于解决了一个真正的数学问题"
Digg:
> "OpenAI 的内部模型在离散几何中产生了全新构造"
更多细节
证明的技术要求
根据 companion remarks,证明用到的工具来自代数数论——这在组合几何问题中是罕见的。方格子猜想表面上是个几何/组合问题,模型却找到了数论工具来解决它。这暗示了 AI 可以发现人类数学家很少跨越的学科边界。
思维链的规模
125 页。不是人类写的逐步注释,而是模型在推理过程中的认知轨迹。OpenAI 公开它是为了让数学家能追溯模型"怎么想到的"。
对 AI 未来意味着什么
1. 数学研究范式可能改变 — 不是替代数学家,而是像望远镜之于天文学,成为探索数学空间的工具
2. 代数数论+组合几何的交叉 — AI 没有学科偏见,能跳出"组合问题就要用组合方法"的定式
3. 推理能力的关键测试 — 数学是对推理能力最严格的测试:精确、长上下文、每一步都不能错。一个能通过这种测试的模型,意味着推理能力达到了新的量级
4. 引用和信用问题 — 如果模型不用引用就能产出证明,学术界的信用体系可能需要适应"AI 辅助发现"的新模式
🔗 参考链接
- OpenAI 官方公告:https://openai.com/index/model-disproves-discrete-geometry-conjecture/
- 完整证明 PDF:https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf
- Companion Remarks:https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf
- 思维链(125 页):https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf
- HN 讨论(560 评论):https://news.ycombinator.com/item?id=48212493
- TechCrunch 报道:https://techcrunch.com/2026/05/20/openai-claims-it-solved-an-80-year-old-math-problem-for-real-this-time/
报告生成于 2026-05-21|基于 OpenAI 公告、HN 讨论、TechCrunch 报道