MiroFish 深度研究:00 后中科大学生的"预测万物"群体智能引擎,陈天桥 3000 万投了
> 来源: https://github.com/666ghj/MiroFish
> 新浪财经报道: https://finance.sina.com.cn/cj/2026-03-09/doc-inhqkhiq9966018.shtml
> 腾讯新闻实测: https://news.qq.com/rain/a/20260312A01MVI00
> 在线 Demo: https://666ghj.github.io/mirofish-demo/
> 研究时间: 2026-03-17
📌 一句话总结
MiroFish 是中科大大四学生 BaiFu(郭航江)开发的多智能体群体智能预测引擎——上传现实世界的"种子信息"(新闻/报告/小说),自动构建一个平行数字世界,让成千上万个有独立人格的 AI 智能体在里面自由交互、社会演化,最终生成预测报告。盛大集团创始人陈天桥投了 3000 万人民币。GitHub 两周 15K+ Stars,登上全球趋势榜第一。
🧠 核心理念
> "个体或许难以预测,但一旦融入群体,就会出现去个性化、情绪传染、易受暗示等特征,行为反而变得极端、非理性,且具备可预测性。" —— 古斯塔夫·勒庞《乌合之众》
MiroFish 的核心假设:与其让一个大模型直接"猜"未来,不如让一群有不同立场的 AI 在模拟环境里互动、博弈,通过群体涌现来推演走向。
🏗️ 技术架构
五阶段流水线
种子材料(新闻/报告/小说)
↓
① 图谱构建
种子信息提取 → 实体关系抽取 → GraphRAG 知识图谱
个体+群体记忆注入
↓
② 环境搭建
为每个实体生成"人设"(性格、立场、背景)
环境配置 Agent 注入仿真参数
↓
③ 双平台并行模拟
两个独立环境中,数十/上百智能体围绕议题讨论、博弈
自动解析预测需求 → 动态更新时序记忆
↓
④ 报告生成
ReportAgent 用工具集与模拟后环境深度交互
输出结构化预测报告
↓
⑤ 深度互动
与任意智能体 1v1 对话(追问逻辑/立场)
与 ReportAgent 对话(解释/总结)
技术栈
| 组件 | 技术 |
|---|---|
| **前端** | Node.js 18+ |
| **后端** | Python 3.11-3.12 |
| **包管理** | uv(Python)+ npm |
| **仿真引擎** | 基于 OASIS (CAMEL-AI 开源) |
| **知识图谱** | Zep Cloud |
| **LLM** | 支持 OpenAI SDK 格式的任意模型(推荐阿里百炼 qwen-plus) |
| **部署** | docker compose 或源码部署 |
安装
# 克隆
git clone https://github.com/666ghj/MiroFish.git
cd MiroFish
# 配置
cp .env.example .env
# 填入 LLM_API_KEY、ZEP_API_KEY
# 一键安装
npm run setup:all
# 启动
npm run dev
# 前端: http://localhost:3000
# 后端: http://localhost:5001
或 Docker:
cp .env.example .env
docker compose up -d
📊 数据
| 指标 | 数据 |
|---|---|
| **GitHub Stars** | 15.7K+(截至 3/12,两周内) |
| **投资** | 盛大集团 3000 万人民币 |
| **作者** | BaiFu(郭航江),中科大大四,00后 |
| **前作** | BettaFish(舆情分析,也登过 GitHub 趋势榜 #1) |
| **开发周期** | 据称 AI 编码辅助下 10 天 |
| **仿真基础** | OASIS (CAMEL-AI) |
| **许可证** | 未明确标注 |
| **同类项目** | Ebbiforge, OASIS (CAMEL-AI), Generative Agents (Stanford) |
🔬 真实测评(腾讯新闻 2026-03-12)
一位博主用伊朗-美国局势新闻做了实测:
| 环节 | 耗时 | 体验 |
|---|---|---|
| 部署 | 15 分钟 | AI 辅助完成,非常快 |
| 图谱构建 + 环境搭建 | 几分钟 | 自动提取角色、生成人设,正常 |
| 模拟(15 轮) | **~1 小时** | ⚠️ 很慢 |
| 报告生成 | **~20 分钟** | 额外等待 |
| **总耗时** | **~2 小时** | 一次完整预测 |
发现的问题
1. 智能体"偷懒":部分智能体在推演过程中回复重复内容,没有真的在推演
2. 结果泛泛:预测结果"有用但用处不多",都是正确但没参考价值的话
3. 不如直接问 GPT:博主认为结果不如直接用 GPT/Grok 检索信息后给出的预测
4. 模型依赖:用 qwen3.5 效果一般,GPT 的回答更好,说明预测质量高度依赖底层模型
博主结论
> "我承认这个项目的思路很好,有不少让人眼前一亮的亮点,但目前还非常初级,完全不具备落地能力。"
🤔 深度分析
为什么受关注?
1. 叙事极强:"预测万物"+ "平行数字世界"+ "上帝视角"——每个词都戳到想象力
2. 00后 + 陈天桥 3000万:故事性满分——大四学生用 AI 10 天写出来,初代首富看完 demo 直接投了
3. 时机好:多智能体 + Agent 是 2025-2026 最热赛道,刚好踩在风口上
4. 前作背书:BettaFish 已经上过 GitHub 趋势榜第一,有信用积累
技术层面的冷思考
核心问题:群体智能仿真≠预测
MiroFish 的底层逻辑是:让一群 AI 扮演不同角色互动 → 观察涌现行为 → 预测现实走向。但这里有几个根本假设需要验证:
1. AI 角色扮演 ≠ 真实角色行为:AI 扮演"俄罗斯"的行为逻辑跟真实俄罗斯决策者差距巨大。AI 缺乏内部信息、利益驱动、情感状态
2. 涌现 ≠ 预测精度:一群 AI 的涌现行为可能有趣,但不一定比单个强模型的直接推理更准确
3. 垃圾进 → 垃圾出:如果种子信息不全面,构建的"平行世界"就不完整,预测自然不靠谱
4. 成本高昂:每次预测调用大量 LLM API(数十/上百智能体 × 多轮对话),token 消耗极大
与 Stanford Generative Agents 的比较
| Generative Agents (2023) | MiroFish (2026) | |
|---|---|---|
| 场景 | 虚拟小镇 25 人 | 现实事件 数十-上百人 |
| 目的 | 研究涌现行为 | 预测现实走向 |
| 记忆 | Reflection + Retrieval | GraphRAG + 时序记忆 |
| 输出 | 观察报告 | 结构化预测报告 + 互动 |
| 实用性 | 学术研究 | 尝试落地(但目前效果有限) |
MiroFish 在工程上做了不少创新(GraphRAG 种子提取、双平台并行、ReportAgent 工具集),但核心科学问题——"多智能体仿真能否真正预测复杂系统"——还远未解决。
适合什么场景?
| 场景 | 适合度 | 说明 |
|---|---|---|
| **小说/影视结局推演** | ✅ 高 | 最适合!不需要准确预测,有趣就行 |
| **舆情走向推演** | 🟡 中等 | 可以提供视角,但不够精确 |
| **金融预测** | ❌ 低 | 缺乏量化数据支持,纯定性推演 |
| **地缘政治预测** | ❌ 低 | AI 角色扮演与真实决策差距太大 |
| **教育/培训** | ✅ 高 | 让学生理解复杂系统互动的好工具 |
💡 与我们的关联
1. 思路值得借鉴
MiroFish 的"多视角推演"思路可以用在我们的深度研究中——与其让一个 Agent 写报告,不如让多个 Agent 从不同角度(技术/商业/竞争/风险)分别分析,最后综合。
2. 但不适合直接用
- 我们需要的是信息收集+分析,不是"预测走向"
- MiroFish 的 token 消耗太大(一次预测 2 小时 + 大量 API 调用)
- 当前效果还不如直接用强模型
3. 关注其 Zep + GraphRAG 组合
MiroFish 用 Zep Cloud 做知识图谱存储 + GraphRAG 做实体关系提取的组合值得关注。如果这个模式成熟,可能对我们的记忆系统有启发。
📊 评分
| 维度 | 评分(/10) |
|---|---|
| 创新性 | 8.5 — 群体智能预测的工程化实现,思路新颖 |
| 技术实现 | 6.5 — 五阶段管线设计合理,但实测效果不佳 |
| 实用价值 | 5.0 — 目前"非常初级,完全不具备落地能力" |
| 社区热度 | 9.0 — 两周 15K+ Stars,陈天桥 3000 万,叙事满分 |
| 与我们的关联 | 5.5 — 思路可借鉴,但不适合直接使用 |
| **综合** | **6.8** |
报告由深度研究助手自动生成 | 2026-03-17
来源: https://github.com/666ghj/MiroFish