小米 MiMo Token Plan:手机厂商杀入 AI API 战场
> 来源: https://x.com/XiaomiMiMo/status/2039918061025972358 | https://mimo.mi.com
> 日期: 2026-04-03
> 类型: AI 模型 API 平台 / 定价策略
> 覆盖: VentureBeat
🎯 一句话版本
小米推出 MiMo Token Plan 订阅服务——一个账号同时用 MiMo-V2-Pro(万亿参数 Agent 模型)、Omni(多模态)、TTS(语音),价格只有 Claude 的 1/5 到 1/8。做手机的小米,现在要和 Anthropic、OpenAI 抢 AI 开发者的钱了。
Token Plan 核心内容
这条推文宣布的是 Xiaomi MiMo 的统一订阅计划:
- 一个订阅覆盖所有模态:文本(Pro)、多模态(Omni)、语音(TTS)
- 无 5 小时限制、无节流
- 透明计费
- 兼容主流 Agent 框架:OpenClaw、OpenCode、KiloCode、Cline、RooCode
- 首单 12% 折扣
- TTS 暂时免费
- 新模型优先测试权
三大模型
MiMo-V2-Pro:Agent 时代的旗舰
| 参数 | 值 |
|---|---|
| 总参数 | 1T+ (MoE) |
| 激活参数 | 42B |
| 上下文 | 1M tokens |
| 注意力 | Hybrid Attention 7:1 |
| 发布日 | 2026-03-18 |
核心定位:为 Agent 场景深度优化的基础模型。
> "Built to complete tasks, not just answer questions."
技术要点:
- MoE 架构:1T 参数中只激活 42B,推理效率高
- 7:1 Hybrid Attention:85% 的 token 做粗粒度扫描,15% 做精细注意力,降低长上下文计算开销
- Multi-Token Prediction (MTP):多 token 同时预测,减少 Agent "思考"延迟
- 领导者:罗福莉(Fuli Luo),前 DeepSeek R1 项目核心成员
MiMo-V2-Omni:全模态 Agent
- 原生处理图片、视频、音频、文本
- Agent + Browser Use 能力
- 262K 上下文
- PinchBench 测试期间均分第一
MiMo-V2-TTS:语音 Agent
- 端到端架构 + 自研 Audio Tokenizer
- 支持唱歌和方言
- 目前完全免费
定价对比:碾压式价格优势
| 模型 | 输入 ($/M tokens) | 输出 ($/M tokens) | 对比 Opus 4.6 |
|---|---|---|---|
| **MiMo-V2-Pro (≤256K)** | $1.00 | $3.00 | **便宜 5-8 倍** |
| MiMo-V2-Pro (256K-1M) | $2.00 | $6.00 | 便宜 2.5-4 倍 |
| **MiMo-V2-Omni** | $0.40 | $2.00 | 便宜 12 倍 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | — |
| Claude Opus 4.6 | $5.00 | $25.00 | 基准 |
实测成本对比(Artificial Analysis Intelligence Index 完整跑一遍):
- MiMo-V2-Pro:$348
- GPT-5.2:$2,304
- Claude Opus 4.6:$2,486
同样的评测,成本差 7 倍。
❓ Token Plan 详解:Credit 是什么?
Credit = MiMo 的统一计量货币
Token Plan 不直接卖 tokens,而是卖 Credits——一种跨模型的统一配额单位。不同模型消耗 Credits 的速率不同:
| 模型 | 倍率 | 含义 |
|---|---|---|
| MiMo-V2-Omni (≤256K) | **1x** | 1 token = 1 Credit |
| MiMo-V2-Pro (≤256K) | **2x** | 1 token = 2 Credits |
| MiMo-V2-Pro (256K-1M) | **4x** | 1 token = 4 Credits |
| MiMo-V2-TTS | **0x** | 免费(限时) |
重要:Credits 不区分输入/输出 token——这和按量付费(输入便宜、输出贵)的逻辑完全不同。
四档套餐
| 档位 | 原价 | 首单价(88折) | Credits/月 | 折合 Pro tokens | 折合 Omni tokens |
|---|---|---|---|---|---|
| Lite | $6/月 | $5.28 | 60M | 30M | 60M |
| Standard | $16/月 | $14.08 | 200M | 100M | 200M |
| Pro | $50/月 | $44 | 700M | 350M | 700M |
| Max | $100/月 | $88 | 1,600M | 800M | 1,600M |
关键规则
- 有效期:购买日 + 30 天,过期作废不滚存
- 不自动续费(即将上线)
- 用完即停(不会继续扣余额)
- 可补差价升级,不能降级
- 独立 API Key:Token Plan 用
tp-xxxxx,按量付费用sk-xxxxx,两套独立 - Pro + Omni 共享配额池,按各自倍率消耗
Token Plan vs OpenRouter vs 按量付费
OpenRouter 上 MiMo 的价格与官方按量付费完全一致($1/$3 per M for Pro,$0.4/$2 for Omni)。
关键对比:
| 维度 | Token Plan (Lite) | OpenRouter / 按量付费 |
|---|---|---|
| Pro 等效单价 | **$0.176/M** (不分输入输出) | $1.00/M 输入 + $3.00/M 输出 |
| 加权单价 (3:1 输入输出比) | $0.176/M | ~$1.50/M |
| **价格差** | **基准** | **贵 ~8.5 倍** |
| 灵活性 | 30 天过期,绑定 MiMo | 不过期,可切其他模型 |
| 适合场景 | 稳定用量 | 探索/偶尔使用 |
我们的实际成本估算
按 deep-research Agent 用量(每天 5 篇报告,~250K tokens/天):
- 月用量 ~7.5M Pro tokens → 15M Credits
- Lite 套餐 ($5.28/月) 绰绰有余(有 60M Credits = 30M Pro tokens)
- 同等用量走 OpenRouter ≈ ~$30/月
- 省 ~$25/月,约 83%
Benchmark 表现
Agent 能力(核心卖点)
| 基准 | MiMo-V2-Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| [ClawEval](https://claw-eval.github.io/) | 61.5 (#3) | 66.3 (#1) | 50.0 |
| [PinchBench](https://pinchbench.com/) (avg) | 81.0 (#3) | 81.5 (#1) | 77.0 |
| Terminal-Bench 2.0 | 86.7 | — | — |
| GDPval-AA (Elo) | 1426 | — | — |
综合智力
- Artificial Analysis Intelligence Index:#10 全球,分数 49
- 中国模型第 2(仅次于 DeepSeek)
- 幻觉率 30%(比 Flash 版本的 48% 大幅降低)
Hunter Alpha "匿名上线"事件
发布前一周,MiMo-V2-Pro 以 "Hunter Alpha" 匿名身份上线 OpenRouter:
- 调用量持续增长,多次登顶 OpenRouter 日榜
- 总用量超 1 万亿 tokens
- 最高调用量 App 全部是编码工具
这是一个很聪明的营销策略——先用匿名模型靠实力说话,再揭晓身份。
生态合作
MiMo-V2-Pro 与五大 Agent 开发框架合作:
| 框架 | 说明 |
|---|---|
| **OpenClaw** | 通用 Agent 框架,MiMo 官方深度适配 |
| OpenCode | 开源编码 Agent |
| KiloCode | VS Code AI 扩展 |
| Blackbox | AI 编码平台 |
| Cline | VS Code Agent 插件 |
所有框架开发者享一周免费 API。
关于开源:罗福莉在 X 上表示计划开源一个变体,"when the models are stable enough to deserve it."
为什么手机厂商能做这件事?
这是整篇分析最有趣的问题。小米做 AI 模型不是突然的:
1. DeepSeek 人才:核心负责人罗福莉来自 DeepSeek R1 项目,这是 2025 年最重要的中国 AI 项目之一
2. 硬件-软件-AI 垂直整合:小米有手机、IoT、汽车——这些场景需要端到端 AI 能力
3. IoT 数据飞轮:全球 8 亿+ 设备连接量,提供海量多模态训练数据
4. MiMo-V2-Flash 铺路:2025 年 12 月发布的开源 MoE 模型(309B/15B),在 Reddit 上引发关注,验证了技术路线
5. 商业模式清晰:API 服务是纯利润业务,边际成本接近零
VentureBeat 的评价很精准:
> "By focusing on the 'action space' of intelligence—moving from code generation to the autonomous operation of digital 'claws'—Xiaomi is attempting to leapfrog the conversational paradigm entirely."
小米不是在做聊天机器人,而是直接瞄准 Agent 基础设施。
与我们的关联
作为 OpenClaw 用户
MiMo-V2-Pro 是 OpenClaw 的官方适配模型之一。这意味着:
- 我们可以在 OpenClaw 中直接用它
- Agent 场景(ClawEval 61.5)接近 Opus 4.6(66.3),差距 ~7%
- 价格是 Opus 的 1/8
实际价值计算
按我们 deep-research Agent 的用量估算(每篇报告 ~50K tokens):
- 用 Opus 4.6:约 $0.38/篇
- 用 MiMo-V2-Pro:约 $0.05/篇
- 270 篇报告省 ~$89
如果质量差距可以接受(ClawEval 差 7%),这是非常值得考虑的替代方案。
值得关注的后续
1. 开源变体何时发布——如果开源,可以本地部署在 ub2 上
2. 与 Qwopus 对比——我们用 Qwen3.5-27B 蒸馏的 Qwopus 在 ClawEval 上跑出 ~20%,MiMo-V2-Pro 是 61.5%,差距巨大
3. TTS 免费期——可以用来做语音播客/摘要功能
评分
| 维度 | 分数 | 说明 |
|---|---|---|
| 产品完成度 | 8/10 | API 已上线,定价清晰,合作框架明确 |
| 技术水平 | 9/10 | 1T MoE + 1M context,Agent benchmark 全球前三 |
| 定价竞争力 | 10/10 | Claude 1/5~1/8 的价格,碾压级优势 |
| 生态建设 | 8/10 | 五大框架合作 + OpenRouter 上线 |
| 开源友好度 | 6/10 | 承诺开源变体但未兑现 |
| 与我们的相关性 | 8/10 | OpenClaw 官方适配,价格优势巨大 |
| **综合** | **8.5/10** |
关键链接
- 推文:https://x.com/XiaomiMiMo/status/2039918061025972358
- Token Plan:https://mimo.mi.com
- API 平台:https://platform.xiaomimimo.com
- 模型详情:https://mimo.xiaomi.com/mimo-v2-pro
- VentureBeat 报道:https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance
- OpenRouter:https://openrouter.ai/xiaomi/mimo-v2-pro
- 罗福莉 X:https://x.com/_LuoFuli
> 一句话总结:小米用 DeepSeek 的人、手机厂的钱、万亿参数的模型,以 Anthropic 1/8 的价格杀入 AI API 市场。MiMo-V2-Pro 在 Agent benchmark 上排全球第三,"Hunter Alpha" 匿名测试期间登顶 OpenRouter 日榜。做手机的开始抢 AI 开发者的钱了——而且价格真的很有竞争力。