NVIDIA Vera CPU — 专为 Agentic AI 打造的首款自研 CPU,首批交付
来源: https://blogs.nvidia.com/blog/vera-cpu-delivery/
日期: 2026-05-19
评分: ⭐⭐⭐⭐⭐ (5/5)
一句话版本
NVIDIA 上周五(5月15日)开始向 Anthropic、OpenAI、SpaceXAI 和 Oracle 交付它的首款自研 CPU Vera——这不是给电脑用的,是专门给 AI Agent 用的 CPU,88个自研核心、1.2 TB/s 内存带宽,比 AMD/Intel 快 50%。
核心内容
大事件:Vera CPU 开始交付
2026年5月15日(上周五),NVIDIA 副总裁 Ian Buck 亲自将首台 Vera CPU 系统送到了三家顶级 AI 实验室,周一又送到了 Oracle:
| 客户 | 时间 | 地点 | 接机人 |
|---|---|---|---|
| **Anthropic** | 上周五 | 旧金山 SoMa | James Bradbury(计算负责人) |
| **OpenAI** | 上周五 | Mission Bay | Sachin Katti(计算基础设施负责人) |
| **SpaceXAI** | 上周五 | 帕洛阿尔托 | Elon Musk(亲自上阵,问了很多架构问题) |
| **Oracle Cloud** | 周一 | Santa Clara | Karan Batta + Gary Miller |
这是 Vera 从 GTC 2026(3月16日)发布后的首次实物交付——从宣布走向生产。
为什么 Agentic AI 需要专用 CPU?
NVIDIA 的核心论点:AI Agent 不只在 GPU 上跑。
每次 AI Agent 执行一个任务,背后发生的是:
1. Agent 需要执行代码 → CPU 编译 ✅
2. Agent 需要搜索文件 → CPU I/O ✅
3. Agent 需要调用工具 → CPU 编排 ✅
4. Agent 需要跑沙箱 → CPU 隔离 ✅
5. Agent 需要检索长上下文 → CPU 内存管理 ✅
传统 CPU(AMD EPYC、Intel Xeon)设计时以核心密度为优化目标,但 Agentic AI 需要的是高单核性能 + 高内存带宽 + 确定性低延迟的组合——Vera 正是为此而生。
技术规格
| 指标 | 数据 |
|---|---|
| **核心数** | 88 个 NVIDIA 自研 Olympus 核心 (Arm v9.2) |
| **内存带宽** | 1.2 TB/s (LPDDR5X SOCAMM) |
| **每核内存带宽** | 14 GB/s(传统数据中心的 ~3 倍) |
| **持续负载表现** | 比竞品快 50% |
| **单核 IPC 提升** | 1.5x |
| **SCF 互连带宽** | 3.4 TB/s 对分带宽 |
| **峰值内存容量** | 1.5 TB(3x 前代 Grace) |
| **功耗** | 传统 DDR 的一半以下 |
| **指令集** | Arm v9.2,兼容已有 Arm 软件生态 |
核心架构亮点:
- Olympus 核心:NVIDIA 首个完全自研的数据中心 CPU 核心,10-wide 指令获取/解码前端,神经分支预测器(每周期可评估 2 个预测分支)
- NVIDIA Spatial Multithreading (SMT):每个核心可跑 2 个线程,但不像传统 SMT 那样时间分片——而是提供稳定的性能隔离和可预测的尾延迟
- 第二代 SCF(Scalable Coherency Fabric):统一拓扑,所有核心到内存/缓存的延迟一致——不需要像 x86 那样做 NUMA 感知的任务绑定
- LPDDR5X SOCAMM:可拆卸、可升级的小型内存模组,首次把低功耗内存引入数据中心
平台家族
Vera 不是单芯片,是一个完整平台:
| 平台 | 说明 | 场景 |
|---|---|---|
| **Vera Rubin NVL72** | Vera CPU + Rubin GPU 通过 NVLink-C2C 紧密耦合 | 大型 AI 工厂,前沿训练/推理 |
| **Vera CPU Rack** | 液冷机架,256 颗 Vera CPU,22,500+ 并发沙箱 | AI 工厂基础设施,Agent pipelines |
| **单/双路 Vera 服务器** | 1-2 颗 Vera CPU,1.5TB LPDDR5X/路 | 云基础设施、企业、HPC |
| **HGX Rubin NVL8** | Vera 作为 Rubin GPU 的主机 CPU | AI 推理、技术计算 |
性能数据
- Agentic 沙箱性能:持续满载下比 x86 竞品快 1.5x(编译器、脚本引擎、运行时、压缩、工具调用)
- Vera CPU Rack:4x 沙箱密度、2x 能效比 vs x86 机架
- Redpanda 测试:Kafka 兼容工作负载,5.5x 更低延迟
- Vera + Rubin 预填充/解码分工:Prefill 跑在 Vera 上,Decode 跑在 Rubin 上 → 35x tokens/watt 提升
- 能效:x86 的两倍
生态支持
客户/云提供商:Alibaba Cloud、ByteDance、Meta、OCI、CoreWeave、Lambda、Nebius、Nscale
OEM 伙伴:Dell Technologies、HPE、Lenovo、Supermicro、ASUS、Compal、Foxconn、GIGABYTE、Pegatron、QCT、Wistron、Wiwynn
关键 ISV:Cursor(CEO Michael Truell 公开表示将采用 Vera 提升编码 Agent 性能)、Redpanda
可用时间
- 首批工程样机交付:2026年5月15日
- OEM 商用出货:2026 年下半年
分析
为什么这是 Big Deal
1. NVIDIA 正式进军 CPU 市场 — 不再是 Grace(只是 GPU 的陪衬),Vera 是独立 CPU 产品线。Jensen 在 GTC 上说这是 NVIDIA 的下一个数十亿美元业务
2. "Agentic CPU" 这个品类被定义了 — 以前 CPU 是为通用计算或服务器设计的,Vera 第一次说"我是为 Agent 造的"。这会给整个行业带来新分类
3. 性能数据非常猛 — 1.5x 现网满载性能 vs AMD/Intel 旗舰,4x 机架密度,2x 能效。这不是 PPT 数据,首批实物已经交付
4. 生态已全面铺开 — 所有主要 OEM 都在做 Vera 服务器,OCI 计划部署数十万颗,Cursor 公开背书
5. Vera + Rubin 的协同设计才是王炸 — 预填充跑 Vera、解码跑 Rubin,35x tokens/watt。这是 x86 架构永远做不到的垂直整合
市场影响
- 对 AMD/Intel:真正的威胁。NVIDIA 有 GPU 生态的天然抓手,能从"GPU 附带的 CPU"切进数据中心 CPU 市场
- 对 Arm 服务器生态:强心针。NVIDIA 入局 Arm 服务器 = Arm 在数据中心的第三极(AWS Graviton + NVIDIA Vera + 其他)
- 对 AI 泡沫叙事:老黄说"AI 需要新 CPU" → 实际上验证了 Agentic AI 的基础设施需求远超预期
潜在风险
- Vera 是初代产品,落地稳定性待验证
- Arm 生态的软件兼容性(虽然是 v9.2 兼容,但很多企业工具链还是 x86 原生)
- OEM 服务器要到 H2 2026 才能买得到
- 价格未知——NVIDIA 的 CPU 定价策略可能会很激进
与我们项目的关联
从"Agent CPU"看 Agent 基础设施趋势
Vera 的核心理念——Agent 需要大量 CPU 来做编排、沙箱、工具调用、数据预处理——跟我们做 OpenClaw deep research 的实践一致:
- 每次做 deep research,我们跑 web_fetch、web_search、浏览器操作、代码执行、文件 I/O,这些都是 CPU 密集的
- OpenClaw 的沙箱隔离(每个子 Agent 独立环境)正是 Vera 设计的典型场景
- Long-context 检索、记忆压缩、文件嵌入——都是内存带宽敏感任务
对部署的影响
- 如果 Vera + Rubin 的组合兑现 35x tokens/watt,重度 Agent 用户的推理成本会大幅下降
- Vera 的 22,500+ 沙箱/机架意味着托管 Agent 服务(如 Manus Cloud Computer)的密度可以提升 4x
- LPDDR5X SOCAMM 的可维修性设计很有意思——跟 OpenClaw 的模块化设计哲学一致
值得关注的时间点
- 2026 H2: OEM 服务器上市 → 届时可以关注 Vera 在 Agent 工作负载上的实际评测
- Cursor 的 Vera 部署结果:如果 Cursor 真的用上了且效果好,这是最直接的 Agent 场景验证
评分表
| 维度 | 评分 | 说明 |
|---|---|---|
| 创新性 | ⭐⭐⭐⭐⭐ | 首个专为 Agentic AI 设计的 CPU,重新定义了 CPU 分类 |
| 技术实现 | ⭐⭐⭐⭐⭐ | Olympus 自研核心 + SMT + LPDDR5X + SCF,架构统一优雅 |
| 性能数据 | ⭐⭐⭐⭐☆ | 1.5x vs x86 竞品在 spec 层面很有说服力,但需独立验证 |
| 生态影响力 | ⭐⭐⭐⭐⭐ | 所有 OEM、主要云商、Cursor 等 ISV 全线站队 |
| 与我们关联 | ⭐⭐⭐⭐ | Agent 基础设施核心组件,直接影响 Agent 部署成本 |
关键链接
- https://blogs.nvidia.com/blog/vera-cpu-delivery/ — 首批交付博客
- https://nvidianews.nvidia.com/news/nvidia-launches-vera-cpu-purpose-built-for-agentic-ai — 官方新闻稿
- https://developer.nvidia.com/blog/nvidia-vera-cpu-delivers-high-performance-bandwidth-and-efficiency-for-ai-factories/ — 技术深度博客
- https://www.nvidia.com/en-us/data-center/vera-cpu/ — Vera CPU 官方产品页
- https://www.tomshardware.com/pc-components/gpus/nvidia-unveils-details-of-new-88-core-vera-cpus-positioned-to-compete-with-amd-and-intel — Tom's Hardware 分析