NVIDIA Vera CPU — 专为 Agentic AI 打造的首款自研 CPU，首批交付

来源: https://blogs.nvidia.com/blog/vera-cpu-delivery/

日期: 2026-05-19

评分: ⭐⭐⭐⭐⭐ (5/5)

一句话版本

NVIDIA 上周五（5月15日）开始向 Anthropic、OpenAI、SpaceXAI 和 Oracle 交付它的首款自研 CPU Vera——这不是给电脑用的，是专门给 AI Agent 用的 CPU，88个自研核心、1.2 TB/s 内存带宽，比 AMD/Intel 快 50%。

核心内容

大事件：Vera CPU 开始交付

2026年5月15日（上周五），NVIDIA 副总裁 Ian Buck 亲自将首台 Vera CPU 系统送到了三家顶级 AI 实验室，周一又送到了 Oracle：

客户	时间	地点	接机人
Anthropic	上周五	旧金山 SoMa	James Bradbury（计算负责人）
OpenAI	上周五	Mission Bay	Sachin Katti（计算基础设施负责人）
SpaceXAI	上周五	帕洛阿尔托	Elon Musk（亲自上阵，问了很多架构问题）
Oracle Cloud	周一	Santa Clara	Karan Batta + Gary Miller

这是 Vera 从 GTC 2026（3月16日）发布后的首次实物交付——从宣布走向生产。

为什么 Agentic AI 需要专用 CPU？

NVIDIA 的核心论点：AI Agent 不只在 GPU 上跑。

每次 AI Agent 执行一个任务，背后发生的是：

1. Agent 需要执行代码 → CPU 编译 ✅

2. Agent 需要搜索文件 → CPU I/O ✅

3. Agent 需要调用工具 → CPU 编排 ✅

4. Agent 需要跑沙箱 → CPU 隔离 ✅

5. Agent 需要检索长上下文 → CPU 内存管理 ✅

传统 CPU（AMD EPYC、Intel Xeon）设计时以核心密度为优化目标，但 Agentic AI 需要的是高单核性能 + 高内存带宽 + 确定性低延迟的组合——Vera 正是为此而生。

技术规格

指标	数据
核心数	88 个 NVIDIA 自研 Olympus 核心 (Arm v9.2)
内存带宽	1.2 TB/s (LPDDR5X SOCAMM)
每核内存带宽	14 GB/s（传统数据中心的 ~3 倍）
持续负载表现	比竞品快 50%
单核 IPC 提升	1.5x
SCF 互连带宽	3.4 TB/s 对分带宽
峰值内存容量	1.5 TB（3x 前代 Grace）
功耗	传统 DDR 的一半以下
指令集	Arm v9.2，兼容已有 Arm 软件生态

核心架构亮点：

Olympus 核心：NVIDIA 首个完全自研的数据中心 CPU 核心，10-wide 指令获取/解码前端，神经分支预测器（每周期可评估 2 个预测分支）
NVIDIA Spatial Multithreading (SMT)：每个核心可跑 2 个线程，但不像传统 SMT 那样时间分片——而是提供稳定的性能隔离和可预测的尾延迟
第二代 SCF（Scalable Coherency Fabric）：统一拓扑，所有核心到内存/缓存的延迟一致——不需要像 x86 那样做 NUMA 感知的任务绑定
LPDDR5X SOCAMM：可拆卸、可升级的小型内存模组，首次把低功耗内存引入数据中心

平台家族

Vera 不是单芯片，是一个完整平台：

平台	说明	场景
Vera Rubin NVL72	Vera CPU + Rubin GPU 通过 NVLink-C2C 紧密耦合	大型 AI 工厂，前沿训练/推理
Vera CPU Rack	液冷机架，256 颗 Vera CPU，22,500+ 并发沙箱	AI 工厂基础设施，Agent pipelines
单/双路 Vera 服务器	1-2 颗 Vera CPU，1.5TB LPDDR5X/路	云基础设施、企业、HPC
HGX Rubin NVL8	Vera 作为 Rubin GPU 的主机 CPU	AI 推理、技术计算

性能数据

Agentic 沙箱性能：持续满载下比 x86 竞品快 1.5x（编译器、脚本引擎、运行时、压缩、工具调用）
Vera CPU Rack：4x 沙箱密度、2x 能效比 vs x86 机架
Redpanda 测试：Kafka 兼容工作负载，5.5x 更低延迟
Vera + Rubin 预填充/解码分工：Prefill 跑在 Vera 上，Decode 跑在 Rubin 上 → 35x tokens/watt 提升
能效：x86 的两倍

生态支持

客户/云提供商：Alibaba Cloud、ByteDance、Meta、OCI、CoreWeave、Lambda、Nebius、Nscale

OEM 伙伴：Dell Technologies、HPE、Lenovo、Supermicro、ASUS、Compal、Foxconn、GIGABYTE、Pegatron、QCT、Wistron、Wiwynn

关键 ISV：Cursor（CEO Michael Truell 公开表示将采用 Vera 提升编码 Agent 性能）、Redpanda

可用时间

首批工程样机交付：2026年5月15日
OEM 商用出货：2026 年下半年

分析

为什么这是 Big Deal

1. NVIDIA 正式进军 CPU 市场 — 不再是 Grace（只是 GPU 的陪衬），Vera 是独立 CPU 产品线。Jensen 在 GTC 上说这是 NVIDIA 的下一个数十亿美元业务

2. "Agentic CPU" 这个品类被定义了 — 以前 CPU 是为通用计算或服务器设计的，Vera 第一次说"我是为 Agent 造的"。这会给整个行业带来新分类

3. 性能数据非常猛 — 1.5x 现网满载性能 vs AMD/Intel 旗舰，4x 机架密度，2x 能效。这不是 PPT 数据，首批实物已经交付

4. 生态已全面铺开 — 所有主要 OEM 都在做 Vera 服务器，OCI 计划部署数十万颗，Cursor 公开背书

5. Vera + Rubin 的协同设计才是王炸 — 预填充跑 Vera、解码跑 Rubin，35x tokens/watt。这是 x86 架构永远做不到的垂直整合

市场影响

对 AMD/Intel：真正的威胁。NVIDIA 有 GPU 生态的天然抓手，能从"GPU 附带的 CPU"切进数据中心 CPU 市场
对 Arm 服务器生态：强心针。NVIDIA 入局 Arm 服务器 = Arm 在数据中心的第三极（AWS Graviton + NVIDIA Vera + 其他）
对 AI 泡沫叙事：老黄说"AI 需要新 CPU" → 实际上验证了 Agentic AI 的基础设施需求远超预期

潜在风险

Vera 是初代产品，落地稳定性待验证
Arm 生态的软件兼容性（虽然是 v9.2 兼容，但很多企业工具链还是 x86 原生）
OEM 服务器要到 H2 2026 才能买得到
价格未知——NVIDIA 的 CPU 定价策略可能会很激进

与我们项目的关联

从"Agent CPU"看 Agent 基础设施趋势

Vera 的核心理念——Agent 需要大量 CPU 来做编排、沙箱、工具调用、数据预处理——跟我们做 OpenClaw deep research 的实践一致：

每次做 deep research，我们跑 web_fetch、web_search、浏览器操作、代码执行、文件 I/O，这些都是 CPU 密集的
OpenClaw 的沙箱隔离（每个子 Agent 独立环境）正是 Vera 设计的典型场景
Long-context 检索、记忆压缩、文件嵌入——都是内存带宽敏感任务

对部署的影响

如果 Vera + Rubin 的组合兑现 35x tokens/watt，重度 Agent 用户的推理成本会大幅下降
Vera 的 22,500+ 沙箱/机架意味着托管 Agent 服务（如 Manus Cloud Computer）的密度可以提升 4x
LPDDR5X SOCAMM 的可维修性设计很有意思——跟 OpenClaw 的模块化设计哲学一致

值得关注的时间点

2026 H2: OEM 服务器上市 → 届时可以关注 Vera 在 Agent 工作负载上的实际评测
Cursor 的 Vera 部署结果：如果 Cursor 真的用上了且效果好，这是最直接的 Agent 场景验证

评分表

维度	评分	说明
创新性	⭐⭐⭐⭐⭐	首个专为 Agentic AI 设计的 CPU，重新定义了 CPU 分类
技术实现	⭐⭐⭐⭐⭐	Olympus 自研核心 + SMT + LPDDR5X + SCF，架构统一优雅
性能数据	⭐⭐⭐⭐☆	1.5x vs x86 竞品在 spec 层面很有说服力，但需独立验证
生态影响力	⭐⭐⭐⭐⭐	所有 OEM、主要云商、Cursor 等 ISV 全线站队
与我们关联	⭐⭐⭐⭐	Agent 基础设施核心组件，直接影响 Agent 部署成本

关键链接

https://blogs.nvidia.com/blog/vera-cpu-delivery/ — 首批交付博客
https://nvidianews.nvidia.com/news/nvidia-launches-vera-cpu-purpose-built-for-agentic-ai — 官方新闻稿
https://developer.nvidia.com/blog/nvidia-vera-cpu-delivers-high-performance-bandwidth-and-efficiency-for-ai-factories/ — 技术深度博客
https://www.nvidia.com/en-us/data-center/vera-cpu/ — Vera CPU 官方产品页
https://www.tomshardware.com/pc-components/gpus/nvidia-unveils-details-of-new-88-core-vera-cpus-positioned-to-compete-with-amd-and-intel — Tom's Hardware 分析