英伟达Vera CPU开始交付:系统内存达1.5TB,或重塑DRAM供应链
Andy 2026-05-20 18:46英伟达近日宣布,其首款专为代理式 AI设计的 Vera CPU 已完成首批交付。首批客户包括 Anthropic、OpenAI、SpaceX AI 以及甲骨文云端基础设施(OCI)。
产品定位与技术规格
Vera CPU是英伟达首款完全自主设计的数据中心 CPU,也是此前 Grace 处理器的继任者。与 Grace 主要作为 GPU 配套主机处理器的定位不同,Vera 专门面向智能体 AI 工作负载,承担以下关键任务:
编排调度与工具调用、强化学习训练与数据分析、智能体沙箱隔离、长上下文状态管理
Vera CPU采用英伟达下一代定制 Arm 架构 Olympus,配备 88 核 / 176 线程,系统内存高达1.5TB(为 Grace 的 3 倍),内存带宽达到 1.2TB/s,NVLink-C2C 互联带宽为 1.8TB/s,并支持机架级机密计算。
内存方案:LPDDR5X 的选择逻辑
在内存方案上,Vera CPU 选用 LPDDR5X,并采用 SOCAMM 封装模组。英伟达作出这一选择的核心考量是能效。相比传统 DDR5,LPDDR5X 在提供高带宽的同时功耗显著更低,官方表示 Vera 的每瓦性能处于行业领先水平。
值得注意的是,单颗 Vera CPU 将消耗大量 LPDDR5X 内存(1.5TB 容量)。随着 Vera 大规模出货,LPDDR5X DRAM 的需求预计将显著增长,供应链可能面临进一步收紧。
代理式 AI 时代下,CPU 重回关键地位
过去市场焦点集中于 GPU 算力,但在代理式 AI 时代,CPU 正重新成为关键元件。英伟达指出,长上下文推理、工具调用、强化学习沙箱及多层代理流程中,大量工作实际上发生在 CPU 层。AI服务器中的CPU:GPU比例,正从过去的1:4、1:8,逐渐向1:1靠近,未来部分场景下甚至可能出现CPU数量超过GPU的情况。
据悉,Vera CPU 将以两种形态交付:独立的 LPX 服务器,或Vera Rubin NVL72 机架中的主机处理器。