
北京时间周二清晨,英伟达创始人兼首席执行官黄仁勋在超过两个小时的“全栈AI”演讲中,勾勒出算力巨头未来一年的发展蓝图。
作为今天最重要的数字,黄仁勋给出了更为激进的算力芯片营收预测:到2027年可能达到1万亿美元。
硬件层面,英伟达展示了新一代Vera Rubin平台及Rubin Ultra架构,以及CPO共封装光学交换机以及与Groq合作的LPU推理系统。新的架构将GPU用于模型预填充与主要计算,而LPU负责低延迟Token解码,以显著提升AI推理效率。英伟达还展示了一款用于太空数据中心的芯片模组。
在软件与生态方面,英伟达推出DLSS 5和“一键养虾”平台NemoClaw,并宣布成立Nemotron联盟,与全球AI实验室合作开发开放基础模型,同时发布开源智能体工具链,推动企业构建自定义AI代理。公司认为,未来企业软件形态将从传统应用转向“AI代理平台”。
应用生态方面,英伟达宣布多家车企加入其robotaxi ready自动驾驶平台,并展示与迪士尼合作的机器人项目。
以下为直击实录:
02:00 在黄仁勋登台前,英伟达股价涨超2%,依然在去年8月至今的股价中枢上波动。黄仁勋似乎来晚了一些,演讲并没有准时开始。

(来源:TradingView)
02:19 黄仁勋登场!GTC主题演讲正式开始

02:20 回顾起点——今年正值CUDA诞生20周年
黄仁勋表示,今天是一场科技大会,我们将探讨诸多议题,包括人工智能、AI工厂、硬件设备以及更多精彩内容。
02:30 黄仁勋开场回忆了一番公司历史,例如CUDA、RTX、GeForce等产品的发展史。
02:34 今天的第一个新品:DLSS 5
英伟达宣布推出新一代AI图形技术DLSS 5,通过实时神经渲染模型为游戏画面注入更真实的光照和材质效果,被公司称为继2018年实时光线追踪后的最大图形突破。该技术利用游戏的颜色与运动向量数据生成接近电影级的画面效果,并保持实时交互性能,预计今年秋季上线,支持4K游戏,并获得多家大型游戏厂商支持。

演示中出现了《生化危机安魂曲》、《FC 26》等游戏。英伟达宣布,产业合作伙伴 / 支持厂商包括卡普空、网易、腾讯等游戏大厂。
02:50 黄仁勋谈应用加速(application acceleration)
黄仁勋表示,加速计算并不是一个系统层面的难题。“加速计算”这个说法其实少了一个词,只是现在很少再提起——那就是应用加速(application acceleration)。
如果我能让一台计算机把所有事情都运行得更快,那其实就是CPU的工作,但这种方式已经走到了尽头。未来我们能够继续提升应用速度、实现巨大性能提升并大幅降低成本的唯一方法,就是通过针对应用或特定领域的加速。

黄仁勋指出,面向特定领域的专用软件库(domain-specific libraries)将成为解决各个垂直行业具体问题的关键——从自动驾驶汽车到金融交易,从机器人到电子游戏等领域皆是如此。
03:06 黄仁勋:过去三年AI产业的3个里程碑产品分别是ChatGPT、o1推理模型,以及Claude Code智能体,象征着推理需求的激增。

03:09 最新营收预测登场!到2027年1万亿美元!!!!!!

黄仁勋说:“去年这个时候我说过,当时站在那个时间点上,我们看到了大约5000亿美元的需求——而且是高度确定的需求,包括到2026年的Blackwell和Rubin采购订单。那是我去年说的。”
他进一步表示:“不过我要告诉你们的是,现在在我所站的位置,我看到的是到2027年将达到至少1万亿美元的规模。”
03:11 黄仁勋:事实上,我们很可能仍然会供不应求。我确信计算需求将远远高于这个数字。
他进一步介绍称,英伟达约60%的业务来自超大规模云厂商(hyperscalers),也就是那些正在建设数据中心、需要大量AI GPU的公司。另外40%的业务来自其他领域,包括云服务、企业客户、机器人、游戏以及超级计算等。
03:22 黄仁勋开始强调每瓦Token数(Tokens per watt)这个指标。他强调,英伟达的Token成本目前是世界级的,基本无人能及。之所以能够做到这一点,是因为进行了极端程度的协同设计(co-design)。
黄仁勋还摆出了一个“Token之王”的姿势。

03:28 Vera Rubin来了

03:33 股民们要的炒作概念喷涌而出。
黄仁勋表示,Vera Rubin系统已经实现100%液冷。过去需要两天安装的系统,现在只需要两个小时就能完成安装。这同样是一台采用45℃热水冷却的超级计算机。这种方式减少了数据中心的压力,显著降低了冷却成本,并释放出更多可用电力。第六代NVLink系统也是完全液冷的。

备受关注的Groq LPU系统也登场。这个系统包含8颗LP30 Groq芯片,目前已经进入量产阶段。整套LPX机架包括:256个LPU处理器、128GB片上SRAM,合计640TB/s扩展带宽。
与Rubin GPU协同运行时,GPU和LPU会共同计算AI模型每一层,从而提高生成token的解码速度。

此外还有全球首个采用 CPO(共封装光学)的Spectrum-6 SPX交换机。该交换机已经进入全面生产阶段。

所谓共封装光学(CPO),就是把光模块直接集成在芯片上,使光信号可以直接与硅芯片连接。电子信号在这里转换为光信号并直接进入芯片。英伟达与台积电共同开发了这项制造工艺,目前只有英伟达实现量产。这项技术被称为Co-Packaged Optics,是一项革命性的技术。
黄仁勋也展示了单独出售的Vera CPU系统。在后续的新闻稿中,英伟达表示Vera CPU的产业合作伙伴包括Meta、甲骨文、阿里巴巴、字节跳动、Nebius等。

03:40 Rubin Ultra登场

与Rubin横向滑入机架不同,Rubin Ultra在Kyber机架中是垂直插入的。在一个NVLink域中可连接144块GPU。
03:45 黄仁勋进一步讲解LPU的价值。
他表示,如果你的工作负载主要是高吞吐任务,那么只使用Vera Rubin就很好。但如果你的工作负载包含大量编程任务或高价值工程任务(例如Token生成),应该在数据中心中加入Groq芯片。

该架构使用了大量SRAM,并且专门针对推理这一单一工作负载进行优化。而推理正是AI工厂最核心的工作负载。
英伟达正在重新设计推理流程,其中Vera Rubin负责 Prefill(预填充)与主要计算,Groq负责低延迟Token解码生成。目前Groq LP30芯片由三星制造,已经进入生产阶段,预计今年下半年发货。

03:50 英伟达还披露了下一代费曼架构的更多信息。首先,费曼架构GPU将采用3D堆叠芯片。同时,费曼GPU使用的内存不是次世代HBM,而是定制HBM技术。

04:02 英伟达还发布了一款用于太空数据中心的Vera Rubin模组,不过没有给出更多信息

04:04 英伟达的“一键养龙虾”平台NemoClaw亮相。这是能够一键部署的完整技术栈。该系统整合Nemotron模型与OpenShell运行环境。


04:15 黄仁勋表示,英伟达与OpenClaw开发者Peter Steinberger,以及全球一些最顶尖的安全与计算专家合作,打造了一整套智能体AI工具链。系统内部包含策略引擎(Policy Engine)、网络安全护栏(Network Guardrails)和隐私路由器(Privacy Router),确保 AI 代理在公司内部执行任务时是安全的。

英伟达还为智能体系统增加了许多能力。其中最重要的一点是:企业可以构建自己的自定义模型和自定义代理。黄仁勋强调,英伟达已经是全球开放模型的最大贡献者,站在AI模型各个领域的最前沿。

04:20 英伟达宣布成立“Nemotron联盟”,联合多家全球AI实验室共同开发开放式前沿基础模型,通过共享数据、算力与研究成果加速AI创新。首个项目将由英伟达与Mistral AI共同训练基础模型,并在DGX Cloud上构建,未来将作为Nemotron 4开源模型家族的核心基础,使企业和开发者能够针对行业和区域需求进行后训练与定制。
英伟达同时发布开源智能体软件套件,为企业和开发者提供构建与运行AI智能体的软件平台。该工具支持智能体自主完成复杂任务,并通过安全与策略机制保障部署。英伟达表示,企业未来将通过大量专业化AI代理提升知识工作效率,推动软件行业向“代理平台化”转型。

04:25 黄仁勋宣布,比亚迪、日产、吉利和现代汽车加盟英伟达robotaxi ready平台,并称“自动驾驶的ChatGPT时刻已至”。

04:30 英伟达与迪士尼的合作也在继续推进——《冰雪奇缘》中的雪宝(Olaf)机器人登上舞台,与黄仁勋一同展示英伟达如何为这一机器人提供技术支持。

04:35 在一段由AI生成的MV中,黄仁勋的2026 GTC演讲落幕。



(文章来源:财联社)

