全程回顾黄仁勋“全栈AI”演讲：万亿美元新蓝图启动

K图 NVDA_0

　　北京时间周二清晨，英伟达创始人兼首席执行官黄仁勋在超过两个小时的“全栈AI”演讲中，勾勒出算力巨头未来一年的发展蓝图。

　　作为今天最重要的数字，黄仁勋给出了更为激进的算力芯片营收预测：到2027年可能达到1万亿美元。

　　硬件层面，英伟达展示了新一代Vera Rubin平台及Rubin Ultra架构，以及CPO共封装光学交换机以及与Groq合作的LPU推理系统。新的架构将GPU用于模型预填充与主要计算，而LPU负责低延迟Token解码，以显著提升AI推理效率。英伟达还展示了一款用于太空数据中心的芯片模组。

　　在软件与生态方面，英伟达推出DLSS 5和“一键养虾”平台NemoClaw，并宣布成立Nemotron联盟，与全球AI实验室合作开发开放基础模型，同时发布开源智能体工具链，推动企业构建自定义AI代理。公司认为，未来企业软件形态将从传统应用转向“AI代理平台”。

　　应用生态方面，英伟达宣布多家车企加入其robotaxi ready自动驾驶平台，并展示与迪士尼合作的机器人项目。

　　以下为直击实录：

　　02:00 在黄仁勋登台前，英伟达股价涨超2%，依然在去年8月至今的股价中枢上波动。黄仁勋似乎来晚了一些，演讲并没有准时开始。

（来源：TradingView）

　　02:19 黄仁勋登场！GTC主题演讲正式开始

　　02:20 回顾起点——今年正值CUDA诞生20周年

　　黄仁勋表示，今天是一场科技大会，我们将探讨诸多议题，包括人工智能、AI工厂、硬件设备以及更多精彩内容。

　　02:30 黄仁勋开场回忆了一番公司历史，例如CUDA、RTX、GeForce等产品的发展史。

　　02:34 今天的第一个新品：DLSS 5

　　英伟达宣布推出新一代AI图形技术DLSS 5，通过实时神经渲染模型为游戏画面注入更真实的光照和材质效果，被公司称为继2018年实时光线追踪后的最大图形突破。该技术利用游戏的颜色与运动向量数据生成接近电影级的画面效果，并保持实时交互性能，预计今年秋季上线，支持4K游戏，并获得多家大型游戏厂商支持。

　　演示中出现了《生化危机安魂曲》、《FC 26》等游戏。英伟达宣布，产业合作伙伴 / 支持厂商包括卡普空、网易、腾讯等游戏大厂。

　　02:50 黄仁勋谈应用加速（application acceleration）

　　黄仁勋表示，加速计算并不是一个系统层面的难题。“加速计算”这个说法其实少了一个词，只是现在很少再提起——那就是应用加速（application acceleration）。

　　如果我能让一台计算机把所有事情都运行得更快，那其实就是CPU的工作，但这种方式已经走到了尽头。未来我们能够继续提升应用速度、实现巨大性能提升并大幅降低成本的唯一方法，就是通过针对应用或特定领域的加速。

　　黄仁勋指出，面向特定领域的专用软件库（domain-specific libraries）将成为解决各个垂直行业具体问题的关键——从自动驾驶汽车到金融交易，从机器人到电子游戏等领域皆是如此。

　　03:06 黄仁勋：过去三年AI产业的3个里程碑产品分别是ChatGPT、o1推理模型，以及Claude Code智能体，象征着推理需求的激增。

　　03:09 最新营收预测登场！到2027年1万亿美元！！！！！！

　　黄仁勋说：“去年这个时候我说过，当时站在那个时间点上，我们看到了大约5000亿美元的需求——而且是高度确定的需求，包括到2026年的Blackwell和Rubin采购订单。那是我去年说的。”

　　他进一步表示：“不过我要告诉你们的是，现在在我所站的位置，我看到的是到2027年将达到至少1万亿美元的规模。”

　　03:11 黄仁勋：事实上，我们很可能仍然会供不应求。我确信计算需求将远远高于这个数字。

　　他进一步介绍称，英伟达约60%的业务来自超大规模云厂商（hyperscalers），也就是那些正在建设数据中心、需要大量AI GPU的公司。另外40%的业务来自其他领域，包括云服务、企业客户、机器人、游戏以及超级计算等。

　　03:22 黄仁勋开始强调每瓦Token数（Tokens per watt）这个指标。他强调，英伟达的Token成本目前是世界级的，基本无人能及。之所以能够做到这一点，是因为进行了极端程度的协同设计（co-design）。

　　黄仁勋还摆出了一个“Token之王”的姿势。

　　03:28 Vera Rubin来了

　　03:33 股民们要的炒作概念喷涌而出。

　　黄仁勋表示，Vera Rubin系统已经实现100%液冷。过去需要两天安装的系统，现在只需要两个小时就能完成安装。这同样是一台采用45℃热水冷却的超级计算机。这种方式减少了数据中心的压力，显著降低了冷却成本，并释放出更多可用电力。第六代NVLink系统也是完全液冷的。

　　备受关注的Groq LPU系统也登场。这个系统包含8颗LP30 Groq芯片，目前已经进入量产阶段。整套LPX机架包括：256个LPU处理器、128GB片上SRAM，合计640TB/s扩展带宽。

　　与Rubin GPU协同运行时，GPU和LPU会共同计算AI模型每一层，从而提高生成token的解码速度。

　　此外还有全球首个采用 CPO（共封装光学）的Spectrum-6 SPX交换机。该交换机已经进入全面生产阶段。

　　所谓共封装光学（CPO），就是把光模块直接集成在芯片上，使光信号可以直接与硅芯片连接。电子信号在这里转换为光信号并直接进入芯片。英伟达与台积电共同开发了这项制造工艺，目前只有英伟达实现量产。这项技术被称为Co-Packaged Optics，是一项革命性的技术。

　　黄仁勋也展示了单独出售的Vera CPU系统。在后续的新闻稿中，英伟达表示Vera CPU的产业合作伙伴包括Meta、甲骨文、阿里巴巴、字节跳动、Nebius等。

　　03:40 Rubin Ultra登场

　　与Rubin横向滑入机架不同，Rubin Ultra在Kyber机架中是垂直插入的。在一个NVLink域中可连接144块GPU。

　　03:45 黄仁勋进一步讲解LPU的价值。

　　他表示，如果你的工作负载主要是高吞吐任务，那么只使用Vera Rubin就很好。但如果你的工作负载包含大量编程任务或高价值工程任务（例如Token生成），应该在数据中心中加入Groq芯片。

　　该架构使用了大量SRAM，并且专门针对推理这一单一工作负载进行优化。而推理正是AI工厂最核心的工作负载。

　　英伟达正在重新设计推理流程，其中Vera Rubin负责 Prefill（预填充）与主要计算，Groq负责低延迟Token解码生成。目前Groq LP30芯片由三星制造，已经进入生产阶段，预计今年下半年发货。

　　03:50 英伟达还披露了下一代费曼架构的更多信息。首先，费曼架构GPU将采用3D堆叠芯片。同时，费曼GPU使用的内存不是次世代HBM，而是定制HBM技术。

　　04:02 英伟达还发布了一款用于太空数据中心的Vera Rubin模组，不过没有给出更多信息

　　04:04 英伟达的“一键养龙虾”平台NemoClaw亮相。这是能够一键部署的完整技术栈。该系统整合Nemotron模型与OpenShell运行环境。

　　04:15 黄仁勋表示，英伟达与OpenClaw开发者Peter Steinberger，以及全球一些最顶尖的安全与计算专家合作，打造了一整套智能体AI工具链。系统内部包含策略引擎（Policy Engine）、网络安全护栏（Network Guardrails）和隐私路由器（Privacy Router），确保 AI 代理在公司内部执行任务时是安全的。

　　英伟达还为智能体系统增加了许多能力。其中最重要的一点是：企业可以构建自己的自定义模型和自定义代理。黄仁勋强调，英伟达已经是全球开放模型的最大贡献者，站在AI模型各个领域的最前沿。

　　04:20 英伟达宣布成立“Nemotron联盟”，联合多家全球AI实验室共同开发开放式前沿基础模型，通过共享数据、算力与研究成果加速AI创新。首个项目将由英伟达与Mistral AI共同训练基础模型，并在DGX Cloud上构建，未来将作为Nemotron 4开源模型家族的核心基础，使企业和开发者能够针对行业和区域需求进行后训练与定制。

　　英伟达同时发布开源智能体软件套件，为企业和开发者提供构建与运行AI智能体的软件平台。该工具支持智能体自主完成复杂任务，并通过安全与策略机制保障部署。英伟达表示，企业未来将通过大量专业化AI代理提升知识工作效率，推动软件行业向“代理平台化”转型。

　　04:25 黄仁勋宣布，比亚迪、日产、吉利和现代汽车加盟英伟达robotaxi ready平台，并称“自动驾驶的ChatGPT时刻已至”。

　　04:30 英伟达与迪士尼的合作也在继续推进——《冰雪奇缘》中的雪宝（Olaf）机器人登上舞台，与黄仁勋一同展示英伟达如何为这一机器人提供技术支持。

　　04:35 在一段由AI生成的MV中，黄仁勋的2026 GTC演讲落幕。

（文章来源：财联社）