Connect with us

GPLP

AI工厂产出token,英伟达DSX与下一场制造业革命蓝图

行业事件

AI工厂产出token,英伟达DSX与下一场制造业革命蓝图

来源:未尽研究

作者:未尽研究

GTC大会上,黄仁勋穿着黑色皮衣,站在一排闪着金属光泽的巨型机柜前,向台下数千名工程师和投资人展示了一张密密麻麻的系统架构图,这是一套完整的”工厂操作系统”——英伟达称之为DSX

这次配合Vera Rubin GPU,英伟达正式发布了AI超级工厂的完整版设计参考和数字孪生蓝图,标志着英伟达不只是卖硬件和软件,而是要在AI推理需求跨越拐点之际,构建最具token生产效率与成本竞争力的基础设施。

黄仁勋正在主动改变AI竞争的规则,目的是把token生产体系绑定在一代又一代的GPU芯片上;将整个AI工厂生命周期转变为一个优化的产品级系统,亦将对未来的制造业产生深远的影响。

从超级工厂到AI超级工厂

2016年,马斯克在接受采访时说过一句让很多人困惑的话:

“特斯拉真正的产品不是电动车,而是生产电动车的超级工厂。制造机器的机器,在难度上指数级超过机器本身。”

当时很多人把这句话当成马斯克一贯的大话。但几年后,当特斯拉上海工厂以令人难以置信的速度建成投产,并以远低于弗里蒙特工厂的成本大规模生产Model 3时,人们才开始认真对待这句话的含义。

这句话有一个明确的技术意涵:制造系统的设计能力,比制造出来的单个产品更有价值。产品是工厂的输出,工厂才是真正的护城河。竞争对手可以拆解每一颗螺丝,却复制不了那套极度垂直整合、持续迭代的制造系统。

DSX正是把这个洞见推进到了下一个量级。

在理解DSX之前,需要先理解黄仁勋所说的”AI工厂”是什么意思。

传统数据中心的定位是存储和计算数据的基础设施,它更像是一个仓库。但黄仁勋把新一代AI数据中心重新定义为AI工厂:一座像制造业工厂一样,持续不断生产某种产品的设施。只不过这座工厂生产的不是汽车或芯片,而是智能,更准确地说,是AI推理所产生的token。

当一座数据中心运行着数万颗GPU,24小时不间断地为全球数亿用户提供AI服务时,它需要精密的能源管理、精确的温度控制、复杂的物流调度,以及持续的效率优化。

而且,AI工厂的规模正在迅速逼近令人眩晕的量级。英伟达预计,一座吉瓦级AI工厂用电量相当于一座中型城市,它代表着500亿美元的投资和2000亿美元的潜在营收。在这个量级上,哪怕效率提升1%,就意味着20亿美元的价值差距。

这就是DSX要解决的问题。

DSX:建造工厂的工厂

DSX的全称是Data Center eXperience,是”基础设施级别的极致协同设计”;用更直白的语言来说,它是一套从零建造和运营AI工厂的完整操作系统。

黄仁勋展示了两张图。第一张是战略全景图,把DSX分成三层:最底层是物理设施(芯片、机柜、电力系统、液冷系统),中间层是软件库和API,最顶层是参考设计和方法论。这张图是说给投资人和决策者听的:我们不只卖GPU,我们卖整座工厂。

第二张图则是工程师看的版本,密密麻麻地展示了整个系统的工作流程,分为四个阶段:设计(Design)、仿真(Simulate)、建造(Build)和运营(Operate)。这四个阶段首尾相连,构成一个完整的闭环。

设计阶段的核心是一套叫做SimReady的规范体系。在这个阶段,每一台机柜、每一根冷却管道、每一条供电线路,都以OpenUSD格式被精确建模——不只是几何形状,还包括热力学参数、电气特性、连接拓扑。这些数字资产之精确,达到了可以直接用于物理仿真的程度。

仿真阶段是整个DSX最具革命性的环节。在Omniverse数字孪生平台里,一座还没动一块砖的AI工厂,已经可以在虚拟环境中完整运行——网络流量仿真、热力学仿真、电气负载仿真、站点环境仿真,同时进行,全面验证。更关键的是,英伟达引入了Physics NeMo等工具,专门训练替代模型(Surrogate Model)——用AI来加速物理仿真本身,使得仿真速度比传统CFD(计算流体动力学)快出几个数量级。

建造阶段则把数字设计转化为物理建设,引入了Procore等施工管理系统,整合BIM数据、施工进度、成本控制,甚至包括现场机器人和建造自动化。英伟达的野心渗入到了砖瓦之间。

而最令人着迷的,是最后一个阶段。

智能体开始管理工厂

传统工厂有一个令人沮丧的规律:它在建成那一天是最好的状态,之后只有磨损和老化,靠人工维护来抵抗熵增。每一次参数调整,都依赖工程师的经验积累;每一次故障排查,都需要翻阅厚厚的运维手册。

DSX的运营阶段(Operate)提出了一个完全相反的愿景:工厂越运行越聪明。

这个愿景的核心,是一家叫做Phaidra的公司。

三位创始人于2019年联合创立了这家公司,Jim Gao曾主导Google DeepMind的工业AI项目,Vedavyas Panneershelvam是AlphaGo的核心工程师之一,Katherine Hoffman则来自制冷设备巨头Trane,拥有丰富的工业控制系统经验。这个组合的意图非常明确:把DeepMind级别的强化学习能力,嫁接到工业控制系统的实战场景中。

Phaidra不依赖预先编写的规则(如果温度超过X就触发Y),而是通过强化学习,在数据中心的历史遥测数据上反复训练,让AI自己摸索出最优的控制策略。

它的智能体首先在Omniverse数字孪生环境里接受训练,经历数以万计的虚拟运行场景,学会如何应对各种极端情况。训练成熟后即部署到真实的物理系统中。

英伟达用自己的DGX SuperPOD做了一次测试——用这套系统的数字孪生体训练了一个AI智能体,然后部署到搭载真实AI工作负载的DGX GB200系统上。结果出人意料:在仿真中训练出的智能体,其表现显著超越了已经由人类专家精心调校过的现有液冷控制系统。这印证了一个规律:在足够复杂的系统里,AI能发现人类专家穷尽经验也想不到的优化路径。

数字说明了一切:与传统控制系统相比,Phaidra的智能体将AI工作负载引发的液冷热峰值降低了约80%,GPU集群热稳定性提升70%。而在更早期的Google数据中心应用中,冷却能耗降低了40%。以往需要数天乃至数周的故障排查,现在缩短到数分钟。

这些数字,在吉瓦级AI工厂的量级下,意味着数以十亿美元计的节省。

两百家合作伙伴

DSX不仅是英伟达垂直整合的极致追求,也是横向开放的结果。

在GTC大会正式宣布这一平台时,英伟达同时公布了超过200家合作伙伴,其中点名的核心伙伴,几乎把AI工厂全生命周期的每一个关键节点都占据了。

设计环节:达索系统(Dassault Systèmes)将新的参考设计集成进其CATIA软件的MBSE平台;PTC负责产品生命周期管理;Cadence接入其数据中心数字孪生平台;Jacobs——全球最大的工程建设咨询公司之一——负责设施工程设计。

仿真环节:西门子(Siemens)和施耐德电气(Schneider Electric)基于Omniverse DSX Blueprint,构建AI工厂的高精度数字孪生,在虚拟环境中仿真气流、功耗、网络拓扑和热力学行为。

建造环节:Procore Technologies负责施工管理系统,整合BIM数据、施工进度、资产清单和成本控制。Nscale和Switch已宣布使用DSX蓝图建设其AI工厂。

运营环节:伊顿(Eaton)与英伟达联合推出了专为Vera Rubin NVL72设计的模块化数据中心平台,支持每机柜超过130kW的功率密度,采用800V直流供电基础设施;维谛(Vertiv)负责精密电源和冷却;特灵科技(Trane Technologies)提供热管理解决方案;以及前文所述的Phaidra,负责AI自主运营。

而最值得关注的,是单独列出的能源合作伙伴:通用电气旗下的GE Vernova、日立(Hitachi)、西门子能源(Siemens Energy)和Emerald AI。这些公司的存在,揭示了AI工厂最终极的瓶颈所在——不是算力,而是电力。

GE Vernova将数字孪生能力延伸至从电网到AI工厂的整个电力栈,与DSX参考架构对齐,统一电力和算力建模。日立利用物理AI和电力系统专业知识,为吉瓦级AI工厂规划高效可靠的电力供给。西门子能源在其Noedra数字孪生平台中,使用NVIDIA RAPIDS库实时监测电网健康状态,在故障发生前预测风险。Emerald AI则专注于可再生能源的智能调度,对应DSX系统图里DSX Flex模块中那个明确标注的接入节点。

这张合作伙伴地图,本身就是一幅完整的未来制造产业图景。

工厂的工厂

工业系统的演变,有三个递进的认知层级:

第一层,设计更好的产品。这是大多数制造企业的竞争方式——更好的工程设计,更好的材料,更好的功能。这个层级的竞争是透明的,也是容易被模仿的。

第二层,把工厂本身当作产品来设计。这是马斯克的洞见。工厂的建造效率、运营效率、持续迭代能力,才是真正的竞争壁垒。这个层级的竞争是隐性的,因为外人很难完整观察到一座工厂系统的全貌。

第三层,把建造和运营工厂的完整知识体系产品化。这是英伟达DSX的野心。它不只是建造一座AI工厂,而是把建造和运营AI工厂的所有方法论、工具链、仿真体系、自动化运营能力,打包成一套可以交付、可以复制、可以持续迭代的系统。

用一个更简洁的表达:

– 传统制造是设计产品 ,建工厂生产产品

– 马斯克认为工厂本身是产品 ,持续迭代工厂

– 黄仁勋预见到设计、建造、运营工厂的系统是产品,DSX就是建造AI工厂的工厂

这是一个”元制造”(Meta-Manufacturing)的概念。

DSX所代表的这套方法论,已经在AI数据中心建设中初步验证,其影响也将远远超出AI数据中心本身。

首先,制造知识将被彻底软件化。传统工厂最宝贵的资产是隐性知识——老工程师几十年积累的调试直觉,口口相传的工艺参数,在特定设备上才能体现的操作习惯。这些知识极难转移,一旦人员流失就永久损失,这也是在美国已经发生的事情,制造业中的许多行业,在美国不是“外包”的问题,而是已经失传了。DSX正在做的,是把”如何建造和运营最优AI工厂”这套知识完全编码进软件——SimReady规范、Omniverse数字孪生、Phaidra的强化学习模型。第一座工厂的建设经验,可以直接复用到第一百座;工厂知识不再依附于人,而是沉淀在系统里持续迭代。

其次,”先仿真后建造”将成为复杂制造的标准范式。工业史上最大的浪费,发生在建好了才发现设计有问题的时刻。Omniverse数字孪生让整座AI工厂在第一块砖铺下之前就已经跑通了数千次仿真。这个逻辑可以向所有复杂制造系统推广:芯片工厂在建设前完整仿真良率,化工厂在投产前完整仿真安全边界,制药工厂在投产前完整仿真GMP合规性。建了再试的时代,将逐步被”仿真即建造”取代。

第三,工厂将从静态系统变成持续进化的有机体。Phaidra所代表的自主运营AI,让工厂从开机第一天就在学习——自适应负载变化、季节变化、设备老化,持续逼近能效边界,越运行越聪明。这个特性,在任何传感器数据足够丰富的复杂制造场景中都适用:汽车工厂的机器人控制、半导体工厂的良率优化、精密化工的反应炉管理。

第四,能源将重塑工业地理。当DSX把算力调度和电网调度打通,工厂可以在电价低谷时跑高强度训练任务,可以作为电网的柔性调节器消纳可再生能源的波动。这意味着工业选址逻辑将从靠近市场转向靠近廉价与稳定的能源。西弗吉尼亚、沙特、阿联酋大量投资AI工厂,本质上是在把自然资源禀赋(煤电、油气、光照)兑换成算力资产。

英伟达在深挖新的护城河

单颗GPU的性能差距,竞争对手可以用3-5年时间追平。CUDA生态的护城河更深,需要10年以上的生态积累才能动摇。但从电力规划到AI自主运营的全栈AI工厂系统这套能力,竞争对手要复制,面对的是一套由200家合作伙伴、数十年工业知识、以及自我进化的AI系统共同构成的壁垒。

马斯克说,制造机器的机器,在难度上指数级超过机器本身。

英伟达用DSX押注的,是把这个指数级的难度,封装成一个可以交付的产品。

如果这个赌注成立,未来制造业的真正分野,将不再是谁拥有最好的设备,而是谁掌握了”设计-仿真-建造-自主运营”这套完整闭环的系统能力。这是工业文明一次真正意义上的范式跃迁——从人操作机器”到AI运营工厂”,从工厂生产产品到系统生成工厂。

如果说智能体的未来,是解决当下推理所面临的挑战,进一步降低token的成本,加快实现赢利的进度,那么决定未来竞争优势的,已经不再是GPU芯片,而是高效产出token的能力。把技术和市场的这一趋势,转变竞争战略,再工程化、系统化、产品化,这方面的能力,没有人能比得过黄仁勋。

这就是AI工厂,一种能持续优化的产品级的系统。AI自回归的优化,不仅在于模型的生成能力本身,也在于产生这个模型的整个链条。

参考

https://nvidianews.nvidia.com/news/nvidia-releases-vera-rubin-dsx-ai-factory-reference-design-and-omniverse-dsx-digital-twin-blueprint-with-broad-industry-support

https://build.nvidia.com/nvidia/omniverse-dsx-blueprint-for-ai-factories

更多关于 行业事件的文章

  • 行业事件

    光刻机巨头,轰然“倒塌”

    By

    来源:半导体行业观察 作者:L晨光 近日,日本光学巨头尼康(Nikon)发布了其历史上最为惨烈的亏损预警——预计2025财年将出现850亿日元的巨额亏损,创下公司自1917年创立以来的百年最差...

  • 行业事件

    困在“活动”里的商场:越热闹,越迷茫

    By

    来源:惊蛰研究所 作者|初夏 从二次元“痛楼”的盛大庆生、coser巡游的破壁狂欢,到手作市集升腾的烟火气、咖啡节弥漫的醇香,再到宠物交友会流露的治愈瞬间……如今的商业空间,仿佛一座永不落幕的...

  • 行业事件

    ARM的AI叙事:AGI路径与CPU复兴

    By

    来源: 未尽研究  作者:未尽研究 在AI叙事中,GPU一度吞噬了一切,但那些曾被边缘化的角色,逐步重新成为瓶颈。正如黄仁勋反复强调的那样,CPU已经成为限制英伟达“AI工厂”吞吐token速...

  • 行业事件

    中国独角兽十二年全景图谱:805家企业的诞生与退场

    By

    来源:IT桔子 作者:Judy 截至2025年底,IT 桔子记录,中国创投市场累计诞生了805家估值超10亿美元的独角兽企业。这是一个创造神话的数字,但更是一个充满周期的故事——其中336家已...

  • 行业事件

    塑料包装涨、物流费涨、生鲜成本涨:谁在为油价上涨买单?

    By

    来源:灵兽 作者:楚勿留香 零售企业如何应对油价上涨 “一是,不要存那么多货,高进高出,低进低出,保持合理的利润;二是,优化配送线路,从集约化管理方面去做一些调整。”谈及零售企业如何应对油价上...

To Top