Connect with us

GPLP

全球领先,国产万卡超集群首次真机亮相

行业事件

全球领先,国产万卡超集群首次真机亮相

2025年12月18日,在昆山举行的光合组织2025人工智能创新大会(HAIC2025)上,中科曙光发布并展出了全球领先的大规模智能计算系统——scaleX万卡超集群,这也是国产万卡级AI集群系统首次以真机形式亮相。

“scaleX万卡超集群,是曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案”。中科曙光高级副总裁李斌表示,面对人工智能基础设施对性能、效率、可靠性、可扩展性等方面的极致需求,scaleX万卡超集群在超节点架构、高速互连网络、存储性能优化、系统管理调度等方面实现了多项创新突破,部分技术与能力已超越海外同类产品研发路线图的2027年NVL576里程节点,其核心技术优势如下:

优势1:全球首创单机柜级640卡超节点。scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署,总算力规模超5EFlops。作为世界首个单机柜级640卡超节点,scaleX640采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升20倍,PUE值低至1.04。

优势2:自主研发原生RDMA高速网络。曙光scaleFabric网络,基于国内首款400G 类InfiniBand的原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、低于1微秒端侧通信延迟,超节点间的通信性能达到业内领先水平,充分释放万卡超集群算力,并可将超集群规模轻松扩展至10 万卡以上,相比传统IB网络提升2.33倍,同时网络总体成本降低 30%。

优势3:存、算、传紧耦合深度优化。通过“超级隧道”、AI数据加速等设计,实现从芯片级、系统级到应用级的三级数据传输协同优化,使存力平台高效应对大模型训练时万卡并发读写带宽极致需求挑战,提升高通量AI推理时的响应速度与结果精准度,并可将AI加速卡资源利用率提高55%。

优势4:超集群数字孪生与智能调度。通过物理集群数字孪生,实现故障定位、修复等全流程可视化智能管理;智能化运维平台可支撑集群长期可用性达99.99%;智能调度引擎可管理万级节点、服务十万级用户,支持每秒万级作业调度。

作为 “AI计算开放架构”最新重磅成果,scaleX万卡超集群可支持多品牌加速卡以及主流计算生态,并实现400+主流大模型、世界模型等适配优化。在实际应用中,该超集群可覆盖大模型训练、金融风控、地质能源勘探及科学智能等多元场景。

“AI计算开放架构” 由中科曙光协同20多家AI产业链企业共同推出,以共享若干关键共性技术能力,依托系统工程思维推进智算集群创新。通过scaleX万卡超集群,AI企业可降低智算集群研发门槛,并从技术“单点突围”走向产业“生态共进”,将开放理念转化为可落地普惠算力。

更多关于 行业事件的文章

  • 行业事件

    刚火3个月,第一批馄饨酒馆已经开始关店了?

    By

    来源:红餐网 作者:周飞飞 走进一家馄饨酒馆,昏黄的灯光、水泥地板、简陋的木桌,以及十块钱一只的塑料凳子,构成了几乎统一的空间风格。墙上挂满土味标语——“让喝酒的人先富起来”“你有故事我有酒”...

  • 行业事件

    跨境电商新一轮裁员潮,AI背锅?

    By

    来源:亿邦动力 作者:王昱 “亚马逊裁员,我也‘受灾’啊。”在一家小型外贸公司负责亚马逊运营的小陈调侃道,从今年1月下旬开始,他就联系不上客户经理了,各种运营问题沟通一下子断裂。 2025年1...

  • 行业事件

    创新药“失血”:为何压舱石也跌跌不休

    By

    来源:深蓝观 作者:李昀  农历新年过后,无论A股还是港股,医药板块整体呈现走弱趋势。 据研报显示,A股2月医药板块整体跌去0.18%,而同期上证综指则增长了1.09%。而港股的回调更为深度:...

  • 行业事件

    大厂“养虾”,各怀心事

    By

    来源:定焦One 作者:定焦One团队 风口的到来,总是伴随着狂热、焦虑以及重新洗牌。 这一次的引爆点,是一个被开发者称为“龙虾”的开源项目——OpenClaw,由奥地利独立开发者彼得·斯坦伯...

  • 行业事件

    连战连捷!海光C86再破SPEC纪录!

    By

    来源:半导体行业观察 不到一个月,国产芯两次站上国际权威测试领奖台。 近日,海光C86携手浪潮云海InCloud Sphere,在SPECvirt_sc2013测试中以3782分的成绩,拿下国...

To Top