logo

新闻中心

浪潮信息重磅发布超节点 AI 服务器,适配万亿参数大模型

近日,浪潮信息推出了一款专为万亿参数级大模型打造的超节点 AI 服务器「元脑 SD200」。这款新产品的亮相,不仅彰显了浪潮信息在前沿计算架构领域的扎实功底,也意味着国产算力系统在应对超大规模 AI 模型挑战时,迈入了一个全新的发展阶段。下面,我们就来详细了解一下这款服务器。

一、单机承载万亿级模型,架构实现突破
如今,大模型参数规模不断攀升,像 DeepSeek R1、Kimi K2、Qwen 等开源模型都已接近或突破万亿参数。面对这样的趋势,传统服务器在显存和带宽方面的瓶颈愈发明显。而浪潮信息的「元脑 SD200」采用超节点架构,对算力逻辑进行了重构,在单机内集成了 64 路本土 GPU 芯片,让传统服务器集群的性能瓶颈成为过去。
在存储方面,借助远端 GPU 虚拟映射技术,服务器的显存统一地址空间扩大了 8 倍,单机能提供最大 4TB 的统一显存和 64TB 的统一内存。这就为万亿参数模型处理海量键值缓存和超长序列提供了充足的资源。实际测试显示,它能同时运行 DeepSeek R1、Qwen、Kimi、GLM 这四大国产顶级开源模型,满足多智能体实时协作和按需调用等复杂场景的需求。

通信方面,通过自研的 Open Fabric Switch 开放总线交换技术构建起 3D Mesh 系统架构,实现了 64 卡 GPU 的高速互连。凭借百纳秒级的物理链路和原生内存语义通信,在推理时的小数据包通信场景中,比如原子操作、load - store 指令等,性能有了明显提升。全规约等算子的通信效率也远超传统架构,有效解决了大规模并行计算中数据传输的难题。

二、软硬协同发力,突破芯片性能极限
「元脑 SD200」不只是简单的硬件组合,更是系统层面上软硬深度协同的成果。
智能总线管理系统能够根据万亿模型计算时对通信的敏感需求,动态规划出全局最优的路由,支持多拓扑结构的切换和资源的按需分配。对于 All Reduce、All Gather 等常见算子,通过多层级细粒度的通信策略,进一步降低延迟,让 64 卡 GPU 的协同潜力得到最大程度的发挥。
开放 PD 分离推理框架将推理过程拆分为预填充与解码异步并行,提高了 KV Cache 的传输效率。这不仅提升了业务场景的服务等级,还能很好地兼容昇腾、沐曦等国产 GPU 及异构计算组合,大大增强了系统对未来模型更新迭代的适应能力。

和传统的横向扩展方案相比,SD200 选择了纵向扩展路径。这种设计通过短链路物理集成,让芯片间的通信效率有了质的飞跃。浪潮信息副总经理赵帅表示,在推理场景的小数据包通信优化上,这种设计效果显著。实际测试中,DeepSeek R1 全参推理性能实现了 370% 的超线性扩展效率,Kimi K2 等模型的性能也有明显提升。

三、秉持开放生态理念,助力国产 AI 规模化应用
浪潮信息一直将开源开放作为核心战略,「元脑 SD200」就是这一理念的生动体现。
在本土产业链协同与兼容方面,服务器采用 OCM(开放算力模组)+ OAM(开放加速模块)标准架构设计,能够快速适配 Intel、AMD、ARM 等多种 CPU 平台,以及摩尔线程、沐曦、天数智芯等 20 余家主流国产 GPU 芯片。通过标准化,降低了产业链整合的成本,推动了国产算力生态的成熟。
在部署迁移方面,它全面兼容 PyTorch、vLLM、SGLang 等主流 AI 框架,以及 Megatron - LM、DeepSpeed 等训练工具,现有模型和工作流可以零改造迁移过来。这对生物医药、气象科学、工业仿真等垂直领域的客户来说非常重要,他们能快速将定制化的万亿模型部署到新平台上,加快 AI 在科学等前沿领域的应用。

同时,浪潮信息还通过「元脑生态」平台不断开放技术接口,与华胜天成、上海华胄等行业 ISV 伙伴深度合作,共同开发场景化解决方案,推动 AI 从通用能力向各个行业的智能化深度发展。

四、破解算力难题,改变 AI 应用模式
当前,AI 产业正受到模型参数膨胀和 Agentic 智能体交互的双重推动。
万亿模型的商业化迎来了关键转折点。麦肯锡预测,未来五年全球 AI 数据中心的算力需求将大幅增长,电力增量相当于 10 个三峡电站的年发电量。传统的单点服务器或小规模集群已经难以满足智能体应用的需求,这类应用推理速度需要达到 50–100 token/s,多轮对话的 token 量更是传统模型的百倍。「元脑 SD200」的全面商用,为企业提供了一条降本增效的规模化部署途径,单机就能替代部分低效集群,降低数据中心的复杂度和运维成本。

在绿色可持续方面,SD200 优先采用风冷方案,同时也兼顾液冷扩展。这不仅降低了企业机房改造的门槛,还顺应了全球数据中心能效优化的趋势,体现了浪潮信息长期坚持的「绿色计算」理念

五、前瞻布局,引领国产算力进入超节点时代
「元脑 SD200」的诞生并非偶然,而是浪潮信息在融合架构与开放计算领域十余年积累的成果。
其核心技术,如内存语义通信、资源池化、动态调度等,源于浪潮信息对「融合架构 3.0」的不断发展。从整合供电、散热等非 IT 资源,到实现计算、存储、异构加速等核心资源的深度解耦,积累了芯片共享内存、统一编址等关键能力。此前发布的「源 1.0」中文巨量模型(2457 亿参数)以及多款 CPU 推理服务器(如 NF8260G7),都为大模型优化积累了丰富经验。
作为开放计算社区(OCP)与中国开放计算标准组织(OCTC)的重要成员,浪潮信息正积极推动超节点架构的标准化。后续计划开源部分设计及 PD 分离框架,联合产学研伙伴共同构建 GW 级开放智算生态,助力中国在全球 AI 算力竞争中占据有利地位。


X云擎技术

截屏,微信识别二维码

微信号:18148905161

(点击微信号复制,添加好友)

  打开微信