当前位置:首页 > Deepseek最新资讯 > 正文内容

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

3个月前 (08-09)Deepseek最新资讯396

  当前,开源模型正取得飞跃式进步,推动研发范式从封闭走向开放协作deepseek。随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片。

  据介绍,元脑SD200可实现单机内运行超万亿参数大模型,并支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,目前已率先实现商用。在实际评测中,元脑SD200运行DeepSeek R1和Kimi K2等全参模型的64卡整机推理性能实现超线性扩展。浪潮信息通过开放系统架构创新,为开源大模型的规模化落地和应用创新提供关键支撑。

  随着混合专家模型(MoE)的高效架构驱动大模型参数规模持续扩展,国内外前沿大模型的参数量快速突破万亿规模,这给算力系统架构提出新的挑战。一方面,模型参数量增加和序列长度增加带来的键值缓存(KV cache)激增,需要智能计算系统具有超大显存空间承载,依靠单芯片或节点的性能提升已难以为继;且其推理过程作为通信敏感型计算,对分布式计算通信延时要求极高,需要构建更大向上扩展(Scale up)高速互连域。另一方面,智能体AI开启多模型协作的新范式,其推理过程需要生成比传统模型多近百倍的数据词元(token),导致计算量激增。

  元脑SD200超节点AI服务器是浪潮信息面向万亿参数大模型AI时代而设计,创新研发多主机低延迟内存语义通信架构,基于开放总线交换技术构建,在单机内实现了64路GPU芯片的高速统一互连,成功解决万亿大模型对超大显存空间和超低通信延时的核心需求。在开放架构之上,元脑SD200通过智能总线管理和开放的预填充-解码(Prefill-Decoder)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务。

  在架构层面,元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。

  在系统层面,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

  元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。(战钊)原文出处:浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计,感谢原作者,侵权必删!

标签: deepseek

“浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计” 的相关文章

腾讯教育助力东南大学计算机科学与工程学院拔尖创新人才培养,共探AI助力交叉学科建

腾讯教育助力东南大学计算机科学与工程学院拔尖创新人才培养,共探AI助力交叉学科建

  近日,腾讯云与东南大学计算机科学与工程学院(简称“计算机学院”)开展深度合作,双方基于腾讯前沿AI技术与数字化基础设施,共同探索人才培养、课程创新、学科融合发展等新模式。...

全球十大工程成就发布,DeepSeek、英伟达等上榜

全球十大工程成就发布,DeepSeek、英伟达等上榜

  10月13日,由中国工程院院刊《Engineering》评选的“2025全球十大工程成就”,在“2025年世界工程组织联合会全体大会暨全球工程大会”上正式发布。   ...

中加配置周报|DeepSeek发布V3.1模型,鲍威尔暗示政策转向

中加配置周报|DeepSeek发布V3.1模型,鲍威尔暗示政策转向

  1、中国新一期LPR出炉,1年期为3.0%,5年期以上为3.5%,连续三月保持不变。业内专家普遍认为,LPR继续“按兵不动”,符合预期。从LPR报价机制看,近期央行多次开展公开市场操作...

DeepSeek预测:热那亚vs尤文图斯!斑马军团火力全开,伊尔迪兹助攻王领衔屠

DeepSeek预测:热那亚vs尤文图斯!斑马军团火力全开,伊尔迪兹助攻王领衔屠

  作为意甲历史最悠久的俱乐部,热那亚新赛季首轮0-0闷平莱切,目前以1分暂列第11位。而尤文图斯则在图多尔带领下2-0轻取帕尔马,与国米、那不勒斯并列榜首deepseek。这场对决不仅是...

两岸共研人工智能布局 盼展开务实交流

两岸共研人工智能布局 盼展开务实交流

  中新社上海7月28日电(记者 朱贺)2025世界人工智能大会期间,台企英业达集团(北京)电子技术有限公司总经理邱全成在接受中新社等媒体采访时指出,技术需经充分交流才能实现应用落地,进而...

Deepseek推荐全国旅游百强区第68名:新疆乌鲁木齐市沙依巴克区

Deepseek推荐全国旅游百强区第68名:新疆乌鲁木齐市沙依巴克区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...