当前位置:首页 > Deepseek最新资讯 > 正文内容

AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统

1个月前 (09-29)Deepseek最新资讯146

  光明网讯9月26日,在2025人工智能计算大会上,浪潮信息宣布,基于元脑SD200超节点AI服务器,DeepSeek R1大模型token生成速度仅需8.9毫秒,创造国内大模型最快token生成速度。最新发布的元脑HC1000超扩展AI服务器,实现每百万token成本首次击破1元。

  随着Scaling Law持续推动模型能力跃升,以DeepSeek为代表的开源模型极大降低了创新门槛,加速智能体产业化的到来。智能体产业化的核心三要素是能力、速度和成本。其中,模型能力决定了智能体的应用上限,交互速度决定了智能体的商业价值deepseek,token成本决定了智能体的盈利能力。

  浪潮信息对AI计算架构的持续创新,旨在解决智能体产业化面临的交互速度和token成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地,提供高速度、低成本的算力基础设施。

  浪潮信息最新公布,基于元脑SD200超节点AI服务器运行DeepSeek R1大模型,单token生成速度低至8.9毫秒,带动国内AI服务器token生成速度率先进入“10毫秒时代”。

  元脑SD200基于创新研发的多主机低延迟内存语义通信架构,在单机内实现了64路本土AI芯片的高速统一互连,单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用,实现多模型协同执行复杂任务。

  为实现极低的通信延迟,元脑SD200采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的 AI 推理场景。

  浪潮信息发布元脑HC1000超扩展AI服务器,基于全新开发的全对称DirectCom极速架构,无损超扩展设计聚合海量本土AI芯片、支持极大推理吞吐量,推理成本首次击破1元/每百万token,为智能体突破token成本瓶颈提供极致性能的创新算力系统。

  元脑HC1000通过全面优化降本和软硬协同增效,创新16卡计算模组设计、单卡“计算-显存-互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。同时,全对称的系统拓扑设计支持超大规模无损扩展。据测算,元脑HC1000通过算网深度协同、全域无损技术,实现推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。

  未来,智能体带来的推理算力需求将呈现出指数级的爆发式增长。浪潮信息方面透露,将通过软硬件协同设计与深度优化,持续推动AI计算架构的创新与突破,不断实现token生成“提速降本”,积极促进大模型、智能体等人工智能技术与实体经济的深度融合,让人工智能成为千行百业的生产力和创新力。(记者 战钊)原文出处:AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统,感谢原作者,侵权必删!

标签: deepseek

“AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统” 的相关文章

10月31日 DeepSeek预测 勇士vs雄鹿:库里对决字母哥,勇士客场险胜

10月31日 DeepSeek预测 勇士vs雄鹿:库里对决字母哥,勇士客场险胜

  北京时间10月31日早8点,NBA常规赛将迎来一场焦点对决,东部劲旅雄鹿坐镇主场迎战西部豪强勇士。目前勇士以4胜1负排名西部第三,雄鹿则以3胜2负位列东部第四。本场比赛不仅是东西部强队...

DeepSeek发布新版本模型:优化推理效率,API降价超50%

DeepSeek发布新版本模型:优化推理效率,API降价超50%

  值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。...

亨利:说阿森纳是小俱乐部都是不懂球的,哲凯赖什的加盟让阿森纳有机会拿英超和欧冠。

亨利:说阿森纳是小俱乐部都是不懂球的,哲凯赖什的加盟让阿森纳有机会拿英超和欧冠。

  我和很多阿森纳球员最近都聊过,萨卡、厄德高、萨利巴,包括赖斯,他们都希望能在阿森纳拿下欧冠冠军,我认为这是一个好兆头。   我之前说过,我希望阿森纳能拿下今年的英超冠...

AI赛道又卷起来了!DeepSeek开源新模型,OpenAl推出AI浏览器!科创

AI赛道又卷起来了!DeepSeek开源新模型,OpenAl推出AI浏览器!科创

  10月20日,国产AI公司DeepSeek宣布开源最新大模型DeepSeek-OCR,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此...

DeepSeek发布并开源新一代AI模型,科创人工智能ETF(588730)震荡

DeepSeek发布并开源新一代AI模型,科创人工智能ETF(588730)震荡

  DeepSeek发布并开源新一代AI模型,科创人工智能ETF(588730)震荡走强上涨2.31%,机构:四季度看好AI应用及算力主线方向   DeepSeek发布并...

国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新

国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新

  发布研报称,DeepSeek V3.1在多项指标上性能大幅领先R1-0528,加强了智能体支持,独创性使用UE8M0 FP8 Scale精度,与国产AI芯片协同创新。DeepSeek-...