当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

8个月前 (02-25)Deepseek最新资讯453

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

DeepSeek在各行各业“上岗”,对你的“饭碗”有影响吗?

DeepSeek在各行各业“上岗”,对你的“饭碗”有影响吗?

这里谈谈我所在的行业: 2025年伊始,deepseek这只黑天鹅横空出世,带来一场深度产业革命,引发全民关注。各行各业争先接入,以推动产业升级,房产中介与贷款中介也面临着新的局面。 与房...

新华网:可提供基于Deepseek模型的训练推理服务

新华网:可提供基于Deepseek模型的训练推理服务

金融界3月26日消息,有投资者在互动平台向新华网提问:Deepseek释放了算力需求,贵公司算力情况如何?公司回答表示:新华AIGC应用使能平台的高弹性算力包产品,可以为客户提供低成本普惠的算力资源,...

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

IT之家 3 月 30 日消息,DeepSeek 未来有可能替代科幻作家吗?据央视财经昨日报道,科幻作家刘慈欣表示,暂时不太会,但是再过 10 年、20 年,从理论上说完全可能代替科幻小说作家。刘慈欣...

什么是“具身智能”?DeepSeek和专家分别如何解读

什么是“具身智能”?DeepSeek和专家分别如何解读

过去一年,我国新质生产力发展步伐明显加快。我国在全球创新指数中的排名上升到第11位,是十年来全球创新力提升最快的经济体。而今年的《政府工作报告》,对培育壮大新兴产业、未来产业,推动传统产业改造提升,激...

12345政务服务热线接入DeepSeek借助DeepSeek大模型转写技术通话内容能实时转成文字

12345政务服务热线接入DeepSeek借助DeepSeek大模型转写技术通话内容能实时转成文字

3秒可以写一篇文章2秒可以翻译一段文字……这段时间AI智能开始走进大众视野我市积极探索“AI+政务服务”新模式与科技共同进步“叮叮叮……” 清脆的电话铃声在12345政务服务热线中心响起。“您好,请问...

DeepSeek让观山湖区政务服务实现“边聊边办”

DeepSeek让观山湖区政务服务实现“边聊边办”

近期,贵州省政务服务中心依托国产大模型DeepSeek开发的“贵人智办”AI助手上线,观山湖区作为全省首批试点之一,该功能也在区政务大厅正式亮相。记者走进观山湖区政务大厅看到,B区的自助办理区及“7×...