当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周连续“放大招”

8个月前 (02-25)Deepseek最新资讯420

2月24日消息

DeepSeek宣布启动

“开源周”（Open Source Week）

计划连续5天（2月24日至28日）

陆续开源5个代码库

网友们对此举纷纷点赞称：

“DeepSeek王炸开局”

“‘源’神启动！”

图源：网络

FlashMLA让AI大模型低成本却有高性能

首个开源的项目是FlashMLA

可谓是第一天就“放大招”！

DeepSeek首日开源内容公告图源：X

FlashMLA是

DeepSeek针对

英伟达Hopper架构GPU优化的

高效MLA解码内核

（MLA即多头潜在注意力）

可理解为

专为高性能显卡设计的

“AI加速工具”

现在已经投入生产使用

简而言之

FlashMLA能够让AI大模型

在H800这样的GPU上

跑得更快、更高效

当AI同时处理长句子和短句子时

FlashMLA

能动态调整资源分配

避免浪费算力

网友称赞DeepSeek是真正的“Open AI”图源：X

根据此前公开发布的

DeepSeek V3大模型技术文档

该大模型正是使用

H800芯片训练而成

自从V2模型开始

MLA就已帮助DeepSeek

在一系列模型中实现成本大幅降低

但计算、推理性能

仍能与顶尖模型持平

DeepEP让专业答案更高效精准

2月25日

DeepSeek再度官宣

当日开源代码库为DeepEP

即首个用于MoE（混合专家）模型

训练和推理的

开源EP（专家并行）通信库

据报道

MLA和MoE也被认为是

DeepSeek以低成本

实现杰出表现的核心原因

DeepSeek25日开源内容公告图源：X

MoE架构的缺点之一

是会增加通信成本

而EP通信库正是

针对通信环节的优化

可以实现高效、优化的全员沟通

适配现代高性能计算需求等

值得一提的是

在宣布开源20分钟内

DeepEP便已在GitHub上

获得超1000个收藏

受到大量关注

推动AI普惠发展也要守住底线

“DeepSeek开源周连续“放大招”” 的相关文章

广和通成功在MediaTek MT8893上部署DeepSeek-R1-0528

　　近日，广和通在MediaTek MT8893平台上成功部署并运行了DeepSeek-R1-0528-Qwen3-8B模型，显著提升了端侧AI设备的处理效率与智能化水平，特别是在本地化复...

实测低调上线的DeepSeek新模型：编程比Claude 4还能打，写作…还是算

　　网友和媒体们隔三岔五就要催更一波，不是「压力给到梁文锋」，就是「全网都在等梁文锋回应」。尽管没有等到 DeepSeek R2，但 DeepSeek 今天还是正式上线并开源了新模型 De...

DeepSeek：已在平台内对AI生成合成内容添加标识

　　9月1日，DeepSeek发布关于AI生成合成内容标识的公告。公告称，为贯彻落实《人工智能生成合成内容标识办法》（2025年9月1日起施行）及《网络安全技术人工智能生成合成内容标识方法...

DeepSeek高校上线，智能“助教”为师生深度思考赋能

国产AI大模型DeepSeek（深度求索）的风，已经吹到了高校。近日，中国人民大学、北京师范大学、北京交通大学等多所高校发布消息，表示正在探索开展有关DeepSeek的实践应用，部分高校已在自主研发的...

金沙江创投朱啸虎：大家低估了DeepSeek的影响力

　　新浪科技讯 9月20日上午消息，由硅星人与北京中关村科学城创新发展有限公司、北京中关村创业大街科技服务有限公司联合发起的“AI 创造者嘉年华”上，金沙江创投主管合伙人朱啸虎表示，“大家...

11月4日DeepSeek预测：雄鹿vs步行者，字母哥率队客场复仇

　　NBA常规赛东部焦点战即将打响，雄鹿将客场挑战步行者。目前雄鹿以4胜2负排名东部第3，步行者则以1胜5负位列东部第13。本场比赛对双方都至关重要，雄鹿希望巩固东部前三的位置，而步行者则...