当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2周前 (02-25)Deepseek最新资讯50

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

科技云报到:多行业拥抱DeepSeek,全不顾它身上的“刺”

科技云报到:多行业拥抱DeepSeek,全不顾它身上的“刺”

科技云报到原创。在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,...

6个在微信使用 DeepSeek的方法,建议收藏

6个在微信使用 DeepSeek的方法,建议收藏

DeepSeek 是杭州深度求索公司开发的开源大模型系列,在自然语言处理领域表现出色。它拥有多个版本,如 DeepSeek-V3 采用混合专家架构,有 6710 亿参数,在基准测试中媲美 GPT -...

趣生活 | DeepSeek眼中的陕西女性,原来是这样的~

趣生活 | DeepSeek眼中的陕西女性,原来是这样的~

“来自东方的神秘力量”“大模型圈的大黑马”“它真的好懂”“双商在线,是我目前用过最好的AI”日前“DeepSeek”登上热搜第一DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自...

文心一言:请详细介绍Deepseek在业务流程自动化中的应用

文心一言:请详细介绍Deepseek在业务流程自动化中的应用

文心一言:请详细介绍Deepseek在业务流程自动化中的应用DeepSeek在业务流程自动化中的应用主要体现在以下几个方面:一、自动化任务处理DeepSeek能够识别并自动化处理一些重复性的业务流程任...

太平资产完成DeepSeek本地化部署

太平资产完成DeepSeek本地化部署

上证报中国证券网讯(记者 何奎)记者近日获悉,太平资产积极响应国家科技创新战略,顺应人工智能时代潮流,成功完成DeepSeek-R1大模型本地化部署,并实现国产化适配。据介绍,通过本地化部署DeepS...

华西证券:DeepSeek有望开启AI产业的“安卓时刻”

华西证券:DeepSeek有望开启AI产业的“安卓时刻”

华西证券研报表示,DeepSeek的开源是真正通往AI下游应用生态繁荣之路:部署大模型成本大幅降低,下游行业已经全面铺开,如金融、政府、医疗等领域行业私有化部署如火如荼;大厂开启开源部署之路,腾讯、阿...