当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

8个月前 (02-24)Deepseek最新资讯444

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

李开复最新预测中国大模型终局,DeepSeek目前势头最强

李开复最新预测中国大模型终局,DeepSeek目前势头最强

近日,零一万物创始人兼CEO李开复在参与一档对话节目时公开表示,DeepSeek掀起的行业变革彻底颠覆了人工智能行业的发展模式,“可能让OpenAI创始人辗转难眠”。他同时预测,中国市场最终可能只剩下...

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?思考和行动过程用户希望了解DeepSeek在医疗诊断中的具体应用。DeepSeek是一款开源的人工智能模型,具备强大的自然语言处理和数据分析能力,可能在医...

红塔证券:红塔证券已经成功上线DeepSeek-R1大模型

红塔证券:红塔证券已经成功上线DeepSeek-R1大模型

每经AI快讯,有投资者在投资者互动平台提问:长城证券002939智源AI中心已上线了大模型DeepSeek-R1与阿里Qwen2.5,公司员工可通过系统中的AI工具中心进行使用体验。请问贵公司未来也考...

中国电信中山分公司携手DeepSeek打造智能化政务与行业服务新

中国电信中山分公司携手DeepSeek打造智能化政务与行业服务新

近日,中国电信中山分公司成功借助天翼云算力及政务云资源,助力中山市政数局完成了DeepSeek大模型的本地化部署,并在中山12345热线中率先实现了融合创新应用。此次合作通过赋能智能坐席助手,显著提升...

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

本文参考报告:《2025中国DeepSeek对AI产业的影响》,首发于头豹科创网。DeepSeek在春节期间刷屏朋友圈,引发了AI产业关于低训练成本、开源与闭源模型选择、模型蒸馏及知识产权等话题的热烈...

车企“抢滩”DeepSeek背后:角力智能座舱,降低投资成本

车企“抢滩”DeepSeek背后:角力智能座舱,降低投资成本

DeepSeek掀起的技术革命正在席卷汽车行业。截至目前,超过20家车企宣布接入DeepSeek模型,涵盖了比亚迪、吉利、奇瑞、岚图、长城、理想汽车等主流品牌。这一情况与2023年ChatGPT爆火时...