当前位置:首页 > Deepseek最新资讯 > 正文内容

华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效

3周前 (10-13)Deepseek最新资讯125

  技术层面:1)DeepSeek Spare Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。根据各领域性能公开评测集结果(通用、搜索、代码、代码智能体、数学),DeepSeek-V3.2-Exp表现与V3.1-Terminus基本持平;2)开源TileLang与CUDA两种算子,TileLang由北大团队研发,专为简化高难度GPU算子开发而设计,将成为替代主流OpenAI领域特定语言Triton的有力备选,TileLang将调度空间与数据流解耦,使开发者能够直观地控制数据在硬件中的流动,根据TileLang在GitHub的说明文档,不仅支持英伟达CUDA,还已扩展支持华为昇腾等国产芯片。DeepSeek使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段deepseek,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。

  受益于新模型服务成本大幅降低,API调用价格相应下调。目前DeepSeek-V3.2-Exp API价格为输入0.2元/百万tokens(缓存命中),2元/百万tokens(缓存未命中),输出3元/百万tokens。

  新价格政策下开发者调用DeepSeek API的成本将降低50%以上。我们认为,DeepSeek-V3.2-Exp在技术层面探索了新的稀疏注意力机制,推动中国算力生态协同创新与演进,进一步将模型与算法层面的创新,与中间层的编译语言与更底层的计算芯片协同起来,推动中国算力生态的成长。模型发布后华为昇腾和寒武纪均第一时间宣布完成适配工作,表明国产AI算力生态已进入模型与芯片协同设计阶段。相关公司:神州数码、寒武纪、品高股份、北京利尔、安博通、优刻得、浪潮信息、紫光股份、超讯通信、首都在线。

  1)下游预算限制信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。原文出处:华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效,API同步降价-251012,感谢原作者,侵权必删!

标签: deepseek

“华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效” 的相关文章

亨利当年是怎么突然开窍的?

亨利当年是怎么突然开窍的?

  当时的意甲真的好看也是那时喜欢看足球的,亨利在尤文是没战术地位踢边锋,但他身体条件和技术是相当不错的,当年在边锋位置上他踢的很一般,皮耶罗打的位置更适合亨利,但有一说一巅峰的皮耶罗很厉...

Deepseek推荐全国旅游百强区第45名:陕西西安市长安区

Deepseek推荐全国旅游百强区第45名:陕西西安市长安区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

中控技术的TPT 2,工业领域的“DeepSeek”?

中控技术的TPT 2,工业领域的“DeepSeek”?

  自 ChatGPT、DeepSeek 等大语言模型掀起全球 AI 浪潮以来,几乎所有的工业人都在思考一个问题:在工业领域,我们该如何使用AI技术?   甚至有的企业开...

真我携手中国移动深化战略合作,动感地带首款定制机重磅发布

真我携手中国移动深化战略合作,动感地带首款定制机重磅发布

  2025年9月6日,中国·广州——今日,在广州大学城举办的「敢无畏 更有为」动感地带AI手机宣推会上,在真我中国区总经理易海军与广东移动市场部总经理陈敏的共同见证下,真我手机与中国移动...

砸数万元将产品植入Deepseek,AI还能被骗多久?

砸数万元将产品植入Deepseek,AI还能被骗多久?

  为了“骗”过模型,有人每天陪AI聊天,摸透模型的脾气和规则;有人在图片里用透明字体写上诱导语,扰乱模型答案排序。   人在哪,流量就在哪,入口就在哪。2025年春节后...

Deepseek推荐全国旅游百强区第39名:浙江杭州市萧山区

Deepseek推荐全国旅游百强区第39名:浙江杭州市萧山区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...