当前位置:首页 > Deepseek最新资讯 > 正文内容

中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510

3周前 (10-14)Deepseek最新资讯127

  DeepSeek在年初发布了R1以后,受到了各界普遍关注。后续来看,DeepSeek并没有如期发布更先进的模型R2,而是在进行更多小版本的更新换代。结合每个阶段的发展重点,我们将其划分为3个主要的发展阶段。

  阶段一:性能提升。DeepSeek在3月推出的V3-0324和5月推出的R1-0528,通过后训练实现了模型能力的提升,弥补了和头部模型之间的差距。

  阶段二:实现混合推理架构、Agent能力提升、与国产芯片协同优化。从8月以后,DeepSeek也顺应了海外混合推理架构和Agent能力提升的大趋势,推出了V3.1和V3.1-Terminus,Agent能力有了较大提升,思考效率也有提升。V3.1采用UE8M0FP8缩放格式训练,针对即将发布的下一代国产芯片设计,实现国产大模型和国产芯片协同设计的优化deepseek,对国产化芯片的应用起到积极的推动作用。

  阶段三:提效降价,国产适配加速。9月发布的V3.2-Exp,基于V3.1-Terminus构建,引入了新的注意力机制DSA,在保持模型性能的稳定的同时,在训练推理效率方面有了较大的提升,带来了模型较大幅度的降价。考虑到当前大模型之间能力差距在缩小,成本的下降意味着模型具有更好的性价比和可推广性,也将促进应用端实现更多功能的落地。DeepSeek新兴AI编程语言选用TileLang这个新兴AI编程语言,可以实现对不同硬件平台的支撑,极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题,为国产大模型软硬件生态建立起到了极大的推动作用。发布的当天,国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配,国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。原文出处:中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-251014,感谢原作者,侵权必删!

标签: deepseek

“中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510” 的相关文章

DeepSeek证实2026年推V4版,算法突破替代算力堆砌

DeepSeek证实2026年推V4版,算法突破替代算力堆砌

  #一分钟视频创作季# DeepSeek 证实 2026 年推出 V4 版本,业内热议的不只是新模型的性能,更是它这套不走寻常路的技术发展模式,依靠算法抠细节而非堆算力,用开源拉生态而非...

青云科技 9 月刊

青云科技 9 月刊

  为深职大、省级广电提供智算支撑deepseek,推出基于昇腾的大模型服务原文出处:青云科技 9 月刊,感谢原作者,侵权必删!...

锐评|DeepSeek迎来“Nature时刻”,中国范儿就是这么大大方方

锐评|DeepSeek迎来“Nature时刻”,中国范儿就是这么大大方方

  “同行评审”在学术界属于常见且必要的论文审查程序,为何此次《自然》单独将其提出,并以“打破空白”来高度评价DeepSeek?事实上,自ChatGPT起,全球范围内大模型发展就犹如一场“...

1355 万、DeepSeek 部署大单

1355 万、DeepSeek 部署大单

  采购内容:智能一体机、安全系统及容灾备份,日常运维、系统更新迭代、各个单位的服务(具体详见招标文件)。   2025 年 8 月 26 日发布中标结果deepseek...

DeepSeek预测:马德里竞技vs比利亚雷亚尔!黄色潜水艇火力全开,西蒙尼主场

DeepSeek预测:马德里竞技vs比利亚雷亚尔!黄色潜水艇火力全开,西蒙尼主场

  西甲第4轮即将迎来一场焦点战,马德里竞技将在主场迎战比利亚雷亚尔。目前马竞排名第16,而比利亚雷亚尔高居第3,两队状态可谓天壤之别。   马竞本赛季开局不佳,3轮过后...

北电数智WAIC首秀,展示星火·大平台落百业丰硕成果

北电数智WAIC首秀,展示星火·大平台落百业丰硕成果

  召开会议,把握志愿、弹性原则,推动临盆关系和临盆力、上层修建和经济基本、国家管理和社会成长更好相适应,要周全贯彻习新期间中国特色思惟,全会提出,加倍重视革新实效,以匆匆进社会公道允义、...