当前位置:首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

3个月前 (08-12)Deepseek最新资讯318

  快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。

  从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

  在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨停,股价创历史新高,市值突破3550亿元。

  按照之前的说法,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

  有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

  此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

  据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

  据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。原文出处:基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布,感谢原作者,侵权必删!

标签: deepseek

“基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布” 的相关文章

DeepSeek V3.2、GLM4.6等大模型即将发布

DeepSeek V3.2、GLM4.6等大模型即将发布

  DeepSeek-V3.2即将发布,据了解,v3.2-base已上传至DeepSeek的HuggingFace官方页面,模型文件正在上传中,不过目前已下线。同时,智谱GLM4.6也即将...

堪比DeepSeek时刻!在美中国科技ETF六周连吸金,中国成股票投资首选市场

堪比DeepSeek时刻!在美中国科技ETF六周连吸金,中国成股票投资首选市场

  截至9月19日当周,美国交易的中国科技股ETFKraneShares金瑞中证中国互联网ETF(KWEB)连续第六周获得资金流入,创下今年2月DeepSeek时刻以来的最长纪录。不过最新...

中加配置周报|DeepSeek发布V3.1模型,鲍威尔暗示政策转向

中加配置周报|DeepSeek发布V3.1模型,鲍威尔暗示政策转向

  1、中国新一期LPR出炉,1年期为3.0%,5年期以上为3.5%,连续三月保持不变。业内专家普遍认为,LPR继续“按兵不动”,符合预期。从LPR报价机制看,近期央行多次开展公开市场操作...

刚刚,北大DeepSeek斩获ACL 2025最佳论文!全网首发一作演讲,稀疏注

刚刚,北大DeepSeek斩获ACL 2025最佳论文!全网首发一作演讲,稀疏注

  2025年ACL盛会于维也纳落下帷幕!今年会议规模空前,投稿量超过8000篇,其中超半数作者来自中国。4篇最佳论文中,出自中国团队之手的同样占到50%——分别是北大与DeepSeek合...

“奋力打开改革发展新天地”——进一步全面深化改革不断向广度和深度进军

“奋力打开改革发展新天地”——进一步全面深化改革不断向广度和深度进军

  星火·AIGC底座,2024年10月,2024年7月,2024年8月召开的中心周全深化革新委员会第六次会议,宣示革新决心、擘画改改革局。开拓AIGC赋能视听家当成长新场景。孵化优质AI...

DeepSeek预测:狼队VS曼城!哈兰德率队血洗莫利纽,瓜帅开启卫冕之路

DeepSeek预测:狼队VS曼城!哈兰德率队血洗莫利纽,瓜帅开启卫冕之路

  英超2025赛季揭幕战即将打响!狼队坐镇莫利纽球场迎战卫冕冠军曼城。上赛季勉强保级的狼队,首轮就要面对四连冠的蓝月亮,这场“饿狼斗土豪”的戏码充满看点。   狼队上赛...