当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

8个月前 (03-25)Deepseek最新资讯550

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

华为+DeepSeek,终于不再“服务器繁忙”?

华为+DeepSeek,终于不再“服务器繁忙”?

没有人不在期待大模型能够成为下一个电动车,作为代表中国的新兴产业,在世界范围内掀起狂澜。然而主流的MoE架构大模型,却苦于其结构上的“先天不足”:巨大的硬件成本与多重拖累效率的环节,使得中国企业在这场...

“云上加速,智启未来”——DeepSeek赋能开启磁县智慧政务新纪元

“云上加速,智启未来”——DeepSeek赋能开启磁县智慧政务新纪元

转自:邯郸新闻网DeepSeek作为一款国产AI大模型,自发布以来便以其强大的语言处理能力和卓越的知识推理能力,在众多行业领域展现出了广泛的应用前景。近日,邯郸联通与磁县行政审批局成功合作骨干云与De...

光迅科技:Deepseek应用将推动高速光模块需求

光迅科技:Deepseek应用将推动高速光模块需求

金融界4月2日消息,有投资者在互动平台向光迅科技提问:您好,请问deekseep的崛起对公司有哪些利好?公司芯片能否用在deekseep上是否有合作?公司回答表示:Deepseek的广泛应用将有力推动...

安卓首家接入DeepSeek背后:看见女性力量

安卓首家接入DeepSeek背后:看见女性力量

在人类社会的历史进程中,女性的力量从来不容小觑,她们以不同的方式在各个领域诠释着自身价值。今天,我们将目光投向科技领域:中国科技部最新统计显示,我国女性科技工作者总量达4260万人,在科研人员总量中占...

正式接入DeepSeek!福建这群医护人员已经开始学习……

正式接入DeepSeek!福建这群医护人员已经开始学习……

2月19日下午福建医科大学附属第二医院(以下简称“福医二院”)举办了一场“科技含量满满”的培训会吸引了众多院内科研骨干、临床医护人员及学生参加会上,他们对DeepSeek在医院的创新应用有了更深入的了...

网友称跟DeepSeek炒股日赚千元,也有人亏损,AI投资靠谱吗?

网友称跟DeepSeek炒股日赚千元,也有人亏损,AI投资靠谱吗?

“跟着DeepSeek炒股的第五天,我的收益居然涨到了11%”“用DeepSeek投(股市)100万会怎么样”“股市小白,跟着DeepSeek学炒股”......DeepSeek的热潮还是吹到了股市投...