当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

“国民级应用”纷纷下场 DeepSeek开启AI新时代?

“国民级应用”纷纷下场 DeepSeek开启AI新时代?

刚刚过去的周末,人工智能大模型DeepSeek再次登上各大社交平台的热搜榜,同时出现的,还有“国民级应用”腾讯和百度的名字,引发业界和普通用户高度关注。15日晚间,腾讯宣布微信搜一搜正灰度测试接入De...

电信科技+DeepSeek云智赋能福建漳州,让基层治理更有温度!

电信科技+DeepSeek云智赋能福建漳州,让基层治理更有温度!

AI出手,智解千千结!电信科技+DeepSeek云智赋能福建漳州,为基层工作者打造24小时在线的“智能助手”,让基层治理更有温度!...

两周发行突破10万册 湖南人民出版社DeepSeek爆款书《DeepSeek效率革命》新书受到读者关注

两周发行突破10万册 湖南人民出版社DeepSeek爆款书《DeepSeek效率革命》新书受到读者关注

湖南人民出版社《DeepSeek效率革命》新书受到读者关注。红网时刻新闻3月21日讯(记者 蔡娟 摄影 李丹 通讯员 张恬)3月21日,第32届长沙图书交易会在湖南国际会展中心盛大开幕。中南传媒旗下湖...

DeepSeek接入政务系统,公务员要下岗了?

DeepSeek接入政务系统,公务员要下岗了?

最近,全国多地将DeepSeek等人工智能系统应用于政务和公共服务。基于DeepSeek系统的“AI公务员”在深圳福田区上岗,在多类场景“办公”。广州市政务服务和数据管理局在政务外网正式部署上线Dee...

DeepSeek说:未来AI会不会让人类变得一无是处?

DeepSeek说:未来AI会不会让人类变得一无是处?

意大利出版全球首份“AI报纸”,AI“读者”提问:“未来AI会不会让人类变得一无是处?”对此,DeepSeek说:关于AI是否会让人类变得“一无是处”,这个问题涉及技术、社会、伦理等多个层面的复杂讨论...

患者带着DeepSeek来看病,医学博主自嘲“天塌了”

患者带着DeepSeek来看病,医学博主自嘲“天塌了”

“天都塌了!病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的帖子,引发网友热议。评论区中,不少网友都表示遭遇过类似情况...