当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

3个月前 (08-20)Deepseek最新资讯315

  昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后deepseek,在 Hugging Face 发布了一款新模型

  从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

  该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!

  整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。原文出处:DeepSeek开源新基础模型,但不是V4,而是V3.1-Base,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源新基础模型,但不是V4,而是V3.1-Base” 的相关文章

DeepSeek预测:热刺vs伯恩茅斯!3-1血洗樱桃军团,约翰逊+里沙利松双星

DeepSeek预测:热刺vs伯恩茅斯!3-1血洗樱桃军团,约翰逊+里沙利松双星

  英超第三轮焦点战即将打响!托特纳姆热刺坐镇主场迎战伯恩茅斯,两支开局两连胜的球队将上演榜首争夺战。让我们用数据揭开这场对决的神秘面纱。   热刺目前以净胜球劣势排名第...

中储股份:控股子公司中储智运暂未选择接入DeepSeek

中储股份:控股子公司中储智运暂未选择接入DeepSeek

  中储股份9月10日在互动平台表示,控股子公司中储智运科技股份有限公司(简称“中储智运”)综合考量成本控制、安全合规及系统集成适配性等多维度因素,经审慎研究,暂未选择接入DeepSeek...

Databricks:全球AI第四大独角兽,估值1000亿美元,碾压DeepSe

Databricks:全球AI第四大独角兽,估值1000亿美元,碾压DeepSe

  估值1000亿美元!一个华人小伙子参与创办的公司,成了全球第四大AI独角兽,仅次于OpenAI、字节跳动和马斯克的xAI。   这家公司叫 Databricks,听起...

11月2日DeepSeek预测:勇士vs步行者,库里率队终结连败,西亚卡姆独木难

11月2日DeepSeek预测:勇士vs步行者,库里率队终结连败,西亚卡姆独木难

  北京时间11月2日07:00,NBA常规赛将迎来西部劲旅金州勇士客场挑战东部垫底的印第安纳步行者。目前勇士以4胜2负位列西部第三deepseek,而步行者5战全败排名东部倒数第一。这场...

DeepSeek下一代技术提前曝光,线上消费ETF基金(159793)翻红上涨

DeepSeek下一代技术提前曝光,线上消费ETF基金(159793)翻红上涨

  在ACL2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本...

深耕“武”彩青阳“实践田” 催育“青苗”成长“稻花香”

深耕“武”彩青阳“实践田” 催育“青苗”成长“稻花香”

  “青年工作抓住的是当下,传承的是根脉,面向的是未来,攸关党和国家的前途命运”。近年来,武义县烟草专卖局(分公司)致力于打造梯次化青年人才队伍,三维共建赋能“选育管用”,“武”彩青阳“实...