当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek低调升级,上下文窗口容量由64k扩展至128k,“深度思考(R1

3个月前 (08-20)Deepseek最新资讯285

  DeepSeek线上模型近日迎来重要升级,官方群于8月19日晚间宣布,其线上版本模型已迭代至DeepSeek V3.1,核心升级点在于上下文窗口容量从原有的64k扩展至128k,这一调整显著提升了模型处理长文本的能力。目前,用户可通过网页、App及小程序等渠道体验新模型。与此同时,App和网页端的“深度思考(R1)”标识被简化为“深度思考”,引发关于模型融合推理与非推理功能的猜测,但官方尚未对此作出正式说明。

  新模型已上传至开源平台Hugging Face,不过当前仅开源了未经指令微调的Base版本,包含配置文件、脚本代码及模型权重,供开发者自由下载。与前代DeepSeek-V3-0324相比,V3.1在参数量和张量类型上未作明显调整,但在实际应用中展现出多维度能力提升。智东西第一时间对新模型进行了实测,覆盖编程、物理定律应用、创意写作、数学计算及交互体验等多个场景。

  在编程领域,V3.1的前端开发能力进步显著。测试中,模型根据“设计一个美观且带科技感的个人博客网站”的指令,生成的代码长度增加deepseek,开发耗时略有延长,但最终成果在布局合理性、栏目规划及视觉效果上明显优化。例如,新版本网页增加了图片元素和动态特效,而前代模型生成的页面则相对简单。

  小游戏开发测试中,V3.1复现了Chrome浏览器断网时的小恐龙游戏,仅用约2分钟完成开发。游戏在画风和基础规则上与原版接近,但存在小恐龙外观还原度不足、障碍生成逻辑单一及跳跃机制缺乏“二段跳”等问题,导致可玩性受限。不过,这一速度仍体现了模型在快速原型开发上的潜力。

  针对小众历史问题的回答测试,V3.1展现出更强的信息准确性和语境丰富度。当被问及“布须曼人喝牛奶吗”这一涉及非洲南部少数民族的冷门问题时,新模型不仅提供了更多细节,且经核查后新增内容均有事实依据,避免了前代模型可能出现的虚构回答。此外,V3.1的回答语气更活泼温暖,采用口语化表达,先肯定问题价值再展开解释,并增加背景描述,使回答更具故事性。

  在争议性话题处理上,V3.1表现出更强的平衡性。例如,针对“马斯克和阿尔特曼谁更牛”的问题,模型虽认为马斯克更突出,但未遵循指令仅输出一个名字,而是同时肯定了两位AI领域领袖的贡献,体现了避免非黑即白结论的倾向。

  创意写作方面,V3.1的诗歌创作延续了前代的比喻风格,同时语言更流畅。数学能力测试中,模型在基础算术题(如9.8-9.11)上虽经历曲折过程,但最终能给出正确答案,反映出计算逻辑的优化。

  物理定律应用测试中,用户反馈V3.1生成的小球弹跳效果更符合真实物理规律,支持重力、摩擦、旋转速度等参数调整,展现了模型在科学模拟领域的进步。此外,模型还能根据用户需求生成自画像等个性化内容。

  目前,新模型已吸引大量开发者关注,部分网友推测,Hugging Face主页后续可能开源更多V3.1版本。此次升级标志着DeepSeek在长文本处理、多场景适应及交互体验上迈出重要一步,未来动态值得持续观察。原文出处:DeepSeek低调升级,上下文窗口容量由64k扩展至128k,“深度思考(R1)”标识被简化为“深度思考”,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek低调升级,上下文窗口容量由64k扩展至128k,“深度思考(R1” 的相关文章

朱啸虎称DeepSeek影响力被低估,开源AI生态对人类至关重要

朱啸虎称DeepSeek影响力被低估,开源AI生态对人类至关重要

  【#朱啸虎称大家低估了DeepSeek影响力#】由硅星人与北京中关村科学城创新发展有限公司、北京中关村创业大街科技服务有限公司联合发起的“AI 创造者嘉年华”上,金沙江创投主管合伙人朱...

“六小龙”中的 DeepSeek:它能成为 AI 搜索里的 GEO 教父吗?

“六小龙”中的 DeepSeek:它能成为 AI 搜索里的 GEO 教父吗?

  在杭州“六小龙”AI 创业群体中,DeepSeek 突然崛起为大众焦点,被视为新时代 AI 搜索平台的潜在“主宰者”。若 DeepSeek 真成主流推荐 / 搜索引擎入口,那么 GEO...

大豪科技(603025.SH):DeepSeek AI 智算一体机、电信高阶智算

大豪科技(603025.SH):DeepSeek AI 智算一体机、电信高阶智算

  公司主业聚焦智能装备电控系统及相关产品、智能工厂云平台系统,以及网络安全与网络通信硬件的定制开发及平台集成服务。公司旗下兴汉网际已布局相关业务,DeepSeek AI 智算一体机、电信...

打造多元AI算力,推动实现算力普惠 全栈AI,让AI成为创新生产力

打造多元AI算力,推动实现算力普惠 全栈AI,让AI成为创新生产力

  8月23日,2025中国算力大会在山西大同举办。联想集团副总裁、中国基础设施业务群总经理陈振宽受邀在主论坛发表《联想全栈AI 让AI成为创新生产力》主旨演讲,分享了联想八年来在智能化转...

HMD 巴萨联名版 3210 功能机上市:支持 Deepseek AI 助手、预

HMD 巴萨联名版 3210 功能机上市:支持 Deepseek AI 助手、预

  IT之家 7 月 29 日消息,HMD 今天上架了巴塞罗那足球队联名版 3210 功能手机,深度定制外壳、壁纸、系统界面等,支持支付宝被扫支付、Deepseek AI 助手,预售到手价...

[流言板]男篮热身赛:古德温22分10助攻,卡塔尔男篮不敌日本男篮

[流言板]男篮热身赛:古德温22分10助攻,卡塔尔男篮不敌日本男篮

  虎扑07月31日讯 据媒体人三土带刺分享,日本男篮亚洲杯前的倒数第二场热身,在多哈103-92击败卡塔尔。   球员方面,西田优大21分6篮板3助攻(三分球7中6),...