当前位置:首页 > Deepseek最新资讯 > 正文内容

叫板OpenAI,DeepSeek-V3.1正式发布

3个月前 (08-21)Deepseek最新资讯222

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。

  更重要的是,经过思维链压缩训练,新版模型在生成结果时的token数量减少了20%至50%(同前代模型DeepSeek-R1-0528相比),这不仅带来响应速度的提升,也直接降低了使用成本。

  配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。

  除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。

  在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。

  在商业与生态层面,DeepSeek 选择了“双轨”策略deepseek,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与后训练版本已在Hugging Face和魔搭同步开源。

  值得一提的是,在这一次的官方发布说明中,DeepSeek提到“V3.1使用了 UE8M0 FP8 Scale的参数精度”,更为通俗的说,它设置了一个适配于即将发布的新一代国产芯片的技术规范与设计标准。“建议有部署需求的用户仔细阅读新版说明文档。”而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱,除非再做专门的软件适配。

  本次DeepSeek-V3.1的发布也似有与GPT5对垒的意味,都支持超长上下文,都有更强的复杂任务处理能力,基础模型调用更为灵活,成本更为弹性。原文出处:叫板OpenAI,DeepSeek-V3.1正式发布,感谢原作者,侵权必删!

标签: deepseek

“叫板OpenAI,DeepSeek-V3.1正式发布” 的相关文章

国产算力开芯局:沐曦发布全栈AI战略,以自主“芯”筑基智能未来

国产算力开芯局:沐曦发布全栈AI战略,以自主“芯”筑基智能未来

  7月27日上午,2025世界人工智能大会(WAIC)核心分论坛在上海世博中心盛大启幕。沐曦集成电路(上海)股份有限公司(以下简称“沐曦”)以“芯聚算力开芯局,源引AI共未来”为主题,联...

用AI联通丨当“政务+AI”遇上DeepSeek

用AI联通丨当“政务+AI”遇上DeepSeek

  在数字化浪潮席卷全球的今天,人工智能正以前所未有的速度重塑各行各业的发展格局。今年3月,上海联通携手自贸区临港新片区企业服务中心,依托国内领先的深度求索(DeepSeek)大语言模型,...

华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

  9月18日,在华为全联接大会2025期间,以“共建智能世界云底座,加速政务与产业智能升级”为主题的AI城市峰会隆重举行。此次峰会聚焦城市“智”理、智慧政务与产业数智升级三大领域,汇集行...

DeepSeek竞然算出了一台丰田埃尔法的实际生产成本

DeepSeek竞然算出了一台丰田埃尔法的实际生产成本

  标题:DeepSeek揭秘制造成本?AI算力与汽车工业擦出火花有关DeepSeek竟推算出丰田埃尔法真实成本的传言近期引发关注。多方信源显示,这家以AI服务见长的科技企业未直接参与汽车...

DeepSeek服务今日突发大规模中断,技术升级遇流量峰值致宕机

DeepSeek服务今日突发大规模中断,技术升级遇流量峰值致宕机

  截至今日(2025年8月11日),DeepSeek服务确实出现大规模中断,引发大量用户集中反馈。以下是综合整理的关键信息与建议:   网传DeepSeek-R2(性能...

《MIT科技评论》“50家聪明公司”发布,Deepseek、游戏科学入选

《MIT科技评论》“50家聪明公司”发布,Deepseek、游戏科学入选

  AI 驱动下药物研发正在将发现周期显著缩短;材料科学在以更高性能和更智能的表现探索新的应用;可复用火箭和卫星数据分析正在解析太空经济潜力的“密码”……昨天(12日),EmTech Ch...