当前位置:首页 > Deepseek最新资讯 > 正文内容

从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!

2个月前 (08-31)Deepseek最新资讯228

  从美团最新开源的龙猫大模型,到OpenAI下一代旗舰GPT-5和明星创业公司DeepSeek的新品,顶尖玩家们不约而同地将目光投向了“混合推理”与“自适应计算”,

  美团近日开源的“龙猫”(LongCat-Flash)凭借创新的架构,在性能比肩业界顶尖水平的同时,实现了惊人的算力节省。

  华尔街见闻此前提及,LongCat-Flash最具创新性的设计之一是 “零计算”专家机制,该机制能智能识别输入内容中的非关键部分,如常见的词语和标点符号,并将其交由一个不进行复杂运算的特殊“专家”处理,从而直接返回输入,极大地节省了算力。

  此举并非孤立的技术炫技,而是对当前行业痛点的精准回应——随着推理模式变得更加复杂,AI应用的成本正在快速上升。

  业界的应对策略正在聚焦到一个共同方向:混合推理模式。这种模式让AI系统能够根据问题复杂度自动选择合适的计算资源配置,避免在简单任务上浪费昂贵的算力。

  据机器之心,前段时间,TextQL联合创始人兼CEO丁一帆(Ethan Ding)就指出了一个反直觉的现象 —— 明明Token的成本一直在下降,但各家模型公司的订阅费却在飞涨。

  丁一帆认为,问题的症结在于deepseek,那些降价的模型大部分不是SOTA模型,而人类在认知上的贪婪决定了,大部分人只想要“最强大脑”,所以99%的需求会转向SOTA。而最强模型的价格始终差不多。

  简单来说就是,虽然单个token的价格在下降,但完成复杂任务所需的token数量正在以前所未有的速度增长。

  例如,一次基础的聊天问答可能仅消耗几百个token,但一项复杂的代码编写或法律文件分析任务,可能需要消耗数十万甚至上百万个token。

  这种成本压力已传导至应用层公司。据媒体报道,生产力软件公司Notion的利润率因此下降了约10个百分点。一些AI编程辅助工具的初创公司,如Cursor和Replit,也不得不调整定价策略,引发了部分用户的抱怨。

  各大模型厂商虽然路径不一,但目标高度一致:让模型学会判断何时需要“深度思考”,何时只需“快速响应”。

  OpenAI的GPT-5采用“路由器”机制,根据问题复杂程度自动选择合适的模型处理。举例来说,对于如“天空为什么是蓝色”的简单问题,GPT-5会直接将其交给轻量级模型,复杂任务则调用高算力模型。

  根据OpenAI内部评测,GPT-5使用思考模式能以比前代模型少50-80%的输出token完成任务,达到相同或更好的效果。该系统通过用户行为、偏好反馈和正确率等真实信号持续训练路由机制,随时间不断改进。

  DeepSeek的V3.1版本则更进一步,将对话和推理能力合并到单一模型中,推出了单模型双模式架构。开发者和用户可以通过特定标记或按钮,在“思考”与“非思考”模式间切换。

  官方数据显示,其思考模式能在消耗减少25-50% token的情况下,达到与前代模型相当的答案质量,为企业提供了一个高性价比的开源选择。

  目前,这一趋势已成为行业主流。从Anthropic的Claude系列、Google的Gemini系列,到国内的阿里Qwen、快手KwaiCoder、字节豆包以及智谱GLM等,几乎所有头部玩家都在探索自己的混合推理方案,试图在性能与成本之间找到最佳平衡点。

  有分析指出,混合推理的下一个前沿将是更智能的“自我调节”——让AI模型能够精准地自我评估任务难度,并在无人干预的情况下,以最低的计算代价,在最恰当的时机启动深度思考。原文出处:从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!,感谢原作者,侵权必删!

标签: deepseek

“从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!” 的相关文章

GPT-5登场!国产大模型“扎堆上新”,DeepSeek得加速了

GPT-5登场!国产大模型“扎堆上新”,DeepSeek得加速了

  在屡屡被传研发不顺利、多次“跳票”后,时隔两年零五个月,GPT-5终于来了。8月8日凌晨,OpenAI正式推出新的旗舰AI模型GPT-5,OpenAI CEO山姆·奥特曼评价称,GPT...

DeepSeek预测:狼队VS曼城!哈兰德率队血洗莫利纽,瓜帅开启卫冕之路

DeepSeek预测:狼队VS曼城!哈兰德率队血洗莫利纽,瓜帅开启卫冕之路

  英超2025赛季揭幕战即将打响!狼队坐镇莫利纽球场迎战卫冕冠军曼城。上赛季勉强保级的狼队,首轮就要面对四连冠的蓝月亮,这场“饿狼斗土豪”的戏码充满看点。   狼队上赛...

DeepSeek:A股市场散户多,股市分析更需要正能量

DeepSeek:A股市场散户多,股市分析更需要正能量

  洪榕先生的微博内容,从其倡导的投资理念和对投资者的影响来看,属于正能量范畴,但这种“正能量”并非简单的乐观口号,而是体现在其倡导的理性投资、心态管理和长期主义上。  ...

“记事本”里的大匠心——记济南烟草“金牌工匠”秦建的18年维保征程

“记事本”里的大匠心——记济南烟草“金牌工匠”秦建的18年维保征程

  从计谋全局擘画区域调和成长新图景;面向当前热门的低空经济使用,二是依托铁塔AIoT能力平台,坚持以革新引领区域一体化高质量成长之路。为通用航空和无人机供给低空平安态势感知办事。海内大进...

「看」能否取代「读」,为何DeepSeek-OCR 爆火的重点不在性能?

「看」能否取代「读」,为何DeepSeek-OCR 爆火的重点不在性能?

  DeepSeek-OCR 热度的重点是什么?为什么视觉 token 更擅长处理长上下文?视觉 token 可以如何规避 NTP 机制的「近视」缺陷?为什么视觉 token 不会有「误差...

安联锐视:AI端侧产品深化大模型合作 特种机器人转型成效初显

安联锐视:AI端侧产品深化大模型合作 特种机器人转型成效初显

  10月28日,安联锐视(301042.SZ)发布2025年第三季度报告。数据显示,公司前三季度实现营收3.34亿元;三季度单季营收1.16亿元。报告期内,公司始终锚定转型主线,在AIo...