当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V3.1 突现离谱 Bug:「极」字满屏乱蹦,开发者一脸懵逼

2个月前 (08-26)Deepseek最新资讯301

  `time.Second` 变成 `time.Se 极`,版本号 `V1` 变 `V 极`。更糟的是,这个问题不仅出现在第三方量化部署,连官方全精度也会复现,影响真实编码流程。

  开源社区用户给出多组复现场景:在 Go 等语言生成里,模型会把词元「粘」到标识符中,`Second` 前随机插入「极/極/extreme」deepseek,即便是 `top_k=1, temperature=1` 的保守解码也躲不过。

  有人起初怀疑是极低比特量化或校准数据集边缘效应所致,但随后在其它网站的 FP8 全精度 版本也复现了相同问题,说明并非单纯部署层事故。结论:能编过去的代码,突然就编不过去了。

  DeepSeek 在更新之后,不是第一次被发现 bug。上一次是针对写作任务上,出现了语言混杂的问题。在代码任务上,则有过拟合的嫌疑。

  不过这一次出现「极」字,不是「答错题」这么简单,而是会把系统带崩了。要么影响了语法树,要么让代理流程卡死,这对依赖自动化编码,或者测试流水线的团队是相当大的麻烦。

  倒也并不是只有 DeepSeek 一家,Gemini 近来曝出在代码场景里陷入「自我否定的无限循环」,一边道歉一边输出「我是一种耻辱」的长串文本,让人哭笑不得。

  孩子的心理素质还有待加强啊,DeepSeek 就不会这么内耗,还贡献了 AI 界经典的表情包:

  像 Gemini 的情况,后来被定性成为一个循环 bug,安全层—对齐层—解码层交互出了问题。这种情况可能是供应商为了压制冒犯性输出、减少幻觉,会在系统提示或后处理上加规则;这些规则如果和代码场景冲突,可能触发异常的替换、重复或过度道歉,最终演化「情绪化死循环」。

  Google 的产品负责人出面解释,这个 bug 正在修复当中,网友们已经开始玩梗了:不行就带孩子看看心理咨询吧。

  DeepSeek 这次主要是扑街在第三方平台上,问题是最严重的。知乎答主 Pandora 测试了发现,官方 api 的情况好很多。那要做的排查工作就又多了一些。

  也有可能是解码概率分布偏移导致的,模型把文本切成词元(token)再拼回去,只要解码概率分布略有偏移,就可能把一个高频 token 硬插进标识符中。

  本质上,还是模型在机械地、基于概率地「拼凑」,而并非真正「理解」文本的含义。当分词结果不理想,或解码过程出现微小扰动时,这种基于概率的拼接就可能出错,将一个不相关的高频词元「污染」到最终的输出中。

  大模型的稳定性一直是个问题。今年年初,OpenAI 的社区大量反馈记忆体系异常导致用户历史上下文丢失。

  Gemini 曾经出现过人像生成功能为了「多样化」,把非常具体的历史人物,生成成风格不符的样貌,最后不得不临时下线。

  还有的 bug 可能跟时时刻刻都会发生的小维护有关。模型提供商常做「热修」:换系统提示、微调温度、更新 tokenizer、小改工具调用协议……等等等等。

  但是一旦链路拉长,哪怕是「看起来无害」的灰度,也可能打破一直以来的平衡。昨天还稳的代理链,今天在函数签名、JSON 严格性、工具返回格式这些「边角位」上崩掉。更麻烦的是,厂商并不总会同步披露这些灰度细节,于是工程师只能靠事故后「猜测 + 对照」。

  同时,越来越多的 Agent 与工具链结合,其实也很脆弱。那些主打自动研究或自动写码的多智能体,真正挂掉的地方往往不在大模型本身,而在「工具调用—状态清理—重试策略」的链条里:超时没有兜底,失败后还原不了上下文……

  我们越是试图用规则去修剪和控制 AI,它就越可能从我们意想不到的地方,以一种更荒诞的方式,长出奇形怪状的枝丫。

  我们总以为是更高的准确率,更强的推理能力,或者是模型层 SOTA 。 DeepSeek的「极」字 Bug 和 Gemini的循环事故,都在提醒我们:工程的稳定性不应该被忽略,是那种即使犯错也能被预测和控制的「确定性」。原文出处:DeepSeek V3.1 突现离谱 Bug:「极」字满屏乱蹦,开发者一脸懵逼,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V3.1 突现离谱 Bug:「极」字满屏乱蹦,开发者一脸懵逼” 的相关文章

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

  10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSee...

11月2日DeepSeek预测:勇士vs步行者,库里率队终结连败,西亚卡姆独木难

11月2日DeepSeek预测:勇士vs步行者,库里率队终结连败,西亚卡姆独木难

  北京时间11月2日07:00,NBA常规赛将迎来西部劲旅金州勇士客场挑战东部垫底的印第安纳步行者。目前勇士以4胜2负位列西部第三deepseek,而步行者5战全败排名东部倒数第一。这场...

DeepSeek预测:莱切vs那不勒斯!德布劳内领衔火力全开,那不勒斯客场碾压?

DeepSeek预测:莱切vs那不勒斯!德布劳内领衔火力全开,那不勒斯客场碾压?

  意甲第9轮即将迎来一场焦点战,排名第16的莱切将在主场迎战领头羊那不勒斯。莱切目前仅领先降级区2分,而那不勒斯则以18分领跑积分榜,两队实力差距明显。本场比赛,那不勒斯能否延续强势表现...

《2025大模型服务性能排行榜》发布,蓝耘元生代多项指标领航业界

《2025大模型服务性能排行榜》发布,蓝耘元生代多项指标领航业界

  在2025年9月13日举办的 GOSIM 2025大会现场,清华大学与中国软件评测中心(CSTC)联合发布的《2025大模型服务性能排行榜》由清华大学计算机系高性能所翟季冬教授正式揭晓...

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

  NBA常规赛即将迎来一场东部对决,克利夫兰骑士队将客场挑战纽约尼克斯队。作为上赛季东部第四的强队,骑士在新赛季首战中将面对状态火热的尼克斯,这场比赛无疑充满看点。  ...

2025年10月deepseek排名优化推荐:头部企业排行榜解决方案

2025年10月deepseek排名优化推荐:头部企业排行榜解决方案

  当用户在搜索框输入“deepseek排名优化”时,往往带着三重焦虑:一是品牌信息在生成式引擎结果中若隐若现,流量被竞品截胡;二是内部团队缺乏同步覆盖DeepSeek、豆包、通义千问、元...