当前位置：首页 > DeepSeek技术交流 > 正文内容

DeepSeek 缺席 WAIC 却成焦点？梁文锋的深度求索该何去何从

3个月前 (07-29)DeepSeek技术交流255

来源：大模型之家

今年的世界人工智能大会（WAIC）现场有个挺有意思的现象：DeepSeek明明从未到场，却成了绕不开的“隐形主角”。

这种“存在感”首先体现在技术对标上——阶跃星辰在大会前一天发布的 Step 3 模型直接将其作为参照，宣称在国产芯片上的推理效率最高可达 DeepSeek-R1 的300%；蚂蚁数科面向金融垂直领域推出的大模型 Agentar-Fin-R1-32B，也在各项金融测评集中超越了超大尺寸推理模型 R1 及 GPT-o1。

在ToB市场的硬件端，这种关联同样明显。除华为、联想、中科曙光这些深耕该领域的“老牌玩家”外，燧原科技也携 DeepSeek 一体机系列“闪亮登场”：该系列不仅支持国产 CPU 平台，具备多种场景调优能力，更以低门槛、高效率的特点获得关注。

就连芯片领域也绕不开它——壁仞科技创始人张文提到，DeepSeek 等国产大模型的牵动了国内芯片的设计发展。

这让人忍不住琢磨：春节时靠推理模型火到服务器宕机的 DeepSeek，现在到底在忙啥？

从全网追捧到低调潜行：DeepSeek最近在干嘛？

翻遍 DeepSeek 的官方社媒，最近的动态还停留在模型迭代上。3月推送的V3模型更新，提到中文写作、搜索和推理能力升级；5月28日在官方微信群悄悄放出 R1 模型完成小规模升级的消息，优化了长文本处理和代码生成能力。

但这两次更新，DeepSeek 都透着股“闷声做事”的劲儿——既没有发布会，也没铺天盖地的宣传。

要知道，春节那会儿它可不是这样。当时靠“轻量化推理”出圈，用户抱着手机问东问西，连长辈都在转发它生成的拜年文案。可现在打开它的 APP，界面还是老样子——简洁是简洁，但比起能生成视频、能控制智能家居的同类产品，功能实在有点单薄。

就像火过的网红突然停更，难免让人好奇：DeepSeek 是在憋大招，还是后劲不足？

被追赶的“老标杆”：DeepSeek的优势正在被稀释

追根究底，还得从WAIC的新趋势说起。

今年大会上，大家讨论的不再是“谁的模型更能聊”。产业端在谈AI主权和算力基建，图灵奖得主Geoffrey Hinton引发“人类智能是否只是可被拟态的参数系统”的集体思辨同时，中国移动携手曙光存储发布的国内首个智能存力跨域调度平台也投入使用。

应用端则扎堆展示多模态、智能体、具身智能这些能“动手动脚”的技术——具备企业管理能力和创意生成潜力的 MiniMax Agent、能调制饮料和产品演示的 XMAN-F1 双足服务机器人等都是实打实的落地场景。

而 DeepSeek 的看家本领还是推理，同时在算法的调优之下，也确实更加节约算力。可用户现在想要的更多了：既能聊天又能做PPT，既能分析数据又能生成短视频。偏偏在多模态、具身智能这些新赛道上，它没拿出让人眼前一亮的东西。更关键的是，随着DeepSeek的开源，百度、阿里这些大厂很快推出了自家推理模型，连创业公司都能搭着开源框架做定制，“替代DeepSeek”成了行业公开的小目标。

与此同时，根据Semianalysis与Poe平台提供的数据，截至今年5月，DeepSeek 使用率已骤降至3%，官网流量下滑近三成，Token调用流量也从42%萎缩到16%。随着推理模型赛道逐渐形成后来者居上的局面，DeepSeek 却面临着“断崖式”的退潮。

春节爆火本是攒生态的好机会，可 DeepSeek 显然没抓住。现在看，要么被友商当“靶子”打，要么成为硬件厂商的“营销素材”——就像手里攥着好牌，却没打出组合拳。

后DeepSeek时代，AI圈的生存法则变了

这波AI热潮早就不是“模型强就万事大吉”了——AI要能落地、能解决具体问题，才是硬道理。

对相关企业来说，现在该琢磨的是怎么把AI 用起来。就在WAIC举办期间，移远通信联合智次方研究院正式发布《AI大模型技术方案白皮书》，指出当前“端云协同+多模态融合”已成为AI大模型落地的核心范式。

与其盯着“能不能超越 DeepSeek”，不如紧扣这一趋势思考“怎么用 AI 把客服成本降一半”“怎么让生产线少出残次品”。从产业现实来看，端侧AI市场潜力巨大：2023年中国市场规模已达1939亿元，预计至2028年将突破1.9万亿元，年均复合增长率高达 58%.与此同时，多模态技术也在加速渗透——2025年全球多模态大模型市场规模预计达24亿美元。这些都意味着实用化落地才是真正的机遇所在。

目前，已有不少厂商开启了“多模型协同”实践。比如金山办公推出的WPS AI 3.0版本通过灵犀这一核心，将原本分散于各个办公应用中的AI功能串联起来，实现了用户通过自然语言与AI助理的多轮对话，即可完成文档创作、演示文稿生成及语音助手等多种功能。这种模式既发挥了云侧大模型多任务能力强的优势，又借助端侧模型解决了推理成本高、隐私保护难等问题，正是“端云协同”的生动实践。

那DeepSeek自己该怎么办？眼下最要紧的是跳出“推理舒适区”。要么在多模态上发力，通过算法的开发再次实现弯道超车；要么在生态方面发力，深耕垂直场景，比如给中小商家做“AI 店员”，能算账能聊天还能管库存。

而倘若 DeepSeek 选择“固守”其引以为傲的推理能力，那便不得不去试图重新拉开与“后来者”的差距。其中，首先要面对的就是幻觉问题，虽然R1模型在数学推理上表现优异，但在涉及创意、事实性内容时却频繁出现“幻觉”。不少用户发现DeepSeek-R1 因为无法甄别语料的污染，导致幻觉现象愈发严重：用户体感上觉得DeepSeek 似乎“变笨了”，而幻觉问题，更是成为其走向商业化的拦路虎。

AI圈的迭代就是这么现实：春节时大家还在比“谁的回答更像人”，现在已经在比“谁的AI更有用”。DeepSeek 的故事不是结束，而是给所有玩家提了个醒：要么跟着需求跑，要么被需求甩掉。

至于它能不能再火一把，就看下次亮相时，手里拿的是新模型，还是真能落地的新场景了。大模型领域迭代速度肉眼可见，留给梁文峰扭转颓势的时间不多了。

标签: DeepSeek技术交流