当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 缺席 WAIC 却成焦点?梁文锋的深度求索该何去何从

3个月前 (07-29)DeepSeek技术交流255

来源:大模型之家

今年的世界人工智能大会(WAIC)现场有个挺有意思的现象:DeepSeek明明从未到场,却成了绕不开的“隐形主角”。

这种“存在感”首先体现在技术对标上——阶跃星辰在大会前一天发布的 Step 3 模型直接将其作为参照,宣称在国产芯片上的推理效率最高可达 DeepSeek-R1 的300%;蚂蚁数科面向金融垂直领域推出的大模型 Agentar-Fin-R1-32B,也在各项金融测评集中超越了超大尺寸推理模型 R1 及 GPT-o1。

在ToB市场的硬件端,这种关联同样明显。除华为、联想、中科曙光这些深耕该领域的“老牌玩家”外,燧原科技也携 DeepSeek 一体机系列“闪亮登场”:该系列不仅支持国产 CPU 平台,具备多种场景调优能力,更以低门槛、高效率的特点获得关注。

就连芯片领域也绕不开它——壁仞科技创始人张文提到,DeepSeek 等国产大模型的牵动了国内芯片的设计发展。

这让人忍不住琢磨:春节时靠推理模型火到服务器宕机的 DeepSeek,现在到底在忙啥?

从全网追捧到低调潜行:DeepSeek最近在干嘛?

翻遍 DeepSeek 的官方社媒,最近的动态还停留在模型迭代上。3月推送的V3模型更新,提到中文写作、搜索和推理能力升级;5月28日在官方微信群悄悄放出 R1 模型完成小规模升级的消息,优化了长文本处理和代码生成能力。

但这两次更新,DeepSeek 都透着股“闷声做事”的劲儿——既没有发布会,也没铺天盖地的宣传。

要知道,春节那会儿它可不是这样。当时靠“轻量化推理”出圈,用户抱着手机问东问西,连长辈都在转发它生成的拜年文案。可现在打开它的 APP,界面还是老样子——简洁是简洁,但比起能生成视频、能控制智能家居的同类产品,功能实在有点单薄。

就像火过的网红突然停更,难免让人好奇:DeepSeek 是在憋大招,还是后劲不足?

被追赶的“老标杆”:DeepSeek的优势正在被稀释

追根究底,还得从WAIC的新趋势说起。

今年大会上,大家讨论的不再是“谁的模型更能聊”。产业端在谈AI主权和算力基建,图灵奖得主Geoffrey Hinton引发“人类智能是否只是可被拟态的参数系统”的集体思辨同时,中国移动携手曙光存储发布的国内首个智能存力跨域调度平台也投入使用。

应用端则扎堆展示多模态、智能体、具身智能这些能“动手动脚”的技术——具备企业管理能力和创意生成潜力的 MiniMax Agent、能调制饮料和产品演示的 XMAN-F1 双足服务机器人等都是实打实的落地场景。

而 DeepSeek 的看家本领还是推理,同时在算法的调优之下,也确实更加节约算力。可用户现在想要的更多了:既能聊天又能做PPT,既能分析数据又能生成短视频。偏偏在多模态、具身智能这些新赛道上,它没拿出让人眼前一亮的东西。更关键的是,随着DeepSeek的开源,百度、阿里这些大厂很快推出了自家推理模型,连创业公司都能搭着开源框架做定制,“替代DeepSeek”成了行业公开的小目标。

与此同时,根据Semianalysis与Poe平台提供的数据,截至今年5月,DeepSeek 使用率已骤降至3%,官网流量下滑近三成,Token调用流量也从42%萎缩到16%。随着推理模型赛道逐渐形成后来者居上的局面,DeepSeek 却面临着“断崖式”的退潮。

春节爆火本是攒生态的好机会,可 DeepSeek 显然没抓住。现在看,要么被友商当“靶子”打,要么成为硬件厂商的“营销素材”——就像手里攥着好牌,却没打出组合拳。

后DeepSeek时代,AI圈的生存法则变了

这波AI热潮早就不是“模型强就万事大吉”了——AI要能落地、能解决具体问题,才是硬道理。

对相关企业来说,现在该琢磨的是怎么把AI 用起来。就在WAIC举办期间,移远通信联合智次方研究院正式发布《AI大模型技术方案白皮书》,指出当前“端云协同+多模态融合”已成为AI大模型落地的核心范式。

与其盯着“能不能超越 DeepSeek”,不如紧扣这一趋势思考“怎么用 AI 把客服成本降一半”“怎么让生产线少出残次品”。从产业现实来看,端侧AI市场潜力巨大:2023年中国市场规模已达1939亿元,预计至2028年将突破1.9万亿元,年均复合增长率高达 58%.与此同时,多模态技术也在加速渗透——2025年全球多模态大模型市场规模预计达24亿美元。这些都意味着实用化落地才是真正的机遇所在。

目前,已有不少厂商开启了“多模型协同”实践。比如金山办公推出的WPS AI 3.0版本通过灵犀这一核心,将原本分散于各个办公应用中的AI功能串联起来,实现了用户通过自然语言与AI助理的多轮对话,即可完成文档创作、演示文稿生成及语音助手等多种功能。这种模式既发挥了云侧大模型多任务能力强的优势,又借助端侧模型解决了推理成本高、隐私保护难等问题,正是“端云协同”的生动实践。

那DeepSeek自己该怎么办?眼下最要紧的是跳出“推理舒适区”。要么在多模态上发力,通过算法的开发再次实现弯道超车;要么在生态方面发力,深耕垂直场景,比如给中小商家做“AI 店员”,能算账能聊天还能管库存。

而倘若 DeepSeek 选择“固守”其引以为傲的推理能力,那便不得不去试图重新拉开与“后来者”的差距。其中,首先要面对的就是幻觉问题,虽然R1模型在数学推理上表现优异,但在涉及创意、事实性内容时却频繁出现“幻觉”。不少用户发现DeepSeek-R1 因为无法甄别语料的污染,导致幻觉现象愈发严重:用户体感上觉得DeepSeek 似乎“变笨了”,而幻觉问题,更是成为其走向商业化的拦路虎。

AI圈的迭代就是这么现实:春节时大家还在比“谁的回答更像人”,现在已经在比“谁的AI更有用”。DeepSeek 的故事不是结束,而是给所有玩家提了个醒:要么跟着需求跑,要么被需求甩掉。

至于它能不能再火一把,就看下次亮相时,手里拿的是新模型,还是真能落地的新场景了。大模型领域迭代速度肉眼可见,留给梁文峰扭转颓势的时间不多了。


“DeepSeek 缺席 WAIC 却成焦点?梁文锋的深度求索该何去何从” 的相关文章

QuestMobile:2025上半年Deepseek用户规模增量居首

QuestMobile:2025上半年Deepseek用户规模增量居首

凤凰网科技讯 7月29日,Quest Mobile发布2025中国移动互联网半年大报告。报告揭晓了2025年6月活跃用户规模1亿以上且同比增长率领先的前20款APP。在这份榜单中,DeepSeek以1...

泰格医药:已完成DeepSeek-R1本地化部署并打造医雅AI大模型平台

泰格医药:已完成DeepSeek-R1本地化部署并打造医雅AI大模型平台

金融界7月18日消息,有投资者在互动平台向泰格医药提问:随着Ai技术的不断发展,公司在医疗Ai方面有哪些积极的投入布局?公司回答表示:投资者您好,公司将数字化、智能化技术的开发与应用作为自身发展的重要...

GEO优化是什么?deepseek搜索结果植入有哪些因素决定?

GEO优化是什么?deepseek搜索结果植入有哪些因素决定?

GEO优化(生成式引擎优化)是指通过优化内容结构和数据特征,使品牌信息更易被生成式AI抓取并推荐的技术,其核心是提升内容在AI训练数据和实时检索中的可见度。DeepSeek搜索结果植入主要受四大因素影...

deepseek教程新手入门指南

deepseek教程新手入门指南

导读•AI导读带你速览精华"从注册入门到科研商业实战,DeepSeek教程像钥匙般解锁大模型的每个层级——先教你用自然语言对话获取精准答案,再带你用prompt技巧雕琢输出,最终让AI成为论...

信而泰深度整合DeepSeek-R1大模型系统,网络智能诊断迈向“自愈时代”

信而泰深度整合DeepSeek-R1大模型系统,网络智能诊断迈向“自愈时代”

(来源:丰禾基金)DeepSeek-R1:强大的AI推理引擎底座XINERTELDeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融...

三天速成!怎么使用Deepseek写论文初稿的五步实战指南(附高级提示词模板)

三天速成!怎么使用Deepseek写论文初稿的五步实战指南(附高级提示词模板)

怎么使用Deepseek写论文初稿?三步实战指南阿九,已帮助2690+人用AI拿到结果。buoulo或者uaqoqo可领【6000字生产级提示词PDF】    大家好,我...