当前位置:首页 > Deepseek应用场景 > 正文内容

DeepSeek,带动AI进入“中国时刻”

“海谈科技”核心观点


DeepSeek在底层的训练模型的架构优化、基于强化学习的训练策略优化等多个方面的技术突破,均可圈可点;


客户寻求AI算力及解决方案的热情非常高,AI在政务、教育等多个领域的落地正在加速;


数据安全至关重要,数据标注领域的投资机遇很大……


近日,在海富通基金、上海证券报共同举办的“海谈科技”DeepSeek专场上,复旦大学博导、上海市数据科学重点实验室主任肖仰华,达观数据首席财务官许涵卿,海通证券计算机行业、科技金融首席分析师杨林三位嘉宾,围绕DeepSeek技术突围的底层逻辑及AI应用落地,共同探讨了产业发展和投资之道。



开启中国AI新纪元


2025年中国农历春节期间,国产AI大模型DeepSeek以“低成本、高性能”的技术突破,一经推出,就迅速吸引了全球AI产业界及资本市场的关注,可谓是“一夜风靡”。


DeepSeek现象缘何出现,这背后又有怎样的底层逻辑?


“DeepSeek在底层的训练模型的架构优化、基于强化学习的训练策略优化等多个方面的技术突破,均可圈可点。”肖仰华解读,DeepSeek的突破主要包括三个方面:一是采用了混合专家(MoE)架构,并成功解决了MoE架构在训练过程中通常会遭受不可预测的损失尖峰,从而难以扩展这一问题;二是在数值精度上的优化,其采用FP8训练,超越了美国主要使用的FP16的标准;三是资源效率提升,仅使用2048个H800GPU(相当于1000—1500个H100GPU),就实现了与GPT-4相当的AI性能。


DeepSeek的突破,让全球看到了中国的AI力量,被视为“神秘的东方力量”。杨林将其形容为“科技的国运时刻”,其成功大大增强了中国人的科技信心。


1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。


“DeepSeek的成功,是开源的成功。”许涵卿表示,DeepSeek将模型权重、训练框架及数据管道全部开源,允许用户自由使用、修改和商业化。这意味着,开发者和企业能够以较低的成本进行模型微调和应用开发,降低了AI技术的进入门槛。另外,以往,一些关键基础行业的应用者,会担忧云端数据的安全性,DeepSeek允许下游应用者进行本地化的模型部署,消除了其对数据安全和数据隐私的担忧。


端侧AI是中国机遇


“作为企业,我们看到了更多的产业机会,客户咨询和上马AI大模型产品的意愿显著增强。”谈及DeepSeek的突破,许涵卿看到了其对产业端产生的影响,端侧AI的发展已经箭在弦上。


“早在2022年,达观数据就开始做大模型的前沿研究。”许涵卿介绍,以往谈及上马大模型,客户会担心是不是要在GPU、大模型本身等方面投入大量的资金和资源;DeepSeek的“低成本、高性能、安全性”让应用端客户很兴奋,现在一些政府机构、央地国企尝试AI大模型的意愿大幅提升。


DeepSeek到底有多便宜?DeepSeek的API定价为每百万tokens10美分,相比之下,其成本仅为GPT-4的十分之一,这重新定义了AI经济模型。


DeepSeek的出现,推动AI技术的低成本化和边缘化,使云端和边缘处理的混合AI模型被认为是AI未来的发展方向,端侧AI芯片和端侧小模型的场景应用,恰恰是中国的优势所在,这是中国AI产业发展的大机遇。


不过,许涵卿强调,在不同行业,端侧AI应用落地有先后之分。当前,在日常需要AI协助的领域,比如智能助手、chat bot等应用已经有了显著提升,但在司法等相对严肃的领域、B端客户领域,大模型的应用还需要假以时日。


“2月份我们去调研了多家上市公司,都在满负荷帮助客户测试大模型demo版本。”谈及产业与投资机遇,杨林介绍,大家之所以高度关注DeepSeek,是因为这种技术跨越式的进步,会带动整个平台的切换,带来世纪性的投资机遇,类似于互联网、移动互联网诞生的时刻。


资本,往往走在产业发展的前面,表现得更为乐观。杨林表示,从智算中心到算力芯片,从光模块到电力运维、节能散热等,围绕大模型本身及场景落地,资本市场看到诸多的投资机遇;DeepSeek发布后,开启了端侧AI领域的投资机遇,值得长期关注。


数据和伦理是关键变量


“虽然DeepSeek的技术报告并没有披露太多,但我们可以看到它的‘思维’质量非常高,这说明其有可能是对数据做了大量的精准标注及相应的筛选。”肖仰华认为,精细的数据处理,是DeepSeek成功的重要因素之一。


在很多专家学者看来,国产大模型的发展就要走一条成本可控、安全可信的技术路线,DeepSeek给这条路线大幅增加了可行性。


肖仰华认为,以往,大模型性能提升靠的是堆积算力,DeepSeek给大模型指出了低成本训练方向,这会影响整个大模型的发展方向,业界可以用更低的成本,提升大模型的安全可靠。


“数据壁垒非常高、数据汇聚很困难,使得大模型无法完成有效的垂直领域的训练、无法在专业场景发挥作用。”谈及数据,肖仰华认为,提升大模型的成熟度,当前还存在两大瓶颈问题,一是数据孤岛比比皆是,二是数据的精细化标注还有待加强。


AI技术快速发展,AI大模型在多个场景快速落地,正在重塑着人的概念和内涵,进而给社会关系带来一系列的挑战。


“以人为本,从这个角度出发,提前建立AI应用准则。”肖仰华强调,生成式人工智能技术的发展,已经需要以月为单位进行记录。但是人类的情感、价值、伦理观念调整却是十分缓慢的,如何调和这个矛盾,是我们需要直面的挑战之一。科技普惠,人工智能的发展应始终坚持“服务于人”的本质。


“DeepSeek,带动AI进入“中国时刻”” 的相关文章

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

本文参考报告:《2025中国DeepSeek对AI产业的影响》,首发于头豹科创网。DeepSeek在春节期间刷屏朋友圈,引发了AI产业关于低训练成本、开源与闭源模型选择、模型蒸馏及知识产权等话题的热烈...

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

2月27日上午,由共青团三明市委、兴业银行三明分行、兴业证券三明分公司等联合举办的“三明青年说”在兴业银行三明分行举行,本次活动以“学习探索DeepSeek技术 赋能青年科技创新”为主题,吸引了团市委...

国有大行加速布局DeepSeek 推动金融服务从“信息化”迈向“认知化”

国有大行加速布局DeepSeek 推动金融服务从“信息化”迈向“认知化”

21世纪经济报道记者 张欣 北京报道3月8日,工商银行宣布在同业中率先完成 DeepSeek 最新开源大模型的私有化部署,并将其接入行内“工银智涌”大模型矩阵体系,有力推动金融业务场景的智能化升级。据...

YY直播接入DeepSeek,推出低延时“YYDS”满血版,开启智能社区新体验

YY直播接入DeepSeek,推出低延时“YYDS”满血版,开启智能社区新体验

近日,YY公司宣布正式接入DeepSeek,并推出了低延时、不卡顿的YY-DeepSeek R1-满血版(简称“YYDS”)。目前,广州津虹YY直播和YY语音等产品已经上线了该产品的入口,供用户使用。...

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek为何掀起全球巨浪?春节期间发布的Deepseek-R1在全球引起震动。著名风险投资家马克·安德森 (Marc Andreessen)甚至描述这是“人工智能的人造卫星时刻”——指的是20...

DeepSeek接入完毕,武汉硚口的这些业务可一键办理

DeepSeek接入完毕,武汉硚口的这些业务可一键办理

极目新闻通讯员 李刚近日,武汉市硚口区行政审批局“公司宝典”微信公众号接入深度求索(DeepSeek)人工智能模型,开创了湖北省省市场主体登记领域使用生成式AI服务群众的先河。公司宝典微信公众号据悉,...