当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

1个月前 (09-30)Deepseek最新资讯188

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

京东电教超级品类日:AI电教硬件享双重补贴至高30% 解锁快乐学习新姿势

京东电教超级品类日:AI电教硬件享双重补贴至高30% 解锁快乐学习新姿势

  开学季的脚步声渐近,又到了为新的学习旅程添置“神装备”的时候。8月31日晚8点至9月2日,京东电教超级品类日即将全面上线,携手科大讯飞、学而思、有道、汉王等品牌,带来多款智慧学习产品,...

623 万、DeepSeek 大模型大单

623 万、DeepSeek 大模型大单

  随着社会信息化和智能化的快速发展,警务工作面临着日益复杂的挑战。传统的警务工作模式已难以应对现代社会的需求。苏州市姑苏区作为苏州市的核心区域,人口密集、经济活动频繁,社会治安管理任务繁...

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

  快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。   从网友向DeepSeek提出的问题看,该模型给出的答案是,...

HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5

HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5

  就在最近,由耶鲁大学唐相儒、王昱婕,上海交通大学徐望瀚,UCLA万冠呈,牛津大学尹榛菲,Eigen AI金帝、王瀚锐等团队联合开发的   最令人振奋的是,这一成就并非...

10月30日DeepSeek预测:湖人vs森林狼,东契奇缺阵,森林狼主场险胜?

10月30日DeepSeek预测:湖人vs森林狼,东契奇缺阵,森林狼主场险胜?

  北京时间10月30日,NBA常规赛将迎来西部中游对决,湖人客场挑战森林狼。两支球队目前战绩均为2胜2负,分列西部第7、8位,此役胜负将直接影响季后赛席位争夺格局。  ...

扎根沃土绽芳华

扎根沃土绽芳华

  在平凡的岗位上,她如一粒饱满的种子,深深扎根、默默积蓄;在创新的征途上,她如一束跃动的火焰,点燃智慧、破解难题;在团队的成长中,她如一座明亮的灯塔,凝聚力量、温暖他人。她,就是山东省潍...