当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

4个月前 (07-10)Deepseek应用场景330

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡

黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡

据央视新闻报道,美国英伟达公司创始人兼首席执行官黄仁勋在接受总台《面对面》栏目采访时力赞了 DeepSeek,并表示 AI 是一个极其复杂的系统,中国的创新能力很惊人。黄仁勋称,中国创新的步伐是不可能...

宣亚国际:OrangeGPT接入了DeepSeek-R1大模型

宣亚国际:OrangeGPT接入了DeepSeek-R1大模型

证券日报网讯 宣亚国际7月14日在互动平台回答投资者提问时表示,公司OrangeGPT接入了DeepSeek-R1大模型,在文本生成领域,如文案创作、稿件撰写、视频脚本等业务场景的内容生成质量、场景适...

DeepSeek在日常生活领域有哪些重要应用场景?

DeepSeek在日常生活领域有哪些重要应用场景?

DeepSeek在日常生活领域有哪些重要应用场景?<think> 嗯,我最近对DeepSeek这个AI助手有些兴趣,它能够进行各种复杂的任务,比如自然语言理解、问答、对话等等。最近我想了...

华为云王丰:DeepSeek实践验证,“三个臭皮匠抵个诸葛亮”

华为云王丰:DeepSeek实践验证,“三个臭皮匠抵个诸葛亮”

“2025(第二十四届)中国互联网大会”于7月23日-25日在北京举行。华为云产业发展总裁王丰出席并演讲。  王丰表示,DeepSeekR1出现之后,大家都知道16个千亿专家和256个26亿专家二者能...

当AI邂逅传统校园 郑州升达经贸管理学院如何用“DeepSeek”重构教育基因

当AI邂逅传统校园 郑州升达经贸管理学院如何用“DeepSeek”重构教育基因

6月11日,第三届全国主流媒体河南教育行大型融媒体采访团踏入郑州升达经贸管理学院龙湖校区,这座占地2203亩的园林式校园内,小桥流水与智能实验室交相辉映,传统校训“勤俭朴实、自力更生”的大字与AI教学...

158万元,DeepSeek大模型(数字档案管理应用)大单:郑州市规划勘测中标

158万元,DeepSeek大模型(数字档案管理应用)大单:郑州市规划勘测中标

2025年7月3日,郑州市自然资源和规划局《基于DeepSeek的数字资源智慧化典型应用(数字档案管理应用)项目》公开招标公告,预算金额:1,620,000.00元。项目概况:为贯彻落实市优化营商环境...