当前位置:首页 > DeepSeek技术交流 > 正文内容

全国高校首个!东南大学继DeepSeek又上线QwQ-32B

本文转自【新华日报】;

近日

东大基于昇腾国产算力平台

正式接入阿里最新开源模型QwQ-32B

成为全国首个上线QwQ-32B服务的高校

国产算力基座+头部大模型双轨融合

将为教学科研注入更强的AI动能

QwQ-32B:DeepSeek-R1的超强平替

性能比肩顶级模型

QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。

上图展示了 QwQ-32B 与其他领先模型在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)中的性能对比,QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。

低成本、易部署

模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,助力师生在科研中快速实现AI推理需求。

智能体能力革新

集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。

来源:东南大学微信公众号


“全国高校首个!东南大学继DeepSeek又上线QwQ-32B” 的相关文章

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File)...

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

随着国产AI公司深度求索的大模型DeepSeek爆红,各类仿冒网站也层出不穷,带来安全隐患。2月6日,澎湃新闻记者从奇安信XLab实验室方面获悉,仿冒DeepSeek的网站、钓鱼网站已经超过2000个...

DeepSeek“开源周”点燃大模型开闭源之争

DeepSeek“开源周”点燃大模型开闭源之争

本报记者 秦枭 北京报道DeepSeek 近期举办的“开源周”,宛如一颗重磅炸弹,在全球AI领域激起千层浪。然而,DeepSeek“开源周”带来的影响远不止技术层面,它如同导火索,引发了大模型开源与闭...

调用DeepSeekAPI 会有哪些限制?

调用DeepSeekAPI 会有哪些限制?

调用 DeepSeek 的 API 会有哪些限制?调用DeepSeek的API可能会遇到以下几类限制:数据来源的限制DeepSeek的API主要依赖于网络爬虫抓取的公开数据。因此,如果某些数据被网站管...

DeepSeek爆火后 大模型加速落地医疗!华为已入局

DeepSeek爆火后 大模型加速落地医疗!华为已入局

近日,华为正式发布DCS AI解决方案(数据中心AI全栈解决方案),并针对DeepSeek推出FusionCube A3000训/推超融合一体机,适配DeepSeek V3&R1及蒸馏模型,支...

清华北大、浙大DeepSeek报告汇总(附下载)

清华北大、浙大DeepSeek报告汇总(附下载)

DeepSeek作为一项前沿的人工智能技术,近年来在各大高校中得到了广泛应用和研究。本文整理了四校发布的DeepSeek报告,汇聚了各自在DeepSeek技术领域的最新研究成果,旨在为推动中国高等教育...