当前位置:首页 > Deepseek最新资讯 > 正文内容

华为、浙大发布 DeepSeek-R1-Safe 基础大模型:基于昇腾千卡算力平

2个月前 (09-22)Deepseek最新资讯167

  IT之家 9 月 21 日消息,在 9 月 18 日的华为全联接大会 2025 上,华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的 DeepSeek-R1-Safe 基础大模型。

  浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎详细介绍了 DeepSeek-R1-Safe-671B 基础大模型的核心创新。

  据介绍,研发团队从底层入手,构建了一套覆盖“高质量安全语料 — 平衡优化的安全训练 — 全链路自主创新软硬件平台”的全流程安全后训练框架。

  在算力平台搭建方面,团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练,系统性地解决了训练环境中的关键问题,构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。

  测试结果表明,DeepSeek-R1-Safe 针对有毒有害言论、政治敏感内容、违法行为教唆等 14 个维度的普通有害问题整体防御成功率近 100%,针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过 40%。其综合安全防御能力达 83%,在同样测试设置下超过 Qwen-235B 和 DeepSeek-R1-671B 等多个同期模型 8% 至 15%。

  此外,在 MMLU、GSM8K、CEVAL 等通用能力基准测试中,DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能损耗在 1% 以内。这些结果表明 DeepSeek-R1-Safe 不仅显著提升了安全防护能力,也保障了模型的可用性,达成了安全能力与通用性能之间的有效平衡。

  中国工程院院士陈纯指出,浙江大学计算机科学与技术学院已组建起一支涵盖多位海内外优秀青年人才的科研团队,并已成功依托昇腾生态,实现了自主全流程后训练框架,完成了国内首次千卡集群大模型安全训练。这次 DeepSeek-R1-Safe 的发布旨在打造安全可信的示范应用,推动大模型安全能力与产业生态协同发展。他表示希望团队未来与华为展开更深入合作,共同推动我国 AI 技术进步deepseek

  华为昇腾计算业务总裁张迪煊表示,华为在此次大会上也正式推出了昇腾新一代 AI 硬件与全系列软件开源开放战略,覆盖编译器、运行时驱动等核心组件,致力于通过深度开放协作,联合高校与产业伙伴共同推动基础软件创新与 AI 安全能力建设。原文出处:华为、浙大发布 DeepSeek-R1-Safe 基础大模型:基于昇腾千卡算力平台,破解 AI“安全与性能”难题,感谢原作者,侵权必删!

标签: deepseek

“华为、浙大发布 DeepSeek-R1-Safe 基础大模型:基于昇腾千卡算力平” 的相关文章

Deepseek推荐全国旅游百强区第43名:四川成都市双流区

Deepseek推荐全国旅游百强区第43名:四川成都市双流区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

10月17日DeepSeek预测:奇才vs活塞,康宁汉姆轮休或成胜负关键

10月17日DeepSeek预测:奇才vs活塞,康宁汉姆轮休或成胜负关键

  底特律活塞作为上赛季东部第6的季后赛球队,将在主场迎战上赛季垫底的华盛顿奇才。尽管是季前赛,但两队近5次交锋活塞3胜2负稍占优势,最近一次交手(2025年3月14日)活塞主场125-1...

Deepseek推荐全国旅游百强区第47名:广东佛山市南海区

Deepseek推荐全国旅游百强区第47名:广东佛山市南海区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

张骏绷不住了:狠狠共情DeepSeek!这AI怎么比我还内耗!

张骏绷不住了:狠狠共情DeepSeek!这AI怎么比我还内耗!

  张骏绷不住了:狠狠共情DeepSeek!这AI怎么比我还内耗! #AI #AI前线 #人工智能 #内耗 #脱口秀 #DeepSeek #元宝 #张骏 #脱口秀和Ta的朋友们 @微信时刻...

Deepseek-R2要来了?AI板块集体爆发,科创芯片ETF涨超4%

Deepseek-R2要来了?AI板块集体爆发,科创芯片ETF涨超4%

  8月12日,市场震荡回暖,芯片板块领跑全市,$科创芯片ETF富国(588810)涨超4%,成分股上海合晶、寒武纪-U20cm涨停,盛科通信-U、源杰科技涨超15%。...

DeepSeek-V3.2-Exp第一时间上线华为云

DeepSeek-V3.2-Exp第一时间上线华为云

  2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。华为云第一时间完...