当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

8个月前 (02-24)Deepseek最新资讯422

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

DeepSeek回应两会走红:嘿嘿,怪不好意思的

DeepSeek回应两会走红:嘿嘿,怪不好意思的

这两天,谁要是不说说DeepSeek,好像就不太时髦了。全国两会期间, DeepSeek太火。从大会发言人、部长们的点赞,到代表委员们的热议,DeepSeek参与掀起的“人工智能+”浪潮席卷而来,中国...

DeepSeek正式登陆中山!DeepSeek本地化部署涵盖 “DeepSeek+产业智造” “DeepSeek+民生服务” “DeepSeek+政务应用”三大领域

DeepSeek正式登陆中山!DeepSeek本地化部署涵盖 “DeepSeek+产业智造” “DeepSeek+民生服务” “DeepSeek+政务应用”三大领域

2月18日,中山市完成国内领先的人工智能大模型DeepSeek本地化部署,全面开启AI技术赋能产业发展、智慧民生和高效政务新篇章,为建设创新之城和人才重地注入新活力。目前,DeepSeek本地化部署涵...

DeepSeek激发信心,A股渐入佳境

DeepSeek激发信心,A股渐入佳境

本周A股进一步走强,上证综指全周累计上涨1.30%至3346.72点;深综指、创业板综指、科创50、北证50全周分别上涨1.86%、2.57%、0.36%、3.84%。DeepSeek的技术突破提振了...

deepseek算命准吗?deepseek能算命吗?

deepseek算命准吗?deepseek能算命吗?

好的,用户现在问的是“deepseek算命准吗”。首先,我需要确定用户到底在问什么。DeepSeek是一个人工智能公司,主要专注于大模型领域,所以这里提到的“算命”可能是指他们的某个产品或者服务。不过...

DeepSeek专题培训会助力民营企业把握AI技术革新机遇

DeepSeek专题培训会助力民营企业把握AI技术革新机遇

为深入贯彻落实党的二十届三中全会精神,促进数字经济与实体经济深度融合,助力民营企业把握人工智能技术革新机遇,近日,怀来县工商联举办以“把握AI浪潮,赋能企业创新,共启智慧未来”为主题的DeepSeek...

四川长虹:长虹AI TV已正式接入DeepSeek

四川长虹:长虹AI TV已正式接入DeepSeek

金融界3月27日消息,有投资者在互动平台向四川长虹提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的...