破解AI“安全与性能”难题：华为浙大发布DeepSeek-R1-Safe大模型

2025-09-23 09:12 | 来源：安防行业网

近日消息，在9月18日的华为全联接大会2025上，华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。

浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎详细介绍了 DeepSeek-R1-Safe-671B 基础大模型的核心创新。

据介绍，研发团队从底层入手，构建了一套覆盖“高质量安全语料 — 平衡优化的安全训练 — 全链路自主创新软硬件平台”的全流程安全后训练框架。

在算力平台搭建方面，团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练，系统性地解决了训练环境中的关键问题，构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。

测试结果表明，DeepSeek-R1-Safe 针对有毒有害言论、政治敏感内容、违法行为教唆等 14 个维度的普通有害问题整体防御成功率近 100%，针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过 40%。其综合安全防御能力达 83%，在同样测试设置下超过 Qwen-235B 和 DeepSeek-R1-671B 等多个同期模型 8% 至 15%。

此外，在 MMLU、GSM8K、CEVAL 等通用能力基准测试中，DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能损耗在 1% 以内。这些结果表明 DeepSeek-R1-Safe 不仅显著提升了安全防护能力，也保障了模型的可用性，达成了安全能力与通用性能之间的有效平衡。

▲ 任奎

中国工程院院士陈纯指出，浙江大学计算机科学与技术学院已组建起一支涵盖多位海内外优秀青年人才的科研团队，并已成功依托昇腾生态，实现了自主全流程后训练框架，完成了国内首次千卡集群大模型安全训练。这次 DeepSeek-R1-Safe 的发布旨在打造安全可信的示范应用，推动大模型安全能力与产业生态协同发展。他表示希望团队未来与华为展开更深入合作，共同推动我国 AI 技术进步。

华为昇腾计算业务总裁张迪煊表示，华为在此次大会上也正式推出了昇腾新一代 AI 硬件与全系列软件开源开放战略，覆盖编译器、运行时驱动等核心组件，致力于通过深度开放协作，联合高校与产业伙伴共同推动基础软件创新与 AI 安全能力建设。

媒体注意到，该模型已在 ModelZoo、GitCode、GitHub、Gitee 及 ModelScope 等多个社区全面开源。

THE END

相关阅读

展会预告

新品

汉威科技傅里叶红外气体分析仪 5公里开外，500种气体，一眼便知
石油化工、环境监测、消防应急、船舶港口等领域，往往具有面积大、气体种类多、工况复杂等特点，传统气体探…
奥尼新款4K超清AI智能会议摄像头C98Pro即将上市
汉威科技傅里叶红外气体分析仪 5公里开外，500种气体，一眼便知！
汉威科技推出红外家用可燃气体探测器
思特威推出全新两亿像素超高分辨率手机应用CMOS图像传感器
重磅上市！云深处发布全新行业级小型轮足机器人山猫S10

访谈

护航视频监控网络安全做物联网安全的守护者 ——专访天防安全总经理段伟恒

在万物互联时代，网络安全的重要性日益凸显，尤其在快速发展的城市建设中，搭建的巨大物联网络对其安全保障…
做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…

企业

福建灵信科技发布“低空无人机巡飞防控解决方案”，构建低空立体
随着低空经济的蓬勃发展，无人机在各领域的应用日益广泛，但非授权飞行（黑飞）也给特定高安全等级和敏感区…
福建灵信科技发布“低空无人机巡飞防控解决方案”，构建低空立体安全屏障
星网宇达：公司的安防雷达采用相控阵技术，主要用于安防监控和反无人机领域
e签宝智能合同Agent入选杭州“人工智能+”标杆项目，与宇树科技、海康威视等共筑AI第
思特威回应差异化涨价：安防AIoT需求回暖联动国产代工厂优化供应链
熵云脑机入选中国标准化协会脑机接口与类脑智能专业委员会理事单位