近日消息,在9月18日的华为全联接大会2025上,华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。
浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎详细介绍了 DeepSeek-R1-Safe-671B 基础大模型的核心创新。
据介绍,研发团队从底层入手,构建了一套覆盖“高质量安全语料 — 平衡优化的安全训练 — 全链路自主创新软硬件平台”的全流程安全后训练框架。
在算力平台搭建方面,团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练,系统性地解决了训练环境中的关键问题,构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。
测试结果表明,DeepSeek-R1-Safe 针对有毒有害言论、政治敏感内容、违法行为教唆等 14 个维度的普通有害问题整体防御成功率近 100%,针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过 40%。其综合安全防御能力达 83%,在同样测试设置下超过 Qwen-235B 和 DeepSeek-R1-671B 等多个同期模型 8% 至 15%。
此外,在 MMLU、GSM8K、CEVAL 等通用能力基准测试中,DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能损耗在 1% 以内。这些结果表明 DeepSeek-R1-Safe 不仅显著提升了安全防护能力,也保障了模型的可用性,达成了安全能力与通用性能之间的有效平衡。
▲ 任奎
中国工程院院士陈纯指出,浙江大学计算机科学与技术学院已组建起一支涵盖多位海内外优秀青年人才的科研团队,并已成功依托昇腾生态,实现了自主全流程后训练框架,完成了国内首次千卡集群大模型安全训练。这次 DeepSeek-R1-Safe 的发布旨在打造安全可信的示范应用,推动大模型安全能力与产业生态协同发展。他表示希望团队未来与华为展开更深入合作,共同推动我国 AI 技术进步。
华为昇腾计算业务总裁张迪煊表示,华为在此次大会上也正式推出了昇腾新一代 AI 硬件与全系列软件开源开放战略,覆盖编译器、运行时驱动等核心组件,致力于通过深度开放协作,联合高校与产业伙伴共同推动基础软件创新与 AI 安全能力建设。
媒体注意到,该模型已在 ModelZoo、GitCode、GitHub、Gitee 及 ModelScope 等多个社区全面开源。
访谈
更多做行业赋能者 HID迎接数字化浪潮新机遇 破解新挑战
今年3月份,全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》(以下简称“报告”),该报告…
数字化浪潮下,安防厂商如何满足行业客户的定制化需求?
回顾近两年,受疫情因素影响,包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击,市场…
博思高邓绍昌:乘产品创新及客户服务之舟,在市场变革中逆风飞扬
11月24日,由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会,在深…