在刚刚落幕的华为全联接大会上,华为技术有限公司携手浙江大学共同发布了国内首款基于昇腾千卡算力平台打造的基础大模型——DeepSeek-R1-Safe。该模型聚焦当前人工智能领域中的安全与性能难题,标志着我国在AI安全技术研发方面迈出了关键一步。  浙江大学计算机科学与技术学院院长任奎现场深入解读了该模型的技术亮点。他表示,DeepSeek-R1-Safe 采用了一套完整的安全后训练框架,涵盖高质量安全语料构建、均衡优化的安全训练策略,以及基于自主创新软硬件体系的支撑平台。这一全流程设计有效解决了AI模型在实际应用中面临的安全隐患问题,从根源上提升了系统的可信度。 尤为引人注目的是,DeepSeek-R1-Safe 在千亿参数规模下的安全训练实现了重大突破。实测数据显示,该模型在应对包括恶意言论、政治敏感信息及违法引导等在内的14类有害内容时,整体防御成功率接近100%。面对多种越狱攻击模式,其防御成功率亦超过40%,综合安全防护能力达到83%。相较同类主流模型如 Qwen-235B 和 DeepSeek-R1-671B,安全表现领先8%至15%,展现出显著优势。  不仅如此,在 MMLU、GSM8K、CEVAL 等多项通用能力评测中,DeepSeek-R1-Safe 的性能下降幅度控制在1%以内,充分证明其在大幅提升安全性的同时,依然保持了出色的可用性和推理能力,真正实现了安全与效能的双重保障。 华为昇腾计算业务总裁张迪煊在发布会上强调,华为正持续加大在基础软件和AI安全能力建设方面的投入,致力于构建开放共赢的技术生态。通过与高校及产业伙伴的深度协作,推动核心技术自主创新。目前,DeepSeek-R1-Safe 已全面开源,上线 ModelZoo、GitCode、GitHub、Gitee 等多个开发者社区,欢迎全球研究者和工程师参与共建。  此次发布不仅是AI安全技术发展的重要里程碑,也为未来人工智能产业的协同创新注入了强劲动力,开启了智能时代安全可信发展的新篇章。
以上就是华为与浙大携手发布 DeepSeek-R1-Safe 大模型:AI安全与性能完美平衡的详细内容,更多请关注php中文网其它相关文章!
 
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号