
在2025年世界互联网大会乌镇峰会上,360数字安全集团正式推出国内首个《大模型安全白皮书》,全面剖析大模型从研发到应用全生命周期中的五大关键安全挑战,并首次提出“外挂式安全 + 平台原生安全”双轨治理模式,为应对高风险AI时代构建多层次防御体系。
该白皮书揭示,大模型面临的安全威胁已演变为跨层级、高度关联的复杂结构,主要体现在以下五个层面:
- 基础设施层:训练所依赖的算力集群和平台若遭入侵,可能导致模型被植入恶意逻辑或核心参数泄露;
- 内容生成层:模型可能输出虚假信息、违法内容或产生“AI幻觉”,带来舆论误导与社会信任危机;
- 数据与知识层:训练数据存在泄露风险,知识库一旦被篡改或污染,将直接影响模型判断的准确性与可靠性;
- 智能体层(Agent):具备自主调用工具与决策能力的AI代理,若被恶意引导,可能执行非法操作或发起链式攻击;
- 用户交互层:通过提示词注入、权限越界等手段,攻击者可绕过防护机制直接操控模型输出。
针对上述多维度风险,360创新性地提出“双轨并行”的安全防护思路:
瑞宝通B2B系统使用当前流行的JAVA语言开发,以MySQL为数据库,采用B/S J2EE架构。融入了模型化、模板、缓存、AJAX、SEO等前沿技术。与同类产品相比,系统功能更加强大、使用更加简单、运行更加稳 定、安全性更强,效率更高,用户体验更好。系统开源发布,便于二次开发、功能整合、个性修改。 由于使用了JAVA开发语言,无论是在Linux/Unix,还是在Windows服务器上,均能良好运行
- 外挂式安全:在大模型系统外围部署独立的安全组件,如内容审查网关、行为监控系统与日志审计平台,实现动态监测与拦截;
- 平台原生安全:将安全机制深度融入模型开发流程,在训练、微调、部署、推理等环节嵌入安全校验,做到“安全即内建”。
依托这一理念,360已建成涵盖数据脱敏处理、模型鲁棒性增强、生成内容过滤、Agent行为追踪、API接口防护、红蓝对抗演练及合规管理在内的七大核心技术能力,形成端到端的大模型安全解决方案,并在金融、制造、政务服务等多个关键领域实现规模化应用。
360指出,个体企业的技术投入难以应对全局性安全挑战。未来将持续联合高校、科研机构与产业伙伴,共同推进大模型安全标准体系建设、威胁情报联动共享机制以及开源安全工具生态建设,致力于构建开放协同、可持续演进的AI安全新生态。









