0

0

人工智能安全差距:保护生成式人工智能时代的系统

betcha

betcha

发布时间:2024-09-10 16:21:43

|

970人浏览过

|

来源于DZone

原创

生成式人工智能 (GenAI) 和大型语言模型 (LLM) 的快速采用正在以前所未有的速度改变行业。近 90% 的组织正在积极实施或探索 LLM 用例,渴望利用这些革命性技术的力量。然而,这种热情与令人担忧的安全准备不足并存。 Lakera 最近的一份 GenAI 就绪报告显示,只有约 5% 的组织对其 GenAI 安全框架充满信心。

人工智能安全差距:保护生成式人工智能时代的系统

生成式人工智能 (GenAI) 和大型语言模型 (LLM) 的快速采用正在以前所未有的速度改变行业。近 90% 的组织正在积极实施或探索 LLM 用例,渴望利用这些革命性技术的力量。然而,这种热情与令人担忧的安全准备不足并存。 Lakera 最近的一份 GenAI 准备情况报告显示,只有约 5% 的组织对其 GenAI 安全框架充满信心。

采用和安全准备情况之间的明显差异提出了一个关键问题:市场是否为 GenAI 的潜在安全性做好了准备风险?

即时黑客攻击的兴起

随着 GenAI 的广泛采用,出现了一种新的潜在毁灭性威胁:即时黑客攻击。与需要大量编码知识的传统黑客方法不同,即时黑客攻击使利用人工智能系统的能力变得民主化。只需几句话,即使是新手也可以操纵人工智能模型,从而导致意外行为和潜在的数据泄露。

Lakera 的 Gandalf,一款免费的 LLM 黑客模拟游戏,清楚地说明了这种威胁。迄今为止,已有 100 万甘道夫玩家和 5000 万条提示和猜测记录,其中有 200,000 人成功破解了整个游戏。这一演示 GenAI 是多么容易被操纵,这应该为那些在没有足够安全措施的情况下急于实施这些技术的组织敲响警钟。

GenAI 安全准备状况

Lakera 的 GenAI 准备情况报告将 Gandalf 模拟数据与 1,000 多名参与者的调查结果相结合,描绘了一幅有关 GenAI 安全现状的令人担忧的图景:

  1. 采用率高,置信度低:虽然 42% 的受访者已经积极使用 genai 并实施 llm,只有 5% 对其 ai 安全措施充满信心。

  2. 缺乏针对 AI 的威胁建模:只有 22% 的受访者采用针对 AI 的威胁建模来做好准备针对 GenAI 特定的威胁。

  3. 不同的安全实践:虽然 61% 的组织已实施访问控制机制,但只有 37% 的组织采用渗透测试,只有 22% 的组织使用 AI 特定的威胁

  4. 对漏洞响应缓慢:遇到 GenAI 漏洞的组织中有 20% 表示这些问题仍未完全解决。

这些调查结果凸显了安全准备方面的重大差距,使得许多 GenAI 系统极易受到恶意操纵和滥用。

了解风险

与 GenAI 相关的安全风险不仅仅限于数据泄露。报告中确定的一些关键漏洞包括:

  1. 有偏差的输出:47% 遇到漏洞的组织报告了有偏差的 AI 输出问题。

  2. 数据泄露:42% 遇到了通过 AI 交互暴露敏感数据的问题。

  3. 滥用 AI 输出:38% 报告了 AI 生成的信息被滥用的情况。

  4. 模型操纵:34% 的人尝试过改变或篡改他们的 AI 模型。

  5. 未经授权的访问:19% 面临未经授权的个人访问 GenAI 的问题

这些漏洞的影响可能是深远的,从轻微的操作中断到重大的数据泄露和法律后果。

实施人工智能特定的威胁建模

组织需要采用特定于 AI 的威胁建模实践来解决 GenAI 带来的独特安全挑战。此方法涉及:

  1. 识别 AI 特定资产:识别 AI 系统的独特组件,包括训练数据、模型架构和推理端点。

  2. 绘制攻击面:了解对手如何尝试操纵您的人工智能系统,包括通过输入数据中毒、模型反转攻击或提示注入。

  3. 分析潜在威胁:考虑传统的网络安全威胁和特定于 AI 的风险,例如模型盗窃或输出操纵。

    E购-新零售系统
    E购-新零售系统

    “米烁云货宝”,是一款基于云计算的Saas模式新零售系统。以互联网为基础,通过大数据、人工智能等先进技术,对商品的生产、流通、销售、服务等环节转型升级改造,进而重塑业态结构与生态圈。并对线上交易运营服务、线下体验购买及现代物流进行深度融合,所形成的零售新模式。

    下载
  4. 实施缓解策略:开发和部署针对 AI 系统量身定制的安全措施,例如强大的输入验证、输出过滤和持续模型监控。

  5. 定期测试和更新:持续进行安全评估,并在新漏洞和攻击向量出现时更新威胁模型。

保护 GenAI 系统的最佳实践

为了弥合 GenAI 采用和安全之间的差距,组织应考虑以下最佳实践:

  • 实施强大的访问控制:要限制潜在的攻击媒介,请使用基于角色的访问控制和最小权限原则。

  • 加密敏感数据:确保所有 AI 训练和推理数据都经过适当加密

  • 定期进行安全审核:执行内部和外部安全审核,主动识别和解决漏洞。

  • 采用渗透测试:定期测试您的 AI 系统免受潜在攻击,以发现弱点,以免被利用。

  • 制定安全的 AI 实践:在整个 AI 开发生命周期(从数据收集到模型部署)中整合安全考虑因素.

  • 随时了解情况:通过行业论坛、安全咨询以及与研究人员的合作,了解最新的人工智能安全威胁和最佳实践。

  • 制定正式的 AI 安全策略:制定并实施针对组织内 AI 系统的全面安全策略。

  • 投资于 AI 安全专业知识:建立或收购具有 AI 安全专业知识的团队,以解决这些系统的独特挑战。

未来之路

随着 GenAI 不断革新行业,强大的安全措施的重要性怎么强调都不为过。组织必须弥合采用和安全之间的差距,以充分实现这些强大技术的优势,同时降低相关风险。

通过实施特定于 AI 的威胁建模,采用 GenAI 安全性的最佳实践,并培育一种文化持续学习和适应,组织可以为安全的人工智能创新奠定坚实的基础。当我们探索这一新领域时,成功的关键在于在利用 GenAI 的变革力量和确保人工智能系统的安全性和完整性之间取得适当的平衡。

GenAI 革命已经到来,是时候我们安全实践也随之发展。您准备好保障您的人工智能未来了吗?

相关专题

更多
人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

288

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

620

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

32

2025.10.21

Java 网络安全
Java 网络安全

本专题聚焦 Java 在网络安全与加密通信中的应用,系统讲解常见加密算法(MD5、SHA、AES、RSA)、数字签名、HTTPS证书配置、令牌认证(JWT、OAuth2)及常见安全漏洞防护(XSS、SQL注入、CSRF)。通过实战项目(如安全登录系统、加密文件传输工具),帮助学习者掌握 Java 安全开发与加密技术的实战能力。

706

2025.10.13

PHP 安全与防护
PHP 安全与防护

本专题聚焦于PHP开发中的安全问题与防御措施,详细讲解SQL注入、XSS攻击、CSRF攻击、文件包含漏洞等常见安全风险及其修复方法。通过结合实际案例,帮助开发者理解漏洞成因,掌握输入验证、会话安全、加密存储与安全编码规范,全面提升PHP网站的安全防护水平。

110

2025.11.04

excel制作动态图表教程
excel制作动态图表教程

本专题整合了excel制作动态图表相关教程,阅读专题下面的文章了解更多详细教程。

24

2025.12.29

freeok看剧入口合集
freeok看剧入口合集

本专题整合了freeok看剧入口网址,阅读下面的文章了解更多网址。

74

2025.12.29

俄罗斯搜索引擎Yandex最新官方入口网址
俄罗斯搜索引擎Yandex最新官方入口网址

Yandex官方入口网址是https://yandex.com;用户可通过网页端直连或移动端浏览器直接访问,无需登录即可使用搜索、图片、新闻、地图等全部基础功能,并支持多语种检索与静态资源精准筛选。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

207

2025.12.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.2万人学习

Django 教程
Django 教程

共28课时 | 2.6万人学习

Excel 教程
Excel 教程

共162课时 | 10万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号