讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

数百项 AI 安全测试存在严重缺陷

碧海醫心

发布时间：2025-11-04 17:28:01

|

708人浏览过

|

来源于php中文网

原创

数百项 ai 安全测试存在严重缺陷

由英国政府AI安全研究所联合多所顶尖高校的计算机科学家开展的一项研究揭示，当前广泛用于衡量新一代人工智能（AI）模型安全性与效能的评估体系存在普遍性漏洞。研究人员对超过440个现有基准测试进行了系统分析，结果发现几乎每一项测试都在设计或执行层面存在某种形式的缺陷，可能严重影响其评估结果的可信度。

牛津互联网研究所的研究员安德鲁・比恩（Andrew Bean）作为该研究的主要负责人指出，这些基准测试本应是验证新型AI系统是否安全、可控并符合人类价值观的关键手段。然而，由于行业缺乏统一的技术标准和严谨的验证机制，目前很难判断AI模型的实际表现是在持续提升，还是仅仅在特定测试条件下“看起来”更优。

在美英两国尚未建立全面AI监管框架的现状下，这类基准测试实际上承担着类似“自我监管”的角色，成为科技公司在发布新AI产品前的重要参考。但近年来已有多起因AI输出有害内容而被迫下架产品的案例。例如，谷歌此前不得不撤回其开源AI模型Gemma，原因是该模型生成了关于一名美国参议员的虚假负面信息，引发公众强烈质疑。

RoomGPT

RoomGPT

使用AI为每个人创造梦想的房间

下载

谷歌随后澄清称，Gemma原本面向开发者和研究人员，并非为大众用户设计，在发现被不当使用后迅速采取了回收措施。研究还指出，大多数基准测试缺乏对结果不确定性的量化分析，仅有16%的测试采用了统计显著性检验等科学方法。同时，在评估如“无害性”“公平性”等关键属性时，相关标准定义模糊、主观性强，导致不同测试之间难以横向比较。

为此，研究团队呼吁全球AI社区共同推动建立开放、透明且标准化的评估框架，制定通用的最佳实践指南，以增强AI安全测试的可靠性与可重复性，从而真正保障技术发展的稳健与可信。

相关文章

刘知远：2030—2035 年可实现 AGI

原力灵机推出 GeoVLA 框架

硬核博主用四台 Mac Studio 打造 AI 集群：1.5TB 统一内存、总价接近 4 万美元

Ruby 4.0.0 正式发布，新增 “Ruby Box” 和 “ZJIT”

谷歌母公司 Alphabet 斥资 47.5 亿美元收购 Intersect，加速 AI 和数据中心扩张

相关标签:

计算机人工智能谷歌 ai 人工智能

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：比亚迪自研水平对置发动机荣获“中国心”十佳评选下一篇：苹果 iOS 27 开发进展：AI 功能将迎来重大升级

作者最新文章

趣味无限！在线歌曲生成器：创作你的专属旋律

2025-12-26 10:03

视频号视频怎么配音乐？配音乐算原创吗？

2025-12-26 10:04

AI音乐视频创作指南：Suno AI与Leonardo AI结合，打造爆款音乐视频

2025-12-26 10:07

雪天路滑哪种走路姿势更稳定

2025-12-26 10:07

如何在 Django 中高效组织商品与分类数据并渲染到模板

2025-12-26 10:08

React 文件上传组件首次失效问题的完整解决方案

2025-12-26 10:14

品牌如何做视频号投放？做视频号投放违法吗？

2025-12-26 10:16

《小黑课堂》上课提醒设置方法

2025-12-26 10:18

如何关闭蚂蚁财富与支付宝的关系

2025-12-26 10:21

《支付宝》拒绝别人转账设置方法

2025-12-26 10:22

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

人工智能在生活中的应用

人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容，供大家免费下载体验。

393

2023.08.17

人工智能的基本概念是什么

人工智能的基本概念是什么

人工智能的英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

285

2024.01.09

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

619

2024.09.10

Python 人工智能

Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用，系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例（如房价预测、图像分类、文本情感分析），帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

32

2025.10.21

虚拟号码教程汇总

虚拟号码教程汇总

本专题整合了虚拟号码接收验证码相关教程，阅读下面的文章了解更多详细操作。

30

2025.12.25

错误代码dns_probe_possible

错误代码dns_probe_possible

本专题整合了电脑无法打开网页显示错误代码dns_probe_possible解决方法，阅读专题下面的文章了解更多处理方案。

20

2025.12.25

网页undefined啥意思

网页undefined啥意思

本专题整合了undefined相关内容，阅读下面的文章了解更多详细内容。后续继续更新。

37

2025.12.25

word转换成ppt教程大全

word转换成ppt教程大全

本专题整合了word转换成ppt教程，阅读专题下面的文章了解更多详细操作。

6

2025.12.25

msvcp140.dll丢失相关教程

msvcp140.dll丢失相关教程

本专题整合了msvcp140.dll丢失相关解决方法，阅读专题下面的文章了解更多详细操作。

2

2025.12.25

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

SciPy 教程

SciPy 教程

共10课时 | 0.9万人学习

R 教程

R 教程

共45课时 | 4.1万人学习

SQL 教程

SQL 教程

共61课时 | 3.1万人学习

最新文章

更多

字节跳动团队发布 DreaMontage，帧引导视频生成技术

OpenAI 发布圣诞特别版模型：GPT-5.2-Codex-XMas

Qwen Code 正式发布 VSCode 插件 & TypeScript SDK

国安部提醒：违规使用开源 AI 工具会导致泄密

涂鸦智能发布 AI 生活助手 “Hey Tuya”

Selenium 创始人发布 Vibium，面向 AI Agent 的浏览器自动化架构

LG 将发布基于 AI 技术的新型游戏显示器：UltraGear evo

Liquid AI 最新实验性模型 LFM2-2.6B-Exp 发布

联想将在 CES 发布全球首款“AI 超级智能体”，对标豆包手机助手

圆周率计算世界纪录再被刷新：单台服务器持续运行 110 天，突破 314 万亿位数字

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部