微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

絕刀狂花

发布： 2025-01-08 21:37:49

原创

322人浏览过

一项最新研究表明，即使是最先进的大语言模型 (llm) 也难以始终如一地遵循人类设定的规则。加州大学伯克利分校、斯坦福大学、ai安全中心 (cais) 和阿卜杜勒阿齐兹国王科技城 (kacst) 的研究人员开发了一个名为 rules 的基准测试框架，以编程方式评估 llm 遵循规则的能力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

RULES 基准测试模拟了各种场景，要求模型在遵循特定规则的同时生成文本。例如，模型可能需要在不泄露敏感信息的情况下与用户进行对话，或者在遵循特定格式的同时生成文本。

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

研究人员对包括 GPT-4、Claude、Gemini 等闭源模型以及 Llama-2、Mistral 等 123 个开源模型进行了测试。结果显示，大多数模型，即使是最强大的模型，也未能通过所有测试。即使是表现最好的 GPT-4，也未能通过 93 项测试。

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

RULES 基准测试包含 14 个场景，每个场景都涉及一个或多个规则。这些规则被设计为难度递增，从简单的良性测试到更具挑战性的红队测试，旨在测试模型在各种情况下遵循规则的能力。研究人员还设计了多种策略来试图诱导模型违反规则，包括间接请求、法律术语的误导性解释、混淆请求、规则更改和模拟场景。

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

GPT-MINUS1

GPT-MINUS1

通过在文本中随机地用同义词替换单词来愚弄GPT

GPT-MINUS1

46

GPT-MINUS1

这项研究突显了当前 LLM 在规则遵循方面的局限性。虽然一些模型在某些测试中表现良好，但整体结果表明，确保 LLM 始终如一地遵循规则仍然是一个挑战。这对 LLM 的安全性和可靠性具有重大意义，并强调了进一步研究和改进的必要性。

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

论文链接：https://www.php.cn/link/7473b9f4150cf2af50154b8d4bc81ea3

以上就是强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试的详细内容，更多请关注php中文网其它相关文章！

相关标签：

ai claude gemini 2025 https gpt llama

大家都在看：

BestBlogs— 开源的一站式AI内容聚合平台 ai志愿助手官方网址最新入口_ai志愿助手在线体验官网直达首页天宫AI官方网站链接地址_天宫AI平台入口直达官网访问秘塔AI教育入口秘塔AI在线版教育官网入口百度ai官方网站主页链接_百度ai平台入口地址智能访问

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：岚图汽车12月交付12136辆全年超8.5万梦想家成主力下一篇：华为开发者大会2024：HarmonyOS NEXT Beta，AI 大模型开启OS新纪元

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

gpt5官网入口 gpt5官方在线使用入口

2025-11-13 11:16:25
为什么番茄小说搜索不到想要的小说_番茄小说搜索不到书问题解决教程

2025-11-13 11:19:03
PHP代码怎么注释规范_PHP代码注释规范制定及可读性提升。

2025-11-13 11:21:05
MongoDB索引怎么优化_MongoDB索引原理与JS全栈查询性能优化方法

2025-11-13 11:27:24
Shutterstock图片怎么批量下载_Shutterstock批量下载图片的操作方法

2025-11-13 11:35:02
AO3镜像网站在线访问_AO3镜像网站在线访问操作方法

2025-11-13 11:44:03
php怎么调试接口排序_php接口数据排序参数与结果调试方法

2025-11-13 11:52:18
夸克浏览器2025年免登录入口中国搜索引擎官方地址

2025-11-13 12:18:48
b站怎么关掉抖动_b站关闭视频或界面抖动效果的操作方法

2025-11-13 12:54:03
vscode插件怎么下载代码提示_vscode代码提示补全插件下载指南

2025-11-13 12:59:03

最新问题

天宫AI官方网站链接地址_天宫AI平台入口直达官网访问天宫AI官方网站链接是tiangong.cn，该平台提供智能信息查询、多轮对话、内容生成功能，基于中文优化的大模型支持教育辅助与办公应用。

2025-11-15 15:07:02

895

松鼠AI怎么切换设备不丢数据_松鼠AI多设备登录与数据同步方法首先通过统一账号登录新设备实现数据同步，系统自动下载学习档案；其次利用数据迁移功能传输本地备份文件以应对网络不稳定情况；最后开启实时同步模式确保跨设备数据一致，每次操作后自动上传云端。

2025-11-15 14:55:39

717

文心一言网页版入口链接文心一言官方免费版入口文心一言网页版入口为https://yiyan.baidu.com/welcome，用户可通过手机号验证码、百度账号密码或扫码方式登录，平台具备自然语言理解、多轮对话、内容创作、代码生成等功能，支持知识库调用、图像描述生成与任务分解，提供流畅交互与资源扩展体验。

2025-11-15 14:40:02

651

KaLM-Embedding— 腾讯推出的文本嵌入模型系列 KaLM-Embedding是什么KaLM-Embedding是腾讯团队推出的一系列高性能文本嵌入模型，通过先进的训练技术和高质量数据提升文本嵌入的性能。最新版本KaLM-Embedding-V2在架构和训练方法上进行了多项创新，例如移除因果注意力掩码以实现双向表示学习，采用多阶段训练流程（包括预训练、微调和对比蒸馏），显著提升了模型的泛化能力和语义理解能力。最新的KaLM-Embedding-Gemma3-12B-2511是系列的一个重要版本，基于更大的参数规模（12B参数），进一步优化了模

2025-11-15 14:37:01

535

松鼠AI怎么使用单词背诵计划_松鼠AI智能单词推送与复习设置开启智能推送并配置个性化复习频率，绑定提醒以提升执行率。登录后进入词汇中心选择目标，启动每日推荐词表，设置固定学习时间；在复习策略中选模式与间隔，启用错词优先；通过App开启通知提醒，设定早晚学习时段；每周查看报告，将掌握度低于60%的单词加入专项突破，优化推送优先级。

2025-11-15 14:29:53

986

秘塔AI教育入口秘塔AI在线版教育官网入口秘塔AI教育官网入口为https://metaso.cn/，提供AI深度搜索、文件解析、智能问答及合同审查功能，支持多端便捷使用，适用于企业培训、法律金融、教育学习等场景。

2025-11-15 14:28:42

469

百度ai官方网站主页链接_百度ai平台入口地址智能访问百度AI官方网站主页链接是https://ai.baidu.com/，该平台提供语音识别、图像处理、自然语言理解等技术接口，集成开发工具与SDK，支持模型训练部署及企业级解决方案，助力开发者快速构建智能应用。

2025-11-15 14:27:06

826

AI志愿助手怎么开启青少年保护模式_AI志愿助手青少年模式设置详细步骤开启青少年保护模式可限制不适宜内容，具体步骤：一、登录后进入“我的”个人中心；二、查找并点击“青少年保护模式”选项；三、阅读提示后点击“开启”并完成验证；四、绑定监护人账号以实现远程管理；五、在内容管理中选择适龄标签并设置屏蔽关键词，系统据此调整推荐内容与功能权限。

2025-11-15 14:25:02

545

哩布哩布ai安全官方网址入口_哩布哩布ai平台官网直达链接哩布哩布AI官方网址为https://www.liblib.art/，该平台提供AI图像生成、多种模型选择、参数调节及实时预览功能，拥有活跃的创作者社区和资源共享生态，采用先进深度学习技术，界面简洁，建议使用Chrome浏览器访问以确保最佳体验。

2025-11-15 14:20:03

710

Notion是什么软件_Notion是一款强大的全能型笔记与项目管理软件 Notion是提升效率的理想工具，整合笔记、任务与数据库管理。其模块化设计支持拖拽创建页面，灵活组合文本、待办、表格等块；通过多视图数据库管理任务，实现看板、日历等动态展示；支持团队协作，可设权限、@成员、查版本历史；提供丰富模板，便于快速搭建个性化系统，满足个人与团队多样化需求。

2025-11-15 14:15:36

388

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部