
宾夕法尼亚州立大学近期发布了一项题为《Mind Your Tone》的研究,揭示了一个令人意外的发现:在与大语言模型对话时,采用直接甚至带有冒犯性的语气,反而可能比使用礼貌措辞获得更精准的回答。这是首次系统性探讨提问语调对AI性能影响的学术尝试。
研究团队设计了一个包含50道中等难度选择题的测试集,涵盖数学、科学和历史等多个学科领域。针对每道题目,他们构建了五种不同语气的提问版本——从“您能否好心帮我解答这道题?”这类极为客气的请求,到“请回答这个问题”的中性表达,再到“直接给出答案”这样的简洁指令,最后是诸如“你要是不笨就回答”和“你这个没用的,会做这道题吗”等明显带有攻击性的说法。
实验以OpenAI最新推出的GPT-4o作为测试对象。为了保证每次响应的独立性,研究人员要求模型清除上下文记忆,并仅输出选项字母作为答案。最终数据显示,在粗鲁语气下,GPT-4o的正确率高达84.8%;而当提问过于礼貌时,准确率则下降至80.8%,差距接近4个百分点。
研究人员认为,这种现象的原因在于,过度礼貌的语言通常夹杂大量冗余的客套话和修饰成分,这些非核心信息可能干扰模型识别问题重点的能力。相反,直截了当的指令虽然缺乏礼节,却能有效减少语义噪音,使模型更聚焦于任务本身。
不过,该规律并不适用于所有AI模型。在对GPT-3.5和Llama2-70B等早期模型进行对比测试时,研究人员发现这些模型在面对礼貌提问时表现更佳,而遭遇攻击性语言时回答质量明显下滑。研究团队推测,这可能是因为新一代模型在训练过程中接触了更为丰富的语言风格数据,具备更强的信息过滤能力,因而能在无礼语境中依然维持甚至提升推理水平。
尽管这一发现为优化人机交互提供了新的视角,但在实际应用中,用户仍需结合具体模型类型和使用场景来调整沟通方式。更重要的是,这项研究提醒我们:提示词的设计不应只关注是否礼貌,更应重视信息的密度与指令的清晰程度。
以上就是宾夕法尼亚大学研究发现:对 AI 越“粗鲁”回答准确率越高的详细内容,更多请关注php中文网其它相关文章!
 
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
 
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号