近日,一项跨越18国、涵盖14种语言的大规模研究给正火热的ai助手浇了一盆冷水。据相关报道,欧洲广播联盟的最新研究报告指出,主流ai聊天机器人在处理新闻内容时存在系统性缺陷,近半数回答存在重大问题,这对公众信息获取质量构成了严重威胁。
这项联合22家公共服务媒体的研究,对ChatGPT、Copilot、Gemini和Perplexity等主流AI平台进行了3000次测试。测试结果令人担忧,45%的回答存在至少一个重大错误,81%的回答包含轻微问题。其中,信息来源缺失和准确性不足问题最为突出,分别影响了31%和30%的回答。
研究负责人发出警告,这些错误具有系统性、跨国界和多语言特性。当人们面对众多错误信息,不知道该相信什么时,最终可能会选择什么都不信。
从平台表现来看,Google Gemini的错误率高达76%,处于垫底位置,是其他产品错误率的两倍多。尽管与半年前相比,部分模型有了一定改进,但整体错误率仍然居高不下。研究人员还特别指出,AI在处理突发新闻、复杂时间线以及需要区分观点的事实类问题时,表现尤为薄弱。
然而,与AI在新闻处理上的低可靠性形成鲜明对比的是,它在新闻领域的普及速度十分迅猛。路透研究所的数据显示,使用AI获取新闻的用户数量在一年内实现了翻倍,在阿根廷、美国以及18 - 24岁的年轻人中,AI获取新闻的渗透率最高。更值得警惕的是,有48%的年轻用户依赖AI来简化新闻理解。
AI在新闻领域的高普及与低可靠性之间的矛盾,给公众信息获取带来了极大的挑战。一方面,越来越多的人尤其是年轻人倾向于使用AI获取新闻,享受其带来的便捷;另一方面,AI给出的新闻内容存在大量错误,可能会误导公众。这就需要相关部门和企业重视这一问题,采取有效措施提高AI新闻的可靠性,保障公众能够获取到准确、真实的新闻信息。同时,公众自身也应该提高对AI新闻的辨别能力,不盲目相信AI给出的内容。
以上就是45%重大错误!AI新闻低可靠却高普及公众该咋办?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号