NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

碧海醫心

发布时间：2024-12-02 16:00:33

433人浏览过

来源于php中文网

原创

杜克大学和谷歌研究院的研究人员提出了一种名为自驱动logits进化解码（sled）的新型解码框架，旨在提高大型语言模型（llm）的事实准确性，无需外部知识库或额外微调。该研究成果已被neurips 2024收录，第一作者是杜克大学电子与计算机工程系博士生张健一。

LLM虽然性能卓越，但容易出现事实性错误（幻觉）。研究发现，LLM内部可能已掌握正确答案，只是无法直接从输出中获取。研究者称此为“潜在知识”，并将其比作“三体问题”（图一）。 SLED通过对比LLM最后一层和前面几层的输出，挖掘潜在知识，并将其与原始输出整合，避免过拟合。 (图二展示了SLED框架流程)。

SLED通过优化损失函数，引导正确的token在输出分布中获得更高概率，这类似于对输出进行“梯度下降”。研究者认为LLM训练本身就是一个由数据集驱动的Logits进化过程，而SLED则模拟了这一过程，利用前面几层输出（潜在知识）来改进最后一层的输出。(图三验证了不同层输出分布与真实分布的差异)。

实验结果表明，SLED在多个数据集和不同规模的LLM上，显著提升了事实准确性，并与其他解码方法兼容。此外，SLED计算开销极低，并能有效抑制输出重复。(实验结果见文中图表)。

MaxAI

MaxAI.me是一款功能强大的浏览器AI插件，集成了多种AI模型。

下载

SLED为未来的推理时间算法提供了一个新框架，它与经典优化算法结合紧密，效率更高，且无需修改模型参数，因此更易于应用和扩展，有望在医疗和教育等领域发挥作用。

(文中图片链接保持不变)

AI写作工具深度测评：Agility Writer高效创作实战

2025年最佳AI冷邮件软件：Saleshandy等3款工具深度评测

StableCode：本地安装AI代码生成器的完整指南

AI与3D打印：创新解谜与自动化方案

AI智能笔记终极指南：2分钟快速生成高效学习笔记

谷歌浏览器

谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁，使用起来得心应手。这里提供了谷歌浏览器纯净安装包，有需要的小伙伴快来保存下载体验吧！

下载

相关标签:

git 谷歌 Token 算法

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：NeurIPS 2024 | 数学推理场景下，首个分布外检测研究成果来了下一篇：新一代量子金刚石磁力仪在科大硅谷诞生

作者最新文章

MapStruct 多参数映射：正确使用 source 属性绑定方法参数

2026-01-12 15:48

酷狗音乐如何设置苹果手机铃声

2026-01-12 15:49

Python 中函数返回值的正确获取方式

2026-01-12 15:59

iPhone屏幕上出现的方块按钮怎么隐藏

2026-01-12 16:00

如何在 IntelliJ IDEA 中禁用紧凑型大括号格式（强制换行）

2026-01-12 16:00

Go语言中类型转换：将双向通道转为只读通道的语法解析

2026-01-12 16:04

如何在Java中跨类访问对象实例并共享状态

2026-01-12 16:04

天塌了！《棕色尘埃2》将开启和谐修改角色服装引不满

2026-01-12 16:04

iPhone 17e即将发布，刘海屏彻底成为历史

2026-01-12 16:08

微PE工具箱如何进行分区

2026-01-12 16:08

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6080

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

798

2023.09.14

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1056

2023.12.21

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1211

2024.03.01

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

399

2023.08.14

Java 项目构建与依赖管理（Maven / Gradle）

本专题系统讲解 Java 项目构建与依赖管理的完整体系，重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例，帮助学习者掌握从零搭建、维护到发布 Java 工程的标准化流程，提升在实际团队开发中的工程能力与协作效率。

2026.01.12