讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 科技周边 > 人工智能 > 正文

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

聖光之護

发布： 2025-02-17 13:26:17

原创

1323人浏览过

加州大学伯克利分校吴梓阳博士及其团队提出了一种新型transformer架构——token statistics transformer (tost)，其核心是线性时间复杂度的注意力机制。这项研究成果已发表在iclr 2025，并被选为spotlight论文。马毅教授将在今年四月iclr大会上进行主题报告。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ToST巧妙地解决了传统Transformer架构中自注意力机制计算复杂度高的问题。传统自注意力机制的计算复杂度随输入token数量呈二次方增长，而ToST通过对序列特征的统计建模，将时间复杂度降低至线性。这使得ToST能够高效处理更长序列和更大模型。

论文标题：Token Statistics Transformer: Linear-Time Attention via Variational Rate Reduction
论文地址：https://www.php.cn/link/95f8a41d276ddf36bcdc87d53627da29
项目主页：https://www.php.cn/link/c7f746b7939ba6db31093d4438d9207b
开源地址：https://www.php.cn/link/ef13ab03d0eb503ae378006c95daa368

核心创新：Token Statistics Self-Attention (TSSA)

ToST的核心是TSSA，它通过避免两两相似性计算，仅依赖于token特征的统计量，从而实现线性复杂度。该方法基于变分编码率缩减（Variational Rate Reduction, VRR）框架，并通过实验验证了其在不同任务上的有效性。

方法概述: ToST通过提取统计特征，利用VRR框架压缩特征，最终实现线性时间复杂度。其架构基于先前CRATE工作的扩展，通过最大编码率缩减目标(MCR²)的变分形式推导得出。

慧中标AI标书

慧中标AI标书

慧中标AI标书是一款AI智能辅助写标书工具。

慧中标AI标书

295

慧中标AI标书

实验结果与性能分析: ToST在多个领域（NLP、CV）的任务中都取得了优异的成绩，同时显著降低了计算资源消耗。实验结果表明，ToST在计算时间和内存使用上均实现了线性扩展，且性能与传统Transformer架构相当甚至更好。

未来影响: ToST的线性时间复杂度注意力机制，为大模型的高效化、Transformer的普适化应用、多模态融合以及跨学科应用提供了新的可能性，具有重要的学术意义和应用价值。

以上就是首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git red 2025 架构 Token github transformer nlp https

大家都在看：

AI 语音助手：打造 24/7 全天候智能接待员 RipsyTech AI文档生成器：革新医疗文档工作流程 AI音频编辑工具终极指南：五款顶级工具深度测评 2025年最佳AI代码助手：赋能开发者高效编程 AI在X光图像处理中的应用：医学影像新纪元

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：曝小米SU7上周新增订单破万！口碑推动销量不断攀升下一篇：曝特斯拉Model 3转向拨杆将回归反人类设计减一？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

《天国：拯救2》主笔大胆预测：AI革命或意味着“人类的终结”

2025-12-18 12:36:13
《战地6》稳居25年美国游戏销量榜首！畅销榜公布

2025-12-18 12:39:12
扫地机器人鼻祖 iRobot 宣布破产，将由中国代工厂接手

2025-12-18 12:43:02
Torna 1.35.0 发布，接口文档解决方案

2025-12-18 12:48:02
《艾尔登法环：黑夜君临》新强化BOSS实装高难度安宁者

2025-12-18 12:50:12
小米17 Ultra下周登场！卢伟冰：小米正代高端旗舰全部当年发布

2025-12-18 12:51:07
荣耀Magic8 Mini加速来袭，小屏旗舰赛道迎新玩家

2025-12-18 13:25:02
山海进化录神山十五打法攻略分享

2025-12-18 13:34:02
新三国志曹操传阵营科技系统玩法

2025-12-18 13:36:08
Visual Studio Code 1.107 发布

2025-12-18 13:45:12

最新问题

豆包如何让AI模仿名人语气_豆包语气模仿提示词要素拆解【策略】要实现高保真名人语气模仿，须五步并举：一、锚定身份背景与语言特征；二、嵌入可验证原句作风格标尺；三、施加负向约束排除AI惯性；四、绑定具体交互场景激活语境响应；五、控制输出粒度与节奏参数。

2025-12-19 16:07:36

974

文心一言撰写商业新闻稿教程文心一言媒体沟通技巧掌握AI辅助下的结构化提示与媒体语境适配方法，可高效产出专业、合规、具传播力的商业新闻稿：需明确定义角色与5W1H要素，分段生成并锚定信源，预演媒体问答，执行三层合规审核。

2025-12-19 16:01:02

805

如何用AI快速生成各种风格头像 AI一键制作个性化头像教程【免费】 AI头像生成有四种免费低门槛方式：一、在线生成器如Leonardo.Ai，输入中文提示词即时出图；二、本地部署StableDiffusionWebUI，离线隐私安全；三、手机APP如美图秀秀，上传自拍一键重绘；四、微信小程序，无需注册，上传照片快速导出。

2025-12-19 15:48:08

300

豆包AI如何生成室内设计图豆包AI效果图制作指南豆包AI可快速生成个性化室内设计图，方法包括：一、纯文字提示词生成；二、户型图垫图优化；三、DeepSeek增强质感；四、智能体批量出图；五、笔记整合设计资产。

2025-12-19 15:39:08

648

DeepSeek支持哪些编程语言 DeepSeek代码生成与解释能力一览 DeepSeek展现出强大的编程辅助能力，支持主流开发场景：一、Python（人工智能与数据分析首选，代码生成精确）；二、JavaScript/TypeScript（Web前端与全栈开发，适配现代框架）；三、Java与C++（高性能后端与系统级编程，逻辑严谨）；四、SQL与辅助脚本（数据库查询与自动化运维，提升处理效率）。

2025-12-19 15:33:11

607

豆包AI官网入口地址豆包AI网页版快速通道想要快速体验豆包AI的强大功能，最直接的途径就是访问其官方网页版。这里为用户提供了无需繁琐下载、点击即用的快速通道，让智能交互触手可及。

2025-12-19 15:32:13

150

豆包AI帮你制定健身计划豆包AI健康生活助手豆包AI可基于身体数据、目标和日程生成个性化健身计划：一、输入基础健康信息；二、设定明确健身目标；三、同步日程与环境限制；四、获取动态调整反馈；五、启用语音交互式动作指导。

2025-12-19 15:27:17

683

DeepSeek怎么翻译文档 DeepSeek多语种翻译与润色效果评测 DeepSeek提供四大翻译与润色模式：一、直接对话翻译（响应迅速，适合短文本与实时交互）；二、文档上传翻译（解析力强，支持PDF/Word等长文档处理）；三、多语种对比润色（精准修正，提升表达地道感）；四、特定场景深度本地化（适配学术或商务，术语一致性高）。

2025-12-19 15:16:43

663

豆包AI在线网页版入口豆包AI官网直接访问链接想要快速体验智能对话功能，最便捷的方式就是通过豆包AI在线网页版入口进入。这种方式的最大优势在于无需下载安装，直接通过浏览器即可访问，即开即用，非常适合临时办公或快速查询信息。官方聊天主入口：https://www.doubao.com/chat/ 通过该链接可以直接访问豆包AI官网，体验包括智能问答、文本生成等在内的核心服务。

2025-12-19 15:16:02

517

利用ChatGPT制定学习计划 ChatGPT个性化教育方法需明确学习主题、当前水平与可用时间，通过结构化提示词、知识图谱追问和自我检测机制三类方法定制动态学习路径。

2025-12-19 15:12:07

680

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新Python教程从入门到精通

5267次学习
收藏
Node.js 教程

67875次学习
收藏
CSS3 教程

37729次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部