讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

智谱提出 Glyph：通过视觉-文本压缩扩展上下文窗口

心靈之曲

发布： 2025-10-22 16:37:01

原创

616人浏览过

智谱glm大模型团队推出了 glyph 框架，探索了一条区别于主流方法的全新上下文扩展路径。

该框架创新性地采用视觉-文本压缩技术，将长篇文本转化为图像形式，使模型能够通过“看图”的方式理解语义内容。借助 由大语言模型驱动的搜索算法，Glyph 可自动寻找到最优的视觉渲染策略，在显著减少输入 token 数量的同时，保留关键语义信息，从而有效突破传统模型在上下文长度上的限制。

在多项长文本基准测试中，Glyph 在性能表现与当前顶尖LLM相当的基础上，实现了约 3至4倍的上下文压缩率，并带来了数倍的训练与推理速度提升。

Glyph 开辟了长上下文建模的新思路——通过将文本视觉化实现高效的信息扩展，为构建面向超长文本处理的大模型提供了极具潜力的发展方向。

智谱提出 Glyph：通过视觉-文本压缩扩展上下文窗口

动机

面对文档理解、代码库分析、复杂推理等任务时，大模型常常需要处理数十万乃至上百万 token 的输入数据。

然而，直接扩大模型上下文窗口会带来极高的计算和内存开销，导致“百万级上下文”模型难以实际部署与广泛应用。

为应对这一挑战，研究团队提出 Glyph ——一种基于视觉化输入的新型上下文扩展范式。

不同于依赖修改注意力机制的传统方案，Glyph 从输入表征层面重构问题本质：

慧中标AI标书

慧中标AI标书

慧中标AI标书是一款AI智能辅助写标书工具。

慧中标AI标书

295

慧中标AI标书

将原始文本转换为图像输入，利用视觉-语言模型（VLM）进行读取与理解，实现在不增加模型原生上下文容量的前提下，完成对超长文本的有效建模。

方法

智谱提出 Glyph：通过视觉-文本压缩扩展上下文窗口

Glyph 的核心理念是让模型学会“用眼睛阅读”超长文本。通过将文字内容渲染成图像，模型可在有限 token 预算下接收更密集的信息流，达成高效的语义压缩。整个系统包含三个关键阶段：

持续预训练阶段
研究人员将大量长文本数据渲染为多种视觉样式，涵盖文档排版、网页布局、代码展示等多种真实场景。基于这些图像化文本，构建包括 OCR 识别、图文联合建模、视觉补全在内的多样化任务，帮助模型同时掌握字符的视觉特征与其深层语义。此阶段强化了跨模态对齐能力，使模型能准确“读懂”图像中的文字内容。
**LLM驱动的渲染策略搜索
不同的渲染参数（如字体大小、行距、分辨率、布局方式）会显著影响模型的理解效果与压缩效率。为此，团队设计了一种基于大语言模型引导的遗传搜索算法****。该方法在验证集上评估不同配置的表现，由 LLM 分析结果并生成改进方案，经过多轮迭代后自动收敛至最优渲染策略，在压缩率与语义保真之间达到最佳平衡。
后训练优化阶段
确定最优渲染方式后，模型进入精细化调优阶段，采用有监督微调（SFT）结合 GRPO 强化学习算法进行优化。同时引入OCR辅助学习任务，进一步增强模型对细粒度文本结构的识别与理解能力。

总结

Glyph 标志着一种融合视觉与语言的上下文扩展新范式的诞生。

通过三阶段协同训练，Glyph 实现了在 3–4倍文本压缩率 下仍保持强劲的任务表现，并大幅提升了训练与推理效率。

在极端压缩条件下，仅使用 128K 上下文的视觉模型，即可成功处理 百万 token 级别的文本任务，展现出强大的扩展潜力，也为未来迈向千万级上下文的智能系统奠定了坚实基础。

源码地址：点击下载

以上就是智谱提出 Glyph：通过视觉-文本压缩扩展上下文窗口的详细内容，更多请关注php中文网其它相关文章！

相关标签：

大模型区别压缩技术网页布局 Token 算法 ocr 重构

大家都在看：

蚂蚁开源 AEnvironment，面向 Agentic RL 的统一环境平台智能知识管理系统 SKC V0.1.5 发布（支持推荐阅读）字节跳动正式发布豆包大模型1.8 商汤旗下大晓机器人发布 ACE 具身研发范式、开悟世界模型 3.0 等 Adobe 被诉用盗版书籍训练 AI 模型，SlimLM 陷版权风波

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：亚马逊裁员计划曝光：2033 年机器人或取代超 60 万个岗位下一篇：大语言模型也会“脑腐” (Brain Rot)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

被双平台封杀！恐怖游戏《Horses》销量已超1.8万份

2025-12-18 13:09:02
这就是NS2的实力？《2077》实测：掌机画面直追主机

2025-12-18 13:09:13
Nelm 与 Helm 4 的比较：现有差异与未来规划

2025-12-18 13:15:07
Epic就圣诞连送滑跪道歉：深知与Steam的差距仍会努力

2025-12-18 13:22:01
SE《正当防卫3》D加密正式移除！游戏发售已十年

2025-12-18 13:25:11
小米、徕卡宣布合作升级：引入战略共创模式！首作小米17 Ultra下周见

2025-12-18 13:30:01
《上古卷轴5》Mod爆改成日式美女游戏太犯规了

2025-12-18 13:35:00
谷歌将“氛围编程”工具 Opal 集成至 Gemini 网页端

2025-12-18 13:39:19
老牌劲旅的惺惺相惜！ B社支持《GTA6》延期

2025-12-18 13:45:17
《极限竞速：Motorsport》内容停更专注《极限竞速：地平线6》

2025-12-18 13:58:02

最新问题

三星「摺叠宇宙」来袭！传2026年重心将全面转向摺叠机、提升行动生产力全球智慧型手机领军品牌三星电子（SamsungElectronics）于2025年展现出清晰的战略转向。尽管GalaxyS25系列在硬件性能与销售表现上持续稳居安卓阵营榜首，但产业分析普遍认为，三星已将研发创新的核心全面聚焦于折叠式移动设备，借由形态层面的技术突破，突破直板机型长期面临的增长天花板。传统旗舰稳健有余，突破略显乏力回望2025年，GalaxyS25、S25+与S25Ultra凭借强劲的运算能力与影像系统赢得用户广泛认可，但在外观设计与交互逻辑上仅维持小幅优化，未能复刻过往旗

2025-12-19 12:11:02

911

助产业转守为攻数发部携手SEMI推动E187半导体设备资安认证数位发展部（数发部）今（18）日联合SEMI国际半导体产业协会、台积电、日月光、台湾电子製造设备工业同业公会（TEEIA）等资安与半导体领域关键伙伴，正式推出「SEMIE187半导体设备资安认验证制度」。透过跨部门、跨产业的公私协力模式，以「一套标准强化国际竞争力，一枚标章接轨全球市场」为核心策略，彰显台湾在建构全球供应链资安治理框架中的制度性影响力，并为本土资安软体与服务产业开辟全新成长动能。数位发展部部长林宜敬指出，台积电作为民主供应链的关键支柱，其核心系统虽具备高度防护能力，但攻击者转而锁

2025-12-19 12:06:08

107

版本发布｜ IvorySQL 5.1 发布 2025年12月18日，IvorySQL5.1正式上线！IvorySQL5.1以PostgreSQL18.1为底层内核，融合了多项稳定性修复与能力升级。完整变更日志请查阅官方文档平台。PostgreSQL18.1核心增强新增对CREATESTATISTICS语句中目标Schema的CREATE权限校验机制。优化libpq中内存分配尺寸计算逻辑，规避潜在整数溢出风险。解决SQL/JSON函数（例如JSON_VALUE）在DEFAULT子句中使用含CO

2025-12-19 12:02:16

814

广州至湛江高铁 12 月 22 日建成通车，运行时间压缩 61 分钟感谢网友若怡的线索提供！12月18日，中国国家铁路集团有限公司正式发布消息：广州至湛江高铁（简称“广湛高铁”）将于12月22日正式开通运营。届时，广州白云站与湛江北站之间最快仅需1小时32分钟即可抵达。广湛高铁途经广州、佛山、肇庆、云浮、阳江、茂名、湛江等城市，全线总长401公里，设计运行时速为350公里。本次首发将启用新兴南、阳春东、阳江北、马踏、茂名南、吴川、湛江北共7座车站，线路起讫点分别为广州白云站与湛江北站。而广湛高铁佛山站、佛肇站以及接入广州站的相关工程目前仍在稳步推进中。该线路穿越

2025-12-19 11:48:07

115

43%台湾人用过生成式AI！但真正会用得不到7成财团法人台湾网路资讯中心今日公布《2025台湾网路报告》，最新调查结果显示，已有43.19%的台湾民众实际接触并使用过生成式AI工具。其中，40岁以下族群为最常使用AI的群体；然而，尽管AI使用看似普及，「会用」不等于「善用」。调查显示，虽有79.25%的使用者具备初步判断AI输出品质优劣的能力，但真正能借由AI高效完成任务者仅占66.23%，显示从「认知理解」迈向「实作应用」之间仍存在显著断层。本报告由阳明交通大学研究团队主导执行，聚焦于AI使用行为、数位素养及风险感知等面向进行深入剖析。另发

2025-12-19 11:43:02

970

摺叠机天花板！三星Galaxy Z TriFold三摺机10吋巨幕大展双内摺设计工艺经过多年折叠技术的深耕与积累，三星电子再度突破极限！今日（18日）清晨，以开创性的双侧内折结构，正式发布全新旗舰GalaxyZTriFold，将「移动办公生产力」提升至前所未有的高度，也标志着智能手机正式迈入「三折叠」全新时代。该机完全展开后拥有10英寸巨幅屏幕，沉浸感直逼平板电脑；更采用独家「双侧内折设计」，不仅贴合人体工学，更能将精密脆弱的内屏完整收纳于机身内部，显著增强整机耐用性；收折后则化身为6.5英寸封面屏，厚度与握持手感精准拿捏，单手操作依旧轻松自如。台湾热销爆发！跃居全球首批上市六

2025-12-19 11:42:09

427

汽车电动化、智慧化双轨加速调研估4年内车用晶片市场近千亿美元根据市场研究机构集邦科技（TrendForce）最新报告，随着全球汽车产业加速迈向电动化与智能化，车用半导体市场规模预计将由2024年的约677亿美元稳步攀升至2029年的近969亿美元，2024至2029年间的复合年增长率（CAGR）达7.4%。不过，各类车用芯片的增长动能并不均衡。以逻辑处理器及高端存储器为代表的高性能计算（HPC）芯片，增速明显高于微控制器（MCU）等传统组件，凸显产业价值正快速向支撑电动化与智能化的核心技术领域聚集。数据显示，2025年全球电动车（含纯电BEV、插混PHE

2025-12-19 11:37:00

335

京东武汉独栋“小哥之家”首批用户免租金入住，面向全职骑手和快递员 12月18日消息，据京东黑板报报道，近日，坐落于武汉武昌区中南路的一栋四层单元楼迎来新住户——京东快递员与外卖骑手已陆续入住。这是京东在武汉正式启用的首个独栋式“小哥之家”，采用整栋租赁模式，无偿为一线京东快递小哥及京东全职骑手提供居住保障。据官方信息显示，该“小哥之家”区位优势明显，可高效辐射周边多个京东配送站点。武汉“小哥之家”项目负责人介绍，整栋楼宇由京东统一承租后，面向周边站点有实际住宿需求的全职骑手和快递员开放申请，符合条件者最快当天即可完成入住手续。据了解，每间宿舍均配备独立卫生间且

2025-12-19 11:36:07

445

传蓝猫资本退出百亿美元资料中心投资甲骨文股价一度跌逾 5% 甲骨文（Oracle）股价今日（12月18日）盘中下挫约5%，导火索系《金融时报》报道称，另类资产管理机构BlueOwlCapital已终止就甲骨文位于美国密歇根州SalineTownship的100亿美元AI数据中心项目的融资合作谈判。尽管甲骨文随后迅速发布声明予以否认，并强调该项目正按既定时间表稳步推进，但市场情绪未见明显修复，反而带动一众AI基础设施相关股票集体回调。据《金融时报》援引多位知情人士消息，BlueOwl原本确有参与评估为该拟建1GW超大规模数据中心提供资金支持，但最终因顾虑甲

2025-12-19 11:23:11

703

中国气象局：到 2035 年建成自主可控、国际先进的地球系统预报体系感谢网友若怡的线索提供！12月18日，中国气象局召开专题新闻发布会，正式对外发布《地球系统预报发展战略（2025—2035年）》。该战略立足新阶段气象高质量发展需求，面向全球科技前沿与国家重大战略，系统擘画未来十年地球系统预报能力建设路径。《战略》明确八大核心任务：一、加快构建多圈层耦合的地球系统数值模式，全面提升对大气、海洋、陆面、冰冻圈和生物圈相互作用的刻画能力；二、聚焦气象人工智能前沿方向，研发具有自主知识产权的智能预报模型，支撑天气—气候一体化智能预测；三、深化数值预报与人工智能融合创

2025-12-19 11:15:01

398

相关专题

更多>

热门推荐

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部