讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

MiniMax 开源视觉分词器扩展技术 VTP

花韻仙語

发布： 2025-12-23 20:11:12

原创

204人浏览过

minimax 联合华中科技大学首次对外开源其视觉生成核心技术——vtp（visual tokenizer pretraining，视觉分词器预训练）。该技术在不改动标准dit架构的前提下，仅通过对视觉分词器（visual tokenizers）进行扩展与优化，便实现了高达 65.8% 的端到端生成性能提升。

MiniMax 开源视觉分词器扩展技术 VTP

区别于多数分词器相关研究，VTP 的设计理念强调“零侵入”：它完全不干预下游主干模型（如 DiT）的训练流程，所有改进均集中在前置的 tokenizer 模块上，从而以极低耦合代价达成生成质量的显著跃升。

VTP 预训练范式如下：

MiniMax 开源视觉分词器扩展技术 VTP

超能文献

超能文献

超能文献是一款革命性的AI驱动医学文献搜索引擎。

超能文献

123

超能文献

简言之——VTP 首次在理论上与实践中建立起 latent 表示的易学性（learnability）与通用表征能力之间的强关联，进而将 tokenizer 推至模型缩放（scaling）舞台的中心。它不仅展现出清晰、稳健的 scaling 规律，更指明了一条独立于主模型参数增长之外的全新性能提升路径：即通过 tokenizer 自身的规模化设计与训练，驱动整个生成系统的持续进化。

代码仓库：https://www.php.cn/link/af5ac7432f2b60611a2b2081da85bdc0
论文地址：https://www.php.cn/link/2c144615541213bbe63e9d81c4727883

源码下载：点击获取

以上就是MiniMax 开源视觉分词器扩展技术 VTP的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git github ai 区别架构 github https

大家都在看：

用数据照亮成长之路：PandaCoder Git 统计工具窗口 Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法 JetBrains 宣布 DataGrip 面向非商业用途免费 Linus 对 Git 提交信息中“Link:”标签被滥用表达不满开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：清华大学与 OpenBMB 提出“H-Neurons”：LLM 幻觉相关神经元的存在、作用及其起源下一篇：没有了

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

《自然法则》游戏各功能作用一览

2025-12-21 10:48:18
《乐划锁屏》添加壁纸方法

2025-12-21 10:48:24
qq音乐泡泡是什么

2025-12-21 10:49:23
徐静雨参与《影之刃零》醉剑动捕动作很喜感

2025-12-21 11:38:25
IGN年度最佳游戏终于公开！你认为《光与影：33号远征队》是否实至名归？

2025-12-21 11:48:18
《战斗锻造师》公布最新预告片展示实机游戏画面

2025-12-21 11:57:09
B社《星空》2.0真要来了！游戏引擎大曝光

2025-12-21 12:22:02
游戏记者吐槽TGA在舔好莱坞：颁奖城市为啥固定不变？

2025-12-21 12:30:02
IGN年度游戏公布！25届获奖游戏汇总：你是否认可？

2025-12-21 12:49:00
这还是B社吗？《老滚5》NS2版重大问题火速修复

2025-12-21 14:10:02

最新问题

OpenAI 警示：AI 浏览器恐难完全摆脱提示注入风险 OpenAI近日公开表示，具备代理（Agent）功能的AI浏览器在架构层面难以根除“提示注入”（promptinjection）攻击隐患。即便不断升级防护机制，该问题仍被定性为一项需长期应对的安全挑战，而非可通过单一技术手段彻底“攻克”的缺陷。为此，公司正加快安全补丁发布频率，并依托大规模自动化攻防对抗实验，在真实攻击发生前主动挖掘Atlas浏览器中潜藏的薄弱环节。今年10月，OpenAI正式将AtlasAI浏览器集成进ChatGPT后，安全研究人员迅速验证：仅需在Googl

2025-12-23 19:11:02

635

Steam 客户端将全面转向 64 位 Valve近日推出了Steam客户端的新版本更新，此次更新中引入了若干针对仍在运行32位Windows系统用户的调整。在Windows11及64位版Windows10上，Steam客户端现已全面升级为64位架构。而继续使用32位Windows系统的用户，仍将可获得32位Steam客户端的维护更新，该支持将持续至2026年1月1日。本次调整仅适用于Windows10用户，因其是目前唯一仍提供32位版本支持的Windows操作系统。

2025-12-23 18:54:02

208

谷歌成立算力分配委员会，应对内部资源短缺据TheInformation报道，谷歌目前正遭遇显著的计算资源紧缺问题。随着人工智能模型训练规模持续攀升、GoogleCloud业务加速扩张，以及搜索、广告等关键服务长期占据大量算力，公司内部对计算能力的需求呈现集中式激增，而现有基础设施已难以全面支撑。报道分析指出，这一困境部分源于此前一段时期内资本支出趋于审慎。尽管谷歌已明确将大幅增加在数据中心及自研芯片领域的投入，预计本年度资本开支将提升至约910亿至930亿美元区间，但新建算力设施从规划、建设到实际投产需经历较长周期，短期内仍难

2025-12-23 18:40:03

774

ChatGPT 上线“年终回顾”功能 OpenAI正式推出ChatGPT全新功能——“YourYearwithChatGPT”（你的ChatGPT年度回顾），该功能依托用户全年交互数据，自动生成一份专属的AI使用档案。内容涵盖多维度行为分析、AI生成的视觉化记忆图谱，以及富有趣味性的个性化人格徽章，帮助用户更清晰地洞察自身与AI的互动轨迹，同时提升社交传播的吸引力与参与感。目前该功能已在部分英语国家率先上线，覆盖美国、加拿大、英国、澳大利亚及新西兰等地，并面向满足条件的免费用户、Plus订阅用户及Pro用户开放

2025-12-23 18:35:00

310

Quest Mobile 发布 AI 应用周活排行榜研究机构QuestMobile最新发布的《2025下半年AI应用交互革新与生态落地报告》指出，在当前全市场AI原生App中，最新一周活跃用户数排名前四的应用分别为豆包、DeepSeek、元宝与蚂蚁阿福，阿里千问位居第五；而蚂蚁集团于11月推出的通用型AI助手“灵光”，成功跻身前十。据QuestMobile榜单数据，在12月8日至12月14日这一最新统计周期内，周活跃用户规模位列Top10的AI类App中，通用型AI占据6席，垂直领域专业型AI占4席，呈现出通用与垂类双轨并进、势均力敌的竞争态势。

2025-12-23 18:32:02

911

钉钉发布企业级 AI 硬件 DingTalk Real 在AI钉钉1.1新品发布暨生态大会上，钉钉正式推出面向企业的AI硬件新品——DingTalkReal。官方说明指出：“这并非传统意义上的智能终端，而是我们专为构建企业级Agent所设计的全新硬件载体。它不是为人服务的设备，而是为Agent而生。我们日常使用的手机、电脑、平板等终端，本质上都是围绕‘人’来设计的交互工具；而DingTalkReal，则是首个真正以‘Agent’为核心运行对象的企业级专用终端。”据钉钉创始人兼CEO陈航现场介绍，DingTalkReal是一款基

2025-12-23 18:26:02

426

生数科技联合清华发布并开源视频生成加速框架 TurboDiffusion 近日，生数科技携手清华大学TSAIL实验室共同推出并开源一款面向视频生成任务的高效推理加速框架——TurboDiffusion。开源地址：https://github.com/thu-ml/TurboDiffusion官方信息显示，在几乎不牺牲视觉保真度与内容连贯性的前提下，该框架可达成最高达200倍的视频生成推理速度提升。TurboDiffusion的核心技术突破，精准切中当前视频生成技术演进的关键瓶颈。尽管扩散模型在视频创作领域展现出卓越的表征与生成能力，但长期受限于高昂的计算开销与缓慢的推

2025-12-23 18:13:02

221

塔塔电子将在印度为罗姆提供后端封测服务，双方结成战略合作伙伴 12月23日消息，日本半导体厂商ROHM（罗姆）于当地时间昨日宣布，已与印度塔塔电子（TataElectronics）正式建立战略合作伙伴关系，共同推进在印度本土的半导体制造布局，服务印度及全球市场。双方将充分发挥罗姆在功率半导体器件领域的核心技术优势，以及塔塔电子在后端封装与测试环节的先进能力，携手构建面向功率半导体的本地化制造体系；同时，依托双方在销售通路与渠道资源上的协同整合，该合作有望在印度市场催生全新业务增长点，并为终端客户带来更具竞争力与更高附加值的整体解决方案。本次合作的首个落地项

2025-12-23 17:45:09

656

消息称英国考虑效仿澳大利亚，禁止 16 岁以下儿童使用社交媒体 12月23日消息，据《每日电讯报》（TheTelegraph）报道，英国首相基尔·斯塔默正评估借鉴澳大利亚的做法，拟对16岁以下未成年人实施社交媒体使用禁令。据悉，斯塔默办公室当前正“高度关注”这一面向未成年人的社交平台限制政策。尽管首相此前公开表态称，他个人并不支持对青少年实行一刀切式的全面封禁。值得关注的是，12月10日，澳大利亚正式成为全球首个在全国范围内推行16岁以下人群禁止使用社交媒体的国家。报道指出，斯塔默正与科技大臣利兹·肯德尔就该议题进行深入磋商；若澳大利亚的实践被证实具备显著成

2025-12-23 17:44:03

813

美政府封禁外国无人机引发愤怒，飞手称中国无人机无法替代北京时间12月23日，据《华尔街日报》消息，美国政府于周一正式宣布，将全面禁止进口及销售绝大多数境外生产的新款无人机。此举迅速激起美国本土无人机操作员群体的强烈抗议，他们普遍担忧自身职业生存将受到严重冲击。在众多飞手看来，当前美国本土制造的无人机产品缺乏市场竞争力，根本无法填补中国无人机退出后留下的巨大空白。目前，大疆无人机在美国市场占据绝对主导地位。数据显示，全美已有近50万名持证商用无人机驾驶员完成注册。而美国联邦通信委员会（FCC）最新发布的针对外国产无人机的限制令，已引发其中大量从业者的

2025-12-23 17:28:02

389

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

21319次学习
收藏
Git版本控制工具

14906次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部