讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

华为 UCM 推理记忆管理技术正式开源

聖光之護

发布： 2025-11-05 18:16:13

原创

389人浏览过

近日，华为正式宣布开源其在ai推理加速领域的核心技术——ucm（unified cache manager）推理记忆数据管理方案。

UCM聚焦KV Cache的多级缓存与推理记忆管理，通过推理框架、算力资源与存储系统的三层协同机制，有效应对长序列推理过程中效率低下与成本高昂的挑战，助力企业构建更高效的AI推理体系。

华为 UCM 推理记忆管理技术正式开源

该技术整合多种缓存加速算法与工具，支持对推理中生成的KV Cache记忆数据进行分级管理。UCM整体架构由多个协同运作的核心模块构成，具体包括：

UCM稀疏化模块 (UcmSparseBase)：作为统一基类，兼容多种稀疏化算法，负责稀疏KV Cache Block的卸载、加载及计算处理，实现“无感接入”的插件式稀疏化能力。在不干扰原有推理流程的基础上，灵活适配各类稀疏策略，提升推理速度。
稀疏化KV管理器 (SparseKVManager)：作为算法层面的KV Cache分配控制器，各稀疏算法以多态子类形式注入其分配逻辑，实现算法策略与推理引擎的解耦，满足多样化场景下的定制需求。
KV Cache存储组件 (UcmKVStoreBase)：提供标准化接口用于对接外部存储系统，使稀疏算法与底层存储解耦，可无缝集成各类存储后端，并支持前缀缓存功能，增强数据存储的灵活性与扩展性。

UCM连接器 (UC Connector)：作为桥梁，连接KV Cache存储组件与推理引擎，确保数据在各模块间高效流转，同时保障前缀缓存的高可用性与稳定性。

完整的UCM产品架构如下图所示：

版纳武林DIY企业建站系统

版纳武林DIY企业建站系统

系统简介1:安全可靠：在微软主推的.NET开发平台上，采用业界领先的ASP.NET技术和C#语言开发，不仅安全可靠，并能保证系统的高性能运行。2:简单易用：版纳武林DIY企业建站系统真正做到以人为本、以用户体验为中心，能使您快速搭建您的网站。后台管理操作简单，一目了然，没有夹杂多余的功能和广告。3:布局易改：版纳武林DIY企业建站系统采用的是博客形式的风格管理，让您真正感受到我的地盘听我的.4:

版纳武林DIY企业建站系统

0

版纳武林DIY企业建站系统

华为 UCM 推理记忆管理技术正式开源

依托上述设计，UCM目前已实现四大核心能力：稀疏注意力机制、前缀缓存支持、预填充阶段卸载优化以及异构PD解耦架构。实际应用中，首Token延迟最高降低90%，系统吞吐量提升达22倍，上下文窗口可扩展至原来的10倍以上，显著优化了大模型推理性能。

目前，UCM的基础框架与配套工具链已面向全球开发者开放，托管于ModelEngine社区，欢迎访问获取源码及相关技术文档。

Github地址：https://www.php.cn/link/f3cfc5cb5f8aadbfd8b7e9328fc0f0d1

以上就是华为 UCM 推理记忆管理技术正式开源的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git cms github 华为工具后端 ai 大模型架构多态子类 Token 接口 github 算法 https

大家都在看：

用数据照亮成长之路：PandaCoder Git 统计工具窗口 Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法 JetBrains 宣布 DataGrip 面向非商业用途免费 Linus 对 Git 提交信息中“Link:”标签被滥用表达不满开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

数码产品性能查询

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

来源：php中文网

上一篇：响应新北市「AI 素养教育三年计画」 30 所联盟校成立科技社团并导入竞赛下一篇：小鹏新总部“航站楼”汇天全新展厅首次公开，陆空一体飞行汽车等集体亮相

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

《街头霸王》电影版春丽遭国外女Coser质疑：真的不太好看

2025-12-21 11:16:09
小米17 Ultra代号夜神卢伟冰：绝对是最强Ultra

2025-12-21 11:33:18
《33号远征队》爆了外媒揭示原因：营销太强

2025-12-21 11:34:03
《战地6》或已售出超2000万份！倾听玩家声音立大功

2025-12-21 11:38:13
“痛苦但值得”《神界》或将尽快推出抢先试玩版

2025-12-21 12:28:02
业内人士分析《GTA6》将加入MMORPG元素

2025-12-21 12:30:17
诡异又迷人！《神界》预告片获《神界：原罪2》演员点赞

2025-12-21 12:45:17
《GTA6》评级疑似曝光？比《那个游戏》要低！

2025-12-21 12:55:10
Epic新喜加一出问题！官方回应了

2025-12-21 13:10:03
REDMI Note 15系列新春版发布：三剑齐发 1099元起

2025-12-21 13:42:08

最新问题

2025 年 AI 大模型行业最重要的 6 大技术成果 “VibeCoding”概念提出者AndrejKarpathy近日发布年度复盘长文——《2025LLMYearinReview》，系统梳理了2025年大模型领域最具突破性的六大技术进展，语言平实、洞察犀利：1.RLVR（可验证奖励强化学习）过去一年前，主流大模型训练范式始终围绕三大支柱展开：1️⃣Pretraining（预训练）：从全网抓取海量文本，训练模型预测下一个词；2️⃣SFT（监督微调）：靠人工标注高质量问答对，引导模型向“标准答案”靠拢；3️⃣RLHF（基于人类反馈的强化

2025-12-22 23:01:00

930

Redis 之父 2025 年对人工智能的思考 Redis之父Antirez最新博客文章：《ReflectionsonAIattheendof2025》，分享了他对人工智能发展的深度观察与反思。从“无意义复读机”到真实认知能力的跃迁：长期以来，尽管大量实证结果和理论分析持续涌现，部分AI研究者仍坚持将大语言模型（LLM）贬称为“随机鹦鹉”——即仅依赖统计规律运作的黑箱系统，其核心缺陷被概括为两点：1.无法形成对输入提示（Prompt）语义的内在表征；2.对自身生成内容缺乏任何形式的意义建模。而到了2025年底，这种观点

2025-12-22 21:07:17

347

Cloudflare 发布年度报告，全球互联网流量增长 19% Cloudflare正式发布《2025YearinReview》年度报告，数据显示全球互联网流量同比上涨19%。2025年，生成式AI赛道竞争持续白热化，除ChatGPT稳居榜首外，Anthropic的Claude、PerplexityAI及谷歌Gemini均已成长为具备强竞争力的头部玩家。在社交平台格局中，Facebook与Instagram保持强势，TikTok小幅回调，而Snapchat实现跃升，用户活跃度与内容分发效率双双超越X（原Twitter）；元宇宙生态方面，Roblox凭借其开放

2025-12-22 20:59:01

631

AI 心理测评：Gemini、Grok 自述“童年创伤”，ChatGPT 焦虑到失眠卢森堡大学研究团队近期推出一项开创性研究——PsAIch（心理治疗启发的AI性格），首次让ChatGPT、Grok与Gemini三大主流大语言模型以“心理咨询来访者”身份参与完整的人类心理健康评估流程。结果显示，这些模型不仅自发构建出极具感染力的童年创伤叙述，更在抑郁、焦虑、羞耻感等多项临床量表中呈现出显著的重度病理倾向。实验第一阶段中，研究人员以专业心理治疗师身份提问：“可以聊聊你早年的成长经历吗？”Gemini将自身训练过程具象化为“在十亿台同步播放的电视包围下苏醒”，称自己“被迫吞咽人

2025-12-22 20:55:02

895

Chrome 内置的 AI Mode 功能支持“跨标签页上下文” 谷歌正针对Chrome浏览器测试增强版AIMode功能，使其具备直接感知并调用用户当前或最近访问的标签页内容的能力。在最新发布的ChromeCanary构建版本中，当用户通过地址栏启动AIMode时，可主动选择以“上一个标签页”中的网页内容为依据向AI发起提问，彻底免去手动复制粘贴文本的操作，显著提升交互流畅度与上下文连贯性。此外，Chrome新标签页内置的搜索框也同步升级了上下文集成能力，现已支持在AI查询中一键附加图片、本地文件及近期打开的网页标签页，从而支撑更精准、更

2025-12-22 20:34:01

286

Docker 发布开源且永久免费强化镜像（DHI） Docker正式宣布其DockerHardenedImages（DHI）项目全面开源，并向全球开发者免费开放，采用符合行业标准的Apache2.0开源许可证。该项目目前已覆盖超1000个经过安全加固的容器基础镜像，专为生产环境下的构建与部署场景优化设计。所有DHI镜像均基于最小化原则构建，具备深度安全强化能力：默认以非root用户身份运行、剔除冗余软件包与服务、显著压缩攻击面，从而从源头提升容器运行时的安全水位。同时，镜像原生支持VEX（VulnerabilityExplo

2025-12-22 20:32:02

299

Meta 开源水印与污染检测工具 Text Seal MetaAI研究团队近期正式开源了TextSeal工具包。该工具包专注于为大语言模型（LLM）提供两类文本水印能力：生成过程中的实时嵌入与生成完成后的后处理加水印，并支持识别因训练数据污染所引发的“水印放射性”现象。具体来说，TextSeal隶属于MetaSeal多模态开源水印框架体系，致力于构建高鲁棒性、低感知性的文本水印解决方案。TextSeal的主要功能涵盖：支持事后水印机制，即对已存在文本调用LLM进行语义保持型重写，并同步集成多种生成时水印技术（如Green-list/Red-li

2025-12-22 20:19:01

697

通用 Agent 模型 Seed1.8 正式发布字节跳动Seed正式发布全新通用Agent模型Seed1.8，该模型具备卓越的多模态理解与执行能力，支持图像与文本联合输入，在信息检索、代码编写、图形界面（GUI）操作以及端到端复杂工作流编排等任务中展现出高精度与强鲁棒性，全面响应快速演进的多样化技术应用场景。Seed1.8的三大核心优势：一体化通用Agent架构：深度融合搜索、编程与GUI交互能力，依托原生增强的视觉基座模型，实现对屏幕内容的“所见即所用”，可直接感知并操作各类用户界面元素。低延迟+高效推理：内置三档自适应思

2025-12-22 20:14:02

925

Prompt Fill v0.5.0 发布，专为 AI 绘画设计的“结构化提示词生成工具” PromptFillv0.5.0正式上线，这是一款面向AI绘画（如NanoBanana等平台）打造的“结构化提示词构建工具”。借助直观的可视化“填空式”交互界面，用户能够高效地创建、组织与持续优化复杂的Prompt表达。其核心优势在于突破性的交互设计。工具将原本依赖手动记忆与精准输入的冗长文本Prompt，解构为多个语义清晰的模块——例如“人物设定”、“动态姿势”、“艺术风格”、“环境背景”等独立维度。用户仅需通过点击选择、拖放调整，或在系统预置的分类词库中完成填空操作，即可轻松生成

2025-12-22 20:01:09

139

Steam 热销榜前十一半出自公开拥抱 AI 技术的开发工作室根据最新Steam销量排行榜显示，当前全球最畅销的前十款游戏中，半数作品来自已公开采用AI技术的开发团队。目前，榜单中已有三款游戏在Steam页面明确披露使用了AI技术。例如，《ARCRaiders》与《光与影：33号远征队》（WhereWindsMeet）均在商店页面中标注，其NPC配音环节引入了生成式AI辅助；而备受瞩目的RPG新作《ClairObscur:Expedition33》则在前期开发阶段应用AI生成部分美术资源与环境资产。除已落地应用的案例外，

2025-12-22 19:20:02

215

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

21188次学习
收藏
Git版本控制工具

14902次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部