Granite 4.0 Tiny Preview— IBM推出的语言模型

霞舞
发布: 2025-05-08 15:12:20
原创
535人浏览过

granite 4.0 tiny preview 是 ibm 发布的 granite 4.0 语言模型系列中最小的模型的预览版本。该模型以其高效的计算能力和紧凑的结构为特色,能够在消费级 gpu 上运行多个长上下文(128k)任务,其性能接近 granite 3.3 2b instruct,同时内存需求减少了约 72%。granite 4.0 tiny preview 采用创新的混合 mamba-2/transformer 架构,结合了 mamba 的高效性和 transformer 的精确性,支持无位置编码(nope),能够处理极长的上下文长度。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Granite 4.0 Tiny Preview— IBM推出的语言模型

Granite 4.0 Tiny Preview 的主要功能包括:

  • 高效运行:在消费级 GPU 上,能够同时运行多个长上下文(128K)任务,适合资源有限的开发者。
  • 低内存需求:内存需求减少约 72%,推理时仅激活 1B 参数(总参数 7B),大幅降低硬件要求。
  • 长上下文处理:支持无位置编码(NoPE),已验证能处理至少 128K 的长上下文。
  • 推理效率:推理时仅激活部分专家,提升效率、减少延迟。

Granite 4.0 Tiny Preview 的技术原理包括:

百川大模型
百川大模型

百川智能公司推出的一系列大型语言模型产品

百川大模型 62
查看详情 百川大模型
  • 混合架构:结合 Mamba 的线性计算复杂度(适合长序列)和 Transformer 的精确自注意力机制。模型中 9 个 Mamba 块对应 1 个 Transformer 块,Mamba 块负责高效捕获全局上下文,Transformer 块用于解析局部上下文。
  • 混合专家(MoE):模型包含 7B 参数,分为 64 个专家,推理时仅激活 1B 参数,大幅减少计算资源消耗。
  • 无位置编码(NoPE):摒弃传统的位置编码技术,避免因位置编码带来的计算负担和对长序列的限制,保持长上下文性能。
  • 长上下文优化:基于 Mamba 的线性扩展能力和紧凑的模型设计,支持极长上下文长度,理论上能扩展至硬件极限。

Granite 4.0 Tiny Preview 的项目地址包括:

Granite 4.0 Tiny Preview 的应用场景包括:

  • 边缘设备部署:适合在资源有限的边缘设备或消费级硬件上运行,用于轻量级文本处理任务。
  • 长文本分析:能够处理长上下文(128K tokens),适用于长文本生成、分析或摘要。
  • 多任务并行:在同一硬件上同时运行多个实例,适合批量处理或多用户场景。
  • 企业应用开发:用于智能客服、文档处理等企业级任务,提供高效的语言模型支持。
  • 低成本研发:开源且支持消费级硬件,方便开发者低成本实验和创新。

以上就是Granite 4.0 Tiny Preview— IBM推出的语言模型的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
热门推荐
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号