首页 > 新闻 > IT新闻 > 正文

AI21 开源迷你语言模型 Jamba Reasoning3B

DDD
发布: 2025-10-09 16:39:12
原创
643人浏览过

ai21 labs 最近发布了其最新开源的小型语言模型 —— jamba reasoning3b。这款被称作“迷你语言模型”的系统专为在本地设备上运行人工智能任务而设计。作为该公司在特拉维夫研发的 jamba 系列的最新成果,jamba reasoning3b 采用开放许可的 apache 2.0 协议发布,便于广泛使用与二次开发。

不同于主流的大型语言模型(LLM),Jamba Reasoning3B 基于 AI21 自主研发的混合架构,融合了状态空间模型(SSM)与 Transformer 技术。状态空间模型是一种擅长处理序列数据的深度学习方法,在特定场景下比传统 Transformer 更高效,能够通过当前状态推断下一状态。其中,Mamba 是一种典型的 SSM 架构,构成了 Jamba 模型的核心组成部分之一。

AI21 开源迷你语言模型 Jamba Reasoning3B

该模型具备高达 256,000 token 的上下文窗口,最大可处理多达 1,000,000 token 的输入,在推理能力方面媲美 Anthropic 的 Claude、Google 的 Gemini 和 Meta 的 Llama 等大型模型,却能在 iPhone、Android 手机、Mac 及普通 PC 等资源受限的终端设备上流畅运行。

Futurum Group 分析师 Brad Shimmin 表示,他长期看好状态空间模型的发展潜力。他认为,尽管这一概念在业内已有多年历史,但直到近期才真正实现工程上的突破。随着技术进步,SSM 架构展现出更强的可扩展性和更高的运算速度,正逐步成为替代传统注意力机制的可行方案。

云雀语言模型
云雀语言模型

云雀是一款由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效的完成互动对话

云雀语言模型54
查看详情 云雀语言模型

这类 SSM 模型利用绳索缩放(rope scaling)技术优化注意力机制,能够在降低计算开销的同时更有效地聚焦关键信息。尽管 AI21 在生成式 AI 领域规模相对较小,但凭借 Google 和 AI 芯片领导者 Nvidia 的战略支持,以及自 2017 年以来累计超 6 亿美元的融资,公司已具备构建完整生态的能力,有望通过开源模型 Jamba Reasoning3B 推动商业化落地。

发布会上,AI21 展示了 Jamba 模型在多个权威基准测试中的优异表现,包括 IFBench、MMLU-Pro 和 Humanity's Last Exam,结果显示其性能超越了阿里巴巴 Qwen3.4B、Google Gemma3.4B、Meta Llama3.23B、IBM Granite4.0Micro 以及微软 Phi-4Mini 等知名开源大模型。

Shimmin 强调,该模型在企业级应用中具有巨大潜力,尤其得益于其对检索增强生成(RAG)的支持,企业可以基于私有数据进行定制化部署,同时保障数据隐私与安全。他举例指出,客户服务中心是一个极具前景的应用场景:借助模型强大的推理能力,系统可自动分析客户投诉内容,判断问题复杂度,并决定是否需转交人工或升级至更高阶模型处理。

以上就是AI21 开源迷你语言模型 Jamba Reasoning3B的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号