中科院推出类脑大模型 SpikingBrain:以2% 数据实现百倍速度突破-IT新闻-PHP中文网

中科院推出类脑大模型 SpikingBrain:以2% 数据实现百倍速度突破

冷炫風刃

发布： 2025-09-23 17:11:29

原创

527人浏览过

近日，中国科学院自动化研究所李国齐与徐波领衔的科研团队正式推出全球首个大规模类脑脉冲大模型——spikingbrain1.0。该模型在处理超长文本方面表现卓越，能够以超过现有主流 transformer 模型百余倍的速度完成400万 token 的文本处理任务，同时仅需其2%的训练数据量。

中科院推出类脑大模型 SpikingBrain:以2% 数据实现百倍速度突破

目前广泛应用的大语言模型，如GPT系列，大多依赖于Transformer架构。尽管其自注意力机制具备强大的语义捕捉能力，但随之而来的高计算复杂度成为显著瓶颈。当输入文本长度增加时，计算开销呈平方级增长，导致处理长文档时效率低下、能耗剧增，严重制约了AI在法律文件、学术论文或长篇文学作品等场景中的应用潜力。

为突破这一限制，研究团队转向自然界最高效的智能系统——人脑。大脑拥有约千亿神经元，却仅消耗约20瓦的功率。受此启发，团队提出“基于内生复杂性”的设计思想，致力于提升单个计算单元的智能化水平与运行效率。

SpikingBrain 模型模拟了生物神经元的脉冲放电行为，推出了两个版本：SpikingBrain-7B（70亿参数）和 SpikingBrain-76B（760亿参数）。首先，模型摒弃了传统Transformer中计算代价高昂的二次复杂度自注意力机制，转而采用创新的“混合线性注意力架构”，将整体计算复杂度压缩至线性级别 O(n)，极大提升了对长序列的处理速度。

其次，模型引入“自适应阈值脉冲神经元”机制，神经元是否触发脉冲取决于输入信号的累积强度，并通过动态调节激活阈值，确保网络始终处于高效工作状态。这种事件驱动的计算方式大幅减少了无效运算，实现了高达69.15%的计算稀疏度，显著降低能耗。