苹果公司与俄亥俄州立大学研究团队联合发布了名为fs-dfm(few-step discrete flow-matching)的全新语言模型。该模型在长文本生成方面取得了显著进展,通过创新的三步优化策略改进了迭代过程,使其在困惑度和熵等核心评估指标上超越了多个大型主流模型。
生成效率实现飞跃
FS-DFM仅需8轮快速迭代即可完成高质量长文本的生成,相较于传统扩散模型,其生成速度提升了128倍,极大缓解了长文本生成中的延迟问题。
小模型展现强性能
尽管参数规模仅为1.7亿至17亿,FS-DFM在文本流畅性与准确性(以低困惑度衡量)以及选词稳定性(以稳定熵值衡量)方面均优于参数量达70亿的Dream模型和80亿的LLaDA模型,真正实现了“轻量高效、效果出众”。
核心技术亮点

详情:https://www.php.cn/link/2990a21222c7eeb833f2fdf82aacf400
以上就是苹果发布全新 FS-DFM 模型,提升长文本生成效率的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号