科大讯飞最近推出了两款开源大模型:星火化学大模型 spark chemistry-x1-13b 与文生音频模型 audiofly,旨在推动化学前沿研究及声音生成技术的发展与应用探索。
Spark Chemistry-X1-13B 基于星火 X1 大模型底座打造,专为化学领域任务进行了深度优化。该模型融合了快慢思考机制,并创新性地引入解耦注意力掩码技术,在化学知识问答、分子结构解析、性质预测等关键任务中表现优异,显著超越主流通用大模型,为化学AI和跨学科研究提供了强有力的技术支撑。

核心优势
双模推理架构:结合链式思维(CoT)与双过程理论,构建统一框架,支持快速反应与深度推理两种模式
稳定混合训练:通过创新的注意力掩码策略,实现不同推理路径训练过程的分离,避免数据分布干扰,提升训练稳定性
专业化学优化:针对以下典型场景进行多阶段精细化调优:
AudioFly 是一款基于文本生成音频的生成式模型,能够依据文字描述合成高保真音效,输出采样率达 44.1 kHz,音质清晰且语义对齐度高。
该模型采用潜在扩散架构,参数量达十亿级别,并在大规模、多样化的音频文本数据集上完成训练,涵盖 AudioSet、AudioCaps、TUT 等公开数据集以及丰富的内部专有数据。无论是单一声音事件还是复杂多事件场景,AudioFly 均能生成准确贴合描述内容的音频。在 AudioCaps 基准测试中,其表现已超越此前主流音频生成模型。

开源地址:
https://www.php.cn/link/5e5c6be7a4b64ead7fe95a284e013e18
https://www.php.cn/link/ac4e368758b1e4e2b89f45b7554ac7ab
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号