10月23日,大型科学研究中的高性能计算因其对极高吞吐量的需求,始终依赖超级计算机的支持,而如何高效优化这类系统也成了一项关键课题。
以分子量子行为模拟为例,随着粒子数量增加,相互作用的状态数呈指数级增长。目前主要有两种应对思路:一是使用量子计算机——但技术尚不成熟;二是通过简化模型来适配现有超算——然而复杂体系下精度难以保证。
近日,来自中国“神威”团队的科研人员另辟蹊径,成功将AI技术与现有的“海光lite”(Oceanlite)超级计算机深度融合,首次在真实分子尺度上实现了复杂的量子化学建模运算。
这一成果不仅推动了基础科学的发展,也在工程技术层面实现了重要突破。
在量子力学中,描述系统状态的核心是波函数(Ψ),它包含了分子内电子等粒子所有可能的位置、自旋和能级信息及其概率分布。
但由于量子态的空间维度随粒子数呈指数爆炸式增长,传统超级计算机很快就会遭遇算力瓶颈,几乎无法精确求解。
为此,科学家长期依赖各种近似方法来简化薛定谔方程,在控制计算成本的同时保留必要的物理精度。然而这些基于波函数的传统近似手段通常仅适用于小规模分子体系。
为突破这一限制,研究人员开始探索利用现代机器学习技术,特别是神经网络量子态(NNQS)模型,来逼近多体电子系统的全构型空间,从而研究具有强关联效应的复杂量子系统——例如包含数十个电子、超过100个自旋轨道的大分子。
这种方法有望融合人工智能的强大表达能力与量子理论的高精度要求,拓展可研究体系的边界。
此次,“神威”团队自主研发了一套高效的NNQS框架,通过训练深度神经网络来拟合分子的波函数,进而预测电子最可能出现的空间分布。
在模拟过程中,系统对每一种采样的电子排布计算其局部能量,并持续调整神经网络参数,直到输出结果与真实分子的量子能量特征高度一致。
该NNQS框架专为中国的“海光lite”超级计算机定制开发,该平台搭载了拥有384核心的申威SW26010-Pro处理器,支持FP16半精度、FP32单精度及FP64双精度浮点运算,具备百亿亿次级别的峰值算力。
不过,这款架构主要面向高性能科学计算(HPC),并未针对AI任务进行专门优化,因此在部署AI模型时面临通信效率低、数据流管理复杂等问题。
为此,研究团队设计了一种创新的分层通信机制:由主控核心统一协调节点间的数据交换,同时调度数百万个轻量级双路计算处理单元(CPE)并行执行局部量子计算任务。每个CPE均配备512位向量处理引擎,极大提升了底层计算效率。
同时,团队还引入了动态负载均衡算法,有效缓解因任务分配不均导致的部分核心空转问题,显著提高了整体资源利用率。
最终,该程序在高达3700万个CPE核心上稳定运行,展现出92%的强扩展效率和98%的弱扩展效率,实现了近乎极致的软硬件协同性能,标志着我国在超大规模并行计算领域迈出了关键一步。
截至目前,这项针对包含120个自旋轨道的分子系统的模拟,已成为全球范围内在传统超级计算机上完成的最大规模AI驱动量子化学计算案例,彰显了中国在人工智能与量子科技交叉领域的领先实力。

以上就是3700万核心+AI!中国百亿亿次超算实现分子尺度的量子化学建模的详细内容,更多请关注php中文网其它相关文章!
 
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
 
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号