长期以来,在科学计算这一关键领域,核心软件与硬件大多依赖国外生态体系。这一现状,不仅在性能优化上存在掣肘,也让国产科研面临“算力不可控”的现实挑战。如何让国产软件在国产硬件上高效运行,构建真正自主可控的科学计算生态,成为科研界与产业界共同关注的焦点课题。
最近,国产开源密度泛函理论软件——原子算筹(ABACUS)发布了最新迭代版 v3.9.0.14和v3.9.0.15。值得关注的是,在这些更新中,沐曦科学计算团队首次以开发者身份正式加入 ABACUS 社区。
这不仅是一项功能优化的升级,更是国产 GPGPU 与国产科学计算软件深度融合的重要体现,标志着国产算力生态正在走向新的发展阶段。数字化转型网www.szhzxw.cn
一、沐曦 —— 赋能科学计算的国产 GPGPU
沐曦专注于高性能通用 GPU(GPGPU)的研发,致力于打造完整、自主可控的国产科学计算生态。在软件生态层面,沐曦推出了兼容国际主流GPU软件生态的MXMACA 软件栈:
兼容国际主流GPU软件生态
使原代码应用能够轻松在沐曦GPGPU 上运行,为国产科学计算软件的迁移和适配提供便利。
自研高性能数学库
包括mcBLAS、mcFFT等,为科学计算提供核心算力保障。
AI4Science支撑
依托MXMACA,在AI4Materials领域,沐曦已覆盖从第一性原理计算、分子动力学到 AI 融合的材料科学应用场景,为 AI4Materials 提供全面支持。
凭借出色的软件生态兼容性与深厚的团队开发和优化能力,沐曦正在加速推动科学计算领域的国产化进程。
二、ABACUS —— 开源开放的国产电子结构软件
ABACUS(中文名:原子算筹)[4,5]作为一款基于第一性原理方法的开源材料计算平台,由中国科学技术大学、中科院物理研究所、北京大学、北京科学智能研究院、合肥综合性科学中心人工智能研究院等多家单位共同开发维护,拥有完全自主的知识产权,主要面向凝聚态材料及高温高压物质模拟计算功能支持:
- 平面波基组与数值原子轨道基组;数字化转型网www.szhzxw.cn
- 电子结构优化、原子结构弛豫、分子动力学模拟等功能;
- 从小体系到上千原子的材料模拟计算。
ABACUS 还具备良好的扩展性:
- 可与DeePMD-kit、DeePKS-kit、DP-GEN、DeepTB、DeepH、HammGNN、Hefei-NAMD、PYATB、APEX、LibRI、LibCOMM、Multiwfn、Candela、ASE、Phonopy、Wannier90、TB2J、ShengBTE、Atomkit、PEXSI、等软件联动[6];
- 提供友好的开发者文档、自动化测试与调试工具,方便科研人员快速上手[7]。
ABACUS不仅是一款科学计算软件,更是国产开源科学计算生态的重要基石。
三、沐曦 × ABACUS —— 共筑国产科学计算新生态
在 ABACUS 最新版本(v3.9.0.14和v3.9.0.15)的开发中,沐曦科学计算团队首次以开发者身份正式加入社区[8-10],并取得了显著成果:数字化转型网www.szhzxw.cn
快速适配
得益于MXMACA 出色的软件生态兼容性,ABACUS在沐曦GPU上无需改动一行源码即可顺利运行,平面波的CG或Davidson方法求解特征值、LCAO基组求解Kohn-Sham方程等主流算法均已支持。
深度优化
通过沐曦自研求解器实现 DAV 特征值求解,大幅提升求解效率;在沐曦 C 系列硬件的高带宽架构支持下,性能进一步释放。
社区贡献
沐曦科学计算团队积极提交 PR,不仅带来性能优化,也完成了部分 Bug 修复,为 ABACUS 的稳定发展贡献力量。数字化转型网www.szhzxw.cn
1. 64 GB显存:单卡承载更大材料体系
在处理超大原子体系时,部分软件可能因使用 32 位整型(int)作为数组索引或计数器,在体系规模超过一定阈值后触发整数溢出,进而导致计算崩溃。这一问题通常在显存容量较大的 GPU 上才会暴露——因为只有当单卡能容纳足够大的体系时,相关数据结构的尺寸才会增长到使 int 索引越界;而在显存较小的 GPU 上,由于体系规模受限,往往无法触发该边界条件,因此问题长期隐藏。
沐曦科学计算团队不仅协助 ABACUS 团队定位并修复了这一关键 Bug,从根本上消除了大体系计算中的稳定性隐患,更充分发挥沐曦 GPGPU 大显存(64 GB)容量优势——单卡即可承载更大规模的体系,无需过早切分到多卡。这不仅显著降低了对分布式内存和通信的依赖,也让用户能在更稳定、更经济的单机多卡配置下高效完成超大体系的第一性原理模拟。
2. 性能再提速:算子融合 + Batch FFT 优化
在第一性原理计算中,傅里叶变换(FFT)是连接实空间与倒空间的核心操作,贯穿于电子密度构建、势能计算、波函数更新等多个关键步骤。尤其在平面波或数值原子轨道基组框架下,FFT 的调用频次高、数据规模大,成为影响整体性能的重要瓶颈。为此,沐曦科学计算团队对 ABACUS 中的 FFT 相关流程进行了深度优化:数字化转型网www.szhzxw.cn
- 引入 Batch FFT 与算子融合技术:将 real_to_recip(实空间到倒空间)和 recip_to_real(倒空间到实空间)等关键路径中的 FFT 运算重构为 Batch FFT 模式,将原本逐个执行的多个小规模 FFT 合并为一次批量调用,显著提升了 FFT 部分的计算吞吐与 GPU 利用率。同时,针对这些流程中紧邻 FFT 的其他计算操作(如数据重排,缩放等),沐曦科学计算团队实施了算子融合优化,将多个小 kernel 合并为更高效的执行单元。两项优化协同作用,共同推动 ABACUS 在 沐曦GPGPU 上的整体性能提升。
与此同时,本征态求解是第一性原理计算的另一核心挑战,其算法选择直接影响收敛速度与计算稳定性。相较于传统的共轭梯度(CG)方法,Davidson(DAV)算法往往展现出更优的收敛行为。尽管 DAV 算法在实现上会占用更多显存,但其在 GPU 上的并行潜力巨大。针对这一特点,我们对 DAV 模块进行了优化:
- Davidson 对角化算法全面 GPU 化:将原本运行在 CPU 上的计算逻辑完整迁移至 GPU 端,结合内存访问优化与自定义融合 kernel,高效实现了梯度计算、向量归一化等操作。
- 减少 Host-Device 数据拷贝:关键数据全程常驻显存,避免因 CPU 侧辅助计算引发的冗余数据搬运,确保 GPU 计算单元持续满载。数字化转型网www.szhzxw.cn
沐曦科学计算团队协同 ABACUS 社区修复多项关键问题,确保生产环境稳定可靠:
- 修复 USE_ELPA=OFF 且 BUILD_TESTING=ON 时的编译错误;
- 解决 Debug 模式下多 GPU 并行因设备上下文管理不当导致的崩溃问题
——现在,调试与生产环境同样稳健!
四、高效协作,源于优秀的开源工程实践
沐曦科学计算团队能够高效、快速地向 ABACUS 贡献上述优化与修复,离不开 ABACUS 项目本身卓越的软件工程实践。其代码结构清晰、模块解耦良好,GPU 后端采用高度规范化的模板化设计,接口定义明确,文档完善,使得新功能集成与性能调优工作得以顺畅推进。这种对开发者友好的架构,不仅大幅降低了硬件厂商参与适配的门槛,也为国产科学计算软件的可持续演进树立了标杆。正因如此,沐曦科学计算团队才能在短时间内完成从性能分析、算法优化到代码提交的完整闭环,并顺利合入主干,真正实现“软硬协同,快速迭代”。这不仅是一次适配与优化,更是国产 GPGPU 与国产软件深度融合的缩影。
未来,沐曦将继续携手 ABACUS,共同推动 “国产软件 + 国产硬件” 的科学计算新生态,为 AI4Science 时代的突破性研究提供坚实算力支撑。数字化转型网www.szhzxw.cn
关于沐曦
沐曦致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。
数字化转型网正在帮助企业寻找优质的数字化服务商,如果您想联系该厂商的人,请联系我们!思思:17757154048(微信同号)数字化转型网www.szhzxw.cn

如果贵司从事服务商行业,希望获得免费 曝光权益或跟我们进行合作,请联系我们!Nora:N19221855776(微信同号)数字化转型网www.szhzxw.cn

数字化转型网数字化服务商库拥有来自数字化咨询、ERP、ERP实施、WMS、MES、CRM、SCRM、HR数字化、OA、协同办公数字化、电子签章、发票解决方案、税务解决方案、SRM供应商管理数字化、常见硬件等IT基础设施、低代码开发类、流程管理、预算管理、差旅管理、费控报销数字化、客服数字化、项目与任务管理、研发数字化PLM、财务共享数字化、TMS、电子招投标、B2B供应链管理、视频会议产品、企业直播、在线教育、在线文档、表格信息收集工具、智慧桌面运维、企业文档管理、云计算、云服务、营销数字化、MA、舆情监测分析、E-learning学习平台产品、电商数字化、电商ERP、国产操作系统、国产数据库、ESB、合同管理系统、资金管理、RPA、AI人工智能、信息安全、数据备份与恢复、网络安全态势感知、网管/ITIL/运维管理系统、虚拟云桌面、应用统一身份管理/身份认证/单点登录、上网行为管理、VPN、智慧园区、防火墙、主机文档加密与权限控制、邮件安全产品、运维审计/4A/堡垒机、桌面管理/主机审计、网闸、防病毒、虚拟化安全防护、SIEM/日志管理/日志审计/SOC/安管平台、网络准入控制、主机加固/服务器加固/EDR、打印安全、Web应用防火墙、加密机/密码机、基于云的安全服务、SIEM/日志管理/日志审计等数字化所需软硬件等百余个品类的大小型服务商资料及用户实际使用情况及相应产品同行业实际口碑。数字化转型网szhzxw.cn
数字化转型网数字化服务商库同时拥有来自制造业、消费品行业、电力行业、文化出版行业、医疗行业、外贸行业、交通行业、零售连锁行业、电子商务行业、电商行业、建筑地产行业、汽车销售行业、汽车零部件行业、汽车整车行业、服装制造行业、服装销售行业、教育行业、金融行业、银行业、保险业、证券业、餐饮行业、酒店行业、物流行业、物业行业等具有不同行业特性的数字化服务商方案及用户实际使用情况及相关产品在行业内的具体口碑;也拥有来自外企、央国企、民企等不同类型企业的适用服务商方案及相关产品在同类型企业用户的实际使用情况及具体口碑情况。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)宁檬树
