计算化学公社
标题:
Gromacs调优后的速度参考
[打印本页]
作者Author:
Graphite
时间:
2025-3-27 22:52
标题:
Gromacs调优后的速度参考
本帖最后由 Graphite 于 2025-3-27 23:11 编辑
最近经常看到各种巨慢模拟,例如十万原子50ns用显卡跑几天...实在看不下去了,还是发一下Gromacs的调优后正常的速度,对于其他软件也可以略微引申推理。对于老鸟来说应该是老生常谈,但是应该有人需要。
对于1 g/mL的平衡体系,2 fs步长,cutoff=1 nm的情况,例如常见的蛋白质水溶液:
autodl,12 vCPU+3090能够做到1500-2000万原子*ns/天,也就是如20万原子,75-100 ns/天,或者100万原子,15-20 ns/天。(autodl没说是物理核心还是线程,不过基本等于线程)
autodl,12 vCPU+4090能够做到3000-4000万原子*ns/天。
笔记本低压CPU(R7-5800U)调用8线程(另外8线程闲置/办公),200万原子*ns/天。
服务器CPU(老EPYC,约2.0-2.4 GHz)调用32线程(其余线程闲置/办公),700-800万原子*ns/天。
如果步长1 fs,以上数值减半。
如果密度增加,速度约以密度的平方倍衰减,例如密度1.5 g/mL时,速度只有一半左右。
如果不能做到-update gpu(有freeze group等情况不能-update gpu),数值同样会显著减少。
调优是一个比较复杂的事情,对于不同尺寸和特性的体系、不同的机器和环境,都有不同的情况——要看计算具体哪部分是瓶颈(update/bonded/nb/pme等),对应什么机器资源。CPU/GPU/内存/硬盘(很少情况下)都要考虑,是一个要考虑系统性、全面性的问题。可以参考
http://bbs.keinsci.com/thread-33296-1-1.html
。
不过如果只有以上说的几分之一的速度,那么软件安装/配置问题和使用问题,多少是沾一样的。gromacs对于GPU的调度还是可以的,也可以看nvidia-smi dmon,如果利用率不足50%,多半也是有大问题。
题外话之一:Amber、NAMD等效率不同,但趋势亦类似,LAMMPS这玩意不在讨论之列,不过都用LAMMPS整活了,应该也没那么在意效率吧(笑)
题外话之二:如果你目光准、熟悉调优、通过API弹性调用各种计算资源...那么相比于一次性买硬件,最大化地拉取和榨干远程资源,成本不到20%...
欢迎光临 计算化学公社 (http://ccc.keinsci.com/)
Powered by Discuz! X3.3