计算化学公社

 找回密码 Forget password
 注册 Register
Views: 560|回复 Reply: 0
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] Gromacs调优后的速度参考

[复制链接 Copy URL]

396

帖子

8

威望

3924

eV
积分
4480

Level 6 (一方通行)

石墨

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 Graphite 于 2025-3-27 23:11 编辑

最近经常看到各种巨慢模拟,例如十万原子50ns用显卡跑几天...实在看不下去了,还是发一下Gromacs的调优后正常的速度,对于其他软件也可以略微引申推理。对于老鸟来说应该是老生常谈,但是应该有人需要。

对于1 g/mL的平衡体系,2 fs步长,cutoff=1 nm的情况,例如常见的蛋白质水溶液:

autodl,12 vCPU+3090能够做到1500-2000万原子*ns/天,也就是如20万原子,75-100 ns/天,或者100万原子,15-20 ns/天。(autodl没说是物理核心还是线程,不过基本等于线程)
autodl,12 vCPU+4090能够做到3000-4000万原子*ns/天。
笔记本低压CPU(R7-5800U)调用8线程(另外8线程闲置/办公),200万原子*ns/天。
服务器CPU(老EPYC,约2.0-2.4 GHz)调用32线程(其余线程闲置/办公),700-800万原子*ns/天。

如果步长1 fs,以上数值减半。
如果密度增加,速度约以密度的平方倍衰减,例如密度1.5 g/mL时,速度只有一半左右。
如果不能做到-update gpu(有freeze group等情况不能-update gpu),数值同样会显著减少。

调优是一个比较复杂的事情,对于不同尺寸和特性的体系、不同的机器和环境,都有不同的情况——要看计算具体哪部分是瓶颈(update/bonded/nb/pme等),对应什么机器资源。CPU/GPU/内存/硬盘(很少情况下)都要考虑,是一个要考虑系统性、全面性的问题。可以参考http://bbs.keinsci.com/thread-33296-1-1.html

不过如果只有以上说的几分之一的速度,那么软件安装/配置问题和使用问题,多少是沾一样的。gromacs对于GPU的调度还是可以的,也可以看nvidia-smi dmon,如果利用率不足50%,多半也是有大问题。

题外话之一:Amber、NAMD等效率不同,但趋势亦类似,LAMMPS这玩意不在讨论之列,不过都用LAMMPS整活了,应该也没那么在意效率吧(笑)

题外话之二:如果你目光准、熟悉调优、通过API弹性调用各种计算资源...那么相比于一次性买硬件,最大化地拉取和榨干远程资源,成本不到20%...

评分 Rate

参与人数
Participants 4
eV +17 收起 理由
Reason
ChrisZheng + 5 谢谢
Lance先生 + 5 赞!
含光君 + 2 赞!
FrancisCho + 5 好物!

查看全部评分 View all ratings

自在飞花轻似梦,无边丝雨细如愁。

全自动反应动力学(ReaxFF、AIMD、NEP等)后处理工具网页版:http://cc-portal.xyz/reax_tools

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-18 07:27 , Processed in 0.310250 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list