计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1057|回复 Reply: 10
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] Linux服务器使用支持CUDA加速的gmx2023.5模拟50ns蛋白-配体复合物体系速度较差

[复制链接 Copy URL]

305

帖子

0

威望

550

eV
积分
855

Level 4 (黑子)

本帖最后由 12313 于 2024-6-5 12:15 编辑

各位老师好,之前我在Linux服务器中安装了支持CUDA加速的gromacs2023.5版本,使用的CPU指令集为AVX_512,对蛋白-配体复合物在水中进行50ns模拟,但是使用gmx mdrun 运行tpr文件时感觉计算速度不是很理想,终端提示大约6天才能计算结束,不知道这个计算速度是否正常,想问一下各位老师该如何解决?
1.下面是我的服务器配置信息
CPU型号:Intel(R)  Xeon(R)  Gold  6226R  CPU @ 2.90GHz
CPU总核数:32
GPU型号:NVIDIA  Quadro  P400
2.下面是gromacs的相关信息
Gromacs版本:  2023.5
CUDA 版本:  11.4
SIMD指令集:  AVX_512
运行gmx mdrun时gmx的CPU占用率:1636%
体系及大小:蛋白大分子受体-配体复合物在水中的变化   总原子数:  101628
运行步数:25000000
运行步长:2fs

下图是输入gmx mdrun命令后终端提示的运行结束时间


下图是输入gmx -version 后的信息

下面是我的参数文件及运行文件
md.mdp (2.41 KB, 下载次数 Times of downloads: 2) md01.tpr (4.5 MB, 下载次数 Times of downloads: 2)






6万

帖子

99

威望

5万

eV
积分
120169

管理员

公社社长

2#
发表于 Post on 2024-6-5 12:56:52 | 只看该作者 Only view this author
GPU忒烂
别试图拿亮机卡做GPU加速

这年头最起码弄个RTX 4070再说GPU加速的事
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

86

帖子

3

威望

1753

eV
积分
1899

Level 5 (御坂)

3#
发表于 Post on 2024-6-5 13:01:55 | 只看该作者 Only view this author
应该是你的P400不太行
我在AMD EPYC 7542/4060Ti上运行你的文件只需要6个小时左右,每天206ns

不使用CUDA加速只用32核只需要不到2天时间,每天31ns

305

帖子

0

威望

550

eV
积分
855

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2024-6-5 14:48:43 | 只看该作者 Only view this author
sobereva 发表于 2024-6-5 12:56
GPU忒烂
别试图拿亮机卡做GPU加速

好的,谢谢老师

305

帖子

0

威望

550

eV
积分
855

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2024-6-5 14:48:51 | 只看该作者 Only view this author
Dempey 发表于 2024-6-5 13:01
应该是你的P400不太行
我在AMD EPYC 7542/4060Ti上运行你的文件只需要6个小时左右,每天206ns

好的,谢谢老师

305

帖子

0

威望

550

eV
积分
855

Level 4 (黑子)

6#
 楼主 Author| 发表于 Post on 2024-6-5 20:15:49 | 只看该作者 Only view this author
sobereva 发表于 2024-6-5 12:56
GPU忒烂
别试图拿亮机卡做GPU加速

老师,那我就利用目前的配置条件,能否有办法使其计算速度达到它本身的最大化呢?

6万

帖子

99

威望

5万

eV
积分
120169

管理员

公社社长

7#
发表于 Post on 2024-6-6 00:42:59 | 只看该作者 Only view this author
12313 发表于 2024-6-5 20:15
老师,那我就利用目前的配置条件,能否有办法使其计算速度达到它本身的最大化呢?

再怎么最大化都没意义
这GPU就连鸡肋都算不上,拿这种档次的GPU加速,纯属加速个寂寞
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

305

帖子

0

威望

550

eV
积分
855

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2024-6-6 08:56:55 | 只看该作者 Only view this author
sobereva 发表于 2024-6-6 00:42
再怎么最大化都没意义
这GPU就连鸡肋都算不上,拿这种档次的GPU加速,纯属加速个寂寞

好的谢谢老师

49

帖子

0

威望

1088

eV
积分
1137

Level 4 (黑子)

9#
发表于 Post on 2024-6-13 23:40:30 | 只看该作者 Only view this author
Dempey 发表于 2024-6-5 13:01
应该是你的P400不太行
我在AMD EPYC 7542/4060Ti上运行你的文件只需要6个小时左右,每天206ns

为啥我 7950X+4090 win10 和 Ubuntu 2019.06 gpu版 9万原子100ns 都要44h

206

帖子

0

威望

1117

eV
积分
1323

Level 4 (黑子)

终身学习

10#
发表于 Post on 2024-6-14 00:29:22 | 只看该作者 Only view this author
xptracy 发表于 2024-6-13 23:40
为啥我 7950X+4090 win10 和 Ubuntu 2019.06 gpu版 9万原子100ns 都要44h

确保任务被负载在GPU上了吗,检查一下GPU的占用率
Open source enables open science.

86

帖子

3

威望

1753

eV
积分
1899

Level 5 (御坂)

11#
发表于 Post on 2024-6-14 08:40:43 | 只看该作者 Only view this author
xptracy 发表于 2024-6-13 23:40
为啥我 7950X+4090 win10 和 Ubuntu 2019.06 gpu版 9万原子100ns 都要44h

你看看你的mdrun输出中
  1. 1 GPU selected for this run.
  2. Mapping of GPU IDs to the 2 GPU tasks in the 1 rank on this node:
  3.   PP:0,PME:0
  4. PP tasks will do (non-perturbed) short-ranged interactions on the GPU
  5. PP task will update and constrain coordinates on the GPU
  6. PME tasks will do all aspects on the GPU
复制代码

这一部分是不是都在GPU上,
我的7542/4060Ti跑17.5万原子50ns只要14h大约83.72ns/day,另我亲测9654/4090跑181万原子100ns只要139h大约17.27ns/day

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-16 21:19 , Processed in 0.174522 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list