计算化学公社

 找回密码 Forget password
 注册 Register
Views: 557|回复 Reply: 10
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] 关于gromacs跑动力学任务中断,出现CuDA error #719的问题

[复制链接 Copy URL]

9

帖子

0

威望

105

eV
积分
114

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主

大家好,想请教大家一个问题:
  鄙人在跑蛋白-配体复合物100ns时长动力学的时候,每次任务都是中途停止,有时是40%停止,有时是90%停止,所以每次续跑很麻烦。

报错提示如下:
   Assertion failed:
   Condition:stat == cudasuccess
   Freeing of the device buffer failed. CuDA error #719 (cudaErrorLaunchFailure):
   unspecified launch failure.


  上网查了一下,有人说是GPU占用满了的问题,有人说是程序版本不兼容,也有人说是cuda版本的原因。
  所以想向论坛的大佬们请教一下,什么原因的可能性最大。


鄙人电脑配置如下:
   显卡:RTX 4070Ti super 16GB;   CPU:intel i7-14700KF   内存:32GB
   Gromacs version: 2024.04     显卡驱动版本:550.120   Cuda 版本:12.4    python version: 3.10.12
   模拟体系:加上水分子在内,大概30000个原子大小
所有操作都是在Ubuntu22.04环境下进行,且未同时运行其它任何大型程序。
   谢谢大家
  

29

帖子

0

威望

862

eV
积分
891

Level 4 (黑子)

2#
发表于 Post on 2025-1-22 07:58:37 | 只看该作者 Only view this author
同问,我遇到的是#700报错,一般是在跑第一步时就报错,所以我猜测我遇到的问题应该是体系结构有问题

206

帖子

0

威望

1119

eV
积分
1325

Level 4 (黑子)

终身学习

3#
发表于 Post on 2025-1-22 12:20:49 | 只看该作者 Only view this author
可以先试试更新显卡驱动和CUDA版本,还有问题的话再换个gromacs跑跑看
Open source enables open science.

151

帖子

4

威望

1087

eV
积分
1318

Level 4 (黑子)

4#
发表于 Post on 2025-1-22 21:38:30 | 只看该作者 Only view this author
GMX2024的几个版本似乎CUDA都有点问题,可以换版本试试

9

帖子

0

威望

105

eV
积分
114

Level 2 能力者

5#
 楼主 Author| 发表于 Post on 2025-1-22 22:31:14 | 只看该作者 Only view this author
Seyilaxa 发表于 2025-1-22 12:20
可以先试试更新显卡驱动和CUDA版本,还有问题的话再换个gromacs跑跑看

好的,谢谢你,我试试

9

帖子

0

威望

105

eV
积分
114

Level 2 能力者

6#
 楼主 Author| 发表于 Post on 2025-1-22 22:31:51 | 只看该作者 Only view this author
Huschein 发表于 2025-1-22 21:38
GMX2024的几个版本似乎CUDA都有点问题,可以换版本试试

好的,那我换成2023版,谢谢你的建议

9

帖子

0

威望

105

eV
积分
114

Level 2 能力者

7#
 楼主 Author| 发表于 Post on 2025-1-22 22:32:56 | 只看该作者 Only view this author
FrancisCho 发表于 2025-1-22 07:58
同问,我遇到的是#700报错,一般是在跑第一步时就报错,所以我猜测我遇到的问题应该是体系结构有问题

这个我也不太清楚,而且咱俩的报错代码不一样,期待有大佬解答

1657

帖子

5

威望

4562

eV
积分
6319

Level 6 (一方通行)

喵星人

8#
发表于 Post on 2025-1-26 01:33:22 | 只看该作者 Only view this author
Intel的14代问题

9

帖子

0

威望

105

eV
积分
114

Level 2 能力者

9#
 楼主 Author| 发表于 Post on 2025-1-26 20:56:52 | 只看该作者 Only view this author

请问大佬为什么会是英特尔14代处理器的问题呢,小弟想多了解点,请大佬赐教

21

帖子

0

威望

240

eV
积分
261

Level 3 能力者

10#
发表于 Post on 2025-3-31 11:25:56 | 只看该作者 Only view this author
FrancisCho 发表于 2025-1-22 07:58
同问,我遇到的是#700报错,一般是在跑第一步时就报错,所以我猜测我遇到的问题应该是体系结构有问题

我之前遇到过类似问题,确实是体系或者mdp文件设置的问题,猜测因该是有分子重叠导致的能量爆炸,内存溢出。重新建模和修改参数后问题消失

32

帖子

0

威望

180

eV
积分
212

Level 3 能力者

11#
发表于 Post on 2025-4-1 07:43:34 | 只看该作者 Only view this author
遇到过,的确有可能是体系的问题,不要以为这个就纯粹是硬件问题。可以先检查检查体系,看看模拟中断时输出的PDB文件结构。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-17 22:13 , Processed in 0.177831 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list