计算化学公社

标题: 报错“BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES”该怎么处理 [打印本页]

作者
Author:
易振宇1996    时间: 2021-3-18 12:03
标题: 报错“BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES”该怎么处理
各位老师好,我使用VASP在超算上提交了一个任务后,没有正常进行计算,log文件如下所示,请问是什么原因?应该怎么处理?

作者
Author:
wxw    时间: 2021-7-13 21:00
请问您解决了吗,我也遇到同样的问题了。
作者
Author:
派大馨    时间: 2021-11-26 09:52
请问您解决了吗,我也遇到同样的问题了。
作者
Author:
夙雪夜归    时间: 2021-11-26 16:41
https://www.intel.com/content/www/us/en/develop/documentation/mpi-developer-guide-linux/top/troubleshooting/error-message-bad-termination.html

这个网站中有对这个问题的解释,我在自己课题组的服务器上也遇到过这样的问题,但依然不知道该如何解决。既然是超算,同学你应当可以咨询超算的技术人员寻求帮助吧。

作者
Author:
wolfli369    时间: 2021-11-27 09:38
内存泄露惹的祸,有些版本的intel mpi长时间运行就会导致这样的结果,可以尝试换一下intel编译器版本
作者
Author:
夙雪夜归    时间: 2021-12-11 19:47
http://bbs.keinsci.com/thread-16082-1-1.html
作者
Author:
Jackchem    时间: 2022-11-16 10:10
其中XIT CODE: 9表示内存不足,退出。
作者
Author:
JackHuang    时间: 2022-12-4 14:16
可以尝试在终端中输入下面的命令来增加堆栈空间:
  1. ulimit -s unlimited
复制代码

我测试这个方法时候下面这些报错:
  1. forrtl: severe (174): SIGSEGV, segmentation fault occurred

  2. BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
复制代码

作者
Author:
Icestone    时间: 2023-5-26 17:19
本帖最后由 Icestone 于 2023-5-27 10:33 编辑

可能是KPOINTS输入有问题.KPONITS太大。
作者
Author:
13847344109    时间: 2023-10-23 20:44
本帖最后由 13847344109 于 2023-10-23 20:47 编辑

=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   RANK 9 PID 398254 RUNNING AT gpu05
=   KILLED BY SIGNAL: 9 (Killed)

这种情况怎么办?

作者
Author:
jxw    时间: 2023-11-9 22:20
13847344109 发表于 2023-10-23 20:44
=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   RANK 9 PID 398254 RUNNING AT gpu05
=  ...

你好,请问你的问题解决了吗,我也遇到这样的问题

作者
Author:
清风与鹿    时间: 2023-11-22 08:42
jxw 发表于 2023-11-9 22:20
你好,请问你的问题解决了吗,我也遇到这样的问题

你好,请问你的问题解决了吗,我也遇到这样的问题
作者
Author:
芙宁娜我老婆    时间: 2023-12-16 11:31
13847344109 发表于 2023-10-23 20:44
=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   RANK 9 PID 398254 RUNNING AT gpu05
=  ...

你好,请问问题解决了吗,我也遇到了
作者
Author:
小猫无极    时间: 2024-2-8 09:27
本帖最后由 小猫无极 于 2024-2-20 11:47 编辑
芙宁娜我老婆 发表于 2023-12-16 11:31
你好,请问问题解决了吗,我也遇到了

如果是虚拟机的话,你调一下虚拟机的核数和运算时候-np的cpu核数试试。。。 把diagonalization = 'david' 换成 'cg' 好像可以避免,但是这样运算速度会变慢四五倍.....我看网上有人说好像是amd处理器的兼容问题....
作者
Author:
123wo    时间: 2024-6-19 14:52
Icestone 发表于 2023-5-26 17:19
可能是KPOINTS输入有问题.KPONITS太大。

我遇到的一个比较奇特和搞笑的情况是,K331正常计算,K111报这样的错误
作者
Author:
zbybyby    时间: 2024-6-25 15:48
123wo 发表于 2024-6-19 14:52
我遇到的一个比较奇特和搞笑的情况是,K331正常计算,K111报这样的错误

我也遇到了,999行但121212就不行,请问您是如何解决的呢
作者
Author:
123wo    时间: 2024-6-25 22:03
zbybyby 发表于 2024-6-25 15:48
我也遇到了,999行但121212就不行,请问您是如何解决的呢

我也是前面加的ulimit -s unlimted
作者
Author:
weilu    时间: 2024-11-8 02:46
13847344109 发表于 2023-10-23 20:44
=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   RANK 9 PID 398254 RUNNING AT gpu05
=  ...

你好请问这个问题解决了吗,用vasp接口wannier时候也遇到同样的报错了,=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   RANK 1 PID 6220 RUNNING AT scu01
=   KILLED BY SIGNAL: 9 (Killed)
作者
Author:
zkzk233    时间: 2024-12-3 21:26
=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   RANK 31 PID 142410 RUNNING AT master
=   KILLED BY SIGNAL: 9 (Killed)

进行声子dftp计算的时候遇到了这样的问题。我认为是计算精度太高,导致内存泄漏,把k点的密度降低,后可以正常进行计算。


作者
Author:
denghang2024    时间: 2024-12-25 20:06
能带计算的时候BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES怎么解决的啊
作者
Author:
王二葛    时间: 2024-12-25 21:39
weilu 发表于 2024-11-8 02:46
你好请问这个问题解决了吗,用vasp接口wannier时候也遇到同样的报错了,=   BAD TERMINATION OF ONE OF Y ...

如果精度高对应内存消耗大,可能遇到的问题是内存不足

内存泄漏是说程序声明占用了一块内存但没有及时释放,专有名词
作者
Author:
weilu    时间: 2024-12-26 19:15
王二葛 发表于 2024-12-25 21:39
如果精度高对应内存消耗大,可能遇到的问题是内存不足

内存泄漏是说程序声明占用了一块内存但没有及时 ...

谢谢,但是我在脚本里添加了  ulimit -s unlimted  解除内存限制但是没用,不清楚后续应该如何处理(减少k点吗)。然后wannier好像设置NCORE参数的话也容易报错,提示要改成1,似乎是不能并行运算
作者
Author:
llc    时间: 2025-2-23 15:52
我的cp2k版本是2023.1,服务器CPU是7V12,遇到过这个问题,后来换了2023.2的版本之后就好了。因此可以升级版本试试。




欢迎光临 计算化学公社 (http://ccc.keinsci.com/) Powered by Discuz! X3.3