计算化学公社

标题: AIMD设定了2000步,结果跑了1001步就报错了 [打印本页]

作者
Author:
qwe1832518773    时间: 2020-10-29 21:21
标题: AIMD设定了2000步,结果跑了1001步就报错了
AIMD设定了2000步,结果跑了1001步就报错了:
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 0
yhrun: error: cn132: task 0: Exited with exit code 1
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 8
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 10
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 11
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 12
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 18
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 2
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 14
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 13
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 7
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 3
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 5
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 9
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 19
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 4
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 17
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 6
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 20
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 16
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 21
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 15
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 23
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 22
application called MPI_Abort(MPI_COMM_WORLD, 1) - process 1


查了一下说是储存空间不足,于是换了一个新的集群账号,把第1001帧提出来续算,结果还是同样的报错,这是什么原因呢,请各位大佬帮我看看,感谢感谢!

作者
Author:
qwe1832518773    时间: 2020-11-2 14:03
弱弱在线@sob老师,能回复一下我吗
作者
Author:
wzkchem5    时间: 2020-11-2 19:42
你从第1001帧续算的时候,第1001帧(新任务的第一帧)能算完吗?
作者
Author:
qwe1832518773    时间: 2020-11-3 15:16
wzkchem5 发表于 2020-11-2 19:42
你从第1001帧续算的时候,第1001帧(新任务的第一帧)能算完吗?

不能,第1001就压根没算,直接报错
作者
Author:
wzkchem5    时间: 2020-11-3 17:06
qwe1832518773 发表于 2020-11-3 15:16
不能,第1001就压根没算,直接报错

如果你现在从前面的轨迹里挑一帧出来跑,能算吗?
作者
Author:
qwe1832518773    时间: 2020-11-5 21:10
wzkchem5 发表于 2020-11-3 17:06
如果你现在从前面的轨迹里挑一帧出来跑,能算吗?

按照您说的我试了一下,挑了最开始的第30帧,现在是可以正常跑的!
那是这第1001帧本身出现了问题吗?
作者
Author:
wzkchem5    时间: 2020-11-5 22:17
qwe1832518773 发表于 2020-11-5 21:10
按照您说的我试了一下,挑了最开始的第30帧,现在是可以正常跑的!
那是这第1001帧本身出现了问题吗?

有可能,比如假如你第1000帧能跑的话,好好比较一下第1000帧和第1001帧有什么区别
可能比如说SCF没收敛
作者
Author:
qwe1832518773    时间: 2020-11-6 10:12
wzkchem5 发表于 2020-11-5 22:17
有可能,比如假如你第1000帧能跑的话,好好比较一下第1000帧和第1001帧有什么区别
可能比如说SCF没收敛

好的好的,非常感谢您的回复!




欢迎光临 计算化学公社 (http://ccc.keinsci.com/) Powered by Discuz! X3.3