本帖最后由 abin 于 2022-10-11 11:37 编辑 drizzt 发表于 2022-10-11 11:15 如有开启超线程, 那么关闭. 比如我, 在机器上定义了高斯的脚本, 判定机器名和处理器, 直接改掉作业中的核心和内存设定. 以免被某些莫名其妙的操作, 祸害了其他的计算任务. 仅供参考. 补充一下, 我见过一个机器, 64个核心, 学生说, 机器卡爆了, 然后找我解决. 我看了下, load average, 1700多..... 机器没死, 真厉害呀. |
abin 发表于 2022-10-11 10:25 嗯,谢谢,知道原因就好了,换slurm麻烦,我直接改gjf文件了 |
如果你正确使用调度器, 那么申请了八个核心, 是不可能超过申请额度的。 搞不定pbs的话, 换用slurm 吧…… |
就是qstat -a 里面TSK是8,我以为就是8核工作,看top的意思还是16核的 |
abin 发表于 2022-10-10 20:48 有点懂了. 我gjf配置里写的16核,通过pbs配置#PBS -l nodes=1:ppn=8 来设置,我一直以为通过ppn=8或16 pbs会自动选择核数。这样说来就是gjf配置优先吧,那ppn配置有啥用呢? |
drizzt 发表于 2022-10-10 15:55 看你的描述,应该是你的pbs 配置错误, 或者使用错误, 导致机器过载。 过载之后,当然效率奇差,相应贼慢。 简单说,top,看右上角的数。 如果52核心,负载数据在110属于正常, 或者56左右,如果没有开超线程的话。 超过此数据,就是明显过载。 如果五个任务,每一个都是1600%, 也就是开了5个16核心计算, 那么机器负载可能是80~90,是过载状态。 你的机器,可能是52个物理核心? 也许你是超线程受害者? 我坚信,是调度器使用错误或者配置错误。 |
sobereva 发表于 2022-10-10 14:23 Top的时候看到任务还在,但是cd命令都用不了,文件夹也只能打开一部分。我挂了几个网站也网页打不开,不知道是不是PBS的问题。可能是任务占用,但我52核只用了5个8核任务,%CPU都是1600,正常时候也是这个值 |
top看看当前任务运行状态,并且注意是跑着任务的时候登录进去时有这种问题,还是没任务在跑的时候也有这种问题。前者的话有可能是资源都被任务占了导致响应过慢 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2025-8-16 00:38 , Processed in 0.656622 second(s), 25 queries , Gzip On.