计算化学公社

标题: NVMe持续读写, 速度稳定吗? [打印本页]

作者
Author:
abin    时间: 2021-9-3 12:12
标题: NVMe持续读写, 速度稳定吗?
各位在机器上配置了NVMe固态硬盘的小伙伴,

在机器持续读写运算的时候, NVMe盘温度大概多少? 顺序读写能力能维持在多少?

测试平台, 2686v4双路, 128GB内存, WD Blue SN 550.
标称 顺序读取2400 MB/s, 顺序写入1950 MB/s.

服务器在空载的时候, 测试顺序写入概是1.2 ~ 1.5 GB/s.

服务器如果满负荷做计算的时候, 36个单线程, 各自做读写操作, 写入的数据格式是NetCDF.
起初30分钟, 读写基本正常, 40分钟之后, 读写掉速明显, 大概只有 30MB/s的样子.
同时, 系统监控发现IO_Wait占比较多.
持续24小时满负荷, IO_wait十分明显.

机器有搭载NVMe读写硬盘的小伙伴,
可以测试看看实际读写性能哦.

测试脚本是,
https://gitee.com/hpc4you/linux/blob/master/disk-io-bench-lite.sh

如果不喜欢使用git clone,
打开 https://gitee.com/hpc4you/linux/raw/master/disk-io-bench-lite.sh
粘贴所有内容到你的机器, 创建一个文档.

如何运行,
在NVMe硬盘,
直接 bash disk-io-bench-lite.sh

我初步结论是,
PC级别的NVMe硬盘, 不适合长时间满负荷读写, 效果奇差.

我之前, 也买过两个NVMe硬盘, 测试不符合要求, 退货了.
这次又搞了一个, 连续使用一个小时, 就开始掉速了.

作者
Author:
biogon    时间: 2021-9-3 12:28
本帖最后由 biogon 于 2021-9-3 12:32 编辑

消费级SSD除了傲腾900P 905P之外的都是有读写缓存的,缓存写满必然掉速,想不掉速只能用企业级SSD、
当然也要看下主控温度是不是太高了,这也是降速的原因

作者
Author:
sobereva    时间: 2021-9-3 12:57
用三星固态的较多,建议整个三星的主流盘来测

虽然我这里也有,但不想做测试牺牲有限的读写量

作者
Author:
Entropy.S.I    时间: 2021-9-3 13:17
7月份开始新生产的最新一批SN550换了颗粒和固件,SLC缓存外速度砍半到400M,除顺序写入以外的性能可能也有所影响,看看有没有踩雷
作者
Author:
abin    时间: 2021-9-3 13:57
踩不踩雷没关系,买了好几个呢。
使劲造,没法读写了,就联系更换。

三星980Pro也有,稍微好那么一丢丢。

所以,我当前的结论是,
消费级的NVMe盘,
用来负载长时间的持续读写,
性能堪忧……

虽然起步很快,但后劲不足。

以上仅仅基于我自己的使用场景得到的结论。
仅供参考。
作者
Author:
zhaovic    时间: 2021-9-14 11:44
顺序读写其实没多大意义,标称的速度只有在大文件读写的时候才能体现出来,我感觉计算更多还是小文件的读写,4k性能应该更重要。我自己电脑用SN750,学校服务器用希捷银河机械硬盘,跑vasp可能两个星期的任务固态硬盘能节省10分钟,根本没有意义。如果需要缓外速度可能SN750要好一点,我自己测得全盘写入1.2g/s写满不掉速,比pm981a强,就是不知道970pro这种mlc盘是不是更强。
作者
Author:
abin    时间: 2021-9-14 13:47
zhaovic 发表于 2021-9-14 11:44
顺序读写其实没多大意义,标称的速度只有在大文件读写的时候才能体现出来,我感觉计算更多还是小文件的读写 ...

VASP 基本不写硬盘, 所以硬盘用哈, 基本没关系.

读写大致有两种类型.
机器上有好多计算, 类型不同, 而且都需要读写,
这种时候, 可以类比为随机读写.
比如一套小型集群上, 同时跑300个单线程, 每一个都在疯狂读写的.

DFT做激发态频率, 读写也比较牛逼.
如果是单机, 或者全集群就仅仅只有这几个高斯计算, 可以看作顺序读写.

固态最重要的还是随机读写.
消费级别的, 温度一上去, 基本死翘翘.

我后来买了高端的PCI接口的, 很稳定.
贵有贵的道理.





欢迎光临 计算化学公社 (http://ccc.keinsci.com/) Powered by Discuz! X3.3