计算化学公社

 找回密码 Forget password
 注册 Register
Views: 21706|回复 Reply: 9
打印 Print 上一主题 Last thread 下一主题 Next thread

[VASP] VASP的GPU加速硬件配置方案

[复制链接 Copy URL]

689

帖子

2

威望

4194

eV
积分
4923

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
今天参加了VASP的GPU加速硬件配置方案视频讲座,从测试结果来看VASP GPU加速有一些优势,附件中是报告PPT,有兴趣的同学可以看看

PS: 报告中提到VASP购买信息的真实性请大家自行判断。
PPS: VASP官网上有这样一句话,请大家注意!!!
Please note that Hongcam and its subsidiaries are no longer distributor and not authorized to sell or support MedeA®or VASP.

VASP的GPU加速硬件配置方案.pdf

1.4 MB, 下载次数 Times of downloads: 915

6万

帖子

99

威望

5万

eV
积分
120201

管理员

公社社长

2#
发表于 Post on 2017-3-10 15:34:12 | 只看该作者 Only view this author
看完我的态度是“呵呵”
直接找官方买就完了。从国内代理买,源*也更名正言顺
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

689

帖子

2

威望

4194

eV
积分
4923

Level 6 (一方通行)

3#
 楼主 Author| 发表于 Post on 2017-3-10 15:37:38 | 只看该作者 Only view this author
sobereva 发表于 2017-3-10 15:34
看完我的态度是“呵呵”
直接找官方买就完了。从国内代理买,源*也更名正言顺

如果国内能直接报销的话,估计代理公司就没戏唱了

17

帖子

0

威望

52

eV
积分
69

Level 2 能力者

4#
发表于 Post on 2017-3-10 17:01:34 | 只看该作者 Only view this author
代理商不可靠啊,这么便宜?!

70

帖子

0

威望

1289

eV
积分
1359

Level 4 (黑子)

5#
发表于 Post on 2017-3-14 09:41:08 | 只看该作者 Only view this author
我始终有个问题,GPU版VASP是靠显卡的单精度浮点运算还是双精度浮点运算?换句话说,用游戏卡和专业计算卡计算哪个更合适?请高人指点?

6万

帖子

99

威望

5万

eV
积分
120201

管理员

公社社长

6#
发表于 Post on 2017-3-14 18:52:29 | 只看该作者 Only view this author
szp12345 发表于 2017-3-14 09:41
我始终有个问题,GPU版VASP是靠显卡的单精度浮点运算还是双精度浮点运算?换句话说,用游戏卡和专业计算卡 ...

从测试上看走的是单精度,毕竟1080双精度弱爆
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

70

帖子

0

威望

1289

eV
积分
1359

Level 4 (黑子)

7#
发表于 Post on 2017-3-14 20:23:01 | 只看该作者 Only view this author
sobereva 发表于 2017-3-14 18:52
从测试上看走的是单精度,毕竟1080双精度弱爆

哦,那其实完全没必要上专业计算卡,多谢指点

7

帖子

0

威望

33

eV
积分
40

Level 2 能力者

8#
发表于 Post on 2017-10-26 11:28:09 | 只看该作者 Only view this author
本帖最后由 auroraustc 于 2017-10-26 11:34 编辑
sobereva 发表于 2017-3-14 18:52
从测试上看走的是单精度,毕竟1080双精度弱爆

您好,我认为您的看法不完全正确,vasp_gpu应该主要为双精度运算,理由如下:
1、单精度计算的有效数字位数对于VASP而言应该是不够的。用cuBLAS
库中的sgemm连续作两次1024*1024的矩阵相乘(就是3个矩阵相乘),其计算结果和CPU端的结果就已经会有1*10E-6的误差,这至少对于VASP的EDIFF收敛是不可接受的(GPU版VASP主要是把电子步的Blocked-Davidson和RMM-DIIS进行GPU化了)。
2、对VASP源码中src/CUDA/文件夹下的文件进行grep,比如grep "Dgemm"之类的操作,得到的结果显示双精度函数的使用远多于单精度函数,就比如矩阵相乘,Dgemm/Zgemm的使用远多于Sgemm。
3、对于附件中的计算结果,也是容易解释的。我在2*E5 2680v3上测试双精度的运算性能,大约在350~400Gflops(使用Intel MKL);wiki上查到GTX1080单卡的双精度性能是257Gflops,所以2*1080+2*2650的效率估计会在2*2650的2.5~3.5倍,和附件的结果结论类似。
4、对于个人的测试,测试平台是ryzen 1700(用Intel MKL和Intel Fortran。ryzen的双精度浮点运算还行,8核全开大约在e5 2670的1.3~1.5倍左右,还是打不过双路2670的服务器)+GTX Titan(老泰坦,双精度1300Gflops左右,在驱动中打开双精度),比较ryzen 1700四核和ryzen 1700四核+Titan的结果,对于较小的体系(十几个原子)加速效果并不明显,大约在1.5~3倍左右;对于较大的体系(35个原子以上;同时可以强行修改一下KPOINTS增大计算量)有接近10倍的加速。附件中没有说明测试体系,个人觉得使用4*k80完全被浪费了,考虑到,说不定1*k80的计算时间也差不多是这么多。
5、对于4的补充,测试机器是双通道的,根据测试发现对于ryzen 1700,每通道2个核的时间/核心比每通道4个核的时间/核心小很多。换句话说,单通道+4核运算速度不如双通道+4核;双通道+8和的运算速度比双通道+4核快得很有限。可能和ryzen的内存控制器有关吧,毕竟不是服务器cpu。
6、对于3的补充。3的结果其实比较迷,我还在笔记本的i7 4700hq和ryzen 1700分别用dgemm函数做过测试,4核4700hq的双精度在60Gflops左右,8核ryzen 1700的双精度效率才略高于70Gflops。不知是Intel MKL的问题还是ryzen的浮点本来就这个样。但是测试VASP发现8核ryzen 1700还是比8核e5 2670要快一点,比4700hq快2倍不止。

评分 Rate

参与人数
Participants 1
eV +2 收起 理由
Reason
sobereva + 2 欢迎讨论

查看全部评分 View all ratings

22

帖子

0

威望

179

eV
积分
201

Level 3 能力者

9#
发表于 Post on 2019-8-29 21:39:55 | 只看该作者 Only view this author
auroraustc 发表于 2017-10-26 11:28
您好,我认为您的看法不完全正确,vasp_gpu应该主要为双精度运算,理由如下:
1、单精度计算的有效数字 ...

所以做VASP计算的话,您认为是GTX1080,GTX2060这样的游戏卡效果更好,还是K40,K80这样的卡更好?

16

帖子

0

威望

82

eV
积分
98

Level 2 能力者

10#
发表于 Post on 2020-7-15 18:26:25 | 只看该作者 Only view this author
求教一下,目前单位用的5.4.4版,那么请问vasp GPU版 需要单独购买吗?多少钱?

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-18 03:55 , Processed in 0.155049 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list