计算化学公社

 找回密码 Forget password
 注册 Register

为某网友的AMD GPU平台编译和调优LAMMPS和GROMACS

查看数: 4994 | 评论数: 10 | 收藏 Add to favorites 19
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2023-10-15 00:27

正文摘要:

本帖最后由 Entropy.S.I 于 2023-10-15 04:42 编辑 为某网友的AMD GPU平台编译和调优LAMMPS和GROMACS Oct-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com 0 前言上个月收到一位网友的哔哩 ...

回复 Reply

NGC626 发表于 Post on 2025-3-27 17:01:45
一眼r9000p
hdhxx123 发表于 Post on 2025-3-21 19:13:13
Capt_Lappland 发表于 2025-3-3 03:09
研究了很久解决了,

llvm文件夹就会出现

我上面说的仅指WSL对rocm-llvm的特殊版本限制所说,非wsl下一切正常。
Capt_Lappland 发表于 Post on 2025-3-3 03:09:33
hdhxx123 发表于 2025-1-3 16:57
在WSL2下ubuntu22.04安装rocm6.2.3驱动后,并没有找到在路径下只有omptest/和openmp/两个文件夹。
安装驱 ...

研究了很久解决了,
  1. sudo apt install rocm-llvm-dev
复制代码

llvm文件夹就会出现
在新版本rocm中,llvm的cmake从rocm-llvm移动到rocm-llvm-dev中了
hdhxx123 发表于 Post on 2025-1-3 16:57:50
本帖最后由 hdhxx123 于 2025-1-14 21:19 编辑

在WSL2下ubuntu22.04安装rocm6.2.3驱动后,并没有找到
  1. LLVM_DIR=/opt/rocm/llvm/lib/cmake/llvm
复制代码
在路径
  1. /opt/rocm/llvm/lib/cmake
复制代码
下只有omptest/和openmp/两个文件夹。
安装驱动的命令为
  1. amdgpu-install -y --usecase=wsl,hiplibsdk,rocm --no-dkms
复制代码
,版本是
  1. amdgpu-install_6.2.60203-1_all.deb
复制代码
后续解决方法是:自行安装llvm18和clang,如下是语句:(注:这里选择18是因为rocm6.2.3内置的为clang-18)
  1. wget https://apt.llvm.org/llvm.sh
  2. chmod u+x llvm.sh
  3. sudo ./llvm.sh 18
  4. sudo update-alternatives --install /usr/bin/clang++ clang++ /usr/bin/clang++-18 100
  5. sudo update-alternatives --install /usr/bin/clang clang /usr/bin/clang-18 100
  6. apt-get install libclang-18-dev
复制代码
然后再进行
  1. cmake -D CMAKE_INSTALL_PREFIX=/opt/AdaptiveCppDev20250103.rocm623 -D CMAKE_C_COMPILER=/opt/rocm/llvm/bin/clang -D CMAKE_CXX_COMPILER=/opt/rocm/llvm/bin/clang++ -D WITH_ROCM_BACKEND=ON -D ROCM_PATH=/opt/rocm  -D WITH_SSCP_COMPILER=OFF ..
复制代码

后编译得到AdaptiveCpp,但在进一步进行gromacs2024.3的编译时
  1. cmake -D CMAKE_PREFIX_PATH=/opt/AdaptiveCppDev20250102.rocm623 -D CMAKE_INSTALL_PREFIX=/opt/gmx2024.4_sycldev20231011_rocm623_gfx1100 CMAKE_C_COMPILER=/opt/rocm/llvm/bin/clang -D CMAKE_CXX_COMPILER=/opt/rocm/llvm/bin/clang++ -D GMX_GPU=SYCL -D GMX_SYCL_HIPSYCL=ON -D HIPSYCL_TARGETS=hip:gfx1100 -D GMX_BUILD_OWN_FFTW=ON ..
复制代码

报错。报错信息如图,在附件中是完整的编译过程与rocminfo、acpp-info信息,显卡是7900xt。

gromacs报错.png (293.64 KB, 下载次数 Times of downloads: 159)

gromacs报错.png

bianyi.txt

13.51 KB, 下载次数 Times of downloads: 0

acpp-info.txt

4.84 KB, 下载次数 Times of downloads: 0

HNUST 发表于 Post on 2024-12-24 22:05:03
GoldenBaby 发表于 2024-12-24 06:05
最近我刚刚整了一个A卡,7700xt,系统用的debian12,实测下来大概效率最高也就能跑到12核cpu,速度大概13 ...

试试79000系列,这个系列最新优化的
GoldenBaby 发表于 Post on 2024-12-24 06:05:22
HNUST 发表于 2024-9-21 18:13
大佬,我觉得n卡太贵了,我4070s只是用来跑gmx,我感觉还不如买一个a卡,5000多差不多性能达到4080级别了, ...

最近我刚刚整了一个A卡,7700xt,系统用的debian12,实测下来大概效率最高也就能跑到12核cpu,速度大概13ns/day,也就略低于4060Ti,考虑到普适性与折腾程度还有价格,我觉得还是N卡性价比高。
HNUST 发表于 Post on 2024-9-21 18:13:15
大佬,我觉得n卡太贵了,我4070s只是用来跑gmx,我感觉还不如买一个a卡,5000多差不多性能达到4080级别了,所以我想再组装一台a卡的。如果我买了,我编译成功一次,应该就行了把,稳定性怎么样,是不是所有的a卡都能编译
xptracy 发表于 Post on 2024-8-20 00:02:42
本帖最后由 xptracy 于 2024-8-20 08:52 编辑

老师能付费帮忙调下吗,7905x 4090  2023.1gpu版在linux下 跑不满 只有30%    弄了好几次都不行 9万原子100ns要跑两天多
Q1ngKl 发表于 Post on 2024-5-16 17:03:39
请教一下,kokkos现在是不是只能支持RNDA显卡中的gfx1030和gfx1100?我的6650xt电脑尝试了很久都没法实现。如果用gfx1032配置cmake会出现
  1. HIP enabled but no automatically detected AMD GPU architecture is supported.
复制代码
的错误。查看kokkos_arch.cmake文件,RDNA2中只列举了gfx1030。
如果用当作gfx1030编译能够成功但是运行时会出现
  1. terminate called after throwing an instance of 'std::runtime_error'
  2.   what():  hipFuncGetAttributes(&attr, kernel_func) error( hipErrorInvalidKernelFile): invalid kernel file /home/lch/Software/lammps-stable/lammps-2Aug2023/lib/kokkos/core/src/HIP/Kokkos_HIP_KernelLaunch.hpp:189
复制代码
南北多歧路 发表于 Post on 2023-10-15 09:42:55
恰好也有台7945x+4060laptop的本子,过会参照下大佬下的性能调优,多谢分享!

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-15 13:24 , Processed in 0.223217 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list