计算化学公社

标题: 一个傻瓜式(只需要输入smiles)快速构象搜索的exe程序(基于rdkit) [打印本页]

作者
Author:
Senn    时间: 2025-4-29 23:07
标题: 一个傻瓜式(只需要输入smiles)快速构象搜索的exe程序(基于rdkit)
基于我很多时候只是想看一下大概的分子可能构象,或者给一个靠谱的计算输入。
但是做完整的基于动力学的构象搜索又比较耗时,所以尝试写一个简单程序快速的进行构象筛选原理是利用rdkit的EDKDG方法生成一大批初始构象,然后调用MMFF94力场进行优化和能量计算,然后进行能量和结构RMSD的去重,最后进行排序和玻尔兹曼分布计算,得到可能性大于1%的所有构象。


声明:该方法只是快速的大致看可能的分子构象,如果需要高精度的分子构象MMFF94是不够用的。
经过测试,100个原子以内的分子基本上都能找到比较靠谱的构象。
(, 下载次数 Times of downloads: 72)
这是程序界面,只需要输入smiles,可以自定义初始生成构象,也可以程序默认,因为是快速检索一下,所以限定了最多2000个。
然后自动计算完后输入保存名词就可以导出结果到文件夹中,保存为.xyz文件。
据课题组同门要求,顺手计算了一下分子直径和体积,还顺手输出了.html文件可以直接点开查看一下3D结果,效果如下。
(, 下载次数 Times of downloads: 66)

下载地址:构象搜索工具



作者
Author:
wal    时间: 2025-4-30 07:58
好东西 我正寻思写一个这样的玩意
作者
Author:
exity    时间: 2025-4-30 10:06
把XTB打包进去?
作者
Author:
Senn    时间: 2025-4-30 10:24
exity 发表于 2025-4-30 10:06
把XTB打包进去?

好主意,之后可以打包一个基于xtb动力学的构象搜索程序。这个就是快速检索一下,普通笔记本也能算的很快
作者
Author:
ffcc    时间: 2025-5-15 10:20
期待更新!
作者
Author:
daemonice    时间: 2025-5-15 17:29
给楼主点赞,工作原因,之前试过类似方法做构象生成,提醒下在力场精度下算玻尔兹量分布意义不大,力场本身的误差会在计算构象分布时被进一步放大,可能导致优势构象被错误排除,当时我们做的时候在力场阶段只排除相对能量非常高的构象,其它的都会进入下一轮;另外,如果分子自由度大(可旋转二面角比较多),ETKDG可以提供合理的初始构象,但不能保证覆盖低能构象(它毕竟是一种随机方法),有这方面需求的可能需要(联合)使用其它构象生成方法
作者
Author:
tcntcn    时间: 2025-6-7 12:18
楼主你好,我上传smiles结构680个原子 程序显示警告时间过长,,此时程序是否还能正常运行
作者
Author:
wal    时间: 2025-6-7 15:08
tcntcn 发表于 2025-6-7 12:18
楼主你好,我上传smiles结构680个原子 程序显示警告时间过长,,此时程序是否还能正常运行

够呛 我搜123个原子的结构 4个小时没出来 感觉适合做小一些的
作者
Author:
北大-陶豫    时间: 2025-6-9 14:06
楼主这个程序非常好,但是似乎去重这步的时间太长了。可能可以优化一下去重的算法?首先只比较能量相近的结构是否相同,然后可以计算分子的转动惯量矩阵,对角化之后得到转动主轴和相应的转动惯量,转动惯量明显不同的不需要比较,转动惯量相同的可以先把转动主轴对齐。这样应该可以快很多吧。
作者
Author:
Senn    时间: 2025-6-12 20:49
tcntcn 发表于 2025-6-7 12:18
楼主你好,我上传smiles结构680个原子 程序显示警告时间过长,,此时程序是否还能正常运行

680个原子确实太多了。。。现在这个方法没办法做这么大分子量的,680个原子的感觉光生成构象都很慢。要不你只生成几个构象大概看看
作者
Author:
Senn    时间: 2025-6-12 20:51
wal 发表于 2025-6-7 15:08
够呛 我搜123个原子的结构 4个小时没出来 感觉适合做小一些的

原子数一多就慢了。所以生成初始构象数量那里设置了自定义,可以少生成一些。因为原子数一多这个方法就不能完全覆盖构象了,所以也只能参考一下。
作者
Author:
Senn    时间: 2025-6-12 20:54
daemonice 发表于 2025-5-15 17:29
给楼主点赞,工作原因,之前试过类似方法做构象生成,提醒下在力场精度下算玻尔兹量分布意义不大,力场本身 ...

是的,所以现在这个程序只是大致做一个参考,因为不吃计算资源,主要是方便计算输入的。高精度的构象搜索这个做不到。最近在尝试结合动力学和一些机器学习势来做,之后有空的时候看看能不能打包一个比较完整的构象搜索程序,但是可能就得上服务器跑了。
作者
Author:
Senn    时间: 2025-6-12 21:07
北大-陶豫 发表于 2025-6-9 14:06
楼主这个程序非常好,但是似乎去重这步的时间太长了。可能可以优化一下去重的算法?首先只比较能量相近的结 ...

这个程序的去重是比较0.5Kcal/mol内的构象,然后比较RMSD,阈值0.5A,现在调用的Allchem的模块。现在主要是尝试结合了一些机器学习势的算法加速高精度的构象优化和能量计算,后续有空的时候可能打包一个结合动力学的构象搜索。不过我也是属于半吊子,边学边干。怎么加速计算还可以研究研究。
作者
Author:
wangwj    时间: 2025-6-29 13:06
楼主你好,我近期在做构象搜索时发现耗时会增加很多,60原子数生成200个构象,在去重步骤上用时一个晚上都没有结束,此前并未出现这个情况,想请教一下楼主是什么原因?




欢迎光临 计算化学公社 (http://ccc.keinsci.com/) Powered by Discuz! X3.3