PyTorch第三方库 2. GNN使用PyG的实现( 七 )


在子结构匹配、化学反应等方面发挥着重要作用 。
(SMART编码是前面描述的语言的扩展,可以用来创建查询 。可以将SMART模式看作类似于用于搜索文本的正则表达式(换一种说法就是,smart编码相当于对编码的一种模糊搜索)) 常用的知识:
C c 大写小写C是不一样的,大写代表脂肪碳;小写代表芳香碳 。冒号后面的数字为Atom Map ID羟基O的表示 []判断是否有子结构m.(patt)获取第一个子结构对应的原子编号m.(patt)——返回一个元组m.(patt) 获取所有子结构的原子编号——返回元组表(内含有多个元组...)
以甲氧基苯为例,查找是否含有-OCH3,若有则显示其对应的原子编号 。:
【Code】
from rdkit import Chemm = Chem.MolFromSmiles('c1ccccc1OC')patt = Chem.MolFromSmarts('OC')flag =m.HasSubstructMatch(patt)if flag:print("molecu m contains group -OCH3")atomids = m.GetSubstructMatch(patt)print("matched atom id:",atomids)else:print("molecu m don't contain group -OCH3")
分子指纹就是一种分子的抽象表征,它将分子转化(编码)为一系列比特串(即比特向量,bit.),然后可以很容易地在分子之间进行比较,比较分子的相似性等 。典型的流程是将提取分子的结构特征、然后哈希()生成比特向量 。
使用rdkit中的 from rdkit.Chem.
详情可参考:
化合物相似性搜索 | 基于分子指纹的分子相似性的博客-CSDN博客分子相似性: 相似性原理()指出,总体相似的分子应具有相似的生物活性 。相似性评估 化合物的指纹对于使用计算机考虑化合物的相似性是必需的 。已经提出了各种评估方法,但是最常用的评估方法称为“ 系数 ” 。使用以下等式从两个分子A和B的位阵列指纹计算系数:导入库as p...
~~word~-4--blog-.&spm=1001.2101.3001.4242.3&=7
4. 引用 ?一些视频【强烈安利】其他
Chem : 负责基础常用的化学功能 ( 如 : 读写分子 , 子结构搜索 , 分子美化等 )
: 负责高级但不常用的化学功能。
- 安装问题
装了之后装不上的参考文章:torch-安装教程_机器不学习我学习的博客-CSDN博客
失败原因:
应该是库和库之间依赖的问题,所以torch版本要和还有等都要对应起来!
、 、 、 是一个大佬根据根据版本和一些bug修复持续更新的,因此依赖关系比较严重,根据发布的版本应该对应起来进行安装使用 。
1. —— torch 查看torch版本和the CUDA
2. 按照这个 —安装
【PyTorch第三方库2. GNN使用PyG的实现】安装命令为下图蓝色所示