Rdkit 学习记录(一)
简介
Rdkit 是干个什么呢,RDkit 是一款开源化学信息学与机器学习工具包,提供C++ 和python 的API 接口。是著名的开源化学信息学工具之一,基于BSD协议,核心数据结构与算法由C++编写。支持Python2与python3,支持KNIME,支持机器学习方面的分子描述符的产生。
环境
macOS
Python 3.7
安装
1.Conda模式 官方建议使用Conda进行安装与管理,Conda可以使用清华的源进行下载,安装完成后,再次更换其安装源。换源的命令参考
conda create -c rdkit -n my-rdkit-env rdkit
激活的方法:
conda activate my-rdkit-env
退出环境
conda deactivate
2.Pycharm模式 Pycharm并不能直接安装RDkit,当使用上一步Conda安装完成后,将python的环境配置修改为conda的目录,即可在pycharm中使用Rdkit。
运行代码
导入库
#! /usr/bin/python
# coding: utf-8
# @Time: 2020-05-20 14:53
# @Author:
from rdkit.Chem import AllChem as Chem
from rdkit import rdBase
from rdkit.Chem import Draw
rdkit版本
rint('rdkit版本号=',rdBase.rdkitVersion)
rdkit版本号= 2020.03.2
载入数据绘制分子式
#西地那非(Sildenafil)化学式
smi = 'CCCc1nn(C)c2C(=O)NC(=Nc12)c3cc(ccc3OCC)S(=O)(=O)N4CCN(C)CC4'
m = Chem.MolFromSmiles(smi)
# 化结构式
Draw.MolToImageFile(m,"/Users/st/drug_development/st_rdcit/img/mol1.jpg")
print('化学结构式Sildenafil')
smi2 = 'CCCc1nc(C)c2C(=O)N=C(Nn12)c3cc(ccc3OCC)S(=O)(=O)N4CCN(CC)CC4' #vardenafil
m2 = Chem.MolFromSmiles(smi2)
fp2 = Chem.GetMorganFingerprintAsBitVect(m2, 2, nBits=2048)
西地那非(Sildenafil)结构式