Rdkit 學習記錄(一)
簡介
Rdkit 是幹個什麼呢,RDkit 是一款開源化學信息學與機器學習工具包,提供C++ 和python 的API 接口。是著名的開源化學信息學工具之一,基於BSD協議,核心數據結構與算法由C++編寫。支持Python2與python3,支持KNIME,支持機器學習方面的分子描述符的產生。
環境
macOS
Python 3.7
安裝
1.Conda模式 官方建議使用Conda進行安裝與管理,Conda可以使用清華的源進行下載,安裝完成後,再次更換其安裝源。換源的命令參考
conda create -c rdkit -n my-rdkit-env rdkit
激活的方法:
conda activate my-rdkit-env
退出環境
conda deactivate
2.Pycharm模式 Pycharm並不能直接安裝RDkit,當使用上一步Conda安裝完成後,將python的環境配置修改爲conda的目錄,即可在pycharm中使用Rdkit。
運行代碼
導入庫
#! /usr/bin/python
# coding: utf-8
# @Time: 2020-05-20 14:53
# @Author:
from rdkit.Chem import AllChem as Chem
from rdkit import rdBase
from rdkit.Chem import Draw
rdkit版本
rint('rdkit版本號=',rdBase.rdkitVersion)
rdkit版本號= 2020.03.2
載入數據繪製分子式
#西地那非(Sildenafil)化學式
smi = 'CCCc1nn(C)c2C(=O)NC(=Nc12)c3cc(ccc3OCC)S(=O)(=O)N4CCN(C)CC4'
m = Chem.MolFromSmiles(smi)
# 化結構式
Draw.MolToImageFile(m,"/Users/st/drug_development/st_rdcit/img/mol1.jpg")
print('化學結構式Sildenafil')
smi2 = 'CCCc1nc(C)c2C(=O)N=C(Nn12)c3cc(ccc3OCC)S(=O)(=O)N4CCN(CC)CC4' #vardenafil
m2 = Chem.MolFromSmiles(smi2)
fp2 = Chem.GetMorganFingerprintAsBitVect(m2, 2, nBits=2048)
西地那非(Sildenafil)結構式