药物设计-基于机器学习方法进行的中药类药性分析研究

时间:2015-01-15

定量构效关系(QSAR研究工具是经典的基于配体分子的药物设计方法,采用数理统计方法研究和揭示化合物活性与其分子结构或理化特性之间的定量变化规则,并利用寻找到的活性与分子性质间的定量变化规则,预测新的化合物的活性,广泛应用于药物、环境科学、农业化学、毒理学等领域。Discovery Studio中提供2D-QSAR和3D-QSAR两种方法,其中2D-QSAR可以计算接近千种与生物活性或ADME/T性质相关的描述符同时提供多种统计工具,如Bayesian模型、多元线性回归、偏最小二乘法等,用于对各种复杂数据进行建模和数据挖掘。
 

ref:Mol. Pharmaceutics. 2012, 9, 2875−2886. IF=4.787

链接:http://pubs.acs.org/doi/abs/10.1021/mp300198d
 

      定量或定性地描述已知药物的类药特性,可以帮助药物化学家和计算化学家从大量化合物中筛选出更高效的药物先导化合物以及提高药物研发效率。为了达到这个目的,本文采用贝叶斯分类方法和递归分割方法,基于大量分子物理化学性质和分子指纹,构建了更为精确可靠的类药性预测模型并对中草药化合物进行类药性的评价。所用于构建模型的数据库为药物数据库MDDR和非药数据库ACD。首先,文章研究了不同的分子描述符包括物理化学性质描述符和分子结构特征描述符(分子指纹)对于模型精度的影响;随后,系统研究了用于构建模型的训练集的大小和构成对类药性模型预测能力的影响,同时基于Discovery Studio 2.5,采用DS 2D-QSAR对不同的机器学习方法,包括朴素贝叶斯分类方法和递归分割方法,构建得到的模型的预测精度也进行了比较;最后,用所得到的预测精度最高的模型对新新版的中草药化合物数据库TCMCD进行了类药性定量评价。

                                  

 

为什么选择Discovery Studio
1. Discovery Studio中提供2D-QSAR和3D-QSAR两种方法,可以利用化合物结构和活性信息构建QSAR模型,解释化合物构效关系并预测化合物活性;
2. Discovery Studio中2D-QSAR可以计算接近千种与生物活性或ADME/T性质相关的描述符同时提供多种统计工具,如Bayesian模型、多元线性回归、偏最小二乘法等,用于对各种复杂数据进行建模和数据挖掘。
3. Discovery Studio应用广泛,操作简便,图形化界面十分友好,结果易于分析。