化学信息学 - 上市药物分子中的2D和3D环片段的分析与研究

时间:2014-09-12

上市药物分子中的2D和3D环片段的分析与研究

Two- and Three-dimensional Rings in Drugs

参考文献:Chem Biol Drug Des 2014; 83:450–461

文献链接:http://onlinelibrary.wiley.com/doi/10.1111/cbdd.12260/abstract
 

      随着基于片段的药物设计(FBDD)发展,研究者对化合物片段库的设计开始以多样性导向合成(DOS)为主,对于化合物片段的研究逐步集中到片段估计的多样性,尤其是饱和度和形状复杂度方面的研究。而饱和度与复杂度正是常说的“3D片段”的两大性质特征。如果化合物片段由一个饱和的核心片段,并且含有SP3杂化的C原子,那么该片段就可以定义为含有三维特征的3D片段,与平面芳香环骨架相反。已有大量学术研究表明:增加化合物中3D环片段的含量能够显著提高对应片段筛选库的多样性,改善化合物的ADMET性质,以及更利于作为先导化合物优化的起点。

      为了全面的研究和分析已上市药物分子中的2D和3D环片段,以及其对药物和靶点结合能力的影响情况。本文对2D和3D片段的分类做了如下定义:文中的化合物片段均是一个连续的闭环体系(环片段),其中3D片段必须至少含有一个SP3杂化的C原子,其中对于既含有纯3D片段又含有芳香环的融合环系统又细分为3D-h片段;相反,完全不含SP3杂化的环片段被定义为2D片段。具体分类和定义如图1所示,以蛋白酶抑制剂茚地那维的结构为例。

图1. 文中关于2D和3D环片段的定义方法示意图

      具体实验方法和流程概括如下:首先,是实验数据集的准备,文中从DrugBank中检索2012年3月19日之前所有FDA已批准上市的药物。药物结构数据获取之后经过Pipeline Pilot进行结构标准化预处理,经过处理之后共得到1297个药物分子,同时,作者还采用PP对化合物的物理化学性质(包括:分子量、AlogP、氢键供体数、氢键受体数目和可旋转键数等)做了初步统计分析。其次,采用PP生成化合物片段数据,并根据片段的定义方法计算2D和3D环片段的分类数据。其中,片段生成是采用PP内置的“Generate Fragments”组件实现的,片段中是否含有SP3杂化原子则可以通过定义相关组件参数来实现。再次,作者基于PP的FCFP_4分子指纹对不同片段生成了Tamimoto矩阵,从而评价分子相似性,并基于该相似矩阵进一步分析了不同靶点类型的片段相似性等。此外,作者还通过PP计算了所有化合物片段的主惯性矩(PMI)值作为分子形状的描述符,并采用柯尔莫可洛夫-斯米洛夫检验(Kolmogorov–Smirnov test)来评价2D和3D环片段的形状特征差异,如图2所示。

      本文通过一系列的分析结果表明:3D环片段较2D片段能够提供更多的结构和形状多样性信息,有利于探索新的化学空间;3D环片段对靶点受体有较高的选择性,可以为不同靶点研究体系设计化合物片段库时提供依据;从药物设计的角度而言,3D环片段能够提供优于传统的2D环片段的全新成药性化学空间。

图2. 化合物2D和3D片段的PMI统计分布示意图

Pipeline Pilot在本文中的作用: Pipeline Pilot在药物分子的性质计算和处理过程中起着重要作用,具体包括:(1)原始化合物结构数据的清洗与标准化工作,能够极大的节省数据处理的时间,提供高质量的数据;(2)化合物理化性质的计算,能够快速计算化合物的各种理化性质并进行初步统计分析,方便研究人员对研究体系的宏观了解和快速信息挖掘;(3)化合物片段的相似性打分:ECFP_4和MDL keys相似性打分是化学信息学研究领域常用的相似性搜索算法;(4)化合物形状描述符PMI的计算:用于计算和分析3D环片段的形状特征。