化学信息学 - 助力Precompetitive药物研发:JECL化合物筛选知识库的介绍

时间:2014-11-04

The Joint European Compound Library: boosting precompetitive research

参考文献:Drug Discov Today. 2014 Sep 6. pii: S1359-6446(14)

文献链接:http://www.sciencedirect.com/science/article/pii/S1359644614003419
 

      已知,在过去的20年里药物研发领域呈现了新药化学实体成功率的降低和研发费用的急剧增加的状况,如何助力竞争前期的药物研究是有效避免这种状况并集成不同专业技术资源的解决方案之一。正是这种模式的指导和促进下出现了多个提供药物发现和生物标志物研发服务平台的成功合作案例,例如:Structural Genomics Consortium和Human Blood Plasma Metabolome Consortium。本文则重点介绍ELF机构的工作人员在收集和整理了7家大型制药公司的in-house化合物库之后建立的JECL筛选库及其相关分析工作。目前,JECL已经成为一个提供完善化合物供应、HTS以及基本性质特征描述等服务的开源服务平台,其网址为:http://www.europeanleadfactory.eu/

      关于JECL化合物库中化合物类药性和多样性分析的描述如下:首先,关于化合物多样性的分析工作:传统的化合物多样性分析是通过互换化合物结构或者基于分子指纹计算化合物相似性打分,但是对于具有专利保护或一些不便披露结构的化合物,不太可能直接获取化合物的结构文件来进行比较和分析。因此,ELF和Dundee大学的工作人员通过Pipeline Pilot定制了计算2D分子描述符的protocol,并分发给各医药公司进行计算并返回结果,基于分子描述符来整合与分析来自不同制药公司的化合物的多样性情况,从而保证分子描述符的一致性和无需具体化合物结构就能够针对不同来源的化合物库进行多样性分析的需求。其次,关于化合物类药性的分析工作:文献中采用了分析化合物结构和物理化学性质的信息,同时也考虑了QED打分,同样,这部分计算工作也是通过定制统一的Pipeline Pilot计算protocol来完成的。相关分析结果如图1所示:

      关于JECL化合物库中化合物生物活性多样性的分析描述如下:为了评价和预测JECL库中化合物所涵盖的生物靶标的范围,作者通过一组贝叶斯分类模型来进行分析和预测。文献中所使用的贝叶斯模型是结合ChEMBL17数据库中已知生物活性的化合物和1855个不同的生物靶标为分类依据建立的,如图2所示,与ChEMBL的类别划分类似,贝叶斯分类结果可以分为两个层面(分别为L1类别和L1_L2类别)。

 

图1. JECL化合物知识库中关键理化参数和多样性的统计分布图

图2. JECL化合物知识库中化合物生物活性分类预测结果示意图