化学信息学-用于评价HDACs酶家族虚拟筛选方法的最大无偏差数据集的构建

时间:2015-04-27

Comparative Modeling and Benchmarking Data Sets for Human Histone Deacetylases and Sirtuin Families
J. Chem. Inf. Model. 2015, 55, 374−388   IF:4.068
文章链接:http://pubs.acs.org/doi/abs/10.1021/ci5005515
 
      虚拟筛选是药物研发的重要手段之一,目前存在着多种虚拟方法。选择合适的虚拟筛选方法或模型是虚拟筛选能否成功的关键因素之一,因此虚拟筛选前需要对虚拟筛选方法/模型进行验证。方法的验证通常是通过计算富集率来进行验证,即将一系列已知活性的化合物与(假设)非活性的化合物(decoys)混合组成的测试集进行测试。测试集中,非活性化合物往往占绝大比例,其质量对验证结果有重大的影响。通常,所选的非活性化合物既要求有足够的化学结构多样性,同时理化性质要与已知活性化合物类似,等等。因此不同靶点的测试集将都不相同,本文作者利用Pipeline Pilot等工具,采用全新的方法,构建了一种针对人组蛋白去乙酰化酶(HDACs)家族的无偏差数据,经过验证,其效果优于DUD-E 及 DEKOIS 2.0等数据集。
 
 

图1、MUBD-HDACs无偏差数据集的靶点分布及其富集率测试验证结果。

 
图2、MUBD-HDACs数据集构建及验证的流程
 
【Pipeline Pilot化学信息模块简介】:化学信息学是Pipeline Pilot的最早的应用领域之一,Pipeline Pilot在该领域为我们提供了一系列完整解决方案:支持多种多样的化合物分子文件的读入和输出,快速地对化合物的进行性质计算、分析和处理等,多种多样的化合物库的构建和分析工具,如相似性和子结构搜索,根据反应或R基团进行枚举化合物库,构效分析等等。