化学信息学 - PP中集成R语言的算法包实现化合物IC50曲线拟合计算的示例

时间:2014-07-09

      PP中该example protocol的具体工作流程可以概括为以下几个部分:首先,通过PP的reader组件读取HTS实验中的孔板实验数据,并经过标准化预处理将化合物的响应值(response values)缩放到[0,100]范围内。然后,通过调用R的非线性迭代加权最小二乘(IRLS)算法包,通过四参数log-logistic模型进行拟合,从而得到生物反应与药物浓度的S曲线关系(即IC50曲线)。最后将曲线拟合结果输出,并通过PP的report组件定制可视化网页报告进行展示。

      值得注意的是,我们在运行该protocol调用R程序进行计算时并不需要用户来编写任何R代码进行计算,而是通过一个已有的PP组件来实现拟合计算的。该组件的作用在于封装调用R算法库的脚本以及相关数据处理等过程,而用户使用时只需要简单配置该组件的参数即可完成不同类型的曲线拟合功能。在如图1所示的protocol中,我们通过改变该组件的参数实现了三种不同类型的IRLS算法的拟合计算,包括:无限制拟合(对"bottom", "top", "logEC50"和"hillSlope"等模型系数不进行任何加权限制),部分限制拟合(仅对bottom进行修正)和区间限制拟合(bottom参数修正为: [-20, 20],top参数修正为: [70, 130],hillSlope参数修正为: [-3, 3])。

      而上述三种不同类型的IC50曲线拟合结果由图2所示,每行从左到右依次为每个化合物由不同类型算法拟合的结果。其中每个IC50曲线图中的浅蓝色矩形条表示LogIC50值的置信区间为95%的范围。

图1. PP中集成R程序包的IRLS算法进行IC50曲线拟合的protocol

 

图2. 三种不同类型的IRLS拟合算法得到的IC50曲线结果比较