生物信息学 - 基于PP从BLAST数据库中获取HSPs特征并用于GPCR序列的比对与可视化分析

时间:2014-12-08

      已知,蛋白质和核酸的序列分析模块是PP在生物信息学领域的重要功能应用之一。本文所介绍的案例中将展示如何灵活的使用PP中各种序列分析和比对组件完成GPCR蛋白序列的比对工作,其中重点包括如何使用“Convert HSPs to Features”组件将相似性搜索的结果转化为新的蛋白质序列特征并用于新的比对算法中,具体工作流分析的内容包括以下几部分:
      首先,读取fasta格式的小鼠蛋白序列文件,通过PP的序列分析模块中“GPCR PROSITE Filter”组件筛选出小鼠的GPCR蛋白序列,并以BLAST数据库的格式输出到指定文件中。其次,通过另一条pipeline分支来读取指定的人类蛋白序列文件并筛选出符合“GPCR PROSITE”模式的蛋白序列,然后将这些序列进行ClustalW比对,最后将人类GPCR蛋白与上一步操作中筛选出的小鼠GPCR蛋白序列进行本地BLASTp比对,同时通过PP内置的“Convert HSPs to Features”组件将相似性搜索结果HSPs转化为HSP类型的特征进行可视化。此外,本文所描述的protocol还实现了将人类GPCR蛋白与小鼠蛋白的BLAST hits进行 ClustalW多序列比对,并将比对结果进行JalView工具的可视化,方便研究人员对比对结果的分析和使用。
 
图1 Pipeline Pilot中完整的GPCR蛋白序列分析示意图
 
图2 将HSPs作为序列特征与真实的蛋白序列特征进行比较的报告示意图
 
图3 PP中人类GPCR蛋白序列与小鼠蛋白BLAST结果的JalView展示图