新开发的生物序列处理软件:FasParser

孙艳波  文


中国科学院昆明动物研究所


测序技术的发展使得生物序列(DNA、RNA等)日益增多,从大量的序列数据中挖掘有用的生物学信息,逐渐成为目前众多研究领域的必备手段,这就需要我们必须掌握一些常用的序列处理方法。然而,数据量的增多让某些处理变得非常棘手,尤其像多基因的串联合并、序列的提取、低质量序列的鉴定等。为此,中国科学院昆明动物研究所-两栖爬行类多样性与进化研究组的孙艳波博士开发了一款功能众多且界面友好的软件“FasParser” 来实现上述一些常规的序列分析,2017年3月发表于《Zoological Research(动物学研究)》杂志第38卷第2期110~112页。

原文链接:http://www.zoores.ac.cn/EN/abstract/abstract3797.shtml[PDF]


程序主界面



功能简介

该软件为Windows程序,可运行于个人电脑上。该软件中的大部分功能均具有批处理模式,以用于分析较大的数据集。目前主要包括8个功能模块:


(1)在DNA或密码子水平,计算并查看2条已比对序列之间的差异。该功能在密码子水平下还可以大致计算出两条序列的dN/dS(代表着序列在演化中受到的选择压力)。同时,程序会自动标记同义突变位点(@)和非同义突变位点(#),并采用类似MEGA的样式呈现,方便查看。


(2)鉴定两个比对结果(同一个基因)的重叠区域:不同的比对软件针对同一个基因也可能产生不同的比对结果。一种有效的方法是从多个比对结果中提取出共同的比对区域用于下游分析。


(3)根据序列的名称、长度或给定的条件对序列进行排序/重命名/分类:可以模糊查询,凡是能匹配到关键词的序列都会自动被提取出来。


(4)串联合并多个序列文件:该功能模块的主要功能针对同一批物种,多个基因的序列,并将这些基因的序列串联起来,以用于下游的一些分析。


(5)根据不同遗传编码批量翻译DNA:可以批量翻译(批处理模式),也可以单独翻译一条序列或一个文件。


(6)构建序列比对并转换文件格式:可选择不同的比对软件(Muscle,Mafft,Prank)对多个基因序列进行比对,并可将比对格式转换成其他(phylipi,phylips,nexus,和PAML)。


(7)在特定文件中提取或删除某些序列:从一个大的序列文件中提取指定ID的序列;也可以从一个序列比对中,提取出密码子1、2、3位的序列;可以鉴定比对中是否存在低质量的序列(过短);还可以根据一定的阈值删除GAP列,并将剩余的GAP(-)替换成N。


(8)预测开放阅读框:可以批量预测多序列的ORF(批处理模式),也可以单独预测一条序列。任何模式下都可以提供参考蛋白的序列,用于指导更准确的预测结果。


下载地址

FasParser 程序会得到后期的维护和更新,当前最新版本为1.2.1,可从以下地址免费下载:https://github.com/Sun-Yanbo/FasParser FasParser1.2.1_setup.rar


审核:蒋    珂

编辑:陈宏满