质谱分析软件是用于采集数据、分析或展示质谱分析的软件。在蛋白质质谱中,串联质谱(也称为MS/MS或MS2)一般用于蛋白质/肽鉴定。肽鉴定算法分为两大类:数据库搜索和从头搜索。前者针对包含假定存在于样品中的所有氨基酸序列的数据库进行搜索,而后者则是在不了解基因组数据的情况下推断出肽序列。
数据库搜索软件
软件类型介绍
Andromeda (MaxQuant的一部分) 免费软件 Andromeda是一个以概率评分为基础的肽搜索引擎,由德国麻普所的Jürgen Cox等人开发。从搜索的敏感性分析和特异性分析两方面来说,Andromeda的表现和Mascot(一种广泛使用的商业搜索引擎)一样好。它能够以超高的片段质量精度处理数据,能够对翻译后修饰的复杂模式进行分配和评分(例如高度磷酸化的肽),并且能够容纳巨大的数据库。Andromeda可以独立运作,也可以整合到MaxQuant里。这种组合可以在台式计算机上分析大型数据集。共片段肽的鉴定提高了经鉴定的肽的数量。
Byonic 专利 发布于2011年,它最初是在PARC公司研发的,包括在所有类型的仪器中搜索MS/MS数据以及在内部使用Combyne程序,该程序结合肽标识产生蛋白质分数和识别概率。
Comet 开放资源 华盛顿大学开发的数据库搜索算法可用于Windows和Linux系统。注意Comet只是一个执行MS/MS数据库搜索的命令行二进制文件。它接收某些支持的输入格式图谱,并给出.pep.xml、.pin.xml、.sqt和/或.out文件。需要一些其他的支持工具来实际使用Comet的结果(仅适用于Windows的GUI可用)。
Greylag 开放资源 斯托瓦斯医学研究所开发的数据库搜索算法,旨在对具有数百个节点的计算集群执行大型搜索。
InsPecT 开放资源 加州大学圣地亚哥分校计算质谱中心提供的质谱比对搜索算法。
Mascot 专利 通过统计评估观察到的肽段和预测肽段之间的匹配度来进行质谱数据分析。
MassMatrix 免费软件 MassMatrix是一种用于串联质谱数据的数据库搜索算法。它使用质量精度敏感的概率评分模型对肽和蛋白质匹配进行比对。
MassWiz 开放资源 基因组学和整合生物学研究所开发的一种作为windows命令行工具的搜索算法。
MS-GF + 开放资源 MS-GF+(又称MSGF+或MSGFPlus)通过对来自蛋白质序列数据库的肽进行MS/MS谱评分来进行肽鉴定。它支持HUPO-PSI标准输入文件(mzML),将结果保存为mzIdentML格式,结果很容易转换为TSV格式。ProteomeXchange支持使用MS-GF+搜索结果进行完整数据提交。该软件于加州大学圣地亚哥分校计算质谱中心开发,后来在西北太平洋国家实验室(PNNL)投入使用。
MS-LAMP 开放资源 一个独立软件,能解析脂质的电喷雾电离(ESI)和/或基质辅助激光解吸电离(MALDI)质谱数据。
MyriMatch 开放资源 范德堡大学医学中心开发的数据库搜索程序,该设计用于在单个计算机环境中运行或跨整个处理节点集群运行。
OMSSA 免费软件 开放式质谱搜索算法(OMSSA)是一种通过搜索已知蛋白质序列库来识别MS/MS肽图谱的有效搜索引擎。OMSSA使用经典假设检验(与BLAST中使用的统计方法相同)开发的概率得分对重要匹配点进行评分。它是在美国国家生物技术信息中心开发的。
PEAKS DB 专利 数据库搜索引擎,与从头测序并行运行,以自动验证搜索结果,允许在给定的错误发现率下找到更多序列。除了提供独立的数据库搜索,结果还可以作为inChorus软件的多引擎(Sequest, Mascot, X!Tandem, OMSSA, PEAKS DB)共识报告工具。该工具还提供仅通过从头测序识别的序列列表。
pFind 免费软件 pFind是一个基于质谱的蛋白质组学计算解决方案,由中国科学院计算技术研究所于2002年开发。
Phenyx 专利 Phenyx由日内瓦生物信息学(GeneBio)与瑞士生物信息学研究所(SIB)合作开发。它整合了OLAV(一系列统计评分模型)来生成和优化评分方案,该方案可针对各种仪器、仪器设置和一般样本处理进行定制。
ProbID 开放资源 PI是分析串联质谱的有力工具。ProbID旨在满足对串联质谱进行深入分析的需要,包括中国科学院计算技术研究所生物信息学组开发的裂解规则、裂解偏好、中性损失等。
ProLuCID 免费软件 ProLuCID是一个快速且灵敏的串联质谱蛋白质鉴定程序,由斯克里普斯研究所Yates实验室的Tao Xu等人开发的。
ProSightPC and ProSightPD 专利 ProSightPC/PD是根据UniProt衍生数据库搜索肽和蛋白质串联质谱数据的软件。该软件利用已知的蛋白质组集合,可有效地搜索已知的蛋白质组空间,并识别和表征蛋白质组。
Protein Prospector 开放资源 Prospector是由加州大学旧金山分校开发的软件包,由大约20种蛋白质组分析工具组成。它使用根据仪器和碎片模式定制的评分系统来优化不同类型片段数据的分析。
RAId 丢失 美国国家生物技术信息中心开发的Robust accorrect Identification(RAId)是一套蛋白质组学工具,使用精密统计分析串联质谱数据。
SEQUEST 专利 识别从蛋白质序列数据库生成的肽序列串联质谱的集合。
SIMS 开放资源 SIMS是一种在串联质谱上进行不受限PTM搜索的软件,用户无需对潜在PTM进行表征,只需要指定每个氨基酸的修饰质量范围。
SimTandem 免费软件 用于从LC/MS/MS数据中识别肽序列的数据库搜索引擎;该引擎可以用作OpenMS/TOPP中的外部工具。
Tide (rewrite of Crux) 开放资源 Tide是从串联质谱中识别多肽的工具。这是SEQUEST算法的一个独立的重实现,它通过将观察到的图谱与从已知蛋白质数据库中提取的理论图谱进行比较来识别肽。Tide的“祖先”是Crux,但Tide已经被完全重新设计,速度提高了千倍,同时准确复制顺序SEQUEST XCorr的评分机制。
TopMG 开放资源 TopMG是一种软件,通过在蛋白质序列数据库中搜索自上而下串联质谱来识别超修饰蛋白质组。它能够识别具有多变量PTMs和突变的蛋白质组,如组蛋白和磷酸化的蛋白质组。使用质量图,该软件能有效地用多变量PTMs表示候选蛋白质组,提高了蛋白质组鉴定的速度和灵敏度。此外,它还采用了基于近似图谱的过滤方法来过滤蛋白质序列,并使用Markov chain Monte Carlo方法(TopMCMC)来预估鉴定的统计数据。
X!Tandem 开放资源 匹配串联质谱与肽序列。
本文由北京百泰派克生物科技汇总编辑。
百泰派克生物科技专注于蛋白质理化性质分析及结构解析、以质谱技术为基础的蛋白质组学代谢组学技术,致力于建立国际领先的蛋白质研究分析技术平台,为各科研院所和大学提供高效、准确、性价比高的蛋白质(组)研究技术。
数据库搜索软件
软件类型介绍
Andromeda (MaxQuant的一部分) 免费软件 Andromeda是一个以概率评分为基础的肽搜索引擎,由德国麻普所的Jürgen Cox等人开发。从搜索的敏感性分析和特异性分析两方面来说,Andromeda的表现和Mascot(一种广泛使用的商业搜索引擎)一样好。它能够以超高的片段质量精度处理数据,能够对翻译后修饰的复杂模式进行分配和评分(例如高度磷酸化的肽),并且能够容纳巨大的数据库。Andromeda可以独立运作,也可以整合到MaxQuant里。这种组合可以在台式计算机上分析大型数据集。共片段肽的鉴定提高了经鉴定的肽的数量。
Byonic 专利 发布于2011年,它最初是在PARC公司研发的,包括在所有类型的仪器中搜索MS/MS数据以及在内部使用Combyne程序,该程序结合肽标识产生蛋白质分数和识别概率。
Comet 开放资源 华盛顿大学开发的数据库搜索算法可用于Windows和Linux系统。注意Comet只是一个执行MS/MS数据库搜索的命令行二进制文件。它接收某些支持的输入格式图谱,并给出.pep.xml、.pin.xml、.sqt和/或.out文件。需要一些其他的支持工具来实际使用Comet的结果(仅适用于Windows的GUI可用)。
Greylag 开放资源 斯托瓦斯医学研究所开发的数据库搜索算法,旨在对具有数百个节点的计算集群执行大型搜索。
InsPecT 开放资源 加州大学圣地亚哥分校计算质谱中心提供的质谱比对搜索算法。
Mascot 专利 通过统计评估观察到的肽段和预测肽段之间的匹配度来进行质谱数据分析。
MassMatrix 免费软件 MassMatrix是一种用于串联质谱数据的数据库搜索算法。它使用质量精度敏感的概率评分模型对肽和蛋白质匹配进行比对。
MassWiz 开放资源 基因组学和整合生物学研究所开发的一种作为windows命令行工具的搜索算法。
MS-GF + 开放资源 MS-GF+(又称MSGF+或MSGFPlus)通过对来自蛋白质序列数据库的肽进行MS/MS谱评分来进行肽鉴定。它支持HUPO-PSI标准输入文件(mzML),将结果保存为mzIdentML格式,结果很容易转换为TSV格式。ProteomeXchange支持使用MS-GF+搜索结果进行完整数据提交。该软件于加州大学圣地亚哥分校计算质谱中心开发,后来在西北太平洋国家实验室(PNNL)投入使用。
MS-LAMP 开放资源 一个独立软件,能解析脂质的电喷雾电离(ESI)和/或基质辅助激光解吸电离(MALDI)质谱数据。
MyriMatch 开放资源 范德堡大学医学中心开发的数据库搜索程序,该设计用于在单个计算机环境中运行或跨整个处理节点集群运行。
OMSSA 免费软件 开放式质谱搜索算法(OMSSA)是一种通过搜索已知蛋白质序列库来识别MS/MS肽图谱的有效搜索引擎。OMSSA使用经典假设检验(与BLAST中使用的统计方法相同)开发的概率得分对重要匹配点进行评分。它是在美国国家生物技术信息中心开发的。
PEAKS DB 专利 数据库搜索引擎,与从头测序并行运行,以自动验证搜索结果,允许在给定的错误发现率下找到更多序列。除了提供独立的数据库搜索,结果还可以作为inChorus软件的多引擎(Sequest, Mascot, X!Tandem, OMSSA, PEAKS DB)共识报告工具。该工具还提供仅通过从头测序识别的序列列表。
pFind 免费软件 pFind是一个基于质谱的蛋白质组学计算解决方案,由中国科学院计算技术研究所于2002年开发。
Phenyx 专利 Phenyx由日内瓦生物信息学(GeneBio)与瑞士生物信息学研究所(SIB)合作开发。它整合了OLAV(一系列统计评分模型)来生成和优化评分方案,该方案可针对各种仪器、仪器设置和一般样本处理进行定制。
ProbID 开放资源 PI是分析串联质谱的有力工具。ProbID旨在满足对串联质谱进行深入分析的需要,包括中国科学院计算技术研究所生物信息学组开发的裂解规则、裂解偏好、中性损失等。
ProLuCID 免费软件 ProLuCID是一个快速且灵敏的串联质谱蛋白质鉴定程序,由斯克里普斯研究所Yates实验室的Tao Xu等人开发的。
ProSightPC and ProSightPD 专利 ProSightPC/PD是根据UniProt衍生数据库搜索肽和蛋白质串联质谱数据的软件。该软件利用已知的蛋白质组集合,可有效地搜索已知的蛋白质组空间,并识别和表征蛋白质组。
Protein Prospector 开放资源 Prospector是由加州大学旧金山分校开发的软件包,由大约20种蛋白质组分析工具组成。它使用根据仪器和碎片模式定制的评分系统来优化不同类型片段数据的分析。
RAId 丢失 美国国家生物技术信息中心开发的Robust accorrect Identification(RAId)是一套蛋白质组学工具,使用精密统计分析串联质谱数据。
SEQUEST 专利 识别从蛋白质序列数据库生成的肽序列串联质谱的集合。
SIMS 开放资源 SIMS是一种在串联质谱上进行不受限PTM搜索的软件,用户无需对潜在PTM进行表征,只需要指定每个氨基酸的修饰质量范围。
SimTandem 免费软件 用于从LC/MS/MS数据中识别肽序列的数据库搜索引擎;该引擎可以用作OpenMS/TOPP中的外部工具。
Tide (rewrite of Crux) 开放资源 Tide是从串联质谱中识别多肽的工具。这是SEQUEST算法的一个独立的重实现,它通过将观察到的图谱与从已知蛋白质数据库中提取的理论图谱进行比较来识别肽。Tide的“祖先”是Crux,但Tide已经被完全重新设计,速度提高了千倍,同时准确复制顺序SEQUEST XCorr的评分机制。
TopMG 开放资源 TopMG是一种软件,通过在蛋白质序列数据库中搜索自上而下串联质谱来识别超修饰蛋白质组。它能够识别具有多变量PTMs和突变的蛋白质组,如组蛋白和磷酸化的蛋白质组。使用质量图,该软件能有效地用多变量PTMs表示候选蛋白质组,提高了蛋白质组鉴定的速度和灵敏度。此外,它还采用了基于近似图谱的过滤方法来过滤蛋白质序列,并使用Markov chain Monte Carlo方法(TopMCMC)来预估鉴定的统计数据。
X!Tandem 开放资源 匹配串联质谱与肽序列。
本文由北京百泰派克生物科技汇总编辑。
百泰派克生物科技专注于蛋白质理化性质分析及结构解析、以质谱技术为基础的蛋白质组学代谢组学技术,致力于建立国际领先的蛋白质研究分析技术平台,为各科研院所和大学提供高效、准确、性价比高的蛋白质(组)研究技术。