数据非依赖采集(DIA)质谱蛋白质组学产生可重复的蛋白质组数据。本研究评估了五种工具(OpenSWATH、EncyclopeDIA、Skyline、DIA-NN和Spectronaut)在TripleTOF、Orbitrap和TimsTOF Pro仪器上使用六个DIA数据集的性能。通过比较鉴定和定量指标,以及跨工具鉴定的共享和独特之处,评估了基于库和无库方法。结果显示,当光谱库不够全面时,无库方法优于基于库的方法。然而,构建全面库在大多数DIA分析中仍具有优势。该研究为DIA数据分析工具提供了综合指导,有益于DIA-MS技术的有经验和新手用户。
研究工作流程,涉及利用由三种类型的质谱仪生成的六个数据集
研究设计包括了基于库和无库的两种方法,并采用经典的目标-伪目标验证和经验验证相结合的方式来评估工具性能。首先,从不同质谱仪生成的多物种数据集进行分析,如TripleTOF、Orbitrap和TimsTOF Pro,覆盖了不同类型的实验样本。其次,比较了工具在鉴定和定量方面的表现,包括跨工具鉴定的一致性和差异性,以及库和无库方法的效果。
研究细节 (A)用于评估数据分析工具的 DIA 数据集的详细信息;(B)对于每个数据集,这里详细介绍了它们的光谱库和序列库的组成;(C) 三个主要方面包含了我们评估的 DIA 数据分析工具的最相关特征:RT比对、峰组评分和 FDR 模型;(D) 用于评估识别和量化结果的指标的详细信息。
研究结果显示,DIA-NN在鉴定数量方面明显优于其他工具,其鉴定数量超过第二名工具Spectronaut 59.6%至33.5%。Spectronaut在一些数据集中表现出色,EncyclopeDIA在特定数据集上性能较好,而OpenSWATH和Skyline在某些数据集上也取得了良好的成绩。库和无库方法的比较表明,在库较小的情况下,无库方法可以优于库方法,但是在大多数情况下,构建全面的库仍然具有优势。
此外,研究还评估了不同工具之间的交叉一致性,发现它们在鉴定和定量方面的结果具有高度的一致性。此外,还研究了基于库和无库的搜索策略以及公共库和混合库的使用,为用户提供了全面的性能比较。研究还提供了一个统一的格式和比较平台,用于标准化和解释不同工具生成的结果。
然而,研究也存在一些局限性,例如数据集的选择较为有限,实际样本的复杂性可能未能完全涵盖。此外,由于软件工具不断更新,研究的评估结果可能会因软件版本的变化而有所不同。尽管如此,这项研究为DIA数据分析工具的选择和应用提供了有益的指导,为科研人员在定量蛋白质组学领域做出更加明智的决策提供了帮助。
- 本文借助了ChatGPT进行辅助解读,研究详情请参见论文原文。解读若有错漏之处,欢迎大家指正 -
Guomics
郭天南研究员课题组 (https://www.guomics.com) 长期从事蛋白质组学相关研究,联合人工智能,解析生物过程的原理,助力疾病诊疗。团队诚邀优秀研究生及博士后研究人员加盟!