来源:百蓁生物发布时间:2022-06-10浏览量:385次
2022年6月7日,百蓁生物/BSI创始人辛磊博士、单宝珍博士和李明教授等在国际顶级期刊《Nature Communications》在线发表题为“A streamlined platform for analyzing tera-scale DDA and DIA mass spectrometry data enables highly sensitive immunopeptidomics”的最新研究成果。该研究成果隆重推出了基于人工智能算法的PEAKS online云计算平台,解决了批量质谱数据集的高通量解析难题,把对于质谱DDA和DIA数据的解析和挖掘能力提升到了一个全新的高度,并且成功地从SARS-CoV-2免疫肽组数据中解析出了6个具有强免疫原性的新生抗原肽表位,可以作为COVID-19疫苗开发的潜在靶点。
在基于质谱技术蛋白质组学研究的几十年发展历史中,提高肽端和蛋白质鉴定的灵敏度一直是最重要的研究目标之一。科学家们从质谱实验的不同阶段,包括样品制备、仪器检测、数据采集策略和数据分析等多个方面进行了诸多的尝试和优化改进,来提高整个流程的效率。非数据依赖的质谱采集策略(DIA)允许在一定的m/z和保留时间范围内破碎所有母离子,从而获取样品中所有肽段的二级谱图信息,避免了数据依赖的质谱采集策略(DDA)带来的二级谱图信号缺失的问题。相应的对于质谱数据的解析与挖掘也提出了更高的要求,虽然已经开发出了多种不同的分析方法和软件工具,用于从MS数据中鉴定肽和蛋白质,但是,还有很大的提升空间。
在众多蛋白质组学的研究中,肿瘤相关新生抗原的检测由于其复杂性和丰度原因,对于质谱检测的灵敏度和数据解析的深度提出了很高的要求。此外,最近对基于免疫肽组学的癌症疫苗或病毒相关如COVID-19等传染病的研究表明,在已鉴定的免疫肽中,只有少数T细胞表位能够成为疫苗开发的有效靶点。只有足够高的检测灵敏度以及相关的数据解析能力才能够使得数以千计的免疫肽具有真正的意义。
图1:PEAKS online平台原理
为了解决检测灵敏度和解析深度的问题,李明教授团队整合了不同的MS数据采集策略(DDA和DIA)以及基于深度学习的三种数据分析方法,包括从头测序分析、蛋白质数据库搜索和谱库搜索策略,结合一致的算法、可信度评分计算、FDR卡值以及最新的分布式高性能计算技术,发展了一套现代化且具有友好操作界面的云计算平台,可以实现数千个样本进行高吞吐量分析。
为了评估PEAKS online云计算平台的性能,研发团队对多个标准实验数据集进行了测试。结果显示PEAKS online平台比目前国际上领先的其他算法平台多解析出5-30%的肽段序列。当在三个平行DDA免疫肽组学质谱数据集上进行评估时,PEAKS online根据数据库搜索解析出原先报道1.7-4.1倍的肽段数目,通过深度学习预测可以重新挖掘出以前报道结果1.0-1.4倍的肽段数目。
图2:PEAKS online平台数据解析能力得到了巨大提升
在对DIA免疫肽组学质谱数据集的另一项评估中,PEAKS online结合谱库搜索、数据库搜索和从头测序的集成工作流程共同解析出以前报道的结果1.4-2.2倍的肽段数目,大大提高了谱图的解析率。
图3:PEAKS online平台数据对于DIA数据亦具有很好解析能力
同时,应用PEAKS online平台对SARS-CoV-2 HLA免疫肽组质谱数据进行分析,从受感染细胞中发现了6个T细胞结合表位,这些表位很有可能成为COVID-19疫苗开发的潜在靶点。
图4:PEAKS online平台成功解析到6个新冠病毒T细胞识别表位
PEAKS online云计算平台将在蛋白质组学、免疫肽组学以及新生抗原的发现研究中发挥更为重要的作用,推动相关药物疫苗研发的快速发展。