新闻资讯

AI驱动质谱技术 聚焦精准医疗

重磅!十八位两院院士和多国科学家团队在Nature发文全面介绍π-Hub人体蛋白质组导航计划

来源:市场部发布时间:2024-12-20浏览量:26

20241211日,来自蛋白质组学国家重点实验室、北京蛋白质组研究中心的贺福初院士瑞士苏黎世联邦理工学院的Ruedi Aebersold教授联合近百名国际科学家Nature上发表了题为“π-HuB: the proteomic navigator of the human body”的前瞻性论文。该论述详细介绍了π-HuB(人体蛋白质组导航)计划的三大核心目标、六大支柱支撑、五大主要挑战,最后展望了未来10π-HuB项目第一阶段的主要成果

图片1.png

蛋白质组学与π-HuB计划

人类基因组计划(HGP)绘制出了一幅详尽的人类基因组图谱,并确定了人类大约 20300 个蛋白质编码基因。这彰显了数据驱动、大规模协调开展的 组学项目在变革生物医学研究方面的强大力量,催生了由基因组学驱动的精准医学。然而,由于人体的组织 / 器官以及细胞常常会因环境变化而经历广泛的、可逆或不可逆的改变,因此,所观察到的细胞及机体的复杂性并不能仅凭基因组信息来预测。

蛋白质作为细胞机制的基本功能要素,几乎参与了生物体内的所有生物学过程。现有研究已证实蛋白质是引发和推动各类疾病发生发展的关键因素,同时也是绝大多数药物的主要分子靶点。因此,蛋白质组学提供的并非像基因组学那样的静态视角,而是关于人体动态情况以及人体对环境变化适应性的信息。

2001 年,人类基因组序列发表的同时,一群蛋白质组学研究人员创立了国际人类蛋白质组组织(HUPO)。2010 9 月,HUPO启动了人类蛋白质组计划(HPP),其目标是利用质谱分析法为所有人类蛋白质编码基因的表达寻找高质量证据。十年后的 2020 年,HUPO 人类蛋白质组计划项目团队描绘出了首张高严谨性的人类蛋白质组图谱,覆盖了 90.4% 的标准人类蛋白质组,这一进展与HGP的十年成就相媲美。到 2023 年,研究团队已经检测到19,750个标准人类蛋白中18,397个(93%),并生成了用于高度特异性目标质谱测量的参考光谱集,覆盖了99%以上的已注释人类蛋白。

早在2003年,中国就启动了第一个专注于人类器官(人类肝脏蛋白质组计划)的蛋白质组学项目,成为HPP的先驱。随后,越来越多的疾病相关器官/组织蛋白质组得到了分析但人类蛋白质组复杂性仍待深入探索。

2020 年,中国科学技术部资助了一项由全球约 40 个蛋白质组学研究团队参与的合作项目,并促使 人体蛋白质组导航π-HuB计划的提出。该项目目前正在组建一个由中国及国际科学家构成的联盟,旨在从人体所有主要组织 / 器官以及细胞类型中生成海量蛋白质组数据集,并以前所未有的规模对这些数据进行综合分析。其目标是构建一个名为 “π-HuB 导航的智能计算引擎,该引擎将整合多模态蛋白质组数据集,以增进对人类生物学的理解,助力疾病风险评估和诊断,发现新的药物靶点,优化恰当的治疗策略,进而实现智能医疗保健。

 

π-HuB 项目的三个核心目标

π-HuB 项目以支持国际和跨学科科学家的协作为使命,计划投资数十亿元人民币,历时三十年,致力于实现以下三个具体目标(图 1)。

图片2.png

探索人体基本原理

π-HuB 项目首先将人体解构为一系列数字蛋白质组解剖学空间。通过利用单细胞和空间蛋白质组学等快速发展的技术,借助多模态数据融合等技术进展,揭示细胞 / 组织 / 器官的构建原理及生物过程的分子 / 细胞机制,展示从蛋白质网络到表型的因果关系。

构建Meta Homo Sapiens模型

π-HuB项目将深入探究个体生命周期内蛋白质组的动态变化,在群体层面探索人类蛋白质组如何适应各种影响健康结果的因素。具体目标是1追踪产前和产后主要阶段以蛋白质组为核心的变化轨迹;2)描绘复杂疾病发生发展过程中复杂蛋白质组的纵向动态变化,(3)确定非遗传因素(例如,共生微生物组、生活方式和不同环境)对人类蛋白质组的影响。通过整合各种来源的组学数据,并投射到一个名 “Meta Homo Sapiens” 的数字化模型中。构建这样一个模型将借助人体的构建原理使用三维解剖学层次结构记录器官、组织、体液和细胞在各个层次的数字特征。

构建π-HuB导航器

π-HuB 项目的目标是实现由蛋白质组学驱动的实践智慧医学与传统及当前的医学模式不同,实践智慧医学旨在培养对人体状态进行精准控制以预防疾病的能力。π-HuB 导航器作为一种虚拟的状态空间工具,由生理表型以及细胞、体液、组织和器官中面向蛋白质组的时空生化 / 生物物理信息汇聚而成。构建这样一个导航将提供追踪健康轨迹的机会,确定在疾病风险评估和早期诊断中起重要作用的因素,并推动开发新的治疗干预措施以及智能医疗保健方法

 

构建π-HuB导航器的六大支柱

为实现上述目标,该项目由六个关键支柱支撑(图 2)。

图片3.png

 

人类生物样本

人类生物样本是 π-HuB 项目的基石为实现上述目标π-HuB 项目的样本可分为以下几类:(1从尸体检查中获得的新鲜制备的器官、组织和活体人类样本。2)双胞胎队列3来自世界不同地理区域、具有不同生活方式并处于不同环境的大量个体的横断面队列4包含健康个体或具有明确暴露因素且对健康或治疗有影响或结果的患者纵向队列

测量技术创新

(1)单细胞蛋白质组学(SCP2)空间蛋白质组学3)血浆蛋白质组分析4)功能蛋白质组学

计算技术创新

(1)自动化机器学习(AutoML2)可解释人工智能(XAI3)大语言模型(LLM

大科学基础设施

π-HuB项目将建立国家设施/中心,作为收集和处理多层蛋白质组数据的大科学基础设施。在π-HuB项目的第一阶段,这样的基础设施至少应能够每天处理1000-2000个样本,并每天生成1TB的质谱原始数据

开放资源

π-HuB项目将强调高效、国际化和开放的资源。所有π-HuB生成的(非敏感)原始数据将通过遵循 FAIR 原则的数据门户提供给国际科学界,如ProteomeXchange联盟建立的PRIDEiProX将开发生物信息学基础设施整合蛋白质组图谱至UniProt,并基于π-HuB分子和空间数据开发一个基于网络的Meta Homo Sapiens计算框架,使临床医生和患者能查询医疗干预策略。

国际研究团队

第六支柱是,包括研究人员、软件工程师、临床医生、病理学家、项目经理、管理人员、财务人员、律师、商业实体等。实施π-HuB项目需要全球众多人员之间的协同合作,在决策机构的指导下共同工作,同时也需要明确的治理和问责准则

 

构建π-HuB导航器的挑战

伦理

将成立一个专门的伦理委员会,其主要职责是监督项目的各个方面,包括生物样本收集、分析、数据管理和信息传播。

大数据

π-HuB将与现有的国际数据中心(如ProteomeXchange联盟)紧密合作,以确保数据标准和管理规则与蛋白质组学领域广泛采用的标准保持一致。然而,π-HuB项目还需要一个专门设计、适合其特定目的的数据中心。

数据生成与整合

π-HuB联盟将首先确保所有人类样本都按照标准操作规程(SOPs)进行收集、注释、处理、存储和追踪。鉴于预期的方法发展速度,该联盟还将开发和共享标准、测试样本和基准数据,以帮助每个研究中心更新新技术的SOPs

此外,还需要具有强大泛化能力的新计算方法和机器学习模型来进一步发展蛋白质组数据分析(例如质量控制、数据清洗、归一化和缺失值填补),并专门解决那些可以从多模式和跨中心/实验室测量中受益的问题。

建模

π-HuB导航器将基于计算驱动的Meta Homo Sapiens人类蛋白质组模型构建,该模型将包含三个基本模块(图3):(1状态识别器,通过以蛋白质组为中心的测量来编码人体在状态空间中的不同状态,随后通过多模态大型语言模型(LLM)整合人体的表型信息;(2)谱系追踪器,量化不同生理/病理/治疗条件下每对状态之间的转移概率3)路径规划器,通过平衡疗效、财务成本和个体依从性等各种目标来搜索最佳治疗轨迹。

图片4.png

蛋白质组学的普及

为临床医生和公众构建π-HuB项目的交互界面是一个主要目标,以提高公众意识和参与度。π-HuB联盟还将为临床医生、病理学家和患者提供培训和教育,帮助他们解读和使用蛋白质组学数据,并推动由蛋白质组学驱动的成果应用于临床和医疗保健领域。

 

π-HuB项目第一阶段成果展望(2024 - 2033

在启动与发展阶段(2024 - 2033 年,在此称为 第一阶段),将构建一个国际合作网络,通过推动方法学进步、对前沿技术进行标准化基准测试、构建用于数据整合及建模的计算基础设施等方式,为该项目奠定技术基础。与此同时,在相对较短的时间范围内,取得如下主要成果

细胞类型组织的基本原则

在第一阶段,将首先使用最先进的流式分选技术和并行质谱采集平台的组合,为所有主要器官构建参考细胞类型蛋白质组图谱。基于细胞类型解析的多维蛋白质组图谱,结合前沿的计算和生物信息学方法,将能够揭示主要组织 / 器官的细胞类型组织构建原理。

蛋白质组学驱动的生活方式指南

将从大规模自然人群中收集大量生物液体蛋白质组,旨在:(1)绘制与涉及疾病易感性的基因变异相关的循环 / 组织蛋白质及蛋白质等位基因变异的数量性状位点图谱,以便构建致病通路;(2)通过量化五个主要产前阶段(配子发生、受精、胚胎发育、胎儿发育和分娩)以及五个主要产后阶段(青春期、性成熟期、妊娠期、更年期和老年期)生物液体蛋白质组的动态变化,追踪人类生命周期内的蛋白质组变化轨迹;(3)分析四种主要饮食营养模式(西方饮食、日本饮食、地中海饮食和温饱型饮食)对人体生物液体蛋白质组的影响;(4)根据 Köppen-Geiger 气候分类图,将人群分为六种主要生态环境(热带、温带、寒带、干旱、极地和高原),分析人在适应过程中的蛋白质组轨迹;(5)绘制人体肠道和皮肤蛋白质组与来自内外部环境的代表性微生物群落之间的相互作用图谱,并构建人体蛋白质组针对微生物群落的适应变化轨迹;(6)绘制人体蛋白质组对诸如药物治疗、饮食和运动等各种临床干预策略的反应图谱。

蛋白质组学驱动的精准医学推广

π-HuB 项目的框架下,组织大规模、国际多中心的队列研究来验证用于重大疾病早期及伴随诊断的新生物标志物将更具可行性。为此,研究团队计划绘制十个主要器官及其相应生物液体在不同病理生理阶段的蛋白质组图谱,针对每个相关器官重点关注三到五种代表性疾病。此类分析,连同前面提到的具有细胞类型分辨率的组织蛋白质组图谱以及带有面向生活适应性蛋白质组图谱的生物液体蛋白质组图谱,将有助于构建描绘这些疾病发生发展的蛋白质组进化轨迹,以及与特定生命阶段和生存条件相关的通路。此外,π-HuB 项目将积极与临床医生、政策制定者和行业合作伙伴开展协作,以推动发现可应用于临床疾病诊断和药物研发的新型蛋白质类生物标志物及药物靶点,推动向蛋白质组学驱动的精准医学模式转变。

展望

2020 年启动以来,π-HuB 联盟已发展成为一个拥有 100 多名成员的国际合作力量,动员了全球学术、产业和政府部门中从事蛋白质与健康科学领域的科学家们。

π-hub计划在Nature杂志成功发表后,1217日,π-HuB计划建设工作座谈会在广州胜利召开。钟南山郑泉水鄂维南宋尔卫等两院院士,Ruedi AebersoldRobert MoritzMing LiTony HunterMichael Snyder 等国外院士和国家科技部、广东省、广州市等有关单位领导出席了座谈会。

图片5.png

座谈会强调了“π-HuB计划通过全球顶级科学家团队的大联盟、大协作,绘制人类全生命周期全球性重大疾病及代表性膳食模式、生存环境对应的人体蛋白质组图谱,解析人类蛋白质组构成原理和演变的规律,探索生物医学大数据从信息知识到智慧的路径,实现人体蛋白质组定位系统和人体从非健康状态到健康状态的精准导航。“π-HuB计划”的实施,将增进对人体生物学的深度理解、促进疾病风险评估、设计早期疾病诊断、最佳治疗干预方案和智慧医疗的发展,极大推动蛋白质科学领域的技术进步,带来系列新的诊疗方法和药物靶标的发现,开创健康管理的新范式,并推动医学领域向以主动健康为导向的新时代变革。

AI驱动质谱技术,聚焦精准医疗

加拿大滑铁卢大学教授、加拿大皇家学会院士百蓁生物&BSI公司创始人π-HuB计划的核心科学家李明院士是研究 Kolmogorov复杂性的世界权威专家,在研究机器学习,自然语言处理,算法平均复杂度,信息距离和生物信息学等方面解决了多个几十年未解难题,并今年因“在现代信息论和生物信息学的开创性和突出贡献”获得2024 W. Wallace McDowell Award该奖IEEE计算机协会颁发的最高技术奖。

李明院士团队积极参与π-Hub的大科学计划,BSI2022年坎昆的HUPO大会的人体导航计划启动会上签署谅解备忘录,表示愿意加入这一伟大的努力。我们自2017 ,首次将基于卷积神经网络的深度学习技术引入肽段从头测序,开发了DeepNovo 计算模型,并广泛应用在抗体测序,蛋白质组学,免疫多肽组学等多个领域。经过24在质谱数据分析算法领域深耕,公司旗下的PEAKS®️系列软件已成长为蛋白质质谱数据分析领域公认的标杆产品,在全世界拥有数千家学术和工业用户,并作为工具被5000多篇顶尖论文引用。

2020年,李明院士团队首创基于质谱的抗体和新抗原从头测序技术落地中国,创立了BSI在中国的分公司百蓁生物,致力于构建免疫组学中心,推进抗体和新抗原在肿瘤和自身免疫治疗中的应用。利用AI驱动质谱技术,推动精准医疗的企业目标,也与π-Hub大计划不谋而合。自成立以来,BSI/百蓁生物完成了肿瘤新生抗原发现的全新工作流程,开发了基于人工智能算法的DeepImmu一站式解决方案,从样本处理、新抗原发现到新抗原验证,助力肿瘤免疫治疗研发。同时,开发的NeoDiscoveryTM HLA-I型免疫肽富集试剂盒在2023第九届上交会获得“优秀生物医药项目奖”。并于2024年推出了多克隆抗体发现的自动化平台PolySeq.AI,加速免疫治疗解决方案的建立。


<< 上一篇
返回列表
下一篇 >>