您的位置首页  学习

网上学习的平台_网上学习网站有哪些

  • 来源:互联网
  • |
  • 2025-04-24
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

血浆蛋白质组作为生物标志物来源存在诸多挑战,如血浆蛋白质组动态范围广;低浓度标志物检测和定量困难;数据解释需考虑多种混杂因素;个体间蛋白质组谱存在显著差异。

网上学习的平台_网上学习网站有哪些

 

血浆蛋白质组作为生物标志物来源存在诸多挑战,如血浆蛋白质组动态范围广;低浓度标志物检测和定量困难;数据解释需考虑多种混杂因素;个体间蛋白质组谱存在显著差异目前血浆蛋白质组检测主要有基于亲和的技术(如 SomaLogic 和 Olink 平台)和基于质谱(MS)的方法:亲和技术具有高通量和可多重检测的优势;质谱方法可测量蛋白质的酶解肽段,能识别蛋白质的翻译后修饰和异构体。

2025年2月14日Alkahest Inc.的Sara Ahadi团队bioRxiv发表名为“The Current Landscape of Plasma Proteomics: Technical Advances,Biological Insights, and Biomarker Discovery”,围绕血浆蛋白质组学展开,对多种血浆蛋白质组分析平台的展开头对头比较研究。

01研究设计样本收集队列特征:78 名健康个体(40 名 55-65 岁,38 名 18-22 岁,男女比例 1:1)血浆样本样本处理:抗凝剂为柠檬酸钠,排除疾病和药物干扰分析平台SomaLogic:SomaScan 11K和 7K,基于 SOMAmers 的荧光检测。

Olink:Olink Explore 3072(3k)Explore HT(5k),基于邻近延伸分析(PEA)与测序MS :MS-Nanoparticle(Seer Proteograph™ XT):纳米颗粒富集后 DIA 分析。

MS-HAP Depletion(Biognosys TrueDiscovery™):去除高丰度蛋白后 DIA 分析MS-IS Targeted(SureQuant™):内标触发平行反应监测数据分析技术评估

:计算检测限(eLOD)、数据完整性、技术变异系数(CV)和线性范围相关性分析:Spearman 秩相关评估平台间蛋白丰度一致性生物学意义:多元线性模型分析年龄、性别等因素与蛋白水平的关联,通路富集分析(GO、Reactome)。

图1.研究概述02研究结果技术评估在所有七个平台中,我们在健康血浆样本中共鉴定出13,007 种独特的血浆蛋白(每种蛋白由一个唯一的 UniProt ID 表示)SomaScan 11K 和 7K 平台提供了最全面的蛋白质组覆盖范围,分别检测到9,645 种和6,401 种蛋白。

每个平台都有其独特的蛋白质检测范围,其中SomaScan检测到的专属蛋白质数量最多与其他平台相比,SomaScan 11K 能识别 3,610 种独特蛋白质,SomaScan 7K 可识别 1,954 种独特蛋白质(图2)。

为了评估不同平台定量的可变性,进行了技术重复实验SomaScan 在所有平台中精度最高,技术变异系数(CV)最低,SomaScan 11K 和 7K 的中位 CV 分别为 5.3% 和 5.8%,这表明 SomaScan 最新版本增加了 3000多个SOMAmer,但其精度并未受到影响。

Olink 5K 中位 CV 是 Olink 3K 的两倍多,分别为 26.8% 和 11.4%(图3)对于Olink 5K 平台,将数据限制在健康血浆中高于估计检测限(eLOD)的测量值后,其变异系数从 26.8% 降至 12.4%,然而过滤后用于计算变异系数的分析物数量也减少了 40%。

不同蛋白质组学方法的技术变异系数与生物变异系数之间的差距差异显著,对于 SomaScan 的两个平台、Olink 3K 以及 MS-IS Targeted 来说,技术变异系数对生物变异性的干扰很小或几乎没有(图3)。

图2.UpSet 图展示了各平台鉴定蛋白质的交集情况(仅显示交集大小超过 100 的组合,共有 254 种蛋白质可在所有平台上定量)

图3.各平台每种分析物的技术变异系数(CV)和总 CV为了评估不同平台的数据完整性,检查了每个平台的缺失值数量,并绘制了数据完整性分布情况SomaScan 11K 和 7K 在全部 78 个样本中的数据完整性分别为 96.2% 和 95.8%,Olink 平台的最新版本 5K 的数据仅为 35.9%。

(图4)另外,为了评估每个平台的临床实用性,研究了它们对FDA批准的已知人类血浆蛋白生物标志物的覆盖情况SomaLogic 平台对这些生物标志物的覆盖范围最广,具体而言,SomaScan 11K 和 7K 平台分别覆盖了 88% 和 76% 的 FDA 批准的生物标志物(图5)。

图4.在每个样品中检测到分析物百分比(根据每个年龄组2/3RDS数据完整性过滤MS数据,基于亲和力平台数据是根据适当LOD过滤)

图5.每个平台确定FDA批准蛋白质生物标志物数量各平台共享蛋白质的相关性重叠蛋白质之间的相关性可以反映出各平台在蛋白质鉴定和定量方面的相似性与差异,重叠蛋白质数量最多的是SomaScan 11K和MS-Nanoparticle,有3978种蛋白质重叠,其次是SomaScan 11K和Olink 5K,有3720种蛋白质重叠

(图6)接下来分析了不同平台间蛋白质强度的相关性,每个亲和平台的两个版本之间相关性很高,SomaScan 11K和7K的相关系数为0.79,Olink 5K和3K,相关系数为0.74在将Olink 5K和3K与其他平台进行比较时,5K的相关性比3K差,SomaScan 11K和7K与其他平台的中位相关性大致相同。

在质谱技术中,MS-IS Targeted与其他平台的相关性最强(与MS-Nanoparticle、MS-HAP Depletion、SomaLogic 7K、SomaLogic 11K、Olink 5K和Olink 3K的斯皮尔曼相关系数分别为0.35、0.46、0.49、0.5、0.56和0.62)。

(图7)此外,除了MS-Nanoparticle之外,所有相关性都呈现双峰模式,这表明存在两组相关性高低分布明显不同的蛋白质为了更好地理解平台两两相关性呈现双峰分布背后的原因,聚焦于所有平台共有的259种蛋白质。

根据CV值,蛋白质被分为两组:小于20%和大于20%每个CV类别中斯皮尔曼相关系数值的分布显示CV小于20%的蛋白质往往与其他平台具有更高的相关性(图8)另外还研究了每个平台的变异系数(CV)与数据完整性之间的关系,数据完整性百分比与变异系数的关系,表明两者之间存在明显的负相关(图9)。

图6.各平台两两之间检测到的蛋白质交集数量

图7.直方图(展示了基于单个蛋白质计算得出的斯皮尔曼等级相关系数(Spearman Rho correlation coefficient)分布情况,斯皮尔曼等级相关系数的中位数以红色显示)

图8.针对所有平台共有254 种蛋白质,单个平台与其他所有平台之间斯皮尔曼等级相关系数的密度图(该密度图根据基线平台的技术变异系数(technical CV)着色)

图9.各平台中每种分析物变异系数百分比(Percent CV)与数据完整性(Data Completeness)关系已鉴定蛋白生物学相关性和方差分析PANTHER蛋白质分类类别在不同平台上的分布覆盖范围上存在巨大差异,这主要是由于各平台覆盖的蛋白质数量不同,以及其靶向或非靶向的特性所致。

其他平台相比,SomaScan 11K覆盖的蛋白质类别数量最多(图10)为了评估这些蛋白质的生物学相关性,采用了一种线性模型,该模型纳入了现有的元数据(年龄、性别、种族、血细胞比容、总蛋白、体重指数和吸烟状况),以识别不同平台上与各因素相关的显著标志物。

对于每个平台识别出的显著标志物数量是校正后的p值(p值<0.05或校正p值<0.05)得出的SomaScan 11K覆盖的蛋白质和蛋白质类别数量最多,与其他平台相比,它在年龄、体重指数和性别方面识别出的生物学相关标志物数量最多

(图11)在分析中,考虑到年龄、性别、种族、血细胞比容水平、总蛋白、体重指数和吸烟状况等已知因素后,评估了每个平台特有的无法解释的方差百分比,MS-IS Targeted、Olink 3K、MS-Nanoparticle、SomaScan 7K和11K解释的方差量大致相同(19.9 - 21.3%)。

(图12)。对于所有平台中具有代表性的前20种蛋白质类别,这些蛋白质具有超过50%的无法解释的方差,所有平台之间共享了50%以上的蛋白质类别(图13)。

图10.各个平台中每种 PANTHER 蛋白质类别中存在蛋白质所占百分比

图11.对于每个预测因子基于 0.05 p 值和 0.05 校正 p 值临界值,各个平台中识别出蛋白质标志物数量

图12.每种分析模式无法通过纳入模型参数解释方差占比(即无法被已纳入模型参数识别方差百分比)

图13.除 MS-IS 靶向平台外所有平台上具有超过 50% 未知方差的蛋白质所属的 PANTHER 蛋白质类别与年龄相关标志物在本研究分析的所有生物学因素中,仔细研究了与年龄相关的标志物对于单独平台独有的年龄标志物而言,SomaScan 11K鉴定出的数量最多,有282个标志物未在其他任何平台中被发现。

,其次是Olink 3K和Olink 5K,它们分别鉴定出176个和99个独有的标志物(图14)所有平台中均出现了7种蛋白质(P07998、P10645、P17936、P18065、P49747、Q15113和Q9NQ79)。

P18065(胰岛素样生长因子结合蛋白 2,IGFBP2)和 P17936(胰岛素样生长因子结合蛋白 3,IGFBP3)是胰岛素样生长因子(IGF)结合蛋白,是众所周知的衰老标志物,并且已在血浆蛋白质组学研究中被确定与衰老相关。

P07998是与实际年龄最具显著性关联的前20种SOMAmer试剂之一尽管各平台间共享蛋白质的相关性相当低,但对各平台共有的显著年龄标志物进行的相关性分析显示出高度的一致性,对显著年龄标志物的通路分析,揭示了不同平台之间的独特模式(图15,16)。

SomaScan 11K、SomaScan 7K和Olink 5K在与分子功能、细胞组成部分和生物学过程相关的GO,Reactome通路方面表现出富集为了评估本研究中鉴定出的年龄标志物的相关性,将所有平台的显著标志物与UKB-PPP中报告的标志物进行了比较。

UKB-PPP使用Olink Explore 3072平台检测的54219名参与者的血浆蛋白质组图谱图17展示了每个平台鉴定出的同时也存在于英国生物银行(UKB)数据集中的标志物数量,观察到每个平台鉴定出的标志物与UKB数据集中的标志物存在重叠,这进一步证实了不同平台鉴定出的与年龄相关标志物的生物学相关性和可靠性。

图14.UpSet 图展示了各个平台上具有显著性年龄标志物的交集情况(显著性由校正 p 值小于 0.05 来判定)

图15.不同平台间共享衰老标志物蛋白质的模型之间系数相关性

图16.每个平台显著性年龄标志物,对每个平台的显著性年龄标志物GO、KEGG和 Reactome 通路分析(每个气泡代表一个term,气泡大小表示涉及的标志物数量,仅显示校正 p 值小于 0.01 显著terms)

图17.UpSet 图展示了各个平台鉴定出具有显著性与年龄相关通路交集情况(显著性由校正 p 值小于 0.01 来判定)03总结不同蛋白质组学平台在蛋白质类别覆盖上差异显著,对于非亲和性的质谱平台而言,能够无偏地检测蛋白质,可通过非靶向或靶向方法进行分析,无需预先选择目标蛋白,因此在对于一些新蛋白的发现以及蛋白翻译后修饰的检测有优势。

另外对于一些有绝对定量要求的蛋白质检测,也可通过对应平台实现,例如文中提到的MS-IS Targeted另一方面对于亲和性平台而言,SomaScan 11K展现出最广泛的覆盖范围在评估蛋白质生物学相关性时,线性模型结合元数据分析揭示了SomaScan 11K在识别与年龄、BMI和性别相关的标志物方面表现最为出色。

而年龄相关标志物,SomaScan 11K拥有最多独有的年龄标志物,且有7种蛋白质在所有平台均有出现,其中包括广为人知的衰老标志物IGFBP2和IGFBP3等与此同时,在SomaScan两个版本的检测中都保持了较低的CV值。

因此对于大规模群体性蛋白质组学的研究而言,SomaScan是更优先的选择最后与UKB - PPP数据集的对比结果,进一步证实了本研究中各平台鉴定出的标志物具有生物学相关性和可靠性总体而言,该研究不仅深入剖析了不同蛋白质组学平台的性能和特点,同时为进一步优化蛋白质组学研究方法和平台应用提供了重要参考。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186