基于生物信息学和机器学习方法识别 ST 段抬高型心肌梗死(STEMI)中与 M1 巨噬细胞相关的生物标志物及其意义

《Scientific Reports》:Identification of biomarkers associated with M1 macrophages in the ST-segment elevation myocardial infarction through bioinformatics and machine learning approaches

【字体: 时间:2025年04月02日 来源:Scientific Reports 3.8

编辑推荐:

  为解决 ST 段抬高型心肌梗死(STEMI)预后差、缺乏能区分临床亚型及指导治疗的生物标志物问题,研究人员开展识别与 STEMI 免疫浸润相关血清生物标志物的研究。结果发现 AKT3、GJC2、HMGCL 和 RBM17可提高 STEMI 诊断准确性,为治疗提供新方向。

  在心血管疾病的领域中,心肌梗死(MI)就像一颗随时可能引爆的 “炸弹”,严重威胁着人们的健康。每年我国新增 MI 病例超百万,每三个心脏病发作患者中就有一人不幸离世,而且 MI 还会引发心律失常、心力衰竭等多种严重并发症。目前,MI 分为 ST 段抬高型心肌梗死(STEMI)和非 ST 段抬高型心肌梗死(NSTEMI),其中 STEMI 最为严重,通常意味着冠状动脉完全闭塞,急需救治。多年来,血清肌钙蛋白 I、肌钙蛋白 T 和肌红蛋白等生物标志物的升高一直是诊断 MI 的依据,但它们无法区分 MI 的临床亚型,也不能指导针对性治疗。
在 STEMI 发病过程中,免疫细胞尤其是巨噬细胞起着关键作用。巨噬细胞有 M1 和 M2 两种表型,M1 巨噬细胞在损伤早期吞噬坏死细胞和基质碎片,释放大量促炎细胞因子,而 M2 巨噬细胞则促进心脏恢复。因此,识别与 M1 巨噬细胞相关的生物标志物,对 MI 的诊断、细胞因子调节、干细胞治疗和免疫细胞治疗都至关重要。

为了解决这些问题,中国人民解放军总医院等机构的研究人员开展了一项研究,相关成果发表在《Scientific Reports》上。研究人员旨在通过整合生物信息学和机器学习方法,识别与 STEMI 和 M1 巨噬细胞免疫浸润相关的新生物标志物。

研究人员用到的主要关键技术方法包括:首先,从基因表达综合数据库(GEO)中获取相关数据集,以 “myocardial infarction” 为关键词进行搜索,筛选出符合条件的 GSE59867 和 GSE62646 数据集。然后,利用多种 R 语言包进行数据预处理和分析,如使用 GEOquery 包读取数据集,Limma 包进行差异基因表达分析,CIBERSORTx 算法评估免疫细胞浸润比例。还运用了加权基因共表达网络分析(WGCNA)构建基因共表达网络,以及蛋白质 - 蛋白质相互作用(PPI)网络来筛选关键基因。最后,通过随机森林、最小绝对收缩和选择算子回归(LASSO)、极端梯度提升(XGBoost)等机器学习算法筛选重要特征基因,并使用实时荧光定量聚合酶链式反应(PCR)在患者样本中进行验证。

下面来看具体的研究结果:

  • STEMI 样本中差异表达基因(DEGs)的异质性:研究人员对 GSE59867 数据集进行标准化处理,通过主成分分析(PCA)图和箱线图验证标准化成功,并去除异常值。差异基因表达分析发现,对照组和 MI 组之间有 362 个差异表达基因,其中 293 个下调,69 个上调,这些基因在两组间有明显分类效果,但 STEMI 样本存在一定异质性。
  • M1 巨噬细胞与 STEMI 发生呈正相关:利用 CIBERSORTx 算法评估免疫细胞浸润比例,发现与对照组相比,STEMI 组中 M1 巨噬细胞等六种免疫细胞类型上调,且这些免疫细胞类型之间存在显著相关性。WGCNA 分析确定了与 M1 巨噬细胞显著相关的蓝色和棕色模块,模块基因与差异表达基因相交,得到 295 个重叠基因,构建的 PPI 网络保留 82 个基因用于后续分析。
  • 与 M1 巨噬细胞相关的 DEGs 可有效区分 STEMI 患者:通过一致性聚类分析,发现当 K=2 时,能将 STEMI 患者分为两个分子亚型,且 M1 巨噬细胞相关基因在 M1 型患者中下调,在 M2 型患者中上调。进一步分析两个亚型之间的差异表达基因,得到 200 个差异基因。
  • 利用机器学习算法筛选 STEMI 亚型的特征基因:取 STEMI 亚型之间的差异表达基因与 PPI 网络中心基因的交集,得到 31 个特征基因。经过 XGBoost、LASSO 和随机森林三种机器学习算法分析,最终确定 AKT3、GJC2、HMGCL 和 RBM17为免疫亚型的特征基因。
  • 4 个特征基因在 GSE59867 和 GSE62646 中的表达和预测性能:在 GSE59867 和 GSE62646 数据集中,AKT3、GJC2、HMGCL 和 RBM17的表达水平在 STEMI 组低于对照组,在 M1 型 STEMI 患者组低于 M2 型患者组。受试者工作特征(ROC)曲线显示,这些基因在预测 STEMI 和 STEMI 亚型方面具有较强的诊断价值,在 GSE62646 数据集中,AKT3、GJC2、HMGCL 和 RBM17预测 STEMI 的曲线下面积(AUC)分别为 0.758、0.732、0.543 和 0.811。
  • 患者特征和关键基因的实时 PCR 验证:研究纳入 16 例 STEMI 患者和 8 例对照患者,STEMI 组患者 C 反应蛋白(CRP)、心肌肌钙蛋白 T(cTnT)等指标高于对照组。实时 PCR 分析表明,AKT3、GJC2、HMGCL 和 RBM17在 STEMI 组和对照组之间存在差异表达,其中 AKT3、HMGCL 和 RBM17在 STEMI 组显著下调。

研究结论和讨论部分指出,研究人员通过严谨的生物信息学分析,确定了 AKT3、GJC2、HMGCL 和 RBM17这四个与 STEMI 早期 M1 巨噬细胞免疫微环境密切相关的关键基因。这些基因在诊断 STEMI 方面具有较高的准确性,有望成为可靠的诊断生物标志物。这一发现为 STEMI 的治疗开辟了新的方向,有助于开发更有效的治疗策略。然而,该研究也存在一些局限性,如数据库数据存在偏差、验证集样本量较小、对患者的验证方法不够全面、尚未明确四个基因相关的具体分子通路等。未来需要进一步研究来解决这些问题,推动 STEMI 治疗的发展。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号