AMEND 2.0:基于多重异质网络的模块识别与多组学数据整合方法

《BMC Bioinformatics》:AMEND 2.0: module identification and multi-omic data integration with multiplex-heterogeneous graphs

【字体: 时间:2025年02月10日 来源:BMC Bioinformatics 2.9

编辑推荐:

  本研究针对当前网络分析方法难以整合多类型组学数据的局限性,由美国堪萨斯大学医学中心团队开发了AMEND 2.0算法。该研究通过随机游走重启(RWR-MH)技术实现多重异质网络中的多组学数据动态整合,结合偏置随机游走(B-RWR)和度偏差校正(IN/SDS/BS)方法,在肾细胞癌(TCGA-KIRC)和OGT敲除模型中成功识别出与疾病相关的关键模块(如miR-200c/HIF1A/VEGFA通路和线粒体脂代谢靶点),为复杂疾病的分子机制解析提供了通用性工具。论文发表于《BMC Bioinformatics》,其开源代码和模块化设计将推动精准医学研究。

  

在生命科学领域,多组学技术的快速发展为解析疾病机制提供了海量数据,但如何整合这些异构数据(如转录组、蛋白质组、代谢组)仍是巨大挑战。传统网络分析方法通常仅适用于单一或两种组学类型,且难以处理分子互作网络中普遍存在的度偏差(degree bias)问题。例如,蛋白质互作网络(PPI)中某些"枢纽蛋白"因技术偏好被过度研究,导致基于网络扩散的模块识别算法产生偏差。此外,现有方法如MultiXrank在多重异质网络(multiplex-heterogeneous graphs)的参数化中存在行为不一致问题,限制了其在复杂数据整合中的应用。

针对这些瓶颈,美国堪萨斯大学医学中心的Samuel S. Boyd团队升级了AMEND算法(Active Module identification with Experimental data and Network Diffusion),开发出AMEND 2.0。该研究通过三项核心技术突破实现了多组学数据的动态整合:首先,重构了随机游走重启算法(RWR-MH),使其能处理任意数量的节点类型和网络层;其次,引入偏置随机游走(B-RWR)实现多目标节点筛选;第三,开发了度偏差校正方法(如IN/BS/SDS)。研究团队在肾细胞癌(TCGA-KIRC)和O-GlcNAc转移酶(OGT)敲除模型中验证了方法的有效性,相关成果发表于《BMC Bioinformatics》。

关键技术方法包括:1)基于TCGA-KIRC队列(72例配对肿瘤-正常样本)的RNA-seq/miRNA-seq/甲基化数据整合;2)使用STRING/STITCH数据库构建包含物理互作、功能关联和代谢物-蛋白互作的多重异质网络(57,642节点);3)通过等效变化指数(ECI)分析OGT敲除小鼠的跨时间点多组学稳定性;4)结合超几何检验(ORA)和疾病本体(DO)进行功能富集分析。

随机游走重启在多重异质网络中的应用
研究团队重新参数化RWR-MH算法,解决了MultiXrank中跨层参数(cross-talk)的非线性问题。在KEGG通路验证中,RWR-MH对前100位节点的排名准确率显著优于传统RWR(p<0.05),尤其在异质网络(如PPI-MMI整合网络)中表现最佳。新算法允许不同网络层使用独立种子向量,例如在TCGA分析中同时整合mRNA表达(log2FC)、miRNA丰度和甲基化β值。

度偏差校正方法的性能比较
通过Reactome通路交叉验证,研究发现通胀归一化(IN)在降低扩散分数与节点度的相关性(Pearson r从0.68降至0.21)的同时,仍能保持模块识别敏感性。在模拟实验中,当种子值与节点度负相关时,IN校正后的AMEND模块中高种子值节点的保留率提升35%,优于双随机缩放(BS)和静态分布缩放(SDS)。

偏置随机游走的多目标优化
将TCGA生存数据(HR值)作为B-RWR属性时,关键miRNA(如miR-210-3p)在AMEND迭代中的保留时间延长2.3倍。距离衰减型属性(μi=e-k×di)使模块节点与目标节点(如VEGFA)的平均网络距离缩短19%。

肾细胞癌关键模块的发现
在TCGA-KIRC分析中,AMEND 2.0识别出包含6个miRNA和150个mRNA的模块。其中miR-200c-3p/miR-141-3p通过调控VEGFA促进血管生成,而HIF1A-miR-210-3p-VIM轴与免疫微环境重塑相关。与DIABLO算法相比,AMEND模块中mRNA的加权log2FC显著更高(Mann-Whitney U检验p=0.003),且保留了更多网络拓扑信息。

OGT调控脂代谢的机制解析
在OGT敲除研究中,模块包含167个节点(63 mRNA/60蛋白/16代谢物),其中胆碱代谢通路(CTH/THA1)和线粒体β氧化酶(DECR1/ACSF2)呈现等效下调。ACOX1/ALDH3A2等过氧化物酶体相关蛋白的同步变化,首次揭示了O-GlcNAc修饰(PTM)对肝细胞脂代谢的双细胞器调控作用。

该研究的创新性体现在三方面:方法学上,RWR-MH的参数化使跨组学数据整合更稳定;应用层面,IN校正解决了PPI网络的度偏差问题;生物学意义上,通过OGT模块发现了线粒体-过氧化物酶体协同调控的新机制。开源工具(https://github.com/samboyd0/AMEND)支持自定义网络结构和多目标优化,为癌症、代谢疾病等复杂病症的分子网络解析提供了通用框架。未来工作可拓展至单细胞多组学整合及动态网络建模方向。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号