SCITUNA:单细胞数据整合的创新利器,有效消除批次效应并保留生物信号

《BMC Bioinformatics》:SCITUNA: single-cell data integration tool using network alignment

【字体: 时间:2025年03月28日 来源:BMC Bioinformatics 2.9

编辑推荐:

  在单细胞基因组学实验日益复杂的当下,批次效应成为整合多数据集的重大阻碍。研究人员开展 “SCITUNA: single?cell data integration tool using network alignment” 研究,结果显示 SCITUNA 在消除批次效应、保留生物信号上表现优异。这为单细胞数据整合提供了有力工具。

  在生命科学研究的微观世界里,单细胞技术的发展让科学家们能够深入探索细胞的奥秘。通过单细胞技术,人们可以精准识别各种已知和新型细胞类型,进一步明晰细胞特异性分子机制。然而,随着研究的不断深入,一个棘手的问题逐渐凸显出来 —— 批次效应。当研究人员试图整合来自多个数据集的数据时,由于实验在不同实验室、不同时间或采用不同实验方案进行,数据中会出现不想要的技术变异,这就是批次效应。它就像数据中的 “噪音”,严重干扰了真实生物信号的检测,使得细胞聚类出现偏差,影响研究结果的准确性 。为了解决这一难题,来自 Antalya Bilim University、Akdeniz University、Weill Cornell Medicine 等多个机构的研究人员开展了一项重要研究,相关成果发表在《BMC Bioinformatics》上。
这项研究名为 “SCITUNA: single?cell data integration tool using network alignment”,旨在开发一种全新的方法来有效校正单细胞数据整合中的批次效应。研究人员提出了 SCITUNA(Single-Cell data Integration Tool Using Network Alignment)这一创新工具。

研究人员为开展此项研究,运用了多种关键技术方法。首先,收集了多个数据集,包括三个 scRNA-seq 数据集(人类肺数据集、人类胰腺数据集、小鼠后脑发育数据集)和两个 scATAC-seq 数据集(小鼠标脑 scATAC-seq 数据集的峰值和窗口数据),同时还利用 Splatter 软件包模拟了一个数据集 。之后对数据进行预处理,识别高变基因(HVGs)。接着,采用主成分分析(PCA)进行降维,并用 k - 均值算法聚类。通过构建图和二分图来表示细胞间的相似性,以此为基础进行锚点选择和数据集整合。在整合多个批次数据时,运用基于最优传输的排序策略。

研究结果主要从以下几个方面呈现:

  1. 评估指标:使用 scIB 包中定义的指标评估 SCITUNA 性能,这些指标分为批次校正和生物保护指标两类。同时还纳入了过校正分数等指标,综合计算得出每个方法的总体分数12
  2. 不同数据集结果:在多个数据集上对 SCITUNA 与其他方法进行比较。在人类肺数据集上,SCITUNA 总体表现最佳,在生物保护指标上尤为突出,不过在多批次整合时,其与 fastMNN 得分相近;在胰腺数据集、小鼠后脑发育数据集和小鼠标脑(ATAC)数据集上,SCITUNA 同样展现出良好性能,在生物保护方面领先,且在整合不同批次数据时能有效平衡批次校正和生物信息保留;在模拟数据集上,SCITUNA 获得最高总体分数和生物保护分数3456
  3. 可扩展性:对 SCITUNA 的运行时间和内存需求进行评估,发现其在不同数据集上的表现有所差异。在成对整合时,它比部分方法快;在多批次整合时,虽然运行时间较长,但峰值内存使用量通常小于 12GB 。

研究结论表明,SCITUNA 成功地将基于图和锚点的技术相结合,有效解决了单细胞数据整合难题。它通过构建图来精准捕捉细胞间相似性,将整合问题转化为多对一匹配问题,利用迭代校正策略处理未匹配细胞,保留了细胞局部结构。并且,SCITUNA 直接在原始基因表达空间中操作,极大地方便了下游分析。与其他先进方法相比,SCITUNA 在平衡整合效率和生物保护方面表现卓越,有效避免了过校正问题,能够在多种数据集上保持良好性能。然而,该研究也存在一定局限性,例如锚点选择过程有待优化以提升运行速度,目前仅在人类和小鼠数据集上进行了测试 。未来,研究人员计划进一步拓展研究范围,将 SCITUNA 应用于其他生物体数据集,并探索其在整合空间单细胞数据集方面的潜力。总体而言,SCITUNA 为单细胞数据整合提供了一种强大且有效的工具,为生命科学研究在单细胞层面的深入探索奠定了坚实基础,有望推动相关领域取得更多突破性进展。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号