编辑推荐:
为解决神经发育障碍疾病诊断难题,横滨市立大学医学院等单位研究人员开展索托斯综合征相关研究。他们发现特定 DNA 甲基化标记,可助力诊断。该研究为罕见病诊断提供新思路,强烈推荐科研读者阅读。
在神秘的生命科学领域,DNA 甲基化就像一把神奇的钥匙,掌控着基因表达的大门,对许多生物过程有着至关重要的影响。它参与了基因组印记(让某些基因根据亲代来源进行特异性表达)和 X 染色体失活(使雌性哺乳动物两条 X 染色体中的一条失活,维持基因剂量平衡)等重要生理活动,同时在疾病的发生发展过程中也扮演着关键角色。
在神经发育障碍(NDDs)的研究中,科学家们发现不同综合征有着独特的 DNA 甲基化标记组合,也就是 DNA 甲基化特征(DNA methylation signatures 或 episignatures)。这些特征就像是疾病的 “指纹”,可以用来评估检测到的基因变异的致病性。以往,研究人员通常使用甲基化阵列来检测这些特征,但这种方法有不少缺点,不仅需要额外的实验和评估成本,而且在检测范围和准确性上也存在一定的局限性。
随着科技的发展,长读长测序技术(LR - GS)应运而生。它就像是一个拥有 “火眼金睛” 的神器,不仅能够更全面地检测基因变异,包括单核苷酸变异(SNVs)、结构变异(SVs)、复杂结构变异、重复扩增突变和拷贝数变异(CNVs),甚至在以前测序技术难以攻克的重复区域也能大显身手。更厉害的是,它还能同时检测 DNA 甲基化。这意味着,利用长读长测序技术,有可能实现基因和表观遗传变化的同步评估,大大提高基因检测的准确性,为疾病诊断带来新的希望。
为了探索长读长测序技术在疾病诊断中的应用潜力,尤其是在 Sotos 综合征诊断方面的价值,来自横滨市立大学医学院人类遗传学系等多个单位的研究人员展开了深入研究。他们的研究成果发表在《Clinical Epigenetics》期刊上,论文题目是《Diagnostic utility of single - locus DNA methylation mark in Sotos syndrome developed by nanopore sequencing - based episignature》。
研究人员在这项研究中使用了多种关键技术方法。首先是纳米孔长读长基因组测序(nanopore LR - GS),通过从外周全血中提取基因组 DNA,经过一系列处理后进行测序。其次是纳米孔自适应靶向长读长测序(adaptive T - LRS),用于对特定区域进行更高效的测序。此外,还运用了 PacBio 高保真长读长基因组测序(HiFi LR - GS)技术,从另一个角度为研究提供数据支持。同时,研究人员利用 DSS 程序进行差异甲基化分析,筛选出差异甲基化区域(DMRs);使用支持向量机(SVM)构建预测模型,对疾病进行分类预测 。
下面我们来看看研究的具体结果:
- 纳米孔长读长 DNA 甲基化分析的性能:研究人员先用 16 个来自健康对照的 PromethION 数据集,评估了纳米孔长读长 DNA 甲基化分析流程检测 5 - 甲基胞嘧啶(5 - mC)的性能。他们发现,纳米孔测序与甲基化阵列的相关性高达 0.95,而且纳米孔测序能够覆盖 98% 左右的常染色体 CpG 位点,相比之下,甲基化阵列的覆盖度仅为 3%。此外,纳米孔测序不存在短读长测序中常见的高 / 低 GC 含量偏差问题。这表明纳米孔测序流程能够在全基因组范围内提供可靠的 5 - mC 图谱。
- 纳米孔测序检测 DMRs 的优势:除了随机 X 染色体失活,基因组印记也是一种重要的基因表达调控机制。许多基于亲本来源的印记 DMRs(iDMRs)与人类疾病相关。研究人员利用纳米孔测序的优势,能够直接比较两个单倍型的甲基化水平。他们在全基因组水平上平均检测到 3976 个 DMRs,其中 88% 的已被充分研究的 iDMRs 在一个代表性数据集中被正确检测到。例如,在 H19 DMR 区域,纳米孔测序清晰地展示了两个单倍型的甲基化差异。研究人员还对 NOTCH2NLC 基因的 GGC 重复扩增进行研究,发现通过全基因组筛选,能够准确地将其识别为显著的 DMR。这表明纳米孔测序在检测难以测序区域的 DMRs 方面具有很大优势。
- 纳米孔测序在罕见病 DNA 甲基化特征中的应用:研究人员选择了 Sotos 综合征和 ATR - X 综合征进行深入研究。以往基于 EPIC 阵列的研究报道了这两种综合征的 DNA 甲基化特征,但研究人员通过长读长测序技术发现了新的差异甲基化区域。他们从众多的 DMR 候选区域中筛选出了 44 个 Sotos 综合征和 26 个 ATR - X 综合征的 LR - DNAm 特征。这些特征通过多维度缩放(MDS)分析得到了验证,并且与基于微阵列的 DNA 甲基化特征相比,具有更大的甲基化差异,同时覆盖了更多的 CpG 位点。例如,在 Sotos 综合征中,部分 NSD1 CpG 岛(CpGi)存在低甲基化现象,纳米孔测序检测到该区域有 122 个 CpG 位点,而甲基化阵列仅有 5 个。
- 长读长 DNA 甲基化特征(LR - DNAm 特征)的验证:为了更有效地筛选 LR - DNAm 特征,研究人员应用纳米孔自适应靶向长读长测序对 70 个联合基因组区域进行研究。通过 MDS 分析和支持向量机(SVM)模型,他们成功验证了 Sotos 综合征和 ATR - X 综合征的 LR - DNAm 特征,能够准确地对疾病进行分类预测。对于一些由于 DNA 量有限无法进行全基因组检测的样本,研究人员通过单位点甲基特异性 PCR(MSP)检测也证实了差异甲基化的存在。
- NSD1 CpGi 低甲基化在 Sotos 综合征诊断中的作用:研究人员意外发现 Sotos 综合征中部分 NSD1 CpGi 存在低甲基化现象。通过联合亚硫酸氢盐限制性分析(COBRA),他们在多个 Sotos 综合征患者中进行验证,发现无论是 NSD1 点突变还是 5q35 亚显微缺失的患者,都存在这种低甲基化现象,而且这种低甲基化在健康对照和其他过度生长智力障碍综合征(OGIDs)患者中不存在。这表明 NSD1 CpGi 的低甲基化可以作为 Sotos 综合征的一个诊断标记。
在讨论部分,研究人员指出长读长测序技术具有诸多优势,如能够同时检测 DNA 序列和 DNA 甲基化,分析过程简单,分辨率高,覆盖均匀,还能进行单倍型和重复序列分析。但它也存在一些缺点,例如在低覆盖度数据集下,DNA 甲基化水平的测量不够准确;DNA 质量对测序结果影响较大;可扩展性较差,容易产生假阳性结果。不过,随着技术的不断进步,这些问题有望得到解决。
总的来说,这项研究发现了 Sotos 综合征和 ATR - X 综合征独特的 LR - DNAm 特征,表明长读长测序技术在检测以前未被识别的差异甲基化标记方面具有很大潜力,即使是在单一位点检测中也能发挥重要作用。这一研究为未来利用长读长测序技术同时分析基因组和表观基因组变化进行遗传检测提供了一个范例,有望推动罕见病诊断技术的发展,为更多患者带来准确诊断的希望。