-
生物通官微
陪你抓住生命科技
跳动的脉搏
Science Advances:预测组织特异性基因表达的新方法
【字体: 大 中 小 】 时间:2021年04月08日 来源:生物通
编辑推荐:
了解组织特异性的基因表达有望提供某个人健康状况的重要信息。然而,许多受到疾病影响的组织不容易采样和分析。于是,美国国家癌症研究所(NCI)的研究人员想了解是否能够从全血转录组来推断组织特异性的基因表达。
复杂疾病往往涉及到多种组织中的转录失调。因此,了解组织特异性的基因表达有望提供某个人健康状况的重要信息。然而,许多受到疾病影响的组织不容易采样和分析。于是,美国国家癌症研究所(NCI)的研究人员想了解是否能够从全血转录组来推断组织特异性的基因表达。
国家癌症研究所的Sridhar Hannenhalli及其同事利用基因型-组织表达(GTEx)项目数据来测试模型,以便根据全血样本来预测组织特异性的基因表达。他们发现,对于30多种不同的组织类型,其中一种模型可以预测约60%基因的组织特异性表达水平,其中骨骼肌的基因比例更高。
这项成果于上周五发表在《Science Advances》杂志上。研究人员认为,此类转录组标志物可作为疾病预后的标志物。同时,他们开发出一个名为TEEBoT的软件,可以用来预测组织特异性的基因表达。
研究人员采用了32种主要组织的GTEx数据来开发模型,这些组织至少有65个人的样本以及全血转录组和人口统计学数据。对于每种组织和基因,他们拟合了三个嵌套回归模型,以预测组织特异性的基因表达数据。最好的模型称为M2,涵盖了全血基因表达和全血剪接数据,以及与年龄、种族和性别有关的人口统计学因素。
对于32种组织中的17,031个基因,研究人员进行了拟合,并对其准确性进行了估计。他们指出,基本模型M1可预测一部分表达的基因,但是像M2那样添加全血剪接数据后,预测的基因数可以提高40%以上。另一个模型则添加了SNP数据,但他们发现,它仅仅改善了少数基因的预测,同时还需要全基因组测序。
总的来说,M2模型能够预测各种组织中59%的基因的组织特异性基因表达水平,而对于骨骼肌组织,这个比例高达81%。研究人员还指出,组织特异性可预测基因具有某些特征,例如,它们倾向于参与基本的细胞过程,并且与其他基因(包括看家基因)有更多的联系。
研究人员发现,在预测某些疾病状态方面,这一模型几乎与特定组织的实际基因表达水平相当。他们比较了用实际的组织特异性基因表达,预测的组织特异性基因表达和全血基因表达水平来预测疾病状态的能力。他们发现,预测的组织特异性基因表达要比全血基因表达更好,并且与实际的组织特异性基因表达相当。
此外,研究人员还公开了TEEBoT软件的代码。他们希望加入其他蛋白质组学和代谢组学数据,对这一模型进行改进。同时,他们还在探索根据癌症患者的血液转录组来预测肿瘤转录组。
###
Predicting tissue-specific gene expression from whole blood transcriptome
Science Advances 02 Apr 2021:
Vol. 7, no. 14, eabd6991
DOI: 10.1126/sciadv.abd6991