-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature Methods:基于人工智能的方法来预测RNA修饰
【字体: 大 中 小 】 时间:2023年02月11日 来源:Nature Methods
编辑推荐:
新加坡国立大学(NUS)的一组研究人员开发了一种软件方法,可以从基因组数据中准确预测RNA分子的化学修饰。他们的方法被称为m6Anet,发表在《自然方法》杂志上。
来自科学、技术和研究局(A*STAR)和新加坡国立大学(NUS)的一组研究人员开发了一种软件方法,可以从基因组数据中准确预测RNA[1]分子的化学修饰。他们的方法被称为m6Anet,发表在《自然方法》杂志上。
在RNA内部,添加到RNA上的不同类型的化学分子决定了RNA分子的功能。然而,这些RNA变化对于科学家用来读取RNA的标准方法通常是不可见的。目前,已经发现了160多种RNA修饰,其中最常见的RNA修饰- n6 -甲基腺甘氨酸(m6A)与人类疾病如癌症有关。
在过去,鉴定RNA修饰需要耗时费力的实验,而大多数实验室都无法实现。此外,以前的方法未能在单分子分辨率下检测m6A,这对于理解涉及m6A的生物学机制至关重要。
该团队通过利用直接纳米孔RNA测序克服了这些限制,纳米孔RNA测序是一种新兴技术,可以对原始RNA分子及其RNA修饰物进行测序。在这项研究中,他们开发了m6Anet软件,该软件使用丰富的直接纳米孔RNA测序数据和多实例学习(MIL)方法来训练深度神经网络,以准确检测m6A的存在。
“在传统的机器学习中,我们通常对每个想要分类的例子设置一个标签。例如,每张图像要么是猫,要么不是猫,算法学习根据标签将猫图像与其他图像区分开来。探测m6A的问题是我们有大量标签不清楚的数据。想象一下,你有一个很大的相册,在数百万张其他照片中隐藏着一张猫的照片,你试图在没有任何标签的情况下识别出这张特定的照片。幸运的是,这在机器学习文献中已经被研究过,被称为MIL问题,”文章一作Christopher Hendra说。
在这项研究中,研究小组证明了m6Anet可以从跨物种的单个样本中以单分子分辨率高精度地预测m6A的存在。
“我们的人工智能模型只看到了来自人类样本的数据,但它能够准确地识别RNA修饰,甚至在模型从未见过的物种样本中,识别不同生物样本中RNA修饰的能力可用于了解它们在许多不同应用中的作用,如癌症研究或植物基因组学。”
“看到像机器学习技术(如MIL)这样有理论基础和经过充分研究的机器学习技术如何被利用来为这一具有挑战性的问题提供优雅的解决方案,我们非常满意。见证该软件被科学界如此迅速地采用,是对我们努力的奖励!”新加坡国立大学理学院统计与数据科学系副教授Alexandre Thiery说,他是这项研究的联合负责人。
“准确有效地识别RNA修饰一直是一个长期的挑战,m6Anet有助于解决这些限制。为了使更广泛的科学界受益,这种人工智能方法以及研究结果已向其他科学家公开,以加速他们的研究。”
m6Anet的源代码可以在https://github.com/GoekeLab/m6anet上找到。安装说明和在线文档可在https://m6anet.readthedocs.io/en/latest/上获得。。
[1]核糖核酸(简称RNA)是存在于所有活细胞中与DNA结构相似的核酸。然而,与DNA不同,RNA通常是单链的。RNA分子的骨架由磷酸基和糖核糖交替组成,而不是DNA中的脱氧核糖。
Detection of m6A from direct RNA sequencing using a multiple instance learning framework
知名企业招聘