-
生物通官微
陪你抓住生命科技
跳动的脉搏
AI小胜蛋白质专家团队 机器学习将推动生物技术快速发展
【字体: 大 中 小 】 时间:2022年11月05日 来源:Rutgers University
编辑推荐:
AI在预测蛋白质自我组装的比赛中'小胜'有20多年丰富经验的蛋白质专家团队。一位参与计算机程序比赛的蛋白质科学家说,机器学习将推进生物技术。
蛋白质是存在于所有生物体内的高度复杂的物质。Vikas Nanda花了20多年的时间研究蛋白质的复杂性。这位Rutgers大学的科学家长期以来一直在研究,构成蛋白质的氨基酸的独特模式是如何决定它们将成为从血红蛋白到胶原蛋白或者任何蛋白的,以及随后神秘的自我组装步骤——某些特定的蛋白质聚集在一起形成更复杂的蛋白复合物。
因此,当科学家们想要进行一项实验,让一个对蛋白质设计和自我组装有着深刻直观理解的人类与人工智能计算机程序的预测能力进行对比时,Rutgers大学高级生物技术和医学中心(CABM)的研究员Nanda成为了其中的佼佼者。
现在,谁或什么能更好地预测蛋白质序列结合最成功的比赛结果已经出来了。Nanda和伊利诺伊州阿贡国家实验室的研究人员以及来自全国各地的同事们在《自然化学》杂志上报告说,这场战斗势均力敌,但却是决定性的。南达和他的几位同事在与人工智能程序的比赛中,计算机程序以微弱优势胜出。
Nanda说:“尽管我们有广泛的专业知识,但人工智能在一些数据集上做得一样好,甚至更好,显示出机器学习在克服人类偏见方面的巨大潜力。”
蛋白质是由大量首尾相连的氨基酸组成的。这些链折叠起来形成具有复杂形状的三维分子。每种蛋白质的精确形状,以及它所含的氨基酸,决定了它的功能。科学家们对蛋白质的自我组装非常感兴趣,因为更好地了解蛋白质可以帮助他们设计一系列革命性的产品,用于医疗和工业用途,比如用于伤口的人造人体组织和新化学产品的催化剂。一些研究人员凭借对蛋白质的专业知识从事“蛋白质设计”,创造产生新蛋白质的序列。例如Nanda团队设计了一种合成蛋白质,可以快速检测VX,一种危险的神经毒剂,这可能为新的生物传感器和治疗铺平道路。
由于未知的原因,蛋白质会与其他蛋白质自组装,形成在生物学中很重要的复合结构。有时,蛋白质看起来是遵循某种设计的,例如当它们自我组装成病毒的保护性衣壳时。有时当出现问题时,它们会自我组装形成致命的结构形式,与阿尔茨海默症和镰状细胞病等各种疾病有关。“了解蛋白质的自我组装对于在包括医学和工业在内的许多领域取得进展是至关重要的。”
在比赛中,Nanda和其他五名同事得到了一份蛋白质列表,并被要求预测哪些蛋白质可能会自我组装。他们的预测与计算机程序的预测进行了比较。人类专家根据他们在实验中对蛋白质行为(包括电荷模式和疏水性)的观察,采用经验法则,选择了11种他们预测会自我组装的蛋白质。这个基于先进机器学习系统的计算机程序选择了9种蛋白质。人类在他们选择的11种蛋白质中有6种是正确的。计算机程序获得了更高的百分比,它推荐的9种蛋白质中有6种能够自我组装。
实验表明,人类专家“偏爱”某些氨基酸,有时导致他们做出错误的选择。此外,计算机程序还正确地指出了一些蛋白质的特性,这些特性并不能使它们成为自我组装的明显选择,这为进一步的研究打开了大门。Nanda曾经对机器学习用于蛋白质组装的研究持怀疑态度,但这次经历让他对这项技术更加开放。
Nanda说:“我们正在努力从根本上理解导致自组装的相互作用的化学性质,所以我担心使用这些程序会妨碍重要的洞察。”“但我开始真正理解的是,机器学习只是另一种工具,就像其他工具一样。”