RNA的种类及其生物学作用(rna的种类及其生物功能)

2020年年底,DeepMind推出的AlphaFold2在CASP14竞赛上秀了一把10分钟精确预测蛋白质折叠的绝活,堪称本领域50年来的革命性创举;2021

2020年年底,DeepMind推出的AlphaFold2在CASP14竞赛上秀了一把10分钟精确预测蛋白质折叠的绝活,堪称本领域50年来的革命性创举;2021年7月,该团队在《自然》杂志刊载了两篇论文,发布了AlphaFold的开源代码,同时分享了一个包含35万多种蛋白质结构(其中包括98%以上的已知人类蛋白质)的超级数据库——到2021年年底,35万可能变成1.3亿!
高效预测未知蛋白的三维结构,构建开放的蛋白质数据库,最终的结果无疑是革命性的。从基础生命科学研究,到研发针对诸如癌症之类的恶疾的新药物,深度学习为我们提供了一把万能钥匙,可揭示过去难以解锁的某些生物机制(无论是天然的还是合成的)。
眼下,深度学习也正对RNA做同样的事情。

RNA的种类及其生物学作用(rna的种类及其生物功能)

2020年底,DeepMind推出的AlphaFold2在CASP14比赛中展示了精准预测蛋白质折叠10分钟的绝活,是该领域50年来的革命性创举;2021年7月,该团队在《自然》杂志上发表了两篇论文,发布了AlphaFold的开源代码,并分享了一个包含超过35万个蛋白质结构(包括超过98%的已知人类蛋白质)的超级数据库——到2021年底,35万可能变成1.3亿!
高效预测未知蛋白质的三维结构,构建开放的蛋白质数据库,无疑是革命性的。从基础生命科学研究到开发癌症等恶性疾病的新药,深度学习为我们提供了一把万能钥匙,可以揭示一些过去难以解开的生物学机制(无论是天然的还是合成的)。
目前深度学习也在对RNA做同样的事情。

深度学习正在以惊人的速度揭示生物学最深层的秘密。

2021年8月底,来自斯坦福大学的团队在《科学》杂志上发表文章,介绍了一种名为“原子旋转等变计分器”(简称ARES)的深度学习算法,称其可以有效解决RNA结构预测问题。

来自北卡罗来纳大学的凯文·威克斯(Kevin Weeks)博士没有参与这项研究,但给予了高度评价:“研究团队在一个被证明难以取得革命性进展的领域取得了显著进展。”

令人惊讶的是,ARES训练的材料只包含18个RNA结构,却提取了大量关于RNA折叠的规则。这些规则将在实验室中得到进一步检验。此外,应该注意的是,ARES是一个输入不可知的系统,因为它不专门服务于RNA预测。用这项研究的两位主要作者Rhiju Das和Ron Dror的话说,“这种方法适用于结构生物学、化学、材料科学等领域的各种问题。”

RNA作为“DNA→RNA→蛋白质”这一中心原理的中间产物,在为新冠肺炎疫苗研发提供巨大帮助之前并没有引起太多关注,但它无疑可以被称为生命的基石,因为它不仅携带遗传信息,还催化生物功能,根据自身结构调节基因开关和免疫系统,甚至可能在表观遗传学中发挥关键作用。

RNA由DNA转录而来,有A、U、C和G这4种碱基——A配U,C连G。RNA家族里最有名的是信使RNA,或者叫mRNA,它负责携带遗传指令以构建蛋白质;此外,转运RNA,或者说tRNA,能抓取氨基酸并将它们运送到蛋白质工厂;MicroRNA,简称miRNA,则负责控制基因表达。

RNA可以被视为基因医学或疫苗研发领域的灯塔。例如,我们可以杀死RNA信使来关闭基因,而无需实际接触它们;此外,RNA靶向治疗可能比基因治疗具有更少的意外效果,同时保持我们的基因蓝图完整无缺。

很多人可能会觉得RNA有点像纠结的耳机线,从一条线索开始,绕成一个环,然后这些缠绕的结构互相缠绕在一起,形成三级结构。

这个类比是有道理的,RNA的扭曲和缠绕往往在某种程度上是可以预测的。

威尔克斯说:“每种RNA可能都有独特的结构特征。”

但就是这个看似简单的模型,让研究人员挠头不已。

虽然RNA构建的基础很简单——只有四个碱基,但在成为更复杂的三级模型之前,它们会被折叠成半刚性结构。”尽管有这些简化的特征,模拟复杂的RNA结构被证明是困难的.”

目前的深度学习解决方案通常从大量的训练样本开始。大量的训练可以帮助每一层神经网络学习如何有效地提取特征——这些信息使AI能够做出可靠的预测。

但是这种模型在预测RNA的三维结构上是不可行的,因为RNA不如蛋白质,而且作为训练材料被实验证明的真实例子很少。

鉴于此,阿瑞斯的R&D团队另辟蹊径,干脆放弃RNA本身,忽略任何关于其分子和功能的信息,只关注原子的排列。

ARES首先用一小组来自先前已知RNA结构的基序进行训练,并加入了大量结构相同的不正确替换例子。在消化完这些例子后,ARES慢慢调整自己的神经网络参数,以便程序能够学习每个原子及其位置如何影响整个分子的功能。

ARES的训练过程类似于经典的计算机视觉算法逐步提取特征(从像素到线条和形状),其神经网络中的层覆盖了精细和粗糙的尺度。

当面对一组新的RNA结构(其中许多比训练结构复杂得多)时,ARES可以提取模式和新的基序,并识别字母(即碱基)是如何组合的。

达斯等人说:“它完全从原子结构中学习,不使用其他信息…并且它不假设哪些结构特征可能是重要的。我们甚至没有给算法提供任何基本信息,比如RNA是由四个碱基组成的分子链’。”

完成系统搭建后,研究团队开始让阿瑞斯挑战RNA-Puzzles。

RNA-Puzzles是一项始于2011年的社区挑战。参与其中的结构生物学家会在算法的帮助下预测已经被实验检验过的RNA结构,最后比较预测的准确性。阿瑞斯击败了其他竞争者。

成功将RNA结构预测的准确率提高了30%左右。这看似一小步,却是生物学最棘手问题之一的巨大飞跃。

与蛋白质相比,RNA结构预测要困难得多。目前,ARES还很难达到药物发现所需的精度水平。但毫无疑问的是,战神在拨开RNA的迷雾上迈出了坚定有力的一步。未来算法的一个改进可能是结合一些实验数据进一步模拟这些复杂的结构。

大多数RNA一直是生物暗物质。我们知道它在那里,但很难想象它的样子,更不用说研究它的功能了。“但随着ARES使测量,(深入)学习和预测RNA三级结构的细节成为可能,我们有望在生物机制方面获得更多新发现。”

来源:

Deep Learning Is Tackling Another Core Biology Mystery: RNA Structure

END

记得关注、分享~

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/410084.html

发表回复

登录后才能评论