一项突破性的研究合作近日揭晓,科学家们推出了一款名为“Plant RNA-FM”的人工智能(AI)模型,该模型旨在解读植物遗传信息的序列和结构模式,为植物科学的发展注入新动力。
这款创新性的AI模型由约翰英纳斯中心的植物研究团队与埃克塞特大学的计算机科学专家携手打造,是同类模型中的佼佼者。Plant RNA-FM利用了一个庞大的数据集进行训练,该数据集包含了来自1124种植物的540亿个RNA信息,这些信息共同构成了植物遗传信息的“字典”。
RNA,作为生物体内的重要分子,与DNA一样承载着遗传信息。其结构由核苷酸组成,排列方式类似于语言中的字母组合,构成了生物体遗传信息的“语言”。Plant RNA-FM模型的研究者们,通过深入探索RNA的结构,揭示了这一语言在植物生长、应激反应等复杂生物功能中的调节作用。
为了破解RNA的复杂结构,约翰英纳斯中心的丁义良教授团队与埃克塞特大学的李科博士团队紧密合作。他们借鉴了ChatGPT等AI模型理解人类语言的方法,训练Plant RNA-FM模型理解基于植物的“语言”。这一模型通过学习全球各地植物物种的RNA信息,全面掌握了RNA在植物界中的功能。
正如ChatGPT能够理解并响应人类语言,Plant RNA-FM也学会了理解RNA序列和结构的“语法”与“逻辑”。研究团队已经利用该模型对RNA功能进行了精准预测,并在转录组中发现了特定的功能性RNA结构模式。实验证明,Plant RNA-FM所识别的RNA结构对遗传信息转化为蛋白质的效率具有重要影响。
约翰英纳斯中心的博士后研究员余浩鹏博士表示:“尽管RNA序列在人类眼中可能显得杂乱无章,但我们的人工智能模型已经学会了从中解码出隐藏的模式。”这一成果不仅展示了AI在植物科学研究中的巨大潜力,也为未来的作物改良和基因设计提供了新的可能。
这次成功的合作还得到了东北师范大学和中国科学院科学家们的支持。丁义良教授强调:“Plant RNA-FM只是我们的一个起点。我们正与李科博士的团队紧密合作,开发更先进的人工智能方法,以揭示自然界中隐藏的DNA和RNA语言。这一突破为理解和‘编程’植物开辟了新途径,可能对作物改良和基于AI的基因设计产生深远影响。AI在帮助植物科学家应对全球农业挑战方面发挥着越来越重要的作用,从确保全球粮食安全到培育适应气候变化的新作物品种。”