广州都市报

您现在的位置:  > 酶使用 > 无限可能人工智能技术从头开始生成原始蛋

无限可能人工智能技术从头开始生成原始蛋

发布时间:2024/8/6 17:09:08   点击数:
公益中科 https://m-mip.39.net/baidianfeng/mipso_6359028.html
自然语言模型通过创建活性酶启动了蛋白质设计过程。

研究人员开发了一种人工智能系统,可以从头开始生成人工酶。在实验室实验中,其中一些酶显示出与天然酶相当的功效,即使它们人工创建的氨基酸序列与任何已知的天然蛋白质有很大偏差。

该实验表明,最初为阅读和书写语言文本而创建的自然语言处理可以掌握生物学的某些基本概念。被称为ProGen的AI程序由SalesforceResearch开发,采用下一个令牌预测从氨基酸序列构建人工蛋白质。

科学家们表示,这项新技术可能会变得比获得诺贝尔奖的蛋白质设计技术定向进化更强大,它将通过加速新蛋白质的开发来为拥有50年历史的蛋白质工程领域注入活力,这些蛋白质几乎可用于从治疗到降解塑料的任何东西。

“人工设计比受进化过程启发的设计表现要好得多,”加州大学旧金山分校药学院生物工程和治疗科学教授JamesFraser博士说,他是这项工作的作者,该作品最近发表在NatureBiotechnology上。自年7月以来,该论文的先前版本已在预印本服务器BiorXiv上提供,在同行评审期刊上发表之前获得了数十次引用。

“语言模型正在学习进化的各个方面,但它与正常的进化过程不同,”弗雷泽说。“我们现在有能力调整这些属性的生成以获得特定效果。例如,一种非常热稳定或喜欢酸性环境或不会与其他蛋白质相互作用的酶。

为了创建这个模型,科学家们只需将2.8亿种不同蛋白质的氨基酸序列输入机器学习模型,并让它在几周内消化这些信息。然后,他们用来自五个溶菌酶家族的个序列以及关于这些蛋白质的一些上下文信息对模型进行了微调。

该模型迅速生成了一百万个序列,研究小组根据它们与天然蛋白质序列的相似程度以及AI蛋白质的潜在氨基酸“语法”和“语义”的自然性,选择了个进行测试。

在TierraBiosciences体外筛选的第一批种蛋白质中,研究小组制作了五种人工蛋白质在细胞中进行测试,并将其活性与鸡蛋蛋白中发现的一种酶进行了比较,称为母蛋清溶菌酶(HEWL)。在人类的眼泪、唾液和牛奶中也发现了类似的溶菌酶,它们可以抵御细菌和真菌。

其中两种人工酶能够分解细菌的细胞壁,其活性与HEWL相当,但它们的序列彼此之间只有约18%的相同。这两个序列与任何已知蛋白质的相同程度约为90%和70%。

天然蛋白质中只有一个突变可以使其停止工作,但在另一轮筛选中,研究小组发现,即使只有1.4%的序列类似于任何已知的天然蛋白质,AI生成的酶也显示出活性。

人工智能甚至能够通过研究原始序列数据来学习酶应该如何形成。用X射线晶体学测量,人造蛋白质的原子结构看起来就像它们应该的那样,尽管序列是以前从未见过的。

SalesforceResearch于年开发了ProGen,基于他们的研究人员最初开发的一种自然语言编程来生成英语文本。

他们从以前的工作中知道,人工智能系统可以自学语法和单词的含义,以及其他使写作良好的基本规则。

“当你用大量数据训练基于序列的模型时,它们在学习结构和规则方面非常强大,”SalesforceResearch人工智能研究总监、该论文的资深作者NikhilNaik博士说。“他们学习哪些单词可以同时出现,以及组合性。

对于蛋白质,设计选择几乎是无限的。溶菌酶与蛋白质一样小,含有多达约00个氨基酸。但是有20种可能的氨基酸,有大量(20,00种)可能的组合。这比把所有生活在古往今来的人类乘以地球上的沙粒数,再乘以宇宙中的原子数还要大。

鉴于无限的可能性,该模型可以如此容易地产生工作酶是很了不起的。

“从头开始生成功能蛋白质的能力表明我们正在进入蛋白质设计的新时代,”ProfluentBio的创始人,SalesforceResearch的前研究科学家,该论文的第一作者AliMadani博士说。“这是蛋白质工程师可以使用的多功能新工具,我们期待看到治疗应用。



转载请注明:http://www.hongminqing.com/msy/11415.html

网站简介 | 发布优势 | 服务条款 | 隐私保护 | 广告合作 | 合作伙伴 | 版权申明 | 网站地图

当前时间: