发布时间:2026-03-06
信息来源:中国科学报
字体:
大
中
小
打印
发布时间:2026-03-06
信息来源:中国科学报
2008年,研究人员报道了全球首个活体生物的人工合成基因组。他们通过化学方法合成了生殖支原体具有58万个核苷酸的基因组。后续研究又在细胞中“重启”了这种基因组,创造出科学家所谓的首个合成生命。
如今,研究人员使用人工智能(AI)设计出全基因组序列,其中还包括一个受生殖支原体启发的序列。生成它们的Evo2 DNA语言模型,由生命之树中的生物的数万亿个DNA碱基训练而成。相关成果3月4日发表于《自然》。
尽管令人瞩目,但这些基因组设计只是迈向AI创造微生物的一步。“这很酷,但还远远不够。”荷兰瓦赫宁根大学的Nico Claassens说。
目前的一大障碍是需要大规模合成并测试AI生成的基因组。另一个难题是,要设计出能够指挥哪怕是最简单生命形式的所有基本功能的基因组,更不用说那些更复杂的细胞了。
然而,那些十多年来一直致力于从头设计基因组的科学家说,这个曾经大胆的目标如今已触手可及。
“这些AI模型是合成基因组学领域的‘ChatGPT时刻’。”英国曼彻斯特大学的蔡毅之说,“你可以创造自然界中从未有过的东西。”
此前编写基因组大多只是微调,相当于编辑现有书籍的某一章,或删掉所有的逗号。而Evo2这样的DNA语言模型,让创造与现有生命差异更大的合成生命成为可能。
2025年,美国Arc研究所的Brian Hie与同事使用Evo模型编写了感染细菌的病毒噬菌体的基因组。当研究人员将指令插入大肠杆菌后,285个设计中有16个产生了能够杀死细菌的功能性病毒。
不过,噬菌体基因组只有几千个碱基,仅编码了少数几个基因,比微小的细菌基因组还小得多、简单得多。而且大多数科学家认为病毒是遗传寄生物,缺少许多生命特征。
在最新研究中,Hie与Arc研究所Patrick Hsu带领的团队,用Evo2模型生成了受生殖支原体启发的基因组,以及人类线粒体和酵母染色体的基因组。计算机预测显示,这个仿照生殖支原体的序列中近70%的基因看起来很合理。
“生命设计不能只完成70%。你可以在电脑上这么做,但它不会有生命功能。”Claassens说,只要有一个关键基因缺失或建模不够,这个基因组在细胞内就无法正常工作。
英国剑桥大学的Maciej Wiatrak开发过另一款能生成细菌基因组的AI工具Bacformer。他说,即使包含了所有关键基因,它们的排列顺序也可能决定设计的成败。“判断你的基因组‘看起来对不对’和‘能不能正常工作’完全是两码事。”
而在3月2日公布于bioRxiv预印本平台的一项研究中,美国得克萨斯大学奥斯汀分校的科学家发现,Evo2设计的基因组与自然基因组结构不同,且缺少一些关键特征。这并不意味着AI设计的基因组无法工作,但它们可能对理解基因组的进化作用有限。
Wiatrak也对是否值得投入巨大精力与成本从头设计微生物基因组持怀疑态度。他和同事更感兴趣的是用Bacformer、Evo2等模型设计出能够协同工作的细菌基因簇(操纵子),用于执行生产生物燃料等有用的任务。
Hie相信,团队设计基因组序列的能力会不断提升。但要测试足够多的基因组设计,需要合成一个基因组的DNA并按正确顺序组装,这对现有技术而言仍是巨大挑战。
“实验正迅速面临瓶颈。”Hie说,“在这种规模下,我们面临DNA合成与构建的成本问题。”
Hsu表示,一个可行方向是使用AI+机器人结合的自动化实验室,迭代设计、测试、优化基因组片段,之后再拼接成完整的工作基因组。他说,这种分段式方法,未来有望设计出比微生物基因组更大、更复杂的基因组,如人类和其他哺乳动物的基因组。
Claassens认为,像Evo2这样的AI工具最终能否设计出可工作的细胞基因组仍悬而未决。他觉得,将AI与人类洞察等其他方法相结合,才有可能成功。
相关人物