随着人工智能(AI)工具日益改变科学工作流程,梦想着更系统化变革的Sam Rodriques,于2023年在美国旧金山建立了他的初创公司FutureHouse。
作为一家非营利机构,该公司得到了谷歌公司前任首席执行官Eric Schmidt的支持,目标是培养一名“AI科学家”,能够指导从假设生成到论文撰写的整个研究流程。
据《自然》报道,现在,Rodriques的团队朝这个方向迈出了一步。6月5日,他们发布了第一个专门为科学任务设计的真正的“推理模型”——ether0。
ether0是一个专门为化学领域构建的大语言模型,通过完成大约50万个问题的测试学习化学。ether0可以根据简单的英文说明,给出符合一系列标准的类药物分子的公式。
ether0是开源的,并纳入了许多公司旨在实现科学过程自动化的其他研究成果,比如谷歌和日本公司Sakana AI的成果。
与之前的专业模型不同,ether0通过自然语言跟踪“思路”,为AI的“黑匣子”提供了一个窗口,使它能够回答通常需要复杂推理的问题。尽管一些通用推理模型,如OpenAI o1,在标准化科学测试方面有进步,但在没有针对性训练的情况下,它们很难产生深刻的见解。
德国耶拿大学的数字化学家Kevin Jablonka在试用ether0预览版后发现,该模型可以对未经过训练的化学性质作出有意义的推断。“以前的模型是无法做到的。”
ether0是FutureHouse的最新成果。在过去一年里,该公司发布了“高级科学文献评论家”和“AI代理平台”,后者是基于大语言模型的工具,专为特定任务而设计。基于上述模型,5月,FutureHouse团队提出了一种治疗干性年龄相关性黄斑变性的新方法,这是导致失明的主要原因之一。
FutureHouse的研究人员从法国初创公司Mistral AI那里获得了一个相对较小、足够紧凑的大语言模型,可以在笔记本电脑上运行。他们发现,与其用化学教科书和论文训练模型,不如让它从考试中学习。为此,FutureHouse的化学工程师Andrew White从45篇学术论文中汇编了实验室生成的化学结果,跟踪了分子溶解度和气味等特性,并将其转换为577790个可验证的问题。
研究人员训练了模型的7个版本,每个版本都试图解决上述化学问题的一个特定子集,回答正确可获得强化奖励。然后,研究人员将这些专业模型中的推理链合并为一个通才模型。在再次运行了上述化学问题集后,他们得到了ether0。
该团队使用另一组问题对ether0的性能进行了评估,其中一些问题与训练集中的问题无关。ether0几乎在所有方面的表现都优于OpenAI的GPT-4.1等其他前沿模型。对于某些类型的问题,ether0的准确性是竞争对手的两倍多。
对于ether0的未来,其他科学家认为喜忧参半,它有自己的优势,当然也存在问题。不过,Rodriques认为,将推理能力嵌入专门的模型中,将使团队获得端到端的自动化科学方法,而不仅仅是化学。(徐锐)
相关人物