人工智能(AI)復現(xiàn)一項諾貝爾化學獎成就,需要多久?
答案:4分鐘。這甚至比閱讀完這篇文章的時間都短。而且AI無需反復實驗,一次就成功。
這個由GPT-4驅動的“AI化學實驗室”,被命名為“Coscientist”,由來自美國卡內基梅隆大學和翡翠云實驗室的研究團隊共同創(chuàng)建。相關研究結果發(fā)表于最新一期《自然》雜志上。
有評論稱,自此之后,人類探索化學世界的方式,可能產生巨大革新。
卡內基梅隆大學的云實驗室。圖片來源:卡內基梅隆大學
人工智能進行化學研究的概念呈現(xiàn)。圖片來源:美國國家科學基金會
AI自己學習做實驗
Coscientist結合了大型語言模型、互聯(lián)網和文檔搜索的能力。它首先從互聯(lián)網、文檔數(shù)據(jù)等來源檢索化合物的公開信息;然后通過學術期刊、維基百科、美國化學會等途徑進行學習;最后根據(jù)學到的信息指導自己的行動,設計、規(guī)劃和執(zhí)行真實世界的化學實驗。
系統(tǒng)以GPT-4為基礎,可通過調用4個命令(谷歌、Python、文檔和實驗)來規(guī)劃實驗。除了最后一個執(zhí)行命令外,谷歌命令負責在互聯(lián)網上進行搜索,Python命令負責執(zhí)行代碼,而文檔命令則負責檢索和總結必要的文檔,這些命令還可以執(zhí)行子操作。
研究團隊對Coscientist的表現(xiàn)進行了多輪測試。其中,為了檢驗它設計化學反應流程的能力,團隊要求它通過檢索與學習,分別生成阿司匹林、對乙酰氨基酚和布洛芬等藥物分子。
4分鐘做個諾獎研究
研究團隊對Coscientist的最終考驗,是讓它復現(xiàn)諾獎研究。
2010年,諾貝爾化學獎授予3位化學家,以表彰他們提出鈀催化交叉偶聯(lián)反應。這類反應的實用度非常高,因為其可高效構建碳-碳鍵,輕易生成許多難以合成的物質。在制藥領域,這類反應可以在炎癥、哮喘等多類疾病的新藥開發(fā)中展現(xiàn)實力。而在電子工業(yè)、先進材料等領域,鈀這類反應也能得到廣泛應用。
Coscientist交上的答卷非常漂亮。在確定兩種反應所需的化合物之后,它準確計算了所需的劑量,并對移液機器人進行自主編程來開啟反應。整個過程只用了不到4分鐘。結果,反應后的透明液體樣本中成功發(fā)現(xiàn)了目標產物,對樣本的分析也表明復現(xiàn)成功。
“自動化科研”即將到來
這項成果表明,人類已能有效地利用AI提高科學發(fā)現(xiàn)的速度和數(shù)量,并可改善實驗結果的可復制性和可靠性。
論文通訊作者、美國卡內基梅隆大學研究人員蓋比·葛姆斯表示,人們可擁有自主運行的系統(tǒng),去發(fā)現(xiàn)新的現(xiàn)象、新的反應、新的思想。而科學中的嘗試、失敗、學習和改進的迭代過程,可通過AI大大提速。這本身就將是一場巨大變革。
美國國家科學基金會化學部主任戴維·伯科威茨認為,該團隊成功構建了一種高效的“實驗室伙伴”。將各個組成部分巧妙地融合在一起,最終的成果遠遠超越了各個部分單獨的貢獻。
在同時發(fā)表的新聞與觀點文章中,葡萄牙里斯本大學藥學院阿娜·勞拉·迪亞斯和迪亞戈·羅德里吉斯認為,Coscientist是人類朝著建立自動化實驗室邁出的關鍵一步。
不過,研究人員也指出,Coscientist尚有一些局限性。例如,它有時會出現(xiàn)化學反應不正確的情況。但目前它可通過使用復雜的提示策略(如思維鏈和思維樹)以及增加化學數(shù)據(jù)進行自我糾正。
還需要注意的是,現(xiàn)實世界中的研究問題,很多都比這一研究中的實驗復雜得多。有些研究涉及化學以外的學科概念,如藥物開發(fā)中需應用到的生物學。Coscientist目前還無法解決這一領域的復雜問題。(記者 張夢然)