侵權(quán)投訴
訂閱
糾錯
加入自媒體

“文獻進,產(chǎn)物出” AI 化學家引領(lǐng)化學數(shù)字化發(fā)展

一直以來,化學家在科研過程中需要面對十分復雜的物質(zhì)體系和實驗過程,常常為了一個實驗結(jié)果要進行不計其數(shù)的實驗。

近年來,自動化在化學領(lǐng)域的應用在一定程度上幫助化學家簡化了繁復的實驗研究,尤其是隨著人工智能的發(fā)展,基于機器學習的 “AI化學家” 更是提升了實驗的效率和準確性,在化學研究領(lǐng)域釋放出更多紅利。

如今,來自英國格拉斯哥大學(University of Glasgow)Cronin 實驗室的化學家們在自動化化學合成領(lǐng)域取得了開拓性成果——他們開發(fā)了一個軟件,可以將學術(shù)論文轉(zhuǎn)化為可執(zhí)行的程序,即實現(xiàn)了“文獻進,產(chǎn)物出(Paper in, product out)”的過程,且研究人員無需學習代碼就可以編輯。

相關(guān)工作以 “A universal system for digitization and automatic execution of the chemical synthesis literature” 為題,在線發(fā)表在頂級科學期刊《科學》(Science)上。

圖 | Science 發(fā)表相關(guān)論文(來源:Science)

“文獻進,產(chǎn)物出” AI 化學家引領(lǐng)化學數(shù)字化發(fā)展

早在 2018 年底,Cronin 團隊就研發(fā)了一個名為 “chemputer” 的化學計算機,該系統(tǒng)由試管、燒瓶、輸送化學物質(zhì)的管道、閥門和泵等傳統(tǒng)化學實驗器皿組成,通過系統(tǒng)上運行的一套由化學描述語言(XDL,其中 “X” 的發(fā)音是 “kai”,取自希臘語中化學的第一個字母)編寫的程序,來控制化學分子的合成。去年,Cronin 團隊展示了該計算機可以生產(chǎn)多個分子的能力。如今,他們利用機器編程的便捷方式,再次向化學數(shù)字化領(lǐng)域邁出了重要一步。

這項工作的核心在于化學描述語言。對于該計算機而言,化學描述語言就像 HTML 對于瀏覽器一樣,它告訴機器該做什么。

圖 | 用化學描述語言 XDL 編寫程序(來源:The Cronin Group 官網(wǎng))

該系統(tǒng)創(chuàng)建了一個名為 SynthReader 的軟件,它可以掃描經(jīng)同行評審的文獻中的化學配方,比如生產(chǎn)瑞德西韋的 6 個步驟,并使用自然語言處理來挑選出“添加”、“攪拌”或“加熱”等動詞、“逐滴式”等修飾符,以及持續(xù)時間和溫度等一些其他細節(jié),然后系統(tǒng)將這些指令轉(zhuǎn)換為化學描述語言,通過執(zhí)行語言命令來驅(qū)動化學機器人在實驗室完成化合物的全自動合成。

近期剛被美國食品藥品監(jiān)督管理局(FDA)批準可用于治療新冠住院患者的藥物瑞德西韋試驗就在這臺 chemputer 上高速運行著。前幾日,制造瑞德西韋藥物的吉利德公司宣布,他們將在 10 月底前滿足全球?qū)τ谌鸬挛黜f的需求,由此可見其生產(chǎn)效率之高。

論文作者之一 Cronin 介紹,該框架的優(yōu)勢之一在于化學家們可以用純英文編輯化學方案,因此無需培訓即可操作,還有至關(guān)重要的一點是,他們還可以利用化學專業(yè)知識來發(fā)現(xiàn)代碼中的錯誤。

研究人員表示,他們從化學的相關(guān)文獻中提取了 12 種示范配方,其中包括麻醉劑利多卡因、Dess-Martin 高碘烷氧化劑和氟化劑 AlkylFluor。經(jīng)測試,所有這些配方都是由 chemputer 以類似于人類化學家的效率進行操作的。

Cronin 表示:“如果我們有標準的方法來發(fā)現(xiàn)分子、制造分子,然后生產(chǎn)化學物質(zhì),突然間沒有什么東西會被淘汰,這就像化學的電子書閱讀器。”

多年來,Cronin 一直夢想著未來研究人員可以像發(fā)送電子郵件和打印 PDF 文件一樣,輕松地分發(fā)和生產(chǎn)分子,從而使無法訂購藥物變得像無法找到現(xiàn)代文本一樣古老。

如今,越來越多的科研團隊都在競相將化學技術(shù)帶入數(shù)字時代,Cronin 團隊僅代表了跨越學術(shù)界和工業(yè)界的數(shù)十個小組之一,此次研究成果或?qū)⒁I(lǐng)更安全的藥物生產(chǎn)、更高效的太陽能電池板,以及更具顛覆性的新型產(chǎn)業(yè)。

化學機器人推動制藥公司數(shù)字化轉(zhuǎn)型

如今,Cronin 創(chuàng)立了一家名為 Chemify 的公司,來銷售化學機器人 chemputer 和對應的 XDL 軟件包,他也在網(wǎng)上免費發(fā)布了用于機器的搭建和編程的程序包。chemputer 已經(jīng)在化學界取得了一定的進展,該團隊于去年 5 月在制藥公司葛蘭素史克(GSK )安裝了一臺原型機。

葛蘭素史克高級副總裁兼人工智能和機器學習全球負責人 Kim Branson 博士表示:“chemputer 這一概念的產(chǎn)生,以及 Cronin 團隊圍繞化學機器人所做的工作的確具有很大的變革性!

眾所周知,葛蘭素史克是一家以研發(fā)為基礎(chǔ)的藥品和保健品公司,其產(chǎn)品遍及全球市場。目前,該公司正在探索各種自動化技術(shù),以提高生產(chǎn)效率。Branson 表示,Cronin 團隊正在進行的這項研究工作,可能會讓葛蘭素史克在公司內(nèi)部更加方便地“傳輸專業(yè)知識”。一旦化學家設(shè)計出了一個有前景的分子配方,他們就不用再去寫報告或給同事講解,而是直接一鍵 “分享” 配方。

研究人員表示,盡管 Chemify 不是最復雜的自動化化學平臺,但它可能卻是最易于訪問的平臺。它是基于燒杯和試管這些傳統(tǒng)工具建立起來的,并在化學家們使用了幾個世紀的 “批量” 模式中逐步發(fā)揮作用。

如今,Cronin 團隊正在研究它的通用性(即與任何批處理化學機器人兼容),研究人員只需要告訴軟件他們有哪些零件,并給它一些相應的溫度等數(shù)字,就可以讓機器運行。

AutoSyn 自動化學系統(tǒng)

此外,還有很多其他研究團體也在做一些打破傳統(tǒng)化學領(lǐng)域認知的研究。

SRI International 公司 SRI Biosciences 部門的首席戰(zhàn)略官 Nathan Collins 說:“與我們過去 200 年間所采用的的工作方式相比,大多數(shù)化學過程沒有什么變化,都是一種純手工的、靠工匠驅(qū)動的過程,這一領(lǐng)域還有數(shù)十億美元的機會等待挖掘!

今年 6 月,Collins 和他的同事們發(fā)表了一篇題為 “Fully Automated Chemical Synthesis: Toward the Universal Synthesizer” 的研究論文,描述了一種自動化多步化學合成儀 AutoSyn 進行藥物合成的研究。

圖 | AutoSyn的俯視圖

圖 | AutoSyn流動化學平臺中使用的單元操作模塊(UOM)的順序示意圖

圖 | 多步驟化學合成自動化

AutoSyn 平臺使用一種“流動”化學的方法,來替代傳統(tǒng)的物質(zhì)混合方法。

以往,物質(zhì)的混合首先需要將它們在一個燒杯中混合,然后再倒入另一個燒瓶,而 AutoSyn 平臺的物質(zhì)混合過程則是當化學物質(zhì)流經(jīng)管子的時候,在這個動態(tài)過程中實現(xiàn)連續(xù)的化學反應。

AutoSyn 平臺具備 3000 多種合成途徑,可在幾小時內(nèi)實現(xiàn)毫克級甚至是克級的任何藥物小分子的合成,幾乎可以復制所有類型的液體之間的反應。

Collins 說:“在流體中進行化學反應不僅需要專門的硬件,還需要一些額外的努力,才能從其批次說明中翻譯化學程序,從而實現(xiàn)傳熱和混合等方面的‘精妙’控制。如果像 AutoSyn 這樣的平臺可以針對已公開的反應自動運行數(shù)百種細微的變化,那么它們生成的詳細數(shù)據(jù)集可能會突出顯示制造化學物質(zhì)的最佳方法。”

這項工作可能是一個很好的起點,但許多已發(fā)表的實驗都存在缺陷。據(jù) Collins 估計,化學家們會花費 30%-70% 的時間來解決已知反應中遺漏的細節(jié)!斑M行一個化學反應,是需要研究人員根據(jù)之前的實驗記錄,坐下來逐步操作的! Collins 說。

盡管 AutoSyn 和 chemputer 都能復制如今大部分已發(fā)布的反應,但他們下一步需要讓機器變得更可靠,就像 Cronin 所說的那樣 “讓 Apple 變得時髦”。

Collins 說,我們過去需要一名工程師來維持 AutoSyn 一半以上的運行,但現(xiàn)在所需的修復時間不到 10%。他希望,最終可能實現(xiàn)用戶只通過電話就可以對系統(tǒng)進行故障排除。

Collins 表示:“這仍然是一門非常新的科學。過去 18 個月,它才開始真正爆發(fā)。”

Make-It

美國國防高級研究計劃局(DARPA)在推動這一科學發(fā)展的過程中發(fā)揮了重要作用,DARPA 剛結(jié)束了一項為期 4 年的 Make-It 項目,該項目的重點研究領(lǐng)域包括自動化分子設(shè)計、自動合成(生產(chǎn))和快速反應篩選,在全自動快速分子生產(chǎn)領(lǐng)域取得重大進展。chemputer 和 AutoSyn 都是它的原型。
在過去,化學家們辛辛苦苦地將原子精加工成新穎的分子結(jié)構(gòu),需要一個漫長的等待過程。Make-It 項目的經(jīng)理 Anne Fischer 的一個長期目標就是加快發(fā)現(xiàn)有用分子的過程,她說:“制造和測試分子始終是一個緩慢的步驟。”

但現(xiàn)在,Make-It 已經(jīng)生產(chǎn)了 chemputer、AutoSyn 等制造分子的機器人工具,Fischer 正在指導一個新的 DARPA 項目“加速分子發(fā)現(xiàn)(Accelerated Molecular Discovery)”,該項目著眼于開發(fā)更智能的軟件,來告訴機器人要制造什么分子,以及如何制造。

Fischer 說:“我們現(xiàn)在正在嘗試擴展 Make-It 項目所做的工作,這樣我們就可以逐步教計算機去發(fā)現(xiàn)新的分子!

許多人認為,我們實現(xiàn)這一過程的秘密武器是機器學習,其實一些能夠進行初級化學學習的機器還在研發(fā)中。

自動流動化學系統(tǒng)的持續(xù)改進

麻省理工學院的化學家 Connor Coley 所在的團隊去年將自動流動化學系統(tǒng)融合了一種算法,以對其進行指導。該算法在數(shù)十萬個反應的數(shù)據(jù)庫上進行了訓練,能夠預測新產(chǎn)品的配方。Coley 說:“基于這些模式,該系統(tǒng)試圖了解什么樣的轉(zhuǎn)化方式應該適用于從未見過的新分子合成”。

Coley 還強調(diào),該系統(tǒng)還有很長的路要走。它是基于相似的分子進行預測,而人類化學家還需要補充機器生成的輪廓中所缺失的細節(jié)。盡管如此,這項工作還是支持了軟件可以提出有用配方的概念。

麻省理工學院正在與十多家化學和制藥公司合作,以改進其分子預測算法,并且一些公司已經(jīng)將該軟件投入使用。默克公司(Merck)計算和結(jié)構(gòu)化學助理副總裁 Juan Alvarez 表示,Coley 的機器學習算法是該公司向其內(nèi)部研究人員提供的多種化學預測工具之一。他說:“它的部署絕對會影響我們今天的時間表!

雖然每個研究團隊都從不同角度探究自動化,但他們都在解決同一個問題。存在著近乎無限多種的分子,其中某些必定是可以拯救生命的藥物,或者是一些革命性的新材料,但很少有人擁有這方面的專業(yè)技能,來對這些化合物進行分析、制造和測試。

而這些化學自動化研究團隊的目標就是避免浪費那些稀有技能。

在某些方面,化學家的工作仍然類似于抄寫員的工作,他們曾經(jīng)費盡心思地復制和修正他人的著作。像 Cronin 這樣的研究人員,就是希望借助相當于印刷機、文字處理器和自動更正機的化學制劑在手,未來的化學家們將花費更少的時間進行重復創(chuàng)作,轉(zhuǎn)而花費更多的時間進行新的創(chuàng)作。

Fischer 說:“這不是要取代化學家,而是要給化學家提供工具,讓他們成為有創(chuàng)造力的高級思考者。”

圖片標題

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號