侵權投訴
訂閱
糾錯
加入自媒體

人工智能在新藥研發(fā)中的應用現(xiàn)狀與挑戰(zhàn)

聲明:本文為火石創(chuàng)造原創(chuàng)文章,歡迎個人轉發(fā)分享,網(wǎng)站、公眾號等轉載需經(jīng)授權。

本文選自《藥學進展》2021年第7期,作者劉曉凡 1,孫翔宇 1,朱迅 2* 。《藥學進展》雜志是由中國藥科大學和中國藥學會共同主辦、國家教育部主管

(1. 火石創(chuàng)造,浙江 杭州 310051;2. 吉林大學基礎醫(yī)學院,吉林 長春 130021)

人工智能作為一種新興技術,是新藥研發(fā)實現(xiàn)降本增效的重要方式之一,人工智能 + 新藥研發(fā)已成為中國醫(yī)藥企業(yè)加速創(chuàng)新轉型的重要驅動力。對國內(nèi)外相關文獻和資料進行檢索和歸納,重點分析人工智能在新藥研發(fā)領域的應用模式,總結開展人工智能應用的企業(yè)主體及應用場景,探究我國人工智能賦能新藥研發(fā)面臨的主要挑戰(zhàn)。

當前,新藥研發(fā)面臨著成本高企、收益率下降的雙重困境。新藥研發(fā)具有技術難度大、投入資金多、研發(fā)風險大、回報率高和研發(fā)周期長等特征,隨著疾病復雜程度的提升,新藥研發(fā)難度和成本迅速增加,全球新藥研發(fā)成功率呈明顯下降趨勢。2019 年,艾昆緯(IQVIA)發(fā)布報告 [1] 指出,新藥從臨床試驗開始到研發(fā)結束的平均開發(fā)時間在過去 10 年里增加了 26%,2018 年達到 12.5 年;新藥開發(fā)成功率不斷下降,2018 年降至 11.4%。據(jù) Nature 雜志報道,新藥研發(fā)成本快速增長,2018 年開發(fā)的平均成本約為 26 億美元 [2]。新藥投資回報率不斷下滑,德勤發(fā)布的報告顯示,2017 年全球前 12 大制藥公司的研發(fā)投資回報率僅為 3.2%,較 2010 年的 10.3% 下降7 個百分點 [3]。

人 工 智 能(artificial intelligence,AI) 的 發(fā) 展,為新藥研發(fā)帶來了新的技術手段。通過機器學習(machine learning,ML)、 深 度 學 習(deeplearning,DL)等方式賦能藥物靶點發(fā)現(xiàn)、化合物篩選等環(huán)節(jié),大大提升了新藥研發(fā)的效率,為降本增效提供了可能 [4]。應用 AI 技術,可縮短前期研發(fā)約一半時間,使新藥研發(fā)的成功率從當前的 12% 提高到 14%,每年為全球節(jié)約化合物篩選和臨床試驗費用約 550 億美元 [5]。

提升新藥研發(fā)效率,對加快開發(fā)臨床需求未被滿足的創(chuàng)新藥物,助力藥企搶占“best-in-class”和“first-in-class”藥物市場的機遇窗口期,從而提升藥企全球競爭力具有重要意義。AI 技術作為提升新藥研發(fā)效率的重要驅動力量,正在加速對新藥研發(fā)各環(huán)節(jié)的滲透 [6]。本文通過對 AI 技術、AI 賦能新藥研發(fā)應用場景,以及應用 AI 技術的企業(yè)主體進行總結梳理,并展望 AI 技術未來發(fā)展趨勢,為 AI+新藥研發(fā)提供思路與參考。

01 人工智能 + 新藥研發(fā)的應用模式

與 AI 在其他場景的應用類似,AI+ 新藥研發(fā)的實現(xiàn)路徑包括五大流程:1)獲取目標訓練數(shù)據(jù)集;2)AI 自主學習算法建模;3)多次訓練優(yōu)化模型;4)測試集應用以評估模型性能;5)基于模型實現(xiàn)分子篩選、預測、分析等預定目標。算法、數(shù)據(jù)集和模型這 3 個要素是必不可少的部分,其中,算法和數(shù)據(jù)是實現(xiàn)應用的關鍵。

1.1 人工智能 + 新藥研發(fā)應用算法 AI 技術涵蓋 ML 和 DL,如表 1 所示。ML 算法在新藥研發(fā)領域被廣泛用于分類和回歸預測等方面,常見的 ML 算法包括決策樹(decision tree)、隨機森林(random forest)、支持向量機(supportvector machine)、k-最近鄰算法、樸素貝葉斯分類器等;DL 算法包括深度神經(jīng)網(wǎng)絡(deep neural network,DNN)、 卷 積 深 度 網(wǎng) 絡(convolutionalneural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(recurrentneural network,RNN)和自編碼器(autoencoder,AE)等。DL 算法適合處理大數(shù)據(jù),模型也更為復雜。隨著計算機性能的提高和數(shù)據(jù)量的積累,DL 算法在新藥研發(fā)中的應用越來越廣 [7]。

DNN 是最早應用于藥物發(fā)現(xiàn)的 DL 算法之一,最早來源于1943年McCulloch等[8]提出的計算模型。CNN 是一種前饋神經(jīng)網(wǎng)絡,它在圖像識別領域的表現(xiàn)優(yōu)異 [9]。RNN 是一類用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡,具有記憶能力,可用于處理基因和蛋白序列數(shù)據(jù)等 [10]。自編碼器的目的在于重構輸入數(shù)據(jù),可生成學習模型,在藥物分子生成方面應用前景廣闊 [11]。DNN、CNN、RNN 等 DL 算法模型通過定量結構性質關系(QSPR)或定量結構活性關系(QSAR)等預測藥物分子的物理化學性質以及藥物的吸收、分布、代謝、排泄和毒性(ADMET)。
表1:人工智能常見應用算法

來源:火石創(chuàng)造根據(jù)公開資料整理

面向新藥研發(fā)的 AI 分子篩選技術入選《麻省理工學院技術評論》發(fā)布的 2020 年“全球十大突破性技術”。AI 技術的發(fā)展正從傳統(tǒng)的大樣本訓練向小樣本學習、反饋學習的模式轉變,小樣本學習、零樣本學習將逐漸在藥物研發(fā)中應用和推廣 [12]。

1.2 人工智能 + 新藥研發(fā)應用數(shù)據(jù) 新藥研發(fā)過程涉及大量的數(shù)據(jù),包括文獻資料、化合物數(shù)據(jù)、靶點數(shù)據(jù)、專利數(shù)據(jù)、臨床試驗數(shù)據(jù)、真實世界數(shù)據(jù)、藥品審評審批數(shù)據(jù)、市場銷售數(shù)據(jù)等。面對海量、多源、異質性的數(shù)據(jù),AI 技術應用已逐漸跳出以靶點和分子篩選為核心的傳統(tǒng)新藥研發(fā)模式,形成以數(shù)據(jù)為核心的研發(fā)模式。

IBM 公司開發(fā)的 Watson 系統(tǒng),通過閱讀 2 500萬篇文獻摘要、100 萬篇完整論文和 400 萬篇專利文獻,來預測 RNA 結合蛋白(RNA binding protein,RBP)與肌萎縮側索硬化(ALS)的相關性。英國生物科技公司 Benevolent Bio 從全球范圍內(nèi)海量的學術論文、專利、臨床試驗結果、患者記錄等數(shù)據(jù)中,提取對新藥研發(fā)有用的信息;Atomwise 公司利用其核心技術平臺 AtomNet 識別重要的化學基團,如氫鍵、芳香度和單鍵碳,分析化合物的構效關系,從而用于新藥發(fā)現(xiàn)和評估新藥風險。

02 人工智能 + 新藥研發(fā)的應用企業(yè)

近年來,越來越多的企業(yè)布局 AI+ 新藥研發(fā),探索如何用 AI 技術實現(xiàn)新藥研發(fā)的降本增效。據(jù)Deep Pharma Intelligence 統(tǒng) 計, 截 至 2020 年, 全球共有 240 家 AI+ 新藥研發(fā)企業(yè),主要分布在美國、英國和加拿大,國內(nèi)也有一些從事此類工作的企業(yè)。目前,探索 AI+ 新藥研發(fā)的企業(yè)主要有三類:一是 AI 藥物研發(fā)創(chuàng)新企業(yè),如 Exscienta、BenevolentAI、Atomwise、Relay Therapeutcs、晶泰科技、燧坤智能等;二是 IT 巨頭,如 Google、微軟、騰訊、阿里巴巴集團等

三是大型制藥企業(yè),如羅氏、阿斯利康、強生、葛蘭素史克(GSK)等,見圖 1。

新藥研發(fā) IT 巨頭傾向于利用自身的互聯(lián)網(wǎng)基礎與平臺優(yōu)勢進行技術布局,進入方式為自主研發(fā)相關產(chǎn)品,開發(fā)相關領域針對性技術以賦能行業(yè)應用,業(yè)務領域不斷下沉,或者通過外延并購擴張業(yè)務版圖,例如騰訊進軍 AI+ 新藥研發(fā)領域,發(fā)布首個 AI驅動的藥物發(fā)現(xiàn)平臺“云深智藥(iDrug)”,谷歌計劃斥資 4 億美元收購 AI 企業(yè) DeepMind。

圖1:人工智能+新藥研發(fā)企業(yè)圖譜

來源:火石創(chuàng)造根據(jù)公開資料整理


AI+ 新藥研發(fā)企業(yè)多以技術優(yōu)勢切入 1 個或多個應用場景,如 Benevolent AI 構建判斷加強認知系統(tǒng)(judgment augmented cognition system,JACS)技術平臺,針對包括阿爾茨海默病和罕見腫瘤在內(nèi)的 4 個不同領域的疾病進行 10 多種藥物的研發(fā),晶泰科技組建 Renova AI 新藥研發(fā)平臺,提供“計算+ 實驗”新模式下的藥物設計與固體形態(tài)研究服務。

大型藥企則以自建 AI 研究團隊、投資并購或與 AI 技術公司合作的方式,布局 AI 新藥研發(fā)。輝瑞、GSK 和諾華等制藥公司也在內(nèi)部建立了大量的AI 研究團隊。當前全球十大制藥公司均已布局 AI+新藥研發(fā),諸多大型制藥公司開始與 AI 初創(chuàng)公司開展合作,例如艾伯維與 AiCure、阿斯利康與 BergHealth、拜耳與Sensyne Health、百時美施貴寶(BMS)Concerto Health AI,以及輝瑞與 IBM Watson 等。

由于 AI+ 新藥研發(fā)創(chuàng)新公司缺少新藥研發(fā)的相關數(shù)據(jù)、成熟的研發(fā)管線以及資深的藥物專家,而這恰好是傳統(tǒng)制藥巨頭所具備的優(yōu)勢。因此,大型藥企和 AI+ 新藥研發(fā)的技術公司聯(lián)合是目前主要的業(yè)務模式。從開展合作情況來看,隨著 AI+ 新藥研發(fā)的發(fā)展,現(xiàn)有制藥生態(tài)系統(tǒng)正從執(zhí)行研發(fā)的傳統(tǒng)利益攸關方逐漸轉向更加多樣化的技術支持伙伴關系 [13]。

我國 AI+ 新藥研發(fā)起步較晚,目前尚處在初期階段,據(jù)火石創(chuàng)造統(tǒng)計,國內(nèi)涌現(xiàn)了晶泰科技、深度智藥、云勢軟件、望石智慧等一批創(chuàng)新企業(yè),主要分布在北京、上海、杭州和深圳等城市。然而,國內(nèi) AI+ 新藥研發(fā)企業(yè)并不多,總數(shù)不足 20 家。

近年來,隨著我國醫(yī)藥產(chǎn)業(yè)創(chuàng)新發(fā)展的加速推進,國內(nèi)的醫(yī)藥行業(yè)在 AI+ 新藥研發(fā)領域的跨界合作也在增加:一、醫(yī)藥巨頭與 AI+ 新藥研發(fā)技術公司合作,例如恒瑞醫(yī)藥與百奧知、豪森藥業(yè)與Atomwise 的合作;二、藥企與 IT 巨頭合作,如正大天晴通過與阿里云合作獲得一種全新的化合物篩選方法 [14];三、合同研究組織(CRO)企業(yè)與 AI+新藥研發(fā)技術公司合作,如藥明康德和 Schrdinger合資成立了 Faxian Therapeutics,將藥明康德的先導化合物優(yōu)化服務與 Schrdinger 的藥物設計軟件平臺相結合,從而加速新藥發(fā)現(xiàn);藥明康德和 Insilico 合作開發(fā)了一種 ML 模型,用于從頭設計 DDR1 蛋白(一種與纖維化等疾病有關的激酶)的小分子抑制劑。

03 人工智能 + 新藥研發(fā)的應用實踐

目前,從全球 AI+ 新藥研發(fā)企業(yè)的應用實踐來看,AI+ 新藥研發(fā)主要是將 ML、DL 等 AI 技術,應用到前期研究、靶點發(fā)現(xiàn)、化合物合成、化合物篩選、新適應證發(fā)現(xiàn)、晶型預測、患者招募等新藥研發(fā)環(huán)節(jié)(見圖 2)。例如,數(shù)據(jù)挖掘和分析有助于藥物靶標的確立,進而找到具有潛力的先導化合物 [15],從而最大程度提升新藥研發(fā)效率。與傳統(tǒng)新藥研發(fā)管線比,基于 AI 和生物計算的新藥研發(fā)管線平均 1 ~ 2 年就可以完成臨床前藥物研究 [16]。靶點識別、先導化合物確定、藥物重定向被認為是全球AI+ 新藥研發(fā)最具變革意義的研究領域 [17],其中靶點發(fā)現(xiàn)和化合物合成是企業(yè)布局的熱門方向。

3.1 前期研究 前期研究主要是基于文獻分析和知識庫建設,進行疾病機制、靶點、藥物作用方式研究。AI 的應用主要在文獻數(shù)據(jù)整合分析、新藥研發(fā)知識庫建設、新藥研發(fā)數(shù)據(jù)集建設和基準化合物庫設計等方面,可以借助 AI 自然語音處理、知識圖譜等技術實現(xiàn)海量信息的快速提取,從而對推動新藥研發(fā)的眾多知識進行聚類分析,幫助提出新的可以被驗證的假說,進而加快新藥研發(fā)的進程。例如深度智耀整合了數(shù)百個開放數(shù)據(jù)源,通過 ML 技術,結合醫(yī)藥研發(fā)專家知識,自動提取醫(yī)藥實體、關系和屬性,構建醫(yī)藥研發(fā)知識圖譜。

圖2:人工智能+新藥研發(fā)應用場景來源:火石創(chuàng)造根據(jù)公開資料整理

3.2 藥物發(fā)現(xiàn) 藥物發(fā)現(xiàn)是關系新藥研發(fā)成功率的關鍵環(huán)節(jié),主要包括靶點選擇優(yōu)化、先導化合物的發(fā)現(xiàn)、先導化合物的篩選優(yōu)化,AI 在藥物發(fā)現(xiàn)環(huán)節(jié)的應用聚焦于靶點發(fā)現(xiàn)、晶型預測以及候選藥物分子的篩選優(yōu)化。

在靶點發(fā)現(xiàn)和驗證方面,可以利用自然語言處理技術檢索分析海量文獻、專利和臨床試驗報告的非結構化數(shù)據(jù)庫,找出與疾病相關的潛在的、被忽視的通路、蛋白和機制,從而提出新的可供測試的假說,以發(fā)現(xiàn)新機制和新靶點 [13]。例如,Insilico Medicine 利用自主研發(fā)的 AI 新藥靶點發(fā)現(xiàn)平臺 PandaOmics和 AI 分子生成和設計平臺 Chemistry42,獲得了全球首例完全由 AI 驅動發(fā)現(xiàn)的特發(fā)性肺纖維化(IPF)疾病新靶點。

在晶型預測方面,可以利用認知計算實現(xiàn)高效動態(tài)配置藥物晶型,預測小分子藥物所有可能的晶型。例如艾伯維(AbbVie)結合晶泰科技的晶型預測等技術,設計了一套新集成模型,能夠以二維結構作為輸入,預測得到分子的熱力學溶解度 [18]。相比于傳統(tǒng)藥物晶型研發(fā),采用 AI 技術的制藥企業(yè)能更加自如地面對仿制藥企業(yè)的晶型專利挑戰(zhàn)。另外,晶型預測技術縮短了晶型開發(fā)的時間,能更加高效地挑選出合適的藥物晶型,進而縮短研發(fā)周期,控制成本。

在化合物篩選和優(yōu)化方面,要從數(shù)以萬計的化合物分子中篩選出對特定靶標具有較高活性的化合物,往往需要較長的時間和成本,可以利用 AI 技術建立虛擬藥物篩選模型,快速過濾“低質量”化合物,富集潛在有效分子,檢索更快、覆蓋范圍更廣,利用 ML 技術,從海量化合物中挑選出高潛力候選藥物,從而減少研發(fā)新藥的時間和成本 [19–20],加速先導化合物的發(fā)現(xiàn)和優(yōu)化,以及候選藥物分子的產(chǎn)生。例如 BenevolentBio 曾借助 JACS 技術,標記出 100個或可用于治療 ALS 的潛在化合物,并成功篩選出5 個化合物;BergHealth 則篩選了多達 25 萬個疾病組織樣本來尋找癌癥早期的新生物學指標和生物標記等。

當前來看,AI 藥物發(fā)現(xiàn)在藥物靶點發(fā)現(xiàn)和藥物篩選環(huán)節(jié)的技術應用相對成熟:研究層面,現(xiàn)有 AI解決方案在藥物發(fā)現(xiàn)階段更具先進性 [13],例如阿斯利康作為 AI 領域的探索者,僅在 2019 年就發(fā)布了65 篇 AI 相關的新藥發(fā)現(xiàn)及研發(fā)的相關文獻;專利層面,AI+ 新藥研發(fā)領域的專利發(fā)布數(shù)量盡管還較少,但主要技術指向還是集中分布在藥物發(fā)現(xiàn)的靶標確定和化合物篩選這 2 個技術分支 [21]。

另外,也有研究指出使用目前的數(shù)據(jù)不太可能大幅度地提升 AI 藥物發(fā)現(xiàn)的性能,因為目前的數(shù)據(jù)沒有反映出藥物在體內(nèi)的情況,所以計算機僅利用這些數(shù)據(jù)并不能很好地做出決策,尤其是針對復雜的疾病。雖然目前有大量的描述化學特性的數(shù)據(jù),這些數(shù)據(jù)能夠使計算機生成相應的配體,但配體發(fā)現(xiàn)不等于藥物發(fā)現(xiàn) [22]。

3.3 臨床前研究 臨床前研究需要開展藥效學、藥動學和毒理學研究以及藥劑學研究,主要是提前預測候選藥物的ADMET 在后續(xù)藥物開發(fā)中起到關鍵作用的性質,評估候選藥物通過臨床試驗的可能性,提高后續(xù)臨床試驗的成功概率。在臨床前研究環(huán)節(jié),可以利用AI 技術提升 ADMET 性質預測的準確度,以及幫助加速識別新適應證。

在藥物 ADMET 性質研究方面,可利用深度神經(jīng)網(wǎng)絡算法有效提取結構特征的預測方式,進一步提升 ADMET 性質預測的準確度。例如,云深智藥采用“從頭折疊”的蛋白質結構預測方法幫助解析了 SRD5A2 晶體結構,并通過自研 AI 工具“tFold”有效提升了蛋白質結構預測精度,在科研突破中發(fā)揮了核心作用 [23]。

在新適應證拓展方面,一是可以利用 AI 的 DL能力和認知計算能力,將已上市或處于研發(fā)管線的藥物與疾病進行匹配,發(fā)現(xiàn)新靶點,擴大藥物的治療用途;二是借助公共領域的公開大數(shù)據(jù)集資源,可以利用 AI 算法,選擇訓練推導出預測跨目標活動的 ML 模型,應用于藥物的再利用,實現(xiàn)對現(xiàn)有藥物識別新的適應證;三是利用 AI 技術通過模擬隨機臨床試驗發(fā)現(xiàn)藥物新用途 [24]。例如,燧坤智能通過ML 預測,利用 AI 算法系統(tǒng)性整合疾病、靶點、藥物等多個維度的海量數(shù)據(jù),重建藥物-靶點相互作用網(wǎng)絡,實現(xiàn)了對藥物-靶點相互作用的全景刻畫,實現(xiàn)老藥新用、在研藥物二次開發(fā)、失敗藥物再利用、天然產(chǎn)物開發(fā)等。

3.4 臨床試驗 臨床試驗是新藥研究中周期最長、成本最高的環(huán)節(jié),由于患者隊列選擇和臨床試驗期間對患者的監(jiān)測不力等原因,當前的藥物臨床試驗成功率不高,通常 10 種進入臨床試驗的化合物中只有 1 種能進入市場。在臨床試驗環(huán)節(jié),可以利用 ML、自然語言處理等技術輔助臨床試驗設計、患者招募和臨床試驗數(shù)據(jù)處理。

AI 輔助臨床試驗設計主要是利用自然語言處理技術快速處理同類研究、臨床數(shù)據(jù)和監(jiān)管信息,以及讀取臨床試驗等數(shù)據(jù)。例如 Trials.a(chǎn)i 公司使用 AI來優(yōu)化臨床試驗設計,使患者更容易參加臨床試驗,消除不必要的臨床操作負擔。

AI 患者招募主要利用自然語言處理、ML 等技術,對不同來源的受試者信息和臨床試驗方案的入組 / 排除標準進行識別和匹配,包括醫(yī)學資料的數(shù)字化、理解醫(yī)學資料的內(nèi)容、關聯(lián)數(shù)據(jù)集和模式識別、擴大受試者范圍、開發(fā)患者搜索臨床試驗的簡化工具等 [25]。例如梅奧診所與 IBM Watson 合作,基于自然語言處理技術,掃描臨床試驗數(shù)據(jù)庫,為臨床試驗尋找合適的患者。在他們進行的一項試點研究中,IBM Watson 臨床試驗匹配系統(tǒng)使乳腺癌試驗的平均每月注冊人數(shù)增加了 80%;零氪科技利用大數(shù)據(jù)整合患者資料,加快了招募患者參加臨床試驗的速度。

AI 輔助臨床數(shù)據(jù)處理主要是利用云計算強大算力支快速處理臨床數(shù)據(jù)分析并及時調整優(yōu)化整個試驗進程,提升臨床試驗風險控制能力。例如,太美醫(yī)療推出由病例報告表(CRF)設計平臺、臨床試驗電子數(shù)據(jù)采集系統(tǒng) / 數(shù)據(jù)管理系統(tǒng)(EDC)、數(shù)據(jù)分析技術組合構成的自動化臨床數(shù)據(jù)解決方案,可以幫助藥企應對臨床項目中多變的需求,優(yōu)化數(shù)據(jù)處理的流程。

表 2 介紹了 AI 主要應用場景的代表企業(yè)。

表2:人工智能主要應用場景代表企業(yè)

來源:火石創(chuàng)造根據(jù)公開資料整理

04 人工智能 + 新藥研發(fā)面臨的挑戰(zhàn)

AI+ 新藥研發(fā)目前已進入快速成長期,備受業(yè)界矚目;但其作為新興領域,也面臨著一些挑戰(zhàn)。

一是生物學的復雜性,給數(shù)據(jù)獲取和 AI 算法設計帶來巨大挑戰(zhàn)。藥學是一個融合化學和生物學的學科,在數(shù)據(jù)層面,二者具有較大的差異性。一般來說,化學方面的數(shù)據(jù)更加穩(wěn)定、可控與易于計算;生物學數(shù)據(jù)涉及受體蛋白的構象變化,平衡和偏置信號等難以定量計算。化合物與人體靶點的結合與反應過程非常復雜,目前理論認知不足,受環(huán)境影響因素很大,數(shù)據(jù)穩(wěn)定性和可重復性較差。

二是當前的 AI 算法模型只納入部分化學指標,生物學指標不完整。我們能夠基于化學數(shù)據(jù)去設計AI 算法,比如判斷小分子的各種體外物理化學性質、晶型以及與靶點結合的親和力;但是對于小分子藥物在生物系統(tǒng)中的作用很難用一組有限的參數(shù)來定義,而化合物在體內(nèi)的其他特性在模型中被降級為次要的或可忽略部分,包括其前體化合物、代謝產(chǎn)物、濃度依賴性效應等,這些被忽略的因素決定著藥物能否到達其預期的靶點、能否起到治療效果、以及其毒副作用是否在可以接受的范圍等。這使得 AI 在藥物發(fā)現(xiàn)和藥效評估中面臨著更大的不確定性。

三是高質量數(shù)據(jù)制約。我國的醫(yī)藥大數(shù)據(jù)存在數(shù)據(jù)量少、數(shù)據(jù)體系不完整、數(shù)據(jù)標準不統(tǒng)一、數(shù)據(jù)共享機制不完善等問題。諸如病歷、隨訪記錄目前還很難標準化、數(shù)字化;由于涉及患者隱私,臨床數(shù)據(jù)的靈活運用也受到了一定限制;國內(nèi)創(chuàng)新藥研發(fā)起步較晚,原始數(shù)據(jù)積累有限;國內(nèi)藥品數(shù)據(jù)存儲分散,存儲格式不一,完整藥物數(shù)據(jù)獲取比較困難;新藥研發(fā)領域的核心數(shù)據(jù)來源于藥企,考慮到商業(yè)機密的問題,企業(yè)不愿公開核心數(shù)據(jù)。醫(yī)藥數(shù)據(jù)的數(shù)量和質量將成為制藥行業(yè) AI 發(fā)展的主要障礙。

四是高端復合型人才缺失。AI 新藥研發(fā)兼具信息科技和醫(yī)藥雙重屬性,需要一批既掌握 AI 前沿技術,又精通新藥研發(fā)的復合型人才,由于我國相關領域的教學科研起步較晚,人才問題難以在短期內(nèi)得到解決 [26]。據(jù)統(tǒng)計,全世界大約有 2.2 萬名 AI 領域高端研究人員,而在中國只有約 600 名,人才需求缺口較大 [27]。

五是政策法規(guī)的制定滯后。AI 存在監(jiān)管體系滯后于技術發(fā)展、政府單向監(jiān)管無法有效管控風險、企業(yè)缺乏合規(guī)治理有效工具和體系等問題。AI 因算法不透明、難解釋、跨界傳播性和外溢性強,比一般的數(shù)字治理涉及范圍廣、難度大、問題突出。當前,AI 新藥研發(fā)監(jiān)管體系不健全,缺少具體的評估標準、市場準入、退出機制和收費機制,難以對潛在的問題進行監(jiān)督與反饋。在涉及人格權、知識產(chǎn)權、財產(chǎn)權、侵權責任認定、法律主體地位等方面的 AI法律法規(guī)尚屬空白 [28]。
05 結語

AI 在新藥研發(fā)的各個階段都發(fā)揮著重要作用,也在一定程度上助力藥企降本增效,在資本驅動下,AI+ 新藥研發(fā)正掀起創(chuàng)新熱潮。但需強調的是,從已經(jīng)開展 AI+ 新藥研發(fā)的應用實踐來看,AI 不是“靈丹妙藥”,不能在一夜之間提高臨床試驗的效率 [29],當前 AI 技術尚不能為提升新藥研發(fā)效率帶來革命性的突破。受生物系統(tǒng)內(nèi)在的復雜性和疾病異質性特征的制約,AI 分析藥物在體內(nèi)活性的數(shù)據(jù)非常有限,計算機不能很好地做出決策 [30],導致準確模擬疾病的發(fā)病機制難度大,使得 AI 技術在提升新藥的臨床試驗成功率方面發(fā)揮的作用還非常有限。因此,未來 AI 賦能新藥研發(fā)相關研究和應用的進一步深化,需要傳統(tǒng)醫(yī)藥研發(fā)基礎科學(生物化學、生物學、生物醫(yī)學等)和核心 AI 技術的深度結合,需要技術專家、生物學家、醫(yī)學家等聯(lián)合攻關。

著眼當下,為了更好地發(fā)展 AI+ 新藥研發(fā),應對其面臨的五大挑戰(zhàn),提升新藥研發(fā)的效率從而加速我國醫(yī)藥創(chuàng)新升級,一是要突破新技術和新算法,引導技術創(chuàng)新以及 AI 技術在新藥研發(fā)各個環(huán)節(jié)的深入應用;二是建立“AI+ 新藥研發(fā)”領域復合人才跨學科培養(yǎng)輸出機制,自主培養(yǎng)一批高學識、高能力的“AI+ 新藥研發(fā)”領域的科研人員、技術工作者和應用開拓者,加快形成滿足行業(yè)發(fā)展需求的人才網(wǎng)絡;三是集中大數(shù)據(jù)力量助力攻關重大疾病致病機制、藥物靶點/表型/分子分型研究,完善醫(yī)藥研發(fā)數(shù)據(jù)庫,為拓展 AI 在新藥研發(fā)領域的應用構建高質量數(shù)據(jù)支撐體系;四是強化創(chuàng)制體制設計,建立支撐保障措施包括及時建立監(jiān)管機制,明晰產(chǎn)權結構,注重保護新藥研發(fā)中數(shù)據(jù)資產(chǎn)安全和知識產(chǎn)權。

參考資料:

Terry M. IQVIA report: biopharma R&D investment has increased32% over last 5 years[EB/OL].(2019-04-23)[2021-06-24].https://www.biospace.com/article/report-biopharma-focuses-on-oncologyrare-diseases-and-orphan-drugs/.

Fleming N. How artificial intelligence is changing drugdiscovery[EB/OL].(2018-05-10)[2021-06-05]. https://www.nature.com/articles/d41586-018-05267-x.

Taylor P. Pharma is ‘getting lower returns on R&D’[EB/OL].(2017-12-15)[2021-05-21]. http://www.pmlive.com/pharma_news/pharma_is_getting_lower_returns_on_r_and_d_1214594.

劉伯炎 , 王群 , 徐俐穎 , 等 . 人工智能技術在醫(yī)藥研發(fā)中的應用[J]. 中國新藥雜志 , 2020, 29(14): 1979–1986.

? Wong C H, Siah K W, Lo A W. Estimation of clinical trial successrates and related parameters[J]. Biostatistics, 2019, 20(2): 273–286.

陸濤 . 人工智能在醫(yī)藥領域的應用 [J]. 藥學進展 , 2019, 44(1):1–3.

梁禮 , 鄧成龍 , 張艷敏 , 等 . 人工智能在藥物發(fā)現(xiàn)中的應用與挑戰(zhàn) [J]. 藥學進展 , 2020, 44(1): 18–27.

Mcculloch W S, Pitts W. A logical calculus of the ideas immanent innervous activity[J]. Bull Math Biophys, 1943, 5(4): 115–133.

Lu H M, Li Y J, Uemura T, et al. FDCNet: filtering deepconvolutional network for marine organism classification[J].Multimed Tools Appl, 2017, 77(17): 21847–21860.

Yang X, Wang Y F, Byrne R, et al. Concepts of artificial intelligencefor computer-assisted drug discovery[J]. Chem Rev, 2019, 119(18):10520–10594.

Chen H M, Engkvist O, Wang Y H, et al. The rise of deep learningin drug discovery[J]. Drug Discov Today, 2018, 23(6): 1241–1250.

Lavecchia A. Deep learning in drug discovery: opportunities,challenges and future prospects[J]. Drug Discov Today, 2019,24(10): 2017–2032.

張建楠 , 李瑩瑩 , 張燁琳 . AI 驅動新藥研發(fā)深度發(fā)展 [EB/OL].(2021-01-27)[2021-06-28]. http://www.imit.org.cn/index.php?g=&m=article&a=index&id=356&cid=11.

搜狐網(wǎng) . 正大天晴與阿里云合作,AI 制藥提高化合物篩選準確率 20% 新藥研發(fā)困難重重?正大天晴與阿里云合作用 AI 尋找解決辦法 [EB/OL]. (2018-09-04)[2021-06-30]. https://www.sohu.com/a/251826274_114877.

Willems H, De Cesco S, Svensson F. Computational chemistryon a budget: supporting drug discovery with limited resources:miniperspective[J].J Med Chem, 2020, 63(18): 10158–10169.

Chan H, Shan H, Dahoun T, et al. Advancing drug discovery viaartificial intelligence[J]. Trends Pharmacol Sci, 2019, 40(8): 592–604.

Zhavoronkov A. Artificial intelligence for drug discovery, biomarkerdevelopment, and generation of novel chemistry[J]. Mol Pharm,2018, 15(10): 4311–4313.

Hong R S, Mattei A, Sheikh A Y, et al. Novel physics-basedensemble modeling approach that utilizes 3D molecular conformationand packing to access aqueous thermodynamic solubility: a casestudy of orally available bromodomain and extraterminal domaininhibitor lead optimization series[J]. J Chem Inf Model, 2021, 61(3):1412–1426.

Lee P K. Shortcut strategy for screening compounds with clinicalpotentials for drug development[EB/OL].(2018-11-03)[2021-06-26].https://www.eurekalert.org/pub_releases/2018-12/cuoh-ssf120318.php.

Lin X, Duan X, Jacobs C, et al. High-throughput brain activitymapping and machine learning as a foundation for systemsneuropharmacology[J]. Nat Commun, 2018, 9(1): 5142. DOI:10.1038/s41573-019-0024-5.

Vamathevan J, Clark D, Czodrowski P, et al. Applications ofmachine learning in drug discovery and development[J]. Nat RevDrug Discov, 2019(18): 463–477.

Bender A, Cortés-Ciriano I. Artificial intelligence in drug discovery:what is realistic, what are illusions? Part 1: Ways to make an impact,and why we are not there yet[J]. Drug Discov Today, 2021,26(2):511–524.

Xiao Q, Wang L, Supekar S, et al. Structure of human steroid5α-reductase 2 with the anti-androgen drug finasteride[J]. NatCommun, 2020, 11(1): 5430. DOI:10.1038/s41467-020-19249-z.

Liu R, Wei L, Zhang P. A deep learning framework for drugrepurposing via emulating clinical trials on real-world patientdata[J]. Nat Mach Intell, 2021(3): 68–75.

Ulenaers J. The impact of artificial intelligence on the right to a fairtrial: towards a robot judge?[J]. Asian J Law Econ, 2020, 11(2):20200008. DOI:10.1515/ajle-2020-0008.

朱壽華 , 凌澤農(nóng) , 周金花 . 人工智能技術在醫(yī)療健康領域的應用 [J]. 電子技術與軟件工程 , 2020, 171(1): 18–19.

央廣網(wǎng) . 中國人工智能人才缺口超 500 萬供求比例僅為 1:10[EB/OL]. (2017-07-14)[2021-06-30]. https://baijiahao.baidu.com/s?id=1572854410914751&wfr=spider&for=pc.

中國日報網(wǎng) . 法律該賦予人工智能什么地位 ? 實現(xiàn)與人的智能疊 拼 [EB/OL]. (2018-01-23)[2021-06-30]. https://baijiahao.baidu.com/s?id=1590352506664610651&wfr=spider&for=pc.

Bhatt A. Artificial intelligence in managing clinical trial design andconduct: man and machine still on the learning curve?[J]. PerspectClin Res, 2021, 12(1): 1. DOI:10.4103/picr.PICR_312_20.

Jiménez-Luna J, Grisoni F, Weskamp N, et al. Artificial intelligencein drug discovery: recent advances and future perspectives[EB/OL].(2021-04-02)[2021-06-28]. http://doi-org-443.group10-s.ccame.net/10.1080/17460441.2021.1909567.

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號