伊人久在线观看视频,国产一级按摩不卡播放,欧洲亚洲精品免费二区

新藥研發(fā)中人工智能的應(yīng)用現(xiàn)狀與挑戰(zhàn)

2021-10-20 14:28

聲明：本文為火石創(chuàng)造原創(chuàng)文章，歡迎個(gè)人轉(zhuǎn)發(fā)分享，網(wǎng)站、公眾號(hào)等轉(zhuǎn)載需經(jīng)授權(quán)。

本文選自《藥學(xué)進(jìn)展》2021年第7期，作者劉曉凡 1，孫翔宇 1，朱迅 2＊ �！端帉W(xué)進(jìn)展》雜志是由中國(guó)藥科大學(xué)和中國(guó)藥學(xué)會(huì)共同主辦、國(guó)家教育部主管

（1．火石創(chuàng)造，浙江杭州 310051；2．吉林大學(xué)基礎(chǔ)醫(yī)學(xué)院，吉林長(zhǎng)春 130021）

人工智能作為一種新興技術(shù)，是新藥研發(fā)實(shí)現(xiàn)降本增效的重要方式之一，人工智能＋新藥研發(fā)已成為中國(guó)醫(yī)藥企業(yè)加速創(chuàng)新轉(zhuǎn)型的重要驅(qū)動(dòng)力。對(duì)國(guó)內(nèi)外相關(guān)文獻(xiàn)和資料進(jìn)行檢索和歸納，重點(diǎn)分析人工智能在新藥研發(fā)領(lǐng)域的應(yīng)用模式，總結(jié)開(kāi)展人工智能應(yīng)用的企業(yè)主體及應(yīng)用場(chǎng)景，探究我國(guó)人工智能賦能新藥研發(fā)面臨的主要挑戰(zhàn)。

當(dāng)前，新藥研發(fā)面臨著成本高企、收益率下降的雙重困境。新藥研發(fā)具有技術(shù)難度大、投入資金多、研發(fā)風(fēng)險(xiǎn)大、回報(bào)率高和研發(fā)周期長(zhǎng)等特征，隨著疾病復(fù)雜程度的提升，新藥研發(fā)難度和成本迅速增加，全球新藥研發(fā)成功率呈明顯下降趨勢(shì)。2019 年，艾昆緯（IQVIA）發(fā)布報(bào)告［1］指出，新藥從臨床試驗(yàn)開(kāi)始到研發(fā)結(jié)束的平均開(kāi)發(fā)時(shí)間在過(guò)去 10 年里增加了 26％，2018 年達(dá)到 12．5 年；新藥開(kāi)發(fā)成功率不斷下降，2018 年降至 11．4％。據(jù) Nature 雜志報(bào)道，新藥研發(fā)成本快速增長(zhǎng)，2018 年開(kāi)發(fā)的平均成本約為 26 億美元［2］。新藥投資回報(bào)率不斷下滑，德勤發(fā)布的報(bào)告顯示，2017 年全球前 12 大制藥公司的研發(fā)投資回報(bào)率僅為 3．2％，較 2010 年的 10．3％下降7 個(gè)百分點(diǎn) ［3］。

人工智能（artificial intelligence，AI）的發(fā) 展，為新藥研發(fā)帶來(lái)了新的技術(shù)手段。通過(guò)機(jī)器學(xué)習(xí)（machine learning，ML）、深度學(xué) 習(xí)（deeplearning，DL）等方式賦能藥物靶點(diǎn)發(fā)現(xiàn)、化合物篩選等環(huán)節(jié)，大大提升了新藥研發(fā)的效率，為降本增效提供了可能［4］。應(yīng)用 AI 技術(shù)，可縮短前期研發(fā)約一半時(shí)間，使新藥研發(fā)的成功率從當(dāng)前的 12％提高到 14％，每年為全球節(jié)約化合物篩選和臨床試驗(yàn)費(fèi)用約 550 億美元［5］。

提升新藥研發(fā)效率，對(duì)加快開(kāi)發(fā)臨床需求未被滿(mǎn)足的創(chuàng)新藥物，助力藥企搶占“best－in－class”和“first－in－class”藥物市場(chǎng)的機(jī)遇窗口期，從而提升藥企全球競(jìng)爭(zhēng)力具有重要意義。AI 技術(shù)作為提升新藥研發(fā)效率的重要驅(qū)動(dòng)力量，正在加速對(duì)新藥研發(fā)各環(huán)節(jié)的滲透［6］。本文通過(guò)對(duì) AI 技術(shù)、AI 賦能新藥研發(fā)應(yīng)用場(chǎng)景，以及應(yīng)用 AI 技術(shù)的企業(yè)主體進(jìn)行總結(jié)梳理，并展望 AI 技術(shù)未來(lái)發(fā)展趨勢(shì)，為 AI＋新藥研發(fā)提供思路與參考。

01 人工智能＋新藥研發(fā)的應(yīng)用模式

與 AI 在其他場(chǎng)景的應(yīng)用類(lèi)似，AI＋新藥研發(fā)的實(shí)現(xiàn)路徑包括五大流程：1）獲取目標(biāo)訓(xùn)練數(shù)據(jù)集；2）AI 自主學(xué)習(xí)算法建模；3）多次訓(xùn)練優(yōu)化模型；4）測(cè)試集應(yīng)用以評(píng)估模型性能；5）基于模型實(shí)現(xiàn)分子篩選、預(yù)測(cè)、分析等預(yù)定目標(biāo)。算法、數(shù)據(jù)集和模型這 3 個(gè)要素是必不可少的部分，其中，算法和數(shù)據(jù)是實(shí)現(xiàn)應(yīng)用的關(guān)鍵。

1．1 人工智能＋新藥研發(fā)應(yīng)用算法 AI 技術(shù)涵蓋 ML 和 DL，如表 1 所示。ML 算法在新藥研發(fā)領(lǐng)域被廣泛用于分類(lèi)和回歸預(yù)測(cè)等方面，常見(jiàn)的 ML 算法包括決策樹(shù)（decision tree）、隨機(jī)森林（random forest）、支持向量機(jī)（supportvector machine）、k－最近鄰算法、樸素貝葉斯分類(lèi)器等；DL 算法包括深度神經(jīng)網(wǎng)絡(luò)（deep neural network，DNN）、卷積深度網(wǎng) 絡(luò)（convolutionalneural network，CNN）、循環(huán)神經(jīng)網(wǎng)絡(luò)（recurrentneural network，RNN）和自編碼器（autoencoder，AE）等。DL 算法適合處理大數(shù)據(jù)，模型也更為復(fù)雜。隨著計(jì)算機(jī)性能的提高和數(shù)據(jù)量的積累，DL 算法在新藥研發(fā)中的應(yīng)用越來(lái)越廣［7］。

DNN 是最早應(yīng)用于藥物發(fā)現(xiàn)的 DL 算法之一，最早來(lái)源于1943年McCulloch等［8］提出的計(jì)算模型。CNN 是一種前饋神經(jīng)網(wǎng)絡(luò)，它在圖像識(shí)別領(lǐng)域的表現(xiàn)優(yōu)異［9］。RNN 是一類(lèi)用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)，具有記憶能力，可用于處理基因和蛋白序列數(shù)據(jù)等［10］。自編碼器的目的在于重構(gòu)輸入數(shù)據(jù)，可生成學(xué)習(xí)模型，在藥物分子生成方面應(yīng)用前景廣闊［11］。DNN、CNN、RNN 等 DL 算法模型通過(guò)定量結(jié)構(gòu)性質(zhì)關(guān)系（QSPR）或定量結(jié)構(gòu)活性關(guān)系（QSAR）等預(yù)測(cè)藥物分子的物理化學(xué)性質(zhì)以及藥物的吸收、分布、代謝、排泄和毒性（ADMET）。
表1：人工智能常見(jiàn)應(yīng)用算法

來(lái)源：火石創(chuàng)造根據(jù)公開(kāi)資料整理

面向新藥研發(fā)的 AI 分子篩選技術(shù)入選《麻省理工學(xué)院技術(shù)評(píng)論》發(fā)布的 2020 年“全球十大突破性技術(shù)”。AI 技術(shù)的發(fā)展正從傳統(tǒng)的大樣本訓(xùn)練向小樣本學(xué)習(xí)、反饋學(xué)習(xí)的模式轉(zhuǎn)變，小樣本學(xué)習(xí)、零樣本學(xué)習(xí)將逐漸在藥物研發(fā)中應(yīng)用和推廣［12］。

1．2 人工智能＋新藥研發(fā)應(yīng)用數(shù)據(jù) 新藥研發(fā)過(guò)程涉及大量的數(shù)據(jù)，包括文獻(xiàn)資料、化合物數(shù)據(jù)、靶點(diǎn)數(shù)據(jù)、專(zhuān)利數(shù)據(jù)、臨床試驗(yàn)數(shù)據(jù)、真實(shí)世界數(shù)據(jù)、藥品審評(píng)審批數(shù)據(jù)、市場(chǎng)銷(xiāo)售數(shù)據(jù)等。面對(duì)海量、多源、異質(zhì)性的數(shù)據(jù)，AI 技術(shù)應(yīng)用已逐漸跳出以靶點(diǎn)和分子篩選為核心的傳統(tǒng)新藥研發(fā)模式，形成以數(shù)據(jù)為核心的研發(fā)模式。

IBM 公司開(kāi)發(fā)的 Watson 系統(tǒng)，通過(guò)閱讀 2 500萬(wàn)篇文獻(xiàn)摘要、100 萬(wàn)篇完整論文和 400 萬(wàn)篇專(zhuān)利文獻(xiàn)，來(lái)預(yù)測(cè) RNA 結(jié)合蛋白（RNA binding protein，RBP）與肌萎縮側(cè)索硬化（ALS）的相關(guān)性。英國(guó)生物科技公司 Benevolent Bio 從全球范圍內(nèi)海量的學(xué)術(shù)論文、專(zhuān)利、臨床試驗(yàn)結(jié)果、患者記錄等數(shù)據(jù)中，提取對(duì)新藥研發(fā)有用的信息；Atomwise 公司利用其核心技術(shù)平臺(tái) AtomNet 識(shí)別重要的化學(xué)基團(tuán)，如氫鍵、芳香度和單鍵碳，分析化合物的構(gòu)效關(guān)系，從而用于新藥發(fā)現(xiàn)和評(píng)估新藥風(fēng)險(xiǎn)。

02 人工智能＋新藥研發(fā)的應(yīng)用企業(yè)

近年來(lái)，越來(lái)越多的企業(yè)布局 AI＋新藥研發(fā)，探索如何用 AI 技術(shù)實(shí)現(xiàn)新藥研發(fā)的降本增效。據(jù)Deep Pharma Intelligence 統(tǒng) 計(jì)，截至 2020 年，全球共有 240 家 AI＋新藥研發(fā)企業(yè)，主要分布在美國(guó)、英國(guó)和加拿大，國(guó)內(nèi)也有一些從事此類(lèi)工作的企業(yè)。目前，探索 AI＋新藥研發(fā)的企業(yè)主要有三類(lèi)：一是 AI 藥物研發(fā)創(chuàng)新企業(yè)，如 Exscienta、BenevolentAI、Atomwise、Relay Therapeutcs、晶泰科技、燧坤智能等；二是 IT 巨頭，如 Google、微軟、騰訊、阿里巴巴集團(tuán)等

三是大型制藥企業(yè)，如羅氏、阿斯利康、強(qiáng)生、葛蘭素史克（GSK）等，見(jiàn)圖 1。

新藥研發(fā) IT 巨頭傾向于利用自身的互聯(lián)網(wǎng)基礎(chǔ)與平臺(tái)優(yōu)勢(shì)進(jìn)行技術(shù)布局，進(jìn)入方式為自主研發(fā)相關(guān)產(chǎn)品，開(kāi)發(fā)相關(guān)領(lǐng)域針對(duì)性技術(shù)以賦能行業(yè)應(yīng)用，業(yè)務(wù)領(lǐng)域不斷下沉，或者通過(guò)外延并購(gòu)擴(kuò)張業(yè)務(wù)版圖，例如騰訊進(jìn)軍 AI＋新藥研發(fā)領(lǐng)域，發(fā)布首個(gè) AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái)“云深智藥（iDrug）”，谷歌計(jì)劃斥資 4 億美元收購(gòu) AI 企業(yè) DeepMind。

圖1：人工智能＋新藥研發(fā)企業(yè)圖譜

來(lái)源：火石創(chuàng)造根據(jù)公開(kāi)資料整理

AI＋新藥研發(fā)企業(yè)多以技術(shù)優(yōu)勢(shì)切入 1 個(gè)或多個(gè)應(yīng)用場(chǎng)景，如 Benevolent AI 構(gòu)建判斷加強(qiáng)認(rèn)知系統(tǒng)（judgment augmented cognition system，JACS）技術(shù)平臺(tái)，針對(duì)包括阿爾茨海默病和罕見(jiàn)腫瘤在內(nèi)的 4 個(gè)不同領(lǐng)域的疾病進(jìn)行 10 多種藥物的研發(fā)，晶泰科技組建 Renova AI 新藥研發(fā)平臺(tái)，提供“計(jì)算＋實(shí)驗(yàn)”新模式下的藥物設(shè)計(jì)與固體形態(tài)研究服務(wù)。

大型藥企則以自建 AI 研究團(tuán)隊(duì)、投資并購(gòu)或與 AI 技術(shù)公司合作的方式，布局 AI 新藥研發(fā)。輝瑞、GSK 和諾華等制藥公司也在內(nèi)部建立了大量的AI 研究團(tuán)隊(duì)。當(dāng)前全球十大制藥公司均已布局 AI＋新藥研發(fā)，諸多大型制藥公司開(kāi)始與 AI 初創(chuàng)公司開(kāi)展合作，例如艾伯維與 AiCure、阿斯利康與 BergHealth、拜耳與Sensyne Health、百時(shí)美施貴寶（BMS）Concerto Health AI，以及輝瑞與 IBM Watson 等。

由于 AI＋新藥研發(fā)創(chuàng)新公司缺少新藥研發(fā)的相關(guān)數(shù)據(jù)、成熟的研發(fā)管線(xiàn)以及資深的藥物專(zhuān)家，而這恰好是傳統(tǒng)制藥巨頭所具備的優(yōu)勢(shì)。因此，大型藥企和 AI＋新藥研發(fā)的技術(shù)公司聯(lián)合是目前主要的業(yè)務(wù)模式。從開(kāi)展合作情況來(lái)看，隨著 AI＋新藥研發(fā)的發(fā)展，現(xiàn)有制藥生態(tài)系統(tǒng)正從執(zhí)行研發(fā)的傳統(tǒng)利益攸關(guān)方逐漸轉(zhuǎn)向更加多樣化的技術(shù)支持伙伴關(guān)系［13］。

我國(guó) AI＋新藥研發(fā)起步較晚，目前尚處在初期階段，據(jù)火石創(chuàng)造統(tǒng)計(jì)，國(guó)內(nèi)涌現(xiàn)了晶泰科技、深度智藥、云勢(shì)軟件、望石智慧等一批創(chuàng)新企業(yè)，主要分布在北京、上海、杭州和深圳等城市。然而，國(guó)內(nèi) AI＋新藥研發(fā)企業(yè)并不多，總數(shù)不足 20 家。

近年來(lái)，隨著我國(guó)醫(yī)藥產(chǎn)業(yè)創(chuàng)新發(fā)展的加速推進(jìn)，國(guó)內(nèi)的醫(yī)藥行業(yè)在 AI＋新藥研發(fā)領(lǐng)域的跨界合作也在增加：一、醫(yī)藥巨頭與 AI＋新藥研發(fā)技術(shù)公司合作，例如恒瑞醫(yī)藥與百奧知、豪森藥業(yè)與Atomwise 的合作；二、藥企與 IT 巨頭合作，如正大天晴通過(guò)與阿里云合作獲得一種全新的化合物篩選方法［14］；三、合同研究組織（CRO）企業(yè)與 AI＋新藥研發(fā)技術(shù)公司合作，如藥明康德和 Schrdinger合資成立了 Faxian Therapeutics，將藥明康德的先導(dǎo)化合物優(yōu)化服務(wù)與 Schrdinger 的藥物設(shè)計(jì)軟件平臺(tái)相結(jié)合，從而加速新藥發(fā)現(xiàn)；藥明康德和 Insilico 合作開(kāi)發(fā)了一種 ML 模型，用于從頭設(shè)計(jì) DDR1 蛋白（一種與纖維化等疾病有關(guān)的激酶）的小分子抑制劑。

03 人工智能＋新藥研發(fā)的應(yīng)用實(shí)踐

目前，從全球 AI＋新藥研發(fā)企業(yè)的應(yīng)用實(shí)踐來(lái)看，AI＋新藥研發(fā)主要是將 ML、DL 等 AI 技術(shù)，應(yīng)用到前期研究、靶點(diǎn)發(fā)現(xiàn)、化合物合成、化合物篩選、新適應(yīng)證發(fā)現(xiàn)、晶型預(yù)測(cè)、患者招募等新藥研發(fā)環(huán)節(jié)（見(jiàn)圖 2）。例如，數(shù)據(jù)挖掘和分析有助于藥物靶標(biāo)的確立，進(jìn)而找到具有潛力的先導(dǎo)化合物［15］，從而最大程度提升新藥研發(fā)效率。與傳統(tǒng)新藥研發(fā)管線(xiàn)比，基于 AI 和生物計(jì)算的新藥研發(fā)管線(xiàn)平均 1 ～ 2 年就可以完成臨床前藥物研究［16］。靶點(diǎn)識(shí)別、先導(dǎo)化合物確定、藥物重定向被認(rèn)為是全球AI＋新藥研發(fā)最具變革意義的研究領(lǐng)域［17］，其中靶點(diǎn)發(fā)現(xiàn)和化合物合成是企業(yè)布局的熱門(mén)方向。

3．1 前期研究前期研究主要是基于文獻(xiàn)分析和知識(shí)庫(kù)建設(shè)，進(jìn)行疾病機(jī)制、靶點(diǎn)、藥物作用方式研究。AI 的應(yīng)用主要在文獻(xiàn)數(shù)據(jù)整合分析、新藥研發(fā)知識(shí)庫(kù)建設(shè)、新藥研發(fā)數(shù)據(jù)集建設(shè)和基準(zhǔn)化合物庫(kù)設(shè)計(jì)等方面，可以借助 AI 自然語(yǔ)音處理、知識(shí)圖譜等技術(shù)實(shí)現(xiàn)海量信息的快速提取，從而對(duì)推動(dòng)新藥研發(fā)的眾多知識(shí)進(jìn)行聚類(lèi)分析，幫助提出新的可以被驗(yàn)證的假說(shuō)，進(jìn)而加快新藥研發(fā)的進(jìn)程。例如深度智耀整合了數(shù)百個(gè)開(kāi)放數(shù)據(jù)源，通過(guò) ML 技術(shù)，結(jié)合醫(yī)藥研發(fā)專(zhuān)家知識(shí)，自動(dòng)提取醫(yī)藥實(shí)體、關(guān)系和屬性，構(gòu)建醫(yī)藥研發(fā)知識(shí)圖譜。

圖2：人工智能＋新藥研發(fā)應(yīng)用場(chǎng)景來(lái)源：火石創(chuàng)造根據(jù)公開(kāi)資料整理

3．2 藥物發(fā)現(xiàn) 藥物發(fā)現(xiàn)是關(guān)系新藥研發(fā)成功率的關(guān)鍵環(huán)節(jié)，主要包括靶點(diǎn)選擇優(yōu)化、先導(dǎo)化合物的發(fā)現(xiàn)、先導(dǎo)化合物的篩選優(yōu)化，AI 在藥物發(fā)現(xiàn)環(huán)節(jié)的應(yīng)用聚焦于靶點(diǎn)發(fā)現(xiàn)、晶型預(yù)測(cè)以及候選藥物分子的篩選優(yōu)化。

在靶點(diǎn)發(fā)現(xiàn)和驗(yàn)證方面，可以利用自然語(yǔ)言處理技術(shù)檢索分析海量文獻(xiàn)、專(zhuān)利和臨床試驗(yàn)報(bào)告的非結(jié)構(gòu)化數(shù)據(jù)庫(kù)，找出與疾病相關(guān)的潛在的、被忽視的通路、蛋白和機(jī)制，從而提出新的可供測(cè)試的假說(shuō)，以發(fā)現(xiàn)新機(jī)制和新靶點(diǎn) ［13］。例如，Insilico Medicine 利用自主研發(fā)的 AI 新藥靶點(diǎn)發(fā)現(xiàn)平臺(tái) PandaOmics和 AI 分子生成和設(shè)計(jì)平臺(tái) Chemistry42，獲得了全球首例完全由 AI 驅(qū)動(dòng)發(fā)現(xiàn)的特發(fā)性肺纖維化（IPF）疾病新靶點(diǎn)。

在晶型預(yù)測(cè)方面，可以利用認(rèn)知計(jì)算實(shí)現(xiàn)高效動(dòng)態(tài)配置藥物晶型，預(yù)測(cè)小分子藥物所有可能的晶型。例如艾伯維（AbbVie）結(jié)合晶泰科技的晶型預(yù)測(cè)等技術(shù)，設(shè)計(jì)了一套新集成模型，能夠以二維結(jié)構(gòu)作為輸入，預(yù)測(cè)得到分子的熱力學(xué)溶解度［18］。相比于傳統(tǒng)藥物晶型研發(fā)，采用 AI 技術(shù)的制藥企業(yè)能更加自如地面對(duì)仿制藥企業(yè)的晶型專(zhuān)利挑戰(zhàn)。另外，晶型預(yù)測(cè)技術(shù)縮短了晶型開(kāi)發(fā)的時(shí)間，能更加高效地挑選出合適的藥物晶型，進(jìn)而縮短研發(fā)周期，控制成本。

在化合物篩選和優(yōu)化方面，要從數(shù)以萬(wàn)計(jì)的化合物分子中篩選出對(duì)特定靶標(biāo)具有較高活性的化合物，往往需要較長(zhǎng)的時(shí)間和成本，可以利用 AI 技術(shù)建立虛擬藥物篩選模型，快速過(guò)濾“低質(zhì)量”化合物，富集潛在有效分子，檢索更快、覆蓋范圍更廣，利用 ML 技術(shù)，從海量化合物中挑選出高潛力候選藥物，從而減少研發(fā)新藥的時(shí)間和成本［19–20］，加速先導(dǎo)化合物的發(fā)現(xiàn)和優(yōu)化，以及候選藥物分子的產(chǎn)生。例如 BenevolentBio 曾借助 JACS 技術(shù)，標(biāo)記出 100個(gè)或可用于治療 ALS 的潛在化合物，并成功篩選出5 個(gè)化合物；BergHealth 則篩選了多達(dá) 25 萬(wàn)個(gè)疾病組織樣本來(lái)尋找癌癥早期的新生物學(xué)指標(biāo)和生物標(biāo)記等。

當(dāng)前來(lái)看，AI 藥物發(fā)現(xiàn)在藥物靶點(diǎn)發(fā)現(xiàn)和藥物篩選環(huán)節(jié)的技術(shù)應(yīng)用相對(duì)成熟：研究層面，現(xiàn)有 AI解決方案在藥物發(fā)現(xiàn)階段更具先進(jìn)性［13］，例如阿斯利康作為 AI 領(lǐng)域的探索者，僅在 2019 年就發(fā)布了65 篇 AI 相關(guān)的新藥發(fā)現(xiàn)及研發(fā)的相關(guān)文獻(xiàn)；專(zhuān)利層面，AI＋新藥研發(fā)領(lǐng)域的專(zhuān)利發(fā)布數(shù)量盡管還較少，但主要技術(shù)指向還是集中分布在藥物發(fā)現(xiàn)的靶標(biāo)確定和化合物篩選這 2 個(gè)技術(shù)分支［21］。

另外，也有研究指出使用目前的數(shù)據(jù)不太可能大幅度地提升 AI 藥物發(fā)現(xiàn)的性能，因?yàn)槟壳暗臄?shù)據(jù)沒(méi)有反映出藥物在體內(nèi)的情況，所以計(jì)算機(jī)僅利用這些數(shù)據(jù)并不能很好地做出決策，尤其是針對(duì)復(fù)雜的疾病。雖然目前有大量的描述化學(xué)特性的數(shù)據(jù)，這些數(shù)據(jù)能夠使計(jì)算機(jī)生成相應(yīng)的配體，但配體發(fā)現(xiàn)不等于藥物發(fā)現(xiàn) ［22］。

3．3 臨床前研究臨床前研究需要開(kāi)展藥效學(xué)、藥動(dòng)學(xué)和毒理學(xué)研究以及藥劑學(xué)研究，主要是提前預(yù)測(cè)候選藥物的ADMET 在后續(xù)藥物開(kāi)發(fā)中起到關(guān)鍵作用的性質(zhì)，評(píng)估候選藥物通過(guò)臨床試驗(yàn)的可能性，提高后續(xù)臨床試驗(yàn)的成功概率。在臨床前研究環(huán)節(jié)，可以利用AI 技術(shù)提升 ADMET 性質(zhì)預(yù)測(cè)的準(zhǔn)確度，以及幫助加速識(shí)別新適應(yīng)證。

在藥物 ADMET 性質(zhì)研究方面，可利用深度神經(jīng)網(wǎng)絡(luò)算法有效提取結(jié)構(gòu)特征的預(yù)測(cè)方式，進(jìn)一步提升 ADMET 性質(zhì)預(yù)測(cè)的準(zhǔn)確度。例如，云深智藥采用“從頭折疊”的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法幫助解析了 SRD5A2 晶體結(jié)構(gòu)，并通過(guò)自研 AI 工具“tFold”有效提升了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)精度，在科研突破中發(fā)揮了核心作用［23］。

在新適應(yīng)證拓展方面，一是可以利用 AI 的 DL能力和認(rèn)知計(jì)算能力，將已上市或處于研發(fā)管線(xiàn)的藥物與疾病進(jìn)行匹配，發(fā)現(xiàn)新靶點(diǎn)，擴(kuò)大藥物的治療用途；二是借助公共領(lǐng)域的公開(kāi)大數(shù)據(jù)集資源，可以利用 AI 算法，選擇訓(xùn)練推導(dǎo)出預(yù)測(cè)跨目標(biāo)活動(dòng)的 ML 模型，應(yīng)用于藥物的再利用，實(shí)現(xiàn)對(duì)現(xiàn)有藥物識(shí)別新的適應(yīng)證；三是利用 AI 技術(shù)通過(guò)模擬隨機(jī)臨床試驗(yàn)發(fā)現(xiàn)藥物新用途［24］。例如，燧坤智能通過(guò)ML 預(yù)測(cè)，利用 AI 算法系統(tǒng)性整合疾病、靶點(diǎn)、藥物等多個(gè)維度的海量數(shù)據(jù)，重建藥物－靶點(diǎn)相互作用網(wǎng)絡(luò)，實(shí)現(xiàn)了對(duì)藥物－靶點(diǎn)相互作用的全景刻畫(huà)，實(shí)現(xiàn)老藥新用、在研藥物二次開(kāi)發(fā)、失敗藥物再利用、天然產(chǎn)物開(kāi)發(fā)等。

3．4 臨床試驗(yàn) 臨床試驗(yàn)是新藥研究中周期最長(zhǎng)、成本最高的環(huán)節(jié)，由于患者隊(duì)列選擇和臨床試驗(yàn)期間對(duì)患者的監(jiān)測(cè)不力等原因，當(dāng)前的藥物臨床試驗(yàn)成功率不高，通常 10 種進(jìn)入臨床試驗(yàn)的化合物中只有 1 種能進(jìn)入市場(chǎng)。在臨床試驗(yàn)環(huán)節(jié)，可以利用 ML、自然語(yǔ)言處理等技術(shù)輔助臨床試驗(yàn)設(shè)計(jì)、患者招募和臨床試驗(yàn)數(shù)據(jù)處理。

AI 輔助臨床試驗(yàn)設(shè)計(jì)主要是利用自然語(yǔ)言處理技術(shù)快速處理同類(lèi)研究、臨床數(shù)據(jù)和監(jiān)管信息，以及讀取臨床試驗(yàn)等數(shù)據(jù)。例如 Trials．a(chǎn)i 公司使用 AI來(lái)優(yōu)化臨床試驗(yàn)設(shè)計(jì)，使患者更容易參加臨床試驗(yàn)，消除不必要的臨床操作負(fù)擔(dān)。

AI 患者招募主要利用自然語(yǔ)言處理、ML 等技術(shù)，對(duì)不同來(lái)源的受試者信息和臨床試驗(yàn)方案的入組／排除標(biāo)準(zhǔn)進(jìn)行識(shí)別和匹配，包括醫(yī)學(xué)資料的數(shù)字化、理解醫(yī)學(xué)資料的內(nèi)容、關(guān)聯(lián)數(shù)據(jù)集和模式識(shí)別、擴(kuò)大受試者范圍、開(kāi)發(fā)患者搜索臨床試驗(yàn)的簡(jiǎn)化工具等［25］。例如梅奧診所與 IBM Watson 合作，基于自然語(yǔ)言處理技術(shù)，掃描臨床試驗(yàn)數(shù)據(jù)庫(kù)，為臨床試驗(yàn)尋找合適的患者。在他們進(jìn)行的一項(xiàng)試點(diǎn)研究中，IBM Watson 臨床試驗(yàn)匹配系統(tǒng)使乳腺癌試驗(yàn)的平均每月注冊(cè)人數(shù)增加了 80％；零氪科技利用大數(shù)據(jù)整合患者資料，加快了招募患者參加臨床試驗(yàn)的速度。

AI 輔助臨床數(shù)據(jù)處理主要是利用云計(jì)算強(qiáng)大算力支快速處理臨床數(shù)據(jù)分析并及時(shí)調(diào)整優(yōu)化整個(gè)試驗(yàn)進(jìn)程，提升臨床試驗(yàn)風(fēng)險(xiǎn)控制能力。例如，太美醫(yī)療推出由病例報(bào)告表（CRF）設(shè)計(jì)平臺(tái)、臨床試驗(yàn)電子數(shù)據(jù)采集系統(tǒng) ／數(shù)據(jù)管理系統(tǒng)（EDC）、數(shù)據(jù)分析技術(shù)組合構(gòu)成的自動(dòng)化臨床數(shù)據(jù)解決方案，可以幫助藥企應(yīng)對(duì)臨床項(xiàng)目中多變的需求，優(yōu)化數(shù)據(jù)處理的流程。

表 2 介紹了 AI 主要應(yīng)用場(chǎng)景的代表企業(yè)。

表2：人工智能主要應(yīng)用場(chǎng)景代表企業(yè)

來(lái)源：火石創(chuàng)造根據(jù)公開(kāi)資料整理

04 人工智能＋新藥研發(fā)面臨的挑戰(zhàn)

AI＋新藥研發(fā)目前已進(jìn)入快速成長(zhǎng)期，備受業(yè)界矚目；但其作為新興領(lǐng)域，也面臨著一些挑戰(zhàn)。

一是生物學(xué)的復(fù)雜性，給數(shù)據(jù)獲取和 AI 算法設(shè)計(jì)帶來(lái)巨大挑戰(zhàn)。藥學(xué)是一個(gè)融合化學(xué)和生物學(xué)的學(xué)科，在數(shù)據(jù)層面，二者具有較大的差異性。一般來(lái)說(shuō)，化學(xué)方面的數(shù)據(jù)更加穩(wěn)定、可控與易于計(jì)算；生物學(xué)數(shù)據(jù)涉及受體蛋白的構(gòu)象變化，平衡和偏置信號(hào)等難以定量計(jì)算�；衔锱c人體靶點(diǎn)的結(jié)合與反應(yīng)過(guò)程非常復(fù)雜，目前理論認(rèn)知不足，受環(huán)境影響因素很大，數(shù)據(jù)穩(wěn)定性和可重復(fù)性較差。

二是當(dāng)前的 AI 算法模型只納入部分化學(xué)指標(biāo)，生物學(xué)指標(biāo)不完整。我們能夠基于化學(xué)數(shù)據(jù)去設(shè)計(jì)AI 算法，比如判斷小分子的各種體外物理化學(xué)性質(zhì)、晶型以及與靶點(diǎn)結(jié)合的親和力；但是對(duì)于小分子藥物在生物系統(tǒng)中的作用很難用一組有限的參數(shù)來(lái)定義，而化合物在體內(nèi)的其他特性在模型中被降級(jí)為次要的或可忽略部分，包括其前體化合物、代謝產(chǎn)物、濃度依賴(lài)性效應(yīng)等，這些被忽略的因素決定著藥物能否到達(dá)其預(yù)期的靶點(diǎn)、能否起到治療效果、以及其毒副作用是否在可以接受的范圍等。這使得 AI 在藥物發(fā)現(xiàn)和藥效評(píng)估中面臨著更大的不確定性。

三是高質(zhì)量數(shù)據(jù)制約。我國(guó)的醫(yī)藥大數(shù)據(jù)存在數(shù)據(jù)量少、數(shù)據(jù)體系不完整、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)共享機(jī)制不完善等問(wèn)題。諸如病歷、隨訪(fǎng)記錄目前還很難標(biāo)準(zhǔn)化、數(shù)字化；由于涉及患者隱私，臨床數(shù)據(jù)的靈活運(yùn)用也受到了一定限制；國(guó)內(nèi)創(chuàng)新藥研發(fā)起步較晚，原始數(shù)據(jù)積累有限；國(guó)內(nèi)藥品數(shù)據(jù)存儲(chǔ)分散，存儲(chǔ)格式不一，完整藥物數(shù)據(jù)獲取比較困難；新藥研發(fā)領(lǐng)域的核心數(shù)據(jù)來(lái)源于藥企，考慮到商業(yè)機(jī)密的問(wèn)題，企業(yè)不愿公開(kāi)核心數(shù)據(jù)。醫(yī)藥數(shù)據(jù)的數(shù)量和質(zhì)量將成為制藥行業(yè) AI 發(fā)展的主要障礙。

四是高端復(fù)合型人才缺失。AI 新藥研發(fā)兼具信息科技和醫(yī)藥雙重屬性，需要一批既掌握 AI 前沿技術(shù)，又精通新藥研發(fā)的復(fù)合型人才，由于我國(guó)相關(guān)領(lǐng)域的教學(xué)科研起步較晚，人才問(wèn)題難以在短期內(nèi)得到解決［26］。據(jù)統(tǒng)計(jì)，全世界大約有 2．2 萬(wàn)名 AI 領(lǐng)域高端研究人員，而在中國(guó)只有約 600 名，人才需求缺口較大［27］。

五是政策法規(guī)的制定滯后。AI 存在監(jiān)管體系滯后于技術(shù)發(fā)展、政府單向監(jiān)管無(wú)法有效管控風(fēng)險(xiǎn)、企業(yè)缺乏合規(guī)治理有效工具和體系等問(wèn)題。AI 因算法不透明、難解釋、跨界傳播性和外溢性強(qiáng)，比一般的數(shù)字治理涉及范圍廣、難度大、問(wèn)題突出。當(dāng)前，AI 新藥研發(fā)監(jiān)管體系不健全，缺少具體的評(píng)估標(biāo)準(zhǔn)、市場(chǎng)準(zhǔn)入、退出機(jī)制和收費(fèi)機(jī)制，難以對(duì)潛在的問(wèn)題進(jìn)行監(jiān)督與反饋。在涉及人格權(quán)、知識(shí)產(chǎn)權(quán)、財(cái)產(chǎn)權(quán)、侵權(quán)責(zé)任認(rèn)定、法律主體地位等方面的 AI法律法規(guī)尚屬空白［28］。
05 結(jié)語(yǔ)

AI 在新藥研發(fā)的各個(gè)階段都發(fā)揮著重要作用，也在一定程度上助力藥企降本增效，在資本驅(qū)動(dòng)下，AI＋新藥研發(fā)正掀起創(chuàng)新熱潮。但需強(qiáng)調(diào)的是，從已經(jīng)開(kāi)展 AI＋新藥研發(fā)的應(yīng)用實(shí)踐來(lái)看，AI 不是“靈丹妙藥”，不能在一夜之間提高臨床試驗(yàn)的效率［29］，當(dāng)前 AI 技術(shù)尚不能為提升新藥研發(fā)效率帶來(lái)革命性的突破。受生物系統(tǒng)內(nèi)在的復(fù)雜性和疾病異質(zhì)性特征的制約，AI 分析藥物在體內(nèi)活性的數(shù)據(jù)非常有限，計(jì)算機(jī)不能很好地做出決策［30］，導(dǎo)致準(zhǔn)確模擬疾病的發(fā)病機(jī)制難度大，使得 AI 技術(shù)在提升新藥的臨床試驗(yàn)成功率方面發(fā)揮的作用還非常有限。因此，未來(lái) AI 賦能新藥研發(fā)相關(guān)研究和應(yīng)用的進(jìn)一步深化，需要傳統(tǒng)醫(yī)藥研發(fā)基礎(chǔ)科學(xué)（生物化學(xué)、生物學(xué)、生物醫(yī)學(xué)等）和核心 AI 技術(shù)的深度結(jié)合，需要技術(shù)專(zhuān)家、生物學(xué)家、醫(yī)學(xué)家等聯(lián)合攻關(guān)。

著眼當(dāng)下，為了更好地發(fā)展 AI＋新藥研發(fā)，應(yīng)對(duì)其面臨的五大挑戰(zhàn)，提升新藥研發(fā)的效率從而加速我國(guó)醫(yī)藥創(chuàng)新升級(jí)，一是要突破新技術(shù)和新算法，引導(dǎo)技術(shù)創(chuàng)新以及 AI 技術(shù)在新藥研發(fā)各個(gè)環(huán)節(jié)的深入應(yīng)用；二是建立“AI＋新藥研發(fā)”領(lǐng)域復(fù)合人才跨學(xué)科培養(yǎng)輸出機(jī)制，自主培養(yǎng)一批高學(xué)識(shí)、高能力的“AI＋新藥研發(fā)”領(lǐng)域的科研人員、技術(shù)工作者和應(yīng)用開(kāi)拓者，加快形成滿(mǎn)足行業(yè)發(fā)展需求的人才網(wǎng)絡(luò)；三是集中大數(shù)據(jù)力量助力攻關(guān)重大疾病致病機(jī)制、藥物靶點(diǎn)／表型／分子分型研究，完善醫(yī)藥研發(fā)數(shù)據(jù)庫(kù)，為拓展 AI 在新藥研發(fā)領(lǐng)域的應(yīng)用構(gòu)建高質(zhì)量數(shù)據(jù)支撐體系；四是強(qiáng)化創(chuàng)制體制設(shè)計(jì)，建立支撐保障措施包括及時(shí)建立監(jiān)管機(jī)制，明晰產(chǎn)權(quán)結(jié)構(gòu)，注重保護(hù)新藥研發(fā)中數(shù)據(jù)資產(chǎn)安全和知識(shí)產(chǎn)權(quán)。

參考資料：

Terry M． IQVIA report： biopharma R＆D investment has increased32％ over last 5 years［EB／OL］．（2019－04－23）［2021－06－24］．https：／／www．biospace．com／article／report－biopharma－focuses－on－oncologyrare－diseases－and－orphan－drugs／．

Fleming N． How artificial intelligence is changing drugdiscovery［EB／OL］．（2018－05－10）［2021－06－05］． https：／／www．nature．com／articles／d41586－018－05267－x．

Taylor P． Pharma is ‘getting lower returns on R＆D’［EB／OL］．（2017－12－15）［2021－05－21］． http：／／www．pmlive．com／pharma＿news／pharma＿is＿getting＿lower＿returns＿on＿r＿and＿d＿1214594．

劉伯炎，王群，徐俐穎，等．人工智能技術(shù)在醫(yī)藥研發(fā)中的應(yīng)用［J］．中國(guó)新藥雜志， 2020， 29（14）： 1979–1986．

? Wong C H， Siah K W， Lo A W． Estimation of clinical trial successrates and related parameters［J］． Biostatistics， 2019， 20（2）： 273–286．

陸濤．人工智能在醫(yī)藥領(lǐng)域的應(yīng)用［J］．藥學(xué)進(jìn)展， 2019， 44（1）：1–3．

梁禮，鄧成龍，張艷敏，等．人工智能在藥物發(fā)現(xiàn)中的應(yīng)用與挑戰(zhàn) ［J］．藥學(xué)進(jìn)展， 2020， 44（1）： 18–27．

Mcculloch W S， Pitts W． A logical calculus of the ideas immanent innervous activity［J］． Bull Math Biophys， 1943， 5（4）： 115–133．

Lu H M， Li Y J， Uemura T， et al． FDCNet： filtering deepconvolutional network for marine organism classification［J］．Multimed Tools Appl， 2017， 77（17）： 21847–21860．

Yang X， Wang Y F， Byrne R， et al． Concepts of artificial intelligencefor computer－assisted drug discovery［J］． Chem Rev， 2019， 119（18）：10520–10594．

Chen H M， Engkvist O， Wang Y H， et al． The rise of deep learningin drug discovery［J］． Drug Discov Today， 2018， 23（6）： 1241–1250．

Lavecchia A． Deep learning in drug discovery： opportunities，challenges and future prospects［J］． Drug Discov Today， 2019，24（10）： 2017–2032．

張建楠，李瑩瑩，張燁琳． AI 驅(qū)動(dòng)新藥研發(fā)深度發(fā)展［EB／OL］．（2021－01－27）［2021－06－28］． http：／／www．imit．org．cn／index．php？g＝＆m＝article＆a＝index＆id＝356＆cid＝11．

搜狐網(wǎng) ．正大天晴與阿里云合作，AI 制藥提高化合物篩選準(zhǔn)確率 20％新藥研發(fā)困難重重？正大天晴與阿里云合作用 AI 尋找解決辦法［EB／OL］．（2018－09－04）［2021－06－30］． https：／／www．sohu．com／a／251826274＿114877．

Willems H， De Cesco S， Svensson F． Computational chemistryon a budget： supporting drug discovery with limited resources：miniperspective［J］．J Med Chem， 2020， 63（18）： 10158–10169．

Chan H， Shan H， Dahoun T， et al． Advancing drug discovery viaartificial intelligence［J］． Trends Pharmacol Sci， 2019， 40（8）： 592–604．

Zhavoronkov A． Artificial intelligence for drug discovery， biomarkerdevelopment， and generation of novel chemistry［J］． Mol Pharm，2018， 15（10）： 4311–4313．

Hong R S， Mattei A， Sheikh A Y， et al． Novel physics－basedensemble modeling approach that utilizes 3D molecular conformationand packing to access aqueous thermodynamic solubility： a casestudy of orally available bromodomain and extraterminal domaininhibitor lead optimization series［J］． J Chem Inf Model， 2021， 61（3）：1412–1426．

Lee P K． Shortcut strategy for screening compounds with clinicalpotentials for drug development［EB／OL］．（2018－11－03）［2021－06－26］．https：／／www．eurekalert．org／pub＿releases／2018－12／cuoh－ssf120318．php．

Lin X， Duan X， Jacobs C， et al． High－throughput brain activitymapping and machine learning as a foundation for systemsneuropharmacology［J］． Nat Commun， 2018， 9（1）： 5142． DOI：10．1038／s41573－019－0024－5．

Vamathevan J， Clark D， Czodrowski P， et al． Applications ofmachine learning in drug discovery and development［J］． Nat RevDrug Discov， 2019（18）： 463–477．

Bender A， Cortés－Ciriano I． Artificial intelligence in drug discovery：what is realistic， what are illusions？ Part 1： Ways to make an impact，and why we are not there yet［J］． Drug Discov Today， 2021，26（2）：511–524．

Xiao Q， Wang L， Supekar S， et al． Structure of human steroid5α－reductase 2 with the anti－androgen drug finasteride［J］． NatCommun， 2020， 11（1）： 5430． DOI：10．1038／s41467－020－19249－z．

Liu R， Wei L， Zhang P． A deep learning framework for drugrepurposing via emulating clinical trials on real－world patientdata［J］． Nat Mach Intell， 2021（3）： 68–75．

Ulenaers J． The impact of artificial intelligence on the right to a fairtrial： towards a robot judge？［J］． Asian J Law Econ， 2020， 11（2）：20200008． DOI：10．1515／ajle－2020－0008．

朱壽華，凌澤農(nóng) ，周金花．人工智能技術(shù)在醫(yī)療健康領(lǐng)域的應(yīng)用［J］．電子技術(shù)與軟件工程， 2020， 171（1）： 18–19．

央廣網(wǎng) ．中國(guó)人工智能人才缺口超 500 萬(wàn)供求比例僅為 1：10［EB／OL］．（2017－07－14）［2021－06－30］． https：／／baijiahao．baidu．com／s？id＝1572854410914751＆wfr＝spider＆for＝pc．

中國(guó)日?qǐng)?bào)網(wǎng) ．法律該賦予人工智能什么地位？實(shí)現(xiàn)與人的智能疊拼［EB／OL］．（2018－01－23）［2021－06－30］． https：／／baijiahao．baidu．com／s？id＝1590352506664610651＆wfr＝spider＆for＝pc．

Bhatt A． Artificial intelligence in managing clinical trial design andconduct： man and machine still on the learning curve？［J］． PerspectClin Res， 2021， 12（1）： 1． DOI：10．4103／picr．PICR＿312＿20．

Jiménez－Luna J， Grisoni F， Weskamp N， et al． Artificial intelligencein drug discovery： recent advances and future perspectives［EB／OL］．（2021－04－02）［2021－06－28］． http：／／doi－org－443．group10－s．ccame．net／10．1080／17460441．2021．1909567．