侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

首個(gè)AI臨床試驗(yàn)國際指南誕生

醫(yī)學(xué)領(lǐng)域有著一整套長期積累下來的復(fù)雜規(guī)范體系和專業(yè)操作準(zhǔn)則,即便是人工智能作為新的生產(chǎn)工具來勢洶洶,常有“顛覆性”新聞,也須謙虛審慎地融入到這個(gè)體系之中。 現(xiàn)在,一個(gè)權(quán)威國際小組已經(jīng)制定了旨在提高AI臨床研究質(zhì)量、并確保研究報(bào)告的透明性的指導(dǎo)方針。

此舉將使患者、衛(wèi)生保健專業(yè)人員和政策制定者對人工智能應(yīng)用是否安全和有效更有把握,是在醫(yī)療健康領(lǐng)域塑造值得信賴的AI的關(guān)鍵一步。 SPIRIT-AI、CONSORT-AI的誕生作為醫(yī)學(xué)領(lǐng)域的頂刊,《自然醫(yī)學(xué)》(Nature Medicine)、《英國醫(yī)學(xué)雜志》(BMJ)和《柳葉刀》(the Lancent)近日聯(lián)合發(fā)布了首個(gè)AI臨床試驗(yàn)國際標(biāo)準(zhǔn)( the first international standards for reporting of clinical trials for AI.):用以規(guī)范AI臨床試驗(yàn)報(bào)告的兩大指南SPIRIT-AI[1]、CONSORT-AI[2]。由來自伯明翰大學(xué)和伯明翰大學(xué)醫(yī)院NHS基金會的研究人員與來自世界各地的領(lǐng)先機(jī)構(gòu)(包括美國和加拿大)合作推出。 SPIRIT、CONSORT作為兩套基本標(biāo)準(zhǔn),支配著臨床實(shí)驗(yàn)科學(xué)合理地開展,臨床試驗(yàn)需要遵從Consort規(guī)范和Spirit規(guī)范。 其中,SPIRIT是臨床試驗(yàn)研究計(jì)劃書指南,Standard Protocol Items: Recommendations for Interventional Trials,是臨床試驗(yàn)的核心,針對臨床試驗(yàn)方案的報(bào)道,CONSORT則是針對臨床試驗(yàn)報(bào)告的統(tǒng)一標(biāo)準(zhǔn),Consolidated Standards of Reporting Trials,針對的是臨床試驗(yàn)結(jié)果的報(bào)道。

二者雖不相同卻有相通之處。SPIRIT規(guī)范對于研究的監(jiān)督要求會更加具體,是專門為隨機(jī)對照臨床試驗(yàn)(RCT)報(bào)告制訂的指南。隨機(jī)對照試驗(yàn)是證明一種治療或臨床手段有效性、安全性最值得信賴的方法,也是諸多醫(yī)療實(shí)踐和衛(wèi)生政策的基礎(chǔ)。 自誕生以來,SPIRIT、CONSORT兩套關(guān)于臨床試驗(yàn)如何進(jìn)行和報(bào)告的指南,已在全球范圍內(nèi)被用于指導(dǎo)藥物開發(fā)、診斷測試和其他醫(yī)療干預(yù)措施,同時(shí)也會隨著這一領(lǐng)域的變化而時(shí)有更新。 這一次SPIRIT-AI、CONSORT-AI的更新,便是針對AI技術(shù)浪潮而來。兩項(xiàng)新的指南都經(jīng)過了行業(yè)人士階段性的討論、評估并達(dá)成共識。 最終,相較于SPIRIT 2013版本,SPIRIT-AI則增加了15個(gè)新項(xiàng)目,而相較于CONSORT 2010年更新版,CONSORT-AI擴(kuò)展了14個(gè)新條目,總共更新的25個(gè)條目,被認(rèn)為對評估AI介入效果非常重要,包括對AI介入環(huán)節(jié)進(jìn)行清晰的描述、使用說明、使用AI所需的技能、AI的集成環(huán)境、AI輸入和輸出、人機(jī)交互細(xì)節(jié)和提供錯(cuò)誤案例分析等。

如撰寫團(tuán)隊(duì)所言,SPIRIT-AI、CONSORT-A的推出,旨在幫助提高針對AI介入臨床試驗(yàn)的透明度和完整性,解釋和嚴(yán)格評估臨床試驗(yàn)設(shè)計(jì)的質(zhì)量以及報(bào)告結(jié)果存在偏倚的風(fēng)險(xiǎn)。 伯明翰健康伙伴中心監(jiān)管科學(xué)與創(chuàng)新中心AI負(fù)責(zé)人、UHB眼科顧問Alastair Denniston教授評論道:"患者可以從醫(yī)療環(huán)境中使用人工智能中受益匪淺,但在我們將這些技術(shù)引入日常實(shí)踐之前,我們需要知道它們已經(jīng)經(jīng)過了強(qiáng)有力的評估,并被證明是有效和安全的。我們之前的工作表明,這可能是一個(gè)多么大的問題,我們需要一種方法來切斷圍繞AI在醫(yī)療保健中的炒作。

圍繞醫(yī)療AI的炒作有望被規(guī)范 目前,AI技術(shù)的發(fā)展仍有太多的未知和炒作,即便是在事關(guān)個(gè)人生命安危的醫(yī)學(xué)領(lǐng)域,大量將AI系統(tǒng)用于疾病篩選和分類、診斷、預(yù)測、決策支持和治療建議環(huán)節(jié)的研究也層出不窮。 特別是過去幾年,深度學(xué)習(xí)的復(fù)興帶動許多新的AI工具被開發(fā)出來,相應(yīng)的研究也得以發(fā)表在一些權(quán)威醫(yī)學(xué)期刊上,但由于試驗(yàn)設(shè)計(jì)質(zhì)量參差不齊,具體的有效性很難進(jìn)行比較和評估。今年3月,BMJ的一項(xiàng)研究就警告道,研究不當(dāng)和夸大其詞地宣稱AI在醫(yī)學(xué)圖像識別能力有多好(匹敵甚至超過人類醫(yī)生表現(xiàn)),給數(shù)百萬患者帶來了風(fēng)險(xiǎn)。 沒有統(tǒng)一的行業(yè)評判標(biāo)準(zhǔn),也讓商業(yè)公司們鉆了空子,進(jìn)而大肆宣傳其AI應(yīng)用的有效性。例如,總部位于英國的數(shù)字健康公司Babylon Health,曾在2018年宣布其診斷聊天機(jī)器人 "與人類醫(yī)生相當(dāng) ",后受到輿論的抨擊,批評者認(rèn)為公司提供的聊天機(jī)器人測試具有誤導(dǎo)性。因?yàn)橛谢颊叻答,如果出現(xiàn)典型的心臟病發(fā)作癥狀,這個(gè)聊天機(jī)器人會建議你呆在家里,如果是腦膜炎的話就好好休息。 Babylon Health遠(yuǎn)非孤例。

大量AI+醫(yī)療應(yīng)用的開發(fā)者一直聲稱醫(yī)療人工智能的性能超過或匹配人類的能力。實(shí)際上的大多數(shù)情況,對這些人工智能的評估是在公司實(shí)驗(yàn)室內(nèi)部封閉或者說相對有利的條件下進(jìn)行的。還有公司在進(jìn)行AI醫(yī)療產(chǎn)品試驗(yàn)時(shí),會傾向于采用“離岸外包”(off-shoring)的形式:在監(jiān)管環(huán)境較為寬松的管轄區(qū)中使用,那些地區(qū)的人民群眾極度缺乏基本醫(yī)療服務(wù),任何治療都比沒有治療好。

IBM部分AI醫(yī)療合作項(xiàng)目。圖片出處:spectrum.ieee.org

再往前追溯,AI 醫(yī)療的鼻祖——IBM Watson,現(xiàn)在也處于比較尷尬的狀態(tài)。IBM 于 2011 年開始致力于將沃森引入醫(yī)療保健行業(yè)。從那時(shí)起,該公司發(fā)布了近 50 份關(guān)于合作伙伴關(guān)系的公告,主要是合作開發(fā)基于人工智能的新型醫(yī)療保健應(yīng)用,一部分合作致力于為醫(yī)生和機(jī)構(gòu)提供工具;另一部分則屬于消費(fèi)者應(yīng)用。雖然許多聯(lián)盟和合作最終都沒有產(chǎn)生商業(yè)產(chǎn)品,但 IBM 表示這些研究工作很有價(jià)值。 IEEE Spectrum 的編輯 Eliza Strickland 曾發(fā)表一篇文章,反思了IBM Watson為何被高估的想象,她認(rèn)為,自2011年以來的八年里,IBM 大肆宣揚(yáng)開發(fā)人工智能醫(yī)療技術(shù),但其中許多已經(jīng)失敗了。此外,IBM 沃森醫(yī)療健康部門生產(chǎn)的產(chǎn)品,更像是只能執(zhí)行日常任務(wù)的基本 AI 助手,甚至連 AI 醫(yī)生都算不上。 當(dāng)然,這并不是說人工智能就不可能勝過人類醫(yī)生,也不是要否定這些探索。本質(zhì)問題在于,我們還是沒有達(dá)成共識的手段去評估和證明AI在臨床試驗(yàn)?zāi)酥琳麄(gè)醫(yī)療保健領(lǐng)域有效性。這便是為何需要規(guī)范和監(jiān)管的原因。 SPIRIT-AI、CONSORT-AI的誕生,正是為了提高AI臨床試驗(yàn)透明性、可靠性的諸多努力之一。彌補(bǔ)該領(lǐng)域承諾與證明之間的巨大差距,將是所有人都樂見的事情。

CONSORT-AI與CONSORT 2013版本的Checklist對比。圖片出處:CONSORT-AI

SPIRIT-AI與SPIRIT 2013版本的Checklist對比。

圖片出處:SPIRIT-AI Reference[1]Reporting guidelines for clinical trial reports for interventions involving artificial intelligence
[2]Reporting guidelines for clinical trial reports for interventions involving artificial intelligence

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號