侵權(quán)投訴
訂閱
糾錯
加入自媒體

燒掉數(shù)百億美元,沃森醫(yī)生到底買來了什么教訓(xùn)?

2月18日,華爾街日報傳出消息,國際商業(yè)機器公司(International Business Machines Corp.)正在思考如何幫助IBM脫手Watson Health。接下來,Watson可能被出售給私募股權(quán)公司、醫(yī)療行業(yè)企業(yè),或與一家特殊目的收購公司(SPAC)合并。行至此處,IBM實屬無奈。

簡述Watson Health的發(fā)展史,最早可追溯至2011年。那年,擁有一定自然語義分析能力的IBM 將醫(yī)療作為人工智能科研轉(zhuǎn)化的核心,開啟了Watson Health的漫漫旅程。整個AI的訓(xùn)練過程中,Watson先后師從紀念斯隆-凱特琳癌癥中心(MSK)、妙佑醫(yī)療國際(Mayo Clinic)、奎斯特診斷公司(Quest Diagnostics)等全球知名醫(yī)學(xué)研究機構(gòu)。放在國內(nèi),這稱得上是帝皇級的待遇。但直到故事結(jié)尾,Watson還是沒有成為一介名醫(yī)。

2017年與德克薩斯大學(xué)MD安德森腫瘤中心合作破裂是整個夢想幻滅的關(guān)鍵轉(zhuǎn)折:為了培養(yǎng)IBM想象中的虛擬醫(yī)生,MD中心全額支付了IBM 6210萬美元的研發(fā)費用,待海量資金燒盡之后,Watson仍然無法有效應(yīng)用于臨床,而本已存在資金問題的MD中心更是深陷財務(wù)泥沼。

至那以后,受挫Watson便啟動了多次大規(guī)模裁員,在衰落的道路上一去不復(fù)返。今日再談起Watson,國內(nèi)一名涉足于此的經(jīng)銷商不愿多言,只是透露道:“這兒的每個人都認為,這是一個失敗的產(chǎn)品!

從舉世矚目到黯然消亡,Watson生存于醫(yī)療領(lǐng)域的十年是醫(yī)療AI發(fā)展的縮影。燒掉數(shù)百億美元,Watson到底為我們買來了怎樣的教訓(xùn)?

十年耕耘,Watson到底做出了什么?

回到Watson進入醫(yī)療領(lǐng)域那一年,當IBM 為其立下遠大前程后,它接觸的第一個老師便是大名鼎鼎的紀念斯隆-凱特琳癌癥中心。老師的專業(yè)決定了學(xué)生的能力,以腫瘤治療著稱的MSK自然主導(dǎo)了Watson的風格;加之IBM自身轉(zhuǎn)變?yōu)椤罢J知解決方案云平臺公司”,Watson被要求成為一名“用下一代 AI認知技術(shù)應(yīng)用于癌癥治療”的虛擬醫(yī)生。

順著這一圖景,IBM Watson Health先后開發(fā)了三個獨特的癌癥治療解決方案,輔助全球各地的醫(yī)生對患者進行診治,分別是Watson腫瘤解決方案(Watson for Oncolgy);Watson臨床實驗匹配解決方案(Watson for Clinical Trial Matching)與Watson基因解決方案(Watson for Genomics)

三個方案名字諱莫如深,但內(nèi)容理解起來很簡單。第一個Watson for Oncology是IBM賣得最好的產(chǎn)品,意在為患者提供多種治療方案,并可擴充腫瘤專家自身的專業(yè)知識;第二個Watson for Clinical Trial Matching 用于幫助藥物臨床試驗尋求合適的患者;第三個Watson for Genomics 則是用基因測序技術(shù),對腫瘤進行精準治療。

IBM對于AI的洞察力毋庸置疑,即便放在今天,這三個目標仍然是AI應(yīng)用的主要方向,也依然極具挑戰(zhàn)。因此,問題還是出在產(chǎn)品本身。

AI之內(nèi):有限的市場與缺失的邏輯

先談最為重要的Watson for Oncology,這是一個類似于單病種CDSS的產(chǎn)品,意在給定患者文本及影像信息,結(jié)合Watson已經(jīng)學(xué)會的知識(包括乳腺癌、肺癌、直腸癌等13個癌種)進行多輪判斷,最終輸出結(jié)果,其具體處理邏輯如下。

圖片1.png


在實際之中,Watson的診斷流程大致可分為四步,分別是:

1. 輸入醫(yī)療記錄,將患者多個時間節(jié)點的診斷數(shù)據(jù)輸入系統(tǒng),包括結(jié)構(gòu)化數(shù)據(jù)(電子病歷等)和非結(jié)構(gòu)化數(shù)據(jù)(影像等);

2.分析醫(yī)療數(shù)據(jù),檢索已有知識圖譜,并對輸入的醫(yī)療數(shù)據(jù)進行查找與分析,最終為每一位患者提供多種可能有效的治療方案;

3. 方案排序,按照可信度指標為各種治療方案排序。

4. 輸出結(jié)果,最終患者拿到手的,是一本內(nèi)容豐富的癌癥治療方案建議報告。其中,包括幾種推薦方案、考慮方案和不推薦方案,并注明采用此方案的生存率、不良反應(yīng)發(fā)生率、藥物相互作用這些相關(guān)信息,幫助醫(yī)生、患者了解該方案的療效與風險。

Watson通過不斷調(diào)整其內(nèi)部處理程序來“學(xué)習(xí)”,以便在某些問題上得到高概率的正確答案,例如放射圖像揭示癌癥。正確的答案必須是已知的,這樣系統(tǒng)才能被告知,何時做對了什么,何時做錯了什么。系統(tǒng)能夠處理的訓(xùn)練問題越多,命中率就越高。

但是,假若數(shù)據(jù)本身具有一定問題,Watson基于問題知識的診斷自然也會存在問題。

對于依賴于知識圖譜的AI而言,知識的廣度與準確度決定的AI本身判斷的精準程度,但若沒有對知識進行充分描述,訓(xùn)練出的AI便會出問題。舉個例子,如果知識A告訴Watson長時間住院容易產(chǎn)生深靜脈血栓,知識B告訴Watson住院不是產(chǎn)品深靜脈血栓的根本原因,人能夠很容易分清兩句話的邏輯,但AI不行。此類具有邏輯矛盾的描述一旦多了起來,AI輔助診斷的準確率便會下降。

另一種問題來源于數(shù)據(jù)本身的錯誤。如果我們發(fā)現(xiàn)一個患者的診斷結(jié)論為卵巢癌,而患者性別為男,還會用這個數(shù)據(jù)做進一步的臨床研究嗎?如果我們發(fā)現(xiàn)病理報告匯總中當天來檢查的二十多個患者的生日全部是同一天,這得是多么大的“緣分”?在所有的NLP技術(shù)模型構(gòu)建之前,必須要解決這些與正常的醫(yī)學(xué)邏輯、常識邏輯相違背的問題 。

第三個問題是缺乏尋找隱藏在已有數(shù)據(jù)外的知識的能力,舉個例子,在患者的“一述五史”中,研究人員需要提取一個字段名稱叫做“是否有吸煙史”,因此他們需要標注的結(jié)論是“是”或者“否”,而這兩個字在病歷中是不直接出現(xiàn)的,那就需要拆解邏輯,要明確從病例中識別出什么,最終判斷這個是否吸煙的結(jié)論。

Watson對于上述三個問題并沒有給出很好的解決答案。相反,IBM耗費40億巨資收購了Explorys、Phytel、Merge Healthcare等數(shù)據(jù)公司,合作多個著名醫(yī)療機構(gòu)……重重努力有力擴充了Watson的知識量,卻沒有有效提升Watson的邏輯能力。

此外,Watson的根“數(shù)據(jù)”出于MSK。雖然IBM意在全球,但是MSK的診斷風格或許不能適用于每一區(qū)域。以中國為例,生活、飲食習(xí)慣乃至基因差異決定了診斷的差異,本土化不足的Watson很難適應(yīng)這樣的變化,給出準確的診斷結(jié)果。

不僅如此,從Watson的推理過程看來,其分析過程需要結(jié)合結(jié)構(gòu)化的病歷數(shù)據(jù)與非結(jié)構(gòu)化的影像數(shù)據(jù),需要AI處理異構(gòu)數(shù)據(jù)。這在國內(nèi)一般被分為AI的兩個階段,每個階段均有各自的AI負責運算,Watson有些操之過急。因此,即便擁有影像AI公司Merge Healthcare的助力,至少在國內(nèi)的醫(yī)生看來,Watson沒有交出一張好的成績表,只能在診斷中給出標準的、醫(yī)生能力范圍內(nèi)的建議。

不過,盡管缺乏有效的AI邏輯、缺乏自動化的數(shù)據(jù)質(zhì)量問題發(fā)現(xiàn)算法,Watson的知識圖譜仍具備很高的價值。Watson顯然看到了這一點,用于幫助藥物臨床試驗尋求合適患者的Watson for Clinical Trial Matching 與用基因測序技術(shù)對腫瘤進行精準治療Watson for Genomics便是Watson價值的證明。

相對于偏向醫(yī)生端的輔助診斷,這兩個產(chǎn)品對邏輯推理的要求較低,更注重文獻、數(shù)據(jù)的豐富程度,Watson完全能夠滿足這樣的條件。但問題也在于此,如果條件太低,企業(yè)便無法構(gòu)建充分的競爭力。這里的問題在于市場有限,且數(shù)據(jù)庫是醫(yī)療大數(shù)據(jù)公司的基礎(chǔ),競爭對手眾多。國內(nèi)的HLT、浪潮健康都有提供與Watson for Clinical Trial Matching一致的業(yè)務(wù),而Watson for Genomics所處的市場則對AI要求不高,位于上游的測序機構(gòu)更具備話語權(quán)。

AI之外:過度的包裝與存疑的商業(yè)模式

過度的包裝導(dǎo)致醫(yī)療AI常常被人詬病,在這一方面,Watson算是開了一個糟糕的開頭。從2011年美國智力競猜節(jié)目《危險邊緣》中擊敗兩位歷史上最優(yōu)秀的選手后,IBM放出了“人類將會被取代”的豪言,乃至到了2019年,還有不少醫(yī)療人工智能企業(yè)家,仍在強調(diào)自己做的AI,“不是要取代醫(yī)生,而是要賦能醫(yī)生”。

這個錯誤包含兩方面的問題,一是給了投資人、醫(yī)生乃至醫(yī)院過高的期待,加大了產(chǎn)品存在缺陷時采購者的心理落差;二是產(chǎn)品沒有遵循“以人為本”的設(shè)計理念,難以進入實際臨床流程,不能實際為醫(yī)生減壓賦能。

其次是營收問題。根據(jù)本次華爾街日報給出的數(shù)據(jù),Watson年營收為10億美元,這一數(shù)字多少有些奪人眼球。

我們不妨借用2019年數(shù)據(jù)簡單計算一下。目前醫(yī)療AI 頭部創(chuàng)業(yè)公司的營業(yè)收入在一個億人民幣左右,AI獨角獸云知聲年收入2.19億元,依圖科技年收入7.17億元,衛(wèi)寧健康營收19億元……眾多公司加起來才能湊夠IBM Watson Health全球65億元的營收。

再看一組數(shù)據(jù),《華爾街日報》曾透露,Watson Health產(chǎn)品組合中最大的AI產(chǎn)品是Watson for Oncology,IBM通常向每位患者收費200至1000美元,在某些情況下還需要咨詢費;據(jù)《數(shù)智物語》報道,2017年百洋醫(yī)藥集團董事長付鋼在接受記者采訪時曾表示,使用Watson腫瘤解決方案均自費,價格是4500元/例。而IBM給出的數(shù)據(jù)是,至2018年6月底,使用Watson for Oncology的患者數(shù)量為84000名,以20%的患者增長率計算,Watson for Oncology的患者端大概能夠為IBM帶來5.5億元的總共收入,遠低于每年10億美元這一數(shù)字。

2018年11月,處于衰退狀態(tài)的Watson在國內(nèi)的落地情況是43個城市近80家醫(yī)院,略低于頭部AI公司,按照這一數(shù)字計算,Watson帶來的收入距離其百億級的投入,還有很長距離。

還有一個問題不容忽視:為什么患者會想要一個昂貴的虛擬醫(yī)生,而非平價的主任醫(yī)生進行診斷呢?

百億美金燒出了什么教訓(xùn)?

內(nèi)外之下,我們大致可以將Watson存在的問題歸納于4點。

一、在大規(guī)模的收購過程中,Watson的人員嚴重冗雜。在MSK事件后,Watson事業(yè)部裁員50%至70%,被裁員工主要來自收購的三家公司Phytel、Explorys和Truven。

二、診斷準確性、安全性存疑。2018年,IBM內(nèi)部文件流出,多個案例均暗示W(wǎng)atson Health缺乏準確與安全。實際上,綿綿十年,Watson也沒有通過FDA的審批,IBM也未發(fā)表任何科學(xué)論文,證明該技術(shù)如何影響醫(yī)生和患者。

三、數(shù)據(jù)集存在問題。數(shù)據(jù)集存在認知偏見,缺乏有效的邏輯推理,缺乏質(zhì)控、缺乏本土化優(yōu)化。

四、虛擬診斷為偽需求,“燒錢的醫(yī)生”不掙錢。

如今戰(zhàn)略轉(zhuǎn)向AI與混合云,IBM拋棄Watson這一棋子已成為必然。但是,Watson的沒落并非AI的沒落,起伏十年,我們能從中看到許多有價值的東西。

首先是對于AI的定義。習(xí)慣了“互聯(lián)網(wǎng)+”的我們常常用“AI+”來定義其醫(yī)療應(yīng)用,但互聯(lián)網(wǎng)本身便是一個場景,而目前的AI,僅是某一醫(yī)療場景中的某一應(yīng)用,是服務(wù)于該場景的技術(shù),更為準確的說法為“+AI”。換句話說,我們應(yīng)該根據(jù)具體的醫(yī)療場景定制需求,而非做好一個AI算法,強行將其置于某一AI流程之中。

這樣的好處顯而易見。從信息化的產(chǎn)業(yè)發(fā)展可知,醫(yī)療需要AI,但又沒有那么需要AI。從現(xiàn)在的信息化政策來看,各類評級強調(diào)了數(shù)據(jù)的收集、整理、清洗、上報、分析、質(zhì)控,很多過程依靠人力難以實現(xiàn)(尤其是分析、質(zhì)控),必須利用基于NLP的知識圖譜的數(shù)據(jù)進行處理。這些領(lǐng)域之中,我們通常不談AI,但AI卻已成為新一代信息系統(tǒng)不可或缺的一部分。

再談知識圖譜。大規(guī)模臨床電子病歷要真的發(fā)揮其價值并不能如Watson一樣進行簡單的堆疊許欸小,而是需要解決很多問題。在這之中,數(shù)據(jù)質(zhì)量治理問題、數(shù)據(jù)結(jié)構(gòu)化信息提取問題、數(shù)據(jù)歸一標準化問題都非常難以處理。這些問題的解決單純靠人工是無法規(guī);,必須用自然語言處理技術(shù)作為支撐。這里不僅需要自然語言處理的算法技術(shù)、計算技巧和工程能力,更需要很強的醫(yī)學(xué)背景知識。因此,要實現(xiàn)有效的診斷,必須一一解決上述問題,構(gòu)造出有效的邏輯。

作者:趙泓維

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號