訂閱
糾錯
加入自媒體

機器學習如何解決看病難?

機器學習對臨床醫(yī)生的工作有何幫助

預后

機器學習模型可以學習患者的健康軌跡模式。它可以得到超出醫(yī)生個體經(jīng)驗的信息,幫助醫(yī)生以專家水平預測出未來可能發(fā)生的事件。例如,患者重返工作崗位的概率有多大?疾病發(fā)展的速度會有多快?相同類型的預測可以在眾多患者中可靠地識別出將出現(xiàn)高危情況或可能頻繁需要醫(yī)療護理的患者,這些信息可以作為附加信息幫助醫(yī)生。

大型綜合衛(wèi)生系統(tǒng)已經(jīng)在用簡單的機器學習模型了,它可以自動識別可能需要轉移到重癥監(jiān)護室的住院患者,回溯性研究表明,可以用 EHR 和醫(yī)學圖像中的原始數(shù)據(jù)建立更復雜也更準確的預后模型。

構建機器學習系統(tǒng)需要用患者的縱向整合數(shù)據(jù)進行訓練。只有當訓練模型的數(shù)據(jù)集中包含結果時,模型才能學習到患者的情況。但數(shù)據(jù)現(xiàn)在都是獨立存儲在 EHR 系統(tǒng)、醫(yī)學影像存檔和交互系統(tǒng)、付款人、PBM(Pharmacy Benefits Managers,藥品福利管理)甚至患者手機上的應用中的。自然的解決方案是將數(shù)據(jù)系統(tǒng)交到患者自己手中,這也是我們長期以來一直倡導的解決方案,現(xiàn)在這一想法也已經(jīng)通過快速采用患者控制的應用程序編程接口得以實現(xiàn)。

像 FHIR(Fast Healthcare Interoperability Resources,快速醫(yī)療互操作性資源)這樣將數(shù)據(jù)轉化為統(tǒng)一格式可以更有效地聚合數(shù)據(jù);颊呖梢詻Q定哪些人可以用他們的數(shù)據(jù)來構建或運行模型。盡管有人擔心技術的互操作性無法解決 EHR 數(shù)據(jù)中普遍存在的語義標準化問題,但 HTML(Hypertext Markup Language,超文本標記語言)可以索引 Web 數(shù)據(jù),還可以用在搜索引擎上。

診斷

每一位患者都是獨一無二的,但最好的醫(yī)生可以在正常范圍內確定患者特有的微弱信號或異常值。可以用機器學習檢測出的統(tǒng)計模式幫助醫(yī)生識別診斷不到的病癥嗎?

醫(yī)學研究所的結論是,幾乎每一位患者在他(她)的一生中都會遇到一次誤診,而正確的診斷是采用合適治療方法的基礎。這個問題不止在一些罕見的病癥中會出現(xiàn)。在發(fā)展中國家,即便有充足的治療手段、檢查時間和培訓充分的醫(yī)護人員,也無法檢查出急性胸痛、肺結核、痢疾以及分娩期間的并發(fā)癥。

常規(guī)醫(yī)療護理期間收集到的數(shù)據(jù)表明,可以在臨床診斷中用機器學習來判斷可能的診斷,這樣可以提高對以后可能出現(xiàn)的情況的認識。但這樣的方法有局限性。生疏的臨床醫(yī)生可能無法正確提取模型必需的信息,因而無法讓模型變得有意義。模型得到的結果可能建立在臨時或錯誤的診斷之上,可能建立在不能證明是病癥的不良反應條件之上(從而造成過度診斷),可能受計費的影響,或者可能根本沒有記錄。但模型會根據(jù)這些實時收集的數(shù)據(jù)給醫(yī)生提出建議,這些建議在誤診率很高和臨床醫(yī)生不確定的情況中是很有用的。在臨床上正確的診斷和 EHR 中或報銷索賠中的記錄的不一致意味著臨床醫(yī)生應該從一開始就參與到產生數(shù)據(jù)的過程中來,這些數(shù)據(jù)會作為常規(guī)護理的一部分,而且之后還會用于自動診斷過程。

訓練成功的模型可以回溯識別各種圖像類型的異常(表 1)。但將機器學習模型作為臨床醫(yī)生常規(guī)工作一部分的回溯試驗的數(shù)量非常有限。

治療

在數(shù)萬名醫(yī)生要治療數(shù)千萬患者的大型醫(yī)療系統(tǒng)中,患者在什么時候為什么就診以及情況相似的患者應該如何治療都是有差異的。模型是否可以對這些差異進行分類,從而幫助醫(yī)生確定首選治療途徑?

一個比較簡單的應用是比較定點照護(point of care)的處方和模型得到的處方,可以將差異標記出來后再次核查(例如,其他臨床醫(yī)生傾向于使用可以反映新方法的替代療法)。基于歷史數(shù)據(jù)訓練的模型只能學習醫(yī)生的處方習慣,但這并不一定是理想做法。為了了解療效最好的藥物和治療方法,需要精心收集數(shù)據(jù)并評估因果效應,而機器學習模型則不一定能(有時候也不能用給定的數(shù)據(jù)集)識別這些效應。

根據(jù)觀察數(shù)據(jù)比較療效研究和實用性實驗的傳統(tǒng)方法也提供了重要看法。但近期使用機器學習方法的試驗表明,和專家一起生成人工篩查過的數(shù)據(jù)集、更新模型以納入新發(fā)表的數(shù)據(jù)、根據(jù)不同領域的處方進行調整以及從 EHR 中自動提取相關變量都是很大的挑戰(zhàn)。

還可以用機器學習自動選擇患者,根據(jù)臨床記錄,這些患者可能適合進行隨機對照試驗;或者可以用機器學習自動識別可能用早期研究或新療法治愈的高風險患者或亞群。這些工具促使醫(yī)療健康系統(tǒng)研究每一種臨床情況,可以在降低成本和管理費用的同時進行更嚴格的研究。

臨床工作流程

EHR 的引入提高了數(shù)據(jù)的可用性。但這些系統(tǒng)也因費用過高、管理文檔的復選框過多、用戶界面不夠友好、輸入數(shù)據(jù)花費的時間過長以及產生新的醫(yī)療錯誤等讓臨床醫(yī)生們灰頭土臉。

也可以將機器學習技術用在其他消費產品中以提高臨床醫(yī)生們的效率。驅動搜索引擎的機器學習可以在無需臨床醫(yī)生多次點擊的情況下找出患者數(shù)據(jù)的相關信息。用機器學習技術(如預測類型、語音聽寫和自動摘要等)可以大大改進表格和文本數(shù)據(jù)的輸入。根據(jù)患者表格中的信息自動授權支付的模型可以取代提前授權。使用這些工具不僅僅只是為了方便醫(yī)生。無障礙地查看和輸入臨床上的有效數(shù)據(jù)對捕獲和記錄醫(yī)療健康數(shù)據(jù)來說至關重要,這反過來也可以在機器學習的輔助下為每一位患者提供最好的醫(yī)療護理幫助。最重要的是,這種做法提高了效率、簡化了記錄,而且改進了自動化臨床工作流程,這樣臨床醫(yī)生就可以把更多的時間花在患者身上。

在 EHR 系統(tǒng)之外,機器學習技術也可以用于外科手術的實時視頻分析,可以幫助外科醫(yī)生避免在關鍵結構解剖時出現(xiàn)問題或者患者身體有意料之外的改變,甚至可以處理更普通的任務——比如準確計算手術海綿的數(shù)量。檢查清單(checklist)可以避免手術錯誤,還可以自動監(jiān)控手術過程,提高手術的安全性。

在臨床醫(yī)生的個人生活中,他們可能在自己的智能手機上用到了所有這些技術的變體。盡管有將這些技術應用于醫(yī)學背景的概念驗證的研究,但主要的障礙不是模型的開發(fā),而是技術的基礎設施——EHR 之上的法律、隱私和政策框架、衛(wèi)生系統(tǒng)以及技術供應商。

擴大臨床專業(yè)知識的可用性

醫(yī)生不可能照料到所有需要治療的患者。機器學習是否可以在不需要醫(yī)生親自參與的情況下,擴大醫(yī)生診治范圍、提供專家級醫(yī)療評估呢?例如,剛剛發(fā)皮疹的患者可能只要用手機發(fā)送一張照片就可以獲得診斷,從而避免掛不必要的急診。本身要去急診室就診的患者可能在自動診斷系統(tǒng)就能獲得診斷,并在適當?shù)臅r候以另一種形式進行護理。當患者確實需要專業(yè)幫助時,模型也可以識別出專業(yè)最相關且處于空閑狀態(tài)的醫(yī)生。同樣,為了提高舒適度并降低成本,如果機器可以遠程監(jiān)控病人的傳感器數(shù)據(jù),本身需要住院治療的病人就可以在家里接受護理了。

世界上有一些地區(qū),直接學習醫(yī)學專業(yè)知識的渠道有限,而且非常復雜,因而將機器學習的真知灼見直接傳遞給病人變得越來越重要。即便是在那些專家醫(yī)生充足的區(qū)域,這些醫(yī)生擔心他們的能力和努力無法及時且準確地解釋那些浪潮一般的數(shù)據(jù),這些數(shù)據(jù)一般是從患者穿戴的傳感器或活動追蹤設備中得到的,并且由患者自己驅動。事實上,用數(shù)百萬患者的數(shù)據(jù)訓練得到的機器學習模型可以幫助專業(yè)醫(yī)護人士做出更好的決策。例如,護士可以承擔通常由醫(yī)生完成的醫(yī)療工作,初級護理醫(yī)生則可以承擔通常由醫(yī)療專家完成的工作,而醫(yī)療專家則可以將更多的時間投入到非常需要他們專業(yè)知識的病人身上。

不涉及機器學習的移動應用或網(wǎng)絡服務已被證明可以改善藥物的依賴性,還可以控制各種慢性病。但正式的回顧性和前瞻性評估方法阻礙了患者直接應用機器學習。

主要挑戰(zhàn)

高質量數(shù)據(jù)的可用性

構建機器學習模型的核心挑戰(zhàn)在于組裝具有代表性的多樣化數(shù)據(jù)集。理想做法是在使用過程中利用最接近期望數(shù)據(jù)準確格式和質量的數(shù)據(jù)來訓練模型。例如,對于打算用在即時護理中的模型而言,最好使用 EHR 在特定情況下所用的同一數(shù)據(jù),即便已知這些數(shù)據(jù)不可靠或這些數(shù)據(jù)受到了不必要變化的影響。當數(shù)據(jù)集足夠大時,現(xiàn)代模型可以成功被訓練,以將嘈雜輸入映射到嘈雜輸出。使用人工篩查數(shù)據(jù)(比如那些在臨床試驗中從人工病例審查得到的數(shù)據(jù))得到的更小數(shù)據(jù)集就不太理想,除非希望醫(yī)生根據(jù)原始實驗規(guī)范手動提取變量。這種做法對某些變量來說或許可行,但對于做出最準確預測所必需的、EHR 中數(shù)十萬的數(shù)據(jù)而言就太不可行了。

俗話說「垃圾進,垃圾出」(garbage in, garbage out),那么我們如何協(xié)調噪聲數(shù)據(jù)集來訓練模型呢?要學習大多數(shù)復雜的統(tǒng)計模式最好還是有大數(shù)據(jù)集(哪怕是噪聲數(shù)據(jù)),以便對模型進行微調和評估,但具有人工篩查標簽的更小樣例集還是有必要的。當原始數(shù)據(jù)可能標記錯誤時,這種樣例集可以就模型對預期標簽的預測做出正確的評估。對成像模型來說,這通常需要生成由每張圖片的多個評分器判定的「ground truth」標簽(即由一位絕對可靠的專家指定給一個樣例的診斷或發(fā)現(xiàn)),但對非成像任務來說,如果沒能獲得必要的診斷測試,那可能也無法獲得「ground truth」標簽。

一般情況下,訓練數(shù)據(jù)越多機器學習模型表現(xiàn)得越好。因此,對于機器學習的使用而言,一個關鍵的問題是在利用大且多樣化數(shù)據(jù)集以提高機器學習模型準確率的同時,需要平衡隱私問題和監(jiān)管要求。

從過去的失敗經(jīng)驗中學習

人類的所有活動都會被意料之外的偏差破壞。機器學習系統(tǒng)的構建者和使用者需要仔細考慮偏差如何影響用于訓練模型的數(shù)據(jù),并采取措施解決和監(jiān)控這些偏差。

機器學習的優(yōu)勢(也是劣勢之一)在于模型可以識別到人類無法找到的歷史數(shù)據(jù)模式。醫(yī)療實踐的歷史數(shù)據(jù)表明,人們能得到的系統(tǒng)性醫(yī)療護理是存在差異的,一般為弱勢群體提供的醫(yī)療護理較其他群體更差一些。在美國,歷史數(shù)據(jù)反映了一種支付系統(tǒng),該系統(tǒng)會獎勵使用不必要護理和服務的人,這樣可能會錯過那些本該卻并未得到護理的病人(比如沒有保險的患者)。

監(jiān)管、監(jiān)督和安全使用的專業(yè)知識

衛(wèi)生系統(tǒng)已經(jīng)建立了可以確保將藥物安全傳遞到患者手上的復雜機制。機器學習的廣泛適用性也需要同樣復雜的監(jiān)管結構、法律框架以及當?shù)貙嵺`以確保系統(tǒng)的安全開發(fā)、使用和監(jiān)管。此外,技術公司必須要提供可擴展的計算平臺來處理大量數(shù)據(jù)和模型使用的問題,但到現(xiàn)在他們也不清楚自己的定位。

重要的是,使用機器學習系統(tǒng)的醫(yī)生和病人都需要理解其局限性,包括模型并不能泛化到特定場景。做決策或分析圖像時過度依賴機器學習模型可能會導致自動化偏差,而醫(yī)生可能已經(jīng)降低其對這些偏差的警惕。如果模型的可解釋性不夠強,醫(yī)生可能意識不到模型給出了錯誤的建議,這時尤其會出現(xiàn)問題。在模型預測中表現(xiàn)出置信區(qū)間可能有所幫助,但置信區(qū)間本身或許被錯誤解釋。因此,需要對使用中的模型進行前瞻性的、真實的臨床評估,而不只是根據(jù)歷史數(shù)據(jù)集對模型性能做回顧性評估。

需要特別考慮直接針對患者的機器學習應用;颊呖赡軣o法驗證模型構建者所說的話是否得到高質量臨床證據(jù)的證實,也無法驗證模型建議的行為是否合理。

研究結果的出版與傳播

構建模型的跨學科團隊可能會在臨床醫(yī)生不熟悉的場所匯報結果。稿件通常會在 arXiv 和 bioRxiv 這樣的預印本服務網(wǎng)站上發(fā)布,許多模型的源代碼則會在 GitHub 庫這樣的地方保存。此外,許多同行評審的計算機科學稿件也并不會發(fā)布在傳統(tǒng)期刊上,而會發(fā)表在 NeurIPS(神經(jīng)信息處理系統(tǒng)大會)和 ICML(國際機器學習大會)這樣的會議上。

結論

大量衛(wèi)生保健數(shù)據(jù)的加速創(chuàng)建將從根本上改變醫(yī)療保健的性質。我們堅信,醫(yī)患關系將成為為患者提供醫(yī)療服務的基石,而這種關系會因機器學習的輔助而變得豐富。我們期望在未來幾年會出現(xiàn)一些早期模型和同行評審的刊物,它們的出現(xiàn)以及監(jiān)管框架和基于價值醫(yī)療的經(jīng)濟激勵的發(fā)展,都會成為對醫(yī)療領域應用機器學習保持樂觀態(tài)度的理由。我們期望在不遠的未來,數(shù)百萬臨床醫(yī)生在護理數(shù)十億患者時,可以在機器學習模型的幫助下根據(jù)所有醫(yī)學相關數(shù)據(jù)做出決策,從而為所有患者提供最好的護理方案。(作者:機器之心)

<上一頁  1  2  
聲明: 本文系OFweek根據(jù)授權轉載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號