醫院是檢驗人工智慧能做什麼、不能做什麼的試驗場。¶
醫療保健產業正全面擁抱人工智慧,從解讀病患影像到應對保險拒賠,無所不包。¶
西北大學醫學院的薩米爾·阿布德借助人工智慧技術查看胸部 X 光片。
鄧超 |攝影:Nate Ryan,刊登於《華爾街日報》
2026年1月5日凌晨5:30(美國東部時間)
¶
快速概要
-
醫療系統正越來越多地採用人工智慧,其中 27% 的醫療系統付費購買商業人工智慧許可證,這一比例是美國整體經濟水平的三倍。
-
人工智慧工具顯著減少了放射科醫生的報告撰寫時間,並將工作人員處理被拒保險索賠的時間減少了多達 23%。
-
儘管人工智慧提高了效率,但它也可能產生虛假資訊。
西北大學醫學院急診放射科主任薩米爾·阿布德認為自己的工作速度已經達到最快了。憑藉一套精心設計的流程,並藉助語音識別,他最快可以在75秒內完成一份X光片報告的撰寫。
隨後,這家總部位於芝加哥的醫療系統於2024年推出了生成式人工智慧技術,該技術可以分析患者的掃描影像並產生報告。負責檢查人工智慧工作並評估潛在改進方案的阿布德表示,審核速度已提升至約45秒。
結果令人驚嘆,也令人震驚。 「這是我第一次感覺自己的職業生涯是有時間限制的,」阿布德說。
不過,他表示,人是這過程中不可或缺的一部分。而且,加快掃描結果的解讀速度也帶來了許多好處。
阿布德說:“你起身去洗手間都會感到內疚。有數百名病人等著我們讀血,他們中的任何一個都可能是即將離世的病人。”
大型醫院系統已成為人工智慧廣泛應用的試驗場,測試了這項技術的功能,但也揭示了——有時是透過令人震驚的事故——它的不足之處。
根據 Menlo Ventures 和 Morning Consult 最近的一項調查,在醫療系統中,27% 的醫療系統正在為商業人工智慧許可證付費,這一比例是美國整體經濟水平的三倍。
隨著人口老化導致醫療保健需求不斷增長,醫院正在尋找應對持續存在的醫護人員短缺問題的方法,因為醫護人員短缺會導致醫護人員過度勞累並延誤治療。此外,在醫療補助計劃面臨削減的情況下,醫院也正在盡其所能提高效率。
人工智慧尤其在一些最不起眼但勞力密集的醫院日常工作中取得了突破性進展:例如記筆記、接聽病人電話和處理保險索賠。
Aries是西北大學醫學院的人工智慧工具,它可以產生放射科報告草稿供放射科醫生審查。圖中,Abboud正在對一份報告進行修改。
麥肯錫顧問公司高級合夥人魯帕爾·馬拉尼(Rupal Malani)表示,這些任務通常「依賴勞動力,同樣的機械流程要重複數千次」。馬拉尼為醫療系統提供人工智慧實施的諮詢。
儘管人工智慧可以輔助醫療決策,但最終的決策權仍掌握在醫生手中。例如,加州大學洛杉磯分校去年的一項研究發現,人工智慧能夠更好地識別乳癌的細微跡象,這些跡象可能在常規篩檢之間悄悄發展。研究估計,利用人工智慧輔助篩檢患者可以將此類乳癌的發生率降低30%。
同時,也有理由保持謹慎。
梅奧診所心臟科醫生保羅·A·弗里德曼(Paul A. Friedman)在需要評估心臟手術後幾天內需要植入除顫器的患者的病例時,求助於ChatGPT。弗里德曼認為這種手術可行且安全,但想知道是否有相關的病例研究。 ChatGPT回覆他,提供了幾篇發表在醫學期刊上的報告,聲稱這些報告表明這種手術「安全有效」。弗里德曼說“看起來很有道理”,直到一位同事試圖找到這些研究,結果發現它們完全是捏造的。
弗里德曼表示,經歷了那次之後,他採取了「信任但要核實」的態度。 「並不是說我不向ChatGPT諮詢醫學問題,而是當我提問時,我總是會查找參考文獻,點擊鏈接,至少閱讀摘要。」他說。該醫院的心臟科正在測試其他內部開發的AI工具。
ChatGPT 的開發公司OpenAI的一位發言人表示,其團隊會“持續進行評估,以減少有害或誤導性回复”,並且其最新模型比之前的版本(例如弗里德曼當年使用的版本)更能提供準確的健康信息。該公司補充說,ChatGPT 的目的並非取代醫療專業人員的指導。
在醫療系統中,27% 的醫療系統正在為商業人工智慧許可付費,這一比例是美國整體經濟水平的三倍。
10 月發表在《柳葉刀胃腸病學和肝病學》上的一項研究發現,醫生使用人工智慧三個月來幫助他們在結腸鏡檢查中發現增生物,一旦停止使用該工具,他們能夠檢測到的增生物數量就會明顯減少。
「我總是擔心自己會退化技能,」安東尼·卡迪洛說。他是一位病理學家,在紐約市的紀念斯隆-凱特琳癌症中心擔任血液樣本實驗室主任。 「每當我把思考外包給別人,而不是交給自己的大腦時,我都會擔心自己會失去肌肉記憶。”
卡迪洛表示,他和他的同事使用生成式人工智慧來審查樣本,但他們只是在自己做出診斷之後,才將其作為第二雙眼睛進行審查。
儘管存在這些擔憂,但醫療系統表示,他們看到了巨大的前景和必要性。
「當你想到社會即將面臨的巨大需求時,科技是我們唯一可以利用的手段,」西北大學醫學中心首席數位與創新長道 格金說。
西北大學利用人工智慧技術對一年內採集的一百萬份掃描影像進行分析,發現了70份先前未被人工標記需要進一步審查的影像。隨後進行的人工核查又發現了5例醫師認為需要進一步追蹤的病例。西北大學官員表示,該校還在使用另一款人工智慧工具來更有效地安排手術室時間,這意味著可以治療更多患者。
人工智慧已經在一些最耗費人力的日常醫院工作中取得了突破,例如處理保險索賠。
早在大型資料中心在美國各地湧現之前,醫院就已是人工智慧的早期用戶。多年來,預測演算法一直為敗血症預警系統提供支持,識別高風險患者,並協助管理排班。
在北加州,凱撒醫療集團旗下的21家醫院使用一套系統,該系統每小時分析所有患者的生命徵象並記錄評分,以確定哪些患者的風險最高。 《新英格蘭醫學雜誌》上的一項研究發現,該系統每年挽救500多人的生命。
凱撒醫療集團聖克拉拉醫療中心的肺科重症監護醫生劉文森表示,最近有一天,該系統確定一名心臟衰竭患者需要更仔細的檢查,醫生們這才發現他還患有嚴重的呼吸道病毒,需要使用類固醇治療肺部疾病。
廣告
費城醫療系統傑斐遜健康中心正在進行一項持續性試驗,評估諸如 ChatGPT 之類的大型語言人工智慧模型能否為乳癌患者提供量身定制的營養建議。評估因素包括患者的癌症分期、其他健康問題、預算以及附近商店的便利程度。
在喬治亞州奧古斯塔市,家庭醫生迪恩·西胡森表示,他會使用生成式人工智慧來查詢各種疾病的最新治療標準,尤其是一些他並不常見的疾病。他使用的工具只引用經過審核的醫學資料,因此他表示自己很信任它,並且只在大約25%的情況下才會去核實其參考文獻。
不過,他對人工智慧對醫學的整體影響仍持保留態度。 「我最擔心的是,它會進一步削弱大眾對醫學的信任,最終導致病患就醫環境如同蠻荒西部一般混亂,」他說。他還補充道,他發現越來越多的患者在使用人工智慧後自行診斷,其中不乏不準確的診斷結果。
醫院正積極採用人工智慧技術來處理一些看似不起眼但耗時又耗力的任務。電子病歷供應商Epic Systems於2024年推出了一款利用生成式人工智慧挖掘病患病歷並自動產生向保險公司申訴信的工具。該公司表示,目前已有約1,000家醫院在使用該系統。
西北大學資訊科技副總裁大衛布拉尼克表示,該校每年處理的數百萬起索賠案件中,通常有 5% 到 10% 需要提起上訴。
「我們花了大量人力物力去與他們抗爭、申訴,並證明我們應該獲得報酬,」他說。但布拉尼克表示,採用Epic的工具後,員工處理每筆被拒絕申請的時間減少了約23%。
人工智慧正在幫助紐約西奈山醫院推翻保險公司的拒賠決定。 布里塔尼紐曼/西奈山醫院
紐約西奈山醫院的首席數位資訊長 麗莎·斯圖姆普表示,該院採取的類似措施使保險拒賠案件的撤銷率提高了 3%,每年為該醫療系統增加了 1,200 萬美元的收入。
西奈山醫院最近暫停使用Epic公司的一款人工智慧產生工具。該工具旨在分析患者發送給醫生的信息,並產生個人化的回覆草稿。醫生試用幾週後表示,這些草稿並沒有太大幫助,需要大量修改。
西奈山人工智慧保障實驗室主任安基特·薩庫賈表示,確實出現了一些非常具體的故障。例如,在一個案例中,系統告訴一位請求使用助行器或拐杖的患者,它無法提供幫助。在另一個案例中,一位報告頭痛的患者得到了冗長的回复,稱患者的病情可能從輕微的疼痛到腦瘤都有可能。
Epic公司表示,少數醫院已暫停使用該功能,公司正在努力改進。 Epic稱,該工具已幫助護理人員透過系統與病患溝通時節省多達30秒的時間,目前已推廣至約1,700家醫院。不過,該公司也表示,該功能仍需人工監督。
「臨床醫生完全掌控著傳遞給患者的訊息,」Epic公司研發高級副總裁塞思·海恩說。
西北醫學中心的內科醫生謝麗爾·威爾克斯表示,多年來,她在看診期間一直在敲鍵盤,偶爾會轉過頭來問個問題。
西北大學醫學院的 Cheryl Wilkes 使用人工智慧來總結患者的就診情況,並進行必要的修改。
她從2024年開始使用人工智慧來轉錄和總結患者的就診記錄。以前她每天下班後要花兩到三個小時處理電子病歷,現在她只需要花半個小時檢查人工智慧工具的處理結果並進行必要的修改。
在密西根州安娜堡一家門診診所工作的執業護理師傑里米·拉帕姆表示,他曾嘗試使用人工智慧轉錄部分就診記錄,但編輯輸出結果耗時過長。他偶爾會查閱人工智慧資料庫以獲取臨床訊息,但他表示,即使是醫學期刊,他也會仔細點擊參考文獻,以確保其未被撤稿。
他花了很多時間思考,在考慮住房或心理健康等其他生活限制因素的情況下,哪些治療方案對患者有效——他說,人工智慧未必知道如何將這些因素考慮在內。 「我仍然持懷疑態度,」他說。
AI¶
根據您提供的這篇文章,AI 在醫療產業的應用潛力確實非常巨大,但目前正處於一個「壓力測試」階段。醫院作為試驗場,清楚地劃分出了 AI 目前「能做什麼(大幅提升效率與救命)」與「不能做什麼(取代人類判斷與處理複雜情境)」。
以下為您分析文章中呈現的 AI 醫療應用現況:
1. 巨大的潛力:AI「能做什麼」?¶
文章指出,醫療系統採用 AI 的比例是美國整體經濟水平的三倍(27% 的醫療系統付費購買商業 AI 許可證)。其潛力主要體現在以下三個方面:
-
極致的效率提升(行政與文書):
-
影像報告: 西北大學醫學院透過生成式 AI,將醫生撰寫 X 光片報告的時間從 75 秒壓縮至 45 秒,這讓醫生能處理更多病患 。
-
保險申訴(變現能力): AI 能自動生成向保險公司申訴的信件。在西北大學,這讓處理被拒賠案件的時間減少了 23%;在西奈山醫院,這將拒賠撤銷率提高了 3%,每年為醫院增加 1,200 萬美元的收入 。
-
病歷整理: 醫生利用 AI 轉錄和總結就診記錄,將下班後的文書工作時間從 2-3 小時大幅縮減至 30 分鐘 。
-
-
補強人類的盲點(診斷輔助):
-
癌症篩檢: 加州大學洛杉磯分校的研究估計,AI 輔助篩檢可將乳癌發生率降低 30% 。西北大學利用 AI 重新分析掃描影像,發現了 70 份先前被人工漏掉的異常影像 。
-
偵測增生物: 在結腸鏡檢查中,AI 能協助醫生發現更多增生物 。
-
-
挽救生命(即時監控):
- 敗血症與生命徵象監控: 凱撒醫療集團使用演算法系統每小時分析病患生命徵象。該系統能發現人類容易忽略的細微變化(例如心臟衰竭病患同時患有呼吸道病毒),據統計每年挽救了 500 多人的生命 。
2. 現實的局限:AI「不能做什麼」與風險?¶
儘管潛力巨大,但醫院這個「試驗場」也暴露了 AI 嚴重的缺陷,證明它目前無法完全取代人類:
-
虛構事實(Hallucinations):
- 梅奧診所的心臟科醫生發現,ChatGPT 雖然能提供看似合理的醫療建議,但其引用的醫學期刊報告完全是「捏造的」。這迫使醫生必須採取「信任但要核實」的態度 。
-
缺乏語境與常識(Context):
-
溝通失敗: 西奈山醫院曾試用 AI 撰寫回覆病患的訊息,但效果不佳被暫停使用。例如,AI 會告訴需要助行器的病患「無法提供協助」,或對一個頭痛的病患給出可能罹患腦瘤的冗長回覆,這些草稿需要醫生大量修改 。
-
忽視生活因素: AI 未必知道如何將病患的住房狀況、心理健康或預算等現實生活限制納入治療方案的考量 。
-
-
人類技能退化(De-skilling):
- 研究發現,長期依賴 AI 尋找結腸增生物的醫生,一旦停止使用該工具,其檢測能力會明顯下降,這引發了對醫生失去「肌肉記憶」與技能退化的擔憂 。
-
信任危機:
- 醫生擔心 AI 會削弱大眾對醫學的信任,導致病患使用 AI 進行不準確的自我診斷,讓就醫環境變得混亂 。
結論¶
AI 在醫療產業的潛力是「變革性」的,特別是在解決醫護人員短缺、行政效率低落和漏診問題上。然而,目前的技術狀態仍需「人工監督(Human in the loop)」。
正如西北大學急診放射科主任薩米爾·阿布德所言,雖然 AI 讓工作變快,但「人是這過程中不可或缺的一部分」。醫院目前的實驗結果表明,AI 是一個強大的「超級助理」,但還遠未達到能獨立運作的「超級醫生」水準。