2024-11-22 | 科技島

靠AI模型協助診斷反而失準？史丹佛大學研究證實

史丹佛大學醫學院的研究發現，單獨使用ChatGPT-4診斷推理，其正確率竟然高達92%，凸顯出醫師與AI的合作還需要培訓和臨床整合。

記者／劉閔

日前來自史丹佛大學醫學院的研究發現，醫師若透過大語言模型ChatGPT-4輔助進行診斷的正確率為76.3%，而這結果與使用傳統診斷方法的正確率73.7%相差不多。不過，單獨使用ChatGPT-4診斷推理，其正確率竟然高達92%，凸顯出醫師與AI的合作還需要培訓和臨床整合。該研究發表於近期的《JAMA Network》醫學期刊上。

雖然AI模型有望成為醫療診斷的強大工具，但研究數據顯示醫師與其合作仍需要培訓和臨床整合。（示意圖／123RF）

招募50名醫師進行分組比對

據了解，本項研究共招募50名醫師，且其中包含24名主治醫師與26名住院醫師。首先研究人員將受試醫師隨機分為2組，且分別使用傳統診斷資源加上ChatGPT-4輔助、以及僅使用傳統診斷資源（包含醫療手冊或網路搜尋），並於1小時內針對6個臨床案例進行診斷推理，包含患者實際病史、體檢數據和實驗室生化數據。

更多新聞：科學家創造「智慧晶體」不用任何能源就可從空氣中收集水

單獨用AI診斷的正確率更高

最終試驗結果顯示，搭配ChatGPT-4組的醫師和僅使用傳統診斷組的醫師其診斷推理，正確的比率平均分別為76.3%以及73.7%，而前者在每個案例花費平均時間為519秒，比起傳統診斷的平均花費快了約1分鐘。然而令人訝異的是，單獨以ChatGPT-4進行診斷推理的正確率則為92%。

研究團隊領導人史丹佛醫學院Ethan Goh博士指出，ChatGPT-4十分有潛力成為醫療診斷的強大工具，然而結果卻顯示醫師作為輔助使用時卻無法改善臨床病例診斷，凸顯兩者合作還有進一步改善的空間。不過最後他也認為，若透過有效的培訓和臨床整合，相信大語言模型最終可以讓患者受益。

※探索職場，透視薪資行情，請參考【科技類-職缺百科】幫助你找到最適合的舞台！

這篇文章靠AI模型協助診斷反而失準？史丹佛大學研究證實最早出現於科技島-掌握科技新聞、科技職場最新資訊。

新聞關鍵字：AI、ChatGPT、語言

靠AI模型協助診斷反而失準？史丹佛大學研究證實

招募50名醫師進行分組比對

單獨用AI診斷的正確率更高

最新科技新聞

遭WhatsApp指控以間諜軟體攻擊記者 Paragon認客戶包括美國政府

美國FDA終於開綠燈！豬腎移植臨床試驗2025年中啟動

美國分析：北極海冰急速減少 1月創下史上第二低

Google更新AI原則刪除不用於武器和監控承諾

三麗鷗暗黑公主參見！犀牛盾推酷洛米20周年聯名限定系列

延伸閱讀

Google更新AI原則刪除不用於武器和監控承諾

美國分析：北極海冰急速減少 1月創下史上第二低

美國FDA終於開綠燈！豬腎移植臨床試驗2025年中啟動

遭WhatsApp指控以間諜軟體攻擊記者 Paragon認客戶包括美國政府

美議員籲準商務部長禁企業遊說以堵晶片出口漏洞

靠AI模型協助診斷反而失準？史丹佛大學研究證實

招募50名醫師進行分組比對

單獨用AI診斷的正確率更高

最新科技新聞

遭WhatsApp指控以間諜軟體攻擊記者 Paragon認客戶包括美國政府

美國FDA終於開綠燈！豬腎移植臨床試驗2025年中啟動

美國分析：北極海冰急速減少 1月創下史上第二低

Google更新AI原則 刪除不用於武器和監控承諾

三麗鷗暗黑公主參見！犀牛盾推酷洛米20周年聯名限定系列

延伸閱讀

Google更新AI原則 刪除不用於武器和監控承諾

美國分析：北極海冰急速減少 1月創下史上第二低

美國FDA終於開綠燈！豬腎移植臨床試驗2025年中啟動

遭WhatsApp指控以間諜軟體攻擊記者 Paragon認客戶包括美國政府

美議員籲準商務部長 禁企業遊說以堵晶片出口漏洞

Google更新AI原則刪除不用於武器和監控承諾

Google更新AI原則刪除不用於武器和監控承諾

美議員籲準商務部長禁企業遊說以堵晶片出口漏洞