臺北市
19°
( 20° / 17° )
氣象
2024-11-22 | 科技島

靠AI模型協助診斷反而失準?史丹佛大學研究證實



靠AI模型協助診斷反而失準?史丹佛大學研究證實


史丹佛大學醫學院的研究發現,單獨使用ChatGPT-4診斷推理,其正確率竟然高達92%,凸顯出醫師與AI的合作還需要培訓和臨床整合。


記者/劉閔




日前來自史丹佛大學醫學院的研究發現,醫師若透過大語言模型ChatGPT-4輔助進行診斷的正確率為76.3%,而這結果與使用傳統診斷方法的正確率73.7%相差不多。不過,單獨使用ChatGPT-4診斷推理,其正確率竟然高達92%,凸顯出醫師與AI的合作還需要培訓和臨床整合。該研究發表於近期的《JAMA Network》醫學期刊上。





靠AI模型協助診斷反而失準?史丹佛大學研究證實
雖然AI模型有望成為醫療診斷的強大工具,但研究數據顯示醫師與其合作仍需要培訓和臨床整合。(示意圖/123RF)



招募50名醫師進行分組比對




據了解,本項研究共招募50名醫師,且其中包含24名主治醫師與26名住院醫師。首先研究人員將受試醫師隨機分為2組,且分別使用傳統診斷資源加上ChatGPT-4輔助、以及僅使用傳統診斷資源(包含醫療手冊或網路搜尋),並於1小時內針對6個臨床案例進行診斷推理,包含患者實際病史、體檢數據和實驗室生化數據。




更多新聞:科學家創造「智慧晶體」 不用任何能源就可從空氣中收集水




單獨用AI診斷的正確率更高




最終試驗結果顯示,搭配ChatGPT-4組的醫師和僅使用傳統診斷組的醫師其診斷推理,正確的比率平均分別為76.3%以及73.7%,而前者在每個案例花費平均時間為519秒,比起傳統診斷的平均花費快了約1分鐘。然而令人訝異的是,單獨以ChatGPT-4進行診斷推理的正確率則為92%。




研究團隊領導人史丹佛醫學院Ethan Goh博士指出,ChatGPT-4十分有潛力成為醫療診斷的強大工具,然而結果卻顯示醫師作為輔助使用時卻無法改善臨床病例診斷,凸顯兩者合作還有進一步改善的空間。不過最後他也認為,若透過有效的培訓和臨床整合,相信大語言模型最終可以讓患者受益。




※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!



這篇文章 靠AI模型協助診斷反而失準?史丹佛大學研究證實 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀