AI竟然也會變老嗎?最新研究揭示:舊型AI認知出現衰退
隨著時間推移,人工智慧(AI)技術可能也會出現認知衰退,並和人類大腦一樣「老化」。《英國醫學期刊》(BMJ)發表了一項研究,對AI在醫療診斷領域的可靠性提出質疑。
隨著時間推移,人工智慧(AI)技術可能也會出現認知衰退,並和人類大腦一樣「老化」。《英國醫學期刊》(BMJ)發表了一項研究,對AI在醫療診斷領域的可靠性提出質疑。該研究警告,儘管AI工具因其高速分析醫療數據的能力備受推崇,但其長期穩定性可能不如預期。
[caption id="attachment_164875" align="alignnone" width="1200"]
AI工具因其高速分析醫療數據的能力備受推崇,但其長期穩定性可能不如預期。(示意圖/123RF)[/caption]
AI模型認知衰退與人類大腦相似
據報導,該研究評估了數個領先的大型語言模型(LLM),包括OpenAI的ChatGPT 4和4o、Anthropic的Claude 3.5(Sonnet)以及Alphabet的Gemini 1.0和1.5版本,並使用蒙特婁認知評估測試(MoCA)來測試其認知能力,測試範圍涵蓋注意力、記憶、語言、空間推理與執行功能等關鍵領域。
研究發現,像人類參與者一樣,較舊版本的LLM在認知測試中的表現較差,顯示出與神經退行性疾病類似的「認知衰退」現象。
更多新聞:模仿人類大腦運算新時代 韓國開發自主糾錯、學習神經晶片
MoCA測試:衡量AI的認知能力
MoCA測試原本用於檢測老年人的認知障礙和早期癡呆症,研究人員將此測試調整後,用來評估AI在注意力、記憶、語言、空間技能及執行功能等領域的表現。在MoCA測試中,26分(滿分30分)被視為正常認知範圍。
MoCA測試結果顯示,ChatGPT 4o達到了26分,ChatGPT 4與Sonnet獲得25分,而Gemini 1.0的表現則遠低於標準,只獲得16分。其中,在專注力測試中,研究團隊調整測試方法,要求AI辨識特定字母,但部分AI表現仍不理想。
AI在視覺空間和執行功能上不佳
研究指出,所有參與測試的AI聊天機器人,都在視覺空間技能和執行功能任務中表現不佳,尤其是在「數字字母連線測試」和「畫時鐘測試」中。研究人員還發現,Gemini 1.0未能完成延遲回憶任務,即記住五個單詞的順序,這表明其認知功能明顯不足。
該研究結果挑戰了AI將取代人類醫生的普遍看法。儘管AI能快速處理大量醫療數據,但其在認知測試中的表現表明,使AI仍無法取代醫生的角色,尤其是在醫療診斷方面,患者的信任也可能因此受到影響。
AI應輔助而非取代 定期更新非常重要
研究建議,AI應被視為輔助工具,而非人類醫生的替代品。雖然AI能迅速處理大量數據,但診斷結果仍需仰賴人類專業知識進行解讀。此外,研究強調,AI模型需要持續更新與再訓練,以確保其在醫療領域的可靠性與準確性。
參考資料:firstpost、business-standard
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
這篇文章 AI竟然也會變老嗎?最新研究揭示:舊型AI認知出現衰退 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
-
《Hit AI & Blockchain》立法委員黃珊珊:台灣很努力要往前走,但法律沒辦法跟上科技的進步
(3 小時前) -
《Hit AI & Blockchain》台灣加密貨幣交易所HOYA BIT 創辦人暨董事長 彭云嫻:RWA身為WEB 3新金融的一份子,有助於提升資產市場流動性
(4 小時前) -
NASA重要官員相繼去職 美登月計畫增添不確定性
(4 小時前) -
《Hit AI & Blockchain》美國安卓樂資本(Andra Capital)董事長林家振:與其只討論DeepSeek,不如向全球AI最強獨角獸學習邁向世界頂尖
(4 小時前)
延伸閱讀
-
NASA重要官員相繼去職 美登月計畫增添不確定性
(4 小時前) -
《Hit AI & Blockchain》立法委員黃珊珊:台灣很努力要往前走,但法律沒辦法跟上科技的進步
(3 小時前) -
《Hit AI & Blockchain》台灣加密貨幣交易所HOYA BIT 創辦人暨董事長 彭云嫻:RWA身為WEB 3新金融的一份子,有助於提升資產市場流動性
(4 小時前) -
《Hit AI & Blockchain》美國安卓樂資本(Andra Capital)董事長林家振:與其只討論DeepSeek,不如向全球AI最強獨角獸學習邁向世界頂尖
(4 小時前) -
統一資訊首度成立企業加速器,攜手領濤公司招募新創團隊以 AI 主題打造企業生態系,創造企業、新創與產業三贏!
(3 小時前)