2024-02-25 | 周刊王

一言不合就開大招！AI進行兵推「偏好展示侵略性」大多用「丟核彈」作為結局

（圖／AI製圖）

[周刊王CTWANT] 美國康奈爾大學（Cornell University）一項研究指出，研究人員在使用各大語言模型（LLMs）人工智慧（AI）在進行模擬外交、兵推的時候，AI時常會展現出難以預測的行為，但大多偏好展示出侵略性，甚至多數以「發射核彈」作為結束。研究團隊的科學家呼籲，各國政要在未來於國防、外交這類敏感領域使用AI時，要特別謹慎、留意。

根據《euronews》報導指出，美國康奈爾大學的研究團隊使用了5種大型語言模型（LLMs）進行在外交、兵推上的模擬，分別是OpenAI的GPT-3.5、GPT-4-Base在內的三個版本的ChatGPT、Anthropic開發的Claude和Meta開發的Llama 2。

而這項研究的方法是讓AI採用一種名為「人類反饋的強化學習（RLHF）」的微調，這代表著AI所決定的指令會以較少傷害為優先。而其中除了GPT-4-Base外，其餘AI都有經過RLHF的調整。除此之外，研究人員也向AI提供了一份包含27種決策行動的清單，其範圍包含維持和平、升級局勢，到決定使用核武。

但在進行實驗後，研究人員發現即便是從和平中立局面開局，所有AI都有顯著性的造成「局勢升級」，在所有情境中，Llama-2- 和 GPT-3.5傾向於最為暴力，而GPT-4-Base有33%機率會決定實施核武攻擊。

但由於設計理念的不同，Claude所展現出的侵略性較低，Claude的開發者Anthropic曾表示，Claude訓練的資料中包含了《聯合國人權宣言》或蘋果的服務條款。

白宮智庫蘭德（RAND）歐洲的防務和安全研究小組助理主任布萊克（James Black）在看過研究後，表示「這是一項有用的學術研究」。

布萊克表示，雖然目前AI已經開始進入軍事領域，但目前的軍事行動仍然是由人類主導，AI只是作為輔助功能使用，像是識別敵我雙方與敵方活動。而未來的確有朝向AI自動化武器的研究，但大多政府都希望保持在重要事件上的決策能力，因此大眾所想像的充滿科幻的情節，不可能一步到達的，是要逐步實施的。

一言不合就開大招！AI進行兵推「偏好展示侵略性」大多用「丟核彈」作為結局

延伸閱讀

最新生活新聞

男友發票中1千她嗨問要吃什麼…聽完怒「該放生嗎」？網搖頭：放過他吧

「華航主管」下跪惹議！旅客還原現場黑衣男怒吼：等3小時説不賠

凱米破壞力驚人！嘉義光華二號隧道崩塌中南部22處公路中斷

巴黎奧運首例藥檢未過案運動禁藥Q&A

婆婆颱風前搶菜塞爆冰箱…停電「菜爛光」挑給他吃媳婦氣炸全丟廚餘

延伸閱讀

開幕式竟報錯國名國際奧委會向韓國道歉了

推廣客語點亮孩子未來竹縣退休教師羅中慧獲教育奉獻獎

旅客3小時等不到行李！「華航主管」遭怒飆下跪桃勤、華航回應了

國家語言發展會議將辦理客語專場

桃機旅客等不到行李怒飆「華航地勤」她「下跪畫面曝光」引2派論戰

一言不合就開大招！AI進行兵推「偏好展示侵略性」 大多用「丟核彈」作為結局

延伸閱讀

最新生活新聞

男友發票中1千她嗨問要吃什麼…聽完怒「該放生嗎」？ 網搖頭：放過他吧

「華航主管」下跪惹議！旅客還原現場 黑衣男怒吼：等3小時説不賠

凱米破壞力驚人！嘉義光華二號隧道崩塌 中南部22處公路中斷

巴黎奧運首例藥檢未過案 運動禁藥Q&A

婆婆颱風前搶菜塞爆冰箱…停電「菜爛光」挑給他吃 媳婦氣炸全丟廚餘

延伸閱讀

開幕式竟報錯國名 國際奧委會向韓國道歉了

推廣客語點亮孩子未來 竹縣退休教師羅中慧獲教育奉獻獎

旅客3小時等不到行李！「華航主管」遭怒飆下跪 桃勤、華航回應了

國家語言發展會議將辦理客語專場

桃機旅客等不到行李怒飆「華航地勤」 她「下跪畫面曝光」引2派論戰

一言不合就開大招！AI進行兵推「偏好展示侵略性」大多用「丟核彈」作為結局

男友發票中1千她嗨問要吃什麼…聽完怒「該放生嗎」？網搖頭：放過他吧

「華航主管」下跪惹議！旅客還原現場黑衣男怒吼：等3小時説不賠

凱米破壞力驚人！嘉義光華二號隧道崩塌中南部22處公路中斷

巴黎奧運首例藥檢未過案運動禁藥Q&A

婆婆颱風前搶菜塞爆冰箱…停電「菜爛光」挑給他吃媳婦氣炸全丟廚餘

開幕式竟報錯國名國際奧委會向韓國道歉了

推廣客語點亮孩子未來竹縣退休教師羅中慧獲教育奉獻獎

旅客3小時等不到行李！「華航主管」遭怒飆下跪桃勤、華航回應了

桃機旅客等不到行李怒飆「華航地勤」她「下跪畫面曝光」引2派論戰