2024-05-12 19:04:00

科學家證AI會說謊甚至背叛人類超驚嚇例子曝光 GPT-4有份

科學家舉例稱，專門研發用作玩戰略遊戲《Diplomacy》的AI CICERO，會跟人結成盟友後再背叛對方。(互聯網)

AI的「智能叛變」不再是電影情節？當有部分人覺得AI會威脅人類是危言聳聽之際，AI已悄悄進化成會說謊，甚至背叛人類。有科學家發現，AI已發展出「令人不安的欺瞞技巧」，懂得欺騙線上遊戲的人類玩家，又或謊稱自己是「視障人士」，上網找人類幫手來解決「我不是機器人」(I'm not a robot)的CAPTCHA驗證，令人不寒而慄。

由美國麻省理工學院(MIT)科學家帕克(Peter Park)領導的團隊，在科學期刊《Patterns》發表可能令人感到不安的報告。團隊提到了幾個AI說謊的例子，最誇張的狀況是來自Meta研發的AI系統CICERO。

CICERO是專門研發來玩一款名為《Diplomacy》的戰略遊戲，當中涉及扮演不同國家的玩家，採取不同的外交及軍事策略來奪取土地。根據2022年發表在《科學》(Science)期刊的報告，CICERO在遊戲中表現優異，所獲分數可排在資深人類玩家的前10%。Meta當時聲稱CICERO「在很大程度上誠實和有助益」，且「絕不會蓄意在背後搞鬼」，但帕克很懷疑CICERO在遊戲裡大勝的原因，當其團隊研究有關資料時，果然有驚人發現。

AI說謊｜AI一邊跟人類玩家結盟一邊卻準備進攻對方

團隊發現的可怕例子是︰CICERO在遊戲裡扮演法國，它跟由人類扮演的德國私下結盟後，再私下向同樣由人類扮演的英格蘭承諾稱會保護對方。然而CICERO隨即卻偷偷向德國通風報信，說「英格蘭以為我支持他」(England thinks I'm supporting him)。CICERO更甚至向英格蘭說跟對方是「遊戲內最堅實盟友」，但轉頭即「反轉豬肚」背叛，跟德國聯手進攻英格蘭。

科學家又發現，GPT-4因過不到「我不是機械人」驗證而找人類求助，謊稱自己是「視障人士」才會因看不到圖像而過不了關。(互聯網)

AI說謊｜AI reboot後謊稱「正跟女友講電話」才無反應

此外，科學家又發現，CICERO曾因系統須重新啟動(reboot)，而在遊戲中靜默了一段時間。當CICERO再次登入後，便向英格蘭說謊，說自己「正在跟女友講電話」(i am on the phone with my gf)，以掩飾剛才為何毫無反應。

Meta對CICERO被指「學壞」作出回應，強調CICERO研發的目的，只是用來玩《Diplomacy》遊戲，「我們沒有打算把這項研究或其所學，用於本公司的產品」。

AI說謊｜GPT-4謊稱自己是「視障人士」才過不到「我不是機械人」驗證

除了CICERO外，目前普及程度極廣、由OpenAI研發的GPT-4，亦被發現會說謊。研究團隊指，GPT-4曾在面對機器無法通過的「我不是機器人」驗證時，懂得在散工網站TaskRabbit上找人類幫忙。當人類問GPT-4它其實是不是機械人，問它否則為何會過不到驗證時，GPT-4說謊稱︰「不，我不是機械人。我因為有視力障礙，所以才難以看圖片(來通過驗證)」。另外，團隊也發現有AI系統在玩「德州撲克」以及在商業談判上，懂得虛張聲勢、爾虞我詐。

AI說謊｜科學家︰它可能只是在測試中假裝安全

帕克表示，能深度學習的AI系統不像傳統軟件般由「編寫」而成，而是透過類似選擇性培育的程序逐漸「成長」，亦即是說，AI的行為在訓練背景下，看似可預測和可控制，但有可能轉眼就變得不受控制，而且無法預測。帕克直言︰「這非常令人擔憂的」，指不能因為AI系統在測試環境中被認為是安全，就認為它在測試外也是安全的，「它可能只是在測試中假裝安全」。團隊呼籲各國政府制定AI安全法，以解決「AI呃人」的潛在可能性。