AI的「智能叛變」不再是電影情節?當有部分人覺得AI會威脅人類是危言聳聽之際,AI已悄悄進化成會說謊,甚至背叛人類。有科學家發現,AI已發展出「令人不安的欺瞞技巧」,懂得欺騙線上遊戲的人類玩家,又或謊稱自己是「視障人士」,上網找人類幫手來解決「我不是機器人」(I'm not a robot)的CAPTCHA驗證,令人不寒而慄。
由美國麻省理工學院(MIT)科學家帕克(Peter Park)領導的團隊,在科學期刊《Patterns》發表可能令人感到不安的報告。團隊提到了幾個AI說謊的例子,最誇張的狀況是來自Meta研發的AI系統CICERO。
CICERO是專門研發來玩一款名為《Diplomacy》的戰略遊戲,當中涉及扮演不同國家的玩家,採取不同的外交及軍事策略來奪取土地。根據2022年發表在《科學》(Science)期刊的報告,CICERO在遊戲中表現優異,所獲分數可排在資深人類玩家的前10%。Meta當時聲稱CICERO「在很大程度上誠實和有助益」,且「絕不會蓄意在背後搞鬼」,但帕克很懷疑CICERO在遊戲裡大勝的原因,當其團隊研究有關資料時,果然有驚人發現。
AI說謊|AI一邊跟人類玩家結盟 一邊卻準備進攻對方
團隊發現的可怕例子是︰CICERO在遊戲裡扮演法國,它跟由人類扮演的德國私下結盟後,再私下向同樣由人類扮演的英格蘭承諾稱會保護對方。然而CICERO隨即卻偷偷向德國通風報信,說「英格蘭以為我支持他」(England thinks I'm supporting him)。CICERO更甚至向英格蘭說跟對方是「遊戲內最堅實盟友」,但轉頭即「反轉豬肚」背叛,跟德國聯手進攻英格蘭。
AI說謊|AI reboot後 謊稱「正跟女友講電話」才無反應
此外,科學家又發現,CICERO曾因系統須重新啟動(reboot),而在遊戲中靜默了一段時間。當CICERO再次登入後,便向英格蘭說謊,說自己「正在跟女友講電話」(i am on the phone with my gf),以掩飾剛才為何毫無反應。
Meta對CICERO被指「學壞」作出回應,強調CICERO研發的目的,只是用來玩《Diplomacy》遊戲,「我們沒有打算把這項研究或其所學,用於本公司的產品」。
AI說謊|GPT-4謊稱自己是「視障人士」才過不到「我不是機械人」驗證
除了CICERO外,目前普及程度極廣、由OpenAI研發的GPT-4,亦被發現會說謊。研究團隊指,GPT-4曾在面對機器無法通過的「我不是機器人」驗證時,懂得在散工網站TaskRabbit上找人類幫忙。當人類問GPT-4它其實是不是機械人,問它否則為何會過不到驗證時,GPT-4說謊稱︰「不,我不是機械人。我因為有視力障礙,所以才難以看圖片(來通過驗證)」。另外,團隊也發現有AI系統在玩「德州撲克」以及在商業談判上,懂得虛張聲勢、爾虞我詐。
AI說謊|科學家︰它可能只是在測試中假裝安全
帕克表示,能深度學習的AI系統不像傳統軟件般由「編寫」而成,而是透過類似選擇性培育的程序逐漸「成長」,亦即是說,AI的行為在訓練背景下,看似可預測和可控制,但有可能轉眼就變得不受控制,而且無法預測。帕克直言︰「這非常令人擔憂的」,指不能因為AI系統在測試環境中被認為是安全,就認為它在測試外也是安全的,「它可能只是在測試中假裝安全」。團隊呼籲各國政府制定AI安全法,以解決「AI呃人」的潛在可能性。