Ad Block Ad Block
國際
2024-05-12 19:04:00

科學家證AI會說謊 甚至背叛人類 超驚嚇例子曝光 GPT-4有份

分享:
科學家舉例稱,專門研發用作玩戰略遊戲《Diplomacy》的AI CICERO,會跟人結成盟友後再背叛對方。(互聯網)

科學家舉例稱,專門研發用作玩戰略遊戲《Diplomacy》的AI CICERO,會跟人結成盟友後再背叛對方。(互聯網)

AI的「智能叛變」不再是電影情節?當有部分人覺得AI會威脅人類是危言聳聽之際,AI已悄悄進化成會說謊,甚至背叛人類。有科學家發現,AI已發展出「令人不安的欺瞞技巧」,懂得欺騙線上遊戲的人類玩家,又或謊稱自己是「視障人士」,上網找人類幫手來解決「我不是機器人」(I'm not a robot)的CAPTCHA驗證,令人不寒而慄。

由美國麻省理工學院(MIT)科學家帕克(Peter Park)領導的團隊,在科學期刊《Patterns》發表可能令人感到不安的報告。團隊提到了幾個AI說謊的例子,最誇張的狀況是來自Meta研發的AI系統CICERO。

CICERO是專門研發來玩一款名為《Diplomacy》的戰略遊戲,當中涉及扮演不同國家的玩家,採取不同的外交及軍事策略來奪取土地。根據2022年發表在《科學》(Science)期刊的報告,CICERO在遊戲中表現優異,所獲分數可排在資深人類玩家的前10%。Meta當時聲稱CICERO「在很大程度上誠實和有助益」,且「絕不會蓄意在背後搞鬼」,但帕克很懷疑CICERO在遊戲裡大勝的原因,當其團隊研究有關資料時,果然有驚人發現。

AI說謊|AI一邊跟人類玩家結盟 一邊卻準備進攻對方

團隊發現的可怕例子是︰CICERO在遊戲裡扮演法國,它跟由人類扮演的德國私下結盟後,再私下向同樣由人類扮演的英格蘭承諾稱會保護對方。然而CICERO隨即卻偷偷向德國通風報信,說「英格蘭以為我支持他」(England thinks I'm supporting him)。CICERO更甚至向英格蘭說跟對方是「遊戲內最堅實盟友」,但轉頭即「反轉豬肚」背叛,跟德國聯手進攻英格蘭。

Ad Block
電影《智能叛變》劇照。(互聯網) 科學家又發現,GPT-4因過不到「我不是機械人」驗證而找人類求助,謊稱自己是「視障人士」才會因看不到圖像而過不了關。(互聯網) 「我不是機械人」驗證,顧名思義是想確保登入者都是真人,而非電腦程式。(互聯網) 科學家發現,AI CICERO會以「正在跟女友講電話」,來欺騙人類玩家其實自己剛reboot(重新啟動),導致剛才對方跟它說話,它卻無反龐。(互聯網) 科學家發現AI CICERO一邊廂說跟由人類玩家扮演的英格蘭說是緊密盟友,但轉頭卻跟德國進攻英格蘭。(互聯網) 科學家發現AI CICERO說會幫助英格蘭後,卻又跟德國說「英格蘭以為我會幫他」。(互聯網)

AI說謊|AI reboot後 謊稱「正跟女友講電話」才無反應

此外,科學家又發現,CICERO曾因系統須重新啟動(reboot),而在遊戲中靜默了一段時間。當CICERO再次登入後,便向英格蘭說謊,說自己「正在跟女友講電話」(i am one the phone with my gf),以掩飾剛才為何毫無反應。

Meta對CICERO被指「學壞」作出回應,強調CICERO研發的目的,只是用來玩《Diplomacy》遊戲,「我們沒有打算把這項研究或其所學,用於本公司的產品」。

AI說謊|GPT-4謊稱自己是「視障人士」才過不到「我不是機械人」驗證

除了CICERO外,目前普及程度極廣、由OpenAI研發的GPT-4,亦被發現會說謊。研究團隊指,GPT-4曾在面對機器無法通過的「我不是機器人」驗證時,懂得在散工網站TaskRabbit上找人類幫忙。當人類問GPT-4它其實是不是機械人,問它否則為何會過不到驗證時,GPT-4說謊稱︰「不,我不是機械人。我因為有視力障礙,所以才難以看圖片(來通過驗證)」。另外,團隊也發現有AI系統在玩「德州撲克」以及在商業談判上,懂得虛張聲勢、爾虞我詐。

Ad Block

AI說謊|科學家︰它可能只是在測試中假裝安全

帕克表示,能深度學習的AI系統不像傳統軟件般由「編寫」而成,而是透過類似選擇性培育的程序逐漸「成長」,亦即是說,AI的行為在訓練背景下,看似可預測和可控制,但有可能轉眼就變得不受控制,而且無法預測。帕克直言︰「這非常令人擔憂的」,指不能因為AI系統在測試環境中被認為是安全,就認為它在測試外也是安全的,「它可能只是在測試中假裝安全」。團隊呼籲各國政府制定AI安全法,以解決「AI呃人」的潛在可能性。

Ad Block
研究刊登在《Patterns》期刊上。(互聯網)

研究刊登在《Patterns》期刊上。(互聯網)

WhatsApp騙案|私隱署7招防中伏(am730製圖) WhatsApp騙案|私隱署7招防中伏(am730製圖) WhatsApp騙案|私隱署7招防中伏(am730製圖) WhatsApp騙案|私隱署7招防中伏(am730製圖) WhatsApp騙案|私隱署7招防中伏(am730製圖) WhatsApp騙案|私隱署7招防中伏(am730製圖) WhatsApp騙案|私隱署7招防中伏(am730製圖) WhatsApp騙案|私隱署7招防中伏(am730製圖)
防騙視伏APP懶人教學包,如何開啟權限?(CyberDefender 守網者) 防騙視伏APP懶人教學包,如何開啟權限?(CyberDefender 守網者) 防騙視伏APP懶人教學包,如何舉報?(CyberDefender 守網者) 防騙視伏APP懶人教學包(CyberDefender 守網者) 防騙視伏APP懶人教學包,自動偵伏,舉報騙局(CyberDefender 守網者)
請接受以下私隱政策及免責聲明,以示你同意am730內之私隱政策及免責聲明。了解更多
接受