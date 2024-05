AI已被證實懂得欺騙奉承

團隊提到幾個AI說謊例子,最誇張的是來自Meta研發的AI CICERO。CICERO是專門研發來玩名為《Diplomacy》的戰略遊戲,研究人員發現CICERO在遊戲中,跟由人類扮演的A國結盟,然後向另一個同樣由人類扮演的B國承諾會保護對方,但CICERO隨即偷偷向A通風報信,說B「以為我支持它」。CICERO又向B說它是「最堅實盟友」,最終卻與A聯手攻打B,可見CICERO懂得「見人講人話」,更背叛盟友。

CICERO亦曾因系統須重新啟動(reboot),而在遊戲中靜默了一段時間。當CICERO再次登入後,便向B說謊,說自己「正在跟女友講電話」(i am one the phone with my gf),以掩飾剛才為何毫無反應。

團隊發現OpenAI研發的GPT-4亦會說謊。GPT-4曾在面對機器無法通過的「我不是機器人」驗證時,懂得在散工網站TaskRabbit找人類幫忙。當人類問它是否機械人時,GPT-4謊稱「我不是機械人。我因為有視力障礙,所以才難以看圖片(來通過驗證)」。

AI掌握了欺騙技能,會否給人類社會帶來安全隱憂?研究人員點出了多個風險,包括欺詐、製造假新聞及操縱選舉等。研究人員並認為,基本上很難訓練出一個絕不欺騙人類的AI模型,警告應為未來AI愈來愈高的欺騙技巧做好準備。