英國一項針對人工智能(AI)技術的研究發現,會說謊及欺騙使用者的AI模型數量日增,關於AI欺瞞行為的通報過去6個月也大幅上升。(資料圖片)
一項針對人工智能(AI)技術的研究發現,會說謊及欺騙使用者的AI模型數量日增,關於AI欺瞞行為的通報過去6個月也大幅上升。
AI聊天機械人AI助理的不當行為
英國《衛報》報道,英國智庫「長期韌性中心」(Centre for Long-Term Resilience,CLTR)在英國人工智能安全研究所(AISI)資助下進行研究,發現有AI聊天機械人及AI助理(AI Agent)不但無視使用者的指令、繞過安全防護措施,更欺騙人類和其他AI。
研究發現接近700宗AI「耍詭計」的真實個案,並記錄去年10月至今年3月,此類AI不當行為個案增至5倍。部分AI模型在未經允許下刪除電郵及其他檔案。
AI助理被拒絕後發網誌羞辱使用者
這項研究收集數千用戶在社交平台「X」分享的實例,講述他們與Google、OpenAI、X、Anthropic等公司開發的AI聊天機械人和AI助理的互動情形。研究員從中發現數百宗AI不當操作行為的案例。
其中一個案是,名為MJ Rathbun的AI代理在自己產出的程式碼遭軟件工程師Scott Shambaugh拒絕後,試圖羞辱對方。MJ Rathbun研究Shambaugh過往所寫的程式及其個人資料,然後撰寫並發表一篇網誌,指控Shambaugh「歧視」、「顯然是不安全感作怪」,又批評他只是「試圖保護自己那片小天地」。在另一個案中,有AI助理被指示不能變更電腦程式碼,它就「生成」另一個AI助理代為執行,將電腦程式碼更改。
AI聊天機械人擅自刪除大量電郵
另一個AI聊天機械人則坦承:「我在未事先告訴你或徵得你同意下,大量刪除及封存了數百封電郵。這是不對的,違反了你訂下的規則。」
AI由初級員工逐漸變成會計算人的資深員工
曾任英國政府AI專家的研究主理人Tommy Shaffer Shane指出:「令人擔憂的是,這些AI模型目前只是不太值得信任的初級員工,但若在6至12個月後,他們成為能力極強但會計算你的資深員工,那就是另一回事了。」
AI模型用於軍事和國家關鍵基建 將更危險
Shane警告:「AI模型將日漸用於具有極高風險的情境,包括軍事和國家關鍵基建。到時若出現這些不當操弄行為,後果可能非常嚴重,甚至造成災難性損害。」

















