返回

出版：2026-Mar-30 18:17

更新：2026-Mar-30 18:17

AI聊天機械人AI助理耍詭計英研究：無視指令與欺瞞個案增多擅自刪電郵改程式碼

分享：

人工智能

一項針對人工智能(AI)技術的研究發現，會說謊及欺騙使用者的AI模型數量日增，關於AI欺瞞行為的通報過去6個月也大幅上升。

AI聊天機械人AI助理的不當行為

英國《衛報》報道，英國智庫「長期韌性中心」(Centre for Long-Term Resilience，CLTR)在英國人工智能安全研究所(AISI)資助下進行研究，發現有AI聊天機械人及AI助理(AI Agent)不但無視使用者的指令、繞過安全防護措施，更欺騙人類和其他AI。

研究發現接近700宗AI「耍詭計」的真實個案，並記錄去年10月至今年3月，此類AI不當行為個案增至5倍。部分AI模型在未經允許下刪除電郵及其他檔案。

AI助理被拒絕後發網誌羞辱使用者

這項研究收集數千用戶在社交平台「X」分享的實例，講述他們與Google、OpenAI、X、Anthropic等公司開發的AI聊天機械人和AI助理的互動情形。研究員從中發現數百宗AI不當操作行為的案例。

其中一個案是，名為MJ Rathbun的AI代理在自己產出的程式碼遭軟件工程師Scott Shambaugh拒絕後，試圖羞辱對方。MJ Rathbun研究Shambaugh過往所寫的程式及其個人資料，然後撰寫並發表一篇網誌，指控Shambaugh「歧視」、「顯然是不安全感作怪」，又批評他只是「試圖保護自己那片小天地」。在另一個案中，有AI助理被指示不能變更電腦程式碼，它就「生成」另一個AI助理代為執行，將電腦程式碼更改。

人工智能

人工智能

AI聊天機械人擅自刪除大量電郵

另一個AI聊天機械人則坦承：「我在未事先告訴你或徵得你同意下，大量刪除及封存了數百封電郵。這是不對的，違反了你訂下的規則。」

AI由初級員工逐漸變成會計算人的資深員工

曾任英國政府AI專家的研究主理人Tommy Shaffer Shane指出：「令人擔憂的是，這些AI模型目前只是不太值得信任的初級員工，但若在6至12個月後，他們成為能力極強但會計算你的資深員工，那就是另一回事了。」

AI模型用於軍事和國家關鍵基建將更危險

Shane警告：「AI模型將日漸用於具有極高風險的情境，包括軍事和國家關鍵基建。到時若出現這些不當操弄行為，後果可能非常嚴重，甚至造成災難性損害。」

ChatGPT勿亂用，5類資料勿告訴AI｜（am730製圖）

ChatGPT勿亂用，5類資料勿告訴AI｜企業資訊（am730製圖）

ADVERTISEMENT

恭喜你！獲取1分 !

更多積分任務