生活
2025-09-12 04:30:21
日報

語言結構與「似真」的秘密(系列二)

分享:
語言結構與「似真」的秘密(系列二)

語言結構與「似真」的秘密(系列二)

上篇我講到,LLM雖然只係逐字預測,但已經能砌出「似聰明」嘅答案。好多讀者聽到會直覺抗拒,覺得咁樣太簡化。其實,呢種「似真」效果,關鍵喺語言本身的結構。只要語言嘅規則同世界有強烈關聯,逐字生成就自然會顯得有智慧。

點解一句話會「聽落似真」?

語言哲學家維根斯坦曾經指出,語言之所以有意義,係因為佢反映或者規範咗我哋同世界互動的方式。早期嘅維根斯坦(《邏輯哲學論》)認為語言同世界共享邏輯形式,一個正確構造的句子,就可以描畫可能存在的世界。後期的維根斯坦(《哲學研究》、《論確定性》)則轉向語用角度:語言文法唔係世界的鏡子,而係規則,植根於我哋的生活形式,規範咗咩算作「有意義」。換句話講,只要一句說話合乎文法同語境,就會自然被我哋視為「合理」。

一個經典例子係語言學家Chomsky提出嘅句子:Colorless green ideas sleep furiously. 文法完美,但語義荒謬。即使內容完全無意義,你仍然覺得「佢好似一句說話」。呢就係文法帶來的力量:結構本身已經足以產生「似真」的外觀。

由呢個角度去睇LLM,就會更易明。LLM學習咗大量語言數據,裏面包含咗語法規律、慣用搭配、論證模式、甚至社會文化習慣。當佢逐字生成時,其實就係沿住呢啲「語言軌道」行走。每一步選擇都合乎規則,最後疊出來嘅結果自然「講得通」,好似真係有深思熟慮過一樣。

adblk6

但我哋要小心分清楚:「似真」唔等於「真」。文法正確的句子可以無意義,連貫的段落可以錯得有說服力。人腦嘅「左腦解釋器」會咁做,LLM亦一樣。兩者嘅共通點,係語言結構本身賦予咗「聽落合理」的假象。

呢度有個有趣嘅問題:如果語言文法已經蘊含世界的規律,而LLM又能熟練掌握並運用呢套規則,咁佢逐字生成嘅「似真」,到底同我哋日常所謂的「理解」有幾大分別?

我冇打算喺度俾一個最終答案,但可以肯定嘅係:語言結構本身就係智能表現的一部分。我哋之所以會覺得LLM咁「似懂」,係因為語言早已承載住世界的秩序。

下次你再見到AI講得頭頭是道時,不妨諗下:究竟係因為佢真係「懂咗」,定係因為語言嘅規則本身,已經令任何合乎文法的句子都「似懂」?