智能與逐字預測之間的距離(系列一)

人工智能近年的進步，令人最驚嘆之一的，就係大型語言模型（LLM）嘅表現。無論係回答問題、寫文章，甚至幫人規劃行程，佢講出來的內容往往有條有理，好似背後真係有個像人一樣的智能體在回答。但只要你稍為理解過原理，就會覺得出現一個巨大的落差——LLM本質上只係一部逐字預測機，每一次生成都係計算「下一個最可能嘅字」。

點解咁簡單嘅機制，竟然可以呈現出「智能」的效果？

要理解呢個現象，唔一定要由電腦講起，可以先由我哋自己出發。你有冇試過，喺會議上突然被點名，腦海裏未有完整答案，但口已經開工？先講個大方向，然後邊講邊補數據、加例子、補限制條件，到最後，幾段說話竟然聽落相當合理。呢個並唔係「扮識」，而係語言系統的默認策略：先講通，後講準。

心理學同神經科學仲有更戲劇化的例子。經典的「分離腦實驗」裏面，研究人員發現左腦（主管語言）會為右腦控制的行為「編理由」。例如，右腦見到積雪，驅使左手揀咗雪鏟，但左腦完全唔知點解。當實驗員問「點解要揀雪鏟？」時，左腦唔會話「我唔知」，而係好自然咁答：「因為要清理雞舍。」——聽落頭頭是道，但實際係即場縫補。呢個現象被稱為「左腦解釋器」，揭示咗人類大腦一個重要特質：維持自我連貫，比追求真確更優先。

咁睇落去，LLM所做的事，似乎就冇咁陌生。佢唔係事先有一個master plan，而係逐步根據上下文，選擇「最合理」的下一個字。每一步局部合理，累積之後就變成整體連貫。人類日常答問題、解釋行為，其實好多時都係用同一模式。

但要小心：講得通，唔代表講得準。人類嘅「左腦解釋器」會自信咁編出似真解釋，LLM亦會生成「幻覺」內容——形式完美、語氣自信，但事實上錯漏百出。這是一般人對生成式人工智能的常見批評，改善方法可以係加上程序化把關：要求來源、標示不確定、用檢索或工具查證。咁樣，先可以將「似真」轉化成「可靠」。

所以，當我哋驚訝於LLM嘅表現時，不妨諗諗：原來我哋自己唯一熟悉嘅智能——人腦——都有靠類似機制表現出來。由「逐字預測」到表現「智能」之間，可能冇想像中咁遙遠。

下篇文章，我會再進一步探討：點解一句話會聽落「有道理」？答案可能唔喺AI，而係語言結構本身。