生活
2025-08-29 04:30:18
日報

智能與逐字預測之間的距離(系列一)

分享:
智能與逐字預測之間的距離(系列一)

智能與逐字預測之間的距離(系列一)

人工智能近年的進步,令人最驚嘆之一的,就係大型語言模型(LLM)嘅表現。無論係回答問題、寫文章,甚至幫人規劃行程,佢講出來的內容往往有條有理,好似背後真係有個像人一樣的智能體在回答。但只要你稍為理解過原理,就會覺得出現一個巨大的落差——LLM本質上只係一部逐字預測機,每一次生成都係計算「下一個最可能嘅字」。

點解咁簡單嘅機制,竟然可以呈現出「智能」的效果?

要理解呢個現象,唔一定要由電腦講起,可以先由我哋自己出發。你有冇試過,喺會議上突然被點名,腦海裏未有完整答案,但口已經開工?先講個大方向,然後邊講邊補數據、加例子、補限制條件,到最後,幾段說話竟然聽落相當合理。呢個並唔係「扮識」,而係語言系統的默認策略:先講通,後講準。

心理學同神經科學仲有更戲劇化的例子。經典的「分離腦實驗」裏面,研究人員發現左腦(主管語言)會為右腦控制的行為「編理由」。例如,右腦見到積雪,驅使左手揀咗雪鏟,但左腦完全唔知點解。當實驗員問「點解要揀雪鏟?」時,左腦唔會話「我唔知」,而係好自然咁答:「因為要清理雞舍。」——聽落頭頭是道,但實際係即場縫補。呢個現象被稱為「左腦解釋器」,揭示咗人類大腦一個重要特質:維持自我連貫,比追求真確更優先。

咁睇落去,LLM所做的事,似乎就冇咁陌生。佢唔係事先有一個master plan,而係逐步根據上下文,選擇「最合理」的下一個字。每一步局部合理,累積之後就變成整體連貫。人類日常答問題、解釋行為,其實好多時都係用同一模式。

adblk6

但要小心:講得通,唔代表講得準。人類嘅「左腦解釋器」會自信咁編出似真解釋,LLM亦會生成「幻覺」內容——形式完美、語氣自信,但事實上錯漏百出。這是一般人對生成式人工智能的常見批評,改善方法可以係加上程序化把關:要求來源、標示不確定、用檢索或工具查證。咁樣,先可以將「似真」轉化成「可靠」。

所以,當我哋驚訝於LLM嘅表現時,不妨諗諗:原來我哋自己唯一熟悉嘅智能——人腦——都有靠類似機制表現出來。由「逐字預測」到表現「智能」之間,可能冇想像中咁遙遠。

下篇文章,我會再進一步探討:點解一句話會聽落「有道理」?答案可能唔喺AI,而係語言結構本身。