Ad Block Ad Block
新聞
2022-01-07 22:00:00

誰是「王力巨集」?討論簡繁轉換的幾個問題

分享:

最近在網絡看到一則文章,標題是這樣寫的:「王力巨集早在2016年已經離婚」誰是「王力巨集」?相信大家都猜到了,那是王力宏。因為簡繁轉換出錯,「王力宏」被誤作「王力巨集」。

要了解錯誤轉譯的原因, 得從簡繁轉換工具的方法說起。目前很多轉譯工具是以一對一形式轉換簡繁漢字。如果一個簡化字有幾個意思,繁簡轉換的時候很容易出錯。例如簡化字「宏」一詞在內地是一種電腦程序的指令, 不過內地的「宏」指令,台灣則翻譯成「巨集」。由於許多翻譯工具無法分辨「宏」在句子中的內容是什麼,遇到簡化字網頁中有「宏」這個字就會自動換成了「巨集」,這樣一來,「王力宏」的名字就被錯誤理解為「王力巨集」了。

工具無法轉換出正確的繁體字

網上簡繁轉換工具以一對一形式操作,但實際上部分簡化字可以對應多個繁體字,例如「干」可以對應繁體字「干」(如「干涉」)、「乾」(如「乾燥」)和「幹」(如「幹部」)。然而「乾」一字也代表着八卦中的其中一卦,這個時候不使用「干」字,即不能寫作「干坤」(應為「乾坤」)。現有的簡繁轉換工具,能把簡化字換成正確的繁體字嗎?

十年前或不行,十年後的今天問題已得到緩解。大機構如微軟、谷歌等把常用的繁簡詞語表加入它們的數據庫中,因此我們用它們的等軟件做簡繁轉譯的時候,即使「发」可轉為繁體字「發」或「髮」,系統也是可以正確做出識別,把「剪发」轉為「剪髮」,「天后」也不會誤譯為「天後」(見例一)。

例一       

1. 我去了天后廟。(繁體)

2. 我去了天后庙。(把(1)轉為簡體)

3. 我去了天后廟。(把(2)轉繁體)

例二

4. 我上面穿紅色的襯衫,下面穿綠色的褲子。(繁體)

5. 我上面穿红色的衬衫,下面穿红色的裤子。(把(4)轉為簡體)

6. 我上面穿紅色的襯衫,下面穿紅色的褲子。 (把(5)轉為繁體)

例三       

7. 這次下麵時我了用這個調味。(繁體)

8. 这次下面时我了用这个调味。(把(7)轉為簡體)

9. 這次下面時我了用這個調味。(把(8)轉為繁體)

 

不過,問題其實還沒有未完全解決。我們再以MS Word的簡繁轉譯工具做一個測試:例二的句子由繁到簡,由簡再轉繁,「面」一字都沒有改變。但是在例三,句子由簡轉繁的時候(即句(9)),系統無法把「下面」正確轉為「下麵」。這意味着由簡化字寫成的文章轉為繁體字時或者會有出錯。

Ad Block

由繁體字轉簡體字,換到的未必是規範字

上面提過由簡繁轉換時,因為電腦無法按句子的意思,簡繁轉譯過程中可能會選了不對的字。反過來說,繁簡轉譯的時候也可能有問題。

我們先說說簡化字出現的背景:「簡化字」是指中共成立後進行漢字改革所定下的標準化用字,又叫做「規範字」。五十年代毛澤東提倡改革漢字,他主張放棄使用漢字,改為使用漢語拼音。然而漢字拼音化的方向並不能立即在國內推行,於是政府又提出漢字簡化方案,以應付社會的需求。在多次改革方案中,簡化字字型不斷修改,至1986年才逐漸穩定下來,成為今天的規範字。

Ad Block

然而電腦所收錄的漢字並不一定符合規範。舉個例子,「美麗」的簡化字應寫作「美丽」,但部分的字款卻把「丽」字寫作「丽」(上部件應只有一條橫線並非兩條)。因此我們做文書處理前自己要先留意清楚,避免出現誤會。

結束語

有關簡繁轉換涉及的具體問題還很多,除了簡體字有時無法轉換正確的繁體字之外,還有編碼的問題,內地流行的簡體中文使用GB碼或unicode,而香港則使用BIG5碼,如果軟件無支援這兩種編碼,文件就無法正常打開,甚至出現亂碼。期待在不遠的將來能夠徹底解決簡繁轉換問題,從而促進內地與香港信息交流。

Ad Block
請接受以下私隱政策及免責聲明,以示你同意am730內之私隱政策及免責聲明。了解更多
接受