如何當稱職的支語警察?
簡介
PTT 上常有支語警察
也常發現 Google 翻譯的中文常常會翻譯成中國慣用語(可以參考 Google 翻譯修好了沒?)
所以就寫了一個支語警察的網站:支語警察
流程
- 文章分詞
- 標出非台灣習慣用語
- 從資料庫尋找對應的用語
- 若無對應用語則尋找其解釋
資料庫
基本上都是使用現有的詞典,其資料都是人工更新的,目前還沒有自動辨識習慣用語的方法。
- 萌典
- 從萌典的兩岸字典獲取用語中台灣和中國的意思不同者(同字不同義,同義不同字)
- 開放中文轉換 OpenCC
- 支援詞彙的轉換、異體字轉換和地區習慣用語及字體轉換(中國大陸、臺灣、香港、日本)。
- 使用詞典對應的方式實作,像是簡體轉台灣繁體就使用此詞典搭配習慣用語詞典
實作
- Google Trends
- 使用台灣的搜尋趨勢比較原本用語及對應的外來用語
困難
- 資料庫通常沒有收錄網路流行語
- 同詞不同義
- 質量:中國常用於表示「品質」,但兩岸都有「重量」的意思 範例
- 土豆:中國為「馬鈴薯」,台灣為「花生」
個人評價
為了避免被貼上「逢中必反」的標籤(我不是綠衛兵),介紹幾個常用的詞
喜歡的
- 優化(最佳化, optimization)
- 少一個字,意義也相同
- 酸奶(優酪乳, yogurt)
- 意譯比較合理
討厭的
- 視頻(影片)
- 默認(預設, default)
- IT用語:實在是翻譯的很爛
- 兆位元組(MB),千兆(GB)
- 面向對象(物件導向, Object-Oriented)
其他案例
最近發現一位倭語大將軍 - 嚴復,他是提出信達雅翻譯理論,和將達爾文思想傳入中國的人。
他將和製漢語全都重新翻譯一遍(evolution → 天演, total → 拓都, unit → 么匿),結果是大敗收場;只留下烏託邦、物競天擇、適者生存等少數詞語留傳至今。
法國也有英語警察,詳見參考資料。
中國是目前最大的英語警察
- 2010年4月,廣電總局要求不能使用諸如NBA、GDP、WTO、CPI等外語和縮略詞。但時至今日,此規定已名存實亡
- 2017年,要求遊戲中不能出現英文
- 不過經我觀察(我沒玩過中國服的遊戲),英文還是存在的,只是少很多。大多也就是Auto改自動、Success改成功、Item改道具、Level改等級這種程度而已
IT用語
可以說,英語是IT業界的絕對主導語言。
之前看見有人用中文當作Python變數名稱的,拜託不要(雖然合法)。
大學時,教授大多用英文詞語介紹內容,有些直接用英文教學,想不到某個詞的中文怎麼說是很正常的。
之前發現,如果預設語言是中文,Ubuntu也會用中文作為預設資料夾名稱(文件、下載、圖片…),這種漢化大可不必。
心得
中文也有很多從日本傳入的詞彙,明治維新後有一部份,現在也有,如課金、同接、無料、生放送、通販等二次元詞語居多。
沒有必要過度敏感,但也不要過度放縱。
參考資料
- 萌典
- OpenCC
- 圖片來源
- [閒聊] 支語警察是誰畫的?
- [問卦] 支語警察怎麼知道哪些詞是支語
- 支語警察總整理
- 情報】支語警察系列支援包(圖多注意
- 愛台灣卻為了中國用語吵架:支語警察,與討厭支語警察的人們
- 黃克武(Huang, Max K. W.)(20081200)。新名詞之戰:清末嚴復譯語與和製漢語的競賽
- 他翻譯、創造的詞彙已被遺忘,但會通中西的思想卻綿延不絕:中研院黃克武談你所不知道的「嚴復」
- 法國英語警察
- 唯美食與法語不可辜負:現代法國的反美情結
- 為什麼要給盧旺達總統頒發門墊子?【小約翰可汗】
- 有夠狂! 中國遊戲將不准出現英文,如HP、MP...