資訊及通訊科技科 ICT: Google Translate

2011年5月31日

Google Translate

Google Translate 是一個免費工具，幫助你瞬間翻譯語句、文檔甚至是整個網頁，不夠它是如何工作的呢？難道 Google 顧了一屋子的翻譯大牛？當然不是，所有翻譯都是計算機完成的，這些計算機使用一種稱作 “統計機器翻譯” 的程序來按照大量文字排序生成翻譯。

退一步說，如果你想教某人一個新語言肯定得從詞彙表和語法開始，告訴他們如何組成整句。教電腦翻譯也是這個順序，先告訴他們詞彙表和一些語法規矩。但是語言是複雜的，有很多時候都是沒有規則而言的，很難捕捉到並一一說清楚。對於一個計算機程序來說，翻譯質量一般都很差，而 Google Translate 則從另外的角度入手。

Google 並不想教電腦每個語言的規則，而是讓它們自己找到這些規則。這些電腦要分析數百萬人肉翻譯的文檔，包括圖書、聯合國文件、全世界的網站等等。電腦們掃描這些文字找到其中的規律──也就是翻譯後文字和原始文字之間的必然性。一旦機器找到了這個序列，就可以翻譯類似的文字了。當你數十億次重複這一過程就找到了數十億種序列。對於一些翻譯的並不多的文檔來說，找到的序列也就不會太多，這就造成了 Google Translate 翻譯質量的下降。 Google 也一直在讓電腦捕捉並學習更多的文檔，這樣他們的翻譯水平會越來越高。

資訊及通訊科技科 ICT

2011年5月31日

Google Translate

沒有留言:

張貼留言

更多文章