Google Translate 是一個免費工具,幫助你瞬間翻譯語句、文檔甚至是整個網頁,不夠它是如何工作的呢?難道 Google 顧了一屋子的翻譯大牛?當然不是, 所有翻譯都是計算機完成的,這些計算機使用一種稱作 “統計機器翻譯” 的程序來按照大量文字排序生成翻譯。
退一步說,如果你想教某人一個新語言肯定得從詞彙表和語法開始,告訴他們如何組成整句。教電腦翻譯也是這個順序,先告訴他們詞彙表和一些語法規矩。但是語言是複雜的,有很多時候都是沒有規則而言的,很難捕捉到並一一說清楚。對於一個計算機程序來說,翻譯質量一般都很差,而 Google Translate 則從另外的角度入手。
Google 並不想教電腦每個語言的規則,而是讓它們自己找到這些規則。這些電腦要分析數百萬人肉翻譯的文檔,包括圖書、聯合國文件、全世界的網站等等。電腦們掃描這些文字找到其中的規律──也就是翻譯後文字和原始文字之間的必然性。一旦機器找到了這個序列,就可以翻譯類似的文字了。當你數十億次重複這一過程就找到了數十億種序列。對於一些翻譯的並不多的文檔來說,找到的序列也就不會太多,這就造成了 Google Translate 翻譯質量的下降。 Google 也一直在讓電腦捕捉並學習更多的文檔,這樣他們的翻譯水平會越來越高。
沒有留言:
張貼留言