Google發布類神經機器翻譯,翻譯品質接近筆譯人員

Google發布類神經機器翻譯,翻譯品質接近筆譯人員

Google於昨日發布了網頁版和行動版的Google翻譯。在中翻英的過程中,會採用全新的類神經機器翻譯,而這個App每天要進行一千八百萬次這樣的翻譯。此外,Google針對這個翻譯系統的運作原理,發表了一篇學術論文。

之前,Google就曾表示它們在Google翻譯中運用了類神經網路技術,但只限於即時視覺翻譯這個功能。前段時間,Google的資深員工Jeff Dean曾告訴VentureBeat,Google已經在嘗試把越來越多的深度學習功能融入到Google翻譯中。除此之外,Google的一位發言人在郵件中說,最新的類神經機器翻譯是他們努力研發深度學習功能的成果。

實際上,Google一直以來都在致力於將深度類神經網路融入它旗下越來越多的應用軟體中,其中包括Google Allo和Inbox by Gmail。這個功能可以幫助Google更快捷、更有效地處理它們的數據。

Google的類神經機器翻譯(GNMT)對八層長的短時記憶遞歸類神經網路(LSTM-RNNs)依賴性很強。 “通過層間殘留聯繫可以加強梯度流。”Google科學家在論文中寫道。在影像處理器的幫助下,類神經網路一旦變得足夠成熟,Google就可以靠它尚未發布的張量處理單元進行數據處理。

雖然類神經機器翻譯並不永遠是最佳之選,但是Google的各種嘗試顯示,在某些情況下它還是有過人之處的。

57eb0b92f38de-png

“人們對這個翻譯系統的評價顯示,比起之前基於短語的翻譯系統,在翻譯多種語言時,類神經學習翻譯系統的錯誤率已經降低了60%,其中包括英法互譯,英西互譯以及英中互譯。附加實驗的結果顯示,翻譯系統的品質將和筆譯人員平均水準更加接近。”

在昨天發表的一篇文章中,Google Brain Team的研發科學家Quoc Le 和Mike Schuster提到,有了雙語評分員的幫助,在翻譯Wikipedia上的多語種樣句時,Google類神經機器翻譯的錯誤率實際上已經降低了55%到85%。

儘管如此,這個系統還是不完美的。 “類神經機器翻譯還是會犯一些筆譯人員永遠都不可能犯的錯誤,比如漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯、對文章語境缺乏整體把控等等。所以,我們還是有很大的進步空間。但不可否認的是,類神經機器翻譯具有里程碑意義。”

感興趣的讀者們可以猛戳Google論文原文原部落格文哦。

via venturebeat

出處:雷鋒網

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

Loading