其實不只簡體中文、繁體中文的語法不異,他泄漏,日文、韓文在機器翻譯上也可算是語法不異,用統一套系統。
在讀取完全句子後,解碼器(Decoder)就會最先運作,一次產生一個英語句子中 翻譯一個詞。
(中央社記者潘智義台北3日電)Google台灣董事總司理簡立峰說,Google翻譯比之前好用太多了!就算有人惡作劇,決心在「提出點竄建議」欄位寫下錯的翻譯,也不會影響系統的運作 翻譯社
他指出,機器進修是很重要 翻譯議題,各人在接洽Google翻譯 翻譯進修功能之際,也會聯想到人工電腦AlphaGo打敗真人世界棋王。此刻也有人提出讓AlphaGo打AlphaGo,進修能力可以更快的說法,就像是金庸小說「華山論劍」裡全真派的周伯通,用本身的左手和右手對打,使出的「左右互搏」 翻譯社
數年前,Google採用遞歸神經收集(RecurrentNeural Networks)將句子視為一個單元進行翻譯,以後 翻譯片語式機械翻譯體式格局(PBMT),則是將句子切割成零丁的字和詞組做自力翻譯。。-> 翻譯社|,-> 翻譯公司|的-> 翻譯
Google翻譯 翻譯成長進程快速,10年前,Google推出翻譯辦事,並以片語式機器翻譯(Phrase-BasedMachine Translation)作為首要運算體式格局。從曩昔僅支援幾種語言,到此刻可支援103種語言,且每天翻譯跨越1400億個單詞,Google翻譯 翻譯品質有了很大的進展 翻譯社
曩昔,為翻譯隨便兩種說話,Google需要建構多個分歧的翻譯系統,運算本錢相當可觀。相較於曩昔的片語機械進修(PBMT),神經機械翻譯(NMT)僅需要較少 翻譯系統架構設計。剛最先推出神經機械翻譯時,這兩種翻譯體式格局的精準度平起平坐。
他認為,固然簡體中文、繁體中文有些不異的字詞有著分歧的意義,或相同的字已衍生出新的意義,但因簡體、繁體中文語法不異,在機械翻譯上仍採用一套系統,可視為專有名詞,透過學習創立資料庫來校訂。
Google神經機械翻譯(GNMT)將中詞句子翻譯成英詞句子 翻譯進程,透過編碼器 (Encoder),起首,GNMT將中詞句子的每個單詞進行向量(vector)編碼,而每一個向量將顯示出今朝為止單詞被讀取到的所成心義。
簡立峰解釋,Google翻譯有學習及資料庫 翻譯功能,不斷積累經驗,毛病也是一種經驗,除非幾近所 翻譯人都在「點竄建議」欄寫下一模一樣的錯誤,才會積非成是,但事實上這種環境其實不可能産生。
為改良NMT翻譯品質,研究人員提出許多手藝來解決,這傍邊包孕透過摹擬調校模子(externalalignment model) 處置懲罰罕有字詞、利用「留意」(attention)來對準輸入詞和輸出詞,和將詞拆解成更小的單位以應對罕有字詞等 翻譯社
留意 (Attention)功能是為了每步都產出准確的詞,解碼器將針對編碼中文向量裡最相幹的英文單詞權重分布(weighted distribution)進行解碼。1060503
本文出自: https://tw.news.yahoo.com/google%E7%BF%BB%E8%AD%AF%E4%B8%8D%E6%80%95%E6%83%A1%E4%BD%9C%E5%8A%87-%E5%有關翻譯的問題歡迎諮詢華碩翻譯社