av电影在线播放高清免费观看_色综合久久88色综合天天免费_国产精品18久久久_成人h动漫精品一区二区_精品一区二区av_奇米色一区二区_成人激情校园春色_国产中文在线播放

谷歌揭秘自家翻譯系統:如何利用AI技術提高翻譯質量

2020-06-13 17:19:12   來源:新浪科技   評論:0   [收藏]   [評論]
導讀:  對于機器翻譯來說,如果一門語言可用的文字資料越多,經過人工智能模型訓練出來的翻譯效果就越好。但并不是所有語言都具備豐富可用訓練的文字資料,這樣一來,如何在數據不多的情況下,訓練出更好的翻譯器,
  對于機器翻譯來說,如果一門語言可用的文字資料越多,經過人工智能模型訓練出來的翻譯效果就越好。但并不是所有語言都具備豐富可用訓練的文字資料,這樣一來,如何在數據不多的情況下,訓練出更好的翻譯器,成為機器翻譯領域里需要解決的問題之一。

  近日,谷歌在自己的博客上介紹了公司最新的翻譯創新技術,這些技術提升了谷歌翻譯的用戶體驗。目前谷歌翻譯可支持108種語言,平均每天翻譯1500億個單詞。

  谷歌翻譯最早亮相于2006年,在過去的13年間,翻譯水平有了重大飛躍。谷歌表示,其翻譯突破并不是由單一技術推動的,而是針對低資源語言、高資源語言、總體質量、推理速度等一系列技術組合的突破。在2019年5月到2020年5月之間,根據人工評估和BLEU(基于翻譯系統翻譯和人工參考翻譯之間相似性的衡量標準),谷歌翻譯在所有語言中平均提高了5分以上,在50種語料資源最少的語言中平均提高了7分以上。

  混合模型和數據挖掘器

  在這系列技術突破中,谷歌首先提到了混合模型和數據挖掘器。

  混合模型指的是由Transformer編碼器和遞歸神經網絡(RNN)解碼器構成的模型。在機器翻譯中,編碼器通常將單詞和短語編碼為內部表征,解碼器將其生成為所需要的語言文本。谷歌的研究人員在2017年稱首次提出,翻譯質量的提高主要依靠編碼器。谷歌團隊稱這可能是因為RNN和Transformer都設計為處理有序數據序列,但Transformers并不需要按順序處理序列。換句話說,如果所討論的數據是自然語言,則Transformer無需在處理結尾之前先處理句子的開頭。

  盡管如此,RNN解碼器在推理時間上仍然比Transformer中的解碼器要“快得多”。谷歌翻譯團隊認識到這一點,于是在將RNN解碼器與Transformer編碼器耦合之前,對RNN解碼器進行了優化,以創建低延遲、質量及穩定性均比此前所使用的RNN神經機器翻譯模型更勝一籌的混合模型。

  除了新穎的混合模型體系結構之外,谷歌還升級了爬蟲工具,爬蟲工具可以從數以百萬計的示例翻譯中收集編譯訓練數據。升級后,谷歌嵌入了14 種大語言對,而不是單純基于字典數據。也就是說它是使用實數向量來表示單詞和短語,更多地聚焦于精確性(檢索數據中的相關數據部分),而非檢索(實際檢索的相關數據總量)。產出效果方面,谷歌說這使得該數據挖掘器提取到的句子數量平均增加了29%。

  “嘈雜”的數據和遷移學習

  谷歌翻譯性能提升的另一個技術突破來自更好地處理訓練數據中的“噪聲”。“噪聲”即嘈雜的數據,因含有大量無法正確理解或解釋的信息數據,從而會損害語料資源豐富的語言翻譯。因此谷歌翻譯團隊部署了一個系統,該系統使用經過訓練的模型為翻譯示例分配分數,進而篩選出“純凈”的數據。實際上,這些模型一開始基于所有的數據進行訓練,然后逐漸基于更小、更純凈的數據子集進行訓練,這種方法在人工智能研究領域被稱為課程學習。

  對于機器翻譯來說,傳統上依賴于源語言和目標語言中成對句子的語料統計。對于資源較少的語言,谷歌在谷歌翻譯中采用了一個回譯機制,來強化并行訓練數據,即語言中的每個句子都與其譯文相配對。在該機制中,訓練數據與合成的并行數據自動對齊,目標文本為自然語言,而源文本則由神經翻譯模型生成。結果是,谷歌翻譯充分利用更豐富的單語文本數據來訓練模型,谷歌稱這對提高翻譯流暢性特別有幫助。

  此外,谷歌翻譯團隊還建了一個M4模型。M4模型由團隊在2019年提出,該模型對100多種語言的250億對句子進行訓練后,提高了30多種低資源語言的翻譯質量。這一模型也證明了在機器翻譯過程中可以使用遷移學習技術。這也意味著收集包括法語、德語和西班牙語,這些有數十億個并行示例的高資源語言,并進行訓練后,可以應用于翻譯諸如約魯巴語,信德語和夏威夷語,這些僅有數萬個示例的低資源語言。

  機器翻譯的未來

  谷歌稱,自2010年以來,翻譯質量每年都在提高,但是機器翻譯絕不是翻譯問題的“終結者”。 谷歌承認,即使是增強后的模型也容易出錯,包括將一種語言的不同方言混合在一起,產生過多的直譯,以及在特定主題,非正式或口語上的表現不佳。

  谷歌嘗試用不同的方法來解決上述的問題。公司曾發布一項計劃旨在招募志愿者,通過檢查翻譯單詞和短語是否正確來幫助提高低資源語言的翻譯性能。 今年2月份,谷歌翻譯與新興的機器學習技術相結合后就完成了進步,他們提供了僅有7500萬人使用的五種語言翻譯,例如Kinyarwanda(盧旺達語),Odia(奧里亞語),Tatar(韃靼語),Turkmen(土庫曼語)和Uyghur(維吾爾語)。

  追求真正通用翻譯的并不只有谷歌一家。在2018年8月,Facebook發布了一種AI模型,該模型結合了逐詞翻譯,語言模型和反向翻譯,在語言配對方面表現優異。最近,麻省理工學院計算機科學與人工智能實驗室的研究人員提出了一種無監督模型,即可以從未經明確標記或分類的測試數據中學習的模型,該模型可以在兩種語言的文本之間進行翻譯,而無需在兩種語言之間直接進行翻譯。

分享到:
責任編輯:zsz

網友評論

日韩一区二区三区免费视频| 亚洲乱码精品| 欧美日韩一区免费| 国产精品极品国产中出| 欧美午夜片在线观看| av资源久久| 国产美女免费观看| 久久奇米777| 国产日本亚洲| 777午夜精品视频在线播放| 欧美人与拘性视交免费看| 亚洲国产欧美日韩精品| 免费日韩精品中文字幕视频在线| 在线一级视频| 国产成人三级在线观看| melody高清在线观看| 亚洲成年网站在线观看| 色欧美乱欧美15图片| 夜夜操天天操亚洲| 久久综合久色欧美综合狠狠| 国产在线播放一区三区四| 日韩精品成人| 国产丝袜一区视频在线观看| 欧美极品中文字幕| 日韩精品视频在线播放| 国产精品第十页| 中文字幕在线视频区| 精品色蜜蜜精品视频在线观看| 小嫩嫩12欧美| 91精品国产aⅴ一区二区| 亚洲一区二区欧美| 久久日韩精品一区二区五区| 电影中文字幕一区二区| 亚洲精品日韩丝袜精品| 99麻豆久久久国产精品免费优播| 国产精品极品在线观看| 一本免费视频| 亚洲欧洲精品天堂一级| 日本久久综合| av今日在线| 欧美一区二区三区不卡| 国产激情视频一区二区在线观看| 高清精品视频| 国产特黄在线| 亚洲va韩国va欧美va| 黑人巨大精品欧美一区| 岛国精品一区| japanese色国产在线看视频| 污视频在线看网站| 亚洲色在线视频| 亚洲一区在线免费观看| 国产欧美一区二区三区在线老狼| 粉嫩欧美一区二区三区高清影视| 国产粉嫩在线观看| 免费观看羞羞视频网站| 午夜精品久久久久久久99樱桃| 国产乱一区二区| 99免费精品| 亚洲国产91视频| 在线国产91| 亚洲品质视频自拍网| 777欧美精品| 亚洲一卡二卡三卡四卡| 久久久电影一区二区三区| 欧美激情第10页| 成人av影音| 中文字幕在线看片| 国产资源在线看| 精品亚洲一区二区| 欧美日韩在线亚洲一区蜜芽| 中文字幕一区二区日韩精品绯色| 极品少妇一区二区三区精品视频| 婷婷伊人综合| 日本亚洲欧洲无免费码在线| 污污的视频在线观看| 蜜桃视频在线免费| 国产wwww| 亚洲理论在线a中文字幕| 欧美另类久久久品| 欧美午夜久久久| 亚洲久本草在线中文字幕| 波多野结衣91| 国产盗摄一区二区三区| 日韩成人精品在线观看| 精品成人免费| 欧美精品18| 亚洲网站啪啪| 国产一区亚洲| 午夜国产欧美理论在线播放| 伊色综合久久之综合久久| 99视频有精品高清视频| 欧美91看片特黄aaaa| 免费高潮视频95在线观看网站| 毛片在线视频| 色婷婷av在线| 国产美女av在线| 污污的网站在线免费观看| 国产三区在线观看| 免费a在线看| 免费不卡av| 三妻四妾的电影电视剧在线观看 | 精品国产午夜肉伦伦影院| 亚洲福利影视| 欧美黄色a视频| 亚洲毛片在线免费| 夜色77av精品影院| 亚洲精品在线观看91| 在线观看视频免费一区二区三区| 国产日本精品| 国产风韵犹存在线视精品| 粉嫩蜜臀av国产精品网站| 国产日韩欧美不卡在线| 一区二区不卡在线播放| 欧美伊人精品成人久久综合97| 欧洲精品在线观看| 欧美高清视频www夜色资源网| 精品国产一区a| 美国成人av| 成人爽a毛片免费啪啪动漫| av久久网站| 国产精品x8x8一区二区| 久久网站免费观看| 奇米色777欧美一区二区| 91在线视频观看| 自拍偷拍亚洲激情| 欧洲精品在线观看| 亚洲欧洲日产国码av系列天堂| 久久伊伊香蕉| 中文一区一区三区高中清不卡免费| av不卡一区二区| 亚洲伦伦在线| 国产精品夜夜爽| 亚洲成人1区2区| 日韩欧美第一区| 久久久久久女乱国产| 日韩伦理三区| 色综合天天综合网中文字幕| 久久精品国产一区二区三 | 69视频在线| 日本午夜精品| 国产在线精品一区二区三区不卡 | 日韩伦理在线一区| 成人免费在线观看av| 日韩成人精品在线| 亚洲精品视频在线| 8x8x视频在线| 岛国片av在线| 亚洲五月综合| 中文字幕国产一区| 精品国产91洋老外米糕| www免费在线观看| 丝袜美腿综合| 国产成人免费视频一区| 在线免费视频一区二区| 永久免费av片在线观看全网站| 波多野结衣在线一区二区| 人人精品人人爱| 在线视频一区二区免费| 老司机很黄的视频免费| 91制片在线观看| 国产精品v日韩精品v欧美精品网站 | 高清欧美精品xxxxx在线看| 四虎成人精品一区二区免费网站| 国产成人精品一区二| 欧美日韩精品电影| 加勒比一区二区三区在线| 偷窥自拍亚洲色图精选| 26uuu欧美| 免费看成一片| 久久99国产精品视频| 99久久er热在这里只有精品66| 欧美精品一区二区三区久久久| 美女在线视频免费| 久久蜜桃精品| 欧美一级视频精品观看| 成人福利一区二区| 国产大陆a不卡| 亚洲精品一区二区三区99| 欧美成人毛片| 波多野洁衣一区| 依依成人在线| 亚洲视频电影在线| 色琪琪一区二区三区亚洲区| 岛国毛片av在线| 久久99久久99小草精品免视看| 亚洲国产精品悠悠久久琪琪| 日韩有吗在线观看| 国产日韩av一区二区| av电影在线播放高清免费观看| 欧美在线三级| 日韩精品一区二区三区四区视频| av在线亚洲一区| 中文字幕成人av| 羞羞视频在线免费国产| 韩国v欧美v日本v亚洲v| 亚洲欧洲国产伦综合| 国产韩国精品一区二区三区| 精品视频在线免费| 欧美日韩导航| 5566中文字幕一区二区电影|