《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 32分鐘訓練神經機器翻譯,速度提升45倍

32分鐘訓練神經機器翻譯,速度提升45倍

2018-09-10

深度模型的訓練時間通常對研究者而言都是很大的挑戰(zhàn),我們需要花數小時甚至數天才能知道某個小改進到底好不好。然而如果我們從一開始就考慮降低模型訓練時間,那么很多概念都能迅速驗證。在 Facebook 開發(fā)者的試驗中,他們采用了低精度和大批量等一系列加速訓練方法,并成功地將需要 24 小時訓練的 NMT 降低到 32 分鐘。該項目相關的分布式訓練代碼已開源。


項目地址:https://github.com/pytorch/fairseq

微信圖片_20180910214226.gif


我們想讓用戶用自己喜歡的語言體驗我們的產品,同時與世界各地的人們建立聯(lián)系。為此,我們使用神經機器學習(NMT)自動翻譯帖子和內容中的文本。我們之前關于這一課題的研究 fairseq 已經開源,這是一個序列到序列的學習庫,可供任何人訓練 NMT 模型,完成自動摘要或其他文本生成任務。


隨著 NMT 模型在從大規(guī)模單語數據(只有一種語言的數據)中的學習越來越成功,訓練速度變得越來越重要。為了適應這樣的發(fā)展,我們必須想辦法大大減少訓練時間。直到最近,NMT 模型的這種訓練在單臺機器上還需要數周,對于快速實驗和部署來說,這一速度實在太慢。


由于在精度和訓練設置上做了幾項改變,我們在短短 32 分鐘內就能訓練一個強大的 NMT 模型(參見《Scaling Neural Machine Translation》),速度是原來的 45 倍(原來需要 24 小時)。在之后的一項研究《Understanding Back-Translation at Scale》中,我們展示了這一速度大幅提升的訓練設置如何讓我們利用單語文本訓練準確得多的模型。


《Scaling Neural Machine Translation》:https://arxiv.org/abs/1806.00187

《Understanding Back-Translation at Scale》(EMNLP 2018):https://arxiv.org/abs/1808.09381


加速訓練


我們首先在一臺配備 8 塊 Volta GPU 的英偉達 DGX-1 機器上把模型的訓練時間從近 24 小時縮減至不到 5 小時。神經網絡包含數百萬個參數,這些參數在訓練過程中會被調整并通常以 32 位浮點精度存儲。然后,我們把訓練的精度從 32 位轉換為 16 位,這樣不僅能減少 GPU 內存占用,還讓我們能夠使用英偉達最新 Volta GPU 架構提供的經過高度優(yōu)化的 Tensor Core。降低了精度(16 位)的訓練有時會由于浮點「溢出」而導致模型質量降低。在本研究中,我們實施了一個已知的自動監(jiān)控和防止溢出程序,并將訓練時間從近 24 小時減至 8.25 小時,速度提升 2.9 倍而沒有降低模型質量。


接下來,我們通過所謂的累積更新,延遲了模型更新來減少 GPU 之間的通信。通過同步訓練模型,從而每個 GPU 可以維持一個完整、相同的模型副本,但是會處理訓練數據的不同部分。處理時需要反向傳播——在網絡上被分為 forward pass 和 backward pass(前向/反向),以計算訓練模型所需的統(tǒng)計量。在處理每個小批量(mini-batch),GPU 會同步地相互交流結果(梯度)。這樣可能導致效率低下:首先,在 GPU 之間發(fā)送數據會消耗時間;其次,處理較快的工作站必須等待速度較慢的工作站(即所謂散兵游勇),然后訓練才能繼續(xù)。


后者對于文本相關模型來說是一大挑戰(zhàn),不同的句子長度會使這個問題更加嚴重。我們對這兩個問題的解決方案是在工作線程互相通信之前,讓每個工作線程處理并累積多個小批量的結果,從而延遲同步點。這將訓練時間縮減至 7.5 小時,且無損模型質量。


累積更新還能增加有效的批大小,即每一個訓練步所使用的數據量。在我們的研究設置中,批大小增大為 16 倍。這使得學習率可以翻倍,訓練時間減少到 5.2 個小時,比原始系統(tǒng)實現(xiàn)了 4.6 倍的加速。


圖:通過 (i) 減少工作站之間的通信、(ii) 減少不同 GPU 的工作負載變化從而節(jié)約閑置時間,累加多個前向/反向步驟的梯度,實現(xiàn)訓練加速。

微信圖片_20180910214254.jpg

最后,我們使用 16 位浮點數來進一步提高每一個工作站的批大小,從而利用釋放出的額外 GPU 內存。通過將每個工作站的批大小從 3.5K 單詞提升到 5K 單詞,該研究將總訓練時間減少到 4.9 個小時,對原始系統(tǒng)實現(xiàn)了 4.9 倍的加速。


擴展


我們對單個機器訓練的優(yōu)化還可應用于在多個機器上進行并行訓練(即分布式訓練)。我們將訓練從單個 DGX-1 機器擴展到 16 個機器(即 128 塊 GPU),發(fā)現(xiàn)可以在 37 分鐘內訓練完成同樣的模型,與原始的單機器設置相比,速度提升了 38.6 倍。


在多個機器上訓練時,另一個優(yōu)化是同時發(fā)生 GPU 通信和反向傳播。在反向傳播之后,我們將所有信息傳達給其他工作站。典型情況下,反向傳播和通信按順序執(zhí)行,但是我們通過盡可能并行 GPU 通信和反向傳播而節(jié)省時間。具體來說,我們在反向傳播步驟結束后立刻開始在多個工作站之間同步梯度。這樣 GPU 通信和反向傳播發(fā)生就實現(xiàn)了并行,這節(jié)省了 14% 的訓練時間,且使總訓練時間從將近 24 個小時下降到 32 分鐘,速度提升了 44.7 倍。

微信圖片_20180910214342.jpg

圖:反向傳播與梯度同步的并行示意圖。

微信圖片_20180910214407.jpg

圖:每次改進后訓練總時間的變化情況。


在更多未翻譯數據上訓練


加速訓練允許我們在更大數據集上訓練模型。一般而言,訓練 NMT 模型需要原文與參考譯文對應的成對文本,例如雙語數據等。但是,雙語數據相對于網絡上或其它地方常見的大量單語數據要有限地多。在第二篇論文《Understanding Back-Translation at Scale》中,我們展示了如何通過僅提供我們想要翻譯的語言的文本來提升模型的翻譯性能,以及利用大量的此類數據可以大幅提升模型準確度。


通過單語數據提升 NMT 模型最高效的方法之一是反向翻譯(back-translation)。如果我們的目標是訓練一個英語到德語的翻譯模型,我們可以首先訓練一個從德語翻譯到英語的模型并利用該模型翻譯所有的單語德語數據,然后在已有的和新的數據上簡單地訓練一個英語到德語的最終模型。我們的論文顯示,數據如何被翻譯是非常重要的,通過采樣故意不總是選擇最好的翻譯同樣也是非常重要的。

微信圖片_20180910214435.gif

圖:演示反向翻譯的動畫


如果我們把 2.26 億個反向翻譯的句子添加到現(xiàn)有的包含 500 萬個句子的訓練數據中,我們就能大幅提升翻譯質量。下圖(左)顯示了這一系統(tǒng)在標準 WMT』14 英-德基準測試集上的準確率(fairseq & 單語數據)。該系統(tǒng)可以在 16 個 DGX-1 機器上經過 22.5 小時訓練而成。圖中還顯示了 DeepL 的準確率,這是一個依賴于高質量人工翻譯的專業(yè)翻譯服務,此前該服務在該基準測試上表現(xiàn)最佳。

微信圖片_20180910214456.jpg


快速翻譯


我們還提高了 fairseq 模型的翻譯速度。具體來說,我們實現(xiàn)了很巧妙的高速緩存,或從計算和批處理中移除完成句子的幾個單詞而不是句子。這提高了大約 60% 的速度。下圖展示了 fairseq 和其它工具集的對比。只從 32 位浮點數變到 16 位浮點數就能提升 40% 的速度。

微信圖片_20180910214542.jpg

圖:在標準 WMT』14 英語-德語基準測試集上使用大型 Transformer 模型和 V100GPU 得到的翻譯速度。


未來計劃


擴展和提高自動化翻譯技術仍將是我們工作的重點。為了讓該研究項目盡快成長起來,我們共享了分布式訓練的代碼,并將其作為我們的 fairseq 開源項目的一部分,從而使其他研究者也可以輕松地以更快的速度訓練 NMT 模型。進行分布式訓練僅需稍微改動訓練命令。


實現(xiàn)更快的 NMT 訓練是一項激動人心的發(fā)現(xiàn)。大幅度地降低訓練時間可以加快實驗周轉,使我們能更輕松地在更好的模型中做研究。把無標簽數據應用到翻譯之外的問題(如問答或自動摘要)上也是很不錯的發(fā)現(xiàn)。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美中文在线视频| 久久久久久久一区二区| 欧美一级在线视频| 亚洲综合丁香| 亚洲综合色婷婷| 亚洲综合首页| 亚洲欧美日韩一区二区在线| 亚洲综合日韩在线| 亚洲一区二区日本| 亚洲免费中文| 篠田优中文在线播放第一区| 午夜精品久久久久久久久久久久久 | 国产日本欧美视频| 国产老女人精品毛片久久| 国产精品综合| 国产日韩成人精品| 国内久久精品视频| 欧美韩日精品| 小黄鸭精品密入口导航| 午夜激情综合网| 午夜亚洲福利| 久久九九有精品国产23| 久久一区欧美| 欧美成人黑人xx视频免费观看| 欧美国产在线观看| 欧美日韩精品二区第二页| 欧美视频一区| 国产精品一卡二| 国产综合视频在线观看| 在线观看亚洲视频| 亚洲欧洲日韩女同| 一区二区三区免费在线观看| 亚洲欧美日韩天堂一区二区| 久久精品2019中文字幕| 99re这里只有精品6| 亚洲欧美激情四射在线日| 久久精品国亚洲| 免费观看成人网| 欧美日韩亚洲成人| 国产日韩欧美视频| 亚洲高清一区二| 亚洲夜间福利| 亚洲国产精品一区二区www在线| 日韩五码在线| 午夜国产精品视频| 久久狠狠亚洲综合| 欧美男人的天堂| 国产欧美日本一区视频| 亚洲国产一区二区三区a毛片| 亚洲调教视频在线观看| 久久国产黑丝| 中文国产一区| 久久久久久网| 欧美日韩三级一区二区| 国产亚洲精品综合一区91| 亚洲人成网站在线观看播放| 性娇小13――14欧美| 亚洲巨乳在线| 久久av一区二区三区| 欧美国产日本高清在线| 国产精品有限公司| 亚洲激精日韩激精欧美精品| 亚洲一区在线播放| 亚洲伦理久久| 久久国产精品第一页| 欧美乱人伦中文字幕在线| 国产日韩欧美日韩| 一本色道**综合亚洲精品蜜桃冫| 久久精品导航| 午夜精品久久久久久久久久久久| 欧美成人激情视频| 国产永久精品大片wwwapp| 日韩午夜在线电影| 亚洲国产精品福利| 欧美在线你懂的| 欧美性开放视频| 亚洲黄色在线| 久久精品国产91精品亚洲| 亚洲自拍偷拍福利| 欧美精品色网| 在线播放日韩欧美| 欧美一二区视频| 亚洲欧美日韩一区在线| 欧美乱大交xxxxx| 亚洲国产精品国自产拍av秋霞| 小处雏高清一区二区三区| 亚洲综合不卡| 欧美日韩亚洲视频| 亚洲精美视频| 亚洲精华国产欧美| 久久九九全国免费精品观看| 国产精品视频内| 99国产精品久久久| 亚洲每日更新| 男人的天堂亚洲| 影音先锋欧美精品| 亚洲自拍偷拍麻豆| 亚洲一区二区三区在线看| 久久视频这里只有精品| 国产精品久久福利| 亚洲美女毛片| 最新日韩av| 老**午夜毛片一区二区三区| 国产欧美在线视频| 亚洲尤物精选| 国产精品久久久久久久久久尿| 亚洲午夜视频在线| 欧美激情视频在线免费观看 欧美视频免费一| 国产美女一区| 亚洲一区欧美二区| 亚洲一区三区在线观看| 欧美日韩亚洲综合一区| 亚洲人成精品久久久久| 亚洲精品色图| 先锋影音网一区二区| 国产精品久久久久天堂| 99精品黄色片免费大全| 日韩视频欧美视频| 欧美成人性网| 亚洲国产精品久久久久婷婷老年| 亚洲国产经典视频| 久久伊人精品天天| 一区精品在线| 亚洲国产毛片完整版| 久久伊伊香蕉| 亚洲第一区在线| 亚洲人成在线观看一区二区| 欧美不卡视频| 亚洲三级观看| 亚洲午夜精品| 国产精品入口夜色视频大尺度| 亚洲中字黄色| 久久九九国产精品| 伊人久久大香线| 亚洲人成人77777线观看| 欧美激情中文字幕一区二区| 日韩亚洲欧美精品| 亚洲欧美日本国产有色| 国产日韩欧美在线| 久久精品男女| 欧美精品在线一区二区三区| 亚洲色无码播放| 欧美一区二区免费| 国产综合色产| 欧美欧美天天天天操| 99热在线精品观看| 洋洋av久久久久久久一区| 欧美日韩国产小视频在线观看| 一本久道久久综合中文字幕| 亚洲欧美另类国产| 国产伦精品一区二区三区视频黑人| 亚洲区一区二| 亚洲一区二区三区涩| 国产欧美日韩一区| 亚洲国产精品成人综合色在线婷婷| 欧美高清视频在线| 一区二区三区精品视频在线观看| 久久gogo国模啪啪人体图| 亚洲第一区在线| 亚洲在线黄色| 韩国三级在线一区| av成人激情| 国产区在线观看成人精品| 91久久精品日日躁夜夜躁欧美 | 国产日韩欧美视频| 亚洲人久久久| 国产精品久久久久久久浪潮网站| 欧美在线综合| 欧美日韩国产高清视频| 午夜一区二区三区在线观看| 欧美大片第1页| 午夜精品国产| 欧美日韩精品伦理作品在线免费观看 | 国产日韩欧美亚洲一区| 日韩写真在线| 国产乱码精品一区二区三区忘忧草| 亚洲国产视频一区| 国产精品久久一区二区三区| 亚洲国产毛片完整版 | 国产一区二区三区黄| 99精品免费网| 国产亚洲精品aa午夜观看| 日韩亚洲精品在线| 国产亚洲欧美日韩一区二区| 99国产精品自拍| 含羞草久久爱69一区| 亚洲一区二区少妇| 亚洲国产专区校园欧美| 久久激情五月丁香伊人| av成人免费观看| 欧美高清在线一区二区| 欧美一区二区免费观在线| 欧美日韩免费一区二区三区| 亚洲黄网站在线观看| 国产日韩成人精品| 亚洲新中文字幕| 亚洲精品1区| 久久深夜福利免费观看| 亚洲欧美另类国产| 欧美三级电影精品|