《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 128塊Tesla V100 4小時訓練40G文本,這篇論文果然很英偉達

128塊Tesla V100 4小時訓練40G文本,這篇論文果然很英偉達

2018-08-09
關鍵詞: 英偉達 語言建模 GPU

近日,英偉達發表了一篇大規模語言建模的論文,他們使用 128 塊 GPU 在 4 小時內使得 mLSTM 可以收斂,值得注意的是,他們使用的 Amazon Reviews 數據集包含 40GB 的文本,這在以前通常需要花費數周的時間進行訓練。這樣的大規模語言模型能作為一種預訓練模型遷移大量的語言知識,也就是說如果將其應用到機器翻譯、機器閱讀理解和情感分析等 NLP 任務,數據需求量和計算量都能得到大幅度的降低。


近年來,深度學習已經成功應用到多種問題中。遷移學習在計算機視覺問題上的成功運用使得許多應用成為可能:VGG[6] 和 ResNets [7] 等大型 CNN 在 ImageNet 等大型圖像數據集上進行預訓練 [8,9] 然后在計算機視覺任務中作為骨干網絡架構。這些模型可以為新任務提取有用的特征,而無需在執行每個任務時都從頭開始訓練 [2], [10]–[12]。


最近的研究已經從無監督語言建模中得出了很有潛力的結果,隨后人們將遷移學習應用到自然語言任務 [3], [13]。然而,與卷積圖像模型不同,神經語言模型還沒有從大規模和遷移學習中受益。神經語言模型往往通過在大型語料庫上使用詞嵌入預訓練來實現大規模遷移學習 [14]– [16]。僅遷移詞嵌入會限制遷移的范圍,因為詞嵌入不會捕獲文本中的序列信息。英偉達的研究者想要遷移的是具備處理文本序列能力的整個 NLP 模型。


然而,由于在大型數據集上訓練大型語言模型非常耗時,因此上述情況下的遷移學習非常困難。最近發表的幾篇論文試圖發揮分布式深度學習及可用高性能計算(HPC)資源的內存和計算能力的優勢,通過利用分布式數據并行并在訓練期間增加有效批尺寸來解決訓練耗時的問題 [1],[17]– [20]。這一研究往往聚焦于計算機視覺,很少涉及自然語言任務,更不用說基于 RNN 的語言模型了。由于基于 RNN 的語言模型具有序列性,這些模型在數值上很難訓練,且并行性差。有證據表明,用于語言建模、語音識別和神經機器翻譯的 RNN 在大型數據集上訓練時,準確率還有提升的空間 [21]。相應的,高效訓練大型 RNN 模型的技術將在許多神經語言任務中帶來準確率的提升。


研究人員專注于在亞馬遜評論數據集上訓練一個單層 4096 神經元乘法 LSTM(multiplicative LSTM,mLSTM)字符級語言模型,這個數據集是目前開源的最大自然語言處理數據集之一,他們將該模型遷移到 Binary Stanford Sentiment Treebank (SST) 和 IMDB 電影評論數據集的情感分類的下游任務中。然后用混合精度 FP16/FP32 算術運算來訓練循環模型,它在單個 V100 上的訓練速度比 FP32 快了 4.2 倍。


接著研究人員通過 128GPU 的分布式數據并行,使用 32k 的批大小訓練了混合精度模型。這比起使用單個 GPU,訓練的數據量增加了 109 倍。然而,由于批大小變大,需要額外的 epoch 來將模型訓練至相同準確率,最終總訓練時長為 4 小時。


此外,他們還訓練了一個有 8192 個神經元的 mLSTM,它在亞馬遜評論語言模型中的表現超越了當前最優模型,取得了每字符位數(BPC)為 1.038,SST 分類準確率為 93.8% 的性能。


研究人員分析了分布式數據并行是如何隨著模型增大而擴展的。在使用分布式數據并行訓練 RNN 時,他們觀察到一些訓練時批量過大會出現的常見問題。他們研究數據集大小、批大小和學習率方案之間的關系,以探索如何有效地利用大批量來訓練更為常見的大型自然語言處理(NLP)數據集。


在這篇論文中,作者們表示這項工作為商業應用以及深度學習研究提供了大規模無監督 NLP 訓練的基礎。作者在 GitHub 項目中展示了實現無監督情感分析的實驗,其中大規模語言模型可以作為情感分析的預訓練模型。


項目地址:https://github.com/NVIDIA/sentiment-discovery


論文:Large Scale Language Modeling: Converging on 40GB of Text in Four Hours 

微信圖片_20180809210829.jpg

論文地址:https://arxiv.org/pdf/1808.01371v1.pdf


摘要:近期有許多研究關注如何在大型數據集上快速訓練卷積神經網絡,然后將這些模型學習到的知識遷移到多種任務上。跟隨 [Radford 2017] 研究的方向,在這項研究中,我們展示了循環神經網絡在自然語言任務上相似的可擴展性和遷移能力。通過使用混合精度算術運算,我們在 128 塊英偉達 Tesla V100 GPU 使用 32k 的批大小進行分布式訓練,因此可以在 40GB 的亞馬遜評論(Amazon Reviews)數據集上針對無監督文本重建任務訓練一個字符級 4096 維乘法 LSTM(multiplicative LSTM, mLSTM),并在 4 個小時完成 3 個 epoch 的訓練。這個運行時相比于之前在相同數據集、相同大小和配置上花費一個月訓練一個 epoch 的工作很有優勢。大批量 RNN 模型的收斂一般非常有挑戰性。近期的研究提出將學習率作為批大小的函數進行縮放,但我們發現在這個問題中僅將學習率作為批大小的函數縮放會導致更差的收斂行為或立刻發散。我們提供了一個學習率方案,允許我們的模型能在 32k 的批大小下收斂。由于我們的模型可以在數小時內在亞馬遜數據集上收斂,并且盡管我們的計算需求是 128 塊 Tesla V100 GPU,這個硬件規模很大,但在商業上是可行的,這項工作打開了在大多數商業應用以及深度學習研究中實現大規模無監督 NLP 訓練的大門。一個模型可以一夜之間就在大多數公開或私人文本數據集訓練好。


3. 大批量訓練


鑒于亞馬遜語料庫的規模,預訓練大型當前最優神經語言模型是一個非常耗時的過程。在單個 GPU 上運行這么大的工作負載不切實際,因為當前最優模型一般會比較大,且每個 GPU 能夠承擔的訓練批量大小有限。為了保證有效的訓練和遷移大型語言模型,我們使用多 GPU 并行化訓練。我們專注于多 GPU 數據并行化,這意味著我們在訓練過程中將批次分割并分配給多個 GPU。我們沒有使用模型并行化(這種方法把神經網絡分割成多個處理器),因為該方法靈活性較差,且對軟件限制較多,不過它仍然是進一步并行化的有趣選擇。


我們使用同步數據并行化,其中大批量數據被均勻分布給所有參與其中的工作進程,工作進程處理前向和反向傳播、相互通信產生的梯度,以及在獲取新的數據批量之前更新模型。鑒于模型大小和通信延遲,數據并行化通過可用 GPU 的數量與批量大小的線性擴展來實現近似線性加速。


為保證任意語言模型的大批量預訓練,明確分析使用基于 RNN 的語言模型進行大批量預訓練的效果非常重要。循環神經網絡的連續性使得訓練過程很難優化,因為 RNN 計算過程中存在鞍點、局部極小值和數值不穩定性 [35]–[37]。這些復雜性使得使用 RNN 進行大批量訓練的分析非常有必要。


為了保證 RNN 語言模型的大批量訓練,我們探索了線性縮放規則和 Hoffer 等人 [40] 提出的平方根縮放規則  的影響。


4. 混合精度訓練


FP16 不僅能減少通信成本,還對直接加速處理器上的訓練起到關鍵作用,如支持較高吞吐量混合精度運算的 V100。V100 的單精度浮點運算性能可達 15.6 TFlops,而混合精度運算(FP16 存儲和相乘,FP32 累加)的浮點運算性能達到 125 TFlops。


5. 實驗

微信圖片_20180809210907.jpg

微信圖片_20180809210946.jpg

圖 2:a 為混合精度(MP)和單精度(SP)的訓練曲線,b 為單精度和混合精度的測試集評估對比,其中評估指標為亞馬遜 BPC 和 Radford 等人實現的二元情感分類準確率基線集。

微信圖片_20180809211024.jpg

圖 3: a) 亞馬遜評論數據集一次 epoch 的訓練時間與 GPU 數量具有線性關系。b) 有(無)無限帶寬的分布式數據并行訓練的平均每個迭代次數和相對加速度。

微信圖片_20180809211052.jpg

圖 4:在特定維度和批大小的亞馬遜評論數據集上,訓練 mLSTM 模型完成一個 epoch 的訓練過程。虛線表示經過一個 epoch 的訓練后的評估 BPC,以及由 Gray 等人 [34] 得到的當前最佳評估結果(SoTA)。

微信圖片_20180809211121.jpg

圖 5:在多種初始學習率下使用 1 epoch 內衰減到零的學習率方案的評估結果。某些初始學習率按照基于 128 批大小的 5e-4 衰減率的線性或平方根縮放規則進行縮放。Div 表示訓練出現發散。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲国产日韩欧美在线图片| 亚洲欧美精品一区| 日韩亚洲精品视频| 亚洲高清成人| 激情久久综合| 韩日欧美一区二区三区| 国产日韩一区二区三区| 国产精品久久久久久久久久久久久久| 欧美黄色影院| 牛人盗摄一区二区三区视频| 久久夜色精品国产噜噜av| 久久久久久9| 久久久亚洲国产天美传媒修理工| 久久国产欧美| 欧美在线国产精品| 久久久精品久久久久| 久久精品人人做人人爽| 久久精品国产精品| 久久精品一区二区| 久久www成人_看片免费不卡| 性一交一乱一区二区洋洋av| 欧美一级午夜免费电影| 欧美一区二区三区免费看 | 国产精品久久婷婷六月丁香| 国产精品久久久久av| 国产精品久久久久久久午夜片| 国产精品理论片| 国产伦精品一区二区三区照片91| 国产网站欧美日韩免费精品在线观看| 国产日韩在线播放| 国产综合色产在线精品| 激情久久久久久久| 亚洲国产老妈| 亚洲最新中文字幕| 亚洲一区中文| 久久国产直播| 日韩午夜电影av| 亚洲男女自偷自拍| 欧美专区在线观看| 免费成人美女女| 欧美日韩性视频在线| 国产精品免费观看视频| 国产亚洲精品aa午夜观看| 樱桃视频在线观看一区| 亚洲黄色毛片| 亚洲一区二区视频| 久久精品免费电影| 99一区二区| 欧美一区二区三区精品 | 巨胸喷奶水www久久久免费动漫| 欧美岛国激情| 欧美日韩理论| 国产日韩精品一区二区三区在线| 雨宫琴音一区二区在线| 99re热精品| 欧美伊人精品成人久久综合97| 亚洲欧洲在线播放| 亚洲欧美大片| 免费高清在线一区| 欧美午夜久久久| 韩国女主播一区| 99精品国产福利在线观看免费| 亚洲欧美日韩电影| 亚洲精品男同| 欧美在线不卡视频| 欧美精品久久久久a| 国产日本亚洲高清| 亚洲精品一区二| 欧美一级视频| 中文久久精品| 麻豆9191精品国产| 国产精品视频免费一区| 亚洲国产成人av好男人在线观看| 一区二区三区免费网站| 亚洲国产精品一区二区三区| 亚洲免费一在线| 欧美福利一区二区| 国产午夜精品福利| 中文欧美字幕免费| 亚洲乱码视频| 欧美在线三级| 欧美日韩免费在线观看| 国内一区二区三区在线视频| 一区二区三区高清视频在线观看| 亚洲成人在线视频网站| 亚洲综合丁香| 欧美日韩福利| 亚洲大胆视频| 欧美一级视频精品观看| 亚洲综合色噜噜狠狠| 欧美日本乱大交xxxxx| 韩日精品视频| 亚洲欧美日韩精品在线| 国产精品99久久久久久有的能看| 蜜臀a∨国产成人精品| 国产日韩欧美一区二区三区在线观看 | 禁断一区二区三区在线| 亚洲欧美日韩一区| 亚洲在线视频免费观看| 欧美大片在线观看一区| 怡红院精品视频在线观看极品| 午夜激情综合网| 亚洲在线观看视频网站| 欧美日韩国产首页| 亚洲国产精品va在线看黑人动漫| 性久久久久久久久久久久| 亚洲欧美成aⅴ人在线观看| 欧美日韩久久不卡| 亚洲美女视频网| 日韩一级精品| 欧美第一黄色网| 亚洲二区在线| 91久久精品一区二区别| 久久综合九色欧美综合狠狠| 国产一区二区成人| 欧美一区二区三区视频在线 | 亚洲精品少妇30p| 老牛影视一区二区三区| 狠狠色狠狠色综合日日小说| 亚洲欧洲av一区二区| 欧美一区二区在线免费观看| 国产精品伊人日日| 亚洲欧美中文在线视频| 欧美一区二区三区视频在线观看| 国产精品你懂得| 亚洲欧美国产高清va在线播| 小黄鸭精品密入口导航| 国产精品综合网站| 欧美一激情一区二区三区| 久久激情视频免费观看| 国产在线一区二区三区四区| 久久99伊人| 久热精品视频在线| 在线看国产日韩| 日韩视频久久| 欧美国产综合一区二区| 亚洲精品久久久蜜桃| 亚洲一区二区网站| 国产精品视频男人的天堂| 欧美在线播放一区| 牛牛影视久久网| 亚洲精品美女免费| 亚洲综合日韩| 国产在线拍偷自揄拍精品| 91久久在线播放| 欧美日韩美女在线| 亚洲欧美激情一区| 久久亚洲精品一区| 亚洲国产精品第一区二区三区| 日韩视频国产视频| 国产精品高潮呻吟久久| 欧美一区二区免费观在线| 久久综合影视| 亚洲美洲欧洲综合国产一区| 亚洲午夜精品17c| 国产精品制服诱惑| 亚洲第一页在线| 欧美日韩精品一区二区天天拍小说 | 亚洲日本黄色| 欧美视频在线观看 亚洲欧| 亚洲欧美日本国产有色| 免费观看成人| 一区二区高清视频| 久久蜜桃香蕉精品一区二区三区| 亚洲国产精品成人va在线观看| 亚洲午夜久久久久久尤物 | 亚洲伦理久久| 国产精品入口66mio| 亚洲高清在线| 欧美视频免费在线| 欧美在线视频免费观看| 欧美日韩国产一级| 午夜精品视频在线| 欧美成人三级在线| 亚洲天堂免费观看| 毛片av中文字幕一区二区| 日韩一级免费| 久久精品中文字幕免费mv| 亚洲精品日韩综合观看成人91| 午夜免费电影一区在线观看| 在线 亚洲欧美在线综合一区| 亚洲视频欧美视频| 韩国av一区二区三区四区| 亚洲午夜精品| 亚洲国产精品第一区二区三区| 亚洲欧美久久久| 亚洲东热激情| 久久精品免费看| 一本色道久久综合亚洲二区三区| 久久视频在线免费观看| 一区二区精品在线| 欧美成人69| 欧美一级久久久久久久大片| 欧美日韩精品在线播放| 亚洲激情影院| 国产一区99| 午夜精品在线视频| 亚洲另类在线视频| 鲁鲁狠狠狠7777一区二区| 亚洲免费影视|