《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 自適應(yīng)學(xué)習(xí)率調(diào)度器了解一下?

自適應(yīng)學(xué)習(xí)率調(diào)度器了解一下?

2019-02-28

傳統(tǒng)觀點認為,太大的學(xué)習(xí)率不利于優(yōu)化深度神經(jīng)網(wǎng)絡(luò),而相比固定的學(xué)習(xí)率而言,變化的學(xué)習(xí)率更能提供快速的收斂。基于此,本文作者基于理論基礎(chǔ)提出了一個計算深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率的新方法。實驗結(jié)果證明了該方法的有效性。


訓(xùn)練神經(jīng)網(wǎng)絡(luò)受到幾個問題的困擾。這些問題包括梯度消失、梯度爆炸 [7,3] 和過擬合。包括不同激活函數(shù) [14,17]、批歸一化 [12]、新穎的初始化方案 [9] 以及 Dropout[26] 在內(nèi)的多種進展都為這些問題提供了解決方案。


但是,一個更基本的問題是為不同的超參數(shù)尋找最優(yōu)值,而對這個問題而言學(xué)習(xí)率可以說是最重要的。眾所周知,學(xué)習(xí)率太小會導(dǎo)致收斂變慢,但是太大的學(xué)習(xí)率又會導(dǎo)致發(fā)散 [2]。近期的研究一致認為,與固定的學(xué)習(xí)率相比,變化的學(xué)習(xí)率調(diào)度系統(tǒng)能夠提供更快的收斂 [20,23]。而覺得不應(yīng)使用較大學(xué)習(xí)率的傳統(tǒng)經(jīng)驗也被認為有問題,可能導(dǎo)致「超收斂」和規(guī)則效應(yīng)(regularizing effect)[25]。本文的實驗結(jié)果和這個說法是一致的;但是作者沒有使用循環(huán)的學(xué)習(xí)率,而是提出了一種基于理論基礎(chǔ)來計算自適應(yīng)學(xué)習(xí)率的新方法。


據(jù)作者所知,這是首次提出具有理論基礎(chǔ)的自適應(yīng)學(xué)習(xí)率調(diào)度器并且在標準數(shù)據(jù)集和網(wǎng)絡(luò)架構(gòu)上進行實證研究。所以,本文的貢獻是雙重的。首先,作者基于損失函數(shù)的利普希茨常數(shù)(Lipschitz),提出了一個用于在深度神經(jīng)網(wǎng)絡(luò)的隨機梯度下降中計算最優(yōu)學(xué)習(xí)率的新理論框架。其工作表明,在激活函數(shù)的特定選擇方面,僅最后兩層的激活函數(shù)是計算學(xué)習(xí)率時所需要的。其次,作者為幾個常用的損失函數(shù)計算了理想的學(xué)習(xí)率,并用這些公式實驗性地證明了其方法的有效性。


本文方法利用了損失函數(shù)的函數(shù)屬性,僅對損失函數(shù)做了兩個最小限度的假設(shè):它必須是利普希茨連續(xù)的 [19], 且至少是一階可微的。常用的損失函數(shù)都滿足這兩個條件。


論文:A novel adaptive learning rate scheduler for deep neural networks

微信圖片_20190228181427.jpg


論文地址:https://arxiv.org/abs/1902.07399


摘要:優(yōu)化深度神經(jīng)網(wǎng)絡(luò)在很大程度上被認為是一個經(jīng)驗過程,它需要手動調(diào)節(jié)幾個參數(shù),例如學(xué)習(xí)率、權(quán)重衰減以及隨機失活率(dropout rate)。可以說,學(xué)習(xí)率是這些需要調(diào)節(jié)的參數(shù)中最重要的一個,它在最近的工作中也得到了更多的關(guān)注。在本文中,我們提出了一個計算深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率的新方法。我們推導(dǎo)了動態(tài)計算學(xué)習(xí)率的理論框架,然后展示了在標準數(shù)據(jù)集和模型架構(gòu)上的實驗結(jié)果來證明該方法的有效性。


理論框架


對一個使用 Sigmoid、ReLU 或者 softmax 激活函數(shù)的神經(jīng)網(wǎng)絡(luò)來說,很容易表現(xiàn)出這樣的現(xiàn)象:反向傳播時朝著淺層的方向梯度會越來越小。因此,最后一層的梯度是反向傳播過程中計算出的梯度中最大的一個。如果微信圖片_20190228181518.jpg 是第 l 層節(jié)點 i 到節(jié)點 j 的權(quán)重,并且 L 是總的層數(shù),那么:

微信圖片_20190228181450.jpg


本質(zhì)上,公式 (1) 表示誤差對最后一層權(quán)重的最大梯度比誤差對網(wǎng)絡(luò)中任何權(quán)重的梯度都要大。顯然這也可以擴展到偏置(bias)。換句話說,找到最后一層的最大梯度就確定了誤差的利普希茨常數(shù)的上確界,這里的梯度都是根據(jù)每一層的權(quán)重參數(shù)來取的。


我們現(xiàn)在分析得出了不同類型問題的理論上確界。這些數(shù)值的倒數(shù)可以用作梯度下降的學(xué)習(xí)率。在任何一層中,我們都會有這種計算:


微信圖片_20190228181540.jpg


因此,最后一層中任何權(quán)重的梯度都是通過下面的鏈式法則來計算的:

微信圖片_20190228181600.jpg


第三部分是不能解析計算的;我們將它記作 K_z。現(xiàn)在看一下不同類型的問題,并計算這些組成部分。


實驗


下面我們展示了在一些公開數(shù)據(jù)集上的實驗結(jié)果和細節(jié)。雖然我們的結(jié)果不是最先進的,但我們的重點是憑經(jīng)驗證明隨機梯度下降是可以通過更大的學(xué)習(xí)率來進行的,而不是像通常理解的那樣只能用小一些的學(xué)習(xí)率。我們所有的實驗都是在特斯拉 P100 GPU 上運行的,如果沒有特殊說明,模型也是使用(沒有動量或者權(quán)重衰減的)隨機梯度下降優(yōu)化器進行優(yōu)化的。在 CIFAR 數(shù)據(jù)集上,我們和 [10] 一樣僅使用了翻轉(zhuǎn)和平移增強方案。在所有實驗中,原始圖像的像素數(shù)值都除以 255。


在 MNIST 上的實驗只使用了一個自適應(yīng)學(xué)習(xí)率,而因為利普希茨常數(shù),學(xué)習(xí)率在每個 epoch 中都會被重新計算。


圖 1 展示了訓(xùn)練集和驗證集上準確率和損失函數(shù)隨著 epoch 的變化而變化。圖 2 展示了在各個 epoch 計算的學(xué)習(xí)率。請注意,與 CIFAR-10(圖 5)和 CIFAR-100(圖 6)中計算的自適應(yīng)學(xué)習(xí)率不同,MNIST 的學(xué)習(xí)率從高得多的值開始。

微信圖片_20190228181630.jpg


圖 5 展示了不同時間的學(xué)習(xí)率隨。正如相關(guān)文獻所表明的,自適應(yīng)方案會自動選擇一個衰減的學(xué)習(xí)率。

微信圖片_20190228181653.jpg

圖 5:CIFAR-10 上自適應(yīng)學(xué)習(xí)率隨著時間的變化而變化


圖 6 展示了在各個 epoch 的學(xué)習(xí)率。與 CIFAR-10 一樣,前兩個 epoch 會以很小的學(xué)習(xí)率開始(10^(-8)),但是模型會快速適應(yīng)不斷變化的權(quán)重。

微信圖片_20190228181711.jpg

圖 6: CIFAR-100 上隨著時間變化的自適應(yīng)學(xué)習(xí)率。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
日韩一级精品视频在线观看| 亚洲综合社区| 日韩一级黄色片| 亚洲福利国产| 精品成人在线观看| 国产综合色在线| 国产色视频一区| 国产精品日日摸夜夜摸av| 久久深夜福利免费观看| 久久精品国亚洲| 欧美中文字幕| 欧美一区视频| 欧美一区午夜视频在线观看| 欧美一级大片在线观看| 欧美一级视频| 久久精品日韩一区二区三区| 久久成人精品视频| 亚洲成色最大综合在线| 亚洲成人在线视频播放 | 午夜亚洲福利| 亚洲一二三四久久| 亚洲一区二区免费视频| 国产精品成人一区二区网站软件| 亚洲素人在线| 在线视频精品一| 中文欧美日韩| 亚洲欧美日韩精品综合在线观看| 一区二区精品在线观看| 国产欧美亚洲精品| 国产精品久久久免费 | 国产亚洲一区在线| 午夜精彩视频在线观看不卡 | 国产小视频国产精品| 国产在线成人| 在线成人欧美| 亚洲精品日韩精品| 欧美日韩一区二区三区四区五区| 欧美黄色日本| 欧美午夜精品久久久久久人妖| 国产精品蜜臀在线观看| 国产亚洲va综合人人澡精品| 激情综合久久| 亚洲理论电影网| 久久综合九色综合欧美狠狠| 亚洲第一主播视频| 91久久久亚洲精品| 亚洲一区二区三区在线观看视频| 欧美一区在线视频| 亚洲精品九九| 亚洲男人的天堂在线| 久久免费高清视频| 欧美日韩黄视频| 国产日韩欧美在线观看| 亚洲国产精品va| 亚洲视频在线观看网站| 久久高清国产| 亚洲小说欧美另类社区| 久久九九电影| 欧美日韩视频在线一区二区| 国产一区二区成人久久免费影院| 亚洲国产导航| 亚洲资源在线观看| 亚洲精品在线观看免费| 欧美一区二区三区成人| 欧美激情二区三区| 国产欧美日韩在线观看| 亚洲欧洲一区| 欧美一区二区三区在线看| 一区二区三区高清不卡| 久久人人97超碰国产公开结果 | 欧美亚洲一区三区| 日韩视频一区二区三区在线播放| 亚洲欧美精品伊人久久| 欧美电影免费观看网站| 国产欧美一区二区精品性色| 亚洲激情婷婷| 欧美在线播放一区| 亚洲在线观看视频| 亚洲伦理在线观看| 亚洲国产另类 国产精品国产免费| 一区二区三区视频在线| 久久综合伊人| 99re8这里有精品热视频免费 | 亚洲毛片在线观看.| 久久精品国产99国产精品澳门 | 一区二区三区四区国产精品| 美女国产精品| 欧美三级午夜理伦三级中视频| 狠狠色狠狠色综合| 亚洲女人av| 亚洲天堂偷拍| 欧美激情综合| 在线免费观看成人网| 先锋影音久久| 国产精品久久午夜| 一区二区三区四区五区视频| 欧美在线观看你懂的| 欧美日韩直播| 亚洲欧洲精品天堂一级| 亚洲国产精品女人久久久| 久久福利一区| 国产精品你懂的在线欣赏| av成人老司机| 一区二区欧美在线观看| 欧美成人在线免费观看| 激情久久婷婷| 欧美一区国产一区| 欧美一二区视频| 国产精品高清网站| 这里只有精品视频| 亚洲网址在线| 欧美日韩激情网| 亚洲精品日韩一| 99re热精品| 欧美日韩成人免费| 亚洲精品日本| 99re6热只有精品免费观看| 欧美电影在线观看完整版| 亚洲福利专区| 最新国产成人在线观看| 你懂的网址国产 欧美| 影音先锋中文字幕一区二区| 亚洲国产精品一区在线观看不卡| 久久久免费av| 在线观看国产成人av片| 亚洲欧洲精品一区二区| 免费欧美日韩| 亚洲黄色有码视频| 一区二区三区 在线观看视| 欧美破处大片在线视频| 99国产精品久久久久久久成人热| 在线一区亚洲| 欧美亚州韩日在线看免费版国语版| 亚洲午夜电影| 久久国产精品久久精品国产| 国产一区二区三区高清播放| 欧美一区二区三区免费视频| 久久久爽爽爽美女图片| 在线精品亚洲一区二区| 久久精品国产99| 亚洲视频欧美在线| 国产精品美女一区二区在线观看| 亚洲欧美久久久久一区二区三区| 久久成人一区| 亚洲永久字幕| 久久精品人人爽| 嫩模写真一区二区三区三州| 亚洲精品看片| 午夜精品www| 激情亚洲一区二区三区四区| 亚洲精品国偷自产在线99热| 欧美日韩精品国产| 亚洲亚洲精品在线观看| 久久精品在线观看| 最新日韩欧美| 午夜久久影院| 伊人精品成人久久综合软件| 99综合精品| 国产精品视频xxx| 亚洲第一页中文字幕| 欧美美女bb生活片| 亚洲在线免费观看| 老司机67194精品线观看| 亚洲人成网站777色婷婷| 亚洲欧美中文另类| 尤物精品国产第一福利三区| 在线中文字幕一区| 国产日本亚洲高清| 亚洲精品视频在线| 国产精品视频精品视频| 亚洲黄色免费| 国产精品美腿一区在线看| 亚洲国产中文字幕在线观看| 欧美日韩精品免费看| 欧美一区观看| 欧美日韩日韩| 久久成人精品一区二区三区| 欧美日韩久久久久久| 欧美一区=区| 欧美日韩国产在线观看| 欧美一区二区三区免费视| 欧美日韩精品二区第二页| 久久国产精彩视频| 欧美视频中文一区二区三区在线观看| 欧美亚洲一区| 欧美视频免费在线观看| 亚洲福利视频一区二区| 国产精品日韩电影| 日韩一级裸体免费视频| 国产综合香蕉五月婷在线| 亚洲在线观看免费| 亚洲欧洲美洲综合色网| 久久久久久久精| 国产精品99久久不卡二区| 欧美国产乱视频| 亚洲女女女同性video| 欧美日韩精品免费在线观看视频| 亚洲国产激情| 国产欧美欧洲在线观看| 亚洲视频在线二区|