《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 業(yè)界動(dòng)態(tài) > MemNN記憶網(wǎng)絡(luò)的特征和芯片架構(gòu)的實(shí)現(xiàn)

MemNN記憶網(wǎng)絡(luò)的特征和芯片架構(gòu)的實(shí)現(xiàn)

2019-09-15
關(guān)鍵詞: MemNN 記憶網(wǎng)絡(luò)

  記憶網(wǎng)絡(luò)MemNN)是神經(jīng)網(wǎng)絡(luò)的重要分支,在問(wèn)答領(lǐng)域有廣泛應(yīng)用。其計(jì)算特點(diǎn)更符合人類(lèi)記憶和思考的過(guò)程,相比傳統(tǒng)RNN、LSTM等模型具有更好的長(zhǎng)期記憶能力,最近的關(guān)注度也很高。本文首先闡述了MemNN的網(wǎng)絡(luò)特點(diǎn),進(jìn)而分析其架構(gòu)設(shè)計(jì)中的難點(diǎn),主要針對(duì)其存儲(chǔ)過(guò)大、帶寬高、稀疏計(jì)算三個(gè)方面,結(jié)合ISCA相關(guān)論文的論述,提出一些可能的解決方案和思考方向,希望對(duì)今后的AI加速器設(shè)計(jì)有所啟發(fā)。

  memory network(MemNN),也叫memory-argumented neural network,2014年由Facebook的工程師提出。這種特殊的網(wǎng)絡(luò)有很強(qiáng)的上下文信息感知和處理能力,非常適合信息提取,問(wèn)答任務(wù)等人工智能輔助領(lǐng)域。不同于傳統(tǒng)的前饋網(wǎng)絡(luò)CNN,RNN等將訓(xùn)練集壓縮成hidden state進(jìn)行存儲(chǔ)的方式,這類(lèi)方法產(chǎn)生的記憶太小了,在壓縮過(guò)程中損失了很多有用信息。而MemNN是將所有的信息存在一個(gè)外部memory中,和inference一起聯(lián)合訓(xùn)練,得到一個(gè)能夠存儲(chǔ)和更新的長(zhǎng)期記憶模塊。這樣可以最大限度的保存有用信息,下圖是一個(gè)簡(jiǎn)單的MemNN的流程示意圖。

640.webp.jpg

  通過(guò)描述性的語(yǔ)言解釋下MemNN的運(yùn)行過(guò)程。首先輸入的內(nèi)容(input story sentences)經(jīng)過(guò)加工和提取儲(chǔ)存在外部memory中。問(wèn)題提出后,會(huì)和上述內(nèi)容一起通過(guò)embedding過(guò)程產(chǎn)生question,input和output三部分,相當(dāng)于在理解問(wèn)題和內(nèi)容的相關(guān)程度。然后通過(guò)inference過(guò)程,尋找和問(wèn)題最相關(guān)的內(nèi)容語(yǔ)句,再提取語(yǔ)句中和問(wèn)題最相近的單詞,最終產(chǎn)生答案A。在這個(gè)過(guò)程中,輸入內(nèi)容幾乎是完整的保存和使用的,而不是像RNN那樣壓縮成數(shù)據(jù)量較少的中間狀態(tài),因此信息的完整性是比較好的。同時(shí)inference使用的是full connection連接和softmax歸一化,很容易在傳統(tǒng)的深度學(xué)習(xí)優(yōu)化算法和硬件上獲得較好的加速效果。

640.webp (3).jpg

  具體到細(xì)節(jié),MemNN主要包括2種操作:embedding和inference。前者是將輸入轉(zhuǎn)化成中間狀態(tài)的計(jì)算過(guò)程,而inference是通過(guò)多層神經(jīng)網(wǎng)絡(luò)來(lái)推斷語(yǔ)句和問(wèn)題的相關(guān)性。story經(jīng)embedding過(guò)程產(chǎn)生2個(gè)矩陣:input 和output matrix,把輸入語(yǔ)句轉(zhuǎn)化為內(nèi)部存儲(chǔ)的向量,這一步會(huì)使用通常NLP的詞向量轉(zhuǎn)化方法。問(wèn)題輸入給MemNN網(wǎng)絡(luò)后,會(huì)通過(guò)inference計(jì)算得到和上述內(nèi)部向量之間的相關(guān)性,具體是三個(gè)步驟。

  首先“input memory representation”過(guò)程會(huì)計(jì)算問(wèn)題向量和input matrix的點(diǎn)積后歸一化,得到和input matrix維度一致的概率向量p,即問(wèn)題和各記憶向量的相關(guān)程度。這一步的運(yùn)算是矩陣乘累加和softmax。

  第二,“output memory representation”過(guò)程將output matrix按概率向量p進(jìn)行加權(quán)求和,得到輸出向量o,相當(dāng)于選取了相關(guān)性最高的記憶向量組合。這一步主要是矩陣點(diǎn)積。

  最后一步“output calculation”是將輸出向量轉(zhuǎn)化為所需答案的格式,得到各單詞相對(duì)答案的概率,運(yùn)算是全連接型的矩陣乘累加。

  上述只做行為級(jí)的描述,相關(guān)步驟的公式可以參考論文[1]。

640.webp (4).jpg

  經(jīng)過(guò)上述分析,我們可以總結(jié)下MemNN的計(jì)算特點(diǎn)并從架構(gòu)角度分析其可能存在的問(wèn)題。首先,也是最明顯的,MemNN對(duì)輸入內(nèi)容的保存沒(méi)有經(jīng)過(guò)大幅度的壓縮,信息完整性很高,這樣在問(wèn)答推理上相比RNN等壓縮模型很有優(yōu)勢(shì),不過(guò)帶來(lái)的問(wèn)題就是存儲(chǔ)空間會(huì)隨著內(nèi)容的增大而線性增加,對(duì)片上存儲(chǔ)的壓力較大。而片上存儲(chǔ)不足的直接后果就是內(nèi)存帶寬需求的增加。第二,運(yùn)算幾乎都是矩陣乘累加或者點(diǎn)乘,這一點(diǎn)和RNN是比較類(lèi)似的,這樣在同等運(yùn)算強(qiáng)度下,對(duì)數(shù)據(jù)量的需求要高于卷積,也就是對(duì)帶寬的需求更大;第三,由于MemNN計(jì)算的特點(diǎn)是從story生成的多個(gè)向量中選擇相關(guān)性最大的產(chǎn)生答案,因此中間結(jié)果矩陣會(huì)是一個(gè)很稀疏的矩陣,只有相關(guān)性較強(qiáng)的部分才有值,其他不相關(guān)的幾乎都是0,這樣的話通常的密集運(yùn)算加速器(如TPU等)效果就不好了,需要軟件和硬件著重考慮如何進(jìn)行稀疏性的優(yōu)化。

  可以看出,對(duì)于MemNN來(lái)說(shuō),現(xiàn)有的ASIC加速器并不能很好的優(yōu)化上述問(wèn)題,因此在計(jì)算效率上應(yīng)該是沒(méi)有GPU強(qiáng)的,這也是GPU這種SIMT結(jié)構(gòu)適應(yīng)性更強(qiáng)的優(yōu)勢(shì)。如何在硬件上同時(shí)高效支持CNN和MemNN這兩種差別較大的模型,還有比較長(zhǎng)的路要走。今年的ISCA論文中,有一篇是針對(duì)MemNN進(jìn)行優(yōu)化,盡管主要在算法層面,但可以在一定程度上給未來(lái)的通用AI加速器作為參考。

640.webp (1).jpg

  針對(duì)MemNN存儲(chǔ)較大的優(yōu)化方法利用了input memory representaion計(jì)算的可交換性。通常的計(jì)算是先乘累加在softmax,由于softmax是一個(gè)除法運(yùn)算,分母是固定的,因此可以利用乘法分配律,將矩陣乘累加拆成若干個(gè)部分單獨(dú)執(zhí)行,這樣歸一運(yùn)算和求和計(jì)算就很好的分開(kāi)了,具體公式可以參考論文[2]。針對(duì)后者,我們不需要一次性的算完e^n后再和Mout做乘法,而是將其分組(N),每組內(nèi)部先完成全部的求和,這樣一次運(yùn)算對(duì)存儲(chǔ)的需求就只有之前的1/N了,如果正好全部放在片上cache中,那么組內(nèi)運(yùn)算就不需要進(jìn)行內(nèi)存的替換。再配合ping-pong預(yù)取下一組的數(shù)據(jù),可以完美的將數(shù)據(jù)預(yù)取和計(jì)算并行起來(lái),大大降低了傳統(tǒng)計(jì)算中數(shù)據(jù)反復(fù)替換的損失。這一點(diǎn)很有啟發(fā),AI加速是軟硬一體的緊密結(jié)合體,算法設(shè)計(jì)中應(yīng)該充分利用數(shù)據(jù)的局部性,盡可能將一組數(shù)據(jù)和計(jì)算都在片上完成,組與組之間提高并行性。硬件應(yīng)提供相應(yīng)的并行化設(shè)計(jì)和調(diào)度方式,方便軟件進(jìn)行優(yōu)化。兩者相輔相成。

640.webp.jpg

  其他兩種方法沒(méi)什么特點(diǎn),一個(gè)是針對(duì)稀疏性提出的根據(jù)閾值丟棄運(yùn)算,這個(gè)主要在軟件層面,CPU和GPU會(huì)比較容易實(shí)現(xiàn);另一個(gè)是針對(duì)embedding matrix是常量的特點(diǎn),設(shè)計(jì)了一個(gè)dedicated cache專(zhuān)門(mén)存放input和output matrix,類(lèi)似于獨(dú)立的weight cache,進(jìn)行數(shù)據(jù)分隔式存儲(chǔ),減小對(duì)計(jì)算中間結(jié)果的干擾。最后使用FPGA做了一個(gè)硬件實(shí)現(xiàn),比CPU算法高了6倍。這個(gè)加速比并不算高,主要原因是對(duì)于cache替換的優(yōu)化在CPU和FPGA上的提升是差不多的;而稀疏矩陣的加速效果FPGA甚至?xí)陀贑PU;至于embedding cache,我個(gè)人感覺(jué)作用不大。因此FPGA主要就是運(yùn)算單元數(shù)量和某些ASIC算法(softmax)上的優(yōu)勢(shì)了。因此該方案并沒(méi)有很好的利用MemNN的特征,不是一個(gè)很好的解決方案,論文中也只是一帶而過(guò)的介紹。

  總結(jié)一下,MemNN的運(yùn)算特點(diǎn)決定了它并不能在當(dāng)前的AI硬件加速器中獲得很好的提升。這突出了TPU類(lèi)ASIC加速器算法適應(yīng)狹窄的缺點(diǎn),也幾乎是目前所有面世的AI加速器的局限。之前在“AI芯片的趨勢(shì)”一文中提到了靈活性,對(duì)于AI算法而言,更需要軟硬一體層面的緊密配合,甚至要超過(guò)在CPU和GPU這類(lèi)通用處理器上的所能做的極致。在這一點(diǎn)上,目前的AI加速器設(shè)計(jì)還有很多可以改進(jìn)之處。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产午夜精品理论片a级大结局| 亚洲人午夜精品| 欧美肥婆在线| 裸体一区二区三区| 久久五月婷婷丁香社区| 欧美一区二区视频免费观看| 亚洲综合国产| 亚洲——在线| 亚洲欧美日韩在线高清直播| 亚洲午夜久久久久久尤物 | 国产在线麻豆精品观看| 国产欧美综合在线| 国产一区二区精品久久91| 国产亚洲va综合人人澡精品| 国产欧美日韩在线视频| 国产老肥熟一区二区三区| 国产精品亚洲аv天堂网| 国产欧美精品一区aⅴ影院| 国产片一区二区| 国产夜色精品一区二区av| 国产综合网站| 亚洲高清久久网| 亚洲伦理网站| 亚洲一区999| 欧美亚洲综合另类| 久久精品国产999大香线蕉| 久久精品国产亚洲一区二区三区| 亚洲成人在线视频播放 | 99在线精品免费视频九九视| a4yy欧美一区二区三区| 亚洲专区在线视频| 欧美一区二区性| 久久久久久久久久久久久女国产乱| 久久久精品999| 欧美不卡在线视频| 欧美日韩一区二区三区免费| 国产精品国产成人国产三级| 国产乱码精品一区二区三| 国模精品娜娜一二三区| 亚洲激情图片小说视频| 亚洲视频一起| 久久精品亚洲一区二区| 99精品久久免费看蜜臀剧情介绍| 亚洲影院色在线观看免费| 久久国产精品久久久久久| 米奇777超碰欧美日韩亚洲| 欧美精品一区二区三区蜜臀| 国产精品毛片在线| 韩日在线一区| 日韩亚洲不卡在线| 午夜一区二区三视频在线观看| 亚洲国产岛国毛片在线| 一区二区三区你懂的| 欧美一区二区免费观在线| 老司机成人在线视频| 欧美日韩人人澡狠狠躁视频| 国产欧美精品国产国产专区| 在线激情影院一区| 亚洲一区二区三| 亚洲国产精品高清久久久| 在线视频欧美日韩| 久久久久亚洲综合| 欧美日韩色综合| 激情另类综合| 亚洲永久精品国产| 亚洲靠逼com| 欧美一区二区在线看| 欧美高清免费| 国产欧美日韩亚洲精品| 亚洲欧洲一二三| 性亚洲最疯狂xxxx高清| 99精品视频一区| 久久精品av麻豆的观看方式| 欧美日韩喷水| 影音先锋亚洲视频| 亚洲欧美日韩国产中文在线| 日韩午夜免费视频| 久久蜜桃精品| 国产精品久久久久一区| 亚洲日本成人| 亚洲第一级黄色片| 欧美在线观看视频一区二区| 欧美日韩一区二区在线观看视频| 国语自产在线不卡| 亚洲资源av| 中文有码久久| 欧美黄色成人网| 狠狠久久亚洲欧美专区| 午夜精品免费视频| 亚洲一区二区黄色| 欧美黄色小视频| 伊人久久亚洲美女图片| 香蕉久久夜色精品国产| 亚洲欧美在线播放| 欧美日韩国产小视频在线观看| 一区二区视频欧美| 性18欧美另类| 午夜视频精品| 欧美亚州韩日在线看免费版国语版| 亚洲激情在线观看| 久久大逼视频| 久久精品国产亚洲a| 国产精品视频免费观看| 正在播放亚洲| 中文精品99久久国产香蕉| 欧美大片一区| 激情五月***国产精品| 欧美一区二区成人6969| 欧美亚洲一区在线| 国产精品国产精品| 一区二区三区日韩| 亚洲一区高清| 国产精品v欧美精品v日韩| 亚洲最新视频在线播放| 在线一区二区日韩| 欧美日韩免费在线视频| 99在线精品免费视频九九视| 99成人免费视频| 欧美精品成人| 亚洲伦理在线免费看| 亚洲午夜激情在线| 国产精品裸体一区二区三区| 中日韩视频在线观看| 亚洲免费小视频| 国产精品免费网站在线观看| 亚洲一区二区三区精品视频| 亚洲欧美日韩国产综合| 国产精品男gay被猛男狂揉视频| 中文精品在线| 香蕉久久精品日日躁夜夜躁| 国产老女人精品毛片久久| 欧美一区二区免费| 久久婷婷久久| 亚洲成人自拍视频| 日韩午夜视频在线观看| 欧美视频不卡| 亚洲欧美日韩直播| 久久久www成人免费精品| 精品成人一区| 99视频精品| 国产精品视频免费观看| 久久精品国产2020观看福利| 欧美大片第1页| 一区二区三区视频在线播放| 午夜精品久久久久久久久久久| 国产农村妇女精品| 久久狠狠亚洲综合| 欧美激情一区二区三区| 一区二区动漫| 久久精品噜噜噜成人av农村| 影院欧美亚洲| 亚洲一区3d动漫同人无遮挡| 国产欧美一区二区白浆黑人| 亚洲国产欧美精品| 免费成人高清视频| 99精品欧美一区二区三区综合在线| 亚洲一区欧美| 国产欧美精品va在线观看| 久久激情综合| 欧美精品在线一区二区| 亚洲一区二区精品在线| 久久久久久久性| 美女主播一区| 久久爱www.| 狠狠色综合网| 亚洲美女福利视频网站| 国产精品成人一区| 欧美影院午夜播放| 欧美激情一区二区三级高清视频| 亚洲午夜三级在线| 老鸭窝毛片一区二区三区| 一本色道久久88亚洲综合88| 久久精品夜色噜噜亚洲aⅴ| 亚洲激情另类| 欧美日韩精品综合| 午夜精品亚洲一区二区三区嫩草| 猫咪成人在线观看| aa亚洲婷婷| 久久久亚洲国产天美传媒修理工 | 米奇777超碰欧美日韩亚洲| 亚洲大片在线观看| 一区二区三区视频在线| 国产性天天综合网| 一二三区精品福利视频| 亚洲欧美日韩国产精品| 国产精品久久久久久久久久免费看 | 99精品视频免费在线观看| 亚洲无玛一区| 国产精品自拍三区| 亚洲日韩第九十九页| 国产精品视频一二三| 亚洲欧洲另类| 国产欧美亚洲视频| 一个人看的www久久| 一区二区三区亚洲| 亚洲欧美视频在线观看| 亚洲欧洲午夜| 麻豆精品视频在线观看| 亚洲国产综合在线看不卡| 欧美日韩国产123区|