《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > 一種基于FPGA的CNN硬件加速器實現
一種基于FPGA的CNN硬件加速器實現
電子技術應用
邱臻博
重慶郵電大學 光電工程學院, 重慶 400065
摘要: 提出了一種基于FPGA的通用CNN硬件加速器設計方案。針對計算量最大的卷積層,采用了輸入通道并行、核內并行、輸出通道并行三種加速方式,根據FPGA的片上資源,合理地設置相應并行度。在數據加載方面,采用相鄰數據位寬合并傳輸,有效提高了加速器的實際傳輸帶寬。基于行的數據流加載思想,設計了輸入緩存模塊。該緩存模塊只需緩存兩行數據即可開始卷積運算,有效地提前卷積運算的開始時間。在數據輸入、數據運算、數據輸出模塊之間,利用流水線循環優化方式,極大地提高了硬件的計算性能。最后將該加速器應用于VGG16和Darknet-19網絡,實驗表明,計算性能分別達到34.30 GOPS和33.68 GOPS,DSP計算效率分別高達79.45%和78.01%。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.234372
中文引用格式: 邱臻博. 一種基于FPGA的CNN硬件加速器實現[J]. 電子技術應用,2023,49(12):20-25.
英文引用格式: Qiu Zhenbo. An FPGA-based implementation of CNN hardware accelerator[J]. Application of Electronic Technique,2023,49(12):20-25.
An FPGA-based implementation of CNN hardware accelerator
Qiu Zhenbo
College of Photoelectric Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
Abstract: This paper proposes a general CNN hardware accelerator design scheme based on FPGA. For the most computationally intensive convolutional layer, three acceleration modes are adopted: input channel parallelism, intra-core parallelism, and output channel parallelism, and the corresponding parallelism degree is reasonably set according to the on-chip resources of FPGA. In terms of data loading, adjacent data bit width combined transmission is adopted, which effectively improves the actual transmission bandwidth of the accelerator. Based on the idea of row-based data flow loading, the input cache module is designed. The cache module only needs to cache two rows of data to start the convolution operation, effectively advancing the start time of the convolution operation. Between the data input, data operation, and data output modules, the pipeline cycle optimization method is used to greatly improve the computing performance of the hardware. Finally, the accelerator is applied to VGG16 and Darknet-19 networks, and experiments show that the computing performance reaches 34.30 GOPS and 33.68 GOPS, respectively, and the DSP computing efficiency is as high as 79.45% and 78.01%.
Key words : convolutional neural network acceleration;FPGA;row data loading;module division;pipeline structure

0 引言

隨著深度學習技術的飛速發展,神經網絡模型在圖像識別、目標檢測和圖像分割等領域取得了巨大技術進步[1-2]。然而相比較傳統算法,神經網絡在獲得高的性能同時也帶來了高計算復雜度的問題,使得基于專用硬件設備加速神經網絡成為神經網絡模型應用領域關注的焦點。目前,神經網絡模型硬件加速的主要方案有GPU、ASIC和FPGA三種方案。相比較GPU,FPGA具有成本功耗低的特點;相比較ASIC,FPGA具有模型實現靈活、開發速度快、綜合成本低的特點,特別適用于當前神經網絡在邊緣設備上部署的需求,因此基于FPGA的神經網絡模型加速研究成為當前神經網絡領域研究的熱點[3-5]。

大多數神經網絡模型中卷積層的運算量占到了總計算量的90%以上,因此可以通過在FPGA中執行卷積運算來實現神經網絡加速[6-7]。文獻[6]基于FPGA實現通用矩陣乘法加速器來實現神經網絡加速,獲得了很好的加速性能。文獻[7]則提出了一種基于脈動陣結構的矩陣乘法加速模塊,并用于神經網絡加速,獲得了較好的性能提升。文獻[8-9]從卷積運算的加速算法方面進行研究,Liang Y[8]等人基于二維Winograd算法在FPGA上對CNN進行了實現,與常規的卷積計算單元相比,該實現中基于二維Winograd算法設計的卷積計算單元將乘法操作減少了56%。Tahmid Abtahi[10]等人使用快速傅里葉變換(Fast Fourier Transform,FFT)對ResNet-20模型中的卷積運算進行優化,成功減少了單個卷積計算單元的DSP資源使用量。除卷積運算加速外,相關研究團隊對神經網絡加速過程中的其他方面也展開深入研究[10-14]。文獻[10]提出了一種塊卷積方法,這是傳統卷積的一種內存高效替代方法,將中間數據緩沖區從外部DRAM完全移動到片上存儲器,但隨著分塊層數的增加,精度會降低。文獻[11]提出一種相鄰層位寬合并和權重參數重排序的策略實現數據傳輸的優化方法,增加數據傳輸并行度的同時節省了通道的使用。文獻[12-14]采取乒-乓處理結構,分別在輸入模塊、卷積運算單元、輸出模塊方面提升了卷積運算的速率。



本文詳細內容請下載http://www.jysgc.com/resource/share/2000005800


作者信息

邱臻博

(重慶郵電大學 光電工程學院, 重慶 400065)




weidian.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲毛片一区| 亚洲欧洲精品一区二区三区波多野1战4| 国产精品视频网站| 欧美理论在线播放| 欧美高清视频一区二区三区在线观看| 久久九九国产精品| 久久精品夜夜夜夜久久| 香蕉av777xxx色综合一区| 亚洲小说欧美另类社区| 亚洲视频香蕉人妖| 亚洲婷婷综合久久一本伊一区| 一区二区三区成人精品| 一区二区三区久久精品| 一区二区三区视频在线| 在线视频你懂得一区二区三区| 日韩一二三区视频| 一区二区三区|亚洲午夜| 亚洲视频狠狠| 亚洲女同在线| 欧美亚洲日本一区| 久久久国产一区二区| 久久一区亚洲| 欧美国产免费| 欧美日韩亚洲综合在线| 欧美调教vk| 国产精品自拍网站| 国内精品久久久久伊人av| 狠狠色狠狠色综合日日五| 18成人免费观看视频| 亚洲欧洲日本国产| 一区二区三区四区国产精品| 亚洲一级二级在线| 欧美在线视频a| 亚洲精品免费一二三区| 在线午夜精品| 欧美亚洲网站| 免费久久99精品国产| 欧美精品1区2区| 国产精品激情电影| 国内免费精品永久在线视频| 亚洲国产片色| 亚洲视频中文字幕| 久久国产精品色婷婷| 日韩视频中文| 午夜亚洲伦理| 免费中文日韩| 国产精品第一区| 国内一区二区在线视频观看| 亚洲精品视频在线播放| 亚洲免费小视频| 亚洲国产精品综合| 亚洲午夜精品网| 久久精品视频在线观看| 欧美精品九九| 国产三级精品在线不卡| 亚洲国产一区二区视频| 亚洲一区二区高清| 91久久国产综合久久| 亚洲欧美激情在线视频| 免费在线欧美视频| 国产精品视频一| 亚洲国产欧美久久| 亚洲尤物视频在线| 亚洲卡通欧美制服中文| 午夜欧美视频| 欧美黄色aa电影| 国产日韩亚洲欧美综合| 亚洲人成人99网站| 午夜在线一区二区| 一区二区激情| 老司机午夜精品视频| 国产精品久久久99| 亚洲黄色小视频| 欧美一区网站| 午夜精品成人在线| 欧美精品一区二| 激情小说亚洲一区| 亚洲欧美日韩在线一区| 在线视频精品| 欧美成人福利视频| 国产最新精品精品你懂的| 在线视频欧美日韩| 99国产精品国产精品久久| 久久久噜噜噜久久久| 国产精品九九| 日韩午夜剧场| 亚洲日本成人| 久久综合成人精品亚洲另类欧美 | 国产精品视频一区二区三区| 91久久在线观看| 亚洲国产高清在线| 久久不射网站| 国产精品久久久久高潮| 99国产精品久久| 一区二区高清视频| 欧美精品久久久久久久免费观看 | 亚洲欧美韩国| 亚洲男女自偷自拍| 欧美日韩xxxxx| 亚洲国产精品一区二区www| 久久国产精品网站| 久久精品视频在线免费观看| 国产精品无码永久免费888| 一本大道久久a久久综合婷婷| 亚洲精品午夜| 欧美高清在线精品一区| 亚洲国产mv| 亚洲人成小说网站色在线| 久久亚洲私人国产精品va| 国产日韩欧美中文在线播放| 亚洲欧美成人在线| 午夜精品国产更新| 国产麻豆精品theporn| 亚洲永久免费观看| 性欧美1819sex性高清| 国产精品视频久久久| 亚洲欧美精品在线观看| 性伦欧美刺激片在线观看| 国产精品一区视频网站| 午夜精品婷婷| 久久国产精品免费一区| 国产一区二区三区观看| 久久都是精品| 麻豆av一区二区三区| 136国产福利精品导航网址| 亚洲日本成人女熟在线观看| 欧美精品1区2区3区| 日韩香蕉视频| 亚洲女女女同性video| 国产精品一区2区| 欧美在线不卡视频| 久热国产精品视频| 亚洲国产你懂的| 在线亚洲电影| 国产精品一区二区黑丝| 香蕉久久一区二区不卡无毒影院| 久久av一区二区三区漫画| 国产视频精品免费播放| 久久精品国产77777蜜臀 | 国产精品日韩高清| 欧美一二三视频| 美女被久久久| 日韩一级成人av| 销魂美女一区二区三区视频在线| 国产日韩精品视频一区| 亚洲高清免费| 欧美连裤袜在线视频| 亚洲天堂av在线免费| 久久九九精品99国产精品| 在线不卡中文字幕| 一区二区高清视频| 国产女主播在线一区二区| 久久精品观看| 欧美日韩少妇| 午夜在线一区二区| 欧美成人免费小视频| 中文在线资源观看网站视频免费不卡 | 亚洲综合第一页| 裸体女人亚洲精品一区| 日韩午夜激情电影| 久久精品国产视频| 亚洲欧洲美洲综合色网| 性亚洲最疯狂xxxx高清| 玉米视频成人免费看| 亚洲性av在线| 激情久久久久| 亚洲欧美国产精品va在线观看 | 精品福利电影| 亚洲素人在线| 狠狠色综合网| 亚洲特级片在线| 国内精品视频666| 一区二区三区视频观看| 国产亚洲一区二区三区在线观看| 亚洲免费电影在线观看| 国产欧美日韩精品在线| 亚洲精品欧美极品| 国产毛片一区| 一区二区三区日韩在线观看| 国产一区二区三区四区在线观看 | 免费91麻豆精品国产自产在线观看| av成人福利| 免费不卡在线视频| 亚洲午夜91| 欧美黄色网络| 欧美在线综合视频| 国产精品久久久久久久久免费樱桃 | 亚洲精品国产精品国产自| 国产精品久久二区二区| 亚洲精品乱码久久久久久久久| 国产精品夜夜夜| 一本一道久久综合狠狠老精东影业| 国内成人精品一区| 亚洲欧美日韩中文播放| 亚洲黄一区二区| 久久人人九九| 欧美一级在线播放| 国产精品久久久久久久久久ktv| 日韩午夜中文字幕| 好吊视频一区二区三区四区|