《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > 一種基于FPGA的CNN硬件加速器實現
一種基于FPGA的CNN硬件加速器實現
電子技術應用
邱臻博
重慶郵電大學 光電工程學院, 重慶 400065
摘要: 提出了一種基于FPGA的通用CNN硬件加速器設計方案。針對計算量最大的卷積層,采用了輸入通道并行、核內并行、輸出通道并行三種加速方式,根據FPGA的片上資源,合理地設置相應并行度。在數據加載方面,采用相鄰數據位寬合并傳輸,有效提高了加速器的實際傳輸帶寬。基于行的數據流加載思想,設計了輸入緩存模塊。該緩存模塊只需緩存兩行數據即可開始卷積運算,有效地提前卷積運算的開始時間。在數據輸入、數據運算、數據輸出模塊之間,利用流水線循環優化方式,極大地提高了硬件的計算性能。最后將該加速器應用于VGG16和Darknet-19網絡,實驗表明,計算性能分別達到34.30 GOPS和33.68 GOPS,DSP計算效率分別高達79.45%和78.01%。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.234372
中文引用格式: 邱臻博. 一種基于FPGA的CNN硬件加速器實現[J]. 電子技術應用,2023,49(12):20-25.
英文引用格式: Qiu Zhenbo. An FPGA-based implementation of CNN hardware accelerator[J]. Application of Electronic Technique,2023,49(12):20-25.
An FPGA-based implementation of CNN hardware accelerator
Qiu Zhenbo
College of Photoelectric Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
Abstract: This paper proposes a general CNN hardware accelerator design scheme based on FPGA. For the most computationally intensive convolutional layer, three acceleration modes are adopted: input channel parallelism, intra-core parallelism, and output channel parallelism, and the corresponding parallelism degree is reasonably set according to the on-chip resources of FPGA. In terms of data loading, adjacent data bit width combined transmission is adopted, which effectively improves the actual transmission bandwidth of the accelerator. Based on the idea of row-based data flow loading, the input cache module is designed. The cache module only needs to cache two rows of data to start the convolution operation, effectively advancing the start time of the convolution operation. Between the data input, data operation, and data output modules, the pipeline cycle optimization method is used to greatly improve the computing performance of the hardware. Finally, the accelerator is applied to VGG16 and Darknet-19 networks, and experiments show that the computing performance reaches 34.30 GOPS and 33.68 GOPS, respectively, and the DSP computing efficiency is as high as 79.45% and 78.01%.
Key words : convolutional neural network acceleration;FPGA;row data loading;module division;pipeline structure

0 引言

隨著深度學習技術的飛速發展,神經網絡模型在圖像識別、目標檢測和圖像分割等領域取得了巨大技術進步[1-2]。然而相比較傳統算法,神經網絡在獲得高的性能同時也帶來了高計算復雜度的問題,使得基于專用硬件設備加速神經網絡成為神經網絡模型應用領域關注的焦點。目前,神經網絡模型硬件加速的主要方案有GPU、ASIC和FPGA三種方案。相比較GPU,FPGA具有成本功耗低的特點;相比較ASIC,FPGA具有模型實現靈活、開發速度快、綜合成本低的特點,特別適用于當前神經網絡在邊緣設備上部署的需求,因此基于FPGA的神經網絡模型加速研究成為當前神經網絡領域研究的熱點[3-5]。

大多數神經網絡模型中卷積層的運算量占到了總計算量的90%以上,因此可以通過在FPGA中執行卷積運算來實現神經網絡加速[6-7]。文獻[6]基于FPGA實現通用矩陣乘法加速器來實現神經網絡加速,獲得了很好的加速性能。文獻[7]則提出了一種基于脈動陣結構的矩陣乘法加速模塊,并用于神經網絡加速,獲得了較好的性能提升。文獻[8-9]從卷積運算的加速算法方面進行研究,Liang Y[8]等人基于二維Winograd算法在FPGA上對CNN進行了實現,與常規的卷積計算單元相比,該實現中基于二維Winograd算法設計的卷積計算單元將乘法操作減少了56%。Tahmid Abtahi[10]等人使用快速傅里葉變換(Fast Fourier Transform,FFT)對ResNet-20模型中的卷積運算進行優化,成功減少了單個卷積計算單元的DSP資源使用量。除卷積運算加速外,相關研究團隊對神經網絡加速過程中的其他方面也展開深入研究[10-14]。文獻[10]提出了一種塊卷積方法,這是傳統卷積的一種內存高效替代方法,將中間數據緩沖區從外部DRAM完全移動到片上存儲器,但隨著分塊層數的增加,精度會降低。文獻[11]提出一種相鄰層位寬合并和權重參數重排序的策略實現數據傳輸的優化方法,增加數據傳輸并行度的同時節省了通道的使用。文獻[12-14]采取乒-乓處理結構,分別在輸入模塊、卷積運算單元、輸出模塊方面提升了卷積運算的速率。



本文詳細內容請下載http://www.jysgc.com/resource/share/2000005800


作者信息

邱臻博

(重慶郵電大學 光電工程學院, 重慶 400065)




weidian.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
精品福利免费观看| 一区二区三区免费网站| 欧美连裤袜在线视频| 欧美一区二区三区四区在线| 一本久道久久综合中文字幕| 亚洲国产婷婷香蕉久久久久久99| 亚洲欧美不卡| 一本色道久久综合狠狠躁篇怎么玩 | 欧美午夜电影在线| 欧美精品久久久久久久免费观看| 久久综合色播五月| 久久综合伊人77777| 久久久久久久久久看片| 久久精品国产96久久久香蕉| 午夜精品国产更新| 午夜精品久久久久久| 亚洲一区二区三区免费观看 | 亚洲自拍偷拍麻豆| 亚洲一区二区三区精品视频| 亚洲网站在线看| 亚洲视频综合在线| 亚洲视频一区| 亚洲一区二区视频在线| 亚洲深夜激情| 亚洲永久免费| 亚洲欧美在线一区| 久久爱www久久做| 久久米奇亚洲| 乱码第一页成人| 免费成人av在线看| 欧美精品久久一区二区| 欧美日韩亚洲天堂| 国产精品久久久99| 国产精品一区免费观看| 国产视频欧美| 激情六月婷婷综合| 亚洲黄色成人| 99精品视频免费观看视频| 中文av一区特黄| 午夜电影亚洲| 亚洲福利国产| 亚洲美女在线一区| 亚洲手机视频| 性色av一区二区怡红| 久久免费精品日本久久中文字幕| 美女成人午夜| 欧美日韩精品在线播放| 国产精品久久久久久久久久久久久 | 亚洲综合色激情五月| 欧美一区二区视频在线| 亚洲国产综合视频在线观看| 夜夜嗨一区二区三区| 亚洲欧美成人综合| 久久久精品动漫| 欧美激情综合五月色丁香小说 | 精品成人在线观看| 亚洲精品免费一二三区| 亚洲一区二区高清视频| 亚洲高清三级视频| 一区二区三区日韩| 久久成人精品无人区| 欧美sm视频| 国产精品久久99| 伊人成人开心激情综合网| 亚洲精品欧美日韩专区| 亚洲免费小视频| 亚洲国产三级在线| 亚洲综合色激情五月| 久久一区二区三区四区| 欧美日韩国产精品一区| 国产三区精品| 日韩视频一区二区| 久久成人在线| 亚洲一区二区三区四区视频| 久久久久久夜| 欧美性事免费在线观看| 激情婷婷亚洲| 亚洲深夜影院| 亚洲精品欧美| 久久国产精品久久久久久电车| 欧美噜噜久久久xxx| 国产视频欧美视频| 亚洲最新在线| 亚洲欧洲在线一区| 久久精视频免费在线久久完整在线看| 欧美啪啪一区| 国模精品一区二区三区| 一本色道久久加勒比精品| 亚洲黄一区二区三区| 午夜国产精品视频免费体验区| 欧美激情成人在线| 国产真实乱偷精品视频免| 国产精品99久久久久久有的能看| 91久久在线播放| 久久精品视频免费| 欧美午夜大胆人体| 91久久黄色| 久久精品日产第一区二区| 午夜在线成人av| 欧美日韩久久不卡| 亚洲国产精品久久久久秋霞蜜臀| 新67194成人永久网站| 亚洲性线免费观看视频成熟| 欧美韩日亚洲| 在线观看国产精品淫| 欧美一级电影久久| 欧美一区二区大片| 国产精品久久久久久久久久尿| 亚洲卡通欧美制服中文| 亚洲日韩第九十九页| 卡一卡二国产精品| 韩国一区电影| 午夜视频在线观看一区| 先锋影音久久| 国产精品久久久久久久第一福利| 亚洲精品在线观看免费| 亚洲精品免费在线播放| 欧美1级日本1级| 激情久久五月| 久久精品一区四区| 久久久伊人欧美| 国产亚洲激情视频在线| 校园春色国产精品| 久久国产精品久久精品国产| 国产精品手机在线| 亚洲一区二区网站| 亚洲欧美日韩在线观看a三区| 国产精品大片免费观看| 一本到高清视频免费精品| 亚洲视频一区二区在线观看| 欧美日韩亚洲一区二区三区在线观看| 亚洲人体偷拍| 99成人在线| 欧美日韩精品一区二区在线播放 | 一区二区三区国产精品| 亚洲愉拍自拍另类高清精品| 欧美日韩亚洲一区二区三区在线| 亚洲精品美女91| 亚洲少妇自拍| 欧美午夜欧美| 亚洲一区免费| 久久精品国产99| 在线观看欧美亚洲| 亚洲精品久久久久久久久久久久久| 欧美成年人视频网站| 最新成人在线| 亚洲午夜电影在线观看| 国产精品免费在线| 欧美一二区视频| 久久综合伊人77777| 91久久国产综合久久91精品网站| 99视频有精品| 国产精品看片资源| 午夜精品国产更新| 久久婷婷激情| 亚洲精品视频在线观看网站| 亚洲一区二区三区欧美| 国产精品揄拍500视频| 久久国产精品黑丝| 欧美国产日韩一区二区在线观看| 日韩视频一区二区三区在线播放免费观看 | 麻豆9191精品国产| 亚洲精品久久久久久下一站| 亚洲特色特黄| 国产一区二区三区视频在线观看| 91久久综合| 欧美午夜精品理论片a级大开眼界 欧美午夜精品理论片a级按摩 | 欧美日韩精品免费看| 亚洲综合国产精品| 久久在线观看视频| 亚洲欧洲日产国产网站| 亚洲欧美激情四射在线日| 国产最新精品精品你懂的| 99在线精品视频在线观看| 国产精品久久77777| 久久精品30| 欧美日韩色一区| 久久经典综合| 欧美视频一区二区三区…| 午夜久久tv| 欧美激情中文不卡| 西西人体一区二区| 欧美精品系列| 欧美一级片一区| 欧美激情一区二区在线| 亚洲欧美另类在线观看| 欧美成人在线免费视频| 亚洲综合社区| 欧美一区国产一区| 久久免费精品视频| 亚洲成色精品| 中文欧美在线视频| 国产日韩欧美中文在线播放| 亚洲精品乱码久久久久久日本蜜臀 | 国产精品99久久久久久人| 国产亚洲免费的视频看| 亚洲日本中文| 国产视频欧美视频| 正在播放日韩| 在线观看日韩av先锋影音电影院|