《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 基于注意力特征金字塔的輕量級(jí)目標(biāo)檢測(cè)算法
基于注意力特征金字塔的輕量級(jí)目標(biāo)檢測(cè)算法
2021年電子技術(shù)應(yīng)用第10期
趙義飛,王 勇
北京工業(yè)大學(xué) 信息學(xué)部,北京100124
摘要: 基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法因其模型復(fù)雜度和對(duì)計(jì)算能力的要求,難以部署在移動(dòng)設(shè)備等低算力平臺(tái)上。為了降低模型的規(guī)模,提出一種輕量級(jí)目標(biāo)檢測(cè)算法。該算法在自頂向下的特征融合的基礎(chǔ)之上,通過添加注意力機(jī)制構(gòu)建特征金字塔網(wǎng)絡(luò),以達(dá)到更細(xì)粒度的特征表達(dá)能力。該模型以分辨率為320×320的圖像作為輸入,浮點(diǎn)運(yùn)算量只有0.72 B,并在VOC數(shù)據(jù)集上取得了74.2%的mAP,達(dá)到了與傳統(tǒng)單階段目標(biāo)檢測(cè)算法相似的精度。實(shí)驗(yàn)數(shù)據(jù)表明,該算法在保持了檢測(cè)精度的同時(shí)顯著降低了模型運(yùn)算量,更適合低算力條件下的目標(biāo)檢測(cè)。
中圖分類號(hào): TN98;TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.211320
中文引用格式: 趙義飛,王勇. 基于注意力特征金字塔的輕量級(jí)目標(biāo)檢測(cè)算法[J].電子技術(shù)應(yīng)用,2021,47(10):33-37.
英文引用格式: Zhao Yifei,Wang Yong. Lightweight object detection algorithm based on attention feature pyramid network[J]. Application of Electronic Technique,2021,47(10):33-37.
Lightweight object detection algorithm based on attention feature pyramid network
Zhao Yifei,Wang Yong
Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China
Abstract: Object detection algorithms based on deep learning are difficult to deploy on low computing power platforms such as mobile devices due to their complexity and computational demands. In order to reduce the scale of the model, this paper proposed a lightweight object detection algorithm. Based on the top-down feature fusion, the algorithm built a feature pyramid network by adding an attention mechanism to achieve more fine-grained feature expression capabilities. The proposed model took an image with a resolution of 320×320 as input and had only 0.72 B FLOPs, achieved 74.2% mAP on the VOC dataset and the accuracy is similar to traditional one-stage object detection algorithms. Experimental data shows that the algorithm significantly reduces the computational complexity of the model, maintains the accuracy, and is more suitable for object detection with low computing power.
Key words : object detection;feature pyramid;attention mechanism;lightweight algorithm

0 引言

    目標(biāo)檢測(cè)是計(jì)算機(jī)視覺的關(guān)鍵組成部分之一,旨在探索統(tǒng)一框架下人類視覺認(rèn)知過程的模擬和行人檢測(cè)、人臉識(shí)別、文本檢測(cè)等特定應(yīng)用場(chǎng)景下視覺任務(wù)的完成。2012年,Krizhevsky等[1]提出的AlexNet將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在了圖像分類算法之中并取得了驚人的效果,從此基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)算法開始取代傳統(tǒng)的基于人工特征的算法,成為了計(jì)算機(jī)視覺領(lǐng)域的主流研究方向。

    目前基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法可分為單階段檢測(cè)算法和兩階段檢測(cè)算法兩類。單階段目標(biāo)檢測(cè)算法以SSD[2]和Yolo[3-5]系列算法為代表,是一種通過在卷積神經(jīng)網(wǎng)絡(luò)提取的特征圖上設(shè)置錨點(diǎn),并對(duì)每個(gè)錨點(diǎn)上預(yù)設(shè)的不同大小和長(zhǎng)寬比例的邊界框進(jìn)行檢測(cè)的方法。兩階段目標(biāo)檢測(cè)算法以RCNN[6-8]系列算法為代表,先在特征圖上采用額外步驟生成候選區(qū)域,再對(duì)候選區(qū)域進(jìn)行檢測(cè)。與單階段算法相比,兩階段算法一般擁有更高的檢測(cè)精度,但由于增加了額外的運(yùn)算量,檢測(cè)速度也相對(duì)較低。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://www.jysgc.com/resource/share/2000003778




作者信息:

趙義飛,王  勇

(北京工業(yè)大學(xué) 信息學(xué)部,北京100124)




wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 97视频免费观看2区| 日本xxxxx在线观看| 在线观看免费成人| 亚洲av成人一区二区三区| 精品国际久久久久999波多野| 成人18网址在线观看| 亚洲国产美女精品久久久久| 老子影院午夜伦不卡亚洲| 国产精品爽爽影院在线| 中文字幕在线影院| 欧美伊人久久久久久久久影院| 四虎影视在线影院在线观看| 美女扒开大腿让我爽| 扒开腿狂躁女人爽出白浆| 亚洲欧美日韩在线观看看另类| 超级无敌科技帝国| 国产裸舞福利资源在线视频| 丰满少妇AAAAAA爰片毛片| 欧美婷婷六月丁香综合色| 又大又粗又长视频| 男女xx动态图| 少妇丰满大乳被男人揉捏视频| 亚洲va无码va在线va天堂| 男人免费桶女人45分钟视频| 国产在线乱码在线视频| 99RE66在线观看精品免费| 好吊妞视频haodiaoniucom| 久久国产一区二区三区| 欧美日韩一区二区三区自拍| 午夜亚洲WWW湿好大| 麻豆国产剧果冻传媒视频| 国产视频一二三区| 99视频免费播放| 无人视频在线观看免费播放影院| 亚洲伦理中文字幕| 理论片在线观看韩影库| 免费网站看v片在线a| 车文里的冰块棉签是干啥用的| 国产成人va亚洲电影| 91在线丨亚洲| 成人免费福利电影|