《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于深度注意力的融合全局和語義特征的圖像描述模型
基于深度注意力的融合全局和語義特征的圖像描述模型
網絡安全與數據治理
及昕浩,彭玉青
(河北工業大學人工智能與數據科學學院,天津300401)
摘要: 現有的圖像描述模型使用全局特征時受限于感受野大小相同,而基于對象區域的圖像特征缺少背景信息。為此,提出了一種新的語義提取模塊提取圖像中的語義特征,使用多特征融合模塊將全局特征與語義特征進行融合,使得模型同時關注圖像的關鍵對象內容信息和背景信息。并提出基于深度注意力的解碼模塊,對齊視覺和文本特征以生成更高質量的圖像描述語句。所提模型在Microsoft COCO數據集上進行了實驗評估,分析結果表明該方法能夠明顯提升描述的性能,相較于其他先進模型具有競爭力。
中圖分類號:TP391文獻標識碼:ADOI: 10.19358/j.issn.2097-1788.2024.02.008
引用格式:及昕浩,彭玉青.基于深度注意力的融合全局和語義特征的圖像描述模型[J].網絡安全與數據治理,2024,43(2):49-53.
Deep attention based image caption model with fusion of global and semantic feature
Ji Xinhao,Peng Yuqing
(School of Artificial Intelligence, Hebei University of Technology, Tianjin 300401,China)
Abstract: Aiming at the problems that existing image caption generation models face limitations when utilizing global features due to the fixed receptive field size, and object region based image features lack background information, an image caption model(DFGS) is proposed. A multifeature fusion module is designed to fuse global and semantic feature, allowing the model to focus on key object and background information in the image. A deep attentionbased decoding module is designed to align visual and textual features, enhancing the generation of higher quality image description statements. Experimental results on MSCOCO dataset show that the proposed model can produce more accurate captions, and is competitive compared with other advanced models.
Key words : image caption; global feature; semantic feature; feature fusion

引言

圖像描述[1-2]是一種使用自然語言描述圖像內容的任務,是一項涉及計算機視覺領域和自然語言處理領域的跨領域研究內容。目前大多數方法使用卷積神經網絡(Convolutional Neural Network, CNN)編碼圖像以提取圖像特征,然后使用Transformer網絡結構來解析圖像特征并生成描述語句。Pan等人[3]提出了XLinear注意力塊來捕獲單或多模態之間的二階相互作用,并將其集成到Transformer編碼器和解碼器中。Cornia等人[4]在Transformer編碼器和解碼器中設計了類似網格的連接,以利用編碼器的低級和高級特征。多數研究者針對Transformer網絡結構進行改進,沒有關注CNN提取到的圖像特征其對應的感受野是均勻的網格,難以明顯地關注圖像中對象內容信息的問題。此外Transformer模型中的注意力機制僅僅是隱式地計算單個區域和其他區域的相似性,無法捕捉長距離的關系。


作者信息:

及昕浩,彭玉青

(河北工業大學人工智能與數據科學學院,天津300401)


文章下載地址:http://www.jysgc.com/resource/share/2000005902


weidian.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 又爽又黄又无遮挡的视频在线观看 | 亚洲av中文无码乱人伦在线观看| 玩弄CHINESE丰满人妻VIDEOS| 国产97在线观看| 高清不卡毛片免费观看| 国产精品va在线观看无| 91久久精品午夜一区二区| 天天爽夜夜爽夜夜爽精品视频| 中文字幕www| 日日干日日操日日射| 久久精品国产一区二区三区肥胖| 欧美丰满熟妇BBB久久久| 亚洲欧洲另类春色校园网站 | 国产精品9999久久久久| 80电影天堂网理论r片| 夜精品a一区二区三区| zooslook欧美另类最新| 性欧美高清come| 中文字幕专区高清在线观看| 日本a∨在线播放高清| 久久免费观看视频| 日韩欧美视频在线| 乱色熟女综合一区二区三区| 欧美一区二区激情三区| 亚洲国产精品久久久久秋霞小| 欧美爽爽爽爽爽爽视频| 亚洲精品tv久久久久久久久久 | 成人口工漫画网站免费| 中文字幕精品视频在线观| 日本在线高清视频日本在线观看成人小视频| 亚洲av乱码一区二区三区香蕉| 欧美一级黄色片视频| 亚洲噜噜噜噜噜影院在线播放| 欧美成在线观看| 亚洲第一网站免费视频| 浪荡女天天不停挨cao日常视频| 人与禽交免费网站视频| 狠狠色丁香久久婷婷综合五月| 免费国产黄网站在线观看视频| 秋霞理论最新三级理论最| 免费国产成人高清在线观看麻豆|