《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于模板匹配OCR的報(bào)告自動(dòng)歸檔系統(tǒng)研究
基于模板匹配OCR的報(bào)告自動(dòng)歸檔系統(tǒng)研究
信息技術(shù)與網(wǎng)絡(luò)安全
張 辰1,陳 陽2
(1.廣東省建設(shè)工程質(zhì)量安全檢測(cè)總站有限公司,廣東 廣州510500; 2.廣東省建筑科學(xué)研究院集團(tuán)股份有限公司,廣東 廣州510500)
摘要: 針對(duì)建筑檢測(cè)行業(yè)中檢測(cè)報(bào)告多、人工歸檔效率低下的問題,利用模板匹配算法與LeNet框架建立了一套強(qiáng)魯棒性用于報(bào)告文件數(shù)字符號(hào)的OCR識(shí)別系統(tǒng)。針對(duì)報(bào)告中感興趣區(qū)域(ROI)位置和大小不固定的問題,采用了機(jī)器視覺領(lǐng)域中的模板匹配定位算法來定位報(bào)告文件的ROI區(qū)域。結(jié)合LeNet網(wǎng)絡(luò)與模板匹配定位算法,實(shí)現(xiàn)了傳統(tǒng)機(jī)器視覺方法與人工智能方法的結(jié)合,構(gòu)建了一套檢測(cè)報(bào)告自動(dòng)歸檔系統(tǒng)。所構(gòu)建的自動(dòng)歸檔系統(tǒng)的正確歸檔率達(dá)到了95.8%,有效節(jié)約了人工成本與時(shí)間成本。
中圖分類號(hào): TP274
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2021.08.014
引用格式: 張辰,陳陽. 基于模板匹配OCR的報(bào)告自動(dòng)歸檔系統(tǒng)研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(8):84-89.
Research on automatic filing system of detection report based on template matching and OCR recognition
Zhang Chen1,Chen Yang2
(1.Guangdong Construction Engineering Quality and Safety Inspection Station Co.,Ltd.,Guangzhou 510500,China; 2.Guangdong Building Research Institute Group Co.,Ltd.,Guangzhou 510500,China)
Abstract: In view of the problems of many detection reports and low efficiency of manual filing in the construction inspection industry, a strong robust OCR identification system for digital symbols of report files is established by using template matching algorithm and LeNet framework. Aiming at the problem that the location and size of ROI in the report are not fixed, a template matching location algorithm in the field of machine vision is used to locate the ROI region of the report file. Combined with the matching and positioning algorithm of LeNet network and template, the combination of traditional machine vision method and artificial intelligence method is realized, and a set of automatic filing system of detection report is constructed. The correct filing rate of the automatic archive system is 95.8%, which effectively saves labor cost and time cost.
Key words : template matching;OCR identification;automatic filing

0 引言

光學(xué)字符識(shí)別(Optical Character Recognition,OCR)是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,獲取文字及版面信息的過程。亦即將圖像中的文字進(jìn)行識(shí)別,并以文本的形式返回。其在文檔歸檔應(yīng)用背景下具有廣闊的市場(chǎng)前景。OCR字符識(shí)別技術(shù)經(jīng)過多年發(fā)展,已有LeNet[1]、RRPN[2]、DMPNet[3]、CTPN[4]等OCR網(wǎng)絡(luò)結(jié)構(gòu)被提出。其中,CTPN是目前應(yīng)用最廣的文本檢測(cè)模型之一。其基本假設(shè)是單個(gè)字符相較于異質(zhì)化程度更高的文本行更容易被檢測(cè),因此先對(duì)單個(gè)字符進(jìn)行類似R-CNN的檢測(cè),并在檢測(cè)網(wǎng)絡(luò)中加入雙向LSTM[5],使檢測(cè)結(jié)果形成序列提供了文本的上下文特征,便可以將多個(gè)字符進(jìn)行合并得到文本行。LeNet網(wǎng)絡(luò)提出時(shí)間較早,在銀行票據(jù)手寫體字符識(shí)別方面有著長(zhǎng)期的應(yīng)用。上述網(wǎng)絡(luò)結(jié)構(gòu)可以在通用背景下有效識(shí)別場(chǎng)景中的字符,對(duì)于非垂直文本也能進(jìn)行檢測(cè)。對(duì)于大多數(shù)OCR的應(yīng)用場(chǎng)景,并不需要對(duì)圖片中的所有字符進(jìn)行識(shí)別,往往只需要對(duì)部分ROI區(qū)域的字符進(jìn)行檢測(cè),但OCR技術(shù)對(duì)ROI區(qū)域的位移與旋轉(zhuǎn)適應(yīng)性較差,需要訓(xùn)練單獨(dú)的網(wǎng)絡(luò)來對(duì)ROI區(qū)域進(jìn)行定位。機(jī)器視覺技術(shù)在制造業(yè)領(lǐng)域有著廣泛的應(yīng)用,特別是在工件定位、視覺測(cè)量等方面有大量成熟的算法,其中,模板匹配算法則針對(duì)工業(yè)定位[6-7]的應(yīng)用背景,提出了基于灰度[8]、邊緣[9]、變換域[10]的模板匹配算法,能適應(yīng)各種工業(yè)定位需求[11-15]。



本文詳細(xì)內(nèi)容請(qǐng)下載:http://www.jysgc.com/resource/share/2000003731



作者信息:

張  辰1,陳  陽2

(1.廣東省建設(shè)工程質(zhì)量安全檢測(cè)總站有限公司,廣東 廣州510500;

2.廣東省建筑科學(xué)研究院集團(tuán)股份有限公司,廣東 廣州510500)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 小h片在线观看| 果冻传媒国产仙踪林欢迎你| 可以免费看黄的网站| 麻豆三级在线播放| 国产精品xxx| 91在线老王精品免费播放| 天天5g天天爽永久免费看欧美| 中文字幕专区在线亚洲| 日本高清免费不卡视频| 亚洲av无码精品色午夜果冻不卡| 欧美日韩精品久久免费| 免费中文字幕不卡视频| 精品欧美一区二区三区四区| 国产乱人伦偷精品视频不卡| 国产黑丝袜在线| 国产精品18久久久久久麻辣| 91w乳液78w78wyw5| 在线日韩理论午夜中文电影| gay精牛cum| 妞干网在线观看| 一级做a爰片久久毛片下载| 成年日韩片av在线网站| 久久久久久久综合狠狠综合| 日韩一区二区视频| 久久综合九色综合欧美就去吻| 欧男同同性videos免费| 亚洲国产一区二区三区| 欧美成人免费一级人片| 亚洲成色在线综合网站| 欧美色视频在线| 亚洲熟妇少妇任你躁在线观看无码| 热re99久久精品国产66热| 从镜子里看我怎么c你的阅读视频| 精品一区二区三区在线视频观看 | 一本伊大人香蕉高清在线观看| 成年女人a毛片免费视频| 丰满少妇被粗大的猛烈进出视频 | 国产欧美日韩综合精品一区二区| 福利免费在线观看| 国产精品久久久尹人香蕉| sss欧美一区二区三区|