《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于顏色分割的發(fā)票識別與自校正系統(tǒng)研究
基于顏色分割的發(fā)票識別與自校正系統(tǒng)研究
信息技術與網絡安全
王 濤
(同濟大學浙江學院 電子與信息工程系,浙江 嘉興314000)
摘要: 傳統(tǒng)基于二值圖像的框線特征提取信息的票據識別技術,其結果存在一定的差錯率,針對此問題,提出了基于顏色分割的發(fā)票識別與驗證系統(tǒng)。通過顏色分割和版式分析,將文字區(qū)域、二維碼及圖章等不同區(qū)域進行分割,分區(qū)域進行識別處理后,對發(fā)票關鍵信息進行比對驗證。與傳統(tǒng)的票據識別技術相比,該系統(tǒng)不僅可以完成發(fā)票自動識別,還可以結合二維碼信息進行自我驗證,提高了發(fā)票識別信息的準確性和完整性。
中圖分類號: TP311
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.05.014
引用格式: 王濤. 基于顏色分割的發(fā)票識別與自校正系統(tǒng)研究[J].信息技術與網絡安全,2021,40(5):80-85.
Research on invoice recognition and self correction system based on color segmentation
Wang Tao
(Department of Electronics and Information Engineering,Tongji Zhejiang College,Jiaxing 314000,China)
Abstract: Aiming at the problem of a certain error rate in the result of the traditional bill recognition technology based on the frame line feature extraction information of the binary image, an invoice recognition and verification system based on color segmentation is proposed. Through color segmentation and layout analysis, the text area, two-dimensional code, and stamps are divided into different areas, and the key information of the invoice is compared and verified after the area is identified. Compared with the traditional bill recognition technologies, this system can not only complete automatic invoice recognition, but also self-verify in combination with two-dimensional code information, which improves the accuracy and completeness of invoice recognition information.
Key words : color segmentation;invoice;two-dimensional code;auto recognition;OCR

0 引言

發(fā)票是企業(yè)經營或人們日常消費生活中不可或缺的一部分。面對日益增長的發(fā)票管理需求,無論是紙質發(fā)票還是電子發(fā)票,企業(yè)或個人都需要在發(fā)票信息的錄入、存儲及后續(xù)管理上花費很多時間。因此,應用現代技術對發(fā)票內容信息進行自動掃描識別并提取成為財務會計、計算機和軟件應用等多個領域共同希望解決的課題。何文琦[1]在分析了高校財務報銷難題后,提出了直接采用OCR技術對票據圖片進行識別,提取發(fā)票中的關鍵信息,減少網上報銷過程中的手工錄入環(huán)節(jié)。王林水[2]等提出了一個自動票據識別系統(tǒng),采用圖像預處理技術將圖像進行二值化,通過版面分析后進行字符識別。王貴新[3]等人建立了利用隱態(tài)馬爾可夫模型(HMMs)的銀行票據識別系統(tǒng),系統(tǒng)首先通過光電掃描設備將用戶填寫的票據掃描成灰度圖像,然后去掉票據的底色,使之變?yōu)楹诎讏D像,對黑白圖像進行去噪處理后,再進行文字的分割。

縱觀上述文獻,現有的研究都是將采集的發(fā)票圖像進行二值化處理,忽略掉圖片本身的顏色信息,其次不區(qū)分二維碼、印章等圖片組成,直接采用版式分析的方法或者OCR的方法對圖片中的文字進行識別,這必然帶來識別準確率的降低。而且上述方法都是對票面信息進行提取,并不進行驗證,這導致存在最終結果上的差錯率,在實際使用過程中還需要輔助人工驗證。鑒于此,本文提出通過顏色分割方法對發(fā)票圖片進行信息分層,得到二維碼、印章區(qū)域和文字區(qū)域,針對文字區(qū)域按照預設的格式進行文字識別,獲得發(fā)票上所記載的發(fā)票代碼、發(fā)票號碼、開票日期、購方稅號、銷方稅號、金額和稅額等信息;針對二維碼圖片進行自動掃描從互聯網服務器獲取發(fā)票代碼、發(fā)票號碼、開票日期、購方稅號、銷方稅號、金額和稅額等信息。然后將兩部分信息進行比對驗證發(fā)票的真?zhèn)巍r炞C為正確的發(fā)票分別將原始圖片和信息數據存入數據庫,對用戶的發(fā)票憑證進行統(tǒng)一的信息管理。驗證為錯誤的信息以二維碼獲取得信息為準存入數據庫,并在數據中進行標記以備后續(xù)查詢。



本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003556




作者信息:

王  濤

(同濟大學浙江學院 電子與信息工程系,浙江 嘉興314000)


此內容為AET網站原創(chuàng),未經授權禁止轉載。
主站蜘蛛池模板: 成人性一级视频在线观看| 欧美在线观看第一页| 无码专区aaaaaa免费视频| 亚洲中字慕日产2020| 洗澡被王总干好舒服小说| 午夜dj在线观看免费高清在线| 777奇米四色成人影视色区 | 黑人video| 女邻居拉开裙子让我挺进| 中文字幕影片免费在线观看| 日韩三级小视频| 亚洲综合激情另类小说区| 精品久久久一二三区| 国产日韩一区二区三区 | 免费看v片网站| 国产综合欧美日韩视频一区| av无码国产在线看免费网站| 日韩av高清在线看片| 五月婷婷电影网| 欧美亚洲国产成人综合在线| 亚洲日本va午夜中文字幕一区| 网站大全黄免费| 国产精品久久久久鬼色| 91香蕉视频污| 性色AV一区二区三区无码| 五月天婷婷在线观看视频| 欧美婷婷六月丁香综合色| 亚洲最大免费视频网| 欧美精品dorcelclub全集31| 亚洲精品国产综合久久一线| 浪小辉chinese野战做受| 亚洲精品视频专区| 热久久视久久精品18国产| 伊人久久大香线蕉综合AV| 男生女生一起差差很痛| 免费观看美女裸体网站| 精品久久久久久久中文字幕 | 亚洲视频一区二区在线观看| 狠狠色婷婷丁香六月| 人欧美一区二区三区视频xxx| 男朋友说我要冲你是什么意思|