应用科学学报 ›› 2023, Vol. 41 ›› Issue (6): 1058-1067.doi: 10.3969/j.issn.0255-8297.2023.06.012
曹菁1, 陈康1, 齐宁1, 夏鹏程1, 邱渝2
收稿日期:
2021-12-01
出版日期:
2023-11-30
发布日期:
2023-11-30
通信作者:
曹菁,工程师,研究方向为金融科技。E-mail:caojing103@126.com
E-mail:caojing103@126.com
CAO Jing1, CHEN Kang1, QI Ning1, XIA Pengcheng1, QIU Yu2
Received:
2021-12-01
Online:
2023-11-30
Published:
2023-11-30
摘要: 本文基于OCR和图像检测技术设计并实现了一个解决盖章文书图像审核耗时、低效、准确率无保障问题的自动审核方法。具体包括三个部分:文字识别、印章识别和表格内容审核。其中文字识别部分包括带有角度的文本检测算法SegLink以及卷积递归神经网络(convolutional recurrent neural network,CRNN);印章识别部分包括印章识别与提取算法YOLOv3和印章内容识别方法——极坐标变换法;表格内容审核部分根据预设的规则对表格内容进行完备性和正确性检测。实验结果表明,该方法对此类盖章文书图像具有较高的审核准确率。
中图分类号:
曹菁, 陈康, 齐宁, 夏鹏程, 邱渝. 基于OCR和图像检测的盖章文书图像自动审核方法[J]. 应用科学学报, 2023, 41(6): 1058-1067.
CAO Jing, CHEN Kang, QI Ning, XIA Pengcheng, QIU Yu. Auto-Checking Stamped Document Image Based on OCR and Image Detection[J]. Journal of Applied Sciences, 2023, 41(6): 1058-1067.
[1] 骆蓉, 黄俊, 黎茂锋, 等. 基于Word模板的复杂文档快速生成方法[J]. 计算机应用与软件, 2020, 37(10):57-63. Luo R, Huang J, Li M F, et al. A fast generation method of complex documents based on word template[J]. Computer Applications and Software, 2020, 37(10):57-63. (in Chinese) [2] Stevens M E. Introduction to the special issue on optical character recognition (OCR)[J]. Pattern Recognition, 1970, 2(3):147-150. [3] Tian Z, Huang W L, He T, et al. Detecting text in natural image with connectionist text proposal network[C]//European Conference on Computer Vision. Cham:Springer, 2016:56-72. [4] Zhou X Y, Yao C, Wen H, et al. EAST:an efficient and accurate scene text detector[C]//2017 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2017:2642-2651. [5] Yin W P, Schütze H, Xiang B, et al. ABCNN:attention-based convolutional neural network for modeling sentence pairs[J]. Transactions of the Association for Computational Linguistics, 2016, 4:259-272. [6] Shi B G, Bai X, Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(11):2298-2304. [7] 欧阳欢, 范大昭, 李东子. 多特征融合决策的发票印章识别[J]. 计算机工程与设计, 2018, 39(9):2842-2847. Ouyang H, Fan D Z, Li D Z. Invoice seal identification based on multi-feature fusion decision[J]. Computer Engineering and Design, 2018, 39(9):2842-2847. (in Chinese) [8] Shi B G, Bai X, Belongie S. Detecting oriented text in natural images by linking segments[C]//2017 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2017:3482-3490. [9] Redmon J, Farhadi A. YOLOv3:an incremental improvement[DB/OL]. 2018[2021-12-01]. https://arxiv.org/abs/1804.02767. [10] Shi X, Chen Z, Wang H, et al. Convolutional LSTM network:a machine learning approach for precipitation nowcasting[DB/OL]. 2015[2021-12-01]. https://arxiv.org/abs/1506.04214. [11] Wang Z, Li X, Zhou J. Small-footprint keyword spotting using deep neural network and connectionist temporal classifier[DB/OL]. 2017[2021-12-01]. https://arxiv.org/abs/1709.03665. [12] Everingham M, Van Gool L, Williams C K I, et al. The pascal visual object classes (VOC) challenge[J]. International Journal of Computer Vision, 2010, 88(2):303-338. |
[1] | 周啸辉, 余磊, 张睿婷, 熊邦书, 欧巧凤. 基于SASK和双分支结构的服装图像识别方法[J]. 应用科学学报, 2023, 41(6): 967-977. |
[2] | 沈坤烨, 周晓飞, 费晓波, 陈雨中, 张继勇, 颜成钢. 基于边缘感知深度残差网络的带钢表面缺陷检测[J]. 应用科学学报, 2023, 41(6): 978-988. |
[3] | 熊娟, 张孙杰, 阚亚亚, 陈家豪. 基于CAFPN和细化双头解耦的遥感图像目标检测[J]. 应用科学学报, 2023, 41(6): 989-1003. |
[4] | 李伟汉, 侯北平, 胡飞阳, 朱必宏. 阿尔茨海默症的多模态分类方法[J]. 应用科学学报, 2023, 41(6): 1004-1018. |
[5] | 阚亚亚, 张孙杰, 熊娟, 祖奕. 结合transformer多尺度实例交互的稀疏集目标检测[J]. 应用科学学报, 2023, 41(5): 777-788. |
[6] | 陈荟慧, 钟委钊. 基于人机协作的高质量城市图像采集方法[J]. 应用科学学报, 2023, 41(5): 801-814. |
[7] | 陈俊, 席宁丽, 李佳敏, 万晓容. 融合Skip-gram与R-SOPMI的教育领域情感词典构建[J]. 应用科学学报, 2023, 41(5): 870-880. |
[8] | 王辉, 丁铂栩. 三维点云表示的人体动作序列预测[J]. 应用科学学报, 2023, 41(3): 461-475. |
[9] | 罗凡, 熊邦书, 余磊, 汪婉灵. 基于DBAFFNet的低照度图像增强[J]. 应用科学学报, 2023, 41(3): 476-487. |
[10] | 史汶泽, 陆林, 秦文杰, 于涛. 一种可信执行环境下的联邦逻辑回归评分卡系统[J]. 应用科学学报, 2023, 41(3): 488-499. |
[11] | 赵小薇, 季明辉, 徐秀娟, 沈家乐. 应用掩码区域卷积神经网络的文本检测模型[J]. 应用科学学报, 2023, 41(3): 527-540. |
[12] | 萧晓彤, 丁建伟, 张琪. 基于局部和全局梯度上升的分段后门防御[J]. 应用科学学报, 2023, 41(2): 218-227. |
[13] | 张翔宇, 栗风永, 秦川. 基于块分类的密文域多重嵌入可逆信息隐藏算法[J]. 应用科学学报, 2023, 41(2): 272-283. |
[14] | 刘明辉, 唐望径, 许斌, 仝美涵, 王黎明, 钟琦, 徐剑军. 实体类别信息增强的命名实体识别算法[J]. 应用科学学报, 2023, 41(1): 1-9. |
[15] | 张亚坤, 李龙杰, 陈晓云. 利用朴素贝叶斯模型进行多层网络链接预测[J]. 应用科学学报, 2023, 41(1): 23-40. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||