应用科学学报 ›› 2023, Vol. 41 ›› Issue (6): 1058-1067.doi: 10.3969/j.issn.0255-8297.2023.06.012
曹菁1, 陈康1, 齐宁1, 夏鹏程1, 邱渝2
收稿日期:2021-12-01
出版日期:2023-11-30
发布日期:2023-11-30
通信作者:
曹菁,工程师,研究方向为金融科技。E-mail:caojing103@126.com
E-mail:caojing103@126.com
CAO Jing1, CHEN Kang1, QI Ning1, XIA Pengcheng1, QIU Yu2
Received:2021-12-01
Online:2023-11-30
Published:2023-11-30
摘要: 本文基于OCR和图像检测技术设计并实现了一个解决盖章文书图像审核耗时、低效、准确率无保障问题的自动审核方法。具体包括三个部分:文字识别、印章识别和表格内容审核。其中文字识别部分包括带有角度的文本检测算法SegLink以及卷积递归神经网络(convolutional recurrent neural network,CRNN);印章识别部分包括印章识别与提取算法YOLOv3和印章内容识别方法——极坐标变换法;表格内容审核部分根据预设的规则对表格内容进行完备性和正确性检测。实验结果表明,该方法对此类盖章文书图像具有较高的审核准确率。
中图分类号:
曹菁, 陈康, 齐宁, 夏鹏程, 邱渝. 基于OCR和图像检测的盖章文书图像自动审核方法[J]. 应用科学学报, 2023, 41(6): 1058-1067.
CAO Jing, CHEN Kang, QI Ning, XIA Pengcheng, QIU Yu. Auto-Checking Stamped Document Image Based on OCR and Image Detection[J]. Journal of Applied Sciences, 2023, 41(6): 1058-1067.
| [1] 骆蓉, 黄俊, 黎茂锋, 等. 基于Word模板的复杂文档快速生成方法[J]. 计算机应用与软件, 2020, 37(10):57-63. Luo R, Huang J, Li M F, et al. A fast generation method of complex documents based on word template[J]. Computer Applications and Software, 2020, 37(10):57-63. (in Chinese) [2] Stevens M E. Introduction to the special issue on optical character recognition (OCR)[J]. Pattern Recognition, 1970, 2(3):147-150. [3] Tian Z, Huang W L, He T, et al. Detecting text in natural image with connectionist text proposal network[C]//European Conference on Computer Vision. Cham:Springer, 2016:56-72. [4] Zhou X Y, Yao C, Wen H, et al. EAST:an efficient and accurate scene text detector[C]//2017 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2017:2642-2651. [5] Yin W P, Schütze H, Xiang B, et al. ABCNN:attention-based convolutional neural network for modeling sentence pairs[J]. Transactions of the Association for Computational Linguistics, 2016, 4:259-272. [6] Shi B G, Bai X, Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(11):2298-2304. [7] 欧阳欢, 范大昭, 李东子. 多特征融合决策的发票印章识别[J]. 计算机工程与设计, 2018, 39(9):2842-2847. Ouyang H, Fan D Z, Li D Z. Invoice seal identification based on multi-feature fusion decision[J]. Computer Engineering and Design, 2018, 39(9):2842-2847. (in Chinese) [8] Shi B G, Bai X, Belongie S. Detecting oriented text in natural images by linking segments[C]//2017 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2017:3482-3490. [9] Redmon J, Farhadi A. YOLOv3:an incremental improvement[DB/OL]. 2018[2021-12-01]. https://arxiv.org/abs/1804.02767. [10] Shi X, Chen Z, Wang H, et al. Convolutional LSTM network:a machine learning approach for precipitation nowcasting[DB/OL]. 2015[2021-12-01]. https://arxiv.org/abs/1506.04214. [11] Wang Z, Li X, Zhou J. Small-footprint keyword spotting using deep neural network and connectionist temporal classifier[DB/OL]. 2017[2021-12-01]. https://arxiv.org/abs/1709.03665. [12] Everingham M, Van Gool L, Williams C K I, et al. The pascal visual object classes (VOC) challenge[J]. International Journal of Computer Vision, 2010, 88(2):303-338. |
| [1] | 李永桢, 马涪元, 马世旋, 王钰涵, 王英. 基于结构增强和深度聚类的网络群体识别[J]. 应用科学学报, 2026, 44(1): 1-20. |
| [2] | 李银香, 杜文元, 许哲, 彭晨, 颜建强. 基于自适应池增强注意力机制的交通模式实时识别算法[J]. 应用科学学报, 2026, 44(1): 21-33. |
| [3] | 张钰婷, 滕飞, 叶晓庆. 基于高斯度量学习的不确定性知识图谱推理模型[J]. 应用科学学报, 2026, 44(1): 50-66. |
| [4] | 向尕, 胡演, 张仰森, 孙露, 齐睿, 谭自程. 面向威胁情报分析的恶意软件知识图谱构建[J]. 应用科学学报, 2026, 44(1): 67-82. |
| [5] | 伊华伟, 宋仕玺, 王艳飞, 白思怡. 融合图神经网络和深度图聚类的联邦推荐算法[J]. 应用科学学报, 2026, 44(1): 83-96. |
| [6] | 吴文强, 陈爱斌, 李潇瑶. 基于特征融合注意力和对比学习的森林图像去雾[J]. 应用科学学报, 2026, 44(1): 97-109. |
| [7] | 张晓明, 冯泽嘉, 王会勇, 张晓静. 基于动态注意力强化学习的可解释学习路径推荐[J]. 应用科学学报, 2026, 44(1): 110-133. |
| [8] | 金正洋, 阎少宏, 张艳博, 姚旭龙, 陶志刚, 陈志远. 融合空间纹理特征的三维模糊聚类算法[J]. 应用科学学报, 2026, 44(1): 134-148. |
| [9] | 徐凯, 池明得, 王崎, 李建州, 张辉. 融合BERT编码层的多粒度语义方面级情感分析模型[J]. 应用科学学报, 2026, 44(1): 149-165. |
| [10] | 刘永畅, 杜怡颖, 吴翠莹, 刘亚文. 航空影像引导的LiDAR点云语义分割[J]. 应用科学学报, 2025, 43(6): 922-934. |
| [11] | 王金伟, 黄琬云, 张家伟, 罗向阳, 马宾. 基于可恢复对抗水印的主动防御方法[J]. 应用科学学报, 2025, 43(6): 935-947. |
| [12] | 郭彦纯, 熊邦书, 黎文超, 温书远. 基于零参考网络的直升机桨叶低光图像增强[J]. 应用科学学报, 2025, 43(6): 990-1002. |
| [13] | 闫振国, 陈杨, 刘如飞, 王金博, 张佳琦. 基于空间临近的森林样地树木点云分割方法[J]. 应用科学学报, 2025, 43(6): 1003-1014. |
| [14] | 高剑奇, 黄典, 骆祥峰. 基于句法语义增强的实体事件关系对联合抽取[J]. 应用科学学报, 2025, 43(6): 1024-1036. |
| [15] | 韩佳洁, 苑清扬, 张博, 赵鑫, 兰天, 李郁. 基于少测点噪声数据重构问题的改进Gappy POD算法[J]. 应用科学学报, 2025, 43(5): 740-756. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||