OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
鉴于计算机视觉的广泛应用和巨大潜力,它已成为人工智能和机器学习最热门的子领域之一。其目标——复制人类视觉强大的能力。而我们今天要讲的是计算机视觉领域应用较早的且较为成熟的OCR技术的应用。下面我们来看看OCR的几大应用。
1)文档识别
文档识别主要应用于学习工作等一些关于文档处理的办公领域,可以快速高效利用OCR技术对文案文档、书籍、表格、说明书、简历、合同等各类纸质文档进行识别,另外可以通过云端技术将识别后的内容以及图像上传到服务器进行备份储存,并具备方便的检索功能,可以使用户简单方便的找到备份的内容。同时,也可以识别原文档的排版,按原排版格式将识别结果输出到word或pdf等格式,便于文档电子化形成和保存。
2)证照识别
是利用扫描仪、数码相机、或手机相机拍摄各种证件图像(二代身份证、护照、驾照、行驶证等),快速扫描并通过OCR技术读取证件图像上的所有文字信息,并通过结构化数据提取算法自动判别证件上的各栏位信息,输出结构化信息,并存入证件信息数据库。目前常用的证照识别有身份证识别、驾照识别、行驶证识别、名片识别、银行卡识别、护照识别、结婚证识别、户口本识别等等
3)票据识别
正常时通过扫描仪或手机进行票据图像的获取,并通过OCR技术读取票据图像上的所有文字信息,并通过结构化数据提取算法自动判别票据上的关键信息。目前常用的票据识别应用有医疗票据识别、增值税发票识别和财务票据识别等等
4)车牌识别|
车牌识别技术要求能够将运动中的汽车牌照从复杂背景中提取并识别出来,通过车牌提取、图像预处理、特征提取、车牌字符识别等技术,识别车辆牌号、颜色等信息,目前最新的技术水平为字母和数字的识别率可达到99.7%,汉字的识别率可达到99%。