java调用身份证识别OCR

java调用身份证识别OCR

(服务器端身份证识别,服务器版身份证OCR识别软件,云端身份证识别,web service)

java调用身份证识别OCR即服务器版身份证OCR识别软件,该软件可部署在客户私有服务器中(私有本地服务器或云服务器均可),APP和业务系统可通过web service接口调用该识别服务,设备端只负责拍摄图像后上传,上传到已部署java调用身份证识别OCR软件的服务器中进行识别,识别完成后再返回标准的XML数据。整个识别过程和我公司没有任何交互,均在企业自有的服务器上完成识别。 java调用身份证识别OCR软件目前支持Windows、Linux等主流服务器操作系统。

java调用身份证识别OCR示意图

(除服务器身份证识别软件外,我司还提供服务器版银行卡识别识别软件、服务器版行驶证识别软件,服务版名片识别软件,服务器版名片识别软件)

java调用身份证识别OCR主要特点功能:

1.识别身份证种类多:可识别汉族身份证、少数民族身份证、台湾身份证、澳门身份证、香港身份证及部分国外身份证;

2.识别时间快:识别一张身份证的速度小于1秒,包含整网络交换过程也可在2秒内完成。

3.支持多进程识别方式:可在客户同一服务器中部署多套服务版OCR识别软件,并支持多进程同时识别。 4.支持负载均衡,自动分发。

5.提供多种接口调用方式:目前提供WebService、Rest Service、Http等多种接口方式。

移动tel:1314, 631,7170 廖仁君 网站:www.sjocr.com

身份证OCR识别技术

一、身份证OCR识别技术应用背景

这些年,随着移动互联网的的发展,越来越多的企业都推出了自己的移动APP,这些APP多数都涉及到个人身份证信息的输入认证(即实名认证),如果手动去输入身份证号码和姓名,速度非常慢,且用户体验非常差。为了提高在移动终端上输入身份证信息的速度和准确性,我们开发出身份证OCR识别技术SDK,以满足各行业应用需求,给用户带来更好的体验。只需将居民身份证OCR识别技术SDK集成到APP中,即可通过手机摄像头扫描识别身份信息。

二、身份证OCR识别技术简介

居民身份证OCR识别技术SDK可支持Android、iOS主流移动操作系统,android平台提供jar包,ios提供静态库.a文件。APP集成居民身份证OCR识别技术SDK后,用户采用手机、平板电脑对身份证进行拍摄识别即可自动识别身份证信息

身份证OCR识别技术技术还可以部署在识别服务器上,可支持Linux 32/64位操作系统、Windows 32位/64位操作系统。用户可部署到自有服务器上,APP可直接调用居民身份证OCR识别技术服务识别身份证信息。

使用居民身份证OCR识别技术技术后,大大地提升了APP的用户体验。

三、身份证OCR识别技术技术功能特点

1.识别身份证种类多:可识别二代身份证(包含汉族身份证和少数民族身份证)、香港身份证、澳门身份证、台湾身份证及部分国外身份证;

2.识别速度快:单张居民身份证OCR识别技术速度小于2 秒;

3.通过调用识别功能Activity,实现APP应用程序接口调用,支持JAVA、Object-C等多种语言开发调用。

四、身份证OCR识别技术技术主要应用领域

1.金融保险:移动展业、移动查勘录入身份证信息;

2.金融P2P:实名认证;

3.银行:直销银行、手机银行实名认证;

4.移动支付:实名认证;

两款开源的中文OCR工具,简直碉堡了

cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用。

cnocr主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。cnocr目前内置的文字检测和分行模块无法处理复杂的文字排版定位。如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用。

cnocr 是Python3下的中英文OCR包,通过pip命令安装后即可直接使用。

V1.1.0 对代码做了很大改动,重写了大部分训练的代码,也生成了更多更难的训练和测试数据。训练好的模型相较于之前版本的模型精度有显著提升,尤其是针对英文单词的识别。

以下列出了主要的变更:

  • 更新了训练代码,使用mxnet的recordio首先把数据转换成二进制格式,提升后续的训练效率。训练时支持对图片做实时数据增强。也加入了更多可传入的参数。
  • 允许训练集中的文字数量不同,目前是中文10个字,英文20个字母。
  • 提供了更多的模型选择,允许大家按需训练多种不同大小的识别模型。
  • 内置了各种训练好的模型,最小的模型只有之前模型的1/5大小。所有模型都可免费使用。
  • 相较于之前版本的模型,新的模型精度有显著提升,尤其是针对英文单词的识别。新模型已经可以识别英文单词间的空格。
  • 支持文字识别只在给定字符集中进行。 对于一些纯数字或者纯英文字母的应用场景可以带来识别率提升。
  • 优化了对黑底白字多行文字图片的支持。
  • mxnet依赖升级到更新的版本了。很多人反馈mxnet 1.4.1经常找不到没法装,现在升级到>=1.5.0,<1.7.0。

cnocr的ocr模型可以分为两阶段:第一阶段是获得ocr图片的局部编码向量,第二部分是对局部编码向量进行序列学习,获得序列编码向量。目前两个阶段分别包含以下的模型:

  1. 局部编码模型(emb model)
  • conv:多层的卷积网络;
  • conv-lite:更小的多层卷积网络;
  • densenet:一个小型的densenet网络;
  • densenet-lite:一个更小的densenet网络。

2. 序列编码模型(seq model)

    • lstm:两层的LSTM网络;
    • gru:两层的GRU网络;
    • fc:两层的全连接网络。

cnocr目前包含以下可直接使用的模型,训练好的模型都放在 cnocr-models 项目中,可免费下载使用:

github: https://github.com/breezedeus/cnocr

目前比较常用的中文 OCR 开源项目是 chineseocr,它基于 YOLO V3 与 CRNN 实现中文自然场景文字检测及识别,目前该项目已经有 2.5K 的 Star 量。而本文介绍的是另一个新 开源的中文 OCR 项目,它基于 chineseocr 做出改进,是一个超轻量级的中文字符识别项目。

项目地址:https://github.com/ouyanghuiyu/chineseocr_lite

该 chineseocr_lite 项目表示,相比 chineseocr,它采用了轻量级的主干网络 PSENet,轻量级的 CRNN 模型和行文本方向分类网络 AngleNet。支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M .

目前 chineseocr_lite 支持任意方向文字检测,在识别时会自动判断行文本方向。我们可以先看看项目作者给出的效果示例:

可以看到,chineseocr_lite 在横排文字和竖排文字的识别上都有不错的效果,而且它提供的交互式网页端能直接在页面插入图像与调用识别模型。

本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com

点赞 0
收藏 0

文章为作者独立观点不代本网立场,未经允许不得转载。