ocr在线(ocr文字识别软件免费版)

编辑导语:目前网上身份认证仍然主要依靠OCR技术,即光学字符识别。然而,在依靠该技术的在线身份认证服务过程中,用户的流失可能会非常严重。为什么?在这篇文章中,作

编辑导语:目前网上身份认证仍然主要依靠OCR技术,即光学字符识别。然而,在依靠该技术的在线身份认证服务过程中,用户的流失可能会非常严重。为什么?在这篇文章中,作者分析了OCR技术应用于在线身份认证的运行效果,让我们来看看。

ocr在线(ocr文字识别软件免费版)插图一、线下身份认证:中国有世界领先的方式。我们在银行柜台办理金融业务,入住酒店,通过高铁,在营业厅购买手机SIM卡号,都要有现场身份认证,也就是核对你的身份证和个人信息。我们只需要拿出自己的身份证,放在指定的身份证读取设备上进行感应,非常方便安全。

2004年,我国推出二代身份证并大力推广。到现在,所有市民应该都统一改了。二代身份证内嵌国家秘密智能芯片,加密存储公民所有基本信息(姓名、性别、民族、出生日期、身份证号、证件照片、家庭住址、签发机关、有效期限,统称为“身份九要素”)。加密后的信息需要通过专门的身份证读取设备进行解码读取,从而同时保证公民信息的安全性和有效性。

随着二代身份证和身份证识读设备的普及和发展,我们在各种需要实名认证的场合享受到了极大的便利。与世界其他国家相比,中国持有高密度安全证书的方式极为先进,是我们享受世界领先、便捷生活的坚实基础。

试想一下,即使有世界第一的高铁技术,如果没有“刷身份证才能通过”的配套保障,大家还是需要在柜台排队买票,然后在闸机检票才能上车。如何提高效率?如果有过痛苦的排队经历,没有人愿意回到那个时代。

从技术底层来说,我们的二代身份证是国家制造的高密度安全芯片。发给每个人,就给了这个公民“自我认同”的权利。

在这方面,中国的管理理念和技术是非常先进的。拿现在流行的话来说,就是很早就采用了去中心化的思维和技术,把信任和便利最大程度的放到了每个人的手里。只要持有合法身份证,就可以完全代表自己,不需要其他集中数据库进行验证。

相比之下,美国等老牌西方国家仍然使用基于“社会安全号码(SSN)”的政府数据库验证方法。也就是说,你无法独立验证自己是谁。你所能做的就是记住你的名字和SSN号码,然后向政府数据库查询,核实这些信息是否正确。如果网络不好,或者中间过程出了问题(比如警察作恶,临时数据库故障等。)

ocr在线(ocr文字识别软件免费版)插图(1)(左:国内身份证结构;右:美国SSN)

两种方式并不能说谁比谁好,只是在不同的场景下各有利弊。所以我们国家其实有一个集中数据库验证的公民管理方式。而我们相对独特的“保证”方式,在保护国民经济方面发挥了越来越大的作用,构成了中国特有的便民服务。

近年来,国外实际上已经注意到了这种差异。例如,法国等欧洲大陆国家已经在加快发放国民身份证,而美国实际上正在许多服务场景中推广和使用内嵌芯片的护照,以补充传统SSN机制的缺点。

第二,在线身份认证:和世界其他国家一样,我们还处于发展初期,主要依靠OCR技术。

OCR(光学字符识别)是指电子设备(如扫描仪或数码相机)检查印在纸上的字符,通过检测明暗图案确定其形状,然后通过字符识别将形状翻译成计算机字符的过程。主要用于将纸质文档中的印刷字符转换成计算机可以处理的文本格式,然后供文字处理软件进一步编辑处理。

身份证虽然好,但是我们在生活中越来越多的网上服务过程中遇到了阻碍:手机不是专门的身份证读取设备。如何读取身份证中的安全芯片信息来完成实时身份认证?很明显,这里需要一套新的技术,但是时间不等人。如何才能服务于已经如火如荼的数字经济?

目前主流的方法是OCR。

用手机摄像头拍摄身份证照片,然后用OCR技术提取身份证表面的印刷文字信息。最后用政府集中数据库来验证信息是否正确。如果成功,则保留用户的身份证复印件,以备后续审核。

这些过程拼接在一起,形成一个完整的OCR身份认证服务。如果有特殊需求,会增加人脸识别比对。这构成了我们在“手机不能直接读取身份证芯片”过渡期的标准解决方案,也是我们开展各种需要身份认证的网上服务的基础。

在技术底层,我们暂时放弃了国内“分散式公民自证”这一相对独特的特征,转而采用“集中式政府数据库”的验证方式。所以在这个领域,我们和西方国家的很多公司形成了同频,可以互相学习,共同提高技术,但是我们也分担了这项技术带来的缺陷和管理风险,比如OCR技术的识别精度,人脸识别技术的识别精度,个人隐私数据的保护。

客观来说,我国在技术上并不落后,但在数据管理和保护上却不尽如人意,事实上造成了身份数据满天飞的乱象。随着最近中国数据安全法、个人信息保护法和网络数据安全管理条例的发布和实施,这方面应该会有明显的改善。

接下来,本文不赘述OCR认证服务中的技术和管理问题,而是转向这项服务的运营效率,即在业务流程中引入OCR认证服务的用户的留存和转化效果。

ocr在线(ocr文字识别软件免费版)插图(2)三、OCR认证服务的用户转化漏斗:我不知道,但我被惊人的损失震惊了。下面我们来详细拆解OCR认证服务中的关键步骤:

1)从用户处获取身份证图片,可能是从相册中获取,也可能是直接调用手机摄像头实时拍摄。由于个人身份证照片存储在相册中的安全风险太大,且这种方式极易被造假,以手机银行为代表的业务方现已禁止使用。本文只分析第二种采集方式:调用手机摄像头实时拍摄身份证。

2)从身份证图片中解析身份元素信息;如果无法解决,请返回步骤1。

3)后台发送到某供应商提供的“政府数据库”云验证接口进行信息验证。如果没有,请返回步骤1。

相应的转换漏斗图如下:

ocr在线(ocr文字识别软件免费版)插图(3)第一步的用户流失率最严重,达到40%左右:

1)如果用户的身份证不在身边,这个过程无法完成。这类用户占20%左右。要彻底解决,需要新的技术方案,比如几年前公安部试点创新的eID和CTID。但是,目前来看,它们还远未完全实用,因此我们可以简单地认为短期内没有解决方案。

2)如果拍摄效果不好,这个过程就完成不了。这个用户数也达到20%。一方面是由于光线、拍摄角度、拍摄稳定性、相机质量等外界客观影响。,相机无法一直锁定和聚焦在身份证上;另一方面,用户在过程中因为页面设计可用性问题、软件bug或者网络不稳定而放弃。这方面应该会有很大的提升空。

第二步的用户流失率弹性很大,大概在10%~30%:

可以简单的认为这一步的用户流失率几乎等于OCR识别结果的错误率。按照风控原则,这一步是不能由用户手动更正的,否则就失去了身份认证的意义,所以一旦信息识别错误,就只能回到上一步重新开始。

流失弹性的关键主要看地址信息是否需要识别。

如果只需要识别姓名、身份证号甚至身份证有效期,现在业内成熟的OCR算法可以达到85%以上的准确率,最好的据说可以达到90%。但如果要准确识别身份证上的地址,OCR的技术难度会呈几何级增加,往往会识别出非法字符。好在目前除了金融、旅游、就业等少数场景之外。识别地址的需求并不普遍。

ocr在线(ocr文字识别软件免费版)插图(4)(地址被识别为非法字符)

第三步的用户流失率,大概5%-10%:

一般来说,只要第二步OCR正确识别身份证信息,就一定能通过“政府数据库”的验证。

但实际上由于自身的业务风控规则(如对未成年人、特殊年龄段人群、黑名单用户等的限制。,一般在5%左右),而第三方供应商的数据来源和服务稳定性(一般不到5%),部分用户过不了关。

其中,业务风控规则导致的用户流失是不可避免的,但第三方供应商的质量控制可以做到优中选优。

综上所述,有了完整的OCR认证服务,用户流失率可能高达60%(1-0.6*0.7*0.9),极端优化后会高达30%(1-0.8*0.9*0.95)。会不会很惊艳?

业务还没真正开始,1/3的用户去了火星。他们怎么生活?

虽然可以通过其他方式把用户拉回来再试一次,但这毕竟是一个令人恐惧的运营黑洞。它必须被解决。

从关键因素来看,要解决的重点是:优化身份证拍照过程的不确定性,OCR识别信息(尤其是大地址信息)的准确性。如果这两个过程能够做到无损,整个服务过程的用户流失率可以降到75%(1-0.8*1*0.95),而且都是纯客观因素造成的,不会引起用户的不满,或者对有价值的用户造成不必要的损失。

解决这两个过程的难度有多大?笔者还在咨询专业人士,但据我所知,并不乐观。

四、还有一些值得注意的潜在风险:黑天鹅事件随时会到来

当然,做生意不可能完全没有风险。但是我们需要知道可能的风险来源,提前做一些准备,尤其是那些涉及合规的隐患。在OCR认证的实际设计和使用过程中,大多数公司普遍存在以下两种潜在风险:

1. OCR 的识别是否在使用“SaaS 公有云服务”?

如果OCR软件是在本地购买和部署的,就不存在本文所说的隐患。然而,由于价格昂贵,大多数公司仍然倾向于选择第三方供应商提供的SaaS云服务,这带来了“个人信息保护”的风险。

将用户的身份证图片传输给这些第三方供应商,是否应该征得用户的明确同意?但如果在流程中加入提示,等待用户选择,留存转化率会更低吗?其实把用户信息提交给某供应商提供的“政府数据库”进行验证也是一样的问题。

2. 是否考虑过对身份证图片的验真呢?

毕竟OCR技术只是对一张图片的识别和计算。如果图片本身是恶意伪造的,OCR认证过程是完全不设防的(这里不考虑加入人脸识别技术作为辅助验证手段。一方面,必然带来更高的成本和更低的用户转化;另一方面,人脸识别有其自身的适用场景和安全风险,会扭曲本文的主题)。

但是,如何在整个流程中加入防骗?不幸的是,这非常困难。如果是恶意人士伪造身份证,单纯使用OCR认证过程是无法识别的,而且这种伪造的成本极低,比如更改身份证的地址和有效期,或者通过贴膜的方式更改头像。

因此,金融、政务、租赁、旅游、就业等领域的公司需要慎重考虑被恶意分子盯上的风险。

注意,以上两个潜在风险是由“身份认证”业务本身的特殊性造成的,而非OCR技术。

然而,随着数字经济的盛行,国内外传统业务的合规监管也将延伸到网上业务。例如,KYC(Know Your Customer)是一个常见的规则,它不仅需要识别和认证正常用户,还需要防范少数恶意分子造成的巨大损失。

在这种情况下,OCR认证服务需要考虑的不仅仅是流畅的流程。

五、展望未来:在线身份认证过程的用户转化效果还能提高么?

在本文的最后,我们可以大胆地做一些“必然”的预测和相关问题:

1)在未来的数字经济中,在线身份认证的重要性和必要性只会越来越强,所以目前的用户转化效果绝对无法满足业务需求,必须大幅提升。但是这个重要的任务一定要由OCR身份认证来承担吗?

2)监管要求的提升如2)KYC其实与近年来国内外网络诈骗事件的大幅增加有直接关系,所以目前看来只会进一步提升。有没有合适的能防止身份伪造的让各方都满意的产品?

3)中国独有的第二代身份证安全芯片,在移动互联网已经如此普及的时代,真的无法发挥优势?我们相信这一定会解决突破。届时,中国的网络身份认证应该能走出另一条更新更好的路!

如果你有更好的想法,可以在评论区告诉我。

本文由@鲸鱼原创发布。每个人都是产品经理。未经许可,禁止复制。

来自Unsplash的图像,基于CC0协议。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/110631.html

发表回复

登录后才能评论