推荐一款文字识别的小程序

文字识别软件是必须的科研利器,尤其在面对需要处理大量扫描版文档的时候。

今天在林墨微信群里见到一位朋友的分享,试用了一下,真心觉得不错,就是这个:

这就是“传图识字”微信小程序的启动界面。程序很精致,功能很简洁,就是文字识别。通过上传手机相册图片,或者手机相机拍摄,可以对图片中的文字进行识别:

识别完成后,点击屏幕下方的“√”,文字即保存到剪贴板中,到另一个程序里粘贴出来即可。从我试用的情况来看,对印刷品文字的识别率还是很喜人的。

这款小程序的两个亮点是:采用了人工智能技术和完全免费。人工智能技术,随着这两年神经网络理论的重新崛起而迅速火热,在许多基础领域已经拥有很成熟的平台,比如利用阿里云的OCR服务,就可以直接解决识别车牌、证件、银行卡等许多APP应用场景中的问题。直接使用阿里云的API非常方便,但显然,这是需要付费的。尤其在用户访问量较大的时候,这个服务需要的费用就不是一点半点了。

通过这个错误提示可以知道,“传图识字”小程序的确已经开始面临这个问题了:

希望通过小程序获益的用户给作者打个赏吧,希望作者能把这个良心小程序坚持维护下去。

说到这里,相信不少朋友会想到,如果需要识别的文本量比较大的话,通过手机与电脑这么交互操作下去,也是令人细思极恐的吧?

是的,如果需要对一整本规范进行识别的话,用手机还是有点不现实,需要使用桌面版程序。我用过的桌面版Windows程序包括ABBYY FineReader、捷速OCR、汉王屏幕摘抄精灵、超星阅读器和CAJViewer。其中超星阅读器和CAJViewer算是插件而不是单独的软件,虽然其识别效果也不错,也还不做推荐。

ABBYY FineReader的识别效果还算不错,据说是前人工智能时代的OCR之王,但我识别过几次,出错率还是有点高,可能是中文对这款国外软件来说,实在是有点高难了。

捷速OCR是不错的软件,识别率相当高,而且支持将整个扫描版文件转换成可识别文档,省去了逐行手动设置选区的麻烦,虽然软件注册需要一点费用,如果我没记错的话,不超过两百吧,也算是良心价了。

如果不想花钱,汉王屏幕摘抄精灵也是不错的选择,识别率比捷速OCR略逊,但也还可以算是表现不错的,仅需要手工修改极少的错字即可。关键是软件非常小,用起来非常方便,如果需要识别的文字不是很多,用汉王精灵是最划算的了。

 

*欢迎转载,转载请标明来源:十千牛,文章地址: http://10kn.com/ocr-xiaochengxu/

欢迎关注十千牛微信公众号

说不定我这一生涓滴意念,侥幸汇成河,而且是一条大长河

Leave a Reply

Your email address will not be published. Required fields are marked *