此工具的用途是批量把图片转换成文字,也可以转换扫描版的PDF。扫描版的PDF转换前,需要把PDF拆分为单个图片。工具的名称是:批量图片文字识别离线版。window应用,绿色版,不需要安装,解压即用。
多张图片转换文字的步骤非常简单,只需要点击“选择待转换图片开始转换”,选择多张图片,开始转换。转换好的文字,默认保存在软件目录下“图片转换结果”文件夹内。下面我说一下扫描版PDF识别成文字的方法。当然,也有扫描版PDF识别软件,但我没找到识别准确率特别高的软件。扫描版PDF识别成文字的具体步骤:
1、扫描版PDF拆分为图片。使用的工具名称是:万彩办公大师。
打开万彩办公大师后,选择“PDF图片抽取”,添加需要拆分的扫描版PDF,默认设置是“抽取所有图片”,不用修改,直接点击“抽取所有”按钮。抽取时间,看文件大小,一般需要几分钟。当出现抽取完毕的提示后,保存所有抽取到的图片。
2、如下图,点击“选择待转换图片开始转换”,选择刚才抽取到的图片,添加并开始转换,转换识别速度取决于你的CPU性能。
3、如果你还想把多个识别出来的txt合并成一个txt文件,可以使用这个软件,名称是:TextTool ,具体使用方法这里就不说了,也简单,看看软件界面就知道了。
批量图片文字识别离线版的缺点:识别率不是100%正确,需要人工校对。好像也没有可以100%正确识别的软件吧,反正我是没找到。
,