由于工作需要,经常要将书刊、报刊、杂志等扫描件图片中的文字提取出来,复制在word中为我们二次引用,用了很多XX破解版软件,效果都不是很理想,因为OCR识别率低导致我还要进行大量的修改工作,后来发现了一个不错的方法可以提高识别率!
工具/原料
1
Microsoft office
2
文通2013数据录入工厂软件
步骤1:导入扫描的图片OCR识别
2
点击“文通TH-OCR 2013数据录入工厂系统”这个图标进入主界面。
3
点击“添加图像页”按钮,将要OCR识别的图片导入到软件中
4
注意了! 为什么我们经常OCR识别的时候OCR识别率会低?下面就是关键点! 因为我们在扫描的时候,图像一般都是有歪斜的,不会水平很正,所以这些歪斜的因素导致了OCR识别率低下!如图!
5
所以,在导入图片的时候,我们就应该选择 自动倾斜校正选项,这样图片就可以自动被纠偏,OCR识别率就会很好了!
6
我们来看看OCR识别效果!确实不错,原版还原呢!
步骤2:导出OCR识别结果
1
接下来我们要把OCR识别结果导出word来,为我们所用!在界面的菜单栏上,寻找导出按钮,并点击;然后在弹出来的对话框中,找到格式那个选线,选择RFT格式,点击确定!
2
然后就可以看到rtf后缀个文件了,这个用office,打开尽情的复制粘贴吧!
注意事项
1
1、选择的图片一定要像素清晰
2
2、图片可以直接扫描进来OCR识别的
上一篇:如何识别网络骗术?