多语言展示
当前在线:856今日阅读:152今日分享:13

如何进行扫描的图片文字识别

由于工作需要,经常要将书刊、报刊、杂志等扫描件图片中的文字提取出来,复制在word中为我们二次引用,用了很多XX破解版软件,效果都不是很理想,因为OCR识别率低导致我还要进行大量的修改工作,后来发现了一个不错的方法可以提高识别率!
工具/原料
1

Microsoft office

2

文通2013数据录入工厂软件

步骤1:导入扫描的图片OCR识别
2

点击“文通TH-OCR 2013数据录入工厂系统”这个图标进入主界面。

3

点击“添加图像页”按钮,将要OCR识别的图片导入到软件中

4

注意了!  为什么我们经常OCR识别的时候OCR识别率会低?下面就是关键点!  因为我们在扫描的时候,图像一般都是有歪斜的,不会水平很正,所以这些歪斜的因素导致了OCR识别率低下!如图!

5

所以,在导入图片的时候,我们就应该选择 自动倾斜校正选项,这样图片就可以自动被纠偏,OCR识别率就会很好了!

6

我们来看看OCR识别效果!确实不错,原版还原呢!

步骤2:导出OCR识别结果
1

接下来我们要把OCR识别结果导出word来,为我们所用!在界面的菜单栏上,寻找导出按钮,并点击;然后在弹出来的对话框中,找到格式那个选线,选择RFT格式,点击确定!

2

然后就可以看到rtf后缀个文件了,这个用office,打开尽情的复制粘贴吧!

注意事项
1

1、选择的图片一定要像素清晰

2

2、图片可以直接扫描进来OCR识别的

推荐信息