照下图书后,需要扫描图书。或者有些图片版本的pdf需要 提取文字。可以用下面提供的经验。这里介绍一款Windows下 提取文字的方法。
工具/原料
1
Windows
2
汉王PDF OCR
方法/步骤
1
首先在windows操作系统中间安装 汉王PDF OCR 属于免费应用。
2
安装后打开,左边是他的文件列表。把照好的文件。一般是jpg拖拽到列表中。
3
先做一下版面分析。看哪些属于非文字区块。因为有些扫面件有黑色斑点,影响识别。
4
当发现,版面分析不正确时。可以用剪刀裁剪相片。把非文字部分尽量裁剪。这样识别算法可以精准识别。
5
最后是进行识别。识别后,可以进行现场编辑。完了再复制导出。
下一篇:十点读书怎么扫码