多语言展示
当前在线:480今日阅读:167今日分享:16

如何使用pdfgrep搜索PDF文件

有很多命令搜索工具都可以搜索指定的纯文本,一般的工具无法读取PDF文件,这就使得开发者在使用搜索工具时有限,通过一个小程序在不打开文件的情况下搜索PDF中的文本的小命令行程序。
工具/原料
1

计算机

2

虚拟机

方法/步骤
1

首先进行安装pdfgrep工具,在包管理器里输入名称pdfgrep查找,它就应该能够安装它,在这里可以浏览其代码,进行查看项目的GitLab页面。

2

接着测试运行安装工具,使用pdfgrep工具的命令格式进行测试,OPTION是一个额外的属性列表,给出诸如-i或--ignore-case命令两者都会忽略匹配正则中的大小写。

3

然后查看输出结果,在结果中红色高亮显示所有遇到单词queue的地方,在命令中加入-i选项将会匹配单词Queue,当加入-i时,这里的大小写不重要,重要的是选项的加入。

4

接着在输出的结果中加入-c或者--count选项,结果会抑制匹配的正常输出,它只显示在文件中遇到该单词的次数,而不是显示匹配的长输出。

5

然后进行指定匹配的最大数目,当达到匹配次数最大时就应该停止读取文件的命令,在选项打印的页面上匹配页码和页面进行匹配模式的出现次数。

6

最后在man页面或pdfgrep在线文档中找完整列表,如果在批量处理一些文件pdfgrep可以同时搜索多个文件,可以通过更改GREP_COLORS环境变量来更改默认的匹配高亮颜色。

推荐信息