文本文档是Gnu / Linux用户和计算机世界中非常普遍的文档……与之相关的所有命令和程序。 但是如今,pdf格式的文件已在文本文档中脱颖而出,成为许多用户,开发人员和项目的最爱。
如果我们使用图形环境 使用和管理pdf文件很容易,但 如果使用终端怎么办? 接下来,我们告诉您如何操作pdf文件和搜索单词,计算pdf文件文本中的字符,等等...
为此,我们将要做 pdfgrep命令的使用,该命令是grep命令的分支。 Pdfgrep允许我们创建pdf文档,将信息发送到已创建的文件或简单地在pdf文档中搜索单词。
Pdfgrep是一个工具 我们可以在几乎所有发行版的官方存储库中找到,因此对于其安装,我们只需要使用发行版的软件管理器并进行安装即可。 我们的发行版可能不包含它(如果使用Ubuntu,这有点奇怪)。 在这种情况下,我们转到 官方网站 从开发人员那里,我们将获得deb或rpm软件包进行安装。
安装完成后,操作必须如下:
pdfgrep [-v] pattern [archivo.pdf]
在这种情况下,pdfgrep和pattern都是固定命令,并且 [-v]是可变的部分,我们将使用它来执行pdf文件的操作,例如搜索单词,计算字符等。[file.pdf]必须更改为我们要使用或创建的文件的名称。 如果它在我们所在的文件夹中,就不会有问题,但是,如果pdf文件位于计算机的另一部分,则必须指出pdf文件的地址,否则将会出错。
如果您确实在终端中使用了grep命令,那么您会喜欢pdfgrep命令的。 可以让我们使用的工具 用我们团队的信息生成pdf文件 并能够将其发送给朋友,技术人员或任何其他类似用途。
他们继续帮助我解决Ubuntu引起的BIOS错误,规范地抛弃了我们并假装忘记了我们,他们损坏了我的新计算机
也许您是愚蠢的,您不理解这个博客不属于该死的规范的巨魔,每次我看到您在评论该胡说的博客时,都会把狗屎拉到其他地方
我刚刚在Ubuntu 16.04上安装了以下版本:
«这是pdfgrep版本1.4.1。
使用poppler版本0.41.0
使用libpcre版本8.41 2017-07-05»
我使用–V(或–version)参数获得了该信息,但使用-v参数却告诉我它无法识别它。
对于所有这些,我发现命令-io –ignore-case更有用,该命令以大写或小写形式返回我们在搜索中传递的关键字。
但是,要搜索重音词和我们亲爱的EÑE字母有一个严重的问题,如果我们要搜索“生产”或“保护”,我们必须寻找:
pdfgrep -i产品文件名.pdf
pdfgrep -i保护文件名.pdf
(我已经尝试过用单引号和双引号将其括起来,C语言转义字符“ \”和通配符则完全没有)。 要搜索关键字“ year”,事实是我想不出任何替代方法,如果您知道什么,请在此处发布并回答我。
最强大的选项是-ro –递归:它会在我们正在处理的目录中的所有pdf文档中查找单词。
总而言之,它是一个很好的工具,并且由于它是用自由软件编写的,因此我们可以对其进行修改,使其支持西班牙语,感谢本文!
阅读本文件:
https://pdfgrep.org/doc.html
我发现并告诉您,建议添加参数“ –unac»来处理带重音符号的字符,但是,我下载的版本不支持unac,因为它根本没有使用该实用程序进行编译,他们称之为“实验性道路。
有趣的是,即使将-i参数与grep一起使用,grep命令也没有该限制,但它可以搜索“ú”,并且还会返回“Ú”。
无论如何,我已经在检查pdfgrep存储库以了解我对它的了解,好了,我不再打扰您了(今天)。