从Ubuntu终端成为pdf专业人士

终端具有主动色彩

文本文档是Gnu / Linux用户和计算机世界中非常普遍的文档……与之相关的所有命令和程序。 但是如今,pdf格式的文件已在文本文档中脱颖而出,成为许多用户,开发人员和项目的最爱。

如果我们使用图形环境 使用和管理pdf文件很容易,但 如果使用终端怎么办? 接下来,我们告诉您如何操作pdf文件和搜索单词,计算pdf文件文本中的字符,等等...

为此,我们将要做 pdfgrep命令的使用,该命令是grep命令的分支。 Pdfgrep允许我们创建pdf文档,将信息发送到已创建的文件或简单地在pdf文档中搜索单词。

Pdfgrep是一个工具 我们可以在几乎所有发行版的官方存储库中找到,因此对于其安装,我们只需要使用发行版的软件管理器并进行安装即可。 我们的发行版可能不包含它(如果使用Ubuntu,这有点奇怪)。 在这种情况下,我们转到 官方网站 从开发人员那里,我们将获得deb或rpm软件包进行安装。

安装完成后,操作必须如下:

pdfgrep [-v] pattern [archivo.pdf]

在这种情况下,pdfgrep和pattern都是固定命令,并且 [-v]是可变的部分,我们将使用它来执行pdf文件的操作,例如搜索单词,计算字符等。[file.pdf]必须更改为我们要使用或创建的文件的名称。 如果它在我们所在的文件夹中,就不会有问题,但是,如果pdf文件位于计算机的另一部分,则必须指出pdf文件的地址,否则将会出错。

如果您确实在终端中使用了grep命令,那么您会喜欢pdfgrep命令的。 可以让我们使用的工具 用我们团队的信息生成pdf文件 并能够将其发送给朋友,技术人员或任何其他类似用途。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。

  1.   乔凡尼·盖普(Giovanni Gapp)

    他们继续帮助我解决Ubuntu引起的BIOS错误,规范地抛弃了我们并假装忘记了我们,他们损坏了我的新计算机

    1.    唐吉x德

      也许您是愚蠢的,您不理解这个博客不属于该死的规范的巨魔,每次我看到您在评论该胡说的博客时,都会把狗屎拉到其他地方

  2.   吉米·奥拉诺(Jimmy Olano)

    我刚刚在Ubuntu 16.04上安装了以下版本:

    «这是pdfgrep版本1.4.1。

    使用poppler版本0.41.0
    使用libpcre版本8.41 2017-07-05»

    我使用–V(或–version)参数获得了该信息,但使用-v参数却告诉我它无法识别它。

    对于所有这些,我发现命令-io –ignore-case更有用,该命令以大写或小写形式返回我们在搜索中传递的关键字。

    但是,要搜索重音词和我们亲爱的EÑE字母有一个严重的问题,如果我们要搜索“生产”或“保护”,我们必须寻找:

    pdfgrep -i产品文件名.pdf
    pdfgrep -i保护文件名.pdf

    (我已经尝试过用单引号和双引号将其括起来,C语言转义字符“ \”和通配符则完全没有)。 要搜索关键字“ year”,事实是我想不出任何替代方法,如果您知道什么,请在此处发布并回答我。

    最强大的选项是-ro –递归:它会在我们正在处理的目录中的所有pdf文档中查找单词。

    总而言之,它是一个很好的工具,并且由于它是用自由软件编写的,因此我们可以对其进行修改,使其支持西班牙语,感谢本文!

  3.   吉米·奥拉诺(Jimmy Olano)

    阅读本文件:

    https://pdfgrep.org/doc.html

    我发现并告诉您,建议添加参数“ –unac»来处理带重音符号的字符,但是,我下载的版本不支持unac,因为它根本没有使用该实用程序进行编译,他们称之为“实验性道路。
    有趣的是,即使将-i参数与grep一起使用,grep命令也没有该限制,但它可以搜索“ú”,并且还会返回“Ú”。

    无论如何,我已经在检查pdfgrep存储库以了解我对它的了解,好了,我不再打扰您了(今天)。