Paperless-ngx,管理文档的优秀应用

最近 Paperless-ngx 新版本发布,这是一个基于网络的文档管理应用程序,可以将纸质(物理)文档转换为可以全文在线搜索、下载和存储的电子文档。

对于那些不了解 Paperless-ngx 的人,我可以告诉你,这个 是无纸化 -ng 项目的一个分支, 这又是 paperlsess 项目的一个分支(创建分支是为了在以前的开发人员停止维护后继续开发)。

关于无纸化-ngx

上传扫描文件后 以任何可用的方式(通过 FTP、通过 Web 界面、通过 Android 应用程序、通过电子邮件通过 IMAP), 该程序执行光学字符识别 (OCR) 使用 Tesseract 引擎。

除此之外, 允许您使用标签组织和索引扫描的文档, 通讯员,类型等等。 它还对文档执行 OCR,将可选文本添加到仅图像文档,并将标签、通讯者和文档类型添加到文档。

无纸化-ngx 支持 PDF 文档、图像、纯文本文件和 Office 文档 (Word、Excel、Powerpoint 和 LibreOffice 等价物),Office 文档支持是可选的,由 Apache Tika 提供。

Paperless-ngx 将您的文档存储在磁盘上,文件名和文件夹无纸化管理,格式可自由配置,并具有机器学习支持的文档匹配功能。

该应用程序本身针对多核系统进行了优化,因此它可以并行处理多个文档,并且内置检查器确保文档存档处于良好状态。

其它功能 Paperless-ngx 的亮点:

  • 单页应用程序界面。
  • 它包括一个仪表板,显示基本统计数据并上传文件。
  • 按标签、通讯员、类型等过滤。
  • 可自定义的视图可以保存并显示在仪表板上。
  • 全文搜索可帮助您找到所需内容。
  • 自动完成会建议您文档中的相关单词。
  • 结果按与您的搜索查询的相关性排序。
  • 突出显示显示文档的哪些部分与查询匹配。
  • 搜索类似文档(“更多类似”)
  • 电子邮件处理:无纸化聚合来自您的电子邮件帐户的文档。
  • 为每个帐户设置多个帐户和过滤器。
  • 从邮件中添加文档时,Paperless 可以将这些邮件移动到新文件夹、将它们标记为已读、将它们标记为重要或删除它们。

Paperless-ngx 1.8.0 的主要新闻

在这个新版本中,强调了 预处理和后处理脚本使用环境变量 而不是命令行参数,加上 网页界面缩略图已转换为 WebP 格式 而不是 PNG,并且 Web 界面配置存储在数据库中。

另一方面,当更改文档的语言时,界面中会出现提示需要重新加载页面,如果发生 Redis 通信错误,则会显示更详细的信息。

除此之外,还要强调的是 查看文档队列的能力 用于加工 已添加到 Web 界面。

最后,如果您有兴趣了解有关该应用程序的更多信息,可以在以下位置查看详细信息 以下链接.

代码使用 Django 框架用 Python 编写,并在 GPLv3 许可下发布。

如何在 Ubuntu 和衍生产品上安装 Paperless-ngx?

对于那些对能够在他们的系统上安装此应用程序感兴趣的人,他们应该知道实现它的最简单方法是借助 Docker。

可以通过打开终端并输入来完成安装:

bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"

有兴趣可以自己编译的可以参考说明书 在下面的链接中。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。