Continuando con nuestra enumeración de utilidades para trabajar con documentos, veremos programas para escanear a PDF en Ubuntu. Aunque en el ámbito hogareño se fue abandonando en favor de las cámaras de los dispositivos móviles, los escáneres siguen teniendo su utilidad en el ámbito laboral y académico.
Lamentablemente, en Linux no tenemos nada parecido al Abby FineReader que es la mejor herramienta para automatizar el proceso de escaneado, reconocimiento y conversión de documentos que pude probar. sin embargo, con un poco de trabajo se consiguen buenos resultados.
Programas para escanear a PDF en Ubuntu
Comencemos aclarando un par de conceptos:
Un escáner es un dispositivo que permite transformar documentos o imágenes en formato papel a archivos digitales lo que hace posible su manipulación. Aunque, como dijimos, se puede usar la cámara del teléfono para el mismo objetivo (Existen aplicaciones que ayudan) los escáneres están optimizados para esta tarea.
La mayoría de los escáneres funcionan en Linux gracias a SANE, un proyecto de código abierto que provee los controladores y firmware adecuados en el caso de que no lo hagan los fabricantes.
El reconocimiento óptico de caracteres es una tecnología que convierte las imágenes en archivos de texto que pueden editarse y en los que pueden realizarse búsquedas. Además de texto impreso, algunas aplicaciones son capaces de reconocer texto manuscrito, código de barra, QR o firmas.
Gscan2pdf
Este es un clásico que está en los repositorios de todas las distribuciones Linux. El programa nos permite crear documentos multi página a partir de imágenes escaneadas o guardadas en el ordenador que contengan texto. El resultado puede guardarse o enviarse por correo electrónico.
Para poder hacer el reconocimiento óptico de caracteres, el programa necesita instalar Tesseract y el paquete de idioma español Lo hacemos con
sudo apt install tesseract-ocr tesseract-ocr-spa
El programa lo instalamos con
sudo apt install gscan2pdf
y lo removemos con:
sudo apt remove gscan2pdf
Document Scanner
No sé si soy yo el que insulta la inteligencia de los lectores explicando que hace este programa o los desarrolladores de GNOME a la hora de ponerle el título. La aplicación trabaja con todos los escáneres compatibles con SANE para escanear el documento y permite eliminar las partes que no se ven bien y rotar la imagen. El resultado puede guardarse a PDF o múltiples formatos de imagen.
Se instala con:
flatpak install flathub org.gnome.SimpleScan
No, no me confundí de aplicación
Se desinstala con:
flatpak uninstall org.gnome.SimpleScan