gImageReader, una aplicació per a PDF amb capacitat de OCR

about gimagereader

En el següent article anem a fer una ullada a gImageReader. Aquesta és una aplicació front-end per al motor tesseract OCR. Per als que no coneguin Tesseract, dir que és un motor òptic de reconeixement de caràcters (OCR) que utilitza intel·ligència artificial per buscar i reconèixer text imprès en imatges. És una biblioteca de codi obert i un dels motors de OCR més populars de mercat. Simplifica tot el procés d'extracció de text imprès d'imatges permetent als usuaris treballar amb arxius, imatges escanejades, PDF, elements de el portapapers enganxats, etc.

Avui dia tots els usuaris, ja sigui en oficines, llars, etc., ens podem trobar davant d'una situació en què necessitem extreure text d'una imatge. Podria ser un document escanejat en format d'imatge, un tros de paper o un treball de recerca antic. L'opció que molts usuaris prendrien seria la d'escriure tot el text amb un editor, però aquest procés pot portar molt de temps. Per evitar-nos aquest treball, podem optar també per l'opció de utilitzar un OCR per extreure el text de forma automàtica.

gImageReader ens va a ofereix moltes funcions i eines. Aquesta aplicació és una bona eina per utilitzar després d'importar un PDF o el document escanejat i el seu posterior processament.

Característiques generals de gImageReader

ocr gImageReader

  • Anem a poder importar documents PDF i imatges d'un disc, dispositius d'escaneig, porta-retalls i captures de pantalla. gImageReader admet molts tipus d'arxius. Simplement haurem d'importar els nostres arxius a l'eina i extreure el text amb un sol clic.
  • Tindrem la possibilitat de generar documents PDF a partir de documents hOCR. gImageReader admet tres formats de text extret, text sense format, PDF i format hOCR.
  • L'eina ens donarà la possibilitat de definir una àrea de reconeixement manual o automàtic per seleccionar el text a extreure.
  • El text reconegut que es mostra directament a la banda de la imatge. Com es pot veure en l'anterior captura de pantalla.
  • Després d'extreure en text pla, gImageReader realitza accions posteriors a el procés, com la correcció ortogràfica. Depenent de l'idioma que triem (el valor predeterminat és All English), Subratllarà les paraules que tenen errors gramaticals. A més, gImageReader permet seleccionar el mode de segmentació de pàgina que volem usar per al text extret.
  • A diferència d'altres eines de OCR en què podem treballar amb un arxiu alhora, gImageReader admet la importació de nombrosos arxius i el seu processament per lots.

Sobre aquest programa podrem obtenir més informació o qualsevol actualització nova en la seva pàgina oficial de GitHub.

Instal·lació en Ubuntu

aplicació funcionant amb un pdf

Aquesta és una aplicació multiplataforma i funciona tant en GNU / Linux com en Windows. En les següent línies veurem el procés d'instal·lació de gImageReader en Ubuntu 18.04 com s'indica en la pàgina de GitHub de el projecte.

Afegir el PPA

Per disposar d'aquest programari necessitarem afegir el repositori PPA al nostre sistema. Això ho farem obrint una terminal (Ctrl + Alt + T) i escrivint el següent comandament:

add repo gImageReader

sudo add-apt-repository ppa:sandromani/gimagereader

instal·lar gImageReader

Acabada l'actualització de programari disponible, ja podem procedir a instal·lar l'aplicació escrivint a la mateixa terminal:

instal·lació d'gImageReader

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

Amb tot l'anterior, gImageReader s'hauria d'instal·lar en el teu Ubuntu. Ara ja hauríem de poder iniciar el programa al nostre equip.

llançador de l'aplicació

Desinstal

En cas que vulguem desinstal·lar gImageReader, En una terminal (Ctrl + Alt + T) no tindrem més que utilitzar la següent comanda:

eliminar gImageReader

sudo apt-get remove gimagereader -y

Per acabar d'eliminar el programa ens queda executar també:

sudo apt-get autoremove

El PPA que utilitzem per a la instal·lació podem eliminar-del nostre sistema escrivint a la mateixa terminal:

desinstal·lar PPA gimagereader

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader és un simple front-end Gtk / Qt per tesseract-ocr que ve ve simplificant tot el procés d'extracció de text imprès d'imatges. Ens permetrà treballar amb arxius, imatges escanejades, PDF, elements de el portapapers enganxats, etc. Això el converteix en una bona opció treure el text de les nostres imatges de forma senzilla i ràpida.


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.