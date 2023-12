En el artículo anterior explicamos cómo podemos descargar videos y subtítulos para poder aprovecharnos de las herramientas que los reproductores de video para el escritorios ponen a disposición de los discapacitados ponen a disposición de los que tenemos problemas visuales. A continuación, vamos con más trucos para linuxeros cortos de vista.

En este caso, veremos cómo podemos cambiar la tipografía, el fondo y el formato de los libros electrónicos.

Más trucos para linuxeros cortos de vista

Tengo que hacer una aclaración. Existen algunos tutoriales en Internet que explican la forma de hacer esto utilizando complementos. El problema es, referidos a libros electrónicos distribuidos por Amazon, que se necesita el número de serie de un dispositivo registrado a nombre del usuario. Como no dispongo de ninguno, solo resta hacer las cosas del modo más difícil

Programas que vamos a necesitar

(Los puedes encontrar en los repositorios de las principales distribuciones Linux)

Scrot : Herramienta de captura de pantalla para la línea de comandos.

: Herramienta de captura de pantalla para la línea de comandos. Xdotools: Simula la presión del botón del ratón.

Simula la presión del botón del ratón. Gscan2PDF: Convierte el pdf de imágenes en un pdf de texto.

Convierte el pdf de imágenes en un pdf de texto. Calibre: Convierte el pdf de texto en otros formatos.

Convierte el pdf de texto en otros formatos. tesseract-ocr y tesseract-ocr-spa: Programa de reconocimientos de caracteres e idioma español.

En el caso de Calibre recomiendo instalarlo desde su sitio web ya que suele estar más actualizado. Lo hacemos desde la terminal con este comando:

sudo -v && wget -nv -O- https://download.calibre-ebook.com/linux-installer.sh | sudo sh /dev/stdin

El método

Lo que vamos a hacer es automatizar el pasaje de páginas del lector online y las capturas de pantalla. A continuación, juntaremos las capturas en un pdf y realizaremos un reconocimiento óptico de caracteres para crear otro en formato texto. Si lo deseamos podemos convertir este segundo pdf a otro formato.

Primer paso: Automatización

Para hacer las diferentes capturas de pantalla necesitamos automatizar el proceso de pasado de página ya que hacerlo en forma manual es tedioso. El proceso es el siguiente.

Abre el libro en el lector web o el software lector del servicio dónde está el libro. Maximiza la ventana. Abre la terminal, pero achícala lo suficiente para que te permita ver la otra ventana. Colócala en el costado izquierdo. En la terminal escribe el comando xdotool getmouselocation pero no pulses Enter. Lleva el puntero adonde está el botón de paso de página del lector y pulsa Enter. Toma nota de las coordenadas que te muestra en la terminal.

Abre el editor de textos de tu distribución y pega este script.



#!/bin/bash

while [ 1 ]; do

xdotool mousemove XXXX YYY click 1 &

scrot -q 100 '%Y-%m-%d-%H:%M:%S.png' -e 'mv $f ~/Carpeta_de_archivos/'

sleep 20

done

Reemplaza XXXX e YYYY por las coordenadas que copiaste previamente. Reemplaza ~/Carpeta_de_archivos/’ por la carpeta en la que quieras que guarde los archivos.

Guarda el archivo con el nombre script.sh.

Ahora, posa el puntero en el icono del script que guardaste y con el botón derecho en Propiedades, cliquea en la opción de darle permisos de ejecución.

Crea la carpeta de destino con el comando



mkdir nombre_carpeta_de_destino.

Recuerda que debe coincidir con el nombre de la carpeta que pusiste en el script.

A continuación, abre el lector y la terminal. En la terminal escribe.

./script.sh

Pon el lector a pantalla completa y espera a que finalice el proceso de captura. Te darás cuenta porque es cuando deja de pasar páginas. Minimiza el lector y cierra la terminal.

Para obtener mejores resultados haz que el texto se muestre en una sola columna.

Segundo paso: Creación de pdf

Ve a la carpeta de destino y elimina los que están repetidos. A continuación:

Abre Gscan2pdf. Ve al Menú Archivo/Abrir y selecciona todas las imágenes. Ve al menú Herramientas/OCR y selecciona Todas las páginas, Tesseract como motor de ocr y el idioma que corresponda. Pulsa en Iniciar ocr. Cuando finalice el reconocimiento ve a Archivo/Guardar y selecciona Todas y el formato pdf. Pulsa en Guardar y elige el destino.

Ahora tienes un pdf de texto que mantiene los estilos y las imágenes. Si tu lector de textos lo permite, podras cambiar los colores y la tipografía. También puedes convertirlo a otros formatos con Calibre.