En el article anterior expliquem com podem descarregar vídeos i subtítols per poder aprofitar-nos de les eines que els reproductors de vídeo per a lescriptoris posen a disposició dels discapacitats posen a disposició dels que tenim problemes visuals. A continuació, anem amb més trucs per a linuxers curts de vista.
En aquest cas, veurem com podem canviar la tipografia, el fons i el format dels llibres electrònics.
Més trucs per a linuxers curts de vista
He de fer un aclariment. Hi ha alguns tutorials a Internet que expliquen la manera de fer-ho utilitzant complements. El problema és, referits a llibres electrònics distribuïts per Amazon, que cal el número de sèrie d'un dispositiu registrat a nom de l'usuari. Com que no en dispose de cap, només resta fer les coses de la manera més difícil
Programes que necessitarem
(Els pots trobar als repositoris de les principals distribucions Linux)
- Escrot: Eina de captura de pantalla per a la línia d'ordres.
- Xdotools: Simula la pressió del botó del ratolí.
- Gscan2PDF: Converteix el PDF d'imatges en un PDF de text.
- Calibre: Converteix el pdf de text en altres formats.
- tesseract-ocr i tesseract-ocr-spa: Programa de reconeixements de caràcters i idioma espanyol.
En el cas de Calibre recomano instal·lar-lo des del seu lloc web ja que sol estar més actualitzat. Ho fem des de la terminal amb aquesta ordre:
sudo -v && wget -nv -O- https://download.calibre-ebook.com/linux-installer.sh | sudo sh /dev/stdin
el mètode
El que farem és automatitzar el passatge de pàgines del lector en línia i les captures de pantalla. A continuació, ajuntarem les captures en un pdf i farem un reconeixement òptic de caràcters per crear-ne un altre en format text. Si ho desitgem podem convertir aquest segon pdf a un altre format.
Primer pas: Automatització
Per fer les diferents captures de pantalla necessitem automatitzar el procés de passat de pàgina ja que fer-ho en forma manual és tediós. El procés és el següent.
- Obre el llibre al lector web o el programari lector del servei on és el llibre.
- Maximitza la finestra.
- Obre la terminal, però guanya-la prou perquè et permeti veure l'altra finestra. Col·loca-la al costat esquerre.
- A la terminal escriviu l'ordre xdotool getmouselocation però no premeu Enter.
- Porta el punter on és el botó de pas de pàgina del lector i prem Enter.
- Pren nota de les coordenades que et mostra a la terminal.
Obre l'editor de textos de la teva distribució i enganxa aquest script.
#!/bin/bash
while [ 1 ]; do
xdotool mousemove XXXX YYY click 1 &
scrot -q 100 '%Y-%m-%d-%H:%M:%S.png' -e 'mv $f ~/Carpeta_de_archivos/'
sleep 20
done
Reemplaça XXXX i YYYY per les coordenades que vas copiar prèviament. Reemplaça ~/Carpeta_de_archivos/' per la carpeta on voleu que deseu els fitxers.
Desa el fitxer amb el nom script.sh.
Ara, poseu el punter a la icona de l'script que heu guardat i amb el botó dret a Propietats, feu clic a l'opció de donar-vos permisos d'execució.
Crea la carpeta de destinació amb l'ordre
mkdir nom_carpeta_de_destinació.
Recorda que ha de coincidir amb el nom de la carpeta que vas posar a l'script.
A continuació, obre el lector i la terminal. A la terminal escriu.
./script.sh
Posa el lector a pantalla completa i espera que finalitzi el procés de captura. T'adonaràs perquè és quan deixa de passar pàgines. Minimitza el lector i tanca la terminal.
Per obtenir millors resultats feu que el text es mostri en una sola columna.
Segon pas: Creació de pdf
Aneu a la carpeta de destinació i suprimiu els repetits. A continuació:
- Obre Gscan2pdf.
- Ves al Menú Fitxer/Obrir i seleccioneu totes les imatges.
- Ves al menú Eines/OCR i selecciona Totes les pàgines, Tesseract com a motor d'ocr i l'idioma que correspongui.
- Cliqueu a Iniciar ocr.
- Quan finalitzi el reconeixement vés a Fitxer/Desa i selecciona Totes i el format pdf.
- Fes clic a Desa i tria la destinació.
Ara tens un pdf de text que manté els estils i les imatges. Si el teu lector de textos ho permet, podràs canviar els colors i la tipografia. També podeu convertir-lo a altres formats amb Calibre.