A partir d'ahir 24 de febrer del 2025, la botiga de llibres en línia més important impedeix baixar llibres al nostre ordinador per transferir-lo a un altre dispositiu. En aquest post veurem com continuar descarregant llibres dAmazon. Aclareixo que farem trampa. No és la descàrrega del llibre pròpiament dita sinó un script que fa captures de pantalla i un programa que reconeix el text.
Queda clar que en cap cas animem els nostres lectors a violar els termes i condicions o les lleis de propietat intel·lectual. Però hi ha casos, com el meu que pateixo una discapacitat visual, on les opcions de configuració del lector d'Amazon no són els adequats i necessitem poder fer modificacions.
'Per què no es poden baixar més llibres a l'ordinador?
El que cal entendre és que en serveis com Amazon no comprem el llibre sinó el dret a llegir-lo. L'empresa es reserva el dret d'esborrar el contingut o de modificar-lo. El 2009 es van eliminar versions en anglès de 1984 y La rebel·lió dels animals milers de dispositius perquè l'editorial no tenia els drets de publicació. L'any passat, Puffin Books editor en anglès de molts de Roald Dahl, va modificar títols emblemàtics com Matilda y Charlie i la fàbrica de xocolatae, per fer-los més políticament correctes eliminant paraules com «gros» i «lleig» de manera inconsuta dels dispositius dels compradors.
Si Amazon seguia permetent baixar a l'ordinador, l'usuari podia perfectament restaurar l'original. Ara, si Bezos decideix guanyar-se l'afecte de Trump modificant el nom del Golf de Mèxic per Golf d'Amèrica a l'Atlas que compras, doncs caldrà aguantar-se.
Aquesta mesura es refereix només a la descàrrega del llibre a lordinador per transferir a un altre dispositiu, es pot seguir descarregant des del lector Kindle del PC per utilitzar amb aquest.
Com continuar descarregant llibres d'Amazon
El que farem és fer servir el lector de llibres al núvol d'amazon i un script que faci captura de pantalla, passi la pàgina de forma automàtica i repetiu el procés. Instal·larem dos programes. Xdotools i Scrot
sudo apt install xdotool scrotA
Xdotoll simula el comportament del ratolí, Scrot sencarrega de la captures de pantalla.
Ara hem de fer el següent:
- Obrim el lector al núvol.
- Triem el llibre que volem descarregar i l'obrim.
- Polsem sobre les lletres del cantó superior esquerre i seleccionem el layout en 1 columna. Això facilita el reconeixement posterior del text.
- Sense tancar el navegador obrim la terminal, la reduïm de mida i la situem a l'esquerra de la pantalla.
- Vam escriure
xdotool getmouselocation
i sense prémer enter portem el punter al botó de passar pàgina del lector de Kindle - Premem Enter.
- Prenem nota dels valors de X i Y que mostra la terminal
A continuació crearem l'script que farà les captures. A l'editor de textos enganxem això.
#!/bin/bash
while [ 1 ]; do
xdotool mousemove XXXX YYY click 1 &
scrot -q 100 '%Y-%m-%d-%H:%M:%S.png' -e 'mv $f ~/libro/'
sleep 20
done
Aquest script col·loca el punter del ratolí a la posició del botó de canvi (Cal reemplaçar X i Y amb els valors que anotem, canvia la pàgina, treu les captures i espera 20 segons per repetir el procés.
Ho guardem amb el nom guió.sh
Creem la carpeta llibre amb l'ordre:
mkdir libro
Obrim el llibre al navegador ia la terminal minimitzada escrivim
./script.sh
Posem el navegador a pantalla completa i esperem que acabi capturar la darrera pàgina. Quan acabi hem de tancar la terminal.
Ara instal·lem el programa que necessitem per combinar les imatges en un pdf
sudo apt install img2pdf
Per fer la conversió fem servir la següent ordre:
find . -name "*.png" -print0 | sort -z | xargs -0 img2pdf -o libro.pdf
És possible que en el temps en què vas trigar a tancar l'script anterior hi hagi alguna captura repetida per la qual cosa és convenient que t'asseguris abans d'executar l'ordre.
Per convertir el pdf a text la millor manera és fer servir documents de Google. Pugem el fitxer, polsem a la línia de punts per obrir el menú del fitxer i en Obre amb Documents de Google. Això fa automàticament un reconeixement de caràcters que podeu desar en format odt o pdf.
També es pot fer des de la línia d'ordres però no funcionarà bé amb dissenys complexos.
Instal·lem els programes
sudo apt install ocrmypdf tesseract-ocr tesseract-ocr-spa
convertim el pdf a text amb l'ordre:
ocrmypdf -l spa libro.pdf libro_ocr.pdf