Leer pdf en terminal
Para ver el contenido de pdfs de texto en una terminal se puede usar el comando pdftohtml y luego abrir el fichero con lynx.
Una forma más rudimentaria y que no necesita tener instalado un navegador web por terminal es transformarlo a texto. Con el comando pdftotext podemos extraer el texto de pdfs que no sean escaneados.
$ pdftotext <fichero>
Pero hay algunos pdf que muestran datos tabulados.
Depende de cómo se transformara el documento en origen, esos datos no se guardan en el pdf en el órden de lectura, sino en columnas. De esta manera, el texto resultante de la transformación es ilegible y no se puede, por ejemplo, hacer grep en él.
Pero pdftotext tiene la opción -layout que intenta trasformar tal cual se ve, no en el orden en que están en el pdf.
$ pdftotext -layout <fichero>
Comentarios recientes
- Сообщаем,На имя утвердили билет на лотерею. Примите в вашем личном кабинете >> https://forms.yandex.ru/cloud/62eb57d564ec315321db0d93/?hs=32f09e11e6dae98f5d1717b678961043& en Coches robóticos con Arduino
- Здравствуйте,Вам подготовили подарок. Примите на официальном сайте >>> https://forms.yandex.ru/cloud/62eb57ce0f5484c5f9535cb0/?hs=fd7c52216d7ee22f214510e78f87d84f& en Los materiales de este curso
- Have you ever tried this sex game before? GIVE IT A TRY: https://link.ac/5Kia100 [hs=23754caf53d7aa692977932753a29308] en El módulo «Sistemas Informáticos»
- All the girls from next door are here with their cams! Visit Cam: https://link.ac/5Kia100 [hs=256b5891d180157c8c3473bded3db3ad] en Sustituir moodle por google docs
- Susana is interested in you! Click here: http://surl.li/bylyx?fog0 [hs=e174d8dbfba9f64326380d814eced76a] en El módulo de Desarrollo Web en Entorno Cliente (DAW)
Categorías
Sitios de interés