Translate

10/12/13

Apropos, Whatis


Web OS

2998ª Parte Apropos, Whatis

videos

apropos

whatis

apropos

whatis

file

pandoc

como-usar-pandoc

videos-pandoc

Si ya habéis aprendido algo de como usar el markdown (que bien fácil es) pues con un simple editor de texto y unas marcas puestas por ahí como # o ## (podéis conseguir hasta 6 niveles que es hasta ######) y usando el enter para marcar los párrafos, ya sabéis punto y aparte que no punto y seguido, y las líneas en blanco los separan, ya podéis capitular y/o seccionar y marcar los párrafos de cualquier libro ya sea de vuestro magin o que queráis convertirlo a epub o a fb2 esto usando el programa pandoc.

El único inconveniente de este convertidor, el pandoc, que está disponible para todos los SOs es que solo trabaja con ficheros que estén en UTF-8.

Hay que usar iconv para convertir en caso de que no esté en UTF-8 aunque cualquier editor de texto nos puede ayudar también en la tarea.

En linux y supongo que en mac también pues usa la shell BASH, la instrucción o comando file nos indica lo que es cada fichero en detalle ver ejemplo mas abajo, en windows se pueden poner y usar utilidades UNIX :

ximo@ximo-ABC8899:~$ whatis pandoc
pandoc (1)           – general markup converter

ximo@ximo-ABC9988:~$ whatis file
file-event (7)       – event signalling that a file has changed
file (1)             – determine file type

Yo por ejemplo he convertido mas mal que bien a partir de un pdf con ayuda del pandoc a otros formatos como el epub o o el fb2, aunque aquí entre las opciones pdftohtml o pdftotext, yo he probado la segunda.

ximo@ximo-junio:~$ whatis pdftotext
pdftotext (1)        – Portable Document Format (PDF) to text converter (version 3.03)

ximo@ximo-junio:~$ whatis pdftohtml
pdftohtml (1)        – program to convert PDF files into HTML, XML and PNG images
 

ximo@ximo-castrillo:~$ apropos pdfto.*
pdftools (1)         – is a high level tools to convert PDF files to AZW or ePUB formats.
pdftocairo (1)       – Portable Document Format (PDF) to PNG/JPEG/TIFF/PDF/PS/EPS/SVG using cairo
pdftohtml (1)        – program to convert PDF files into HTML, XML and PNG images
pdftoppm (1)         – Portable Document Format (PDF) to Portable Pixmap (PPM) converter (version 3.03)
pdftops (1)          – Portable Document Format (PDF) to PostScript converter (version 3.03)
pdftosrc (1)         – extract source file or stream from PDF file
pdftotext (1)        – Portable Document Format (PDF) to text converter (version 3.03)

De los comandos de arriba hay cosas que cualquier distro Linux instala por defecto y otras que habrá que instalarlas después.

Continuo yo he preferido ir directamente al grano de la sencillez pues una vez he markdownizado, esto es puesto capítulos y párrafos y guardado en UTF-8 como texto plano con un sencillo editor, por ejemplo el mousepad en xubuntu aunque el notepad en windows o el textedit en mac os valdrán para lo mismo, no hace falta usar suites complicadas o usar macros especiales, solo lo ya comentado que para empezar a hacer pinitos en el tema es un buen principio, lo de tablas, imágenes, y otra complicaciones es bien fácil también pero eso con el tiempo y probando se sacan los resultados óptimos.

ximo@ximo-ABC8899:~$ file ConUnaMano.*
ConUnaMano.epub: EPUB ebook data
ConUnaMano.fb2:  XML document text
ConUnaMano.html: UTF-8 Unicode text
ConUnaMano.md:   C source, UTF-8 Unicode text
ConUnaMano.pdf:  PDF document, version 1.4
ConUnaMano.txt:  UTF-8 Unicode text

Aunque en lo de arriba hay la base de la conversión mas los resultados el comando file nos ayuda a saber que la base que nos ayudará a convertir con pandoc está en UTF-8. Que es casi el requisito único y necesario para usar pandoc.

Y ahora convertimos simplemente con la siguiente fórmula o invocación y así de sencillo es aunque se puede complicar mas.

ximo@ximo-ABC8899:~$ pandoc -o ConUnaMano.fb2 -i ConUnaMano.txt

ximo@ximo-ABC8899:~$ pandoc -o ConUnaMano.epub -i ConUnaMano.txt

Que nos dará un hermoso fb2 y su parejita epub en un santiamén.

Que os conste que todo se puede mejorar se puede retocar a mano para añadir mas cosas, pero si os atrevéis a probar lo de arriba es un gran principio para conocer una buena utilidad convertidora que necesita pocos medios y que os puede ayudar a ser mas felices con vuestros lectores de ebooks. Y no fiaros nunca de los pdfs que hay por la red sobre todo los que están en español, leer primero para comprobar su integridad que luego pasa lo que pasa. :) Ximo

PD

Libro de prueba  Ya sabéis copiáis y pegáis en un editor de texto o lo convertís y capituláis si hace falta y lo que se os ocurra. ¡Au a disfrutar!

No hay comentarios: