Cosas Interesantes: ePUB

Cosas Interesantes

Mostrando entradas con la etiqueta ePUB. Mostrar todas las entradas

jueves, 16 de diciembre de 2010

Descargas directas de ePUBs para Mi PAPYRE 6S ALEX desde internet

Nuestro querido PAPYRE 6S ALEX no está todo lo abierto que nos gustaría a la conectividad desde INTERNET. Por ejemplo, no hemos sido capaces de que reconociera un archivo ePUB adjunto a un correo electrónico. Tampoco hemos podido descargarnos un libro un formato ZIP ya que ha generado un error al intentar cargarlo en la Biblioteca. Y el colmo de la frustracion fue cuando al descargar un archivo ePUB desde un servidor de archivos público nos dijo que “el dispositivo no admite el contenido que se desea descargar”.
Pero, por fin hemos dado con la tecla. En la BIBLIOTECA de Mi PAPYRE Reader 6.1 para ebooks los archivos ePUB con la versión 1.15 de las BBPP LARdT pueden descargarse y leerse directamente en tu PAPYRE 6S ALEX como si de un Google Books cualquiera se tratara.
Podeis reconocer dichos archivos porque llevan el nuevo icono de las BBPP LARdT:

Así, pues ya sabeis. Otra posibilidad para disfrutar de vuestro PAPYRE 6S ALEX

Como podeis comprobar en esta imagen del historial de descargas.

sábado, 27 de noviembre de 2010

Validando mis ePUBs cómo Dios manda con FlightCrew 0.7

Aunque no hemos hablado de ello en las BBPP LARdT (“Las Buenas Practicas de LARdT para un ePUB decente”) es de sentido común que después de crear nuestro archivo ePUB es muy recomendable pasarlo por alguna de las herramientas de validación que andan rondando por ahí. Pero como es habitual con los ePUB uno se lleva sorpresas.
Hasta ahora utilizaba epubcheck 1.05 ya fuera como ejecutable independiente o accediendo online a través de la página http://threepress.org/document/epub-validate. Y sinceramente, me sacaba un poco de quicio que el programa detectara falsos positivos como, por ejemplo, en los formatos de fecha cuando después de pasar por CALIBRE y modificar la fecha de creación aparecían horas, minutos y segundos añadidos a la fecha; lo cual la última vez que lo comprobé me pareció entender que era perfectamente legítimo.
O cuando me dice que el atributo “file-as” en los metadatos (para guardar el nombre del autor como orden de autor: “Pepe Pérez; file-as “Pérez Pepe”) no es correcto.
Eso unido, a que cuando detecta un error “de verdad” los mensajes de reporte no suelen ser muy informativos, me había hecho ir abandonando la buena práctica de validar mis ePUBs después de hacerlos.
Pero leyendo el blog de desarrollo de SIGIL su autor, Strahinja Markovic comentaba que durante el desarrollo del programa advirtió este tipo de fallos y decidió como spin-off crear su propia aplicación de validación, llamada FlightCrew.

Como es FLIGHTCREW
Es una aplicación de código abierto hospedada en http://code.google.com/p/flightcrew/ muy sencilla y cómoda. Como siempre, podéis descargar la versión WINDOWS 64Bits (para Vista y Win7) desde la página de DESCARGAS – APPS - Nº25. Para otros sistemas operativos podéis acudir a la página de Googlecode indicada.
Lo mejor es que no sólo no detecta falsos positivos sino que además ayuda a implementar buenas prácticas en tu ePUB para que este tenga más calidad y funcione mejor.
Vamos a verlo con un ejemplo:
Pasamos el mismo archivo ePUB por epubcheck 1.05 y por FlightCrew 0.7b

epubcheck

A epubcheck 1.05 le parece estupendo; lo cual no esta mal; al menos no hemos tenido ningún falso positivo.

Sin embargo, FlightCrew muestra dos mensajes de alarma, codificados por colores según la gravedad y especificando DONDE (archivo dentro del ePUB y LINEA si aplica) y PORQUÉ.
El primer mensaje (de color amarillo) no es un error propiamente dicho sino un “warning”. FlightCrew ha detectado que dentro del ePUB he incluido un archivo gráfico que luego no ha sido utilizado, así que o se me ha olvidado usarlo o estoy llenando mi ePUB de basura innecesaria que lo hará más grande y más lento.
El segundo mensaje si es un error. Y me extrañaba porque el elemento “svg” si que es válido dentro de la especificación ePUB. Pero como se explica en las FAQs del programa, resulta que la práctica correcta es encerrarlo entre dos etiquetas <div> y no directamente suelto dentro del <body> como yo lo tenía.
Así pues, FlightCrew va mucho más allá de una mera validación formal del ePUB sino que ayuda, como ya hemos dicho a mejorar tus ePUBs aplicando criterios estrictos.

Así que ya sabéis, una nueva herramienta para validar vuestros ePUBs como Dios manda.

domingo, 3 de octubre de 2010

Solucionando los problemas de ADOBE MOBILE READER con los floats en las cabeceras de capítulo de los ePUB según las BBPP LARdT 1.0 (Cap. 09)

Una de las características más reconocibles de los ePUB que hacemos siguiendo las BBPP LARdT 1.0 (“Buenas Prácticas de LARdT para un ePUB decente”) son las cabeceras de capítulo tipo “feedbooks”; donde encerramos en una caja los componentes de dichas cabeceras.
Cómo podéis apreciar en el PAPYRE 6S ALEX que según creo utiliza una implementación del lector FBREADER, las cabeceras de capítulo quedan bastante bien. Además con la numeración en romano resultan muy apropiadas al libro, una novela de la serie de Marco Licinio Cato de Simon Scarrow.

Cabeceras en el PAPYRE 6S ALEX

VER PRESENTACIÓN

DESCARGAR TODO

Como podéis apreciar en las fotos el parser diferencia entre las cabeceras de capítulo y el cuerpo del texto; y aplica el zoom del tamaño de fuente únicamente a este último componente; lo cual es genera una experiencia de lectura bastante buena.

ADOBE te da sorpresas, sorpresas te da ADOBE, ¡Ay Dios!
snapshot_18

Pedro Navajas, dixit. Pero resulta que si el lector de tu dispositivo está basado en una implementación del ADOBE MOBILE READER, la historia es distinta. ADOBE no distingue entre las cabeceras y el cuerpo del texto (hasta aquí, todo normal). Pero en el momento que empezamos a aplicar el zoom al texto, las cabeceras de capítulo crecen igual que el resto y…

AMR sin clearfloats

VER PRESENTACIÓN

DESCARGAR TODO

…se descuajeringa un tanto la cosa. Vemos que la fuente del número de capítulo crece a un tamaño mayor que la caja que la contiene, lo cual pone en marcha un mecanismo poco virtuoso. No sólo el texto de la cabecera del capítulo sale de su caja, sino que además desaparece en parte por el margen izquierdo (el opuesto adonde estaba referenciado el número de capítulo en romanos). El “XXXVIII” se queda en “XXXV”
Pero lo que es muchísimo peor aun es que rebosa también hacia abajo sobre las primeras líneas del cuerpo del texto y se come al menos la primera línea del capítulo.
No es la primera sorpresa que nos depara el ADOBE MOBILE READER.

La solución, un nuevo estilo CSS “clearfloats”
Pero si algo bueno tiene el ePUB es que depende de una hoja de estilos CSS. Y en el CSS se puede hacer casi de todo. Lo más elemental sería impedir que se pierda parte del texto del capítulo. Para ello, añadiremos a la hoja de estilo CSS de las BBPP LARdT 1.0 un nuevo estilo que vamos a llamar (con bastante poca imaginación) “clearfloats”.

.clearfloats {    clear: both;}

Como al fin y al cabo la caja de la cabecera del capitulo es un “float” lo que debemos asegurarnos es que sus efectos en el formato no se prolonguen más allá del límite del propio objeto (la caja), junto con el texto “rebosado”. Y eso es justo lo que estamos haciendo con el comando
clear: both

limpiar los efectos en ambos sentidos, vertical y horizontal.
Tendremos que aplicar dicho estilo al primer párrafo del capítulo, para que se “detengan” los efectos. Y lo haremos dentro de etiquetas <div>

   1: <body>   2:   <h3 id="heading_id_2"><span class="chapterHeader"><span class="translation serif">Capítulo</span> <span class="count serif">XXXVIII</span></span></h3>   3:     4:   <div class="clearfloats">   5:     <p class="MsoNormal"><span class="none">Cato soltó la cantimplora y se puso en pie rápidamente al tiempo que gritaba las órdenes:</span></p>   6:   </div>

Para ver el efecto más claramente aquí tenéis los pantallazos, podéis comprobar como en este caso la primera línea del primer párrafo del cuerpo del texto es empujada hacia abajo en vez de ser sobrescrita como en el caso anterior.

AMR con clearfloats

VER PRESENTACIÓN

DESCARGAR TODO

sábado, 25 de septiembre de 2010

Los “heading” y la creación de TOCs en las BBPP LARdT 1.0 (“Buenas Prácticas de LARdT para un ePUB decente”) (Cap. 08)

Las etiquetas “heading” (h1, h2, h3,…) se usan muy frecuentemente en HTML porque dado que jerarquizan el contenido y a la vez suelen tener vinculados formatos de estilo (con tamaño de fuentes creciente, negrita, subrayados, etc..) resultan muy prácticas. Es lo que se llama “marcado semántico”: algo etiquetado como <h1> siempre será más visible que lo que esté etiquetado como <h2>.
Dada esta prevalencia en HTML parece natural que su uso se extienda también al XHTML de los ePUB. Y aquí es donde merece la pena realizar un comentario.

Un uso disperso
Todos los que componemos libros en ePUB usamos los headings. Y de forma distinta, lo cual a veces resulta problemático. Las BBPP LARdT 1.0 también contienen su propio criterio de aplicación, como no. Al menos tiene la ventaja de ser siempre idéntico. Por eso, he pensado que no estaría mal que fuera generalizándose un uso un poco más uniforme de los “headings”, es decir, unas “buenas prácticas”.

Leer más » »

miércoles, 25 de agosto de 2010

Preprocesando un archivo DOC (MS Word) para su mejor conversión a ePUB en CALIBRE

A veces encontramos un libro en formato DOC (MS Word) que queremos convertir a ePUB u otro formato mediante CALIBRE. El asunto es que algunos de las funcionalidades de formato que hacen que el libro luzca estupendamente en DOC no son muy convenientes a la hora de la conversión. Pero podemos echarle una mano realizando un pequeño preproceso en MS WORD 2007.

El libro en WORD
Eliminar CABECERAS y PIES DE PÁGINA y METADATOS si procede
Examinaremos las propiedades del documento en BOTON DE OFFICE – PREPARAR – PROPIEDADES. Si el Título y Autor no son correctos los eliminaremos en el siguiente paso. Como son correctos, voy a mantenerlos.
Con BOTON DE OFFICE – PREPARAR – INSPECCIONAR DOCUMENTO seleccionaremos las opciones de inspección.

Leer más » »

martes, 24 de agosto de 2010

Añadimos un FEED con las novedades de “La BIBLIOTECA de Mi reader Papyre para ebooks"

Para que podais hacer un mejor seguimiento de las novedades de la BIBLIOTECA, hemos añadido un FEED que recoge las últmas 5 entradas con su enlace correspondiente para un cómodo acceso. Lo encontrareis en la parte inferior derecha de la página o pulsando la opción de menú “La BIBLIOTECA / LIBRARY ePUB”.
¡Felices lecturas!

martes, 3 de agosto de 2010

Más arreglos con RegEx (Expresiones Regulares) después de la conversión desde PDF a un ePUB para Mi PAPYRE 6.1 reader

Como ya sabéis, los PDFs dan para mucho cuando de convertirlos a ePUB se trata, sobre todo por el tipo de “zurraspas” que nos quedan antes de lograr un ebook decente. Ya hemos comentado varios ejemplos en este BLOG (aquí y también aquí) pero viendo estos ejemplos no he podido resistirme a preguntarle a Coco y compartir sus soluciones.

Leer más » »

martes, 27 de julio de 2010

Usando el sistema de lectura de Mi PAPYRE 6S ALEX. Primer Contacto: La LIBRERÍA (I)

El sistema de lectura del PAPYRE 6S ALEX está formado por tres módulos interconectados.
La Librería: que nos permite acceder a las librerías on-line preconfiguradas, mediante la conexión Wi-Fi; y buscar y descargar nuevos títulos desde las mismas. ALEXLECTOR

La Biblioteca: que se encarga de la gestión, ordenación y selección de nuestros libros almacenados en la memoria del dispositivo (microSD y memoria interna; gestionadas como una unidad).
ALEXector

El Lector: que despliega los visores para los distintos formatos de archivo permitidos ePUB, PDF y HTML, cargando el libro elegido en la Biblioteca para la sesión de lectura.

Vamos a empezar desde cero, es decir, sin libro que llevarnos a la boca porque para eso voy a descargármelo desde la Librería.

ALBERT lo tiene claro: ALEX

Descargando un libro con la Librería
Lógicamente es necesario tener iniciada una sesión de internet mediante la tarjeta Wi-Fi del dispositivo. Entramos y accedemos al listado de los sites desde donde puedo descargar libros. Están pre-configurados; no he encontrado forma de editar o realizar añadidos a la lista. Por los que reconozco, son todos sitios de carácter gratuito aunque no habría problema para incluir sitios de pago.

El proceso es sencillo, se realiza una búsqueda, ya sea por términos o dentro de las subcategorias existentes y el sistema devuelve los títulos que cumplen con la misma. Se selecciona uno de los títulos y en ese momento empieza la descarga del archivo.
Una vez finalizada la descarga, el libro electrónico se carga automáticamente en

el lector, listo para iniciar su lectura.

Ver álbum completo

Nada más terminar la descarga tenemos el libro cargado en el LECTOR:

Y conectado el modo SYNC con la pantalla EPD, como podéis ver.

20100728 MODIFICACION
El proceso es rápido y cómodo; sin embargo el valor que aporte dependerá de las páginas de descarga preconfiguradas. En su mayoría poseen contenidos en inglés. El archivo descargado no se almacena en la memoria microSD, sino en la memoria interna; por lo que no es accesible a las operaciones USB de copia de archivos.

He intentado acceder y descargar mediante WiFi a los archivos ePUB ubicados en “La Biblioteca de Mi PAPYRE reader para ebooks”. No ha sido posible:
- La descarga a través del navegador de internet. El gestor de descargas respondía “descarga desconocida o no autorizada”
- La descarga como anexo a un correo electrónico: el e-mail llegaba con el anexo, pero no era posible abrirlo ni actuar sobre él.

20100729 MODIFICACION
Vemos cómo el archivo descargado NO ES ALMACENADO en la memoria de la tarjeta microSD sino en la memoria interna, lo cual se indica con el icono diferenciador

Seguiremos leyendo con nuestro PAPYRE 6S ALEX en el POST que tratará sobre el LECTOR (II).

Usando el sistema de lectura de Mi PAPYRE 6S ALEX. Primer Contacto: La LIBRERÍA (I)

ALBERT lo tiene claro: ALEX

el lector, listo para iniciar su lectura.

Ver álbum completo

Nada más terminar la descarga tenemos el libro cargado en el LECTOR:

jueves, 22 de julio de 2010

Aplicamos las “BBPP de LARdT 1.0 para un ePUB decente” para la conversión de un PDF desde el principio hasta final (Cap.01)

Algunos lectores me han comentado que lo de las “Buenas prácticas de LARdT para un ePUB decente” (en adelante, BBPP LARdT 1.0), está muy bien pero que hablar sobre la teoría es fácil y que las complicaciones aparecen cuando se enfrenta uno a la edición y mejora de un libro en concreto. Y tienen razón. Por eso, he tomado un libro PDF (de los más antipáticos de convertir) y vamos a mostrar paso por paso las modificaciones realizadas para convertirlo en un ePUB decente.
Cómo es un poco largo no me ha quedado más remedio que dividir el contenido del POST en varios capítulos que irán publicándose diariamente (perdón por la molestia del “CONTINUARA…”).

La edición en SIGIL
Cargamos el ePUB según sale de la conversión desde PDF efectuada en CALIBRE. Por cierto, SIGIL me informa de que acaba de lanzar su actualización a la versión 0.23.
Empezamos a observar el libro y pronto encontramos un problema muy común en las conversiones desde PDF:
MUY IMPORTANTE: si copiais el código para utilizarlo en SIGIL, recordad que SIGIL admite el copiar-pegar de los retornos de carro (NEWLINE) en las cajas de texto del copiar-pegar. Debereis copiar el cambio de línea o bien sustituir en la expresión de busqueda por “(/n/s*)”
Es decir, cuando copies el codigo y lo pegueis en SIGIL quedará:
pero en realidad es:

porque debemos COPIAR y PEGAR entre cada línea el RETORNO DE CARRO:

1. - Depuramos texto espurio (cabeceras y pies de páginas incrustados entre el texto)
Efectivamente como podéis comprobar en la imagen encontramos encabezados con números de páginas entreverados con el texto, interrumpiendo el flujo del mismo. Podéis ver la imagen en detalle pulsando sobre ella, como siempre.

El código de BÚSQUEDA es:

<p class="calibre2">Valeri Massimo Manfredi</p>

<p class="calibre2">([\(\ÑñÓ/ÃÁÉÍÚáéíóúÜü¡!?¿*:«»"'-%…=–º©—“”#{(¼)\)
.,;a-zA-Z0-9\-_\s\c]*)</p>

<p class="calibre2"></p>

<p class="calibre2">([0-9]*)</p>

y no hay código de SUSTITUCIÓN porque se trata de ELIMINAR estas ocurrencias.

Seguimos eliminando ocurrencias similares pero en el caso en el que aparece el nombre del autor seguido del número de página:

El código de BÚSQUEDA es:

Valeri Massimo Manfredi</p>

  <p class="calibre2">L o s i d u s d e m a r z o</p>

  <p class="calibre2"></p>

  <p class="calibre2">([0-9]*)</p>

  <p class="calibre2"></p>

  <p class="calibre2">

y no hay código de SUSTITUCIÓN porque se trata de ELIMINAR estas ocurrencias.

Otra variante similar, pero además cerrando la oración con un código de párrafo:

El código de BÚSQUEDA es:

. Valeri Massimo Manfredi</p>

  <p class="calibre2">L o s i d u s d e m a r z o</p>

  <p class="calibre2"></p>

  <p class="calibre2">([0-9]*)</p>

y el código de SUSTITUCIÓN:

.</p>

2. - Depuramos RETORNOS DE CARRO espúreos que dividen párrafos indebidamente:

El código de BÚSQUEDA es:

([áéíóúa-zA-Z,;?!0-9])</p>

  <p class="calibre2">([¿a-z])

y el código de SUSTITUCIÓN:

\1 \2

Y seguimos con una ligera variación sobre el mismo caso (el corte va precedido de un “Guión largo” (EMDASH):

El código de BÚSQUEDA es:

([áéíóúa-zA-Z,;?!—])</p>

  <p class="calibre2">([a-z¿])

y el código de SUSTITUCIÓN:

\1\2

Y aquí ha llegado el momento de parar para continuar en el CAP.02

Aplicamos las “BBPP de LARdT 1.0 para un ePUB decente” para la conversión de un PDF desde el principio hasta final (Cap.01)

porque debemos COPIAR y PEGAR entre cada línea el RETORNO DE CARRO:

<p class="calibre2">Valeri Massimo Manfredi</p>

<p class="calibre2">([\(\ÑñÓ/ÃÁÉÍÚáéíóúÜü¡!?¿*:«»"'-%…=–º©—“”#{(¼)\)
.,;a-zA-Z0-9\-_\s\c]*)</p>

<p class="calibre2"></p>

<p class="calibre2">([0-9]*)</p>

El código de BÚSQUEDA es:

Valeri Massimo Manfredi</p>

  <p class="calibre2">L o s i d u s d e m a r z o</p>

  <p class="calibre2"></p>

  <p class="calibre2">([0-9]*)</p>

  <p class="calibre2"></p>

  <p class="calibre2">

y no hay código de SUSTITUCIÓN porque se trata de ELIMINAR estas ocurrencias.

Otra variante similar, pero además cerrando la oración con un código de párrafo:

El código de BÚSQUEDA es:

. Valeri Massimo Manfredi</p>

  <p class="calibre2">L o s i d u s d e m a r z o</p>

  <p class="calibre2"></p>

  <p class="calibre2">([0-9]*)</p>

y el código de SUSTITUCIÓN:

.</p>

2. - Depuramos RETORNOS DE CARRO espúreos que dividen párrafos indebidamente:

El código de BÚSQUEDA es:

([áéíóúa-zA-Z,;?!0-9])</p>

  <p class="calibre2">([¿a-z])

y el código de SUSTITUCIÓN:

\1 \2

Y seguimos con una ligera variación sobre el mismo caso (el corte va precedido de un “Guión largo” (EMDASH):

El código de BÚSQUEDA es:

([áéíóúa-zA-Z,;?!—])</p>

  <p class="calibre2">([a-z¿])

y el código de SUSTITUCIÓN:

\1\2

Y aquí ha llegado el momento de parar para continuar en el CAP.02

Cosas Interesantes. Todo lo que siempre quisiste saber, y nadie se atrevió a contestar

Navigation