Cosas Interesantes

miércoles, 9 de junio de 2010

Arreglando con RegEx los guiones largos perdidos(EM DASH) en un ebook ePUB para Mi reader PAPYRE 6.1 (Cap. 02)

Coco profesorPAPYRE STREETCoco nos comenta que el otro día encontró algo extraño en un ebook ePUB con relación a los guiones largos. Resulta que al abrir el libro en ADE de Adobe los guiones largos aparecían como “?” (cierre interrogación). Evidentemente lo mismo pasaba en el lector ADE de mi PAPYRE. ¿Qué misterio es este?  

 

 



 

image

La cosa es aun más misteriosa porque, como podéis comprobar en las imágenes, el texto ePUB se ve perfectamente tanto en el browser incorporado de CALIBRE como el editor SIGIL


Pues es una cuestión de “buenas prácticas” a la hora de editar el libro. El asunto

está en que ADE es más

estrict

o

en el manejo del conjunto de caracteres permitidos

, y resulta que aunque parezca un guión largo (EM DASH), lo que tenemos en este libro es el carácter “barra” que no es admitido por ADE, PORQUE NO ES UNA ENTIDAD HTML 4.0.



Cómo Arreglarlo
 


Pues sustituyéndolo por un carácter que estemos seguros que ADE va a aceptar. La

Click para IMAGE

buena práctica

será utilizar siempre ENTIDADES HTML 4.0 cuyo listado podéis ver en la Wikipedia.
Así, sustituimos por el GUIÓN LARGO (EM DASH) y para estar seguros de no equivocarnos lo escribiremos en su notación HTML, es decir:

—
Es una práctica que os recomiendo para cuando utilicéis caracteres "especiales" y así no tendremos sorpresas. Efectivamente después de sustituir, ¡Voilá!, texto arreglado.


 

 



image



Y recordad, niños, ahora estoy CERCA image y ahora LEJOS image

1 comentario

  1. Eso no es una solución real si realmente se quieren hacer buenas prácticas.
    El Digital Editions hace una partición erronea del salto de página usando el Em Dash.

    ResponderEliminar

© Cosas Interesantes