Cosas Interesantes

domingo, 7 de febrero de 2010

Seguimos preparando nuestros ebooks usando el RegEx de WORD OFFICE (Cap.02)

Coco profesorContinuando con la entrada anterior de este BLOG, seguimos en PAPYRE STREET, utilizando la ayuda de Coco para limpiar un poco nuestros textos antes de convertirlos a ePUB que es nuestro formato preferido. Veamos que trucos nos enseña PAPYRE STREETCoco para aprovechar la potencia del dialecto enrevesado de RegEx (Expresiones Regulares) que WORD OFFICE pone a nuestra disposición.



HACIENDO LIMPIEZA DEL TEXTO PARA CONSEGUIR UNA MEJOR CONVERSIÓN
Porque de eso se trata. Cuando más limpio esté el texto, sin códigos innecesarios, más probabilidades hay de una conversión exitosa. Así que me pongo a revisar el documento y…
Texto INCORRECTOme doy cuenta que al principio de todos los párrafos, la indentación incluye ESPACIOS además del código de tabulación. Eso no es bueno. Compruebo además que no es un ESPACIO “normal” sino un ESPACIO DE NO SEPARACIÓN; el famoso No-breaking space que encontráis mucho en el HTML de las páginas web cómo  

Vamos con la expresión de búsqueda.
Sabemos que buscamos un grupo de 3 ESPACIOS DE NO SEPARACIÓN: ^s{3;}
El código de ESPACIO DE NO SEPARACIÓN ^s y el número de coincidencias; queremos un intervalo desde a 3 a 3 que escribimos como {3;}. No hay expresión de reemplazo porque queremos eliminarlo. Pulsamos ENTER y….

image

image










vemos que hemos limpiado los espacios.

LOS GUIONES OPCIONALESimage
Los guiones opcionales son un gran invento. Aseguran que el texto se separe automáticamente por silabas

image

para su guionado al final de una línea de forma correcta aprovechando al máximo el espacio disponible. Sin embargo, a la hora de exportarlo para una conversión a un formato eBook nos pueden hacer que el ebook aparezcan con guiones en sitios improcedentes.

Los eliminaremos usando: ^~
 image image
¿Por qué tantos reemplazos? Porque hay un posible guión entre cada 2 sílabas contiguas del texto.

ARREGLANDO LOS GUIONES LARGOS
imageimage
Vemos que los guiones de diálogo no son apropiados. Cambiaremos un guión corto con un espacio intercalado por un guión largo: –^s por ^+
imageimage

También:
   
image

 

 

  image

  image  image 

 

 



image image image image 

TÍTULOS CON NUMEROS ROMANOS
Para acabar COCO nos cuenta cómo seleccionar títulos con números romanos:
Con ([IVXL]{1;9}) podréis seleccionar hasta el número 99 en caracteres romanos.

No hay comentarios

Publicar un comentario

© Cosas Interesantes