El texto y las fuentes en un documento PDF
El texto en un fichero PDF puede ir comprimido o sin comprimir. El algoritmo de compresión usado es LZW. Si el texto se hubiera comprimido, ya no será legible a simple vista si se abre con un editor de texto.
El algoritmo LZW funciona reemplazando los datos más frecuentes por un sólo carácter. Suele dar una tasa de compresión de 2:1.
En los ficheros PDF el texto se distribuye línea a línea. Esto significa que un PDF no tiene "conciencia" de cómo fluía el texto en el documento original. Si usas Adobe Acrobat para hacer una pequeña corrección, las palabras no refluirán a la línea inferior si hiciera falta. Sin intentas seleccionar dos líneas en dos columnas adyacentes, verás que puedes seleccionar a lo largo de ambas columnas.
Afortunadamente, si copias y pegas las dos columnas en un documento de texto, verás que se pega en orden adecuado, una columna detrás de otra.
[Nota del traductor: Existen plug-ins para versiones de Acrobat anteriores a la versión 5 que permiten extraer el texto de los documentos. A partir de la versión 5, Acrobat mismo es capaz de guardar el texto de los documentos no bloqueados.]
El algoritmo LZW funciona reemplazando los datos más frecuentes por un sólo carácter. Suele dar una tasa de compresión de 2:1.
En los ficheros PDF el texto se distribuye línea a línea. Esto significa que un PDF no tiene "conciencia" de cómo fluía el texto en el documento original. Si usas Adobe Acrobat para hacer una pequeña corrección, las palabras no refluirán a la línea inferior si hiciera falta. Sin intentas seleccionar dos líneas en dos columnas adyacentes, verás que puedes seleccionar a lo largo de ambas columnas.
Afortunadamente, si copias y pegas las dos columnas en un documento de texto, verás que se pega en orden adecuado, una columna detrás de otra.
[Nota del traductor: Existen plug-ins para versiones de Acrobat anteriores a la versión 5 que permiten extraer el texto de los documentos. A partir de la versión 5, Acrobat mismo es capaz de guardar el texto de los documentos no bloqueados.]
Las fuentes en los ficheros PDF
En el formato PDF se pueden usar fuentes PostScript (tipo 1 y tipo 3) y fuentes True Type. Estas fuentes se incluyen preferentemente en los ficheros PDF para que se puedan ver e imprimir tal cómo fueron hechos por sus creadores. Si faltan algunas fuentes, Acrobat (ya sea su versión completa o Acrobat Reader) intentará emularlas usando alguna de las fuentes Multiple Master que llevan incluidas. De este modo, el documento no se representará tan exactamente como su creador quiso, pero, al menos, el texto no refluirá.
Las fuentes Multiple Master (MM) que Adobe Acrobat usa son:
|
¿Qué fuentes se usan en un PDF?
Acrobat (ya sea su versión completa o Acrobat Reader) ofrecen una opción de información sobre las fuentes es su menú "Archivo - Datos del documento - Fuentes". En este apartado se listan sólamente aquellas fuentes usadas en la página activa en ese momento. No debes usarlo como una fuente de información sobre todas las fuentes usadas en un fichero PDF.
Para obtener una lista completa de todas las fuentes usadas en un fichero PDF debes usar una extensión del tipo de PitStop (de Enfocus). |
Incrustar fuentes
Acrobat Distiller ofrece la opción de añadir automáticamente las fuentes perdidas a los ficheros PostScript que tiene que procesar. En el menú de "Configuración - Ubicación de fuentes", el usuario puede definir varias carpetas para que Acrobat Distiller busque y sepa dónde localizar las fuentes que falten en el fichero PostScript. Para los usuarios de Macintosh: EL programa sólo necesita las fuentes de impresora, no las de pantalla.
¿Qué fuentes no se incluyen en los ficheros PDF?
Hay algunas diferencias fundamentales entre Acrobat 3.x y Acrobat 4.x en la forma de gestionar las fuentes.
Estas fuentes (ZapfDingbats excluida) son las llamadas 13 fuentes básicas.
Adobe Acrobat 4.x no tiene problemas en incrustar esas 14 fuentes. Pero sí tiene otra restricción: Si las normas de licencia (licensing policy) de una fuente True Type impiden que la fuente de incruste en un fichero, Adobe Acrobat 4.x respetará esta restricción y no incrustará la fuente. Lee esto si quieres saber más sobre este problema.
- Hay 14 fuentes que Acrobat Distiller 3.x nunca incrusta en un fichero PDF. Son:
- Courier, Courier-Bold, Courier-Oblique, Courier-BoldOblique.
- Times-Roman , Times-Bold , Times-Italic, Times-BoldItalic.
- Helvetica, Helvetica-Bold, Helvetica-Oblique, Helvetica-BoldOblique.
- Symbol.
- ZapfDingbats.
Estas fuentes (ZapfDingbats excluida) son las llamadas 13 fuentes básicas.
Adobe Acrobat 4.x no tiene problemas en incrustar esas 14 fuentes. Pero sí tiene otra restricción: Si las normas de licencia (licensing policy) de una fuente True Type impiden que la fuente de incruste en un fichero, Adobe Acrobat 4.x respetará esta restricción y no incrustará la fuente. Lee esto si quieres saber más sobre este problema.
Incrustar subjuegos de fuentes
También es posible incluir sólo aquellos carácteres de una fuente que se usen en una publicación. Esta técnica se llama "incrustar subjuegos de fuentes". Al usar la opción "Configuración - Opciones de trabajo - Fuentes - Incrustar subjuegos de fuentes por debajo de XXX %" de Acrobat Distiller, el usuario puede decidir cuántos carácteres deben haberse usado en una publicación para que se incruste una porción de esa fuente.
incrustar subjuegos tiene dos ventajas:
Sin embargo, incrustar subjuegos también tiene dos desventajas:
incrustar subjuegos tiene dos ventajas:
- El tamaño del fichero PDF final se reduce y esto puede ser muy útil si el tamaño de un PDF es verdaderamente crucial, como es el caso de PDFs que deban situarse en la Red.
- Un RIP usará siempre una fuente incrustada como subjuego incluso aunque disponga por sí mismo de la fuente completa. Esta es una manera de evitar recolocaciones extrañas de textos debido a difererencias menores entre veersionesde una misma fuente.
Sin embargo, incrustar subjuegos también tiene dos desventajas:
- Si el usuario opta por editar algo de texto en Adobe Acrobat y un carácter que se necesite no ha sido incrustado en el subjuego, no podrá usarse.
- Fusionar dos ficheros PDF que contienen subjuegos diferentes de una misma fuente puede hacer que desaparezcan carácteres necesarios.