1. EL PDF
QUE ES EL PDF?
PDF (sigla del inglés portable document format, formato de documento portátil)
es un formato de almacenamiento de documentos, desarrollado por la empresa
Adobe Systems. Este formato es de tipo compuesto (imagen vectorial, mapa de
bits y texto).
GENERALIDADES
Está especialmente ideado para documentos susceptibles de ser impresos, ya
que especifica toda la información necesaria para la presentación final del
documento, determinando todos los detalles de cómo va a quedar, no
requiriéndose procesos anteriores de ajuste ni de maquetación.
CARACTERÍSTICAS
• Es multiplataforma, es decir, puede ser presentado por los principales
sistemas operativos (Windows, Unix/Linux o Mac), sin que se modifiquen
ni el aspecto ni la estructura del documento original.
• Puede ingerir cualquier combinación de texto, elementos multimedia
como vídeos o sonido, elementos de hipertexto como vínculos y
marcadores, enlaces y miniaturas de páginas.
• Es uno de los formatos más extendidos en Internet para el intercambio
de documentos. Por ello es muy utilizado por empresas, gobiernos e
instituciones educativas.
• Es una especificación abierta, para la que se han generado
herramientas de software libre que permiten crear, visualizar o modificar
documentos en formato PDF. Un ejemplo es la suite ofimática
OpenOffice.org y el procesador de textos LaTeX.
• Puede cifrarse para proteger su contenido e incluso firmarlo
digitalmente.
• El archivo PDF puede crearse desde varias aplicaciones exportando el
archivo, como es el caso de los programas de OpenOffice.org y del
paquete ofimático Microsoft Office 2007 (si se actualiza a SP21 ).
• Puede generarse desde cualquier aplicación mediante la instalación de
una impresora virtual en el sistema operativo, en caso de usar
aplicaciones sin esa funcionalidad embebida.
• Es el estándar ISO (ISO 19005-1:2005) para ficheros contenedores de
documentos electrónicos con vistas a su preservación de larga
duración.2
• Los ficheros PDF son independientes del dispositivo, el mismo archivo
puede imprimirse en una impresora de inyección de tinta o una
filmadora. Para la optimización de la impresión podremos configurar las
opciones de creación del fichero PDF.
2. HISTORIA
Los archivos PDF, junto con las aplicaciones que podían ver y crear este tipo
de documentos, comenzaron a desarrollarse a partir de 1991, y su adopción
comercial y general era muy reducida. Su software se distribuía como software
de licencia comercial. En esa época el visor de documentos PDF estaba
disponible de forma gratuita, pero no de forma libre.
Las versiones tempranas de los documentos PDF no tenían hipervínculos
externos; por este motivo, su adopción en Internet era considerablemente
reducida y no tenía mucha popularidad. En esos tiempos, eran comunes las
conexiones a Internet a través de módem telefónico, y el tamaño de los
documentos PDF era mucho más grande que otros tipos de documentos, como
el texto simple (sin formato), por ejemplo; por lo tanto, la banda ancha fue un
factor clave para su aceptación en Internet. Además, ya existían otros tipos de
documentos que le hacían fuerte competencia al tipo de documentos PDF,
como por ejemplo, los documentos "PostScript" (.ps), los cuales, en esos
tiempos, eran considerablemente comunes.
Con el tiempo, los documentos PDF fueron adquiriendo popularidad de varias
formas diferentes, como publicidad. Este tipo de documentos empezó a
popularizarse considerablemente, hasta convertirse en un estándar.[cita requerida]
Este tipo de documento es visto como una página digital que está lista para
imprimirse exactamente como se muestra en la pantalla, sin problemas de
márgenes a la hora de imprimir, tal como sucede en otros documentos
digitales.
En los años recientes de su popularidad, han salido varias aplicaciones lectoras
de este tipo de archivos. Su popularidad ha abierto la posibilidad de crear
documentos PDF con programas de software libre, como lo hace en la
actualidad OpenOffice.org. Otras aplicaciones, son incluso capaces de
editarlos, sin necesidad de usar la típica aplicación para crear y editar
documentos PDF de Adobe.
El formato de archivos PDF ha cambiado varias veces, pues las nuevas
versiones del Acrobat de Adobe se han lanzado. Ha habido nueve versiones de
PDF:
• (1993) - PDF 1.0 / Acrobat 1.0
• (1994) - PDF 1.1 / Acrobat 2.0
• (1996) - PDF 1.2 / Acrobat 3.0
• (1999) - PDF 1.3 / Acrobat 4.0
• (2001) - PDF 1.4 / Acrobat 5.0
• (2003) - PDF 1.5 / Acrobat 6.0
• (2005) - PDF 1.6 / Acrobat 7.0
• (2006) - PDF 1.7 / Acrobat 8.0 / ISO 32000
3. • (2008) – PDF 1.7, Adobe Extension Level 3 / Acrobat 9.0
• (2009) – PDF 1.7, Adobe Extension Level 5 / Acrobat 9.1
FORMATO DE FICHERO PDF
Dependientemente de cómo se haya creado el fichero PDF, todos ellos
comparten la misma estructura interna compuesta de cuatro partes:
• Cabecera: Información sobre la especificación del estándar PDF que se
ha seguido en donde se indica, por ejemplo, la versión.
• Cuerpo: Descripción de los elementos usados en las páginas del fichero.
• Tabla de referencias cruzadas: Información de los elementos usados en
las páginas del fichero.
• Coda: Indica dónde encontrar la tabla de referencias cruzadas.
Hay que notar que cuando un fichero PDF es modificado y se añade nuevo
contenido, éste tendrá nuevas secciones de cuerpo, tabla de referencias
cruzadas y coda pero al guardar este documento podemos optimizarlo para
que las secciones duplicadas se fusionen en sólo una y se reorganice el
fichero.
REPRESENTACIÓN DE COLOR EN PDF
El formato PDF está indicado para la impresión de documentos ya que
especifica toda la información necesaria que lo definen. En este punto es
interesante especificar como se hace la representación de colores del fichero
en PDF.
En el formato PDF se especifican espacios de color, esto es la descripción de
cómo hay que interpretar los colores del documento.
Un color se define mediante uno o varios componentes numéricos y la
interpretación de estos se hará según el espacio de color especificado.
Los espacios de color pueden ser: dependientes del dispositivo, independientes
del dispositivo o espacios de color espaciales.
DEPENDIENTES DEL DISPOSITIVO
Es la forma más simple e imprecisa de reproducir colores usada por aparatos
que no disponen de gestores de color. Cada punto es descrito por un color que
está compuesto de ciertas cantidades de colorantes.
4. Para PDF existen tres espacios de colores distintos dependientes del
dispositivo:
• CMYK del dispositivo: Los valores de composición de los colores son
descritos por los colorantes CMYK (cyan, magenta, amarillo y negro)
mediante mezcla sustractiva.
• RGB del dispositivo: Los valores de composición de los colores son
descritos por los colorantes RGB (rojo, verde y azul) mediante mezcla
aditiva.
• Gris del dispositivo: Los valores de composición de los colores son
descritos por una escala acromática de blanco a negro.
INDEPENDIENTES DEL DISPOSITIVO
Estos espacios de color están basados en CIE, organización internacional que
estudia la luz y el color. Su objetivo es el describir con detalle cómo ve el ser
humano e intenta reproducirlos de la misma forma independientemente del
dispositivo que lo reproduzca. A estos colores también se les llama calibrados.
Los colores son descritos mediante matrices numéricas y se modifican
mediante transformaciones de valores usando las ideas de colores neutros más
claros y más oscuros.
Para PDF existen cuatro espacios de colores distintos independientes del
dispositivo:
• RGB calibrado: Los valores de composición de los colores son descritos
por los colorantes RGB (rojo, verde y azul) mediante mezcla aditiva pero
tanto la intensidad, tonalidad y gradación dependen de funciones
decodificadoras en las que se aplica un valor gamma particular para
cada colorante.
• Gris calibrado: Los valores de composición de los colores son descritos
por una escala acromática de blanco a negro pero tanto la intensidad,
tonalidad y gradación dependen de funciones decodificadoras en las que
se aplica un valor gamma particular para el colorante.
• Lab: Espacio de color basado en CIE compuestos por A, B y C que se
les asigna los valores L*, a* y b* del espacio de color CIELAB (espacio
de color Lab).
• Basado en ICC: Basados en los espacios de color del Consorcio
Internacional del Color el cual no se basa en las entradas de los
diccionarios de espacio de color sino en perfiles de color ICC
(International Color Consortium).
5. ESPACIALES
Se utilizan métodos especiales de reproducción del color.
• Espacios de color Separación: Son espacios de color monocromos en
donde se usan colorantes especiales como tintas metálicas o
fluorescentes.
• Espacios de color Dispositivo: Usados para ocasiones en que los objetos
necesiten utilizar más colorantes en la impresión. Estos espacios de
color permite que los colorantes que haya en el dispositivo se traten
como un espacio de color del dispositivo con varios componentes.
COMPRESIÓN EN PDF
Los ficheros PDF se pueden comprimir y cada elemento del mismo es
comprimido mediante uno u otro algoritmo.
Los textos y órdenes PostScript se pueden comprimir usando el algoritmo
Lempel Ziv Welch (LZW) y las imágenes mediante: JPEG, ZIP o RLE.
• JPEG (Joint Photographic Experts Group): En modo con pérdidas o sin
pérdidas usado para imágenes en escala de grises o cuatricromías. Si
se recomprime causa pérdida acumulativa de información.
• ZIP (Formato de compresión ZIP): Realizada mediante el algoritmo LZW,
sin pérdidas, en donde reemplaza secuencias repetidas por marcadores.
Indicado para imágenes en color y escala de grises.
• RLE (Run-length encoding): Sistema sin pérdidas usado para imágenes
de línea (gráfico rasterizado).