El formato PDF es un formato de documento desarrollado por Adobe que permite almacenar documentos de manera independiente del dispositivo incluyendo texto, imágenes y otros elementos multimedia. Los archivos PDF mantienen la presentación y el formato del documento de manera fiel independientemente del sistema operativo o aplicación usada para abrirlo. El formato PDF se ha convertido en un estándar ampliamente usado para compartir y almacenar documentos electrónicos de manera confiable.
2. PDF
Es un formato de almacenamiento de
documentos, desarrollado por la empresa
Adobe Systems. Este formato es de tipo
compuesto (imagen vectorial, mapa de
(
bits y texto).
3. Generalidades
Está especialmente ideado para
documentos susceptibles de ser impresos,
ya que especifica toda la información
necesaria para la presentación final del
documento, determinando todos los
detalles de cómo va a quedar, no
requiriéndose procesos anteriores de
ajuste ni de maquetación.
4. Características
Es multiplataforma, es decir, puede ser presentado por los principales sistemas
operativos (Windows, Unix/Linux o Mac), sin que se modifiquen ni el aspecto ni la
estructura del documento original.
Puede ingerir cualquier combinación de texto, elementos multimedia como vídeos o
sonido, elementos de hipertexto como vínculos y marcadores, enlaces y miniaturas
de páginas.
Es uno de los formatos más extendidos en Internet para el intercambio de
documentos. Por ello es muy utilizado por empresas, gobiernos e instituciones
educativas.
Es una especificación abierta, para la que se han generado herramientas de software
libre que permiten crear, visualizar o modificar documentos en formato PDF. Un
ejemplo es la suite ofimática OpenOffice.org y el procesador de textos LaTeX.
Puede cifrarse para proteger su contenido e incluso firmarlo digitalmente.
El archivo PDF puede crearse desde varias aplicaciones exportando el archivo, como
es el caso de los programas de OpenOffice.org y del paquete ofimático Microsoft
Office 2007 (si se actualiza a SP21 ).
Puede generarse desde cualquier aplicación mediante la instalación de una
impresora virtual en el sistema operativo, en caso de usar aplicaciones sin esa
funcionalidad embebida.
Es el estándar ISO (ISO 19005-1:2005) para ficheros contenedores de documentos
electrónicos con vistas a su preservación de larga duración.2
Los ficheros PDF son independientes del dispositivo, el mismo archivo puede
imprimirse en una impresora de inyección de tinta o una filmadora. Para la
optimización de la impresión podremos configurar las opciones de creación del
fichero PDF.
5. Historia
Los archivos PDF, junto con las aplicaciones que podían ver y crear
este tipo de documentos, comenzaron a desarrollarse a partir de
1991, y su adopción comercial y general era muy reducida. Su
software se distribuía como software de licencia comercial. En esa
época el visor de documentos PDF estaba disponible de forma
gratuita, pero no de forma libre.
Las versiones tempranas de los documentos PDF no tenían
hipervínculos externos; por este motivo, su adopción en Internet era
considerablemente reducida y no tenía mucha popularidad. En esos
tiempos, eran comunes las conexiones a Internet a través de
módem telefónico, y el tamaño de los documentos PDF era mucho
más grande que otros tipos de documentos, como el texto simple
(sin formato), por ejemplo; por lo tanto, la banda ancha fue un factor
clave para su aceptación en Internet. Además, ya existían otros
tipos de documentos que le hacían fuerte competencia al tipo de
documentos PDF, como por ejemplo, los documentos "PostScript"
(.ps), los cuales, en esos tiempos, eran considerablemente
comunes.
6. Con el tiempo, los documentos PDF fueron adquiriendo
popularidad de varias formas diferentes, como publicidad.
Este tipo de documentos empezó a popularizarse
considerablemente, hasta convertirse en un estándar. Este
tipo de documento es visto como una página digital que está
lista para imprimirse exactamente como se muestra en la
pantalla, sin problemas de márgenes a la hora de imprimir, tal
como sucede en otros documentos digitales.
En los años recientes de su popularidad, han salido varias
aplicaciones lectoras de este tipo de archivos. Su popularidad
ha abierto la posibilidad de crear documentos PDF con
programas de software libre, como lo hace en la actualidad
OpenOffice.org. Otras aplicaciones, son incluso capaces de
editarlos, sin necesidad de usar la típica aplicación para crear
y editar documentos PDF de Adobe.
7. El formato de archivos PDF ha cambiado varias veces,
pues las nuevas versiones del Acrobat de Adobe se han
lanzado. Ha habido nueve versiones de PDF:
(1993) - PDF 1.0 / Acrobat 1.0
(1994) - PDF 1.1 / Acrobat 2.0
(1996) - PDF 1.2 / Acrobat 3.0
(1999) - PDF 1.3 / Acrobat 4.0
(2001) - PDF 1.4 / Acrobat 5.0
(2003) - PDF 1.5 / Acrobat 6.0
(2005) - PDF 1.6 / Acrobat 7.0
(2006) - PDF 1.7 / Acrobat 8.0 / ISO 32000
(2008) – PDF 1.7, Adobe Extensión Level 3 / Acrobat 9.0
(2009) – PDF 1.7, Adobe Extensión Level 5 / Acrobat 9.1
8. Formato de fichero PDF
Independientemente de cómo se haya creado el fichero PDF, todos
ellos comparten la misma estructura interna compuesta de cuatro
partes:
Cabecera: Información sobre la especificación del estándar PDF
que se ha seguido en donde se indica, por ejemplo, la versión.
Cuerpo: Descripción de los elementos usados en las páginas del
fichero.
Tabla de referencias cruzadas: Información de los elementos
usados en las páginas del fichero.
Coda: Indica dónde encontrar la tabla de referencias cruzadas.
Hay que notar que cuando un fichero PDF es modificado y se añade
nuevo contenido, éste tendrá nuevas secciones de cuerpo, tabla de
referencias cruzadas y coda pero al guardar este documento
podemos optimizarlo para que las secciones duplicadas se fusionen
en sólo una y se reorganice el fichero.
9. Representación de color en PDF
El formato PDF está indicado para la impresión de
documentos ya que especifica toda la información
necesaria que lo definen. En este punto es interesante
especificar como se hace la representación de colores
del fichero en PDF.
En el formato PDF se especifican espacios de color,
esto es la descripción de cómo hay que interpretar los
colores del documento.
Un color se define mediante uno o varios componentes
numéricos y la interpretación de estos se hará según el
espacio de color especificado.
Los espacios de color pueden ser: dependientes del
dispositivo, independientes del dispositivo o espacios de
color espaciales.
10. Dependientes del dispositivo
Es la forma más simple e imprecisa de reproducir colores
usada por aparatos que no disponen de gestores de color.
Cada punto es descrito por un color que está compuesto
de ciertas cantidades de colorantes.
Para PDF existen tres espacios de colores distintos
dependientes del dispositivo:
CMYK del dispositivo: Los valores de composición de los
colores son descritos por los colorantes CMYK (cyan,
magenta, amarillo y negro) mediante mezcla sustractiva.
RGB del dispositivo: Los valores de composición de los
colores son descritos por los colorantes RGB (rojo, verde y
azul) mediante mezcla aditiva.
Gris del dispositivo: Los valores de composición de los
colores son descritos por una escala acromática de blanco
a negro.
11. Independientes del dispositivo
Estos espacios de color están basados en CIE,
organización internacional que estudia la luz y el
color. Su objetivo es el describir con detalle cómo
ve el ser humano e intenta reproducirlos de la
misma forma independientemente del dispositivo
que lo reproduzca. A estos colores también se les
llama calibrados.
Los colores son descritos mediante matrices
numéricas y se modifican mediante
transformaciones de valores usando las ideas de
colores neutros más claros y más oscuros.
12. Para PDF existen cuatro espacios de colores distintos
independientes del dispositivo:
RGB calibrado: Los valores de composición de los colores
son descritos por los colorantes RGB (rojo, verde y azul)
mediante mezcla aditiva pero tanto la intensidad, tonalidad y
gradación dependen de funciones decodificadoras en las
que se aplica un valor gamma particular para cada
colorante.
Gris calibrado: Los valores de composición de los colores
son descritos por una escala acromática de blanco a negro
pero tanto la intensidad, tonalidad y gradación dependen de
funciones decodificadoras en las que se aplica un valor
gamma particular para el colorante.
LAB: Espacio de color basado en CIE compuestos por A, B
y C que se les asigna los valores L*, a* y b* del espacio de
color CIELAB (espacio de color LAB).
Basado en ICC: Basados en los espacios de color del
Consorcio Internacional del Color el cual no se basa en las
entradas de los diccionarios de espacio de color sino en
perfiles de color ICC (International Color Consortium).
13. Espaciales
Se utilizan métodos especiales de reproducción
del color.
Espacios de color Separación: Son espacios
de color monocromos en donde se usan
colorantes especiales como tintas metálicas o
fluorescentes.
Espacios de color Dispositivo: Usados para
ocasiones en que los objetos necesiten utilizar
más colorantes en la impresión. Estos espacios
de color permite que los colorantes que haya en
el dispositivo se traten como un espacio de color
del dispositivo con varios componentes.
14. Compresión en PDF
Los ficheros PDF se pueden comprimir y cada elemento del mismo
es comprimido mediante uno u otro algoritmo.
Los textos y órdenes PostScript se pueden comprimir usando el
algoritmo Lempel Ziv Welch (LZW) y las imágenes mediante: JPEG,
ZIP o RLE.
JPEG (Joint Photographic Experts Group): En modo con
pérdidas o sin pérdidas usado para imágenes en escala de grises o
cuatricromías. Si se recomprime causa pérdida acumulativa de
información.
ZIP (Formato de compresión ZIP): Realizada mediante el
algoritmo LZW, sin pérdidas, en donde reemplaza secuencias
repetidas por marcadores. Indicado para imágenes en color y
escala de grises.
RLE (Run-length encoding): Sistema sin pérdidas usado para
imágenes de línea (gráfico rasterizado).