Este documento describe diferentes tipos de archivos digitales, incluyendo archivos de texto, imágenes, video, audio y compresión. Explica qué es un archivo en general, las extensiones de archivo, y proporciona detalles sobre formatos populares de archivos para cada tipo, como .txt para archivos de texto, .jpg y .png para imágenes, .avi y .mp4 para video, y .mp3 para audio.
1. ACTIVIDAD
TIPOLOGIA DE ARCHIVOS
Contenido
1.¿Qué es un archivo?
2.¿Qué es una extensión de archivo?
3.¿Qué es un archivo de texto?
4.¿Qué es un archivo de imagen?
5.¿Qué es un archivo de video?
6.¿Qué es un archivo de audio?
7.¿Qué es un archivo de compresión?
8.¿Qué es un archivo de sistema?
9.¿Cuáles son los principales programas que se
utilizan en preprensa y cuáles son sus
extensiones?
2. ¿Qué es un archivo?
Un archivo es un conjunto de información que se
almacena en algún medio de escritura que permita
ser leído o accedido por una computadora.
Un archivo es identificado por un nombre y la
descripción de la carpeta o directorio que lo
contiene. Los archivos informáticos se llaman así
porque son los equivalentes digitales de los archivos
en tarjetas, papel o microfichas del entorno de
oficina tradicional. Los archivos informáticos facilitan
una manera de organizar los recursos usados para
almacenar permanentemente información dentro de
un computador.
En lo que concierne al sistema operativo, un archivo
es, en la mayoría de los casos, simplemente un flujo
unidimensional de bytes (números enteros en el
intervalo de 0 a 255), que es tratado por el sistema
operativo como una única unidad lógica. Un archivo
de datos informático normalmente tiene un tamaño,
que generalmente se expresa en bytes. Depende del
software que se ejecuta en la computadora el
interpretar esta simplísima estructura básica como
por ejemplo un programa, un texto o una imagen,
basándose en su nombre y contenido.
La información de un archivo informático
normalmente consiste de paquetes más pequeños
de información (a menudo llamados registros o
líneas) que son individualmente diferentes pero que
comparten algún rasgo en común.
La manera en que se agrupa la información en un
archivo depende completamente de la persona que
diseñe el archivo. Esto ha conducido a una
diversidad de estructuras de archivo más o menos
estandarizadas para todos los propósitos
3. imaginables, desde los más simples a los más
complejos. La mayoría de los archivos informáticos
son usados por programas de computadora.
En algunos casos, los programas de computadora
manipulan los archivos que se hacen visibles al
usuario de la computadora. Por ejemplo, en un
programa de procesamiento de texto, el usuario
manipula archivos, documento a los que él mismo
da nombre. El contenido del archivo-documento
está organizado de una manera que el programa de
procesamiento de texto entiende, pero el usuario
elige el nombre y la ubicación del archivo, y
proporciona la información (como palabras y texto)
que se almacenará en el archivo.
Los archivos de una computadora se pueden crear,
mover, modificar, aumentar, reducir y borrar. En la
mayoría de los casos, los programas de
computadora que se ejecutan se encargan de estas
operaciones, pero el usuario también puede
manipular los archivos si es necesario.
También un archivo es un documento donde uno
introduce algún tipo de dato para almacenar en un
objeto que lo pueda leer o modificar.
Información de Wikipedia
http://es.wikipedia.org/wiki/Archivo_%28inform
%C3%A1tica%29
¿Qué es una extensión de archivo?
En informática, una extensión de archivo o
extensión de fichero, es una cadena de caracteres
anexada al nombre de un archivo, usualmente
precedida por un punto. Su función principal es
4. diferenciar el contenido del archivo de modo que el
sistema operativo disponga el procedimiento
necesario para ejecutarlo o interpretarlo, sin
embargo, la extensión es solamente parte del
nombre del archivo y no representa ningún tipo de
obligación respecto a su contenido.
Referido a los nombres de los archivos informáticos,
conjunto de caracteres añadido a un nombre de
archivo para definir su tipo o clarificar su
significado.
En el sistema operativo MS-DOS, por ejemplo, un
archivo puede tener un nombre de hasta ocho
caracteres de longitud seguidos de un punto (.) y
una extensión de hasta tres caracteres (letras o
números).
La extensión puede ser asignada por el usuario, por
ejemplo MISDATOS.HOY, o bien puede venir
impuesta por el programa, implicando una forma
determinada de manejo; así las extensiones BAS
pertenecen al lenguaje BASIC y las COM y EXE a
programas ejecutables que se pueden cargar y
ejecutar en MS-DOS.
Se puede utilizar la extensión de los archivos para
seleccionar un conjunto de ellos y realizar diversas
operaciones.
Por otra parte es la que indica al sistema que hacer
para ejecutar un tipo de archivo, por ejemplo:
*.bmp" es una imagen de mapa de bits, y se abre
con visores de imágenes; *.zip" es un contenedor
comprimido y se abre con descompresores… etc.,
así cada archivo tiene un tipo específico.
Información de Wikipedia
http://es.wikipedia.org/wiki/Extensi
%C3%B3n_de_archivo
5. ¿Qué es un archivo de texto?
Un archivo de texto llano, texto simple, texto plano,
texto sencillo o texto pelado (en inglés plain text) es
un archivo informático compuesto únicamente por
texto sin formato, sólo caracteres, lo que lo hace
también legible por humanos. Estos caracteres se
pueden codificar de distintos modos dependiendo de
la lengua usada. Algunos de los sistemas de
codificación más usados son: ASCII, ISO-8859-1 o
Latín-1 y UTF-8.
Carecen de información destinada a generar
formatos (negritas, subrayado, cursivas, tamaño,
etc.) y tipos de letra (por ejemplo, Arial, Times,
Courier, etc.). El término texto llano proviene de
una traducción literal del término inglés plain text,
término que en lengua castellana significa texto
simple o texto sencillo.
Las aplicaciones destinadas a la escritura y
modificación de archivos de texto se llaman editores
de texto.
Dentro de los documentos de texto hemos de
diferenciar entre el texto plano y el enriquecido. Es
decir, entre los formatos que sencillamente guardan
las letras (txt, log...) y los que podemos asignarles
un tamaño, fuente, color, etc.
DIC Block de notas / WordPad
DOC Microsoft Word
DIZ Block de notas / WordPad
DOCHTML HTML de Microsoft Word
EXC Block de notas / WordPad
IDX Block de notas / WordPad
6. LOG Block de notas / WordPad
PDF Adobe Acrobat
RTF Microsoft Word
SCP Block de notas / WordPad
TXT Block de notas / WordPad
WRI Write
WTX Block de notas / WordPad
GLOSARIO DE EXTENSIONES DE TEXTO
.TXT: archivo de texto plano, sin gráficos. Se abre
con cualquier editor de texto, incluido el Bloc de
Notas, de Windows.
.NFO: archivo de texto plano que suele incluirse
como descripción del contenido de un archivo
compactado .zip. Se ve con cualquier editor de
texto.
.HTML / .HTM: archivo de hipertexto, utilizado
para la publicación de contenidos en la Web. Es un
standard utilizado por los principales navegadores
de Internet. Sirve para abrir estos archivos:
Internet Explorer y Navigator.
.DIC: diccionario para procesadores de texto. Se
compone de texto plano y se abre como tal con
cualquier procesador de texto.
.DOC: archivo de texto con estilo. Se genera y se
abre con los principales procesadores de texto para
Windows: Microsoft Word, WordPerfect, Display
Write, WordStar.
7. Información de Monografías
http://www.monografias.com/trabajos17/extension
es/extensiones.shtml
¿Qué es un archivo de imagen?
Un archivo de imagen rasterizada, también
llamada mapa de bits, imagen matricial o bitmap, es
una estructura o fichero de datos que representa
una rejilla rectangular de píxeles o puntos de color,
denominada raster, que se puede visualizar en
un monitor de ordenador, papel u otro dispositivo
de representación.
A las imágenes rasterizadas se las suele caracterizar
por su altura y anchura (en pixeles) y por
su profundidad de color (en bits por pixel), que
determina el número de colores distintos que se
pueden almacenar en cada pixel, y por lo tanto, en
gran medida, la calidad del color de la imagen.
Los gráficos rasterizados se distinguen de
los gráficos vectoriales en que estos últimos
representan una imagen a través del uso de
objetos geométricos como curvas de Bézier y
polígonos, no del simple almacenamiento del color
de cada pixel. El formato de imagen matricial está
ampliamente extendido y es el que se suele emplear
para tomar fotografías digitales y realizar capturas
de vídeo. Para su obtención se usan dispositivos
de conversión analógica-digital, tales
como escáneres y cámaras digitales.
Formatos de archivo de gráficos más usados:
.bmp: Comúnmente usado por los programas de
Microsoft Windows y por el sistema operativo
propiamente dicho. Se le puede aplicar compresión
8. sin pérdidas, aunque no todos los programas son
compatibles.
.gif: GIF es utilizado popularmente en la web.
Formato de 8 bits (256 colores máximo), con
soporte de animación por frames. Utiliza la
compresión LZW.
.jpeg-.jpg: El formato JPEG es usado ampliamente
para fotografías e imágenes de gran tamaño y
variedad de color en la web y por las cámaras
digitales. Es un formato comprimido con pérdida de
calidad, aunque esta se puede ajustar.
.png: PNG es gráfico libre con compresión sin
pérdida que ofrece profundidades desde 8 bits con
paleta optimizada, 24, 48 bits: 281 trillones de
colores y en escala de grises se puede obtener
archivos desde 8 y 16 bits igual a 65.536 tonos de
grises. También se puede salvar un canal mas con
alpha channel para video e interlaced. Fue diseñado
para reemplazar al GIF en la web.
.xcf: Formato nativo para el programa The GIMP,
con múltiples características extra, como la
composición por capas. Usado, sobre todo, en The
GIMP, pero también leíble por ImageMagick.
.dwg: Archivo en formato binario usado por
AutoCAD de AutoDesk. Puede contener objetos
tanto en 2D como en 3D con compresión y
comprobación de errores CRC para datos internos.
.eps: Es un archivo PostScript que almacena
pequeños gráficos vectoriales, a diferencia de los
que almacenan una o varias páginas enteras.
.pdf: En esencia no es un formato gráfico
propiamente dicho, sino un formato de
almacenamiento de documentos, que permite
9. almacenar texto con formato, imágenes de
diferentes tipos, etc. Es una versión simplificada de
PostScript; permite contener múltiples páginas y
enlaces.
.ps: Lenguaje genérico de descripción de páginas
basado en vectores, creado y patentado por Adobe.
PostScript es un potente lenguaje de programación
basado en pila. Compatible con la mayoría de
impresoras láser.
.svg-.svgz: Formato vectorial basado en XML,
definido por el W3C para su uso en navegadores
web.
.swf: Formato creado por Macromedia, es ejecutado
por el plugin Flash, el cual permite mostrar
animaciones vectoriales contenidas en ficheros SWF.
Diversas aplicaciones pueden crear ficheros SWF,
incluidos el programa Macromedia Flash. Aunque
básicamente es un formato vectorial, admite
también bitmaps.
.wmf: Almacena gráficos vectoriales y rasterizados
como secuencia de comandos para ser usados con
el sistema operativo Microsoft Windows y
normalmente sirve para formatos de mapas y
graficaciones a escala.
Información de
https://sites.google.com/site/eoitic/family-
blog/tiposdearchivosdeimagenes
¿Qué es un archivo de video?
Son archivos de videos digitales que se pueden
guardar en archivos de distintos formatos. Cada uno
corresponde con una extensión específica del
archivo que lo contiene. Existen muchos tipos de
10. formatos de video. Aquí se citan algunos de los más
utilizados. Asimismo cada tipo de archivo admite en
cada momento un códec de compresión distinto.
AVI (Audio Video Interleaved = Audio y Video
Intercalado)
• Es el formato estándar para almacenar video
digital.
• Cuando se captura video desde una cámara
digital al ordenador, se suele almacenar en este
formato con el códec DV (Digital Video).
• El archivo AVI puede contener video con una
calidad excelente. Sin embargo el peso del
archivo resulta siempre muy elevado.
• Admite distintos códecs de compresión como
CinePak, Intel Indeo 5, DV, etc. Los códecs con
más capacidad de compresión y una calidad
aceptable son DivX y XviD.
• El formato AVI puede ser visualizado con la
mayoría de reproductores: Windows Media,
QuickTime, etc. siempre y cuando se
encuentren instalados en el equipo los
adecuados códecs para cada tipo de
reproductor.
• Es ideal para guardar videos originales que han
sido capturados de la cámara digital
(codificados con DV).
• No es recomendable publicarlos en Internet en
este formato por su enorme peso.
• Los códecs CinePak, Intel Indeo, DV, etc. no
ofrecen una gran compresión. Los códecs DivX
y XviD por el contrario consiguen una óptima
compresión aunque se suelen destinar sobre
11. todo a la codificación de películas de larga
duración.
MPEG (Moving Pictures Expert Group = Grupo de
Expertos de Películas)
• Es un formato estándar para la compresión de
video digital.
• Son archivos de extensión *.MPG ó *.MPEG.
• Admite distintos tipos de códecs de
compresión: MPEG-1 (calidad CD), MPEG-2
(calidad DVD), MPEG-3 (orientado al audio
MP3) y MPEG-4 (más orientado a la web).
• Se reproducen con Windows Media Player y
QuickTime.
MOV (Apple/Quicktime)
• Es el formato de video y audio desarrollado por
Apple.
• Utiliza un códec propio que evoluciona en
versiones con bastante rapidez.
• Este tipo de archivos también pueden tener
extensión *.QT
• Se recomienda utilizar el reproductor de
QuickTime. Existe una versión gratuita del
mismo que se puede descargar de Internet.
• Es ideal para publicar videos en Internet por su
razonable calidad/peso.
• Admite streaming.
WMV (Microsoft)
Ha sido desarrollado recientemente por Microsoft.
• Utiliza el códec MPEG-4 para la compresión de
video.
12. • También puede tener extensión *.ASF
• Sólo se puede visualizar con una versión
actualizada de Windows Media 7 o superior.
Esta aplicación viene integrada dentro de
Windows.
• Es ideal para publicar videos en Internet por
razonable calidad/peso.
• Admite streaming.
RM
• Es la propuesta de Real Networks para archivos
de video.
• Utiliza un códec propio para comprimir el audio.
• Este tipo de archivos tiene extensión *.RM y
*.RAM.
• Se visualiza con un reproductor específico: Real
Player. Existe una versión gratuita del mismo
que se puede descargar de Internet.
• Se puede utilizar para publicar videos en
Internet por su aceptable calidad/peso.
• Admite streaming.
FLV (Adobe)
• Es un formato que utiliza el reproductor Adobe
Flash para visualizar vídeo en Internet.
• Utiliza el códec Sorenson Spark y el códec On2
VP6. Ambos permiten una alta calidad visual
con bitrates reducidos.
• Son archivos de extensión *.FLV.
• Se pueden reproducir desde distintos
reproductores locales: MPlayer, VLC media
player, Riva, Xine, etc.
13. • Opción recomendada para la web por su
accesibilidad. Al visualizarse a través del
reproductor de Flash es accesible desde la
mayoría de los sistemas operativos y
navegadores web.
• Los repositorios de vídeo más conocidos en
Internet utilizan este formato para la difusión
de vídeos: YouTube, Google Video, iFilm, etc.
• Permite configurar distintos parámetros del
vídeo para conseguir una aceptable
calidad/peso.
• Admite streaming.
Información de
http://www.ite.educacion.es/formacion/materiales/
107/cd/video/video0102.html
¿Qué es un archivo de audio?
Un archivo de sonido es un contenedor multimedia
que guarda una grabación de audio (música,
discurso, etc.). Lo que hace a un archivo distinto del
otro son sus propiedades, cómo se almacenan los
datos, sus capacidades de reproducción, y cómo
puede utilizarse el archivo en un sistema de
administración de archivos (etiquetado).
Ejemplos:
* ACC
* AC3
* AMR
* AU
* FLAC
* M4A
* MMF
14. * MP2
* MP3
* OGG
* WMA
Los audios digitales se pueden guardar en distintos
formatos. Cada uno corresponde con una extensión
específica del archivo que lo contiene. Existen
muchos tipos de formatos de audio y no todos se
pueden escuchar utilizando un mismo reproductor:
Windows Media Player, QuickTime, WinAmp, Real
Player, etc. Aquí trataremos los formatos más
utilizados y universales: WAV, MP3 y OGG.
Formato WAV
• El formato WAV (WaveForm Audio File) es un
archivo que desarrolló originalmente Microsoft
para guardar audio. Los archivos tienen
extensión *.wav
• Es ideal para guardar audios originales a partir
de los cuales se puede comprimir y guardar en
distintos tamaños de muestreo para publicar en
la web.
• Es un formato de excelente calidad de audio.
• Sin embargo produce archivos de un peso
enorme. Una canción extraída de un CD (16
bytes, 44100 Hz y estéreo) puede ocupar entre
20 y 30 Mb.
• Compresión: Los archivos WAV se pueden
guardar con distintos tipos de compresión. Las
más utilizadas son la compresión PCM y la
compresión ADPCM. No obstante incluso
definiendo un sistema de compresión, con un
audio de cierta duración se genera un archivo
excesivamente pesado.
15. • El formato WAV se suele utilizar para
fragmentos muy cortos (no superiores a 3-4
segundos), normalmente en calidad mono y con
una compresión Microsoft ADPCM 4 bits.
Formato MP3
• El formato MP3 (MPEG 1 Layer 3) fue creado
por el Instituto Fraunhofer y por su
extraordinario grado de compresión y alta
calidad está prácticamente monopolizando el
mundo del audio digital.
• Es ideal para publicar audios en la web. Se
puede escuchar desde la mayoría de
reproductores.
• La transformación de WAV a MP3 o la
publicación directa de una grabación en formato
MP3 es un proceso fácil y al alcance de los
principales editores de audio.
• Tiene un enorme nivel de compresión respecto
al WAV. En igualdad del resto de condiciones
reduciría el tamaño del archivo de un
fragmento musical con un factor entre 1/10 y
1/12.
• Presentan una mínima pérdida de calidad.
Formato OGG
• El formato OGG ha sido desarrollado por la
Fundación Xiph.org.
• Es el formato más reciente y surgió como
alternativa libre y de código abierto (a
diferencia del formato MP3).
• Muestra un grado de compresión similar al MP3
pero según los expertos en música la calidad de
reproducción es ligeramente superior.
16. • No todos los reproductores multimedia son
capaces de leer por defecto este formato. En
algunos casos es necesario instalar los códecs o
filtros oportunos.
• El formato OGG puede contener audio y vídeo.
Mención especial merece el formato MIDI. No es un
formato de audio propiamente dicho por lo que se
comentan aparte sus características.
Formato MIDI
• El formato MIDI (Musical Instrument Digital
Interface = Interface Digital para Instrumentos
Digitales) en realidad no resulta de un proceso
de digitalización de un sonido analógico. Un
archivo de extensión *.mid almacena
secuencias de dispositivos MIDI (sintetizadores)
donde se recoge qué instrumento interviene, en
qué forma lo hace y cuándo.
• Este formato es interpretado por los principales
reproductores del mercado: Windows Media
Player, QuickTime, etc.
• Los archivos MIDI se pueden editar y manipular
mediante programas especiales y distintos de
los empleados para editar formatos WAV, MP3,
etc. El manejo de estos programas suele
conllevar ciertos conocimientos musicales.
• Los archivos MIDI permiten audios de cierta
duración con un reducido peso. Esto es debido
a que no guardan el sonido sino la información
o partitura necesaria para que el ordenador la
componga y reproduzca a través de la tarjeta
de sonido.
• Se suelen utilizar en sonidos de fondo de
páginas HTML o para escuchar composiciones
musicales de carácter instrumental.
17. • El formato MIDI no permite la riqueza de
matices sonoros que otros formatos ni la
grabación a partir de eventos sonoros
analógicos.
Información de
http://www.ite.educacion.es/formacion/materiales/
107/cd/audio/audio0102.html
¿Qué es un archivo de compresión?
En ciencias de la computación la compresión de
datos es la reducción del volumen de datos
tratables para representar una determinada
información empleando una menor cantidad de
espacio. Al acto de compresión de datos se
denomina compresión, y al contrario
descompresión.
El espacio que ocupa una información codificada
(datos, señal digital, etc.) sin compresión es el
cociente entre la frecuencia de muestreo y la
resolución. Por tanto, cuantos más bits se empleen
mayor será el tamaño del archivo. No obstante, la
resolución viene impuesta por el sistema digital con
que se trabaja y no se puede alterar el número de
bits a voluntad; por ello, se utiliza la compresión,
para transmitir la misma cantidad de información
que ocuparía una gran resolución en un número
inferior de bits.
La compresión es un caso particular de la
codificación, cuya característica principal es que el
código resultante tiene menor tamaño que el
original.
18. La compresión de datos se basa fundamentalmente
en buscar repeticiones en series de datos para
después almacenar solo el dato junto al número de
veces que se repite. Así, por ejemplo, si en un
fichero aparece una secuencia como "AAAAAA",
ocupando 6 bytes se podría almacenar simplemente
"6A" que ocupa solo 2 bytes, en algoritmo RLE.
En realidad, el proceso es mucho más complejo, ya
que raramente se consigue encontrar patrones de
repetición tan exactos (salvo en algunas imágenes).
Se utilizan algoritmos de compresión:
• Por un lado, algunos buscan series largas que
luego codifican en formas más breves.
• Por otro lado, algunos algoritmos, como el
algoritmo de Huffman, examinan los caracteres
más repetidos para luego codificar de forma
más corta los que más se repiten.
• Otros, como el LZW, construyen un diccionario
con los patrones encontrados, a los cuales se
hace referencia de manera posterior.
• La codificación de los bytes pares es otro
sencillo algoritmo de compresión muy fácil de
entender.
A la hora de hablar de compresión hay que tener
presentes dos conceptos:
1.Redundancia: Datos que son repetitivos o
previsibles
2. Entropía: La información nueva o esencial que
se define como la diferencia entre la cantidad
total de datos de un mensaje y su redundancia.
La información que transmiten los datos puede ser
de tres tipos:
19. 1.Redundante: información repetitiva o
predecible.
2.Irrelevante: información que no podemos
apreciar y cuya eliminación por tanto no afecta
al contenido del mensaje. Por ejemplo, si las
frecuencias que es capaz de captar el oído
humano están entre 16/20 Hz y 16.000/20.000
Hz, serían irrelevantes aquellas frecuencias que
estuvieran por debajo o por encima de estos
valores.
3.Básica: la relevante. La que no es ni
redundante ni irrelevante. La que debe ser
transmitida para que se pueda reconstruir la
señal.
Teniendo en cuenta estos tres tipos de información,
se establecen tres tipologías de compresión de la
información:
1.Sin pérdidas reales: es decir, transmitiendo
toda la entropía del mensaje (toda la
información básica e irrelevante, pero
eliminando la redundante).
2.Subjetivamente sin pérdidas: es decir, además
de eliminar la información redundante se
elimina también la irrelevante.
3.Subjetivamente con pérdidas: se elimina cierta
cantidad de información básica, por lo que el
mensaje se reconstruirá con errores
perceptibles pero tolerables (por ejemplo: la
videoconferencia).
Información de
Wikipediahttp://es.wikipedia.org/wiki/Compresi
%C3%B3n_de_datos
¿Qué es un archivo de sistema?
20. Un archivo de sistema es al archivo esencial para
que un sistema operativo pueda trabajar, los
sistemas operativos tienen varios archivos de
sistema pero uno de los mas importantes es el
config.sys, todos los archivos de sistema tienes esa
extensión: .sys
Un archivo de programa es cualquier archivo de
cualquier extensión que use un programa para
poder trabajar al igual que un archivo de
procesamiento aunk los de procesamiento suelen
ser de estas extensiones:
.bin
.dat
.com
.bat
.ini
.dll
¿Cuáles son los principales programas que se
utilizan en preprensa y cuáles son sus
extensiones?
-Corel Draw: CDR, CMX, DES, SVG, WPG
-Adobe Photoshop: PSD, PDD, EPS, RAW,
-Adobe Illustrator: AI, FXG, AIT