SlideShare una empresa de Scribd logo
1 de 22
Teoría de la Información.
 Es la reducción del volumen de datos tratables para
representar una determinada información empleando una
menor cantidad de espacio. Al acto de compresión de datos
se denomina «compresión», y al contrario «descompresión».
 La resolución viene impuesta por el sistema digital con que se
trabaja y no se puede alterar el número de bits a voluntad;
por ello, se utiliza la compresión, para transmitir la misma
cantidad de información que ocuparía una gran resolución en
un número inferior de bits.
 La compresión es un caso particular de la codificación, cuya
característica principal es que el código resultante tiene
menor tamaño que el original.
 Factor de compresión fc
 Ca Capacidad del archivo antes, Cd Capacidad del archivo después
 fc= Ca/Cd
 Porcentaje de compresión pc
 pc= Cd/Ca * 100%
 Redundancia: Datos que son repetitivos o previsibles.
 Entropía: La información nueva o esencial que se define como la
diferencia entre la cantidad total de datos de un mensaje y su
redundancia.
 La información que transmiten los datos puede ser de tres tipos:
 Redundante: información repetitiva o predecible.
 Irrelevante: información que no podemos apreciar y cuya
eliminación por tanto no afecta al contenido del mensaje. Por
ejemplo, si las frecuencias que es capaz de captar el oído
humano están entre 16/20 Hz y 16 000/20 000 Hz, serían
irrelevantes aquellas frecuencias que estuvieran por debajo o por
encima de estos valores.
 Básica: la relevante. La que no es ni redundante ni irrelevante. La
que debe ser transmitida para que se pueda reconstruir la señal.
 Sin pérdidas reales: es decir, transmitiendo toda
la entropía del mensaje (toda la información
básica e irrelevante, pero eliminando la
redundante).
 Subjetivamente sin pérdidas: es decir, además de
eliminar la información redundante se elimina
también la irrelevante.
 Subjetivamente con pérdidas: se elimina cierta
cantidad de información básica, por lo que el
mensaje se reconstruirá con errores perceptibles
pero tolerables (por ejemplo:
la videoconferencia).
 El objetivo de la compresión es siempre reducir el tamaño
de la información, intentando que esta reducción de
tamaño no afecte al contenido. No obstante, la reducción
de datos puede afectar o no a la calidad de la información:
 Compresión sin pérdida: los datos antes y después de
comprimirlos son exactos en la compresión sin pérdida. En
el caso de la compresión sin pérdida una mayor
compresión solo implica más tiempo de proceso. La tasa
de bits siempre es variable en la compresión sin pérdida.
Se utiliza principalmente en la compresión de texto.
 Un algoritmo de compresión con pérdida puede eliminar
datos para disminuir aún más el tamaño, con lo que
reduce la calidad. En la compresión con pérdida, la tasa de
bits puede ser constante o variable. Una vez realizada la
compresión, no se puede obtener la señal original, aunque
sí una aproximación cuya semejanza con la original
dependerá del tipo de compresión. Este tipo de
compresión se da principalmente en imágenes, vídeos y
sonidos.
 La compresión sin pérdidas engloba a aquellas
técnicas que garanticen generar un duplicado
exacto del flujo de datos de entrada después de
un ciclo de compresión / expansión. Por esta
razón es utilizada para comprimir archivos que
contienen datos que no pueden ser degradados o
perdidos, como pueden ser documentos de
texto, imágenes y sonido.
 Es generalmente implementada usando uno o
dos tipos de modelos diferentes: el estático y
aquel basado en diccionario.
 RLE (Run-length encoding)
 LZW (Lempel-Ziv-Welch: desarrollado por Terry
Welch en 1984 como una versión mejorada
del algoritmo LZ78 desarrollado por Abraham Lempel y Jacob
Ziv). En este algoritmo se basan RAR y ZIP.
 Algoritmo de Huffman (desarrollado por David A.
Huffman)
 Se refiere a cualquier procedimiento de
codificación que tenga como objetivo
representar cierta cantidad de información
utilizando una menor cantidad de la misma,
siendo imposible una reconstrucción exacta
de los datos originales. Esto es porque, en
lugar de guardar una copia exacta, solo se
guarda una aproximación. Esta aproximación
se aprovecha de las limitaciones de la
percepción humana para esconder la
distorsión introducida.
 Compresión de imagen con pérdida
 Un método consiste en reducir el espacio de color de la
imagen a los colores más comunes dentro de la misma
imagen. Esto se utiliza a menudo en imágenes con
formato GIF y, a veces en imágenes PNG para dar lugar a
archivos más pequeños. Cuando se utiliza en el tipo correcto
de imágenes y es combinado con tramado, puede dar lugar a
imágenes casi idénticas a los originales.
 Compresión fractal
 JPEG
 Compresión Wavelet
 Compresión de vídeo con pérdida
 Flash (también admite sprites JPEG)
 H.261
 H.263
 H.264/MPEG-4 AVC
 MNG (admite sprites JPEG)
 Motion JPEG
 MPEG-1
 MPEG-2
 MPEG-4
 OGG
 Theora
 códec para video Sorenson
 VC-1
 MP4
 Compresión de audio con pérdida
 AAC
 ADPCM
 ATRAC
 Dolby AC-3
 DTS
 MP2
 MP3
 Musepack
 OGG
 Vorbis
 WMA
 Secuencias de datos con el mismo valor consecutivas son
almacenadas como un único valor más su recuento. Esto
es más útil en datos que contienen muchas de estas
"secuencias"; por ejemplo, gráficos sencillos con áreas de
color plano, como iconos y logotipos.
 Por ejemplo, considera una pantalla que contiene texto en
negro sobre un fondo blanco. Habría muchas secuencias
de este tipo con píxeles blancos en los márgenes vacíos,
y otras secuencias de píxeles negros en la zona del texto.
Supongamos una única línea (o scanline), con N
representando las zonas en negro y B las de blanco:
 BBBBBBBBBBBBNBBBBBBBBBBBBNNNBBBBBBBBBBBBBBBBBBBB
BBBBNBBBBBBBBBBBBBB
 12B1N12B3N24B1N14B
PCX (de PiCture eXchange) Fue el formato nativo del programa
Paintbrush, uno de los primeros programas de gráficos populares
que funcionaban bajo DOS
 La mayoría de los métodos de compresión se basan en un
análisis inicial del texto para identificar cadenas repetidas para
armar un diccionario de equivalencias, asignando códigos breves
a estas cadenas. En una segunda etapa, se convierte el texto
utilizando los códigos equivalentes para las cadenas repetidas.
Esto requiere dos etapas, una de análisis y una segunda de
conversión y también requiere que el diccionario se encuentre
junto con el texto codificado, incrementando el tamaño del
archivo de salida.
 La clave del método LZW reside en que es posible crear sobre la
marcha, de manera automática y en una única pasada un
diccionario de cadenas que se encuentren dentro del texto a
comprimir mientras al mismo tiempo se procede a su
codificación. Dicho diccionario no es transmitido con el texto
comprimido, puesto que el descompresor puede reconstruirlo
usando la misma lógica con que lo hace el compresor y, si está
codificado correctamente, tendrá exactamente las mismas
cadenas que el diccionario del compresor tenía.
 Dado que el algoritmo sirve para comprimir cualquier
secuencia de bits, independientemente de si es texto o
cualquier otro tipo de información. En él se supone que los
textos a comprimir se componen solamente de letras
mayúsculas sin espacios, para lo cual bastan 26 códigos,
del 1 al 26, para las mayúsculas más un código (en este
caso se ha adoptado el cero, aunque en la práctica el 0 es
un carácter válido) para representar el fin de archivo, que
se ha representado gráficamente por el símbolo #.
 El texto a comprimir es: TOBEORNOTTOBEORTOBEORNOT#
El proceso de compresión queda representado por la tabla
siguiente. Para interpretarla, se sugiere ignorar la
representación binaria, que se incluye simplemente para
contabilizar el tamaño del archivo de salida. Los códigos
del 1 al 26 se corresponden con caracteres simples 1 = A,
2 = B, ... 26 = Z y 27 = "fin de archivo". Del 28 en
adelante cada código representa más de un carácter.
Explicación detallada en el video del siguiente link:
https://www.youtube.com/watch?v=8Hxo1bPPgCU
 La codificación Huffman utiliza una tabla de
códigos de longitud variable para codificar un
determinado símbolo (como puede ser un
carácter en un archivo), donde la tabla ha sido
rellenada de una manera específica basándose en
la probabilidad estimada de aparición de cada
posible valor de dicho símbolo. Fue desarrollado
por David A. Huffman mientras era estudiante de
doctorado en el MIT, y publicado en "A Method
for the Construction of Minimum-Redundancy
Codes".
 Árbol de Huffman generado para las
frecuencias de apariciones exactas del texto
"ESTO ES UN EJEMPLO DE UN ARBOL DE
HUFFMAN". Las frecuencias y códigos de cada
carácter se muestran abajo. Codificar esta
frase de 41 caracteres usando este código
requiere 156 bits (sin contar con el espacio
para el árbol) cuando con bytes de 8 bits
requiere 328 bits.
ESTO ES UN EJEMPLO DE UN ARBOL DE HUFFMAN
 Video del algoritmo de Huffman
 https://www.youtube.com/watch?v=8Gf8wutvS1w

Más contenido relacionado

La actualidad más candente

Multi core-architecture
Multi core-architectureMulti core-architecture
Multi core-architecturePiyush Mittal
 
Hands on machine learning with scikit-learn and tensor flow by ahmed yousry
Hands on machine learning with scikit-learn and tensor flow by ahmed yousryHands on machine learning with scikit-learn and tensor flow by ahmed yousry
Hands on machine learning with scikit-learn and tensor flow by ahmed yousryAhmed Yousry
 
Multiprocessor Architecture (Advanced computer architecture)
Multiprocessor Architecture  (Advanced computer architecture)Multiprocessor Architecture  (Advanced computer architecture)
Multiprocessor Architecture (Advanced computer architecture)vani261
 
Arquitectura del computador
Arquitectura del computadorArquitectura del computador
Arquitectura del computadorKarlys Velasquez
 

La actualidad más candente (9)

La tarjeta madre
La tarjeta madreLa tarjeta madre
La tarjeta madre
 
Multi core-architecture
Multi core-architectureMulti core-architecture
Multi core-architecture
 
Naive Bayes
Naive Bayes Naive Bayes
Naive Bayes
 
Hands on machine learning with scikit-learn and tensor flow by ahmed yousry
Hands on machine learning with scikit-learn and tensor flow by ahmed yousryHands on machine learning with scikit-learn and tensor flow by ahmed yousry
Hands on machine learning with scikit-learn and tensor flow by ahmed yousry
 
Exposicion alberto acosta
Exposicion alberto acostaExposicion alberto acosta
Exposicion alberto acosta
 
Multiprocessor Architecture (Advanced computer architecture)
Multiprocessor Architecture  (Advanced computer architecture)Multiprocessor Architecture  (Advanced computer architecture)
Multiprocessor Architecture (Advanced computer architecture)
 
Bios
BiosBios
Bios
 
Presentación board
Presentación boardPresentación board
Presentación board
 
Arquitectura del computador
Arquitectura del computadorArquitectura del computador
Arquitectura del computador
 

Similar a COMPRESION DE DATOS.pptx

Similar a COMPRESION DE DATOS.pptx (20)

Compresion graficos
Compresion graficosCompresion graficos
Compresion graficos
 
UNIDAD I
UNIDAD IUNIDAD I
UNIDAD I
 
Pdi05
Pdi05Pdi05
Pdi05
 
Parte 3
Parte 3Parte 3
Parte 3
 
Representacion de la información en las computadoras
Representacion de la información en las computadorasRepresentacion de la información en las computadoras
Representacion de la información en las computadoras
 
Compresion de Datos - Telecomunicaciones III
Compresion de Datos - Telecomunicaciones IIICompresion de Datos - Telecomunicaciones III
Compresion de Datos - Telecomunicaciones III
 
Formato de-archivo-png-angela-bohorquez-1002 (1)
Formato de-archivo-png-angela-bohorquez-1002 (1)Formato de-archivo-png-angela-bohorquez-1002 (1)
Formato de-archivo-png-angela-bohorquez-1002 (1)
 
Compresión
CompresiónCompresión
Compresión
 
Hpcs conf poster
Hpcs conf posterHpcs conf poster
Hpcs conf poster
 
Compresion de archivos
Compresion de archivosCompresion de archivos
Compresion de archivos
 
Codificacion HUFFMAN en matlab
Codificacion HUFFMAN en matlabCodificacion HUFFMAN en matlab
Codificacion HUFFMAN en matlab
 
Curso básico de ensamblador
Curso básico de ensambladorCurso básico de ensamblador
Curso básico de ensamblador
 
Curso basico de emsamblador
Curso basico de emsambladorCurso basico de emsamblador
Curso basico de emsamblador
 
Curso básico de ensamblador
Curso básico de ensambladorCurso básico de ensamblador
Curso básico de ensamblador
 
Curso básico de Ensamblador
Curso básico de EnsambladorCurso básico de Ensamblador
Curso básico de Ensamblador
 
Archivos de compresion_de_imagenes
Archivos de compresion_de_imagenesArchivos de compresion_de_imagenes
Archivos de compresion_de_imagenes
 
Jpeg presentacion
Jpeg presentacionJpeg presentacion
Jpeg presentacion
 
Trabajo informatica
Trabajo informaticaTrabajo informatica
Trabajo informatica
 
Como digitalizar imágenes y fotografías
Como digitalizar imágenes y fotografíasComo digitalizar imágenes y fotografías
Como digitalizar imágenes y fotografías
 
Sistemas de Telecomunicaciones cap 2
Sistemas de Telecomunicaciones cap 2Sistemas de Telecomunicaciones cap 2
Sistemas de Telecomunicaciones cap 2
 

Más de Manuel Mazariegos

Más de Manuel Mazariegos (11)

Osciladores.pdf
Osciladores.pdfOsciladores.pdf
Osciladores.pdf
 
Mezcladores.pdf
Mezcladores.pdfMezcladores.pdf
Mezcladores.pdf
 
PLLs.pdf
PLLs.pdfPLLs.pdf
PLLs.pdf
 
Presentacion 1 Sistemas-de-Microondas.pptx
Presentacion 1 Sistemas-de-Microondas.pptxPresentacion 1 Sistemas-de-Microondas.pptx
Presentacion 1 Sistemas-de-Microondas.pptx
 
Presentacion Sistemas-de-Microondas.pptx
Presentacion Sistemas-de-Microondas.pptxPresentacion Sistemas-de-Microondas.pptx
Presentacion Sistemas-de-Microondas.pptx
 
propagacion-07.pdf
propagacion-07.pdfpropagacion-07.pdf
propagacion-07.pdf
 
radioenlaces-07.pdf
radioenlaces-07.pdfradioenlaces-07.pdf
radioenlaces-07.pdf
 
Curso radio NEC Ipasolink 200.pdf
Curso radio NEC Ipasolink 200.pdfCurso radio NEC Ipasolink 200.pdf
Curso radio NEC Ipasolink 200.pdf
 
GSM_Fundamentals_Huawei.pdf
GSM_Fundamentals_Huawei.pdfGSM_Fundamentals_Huawei.pdf
GSM_Fundamentals_Huawei.pdf
 
Presentacion electronica analogica
Presentacion  electronica analogicaPresentacion  electronica analogica
Presentacion electronica analogica
 
Redes móviles
Redes móvilesRedes móviles
Redes móviles
 

Último

Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMarceloQuisbert6
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfyoseka196
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdfEdwinAlexanderSnchez2
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdfFlorenciopeaortiz
 
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfPresentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfMIGUELANGELCONDORIMA4
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.ALEJANDROLEONGALICIA
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfKEVINYOICIAQUINOSORI
 
TALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación públicaTALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación públicaSantiagoSanchez353883
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaXimenaFallaLecca1
 
Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfedsonzav8
 
Residente de obra y sus funciones que realiza .pdf
Residente de obra y sus funciones que realiza  .pdfResidente de obra y sus funciones que realiza  .pdf
Residente de obra y sus funciones que realiza .pdfevin1703e
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7luisanthonycarrascos
 
Seleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSeleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSaulSantiago25
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdfAnthonyTiclia
 
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVEl proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVSebastianPaez47
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Francisco Javier Mora Serrano
 
Tiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IITiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IILauraFernandaValdovi
 
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa  tipos y funcionamientoCaldera Recuperadora de químicos en celulosa  tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa tipos y funcionamientoRobertoAlejandroCast6
 
SSOMA, seguridad y salud ocupacional. SST
SSOMA, seguridad y salud ocupacional. SSTSSOMA, seguridad y salud ocupacional. SST
SSOMA, seguridad y salud ocupacional. SSTGestorManpower
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdfFernandaGarca788912
 

Último (20)

Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principios
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdf
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdf
 
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfPresentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdf
 
TALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación públicaTALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación pública
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
 
Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdf
 
Residente de obra y sus funciones que realiza .pdf
Residente de obra y sus funciones que realiza  .pdfResidente de obra y sus funciones que realiza  .pdf
Residente de obra y sus funciones que realiza .pdf
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7
 
Seleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSeleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusibles
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
 
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVEl proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
 
Tiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IITiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo II
 
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa  tipos y funcionamientoCaldera Recuperadora de químicos en celulosa  tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
 
SSOMA, seguridad y salud ocupacional. SST
SSOMA, seguridad y salud ocupacional. SSTSSOMA, seguridad y salud ocupacional. SST
SSOMA, seguridad y salud ocupacional. SST
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdf
 

COMPRESION DE DATOS.pptx

  • 1. Teoría de la Información.
  • 2.  Es la reducción del volumen de datos tratables para representar una determinada información empleando una menor cantidad de espacio. Al acto de compresión de datos se denomina «compresión», y al contrario «descompresión».  La resolución viene impuesta por el sistema digital con que se trabaja y no se puede alterar el número de bits a voluntad; por ello, se utiliza la compresión, para transmitir la misma cantidad de información que ocuparía una gran resolución en un número inferior de bits.  La compresión es un caso particular de la codificación, cuya característica principal es que el código resultante tiene menor tamaño que el original.
  • 3.  Factor de compresión fc  Ca Capacidad del archivo antes, Cd Capacidad del archivo después  fc= Ca/Cd  Porcentaje de compresión pc  pc= Cd/Ca * 100%
  • 4.  Redundancia: Datos que son repetitivos o previsibles.  Entropía: La información nueva o esencial que se define como la diferencia entre la cantidad total de datos de un mensaje y su redundancia.  La información que transmiten los datos puede ser de tres tipos:  Redundante: información repetitiva o predecible.  Irrelevante: información que no podemos apreciar y cuya eliminación por tanto no afecta al contenido del mensaje. Por ejemplo, si las frecuencias que es capaz de captar el oído humano están entre 16/20 Hz y 16 000/20 000 Hz, serían irrelevantes aquellas frecuencias que estuvieran por debajo o por encima de estos valores.  Básica: la relevante. La que no es ni redundante ni irrelevante. La que debe ser transmitida para que se pueda reconstruir la señal.
  • 5.  Sin pérdidas reales: es decir, transmitiendo toda la entropía del mensaje (toda la información básica e irrelevante, pero eliminando la redundante).  Subjetivamente sin pérdidas: es decir, además de eliminar la información redundante se elimina también la irrelevante.  Subjetivamente con pérdidas: se elimina cierta cantidad de información básica, por lo que el mensaje se reconstruirá con errores perceptibles pero tolerables (por ejemplo: la videoconferencia).
  • 6.  El objetivo de la compresión es siempre reducir el tamaño de la información, intentando que esta reducción de tamaño no afecte al contenido. No obstante, la reducción de datos puede afectar o no a la calidad de la información:  Compresión sin pérdida: los datos antes y después de comprimirlos son exactos en la compresión sin pérdida. En el caso de la compresión sin pérdida una mayor compresión solo implica más tiempo de proceso. La tasa de bits siempre es variable en la compresión sin pérdida. Se utiliza principalmente en la compresión de texto.  Un algoritmo de compresión con pérdida puede eliminar datos para disminuir aún más el tamaño, con lo que reduce la calidad. En la compresión con pérdida, la tasa de bits puede ser constante o variable. Una vez realizada la compresión, no se puede obtener la señal original, aunque sí una aproximación cuya semejanza con la original dependerá del tipo de compresión. Este tipo de compresión se da principalmente en imágenes, vídeos y sonidos.
  • 7.  La compresión sin pérdidas engloba a aquellas técnicas que garanticen generar un duplicado exacto del flujo de datos de entrada después de un ciclo de compresión / expansión. Por esta razón es utilizada para comprimir archivos que contienen datos que no pueden ser degradados o perdidos, como pueden ser documentos de texto, imágenes y sonido.  Es generalmente implementada usando uno o dos tipos de modelos diferentes: el estático y aquel basado en diccionario.
  • 8.  RLE (Run-length encoding)  LZW (Lempel-Ziv-Welch: desarrollado por Terry Welch en 1984 como una versión mejorada del algoritmo LZ78 desarrollado por Abraham Lempel y Jacob Ziv). En este algoritmo se basan RAR y ZIP.  Algoritmo de Huffman (desarrollado por David A. Huffman)
  • 9.  Se refiere a cualquier procedimiento de codificación que tenga como objetivo representar cierta cantidad de información utilizando una menor cantidad de la misma, siendo imposible una reconstrucción exacta de los datos originales. Esto es porque, en lugar de guardar una copia exacta, solo se guarda una aproximación. Esta aproximación se aprovecha de las limitaciones de la percepción humana para esconder la distorsión introducida.
  • 10.  Compresión de imagen con pérdida  Un método consiste en reducir el espacio de color de la imagen a los colores más comunes dentro de la misma imagen. Esto se utiliza a menudo en imágenes con formato GIF y, a veces en imágenes PNG para dar lugar a archivos más pequeños. Cuando se utiliza en el tipo correcto de imágenes y es combinado con tramado, puede dar lugar a imágenes casi idénticas a los originales.  Compresión fractal  JPEG  Compresión Wavelet
  • 11.  Compresión de vídeo con pérdida  Flash (también admite sprites JPEG)  H.261  H.263  H.264/MPEG-4 AVC  MNG (admite sprites JPEG)  Motion JPEG  MPEG-1  MPEG-2  MPEG-4  OGG  Theora  códec para video Sorenson  VC-1  MP4
  • 12.  Compresión de audio con pérdida  AAC  ADPCM  ATRAC  Dolby AC-3  DTS  MP2  MP3  Musepack  OGG  Vorbis  WMA
  • 13.  Secuencias de datos con el mismo valor consecutivas son almacenadas como un único valor más su recuento. Esto es más útil en datos que contienen muchas de estas "secuencias"; por ejemplo, gráficos sencillos con áreas de color plano, como iconos y logotipos.  Por ejemplo, considera una pantalla que contiene texto en negro sobre un fondo blanco. Habría muchas secuencias de este tipo con píxeles blancos en los márgenes vacíos, y otras secuencias de píxeles negros en la zona del texto. Supongamos una única línea (o scanline), con N representando las zonas en negro y B las de blanco:  BBBBBBBBBBBBNBBBBBBBBBBBBNNNBBBBBBBBBBBBBBBBBBBB BBBBNBBBBBBBBBBBBBB  12B1N12B3N24B1N14B
  • 14. PCX (de PiCture eXchange) Fue el formato nativo del programa Paintbrush, uno de los primeros programas de gráficos populares que funcionaban bajo DOS
  • 15.  La mayoría de los métodos de compresión se basan en un análisis inicial del texto para identificar cadenas repetidas para armar un diccionario de equivalencias, asignando códigos breves a estas cadenas. En una segunda etapa, se convierte el texto utilizando los códigos equivalentes para las cadenas repetidas. Esto requiere dos etapas, una de análisis y una segunda de conversión y también requiere que el diccionario se encuentre junto con el texto codificado, incrementando el tamaño del archivo de salida.  La clave del método LZW reside en que es posible crear sobre la marcha, de manera automática y en una única pasada un diccionario de cadenas que se encuentren dentro del texto a comprimir mientras al mismo tiempo se procede a su codificación. Dicho diccionario no es transmitido con el texto comprimido, puesto que el descompresor puede reconstruirlo usando la misma lógica con que lo hace el compresor y, si está codificado correctamente, tendrá exactamente las mismas cadenas que el diccionario del compresor tenía.
  • 16.  Dado que el algoritmo sirve para comprimir cualquier secuencia de bits, independientemente de si es texto o cualquier otro tipo de información. En él se supone que los textos a comprimir se componen solamente de letras mayúsculas sin espacios, para lo cual bastan 26 códigos, del 1 al 26, para las mayúsculas más un código (en este caso se ha adoptado el cero, aunque en la práctica el 0 es un carácter válido) para representar el fin de archivo, que se ha representado gráficamente por el símbolo #.  El texto a comprimir es: TOBEORNOTTOBEORTOBEORNOT# El proceso de compresión queda representado por la tabla siguiente. Para interpretarla, se sugiere ignorar la representación binaria, que se incluye simplemente para contabilizar el tamaño del archivo de salida. Los códigos del 1 al 26 se corresponden con caracteres simples 1 = A, 2 = B, ... 26 = Z y 27 = "fin de archivo". Del 28 en adelante cada código representa más de un carácter.
  • 17. Explicación detallada en el video del siguiente link: https://www.youtube.com/watch?v=8Hxo1bPPgCU
  • 18.  La codificación Huffman utiliza una tabla de códigos de longitud variable para codificar un determinado símbolo (como puede ser un carácter en un archivo), donde la tabla ha sido rellenada de una manera específica basándose en la probabilidad estimada de aparición de cada posible valor de dicho símbolo. Fue desarrollado por David A. Huffman mientras era estudiante de doctorado en el MIT, y publicado en "A Method for the Construction of Minimum-Redundancy Codes".
  • 19.  Árbol de Huffman generado para las frecuencias de apariciones exactas del texto "ESTO ES UN EJEMPLO DE UN ARBOL DE HUFFMAN". Las frecuencias y códigos de cada carácter se muestran abajo. Codificar esta frase de 41 caracteres usando este código requiere 156 bits (sin contar con el espacio para el árbol) cuando con bytes de 8 bits requiere 328 bits.
  • 20. ESTO ES UN EJEMPLO DE UN ARBOL DE HUFFMAN
  • 21.
  • 22.  Video del algoritmo de Huffman  https://www.youtube.com/watch?v=8Gf8wutvS1w