SlideShare una empresa de Scribd logo
Técnicas de Compresión y
Descompresión de Señales
Marcelo Fernando Valdiviezo C.
Carrera de Electrónica y Telecomunicaciones
Octubre - 2020
UNIDAD 1: COMPRESIÓN DE DATOS
TEMA: PONDERACIÓN DE ÁRBOL DE CONTEXTO.
INTRODUCCIÓN
CADENA BINARIA
CONTEXTO
COMPRESIÓN IDEAL
Si se pudiera utilizar
los bits que se han
introducido hasta el
momento actual para
predecir el valor del
siguiente.
MÉTODO DE PONDERACIÓN DE ÁRBOL
DE CONTEXTO (CTW)
1 1 2
t
tb bb b=
Se inicia con una
cadena de bits
determinada
2 1d dc b b b− − −=
d bits que la
preceden.
Contexto de 1
t
b
Se construye un árbol de
profundidad d basado en el
contexto
NODO
Subcadena
de cd.
Se introduce y se examina el
primer bit b1.
1
El árbol se actualiza
para incluir la
subcadena cbb1.
Se utiliza para calcular la
probabilidad de que b1=1 dado
el contexto cd.
0
El árbol se actualiza
de manera diferente
SECUENCIA
DE
ENTRADA
Se utiliza para
calcular la
probabilidad de que
b1=0 dado el
contexto cd.
CODIFICADOR
ARITMÉTICO
MÉTODO DE PONDERACIÓN DE ÁRBOL
DE CONTEXTO (CTW)
CADENA BINARIA
FUENTE
SIN MEMORIA CON MEMORIA
MÉTODO DE PONDERACIÓN DE ÁRBOL
DE CONTEXTO (CTW)
FUENTE SIN MEMORIA
( )1aP
( )0aP
Probabilidad de un bit de ser un 1
Probabilidad de un bit de ser un 0
( )1aP =
( )0 1aP = −
( ) ( )1
1
t
t
a a i
i
P b P b
=
= 
Probabilidad de una cadena determinada
generada por la fuente
( ) ( )1 1
at b
aP b  = −
MÉTODO DE PONDERACIÓN DE ÁRBOL
DE CONTEXTO (CTW)
EJEMPLO
( ) ( )1 1
at b
aP b  = −
t = 5
a = 2
b =3
( ) ( )
25 3
1 1aP b  = −
( )1 1
1
21|
1
t
e t
b
P b b
a b
+
+
= =
+ +
( )1 11|e t
t b
P bb
a b
+ = =
+
Estimación KT
CTW PARA LA COMPRESIÓN DE TEXTO
Caracteres ASCII
• Cada carácter se compone de
7 bits.
• Se utilizan las 128
combinaciones posibles.
• Existen combinaciones mas
comunes que otras
• Ciertas combinaciones dobles
(on) y triples (ion) son mas
comunes.
tb 1 bit en un determinado carácter ASCII X
1 2 1tbb b −
contexto
Se obtienen mejores resultados:
• En contextos de tamaño 12.
• Usando 7 árboles de contexto, uno por cada bit.
• La estimación KT original se de modificada para estimar la
redundancia cero definida por:
( ) ( ) ( ) ( )
1 1 1
, , 0 0
2 4 4
def
e eP a b P a b a b 
+ = + ==
UNIDAD 1: COMPRESIÓN DE DATOS
TEMA: MÉTODOS DE DICCIONARIO.
INTRODUCCIÓN
Los métodos estadísticos de
compresión usan un modelo
estadístico de los datos.
La calidad de la compresión
depende de la calidad del
modelo
LOS MÉTODOS DE DICCIONARIO, NO EMPLEAN UN MODELO ESTADÍSTICO NI CÓDIGOS DE
TAMAÑO VARIABLE.
SELECCIONAN CADENAS DE SÍMBOLOS Y
CODIFICAN CADA CADENA COMO UNA
MUESTRA UTILIZANDO UN DICCIONARIO.
COMPRESIÓN EN CADENAS
Muestra = Token DICCIONARIO
• Estático
• Dinámico
CADENAS DE SÍMBOLOS
LOS COMPRESORES DE DICCIONARIO
SON CODIFICADORES DE ENTROPÍA
SI EL ARCHIVO DE ENTRA ES MUY
GRANDE
En general, los métodos de compresión basados en cadenas de símbolos pueden ser más eficientes
que los métodos que comprimen símbolos individuales.
COMPRESIÓN DE DICCIONARIO
Se lee el archivo fuente y se prepara una lista de los distintos bytes
encontrados. Para cada byte, se incluye también en la lista el número de
veces que aparece en dicho archivo (su frecuencia).
Se ordena la lista en orden decreciente de las frecuencias. Por lo tanto,
comienza con valores de los bytes más comunes en el archivo, y termina con
los bytes que aparecen raramente. Puesto que la lista consta de bytes
distintos, no puede tener más de 256 elementos.
1
2
COMPRESIÓN DE DICCIONARIO
La lista ordenada se convierte en el diccionario; se escribe en el archivo
comprimido, precedido por su longitud (un entero de 1 byte)
Se lee de nuevo el archivo de origen, byte a byte. se localiza cada byte en el
diccionario y se observa su índice; el índice es un número dentro del
intervalo [0, 255], por lo que requiere entre 1 y 8 bits. En el archivo
comprimido, se escribe el índice, precedido por un código de 3 bits, que
indica la longitud del índice. En consecuencia, el código 000 denota un índice
de 1 bit, el código 001 indica un índice de 2 bits, y así sucesivamente hasta el
código 111, que denota un índice de 8 bits.
3
4
COMPRESIÓN DE DICCIONARIO
PREGUNTAS
Semana 5: CTW y Diccionarios
Semana 5: CTW y Diccionarios

Más contenido relacionado

La actualidad más candente

Consulta de bits
Consulta de bitsConsulta de bits
Consulta de bits
taniamabel
 
Unidad de medida de computacion
Unidad de medida de computacionUnidad de medida de computacion
Unidad de medida de computacion
ramiarnold
 
Los bytes unidad de almacenamiento
Los bytes unidad de almacenamientoLos bytes unidad de almacenamiento
Los bytes unidad de almacenamiento
santi1433
 
Unidades de mediciones de almacenamiento
Unidades de mediciones de almacenamientoUnidades de mediciones de almacenamiento
Unidades de mediciones de almacenamiento
Chaaparra
 
Unidades de almacenamiento en internet
Unidades de almacenamiento en internetUnidades de almacenamiento en internet
Unidades de almacenamiento en internet
oespinoza76
 
Unidades de medida en sistemas
Unidades de medida en sistemasUnidades de medida en sistemas
Unidades de medida en sistemas
lgblog1730
 

La actualidad más candente (19)

Unidades y conversion
Unidades y conversionUnidades y conversion
Unidades y conversion
 
Consulta de bits
Consulta de bitsConsulta de bits
Consulta de bits
 
Ana Belén Salvatore
Ana Belén SalvatoreAna Belén Salvatore
Ana Belén Salvatore
 
Medidas de información y Sistemas de Numeración
Medidas de información y Sistemas de NumeraciónMedidas de información y Sistemas de Numeración
Medidas de información y Sistemas de Numeración
 
Unidad de medida de computacion
Unidad de medida de computacionUnidad de medida de computacion
Unidad de medida de computacion
 
Los tipos de bytes
Los tipos de bytesLos tipos de bytes
Los tipos de bytes
 
TIC-Informática. Empezando desde 0... y 1
TIC-Informática. Empezando desde 0... y 1TIC-Informática. Empezando desde 0... y 1
TIC-Informática. Empezando desde 0... y 1
 
Unidades de medidas de almacenamiento
Unidades de medidas de almacenamientoUnidades de medidas de almacenamiento
Unidades de medidas de almacenamiento
 
Como hacer pasaje de unidades
Como hacer pasaje de unidadesComo hacer pasaje de unidades
Como hacer pasaje de unidades
 
Los bytes unidad de almacenamiento
Los bytes unidad de almacenamientoLos bytes unidad de almacenamiento
Los bytes unidad de almacenamiento
 
Consulta
ConsultaConsulta
Consulta
 
Unidades de mediciones de almacenamiento
Unidades de mediciones de almacenamientoUnidades de mediciones de almacenamiento
Unidades de mediciones de almacenamiento
 
Unidades de información
Unidades de informaciónUnidades de información
Unidades de información
 
Medidas de información
Medidas de informaciónMedidas de información
Medidas de información
 
Sistemas de numeración
Sistemas de numeraciónSistemas de numeración
Sistemas de numeración
 
Unidades medida02
Unidades medida02Unidades medida02
Unidades medida02
 
Unidades de almacenamiento en internet
Unidades de almacenamiento en internetUnidades de almacenamiento en internet
Unidades de almacenamiento en internet
 
Unidades de medida en sistemas
Unidades de medida en sistemasUnidades de medida en sistemas
Unidades de medida en sistemas
 
84826353486
8482635348684826353486
84826353486
 

Similar a Semana 5: CTW y Diccionarios

Sistema binario 1
Sistema binario 1Sistema binario 1
Sistema binario 1
josarta
 
Sistema de transmision banda base
Sistema de transmision banda baseSistema de transmision banda base
Sistema de transmision banda base
Douglas
 
Unidades básicas de información (2)
Unidades básicas de información (2)Unidades básicas de información (2)
Unidades básicas de información (2)
Dayiiz Betancourt
 
Conceptos de transmision
Conceptos de transmisionConceptos de transmision
Conceptos de transmision
cesar4174
 

Similar a Semana 5: CTW y Diccionarios (20)

Código Huffman
Código HuffmanCódigo Huffman
Código Huffman
 
Taller tecnologia
Taller tecnologiaTaller tecnologia
Taller tecnologia
 
Sistema Binario
Sistema BinarioSistema Binario
Sistema Binario
 
Sistema binario-1212264484482067-8
Sistema binario-1212264484482067-8Sistema binario-1212264484482067-8
Sistema binario-1212264484482067-8
 
Sistema binario
Sistema binarioSistema binario
Sistema binario
 
Sistema binario
Sistema binarioSistema binario
Sistema binario
 
Sistema binario-1212264484482067-8
Sistema binario-1212264484482067-8Sistema binario-1212264484482067-8
Sistema binario-1212264484482067-8
 
Sistema binario
Sistema binarioSistema binario
Sistema binario
 
Sistema binario-1212264484482067-8
Sistema binario-1212264484482067-8Sistema binario-1212264484482067-8
Sistema binario-1212264484482067-8
 
Sistema binario
Sistema binarioSistema binario
Sistema binario
 
Sistema binario 1
Sistema binario 1Sistema binario 1
Sistema binario 1
 
Sistema de transmision banda base
Sistema de transmision banda baseSistema de transmision banda base
Sistema de transmision banda base
 
Unidades de medida en informatica
Unidades de medida en informatica Unidades de medida en informatica
Unidades de medida en informatica
 
Codificación de huffman
Codificación de huffmanCodificación de huffman
Codificación de huffman
 
Unidades básicas de información (2)
Unidades básicas de información (2)Unidades básicas de información (2)
Unidades básicas de información (2)
 
002 interface movil
002 interface movil002 interface movil
002 interface movil
 
Semana 2 - UPCI (Sede Huanta)
Semana 2 - UPCI (Sede Huanta)Semana 2 - UPCI (Sede Huanta)
Semana 2 - UPCI (Sede Huanta)
 
Conceptos de transmision
Conceptos de transmisionConceptos de transmision
Conceptos de transmision
 
Unidades de Medida en Informatica
Unidades de Medida en InformaticaUnidades de Medida en Informatica
Unidades de Medida en Informatica
 
Investigación Códigos INF 164
Investigación Códigos INF 164Investigación Códigos INF 164
Investigación Códigos INF 164
 

Más de Marcelo Valdiviezo

Semana 9: Métricas de Error y Métodos Intuitivos
Semana 9: Métricas de Error y Métodos IntuitivosSemana 9: Métricas de Error y Métodos Intuitivos
Semana 9: Métricas de Error y Métodos Intuitivos
Marcelo Valdiviezo
 

Más de Marcelo Valdiviezo (20)

Semana 4: Ética Profesional
Semana 4: Ética ProfesionalSemana 4: Ética Profesional
Semana 4: Ética Profesional
 
Semana 3: Ética Profesional
Semana 3: Ética ProfesionalSemana 3: Ética Profesional
Semana 3: Ética Profesional
 
Semana 18: Compresión MPEG-4
Semana 18: Compresión MPEG-4Semana 18: Compresión MPEG-4
Semana 18: Compresión MPEG-4
 
Clase 13 cdi: Razones de cambio relacionadas
Clase 13 cdi: Razones de cambio relacionadasClase 13 cdi: Razones de cambio relacionadas
Clase 13 cdi: Razones de cambio relacionadas
 
Semana 17: Compresión de Audio
Semana 17: Compresión de AudioSemana 17: Compresión de Audio
Semana 17: Compresión de Audio
 
Semana 15: El Sonido
Semana 15: El SonidoSemana 15: El Sonido
Semana 15: El Sonido
 
Semana 15: Integrales Múltiples
Semana 15: Integrales MúltiplesSemana 15: Integrales Múltiples
Semana 15: Integrales Múltiples
 
Semana 14: Gradiente, Divergencia y Rotacional
Semana 14: Gradiente, Divergencia y RotacionalSemana 14: Gradiente, Divergencia y Rotacional
Semana 14: Gradiente, Divergencia y Rotacional
 
Semana 13: Planos Tangentes y Rectas Normales
Semana 13: Planos Tangentes y Rectas NormalesSemana 13: Planos Tangentes y Rectas Normales
Semana 13: Planos Tangentes y Rectas Normales
 
Semana 12: Derivada direccional y gradiente
Semana 12: Derivada direccional y gradienteSemana 12: Derivada direccional y gradiente
Semana 12: Derivada direccional y gradiente
 
Semana 10: Derivadas Parciales
Semana 10: Derivadas ParcialesSemana 10: Derivadas Parciales
Semana 10: Derivadas Parciales
 
Semana 10: Transformadas de Imágenes
Semana 10: Transformadas de ImágenesSemana 10: Transformadas de Imágenes
Semana 10: Transformadas de Imágenes
 
Semana 9: Funciones de varias variables
Semana 9: Funciones de varias variablesSemana 9: Funciones de varias variables
Semana 9: Funciones de varias variables
 
Semana 9: Métricas de Error y Métodos Intuitivos
Semana 9: Métricas de Error y Métodos IntuitivosSemana 9: Métricas de Error y Métodos Intuitivos
Semana 9: Métricas de Error y Métodos Intuitivos
 
Semana 9: Código de Gray
Semana 9: Código de GraySemana 9: Código de Gray
Semana 9: Código de Gray
 
Semana 8: Introducción a la Compresión de Imágenes
Semana 8: Introducción a la Compresión de ImágenesSemana 8: Introducción a la Compresión de Imágenes
Semana 8: Introducción a la Compresión de Imágenes
 
Semana 8: Longitud de Arco y Curvatura
Semana 8: Longitud de Arco y CurvaturaSemana 8: Longitud de Arco y Curvatura
Semana 8: Longitud de Arco y Curvatura
 
Clase 05 CDI
Clase 05 CDIClase 05 CDI
Clase 05 CDI
 
Semana 7: Derivación e Integración de Funciones Vectoriales
Semana 7: Derivación e Integración de Funciones VectorialesSemana 7: Derivación e Integración de Funciones Vectoriales
Semana 7: Derivación e Integración de Funciones Vectoriales
 
Semana 6: LZ77
Semana 6: LZ77Semana 6: LZ77
Semana 6: LZ77
 

Último

BOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuariaBOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
mesiassalazarpresent
 
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOLNORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
Pol Peña Quispe
 

Último (20)

BOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuariaBOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
 
Los vidrios eléctricos en un automóvil.pptx
Los vidrios eléctricos en un automóvil.pptxLos vidrios eléctricos en un automóvil.pptx
Los vidrios eléctricos en un automóvil.pptx
 
DESVIACION
DESVIACION DESVIACION
DESVIACION
 
Vehiculo para niños con paralisis cerebral
Vehiculo para niños con paralisis cerebralVehiculo para niños con paralisis cerebral
Vehiculo para niños con paralisis cerebral
 
Tasaciones Ñuñoa - La Reina - Las Condes
Tasaciones Ñuñoa - La Reina - Las CondesTasaciones Ñuñoa - La Reina - Las Condes
Tasaciones Ñuñoa - La Reina - Las Condes
 
Joseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidadJoseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidad
 
DISEÑO DE LOSAS EN UNA DIRECCION (CONCRETO ARMADO II )
DISEÑO DE LOSAS EN UNA DIRECCION  (CONCRETO ARMADO II )DISEÑO DE LOSAS EN UNA DIRECCION  (CONCRETO ARMADO II )
DISEÑO DE LOSAS EN UNA DIRECCION (CONCRETO ARMADO II )
 
Mecánica de fluidos 1 universidad continental
Mecánica de fluidos 1 universidad continentalMecánica de fluidos 1 universidad continental
Mecánica de fluidos 1 universidad continental
 
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALESLA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
 
Sistemas de posicionamiento global (G.P.S.).pdf
Sistemas de posicionamiento global (G.P.S.).pdfSistemas de posicionamiento global (G.P.S.).pdf
Sistemas de posicionamiento global (G.P.S.).pdf
 
habilidad para el manejo de estación total.pdf
habilidad para el manejo de estación total.pdfhabilidad para el manejo de estación total.pdf
habilidad para el manejo de estación total.pdf
 
problemas consolidación Mecánica de suelos
problemas consolidación Mecánica de suelosproblemas consolidación Mecánica de suelos
problemas consolidación Mecánica de suelos
 
Instalación de GLPI en Debian Linux paso a paso
Instalación de GLPI en Debian Linux paso a pasoInstalación de GLPI en Debian Linux paso a paso
Instalación de GLPI en Debian Linux paso a paso
 
El abecedario constituye el conjunto de grafías que son utilizadas para repre...
El abecedario constituye el conjunto de grafías que son utilizadas para repre...El abecedario constituye el conjunto de grafías que son utilizadas para repre...
El abecedario constituye el conjunto de grafías que son utilizadas para repre...
 
Becas de UOC _ Caja Ingenieros 2024-25.pdf
Becas de UOC _ Caja Ingenieros 2024-25.pdfBecas de UOC _ Caja Ingenieros 2024-25.pdf
Becas de UOC _ Caja Ingenieros 2024-25.pdf
 
Deilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - ConstrucciónDeilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - Construcción
 
Mapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIASMapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIAS
 
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOLNORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
 
Efecto. Fotovoltaico y paneles.pdf
Efecto.     Fotovoltaico  y  paneles.pdfEfecto.     Fotovoltaico  y  paneles.pdf
Efecto. Fotovoltaico y paneles.pdf
 
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOSAnálisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
 

Semana 5: CTW y Diccionarios

  • 1.
  • 2. Técnicas de Compresión y Descompresión de Señales Marcelo Fernando Valdiviezo C. Carrera de Electrónica y Telecomunicaciones Octubre - 2020
  • 3. UNIDAD 1: COMPRESIÓN DE DATOS TEMA: PONDERACIÓN DE ÁRBOL DE CONTEXTO.
  • 4. INTRODUCCIÓN CADENA BINARIA CONTEXTO COMPRESIÓN IDEAL Si se pudiera utilizar los bits que se han introducido hasta el momento actual para predecir el valor del siguiente.
  • 5. MÉTODO DE PONDERACIÓN DE ÁRBOL DE CONTEXTO (CTW) 1 1 2 t tb bb b= Se inicia con una cadena de bits determinada 2 1d dc b b b− − −= d bits que la preceden. Contexto de 1 t b Se construye un árbol de profundidad d basado en el contexto NODO Subcadena de cd. Se introduce y se examina el primer bit b1. 1 El árbol se actualiza para incluir la subcadena cbb1. Se utiliza para calcular la probabilidad de que b1=1 dado el contexto cd. 0 El árbol se actualiza de manera diferente SECUENCIA DE ENTRADA Se utiliza para calcular la probabilidad de que b1=0 dado el contexto cd. CODIFICADOR ARITMÉTICO
  • 6. MÉTODO DE PONDERACIÓN DE ÁRBOL DE CONTEXTO (CTW) CADENA BINARIA FUENTE SIN MEMORIA CON MEMORIA
  • 7. MÉTODO DE PONDERACIÓN DE ÁRBOL DE CONTEXTO (CTW) FUENTE SIN MEMORIA ( )1aP ( )0aP Probabilidad de un bit de ser un 1 Probabilidad de un bit de ser un 0 ( )1aP = ( )0 1aP = − ( ) ( )1 1 t t a a i i P b P b = =  Probabilidad de una cadena determinada generada por la fuente ( ) ( )1 1 at b aP b  = −
  • 8. MÉTODO DE PONDERACIÓN DE ÁRBOL DE CONTEXTO (CTW) EJEMPLO ( ) ( )1 1 at b aP b  = − t = 5 a = 2 b =3 ( ) ( ) 25 3 1 1aP b  = − ( )1 1 1 21| 1 t e t b P b b a b + + = = + + ( )1 11|e t t b P bb a b + = = + Estimación KT
  • 9. CTW PARA LA COMPRESIÓN DE TEXTO Caracteres ASCII • Cada carácter se compone de 7 bits. • Se utilizan las 128 combinaciones posibles. • Existen combinaciones mas comunes que otras • Ciertas combinaciones dobles (on) y triples (ion) son mas comunes. tb 1 bit en un determinado carácter ASCII X 1 2 1tbb b − contexto Se obtienen mejores resultados: • En contextos de tamaño 12. • Usando 7 árboles de contexto, uno por cada bit. • La estimación KT original se de modificada para estimar la redundancia cero definida por: ( ) ( ) ( ) ( ) 1 1 1 , , 0 0 2 4 4 def e eP a b P a b a b  + = + ==
  • 10. UNIDAD 1: COMPRESIÓN DE DATOS TEMA: MÉTODOS DE DICCIONARIO.
  • 11. INTRODUCCIÓN Los métodos estadísticos de compresión usan un modelo estadístico de los datos. La calidad de la compresión depende de la calidad del modelo LOS MÉTODOS DE DICCIONARIO, NO EMPLEAN UN MODELO ESTADÍSTICO NI CÓDIGOS DE TAMAÑO VARIABLE. SELECCIONAN CADENAS DE SÍMBOLOS Y CODIFICAN CADA CADENA COMO UNA MUESTRA UTILIZANDO UN DICCIONARIO.
  • 12. COMPRESIÓN EN CADENAS Muestra = Token DICCIONARIO • Estático • Dinámico CADENAS DE SÍMBOLOS LOS COMPRESORES DE DICCIONARIO SON CODIFICADORES DE ENTROPÍA SI EL ARCHIVO DE ENTRA ES MUY GRANDE En general, los métodos de compresión basados en cadenas de símbolos pueden ser más eficientes que los métodos que comprimen símbolos individuales.
  • 13. COMPRESIÓN DE DICCIONARIO Se lee el archivo fuente y se prepara una lista de los distintos bytes encontrados. Para cada byte, se incluye también en la lista el número de veces que aparece en dicho archivo (su frecuencia). Se ordena la lista en orden decreciente de las frecuencias. Por lo tanto, comienza con valores de los bytes más comunes en el archivo, y termina con los bytes que aparecen raramente. Puesto que la lista consta de bytes distintos, no puede tener más de 256 elementos. 1 2
  • 14. COMPRESIÓN DE DICCIONARIO La lista ordenada se convierte en el diccionario; se escribe en el archivo comprimido, precedido por su longitud (un entero de 1 byte) Se lee de nuevo el archivo de origen, byte a byte. se localiza cada byte en el diccionario y se observa su índice; el índice es un número dentro del intervalo [0, 255], por lo que requiere entre 1 y 8 bits. En el archivo comprimido, se escribe el índice, precedido por un código de 3 bits, que indica la longitud del índice. En consecuencia, el código 000 denota un índice de 1 bit, el código 001 indica un índice de 2 bits, y así sucesivamente hasta el código 111, que denota un índice de 8 bits. 3 4