Detección automática multicanal de anuncios en tv en tiempo real
Detección e identificación de anuncios de radio y TV en tiempo real
1. DETECCIÓN E
IDENTIFICACIÓN DE
ANUNCIOS
DE RADIO Y TELEVISIÓN
EN TIEMPO REAL
PROYECTO FIN DE
CARRERA
ERNESTO SUBIRÁ NIMO
2. INDICE
1. INTRODUCCIÓN Y OBJETIVOS.
2. ALGORITMO DE DETECCIÓN.
3. HARDWARE Y SOFTWARE.
4. DESARROLLO DE LA APLICACIÓN.
5. RESULTADOS Y CONCLUSIONES.
4. INTRODUCCION Y OBJETIVOS
Grandes sumas de dinero en publicidad.
Tipo de contrato depende del horario de
emisión.
Necesidad de comprobar lo acordado en
los contratos publicitarios.
Desarrollo y mejora de una aplicación que
proporciona una solución a este
problema.
5. INTRODUCCION Y OBJETIVOS
Requisitos de la aplicación:
Funcionamiento en tiempo real.
Eficiencia computacional.
Sencillez.
Portabilidad.
7. IDENTIFICACÓN UTILIZANDO
AUDIO FINGERPRINTING
Objetivo Identificar anuncios de
Radio FM y Televisión.
Necesidad de alguna técnica que
permita comparar tramas de audio.
Esta técnica debe ser:
- Robusta.
- Eficiente computacionalmente.
- Precisa.
8. IDENTIFICACÓN UTILIZANDO
AUDIO FINGERPRINTING
Capacidad de identificar una pieza de audio a
partir de unos pocos segundos.
Busca características de la señal comunes a
todas ellas.
Suficientemente robusta para identificar en
escenarios poco favorables.
Genera una representación compacta (huella o
fingerprint) con estas características.
Utiliza esta huella como elemento identificador.
12. COMPONENTES DEL SISTEMA DE
AUDIO FINGERPRINTING
Dos Bloques fundamentales:
1. Bloque de extracción de fingerprints.
2. Bloque de búsqueda en la base de datos.
15. MODELADO DE FINGERPRINT
Dar una representación final a la
fingerprint (huella) extraída.
Minimizar la redundancia.
Matriz con número de filas variable y
32 columnas.
17. ALGORITMO DE BUSQUEDA
Buscar la huella extraída en la base de
datos.
Muchos algoritmos de búsqueda.
Buscan la rapidez y la precisión.
Base de datos menor de 50 anuncios.
Algoritmo elegido Fuerza Bruta
21. HARDWARE
Sistema:
- Equipo Portátil
- Intel Centrino 1,6 GHz
- 512 MB RAM DDR.
Tarjeta Capturadora:
- WINTV USB de
Hauppauge
22. SOFTWARE
Sistema Entorno de Control de
Operativo programación la tarjeta
23. FUNCIONAMIENTO EN OTROS SISTEMAS
CASO CPU MEMORIA S.O. TARJETA TV FM OK
Intel
WIN Hauppauge
1 Centrino 512 MB SI SI
XP WinTV USB
1.4 GHz
Intel P4 WIN Hauppauge
2 256 MB SI SI
2.4 GHz XP WinTV USB
Intel P4 WIN Best Buy
3 512 MB NO SI
2.6 GHz XP Easy TV
Intel P3 WIN Pinnacle
4 256 MB NO SI
864 MHz XP PCTV Pro
Intel P3 WIN Hauppauge
5 256 MB SI SI
864 MHz XP WinTV USB
25. COMPONENTES DE LA APLICACIÓN
Existen 2 partes bien diferenciadas:
1. Interfase de comunicación entre PC y
tarjeta capturadora.
2. Implementación del algoritmo de
detección.
26. INTERFASE DE COMUNICACIÓN ENTRE
PC Y TARJETA CAPTURADORA
Grafo 1: Almacena las muestras capturadas
en un buffer para su posterior tratamiento.
27. INTERFASE DE COMUNICACIÓN ENTRE
PC Y TARJETA CAPTURADORA
Grafo 2: Almacena las muestras capturadas
en un fichero.
28. IMPLEMENTACION DEL ALGORITMO
DE DETECCION
1. Fase de Establecimiento
- Sólo se ejecuta una vez.
- Se leen las frecuencias o canales de TV.
- Se computa el tiempo de procesado.
2. Fase de Aplicación.
- Se ejecuta de forma periódica.
- Se recogen las muestras del buffer.
- Se extrae su fingerprint correspondiente.
- Se busca en la base de datos.
30. RESULTADOS Y CONCLUSIONES
Objetivo de las pruebas:
- Demostrar la eficiencia computacional.
- Comprobar los límites de la aplicación.
Extraer conclusiones que sirvan como
guía de aplicación.
31. TIEMPO DE PROCESADO
Tiempo de computación (Correlación)
Tiempo de computación (Audio Fingerprinting)
30
25
20
15
10
5
0
1 5 9 13 17 21 25 29 33 37 41 45
32. TASA DE ACIERTOS
Tasa de aciertos (detección en la misma
frecuencia que se grabó)
100
80
Porcentaje (%)
60
40
20
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
Nº anuncios
33. TASA DE ACIERTOS
Tasa de aciertos (detección en diferente
frecuencia a la que se grabó)
100
80
Porcentaje (%)
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Nº anuncios
34. CONCLUSIONES
Algoritmo Audio Fingerprinting 5 ó 6
veces más rapido que el de correlación.
Hasta 20 anuncios en la misma frecuencia
de grabación.
Hasta 7 anuncios en diferente frecuencia
de grabación.
Necesidad de un tiempo de captura menor
para trabajar con múltiples sintonías.