Este documento describe un proyecto de investigación para desarrollar un sistema automatizado para detectar objetos peligrosos en radiografías de equipaje en aeropuertos utilizando técnicas de visión por computadora e inteligencia artificial. El autor propone utilizar descriptores locales de patrones binarios y SIFT junto con diccionarios visuales y representación dispersa para clasificar objetos. Se reconocen limitaciones como la falta de estudios previos en este dominio y tiempos de entrenamiento largos. Los resultados preliminares muestran un 60% de éxito utilizando
Detección automática objetos peligrosos rayos X usando visión computar e inteligencia máquina
1. Detección de objetos peligrosos
en radiografías utilizando
múltiples vistas
5 / Septiembre / 2014
Marco Antonio Arias Figueroa
Profesor Supervisor: Domingo Mery
2. Contenido
1. Motivación
2. Marco Teórico
3. Pregunta de Investigación
4. Solución propuesta
5. Limitaciones
6. Estado de la investigación
3. Contenido
1. Motivación
2. Marco Teórico
3. Pregunta de Investigación
4. Solución propuesta
5. Limitaciones
6. Estado de la investigación
8. Problemas generales
• La revisión de equipajes actualmente se realiza
manualmente
• Durante las horas punta, el porcentaje de acierto
de los operadores baja a un 90% o incluso 80%
• El estrés de los trabajadores influye directamente
en los resultados de la revisión de equipaje
• ¿Por qué no aprovechar la tecnología para
resolver este tipo de problemas?
9. Contenido
1. Motivación
2. Marco Teórico
3. Pregunta de Investigación
4. Solución propuesta
5. Limitaciones
6. Estado de la investigación
10. Visión por Computador e Inteligencia
de Máquina
• Visión por Computador
– SIFT, líneas epipolares, múltiples vistas, etc.
• Descriptores
– LBP, Escala de grises, FFT, etc.
• Clasificadores
– SVM, Random Forest, etc.
16. Diccionarios Visuales
• Se realiza clustering a los descriptores
encontrados
• Se buscan representantes
• Se aproximan todos los descriptores al
representante más cercano
17. Sparse Representation
• Comparación de la representación obtenida
con respecto a la real:
• Residuo de reconstrucción:
18. SR en detección de caras
• ~ 97-99% aciertos
• ~ 40 % aciertos
19. Contenido
1. Motivación
2. Marco Teórico
3. Pregunta de Investigación
4. Solución propuesta
5. Limitaciones
6. Estado de la investigación
20. ¿Es posible automatizar el proceso de
detección de objetos peligrosos en
aeropuertos, con el fin de evitar errores
que pueden llevar a consecuencias
fatales?
21. • Más técnicamente:
¿Es posible utilizar algoritmos de visión por
computador e inteligencia de máquina para crear
un sistema autónomo de detección de objetos
peligrosos?
22. Contenido
1. Motivación
2. Marco Teórico
3. Pregunta de Investigación
4. Solución propuesta
5. Limitaciones
6. Estado de la investigación
23. Solución propuesta
(Training)
SIFT +
Matching
Descriptores
LBP
Doble k-means
Diccionario con los
clusters padres e
hijos
25. Solución propuesta
(Testing)
Diccionario
Patch Elección de
representantes
Clasificación por
mayoría de
votos
Sparse
Representation
26. ¿Por qué SR y Diccionarios?
• Se logra una buena representación de los
objetos
• Robusto ante oclusión
• Algoritmo SR ya implementado y relativamente
sencillo de manejar
27. Diccionario previo
Set de
entrenamiento
Diccionario
con todas las
clases
Obtención de
Patches
Obtención de
patches
representativos
Descriptor
28. Contenido
1. Motivación
2. Marco Teórico
3. Pregunta de Investigación
4. Solución propuesta
5. Limitaciones
6. Estado de la investigación
29. Limitaciones
• Se requieren directamente las imágenes de las
vistas.
– No es posible reconocer el área de interés
previamente
• No existe mucho estudio de reconocimiento de
objetos en rayos X
• El tiempo de entrenamiento es muy largo (~1 día
para un set mediano de imágenes)
30. Contenido
1. Motivación
2. Marco Teórico
3. Pregunta de Investigación
4. Solución propuesta
5. Limitaciones
6. Estado de la investigación
31. Set de entrenamiento
• 4 objetos:
– Clips
– Resortes
– Hojas de afeitar
– Otros
• 4-8 vistas c/u
35. Trabajo Futuro
• Agregar al código el match de los SIFT
• Implementar el código del doble diccionario y
ver resultados
– Si el resultado no mejora, buscar otra ayuda a
mejorar la detección de la posición