SlideShare una empresa de Scribd logo
1 de 43
Facultad de Ingeniería, Universidad de la Republica
Cual es el problema a resolver?
•Alta competencia del deporte y del futbol moderno.
•Mercado que mueve millones de dólares.
•Exponencial uso de la tecnología.


         Surge la necesidad de
      obtener información objetiva
       sobre el rendimiento de un
          equipo o jugadores.
Como se pude lograr?
 •La idea es medir y cuantificar eventos.




  La técnica utilizada para obtener algunos de
     estos datos, es utilizar un conjunto de
     cámaras fijas instaladas en el estadio.
Soluciones comerciales existentes
Objetivos:

•Crear un prototipo software que prueba la viabilidad
técnica de una solución en el dominio de interés.

•Generar un conjunto de datos de prueba propio, con
el apoyo económico de la Fundación Ricaldoni.

•Obtener una estimación del grado de incertidumbre
del resultado obtenido.
Procesamiento por cámara


                                 La entrada es el video que
                                 llega de la cámara, la
                                 salida es un conjunto de
                                 datos que describen la
                                 posición y categoría de
                                 cada uno de los objetos
                                 detectados.


    Jugadores, goleros, jueces
Procesamiento unificado


                          La entrada es el conjunto
                          de datos de la primera
                          etapa, la salida es otro
                          conjunto de datos que
                          describen la posición y
                          categoría de los objetos
                          en un modelo único del
                          campo de juego.
Software. Características
 •Diseño modular, que hace fuerte uso de los
 patrones de diseño : Singleton y Strategy

 •Cada Modulo resuelve un problema particular
  y colabora para obtener la solución global.

 •Utilizando Singleton, logramos que la única instancia de
 cada Modulo sea fácilmente accesible y además que tenga
 bajo acoplamiento.

 •Utilizando Strategy, pudimos intercambiar, distintas
 versiones de un mismo algoritmo durante las pruebas al
 sistema.
Software. Características
 •El prototipo se implemento utilizando
  Matlab R2009b .

 •Java jdk1.6.0_12 , IDE Eclipse para la
 comunicación con la API de VIPER GT.
Componentes de la primera etapa
Componentes de la segunda etapa
Conjunto de datos de prueba
   ISSIA DATASET
•   6 cámaras
•   Calibración, puntos en
    el piso
•   Datos Ground Truth

   SCEPTRE DATASET
•   8 cámaras
•   Calibración,
    constantes TSAI
Datos obtenidos por el grupo
   PARQUE CENTRAL           PROBLEMAS:
•   1 cámara
                             • Sombras
                             • Ubicación de las cámaras
   MÉNDEZ PIANA             • Sincronización de las
•   4 cámaras                cámaras
                             • Configuración de las cámaras
   FRANZINI DATASET
•   4 cámaras
•   Calibración, puntos de
    la cancha
Datos obtenidos por el grupo




 18 /11/2010: Partido amistoso Uruguay-Argentina sub 17 , Parque
 Central
Datos obtenidos por el grupo




126/03/2011: Estadio Luis
Franzini
Generación de datos de Ground Truth
con VIPER GT
Modelado del fondo
   Método: Mixture of
    Gaussians

   Distinguir entre puntos
    estáticos y en movimiento
    (los valores bajos de
    energía son utilizados para
    construir el fondo mientras
    que los altos se descartan
    por la probabilidad de
    pertenecer a objetos
    móviles).
Procesamiento multicamara
Cada cámara arroja: estimación + incertidumbre sobre
la posición y categoría de cada “Target”.


                            Se busca “combinar” de manera
                            adecuada cada una de las
                            medidas, para incrementar la
                            precisión global del sistema.


El resultado es enviado a un proceso que utiliza la
restricción de cantidad de elementos por categoría para
condicionar la salida del sistema. (este dato viene de una
fuente externa al sistema)
Procesamiento multicamara
 Nuevamente se utiliza el fitro de Kalman, pero ahora
 en el plano de la cancha.


                                          x = [x                 y ']
                                                                        T
Vector de estados, posición y velocidad
sobre el plano de la cancha:                       y        x'

                                          z = [x   y]
Observaciones:                                          T


     1    0 T 0
     0    1 0 T
Aw =                                1 0 0 0
     0    0 1 0                Hw =         
                                     0 1 0 0
     0    0 0 1
Procesamiento multicamara
Se construye una matriz de asociación (binaria) para
cada cámaras: Targets X Observaciones

                        1 indica una asociación entre el
  1  0
   1  0                Target y la observación.
    1  0
  0 10 0
   0  0                0 no hay asociación.
    0  0
  0 01 0
   0  1
    0  1
     0  1

Se calcula utilizando la mínima distancia de
Mahalanobis y el algoritmo del vecino mas cercano
Procesamiento multicamara

Hasta aquí, seria la salida de una aplicación típica de
seguimiento.


Pero… nosotros conocemos el numero “correcto” de
elementos que el sistema debe retornar.



Podemos “condicionar” la salida global para usar esta
información. => MAP
Procesamiento multicamara
Creación y muerte de los
targets
Las observaciones que no son asociadas con ningún
target activo, son potenciales nuevos targets.

Se utiliza el numero de cámaras esperado que
“observan” el nuevo target para decidir y la “antigüedad”
en cuadros.

La creación o muerte de Targers , una vez que el
sistema llega al numero esperado, es un evento que no
debe ocurrir con frecuencia.
Performance SingleView




A los videos de entrada, los etiquetamos manualmente
mediante el ViperGT en sus posiciones y categorías
correctas y lo comparamos con el XML salida del sistema
utilizando ViperPE. La presentación de resultados se da
mediante Presicion & Recall.
Precision & Recall
Algunos números….



                                                                          ISSIA
                                                                          DATASET




La “Precision" es de 60/69 es decir un 86 %

esto se podrá interpretar como que de los 69 objetos a testear en el archivo xml
de salida del sistema, se pudieron “matchear” o encontrar correspondientes a 60
de ellos con objetos en el archivo de GT.

El “Recall" es de 37/76, es decir que de los 76 objetos test registrados como

verdaderos en el archivo de GT solamente se asignaron 37 de ellos (es decir
para 37 de esos objetos test se encontró correspondiente en el archivo xml de
salida del sistema).
Para que mostrar un resultado intermedio ?

1) Necesidad de investigar como esta evolucionando la performance
por cámara al modificar parámetros de diseño.


2) Comparar como afectan los esquemas de clasificación de
categorías a los esquemas de localización espacial.


3) Tener una idea mas precisa sobre como mejora la performance
final al integrar todas las cámaras, mediante la sencilla
comparación de la performance intermedia y la final.

 Esto nos demuestra que efectivamente tener varias cámaras
 distribuidas espacialmente de forma conveniente nos facilita
 la resolución del problema, pudiendo integrar información
 proveniente de varias cámaras y ponderando dicha
 información entre ellas para resolver los principales
 problemas (falsas detecciones, oclusiones mal resueltas,
 etc..) y así aumentar la performance final del problema
 propuesto.
Resultados de Multiview
Hablar de los resultados de esta etapa es hablar del
rendimiento del sistema en general.


La idea es:

Contar el numero de elementos detectados en cada
categoría cuadro a cuadro y compararlo con el
esperado.


 El numero de objetos detectados en un buen
 indicador del rendimiento del sistema.
Resultados de Multiview
3000 cuadros del dataset ISSIA




                                 Cuadro1 12,8453
                                 Cuadro2 12,8225
                                 Abrbitros 2,2460
                                 Golero1   0,8977
                                 Golero2   1,1140
Resultados de Multiview
Un numero levemente superior al esperado en la
cantidad de jugadores, se explica porque el sistema
tiende a “continuar” los tracks.


Los líneas no son tomados por las cámaras.


En esta secuencia, uno de los arqueros es mal
clasificado, dada su similitud con la camiseta de los
jugadores de cancha.
Conclusiones

Se adquirió experiencia y conocimiento en las
técnicas utilizadas, hasta llegar a dominarlas y
poder integrar las soluciones parciales a la solución
global.

El prototipo construido nos permitió probar que
una solución al problema es técnicamente factible
y realizable.

Creemos que el conocimiento adquirido en el
área del problema, los obstáculos y problemas
que tuvimos que sortear para llegar a este punto,
son en definitiva, el real valor de proyecto
Que cosas identificamos como futuras
mejoras a la solución ?
1) Flujos de datos:

Problema actual:

El principal problema es que el “parser" de los archivos XML no
accede secuencialmente a la información, sino que carga en
memoria todo el archivo. Esto se traduce en cientos de MB en
memoria RAM !!!.

Posible solución:

La primera solución para este problema es sustituir el “parser" que
utiliza VIPER por alguno que acceda secuencialmente a la
información.

Otra solución mas comprometida, seria eliminar completamente el
uso de archivos XML y utilizar una base de datos en la que la
primera etapa inserte y la segunda etapa acceda a leer.
Que cosas identificamos como futuras
 mejoras a la solución ?
2) Movimiento de cámara y sombras:

Problema actual:

El principal problema con el movimiento de la cámara es la falsa
detección de las líneas del campo de juego.
Mientras que las sombras de los jugadores producen una mala
segmentación (la sombra también se mueve ! )

Posible solución:

Crear un bloque del sistema que se encargue de la estabilización
total del video y que elimine las sombras de los jugadores.
Que cosas identificamos como futuras
 mejoras a la solución ?
3) Otras mejoras identificadas a implementar:

        3.1) tracking al balón .

        3.2) clasificación de categorías SingleView mas
        inteligente ( no en todos los frames del video para
        un mismo objetivo)

        3.3) Automatización en el proceso de modelado
        de fondo (extracción periódica y automática del
        Background)

        3.4) Aspectos de arquitectura global que nos
        permitan acercarnos aun mas al limite de tiempo
        real.

        Entre otros….

Más contenido relacionado

Destacado

11061601 paardekooper actiefolder 10 los incl. url
11061601 paardekooper actiefolder 10 los incl. url11061601 paardekooper actiefolder 10 los incl. url
11061601 paardekooper actiefolder 10 los incl. urlPaardekooper BV
 
364 chapter 2
364 chapter 2364 chapter 2
364 chapter 2pairofsox
 
Universidad nacional de cajamarca
Universidad  nacional  de  cajamarcaUniversidad  nacional  de  cajamarca
Universidad nacional de cajamarca43343645454
 
Ipc0911
Ipc0911Ipc0911
Ipc0911idesp
 
Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...
Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...
Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...CIAT
 
Norge i krig elevpresentasjon 1
Norge i krig elevpresentasjon 1Norge i krig elevpresentasjon 1
Norge i krig elevpresentasjon 1mettek
 
Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)
Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)
Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)Invest Northern Ireland
 
สอบ 10 ข้อ
สอบ 10 ข้อสอบ 10 ข้อ
สอบ 10 ข้อwwkaew
 
Robotintro
RobotintroRobotintro
Robotintrofloycito
 
Paardekooper najaarsbrochure 2012
Paardekooper najaarsbrochure 2012Paardekooper najaarsbrochure 2012
Paardekooper najaarsbrochure 2012Paardekooper BV
 
30)Cisneros Cárdenas Nidia Araceli_2014-1
30)Cisneros Cárdenas Nidia Araceli_2014-130)Cisneros Cárdenas Nidia Araceli_2014-1
30)Cisneros Cárdenas Nidia Araceli_2014-1marconuneze
 

Destacado (18)

11061601 paardekooper actiefolder 10 los incl. url
11061601 paardekooper actiefolder 10 los incl. url11061601 paardekooper actiefolder 10 los incl. url
11061601 paardekooper actiefolder 10 los incl. url
 
Abel
AbelAbel
Abel
 
Numero aureo
Numero aureoNumero aureo
Numero aureo
 
364 chapter 2
364 chapter 2364 chapter 2
364 chapter 2
 
Thesis progress
Thesis progressThesis progress
Thesis progress
 
Universidad nacional de cajamarca
Universidad  nacional  de  cajamarcaUniversidad  nacional  de  cajamarca
Universidad nacional de cajamarca
 
Ipc0911
Ipc0911Ipc0911
Ipc0911
 
A connect presentation final
A connect presentation   finalA connect presentation   final
A connect presentation final
 
Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...
Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...
Consulta Regional sobre Políticas públicas en Semillas en América Latina, Por...
 
Norge i krig elevpresentasjon 1
Norge i krig elevpresentasjon 1Norge i krig elevpresentasjon 1
Norge i krig elevpresentasjon 1
 
Cinema 2
Cinema 2Cinema 2
Cinema 2
 
Materia Estado de São Paulo - 2012
Materia Estado de São Paulo - 2012Materia Estado de São Paulo - 2012
Materia Estado de São Paulo - 2012
 
Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)
Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)
Sustainex 2013 - Packaging Design Regulations Robert Duncan (PDF)
 
สอบ 10 ข้อ
สอบ 10 ข้อสอบ 10 ข้อ
สอบ 10 ข้อ
 
Robotintro
RobotintroRobotintro
Robotintro
 
Produccion
ProduccionProduccion
Produccion
 
Paardekooper najaarsbrochure 2012
Paardekooper najaarsbrochure 2012Paardekooper najaarsbrochure 2012
Paardekooper najaarsbrochure 2012
 
30)Cisneros Cárdenas Nidia Araceli_2014-1
30)Cisneros Cárdenas Nidia Araceli_2014-130)Cisneros Cárdenas Nidia Araceli_2014-1
30)Cisneros Cárdenas Nidia Araceli_2014-1
 

Similar a Final

Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosSergio Valenzuela Mayer
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosSergio Valenzuela Mayer
 
diseño_contro_PID_discreto conv.docx
diseño_contro_PID_discreto conv.docxdiseño_contro_PID_discreto conv.docx
diseño_contro_PID_discreto conv.docxProfessorWilliams
 
12 feb 2013 investigación (1)
12 feb 2013 investigación (1)12 feb 2013 investigación (1)
12 feb 2013 investigación (1)heideryxiomara
 
Clase redes neuronales 3
Clase redes neuronales 3Clase redes neuronales 3
Clase redes neuronales 3JUANCHO_ANAYA
 
Guia para el programa desktop garp
Guia para el programa desktop garpGuia para el programa desktop garp
Guia para el programa desktop garpMildred_Lagos
 
CIITEC Fundamentos de Deep Learning.pptx
CIITEC  Fundamentos de Deep Learning.pptxCIITEC  Fundamentos de Deep Learning.pptx
CIITEC Fundamentos de Deep Learning.pptxicebeam7
 
Agente Reconedor de Señales de Transito
Agente Reconedor de Señales de TransitoAgente Reconedor de Señales de Transito
Agente Reconedor de Señales de TransitoDiego Guamán
 
Árboles de Decisión en Weka
Árboles de Decisión en WekaÁrboles de Decisión en Weka
Árboles de Decisión en WekaLorena Quiñónez
 
Computación evolutiva no tradicional
Computación evolutiva no tradicionalComputación evolutiva no tradicional
Computación evolutiva no tradicionalJuan J. Merelo
 
Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1dave
 
03.1 med-pres
03.1 med-pres03.1 med-pres
03.1 med-presxavazquez
 
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...JCarlos Gonzalez Joyé
 

Similar a Final (20)

Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
diseño_contro_PID_discreto conv.docx
diseño_contro_PID_discreto conv.docxdiseño_contro_PID_discreto conv.docx
diseño_contro_PID_discreto conv.docx
 
12 feb 2013 investigación (1)
12 feb 2013 investigación (1)12 feb 2013 investigación (1)
12 feb 2013 investigación (1)
 
1
11
1
 
Clase redes neuronales 3
Clase redes neuronales 3Clase redes neuronales 3
Clase redes neuronales 3
 
Diseño de redes usando simuladores
Diseño de redes usando simuladoresDiseño de redes usando simuladores
Diseño de redes usando simuladores
 
Guia para el programa desktop garp
Guia para el programa desktop garpGuia para el programa desktop garp
Guia para el programa desktop garp
 
Presentacion05
Presentacion05Presentacion05
Presentacion05
 
Presentacion05
Presentacion05Presentacion05
Presentacion05
 
CIITEC Fundamentos de Deep Learning.pptx
CIITEC  Fundamentos de Deep Learning.pptxCIITEC  Fundamentos de Deep Learning.pptx
CIITEC Fundamentos de Deep Learning.pptx
 
Agente Reconedor de Señales de Transito
Agente Reconedor de Señales de TransitoAgente Reconedor de Señales de Transito
Agente Reconedor de Señales de Transito
 
Aplicacion Weka Lorena Leon
Aplicacion Weka Lorena LeonAplicacion Weka Lorena Leon
Aplicacion Weka Lorena Leon
 
Árboles de Decisión en Weka
Árboles de Decisión en WekaÁrboles de Decisión en Weka
Árboles de Decisión en Weka
 
Computación evolutiva no tradicional
Computación evolutiva no tradicionalComputación evolutiva no tradicional
Computación evolutiva no tradicional
 
Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1
 
03.1 med-pres
03.1 med-pres03.1 med-pres
03.1 med-pres
 
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
 
Unidad 1
Unidad 1Unidad 1
Unidad 1
 
Unidad 1
Unidad 1Unidad 1
Unidad 1
 

Final

  • 1. Facultad de Ingeniería, Universidad de la Republica
  • 2. Cual es el problema a resolver? •Alta competencia del deporte y del futbol moderno. •Mercado que mueve millones de dólares. •Exponencial uso de la tecnología. Surge la necesidad de obtener información objetiva sobre el rendimiento de un equipo o jugadores.
  • 3. Como se pude lograr? •La idea es medir y cuantificar eventos. La técnica utilizada para obtener algunos de estos datos, es utilizar un conjunto de cámaras fijas instaladas en el estadio.
  • 5.
  • 6. Objetivos: •Crear un prototipo software que prueba la viabilidad técnica de una solución en el dominio de interés. •Generar un conjunto de datos de prueba propio, con el apoyo económico de la Fundación Ricaldoni. •Obtener una estimación del grado de incertidumbre del resultado obtenido.
  • 7. Procesamiento por cámara La entrada es el video que llega de la cámara, la salida es un conjunto de datos que describen la posición y categoría de cada uno de los objetos detectados. Jugadores, goleros, jueces
  • 8.
  • 9. Procesamiento unificado La entrada es el conjunto de datos de la primera etapa, la salida es otro conjunto de datos que describen la posición y categoría de los objetos en un modelo único del campo de juego.
  • 10.
  • 11. Software. Características •Diseño modular, que hace fuerte uso de los patrones de diseño : Singleton y Strategy •Cada Modulo resuelve un problema particular y colabora para obtener la solución global. •Utilizando Singleton, logramos que la única instancia de cada Modulo sea fácilmente accesible y además que tenga bajo acoplamiento. •Utilizando Strategy, pudimos intercambiar, distintas versiones de un mismo algoritmo durante las pruebas al sistema.
  • 12. Software. Características •El prototipo se implemento utilizando Matlab R2009b . •Java jdk1.6.0_12 , IDE Eclipse para la comunicación con la API de VIPER GT.
  • 13. Componentes de la primera etapa
  • 14. Componentes de la segunda etapa
  • 15.
  • 16. Conjunto de datos de prueba  ISSIA DATASET • 6 cámaras • Calibración, puntos en el piso • Datos Ground Truth  SCEPTRE DATASET • 8 cámaras • Calibración, constantes TSAI
  • 17. Datos obtenidos por el grupo  PARQUE CENTRAL PROBLEMAS: • 1 cámara • Sombras • Ubicación de las cámaras  MÉNDEZ PIANA • Sincronización de las • 4 cámaras cámaras • Configuración de las cámaras  FRANZINI DATASET • 4 cámaras • Calibración, puntos de la cancha
  • 18. Datos obtenidos por el grupo 18 /11/2010: Partido amistoso Uruguay-Argentina sub 17 , Parque Central
  • 19. Datos obtenidos por el grupo 126/03/2011: Estadio Luis Franzini
  • 20. Generación de datos de Ground Truth con VIPER GT
  • 21.
  • 22. Modelado del fondo  Método: Mixture of Gaussians  Distinguir entre puntos estáticos y en movimiento (los valores bajos de energía son utilizados para construir el fondo mientras que los altos se descartan por la probabilidad de pertenecer a objetos móviles).
  • 23.
  • 24. Procesamiento multicamara Cada cámara arroja: estimación + incertidumbre sobre la posición y categoría de cada “Target”. Se busca “combinar” de manera adecuada cada una de las medidas, para incrementar la precisión global del sistema. El resultado es enviado a un proceso que utiliza la restricción de cantidad de elementos por categoría para condicionar la salida del sistema. (este dato viene de una fuente externa al sistema)
  • 25. Procesamiento multicamara Nuevamente se utiliza el fitro de Kalman, pero ahora en el plano de la cancha. x = [x y '] T Vector de estados, posición y velocidad sobre el plano de la cancha: y x' z = [x y] Observaciones: T 1 0 T 0 0 1 0 T Aw =   1 0 0 0 0 0 1 0 Hw =      0 1 0 0 0 0 0 1
  • 26. Procesamiento multicamara Se construye una matriz de asociación (binaria) para cada cámaras: Targets X Observaciones 1 indica una asociación entre el 1  0 1  0 Target y la observación. 1  0 0 10 0 0  0 0 no hay asociación. 0  0 0 01 0 0  1 0  1 0  1 Se calcula utilizando la mínima distancia de Mahalanobis y el algoritmo del vecino mas cercano
  • 27. Procesamiento multicamara Hasta aquí, seria la salida de una aplicación típica de seguimiento. Pero… nosotros conocemos el numero “correcto” de elementos que el sistema debe retornar. Podemos “condicionar” la salida global para usar esta información. => MAP
  • 29. Creación y muerte de los targets Las observaciones que no son asociadas con ningún target activo, son potenciales nuevos targets. Se utiliza el numero de cámaras esperado que “observan” el nuevo target para decidir y la “antigüedad” en cuadros. La creación o muerte de Targers , una vez que el sistema llega al numero esperado, es un evento que no debe ocurrir con frecuencia.
  • 30.
  • 31. Performance SingleView A los videos de entrada, los etiquetamos manualmente mediante el ViperGT en sus posiciones y categorías correctas y lo comparamos con el XML salida del sistema utilizando ViperPE. La presentación de resultados se da mediante Presicion & Recall.
  • 33. Algunos números…. ISSIA DATASET La “Precision" es de 60/69 es decir un 86 % esto se podrá interpretar como que de los 69 objetos a testear en el archivo xml de salida del sistema, se pudieron “matchear” o encontrar correspondientes a 60 de ellos con objetos en el archivo de GT. El “Recall" es de 37/76, es decir que de los 76 objetos test registrados como verdaderos en el archivo de GT solamente se asignaron 37 de ellos (es decir para 37 de esos objetos test se encontró correspondiente en el archivo xml de salida del sistema).
  • 34. Para que mostrar un resultado intermedio ? 1) Necesidad de investigar como esta evolucionando la performance por cámara al modificar parámetros de diseño. 2) Comparar como afectan los esquemas de clasificación de categorías a los esquemas de localización espacial. 3) Tener una idea mas precisa sobre como mejora la performance final al integrar todas las cámaras, mediante la sencilla comparación de la performance intermedia y la final. Esto nos demuestra que efectivamente tener varias cámaras distribuidas espacialmente de forma conveniente nos facilita la resolución del problema, pudiendo integrar información proveniente de varias cámaras y ponderando dicha información entre ellas para resolver los principales problemas (falsas detecciones, oclusiones mal resueltas, etc..) y así aumentar la performance final del problema propuesto.
  • 35. Resultados de Multiview Hablar de los resultados de esta etapa es hablar del rendimiento del sistema en general. La idea es: Contar el numero de elementos detectados en cada categoría cuadro a cuadro y compararlo con el esperado. El numero de objetos detectados en un buen indicador del rendimiento del sistema.
  • 36. Resultados de Multiview 3000 cuadros del dataset ISSIA Cuadro1 12,8453 Cuadro2 12,8225 Abrbitros 2,2460 Golero1 0,8977 Golero2 1,1140
  • 37. Resultados de Multiview Un numero levemente superior al esperado en la cantidad de jugadores, se explica porque el sistema tiende a “continuar” los tracks. Los líneas no son tomados por las cámaras. En esta secuencia, uno de los arqueros es mal clasificado, dada su similitud con la camiseta de los jugadores de cancha.
  • 38.
  • 39. Conclusiones Se adquirió experiencia y conocimiento en las técnicas utilizadas, hasta llegar a dominarlas y poder integrar las soluciones parciales a la solución global. El prototipo construido nos permitió probar que una solución al problema es técnicamente factible y realizable. Creemos que el conocimiento adquirido en el área del problema, los obstáculos y problemas que tuvimos que sortear para llegar a este punto, son en definitiva, el real valor de proyecto
  • 40.
  • 41. Que cosas identificamos como futuras mejoras a la solución ? 1) Flujos de datos: Problema actual: El principal problema es que el “parser" de los archivos XML no accede secuencialmente a la información, sino que carga en memoria todo el archivo. Esto se traduce en cientos de MB en memoria RAM !!!. Posible solución: La primera solución para este problema es sustituir el “parser" que utiliza VIPER por alguno que acceda secuencialmente a la información. Otra solución mas comprometida, seria eliminar completamente el uso de archivos XML y utilizar una base de datos en la que la primera etapa inserte y la segunda etapa acceda a leer.
  • 42. Que cosas identificamos como futuras mejoras a la solución ? 2) Movimiento de cámara y sombras: Problema actual: El principal problema con el movimiento de la cámara es la falsa detección de las líneas del campo de juego. Mientras que las sombras de los jugadores producen una mala segmentación (la sombra también se mueve ! ) Posible solución: Crear un bloque del sistema que se encargue de la estabilización total del video y que elimine las sombras de los jugadores.
  • 43. Que cosas identificamos como futuras mejoras a la solución ? 3) Otras mejoras identificadas a implementar: 3.1) tracking al balón . 3.2) clasificación de categorías SingleView mas inteligente ( no en todos los frames del video para un mismo objetivo) 3.3) Automatización en el proceso de modelado de fondo (extracción periódica y automática del Background) 3.4) Aspectos de arquitectura global que nos permitan acercarnos aun mas al limite de tiempo real. Entre otros….

Notas del editor

  1. Cada componente resulve un aspecto especifico del problema. Los componentes son invocados en orden , por otro componente “Controller”