En la charla realizada por Néstor Campos de Metric Arts (https://metricarts.com/), nos presentaron su producto Video Analytics y cómo utilizan Algoritmos de Machine Learning, junto a procesos y modelamientos de Visual Computing para poder realizar seguimiento de objetos y personas a través de video.
3. Analytics & Data Science
Estadística Programación
Investigación
Operativa
Analítica
Predictiva
Data Analytics corresponde al descubrimiento,
interpretación y comunicación de patrones útiles en los
datos, con el objetivo de describir, predecir y mejorar el
performance en aquello que se estudia, basándose en
datos registrados. Las observaciones que se buscan
corresponden a hechos que conocemos o sabemos no
conocer.
4. Analytics & Data Science
Data science es un paradigma también conocido como la
“ciencia dirigida por los datos” y corresponde a un campo
interdisciplinario que agrupa una serie de procesos
científicos y técnicas para obtener conocimiento a través
del estudio de los datos (estructurados o
desestructurados), respecto a hechos que no sabemos no
conocer.
Estadística
Machine
Learning
Minería de
Datos
Analítica
Predictiva
11. ¿Qué queremos que ML haga?
• Dada una imagen, predecir patrones complejos de nivel superior
Reconocimiento Detección Segmentación
“Gato”
[Martin et al., 2001]
12. Tipos de Machine Learning
• Aprendizaje supervisado
El sistema aprende en base a datos estructurados o no estructurados.
Clasificados previamente.
El algoritmo produce una función que establece una correspondencia
entre las entradas y las salidas deseadas del sistema.
13. Tipos de Machine Learning
• Aprendizaje no supervisado
Modelo se construye usando un conjunto de datos como entrada, los
cuales no han sido clasificados previamente.
El sistema tiene que ser capaz de reconocer patrones para poder
etiquetar las nuevas entradas.
14. Deep Learning
• Deep learning o Aprendizaje profundo corresponde
a un conjunto de métodos de machine learning
basados en el aprendizaje de representaciones de
los datos.
• Deep neural networks o redes neuronales profundas
son el caso más conocido. Uso de redes neuronales
artificiales y arquitectura con múltiples capas.
15. Impacto real
• Los sistemas construidos con DL logran altos rendimientos
en muchas tareas y múltiples dominios
Image recognition
[E.g., Krizhevsky et al., 2012]
Speech recognition
[E.g., Heigold et al., 2013]
NLP
[E.g., Socher et al., ICML 2011;
Collobert & Weston, ICML 2008]
[Honglak Lee]
18. Chile presenta una condición favorable para
convertirse en un jugador relevante de Big
Data, ya que pronto capturará el 70% de los
datos astronómicos mundiales
Alma Project - Chile
19. La em pleabilidad en los
sectores de inf orm ática y
tecnologías de la
inf orm ación cr ecer á 13%
Mercado
Las tecnolog ías de la
inf orm ación son
esenciales para los
negocios de hoy.
Finanzas y m edicina
son los m ejor es
clientes .
Negocios
20. T - s h a p e d v s P i - s h a p e d
A l e x S z a l a y
Nueva camada
Profesionales del tipo T-shaped: Conocimiento general amplio y
poco profundo, pero con habilidades y conocimiento detallado de
una temática en particular.
Nuevos profesionales del tipo Pi-shaped: Conocimiento general
amplio, pero profundizar tanto en la temática de estudio y los
métodos estadísticos y computacionales.
21. T h e D a t a S c i e n c e V e n n D i a g r a m
D r e w C o n w a y ( 2 0 1 0 )
Programming
Exploratory analysis
Analytical thinking
Modeling
Domain knowledge
Business experience
23. Datos en Astronomía
• Desde la obtención del dato crudo hasta la generación de resultados en
forma de tablas y gráficos.
• Testigo del impacto del Big data en Astronomía: SDSS (1998) llena discos
duros de 8GB en 25 min.
Time span: 15 years
Area: 14.555 deg2
# Sources: 469.053.874
24. Dato procesadoDato crudo
Ciencia Guiada por los Datos
Jim Gray, investigador de Microsoft y pionero en bases de datos, hizo notar
que la Ciencia entró al cuarto paradigma: Data-driven Science
Muñoz et al. 2015
25. Visión Computacional
• Enseñar a las máquinas a ver e interpretar tal como lo hacemos los humanos.
• Proceso Interdisciplinario: Matemáticas, Física, Estadística, AI, procesamiento de
imágenes, reconocimiento de patrones.
27. Mayo 2016:
Premio top 50 innovaciones más
influyentes CORFO
Investigación e Innovación
28. Video Analytics
Física
Uso de conocimiento de
óptica para optimizar la
captura de imágenes según el
entorno.
Procesamiento de
Imágenes
Captura, detección y
clasificación de personas y
objetos presentes en el
video.
Machine Learning
Uso de Inteligencia Artificial y
entrenamiento de algoritmos
basados en reconocimiento
de patrones.
Data Science
Construcción de modelos
estadísticos y matemáticos
para generar información
valiosa.
Funcionalidades
Detección y seguimiento inteligente de
personas y objetos
Estimación de variables demográficas
(sexo, edad)
Estimación de largos de filas y tiempos
de espera
Generación de alertas en tiempo real
Identificación y comparación de
personas
Detección de patrones de
comportamiento (micro-expresión)
Generación de mapas de calor
31. Cloud Platform
Bases
Operacionales
Cámara con óptica
especializada
Repositorio
consolidado
Web App Analytics
Alertas
Cognitive
Services
Machine
Learning
On-premises
INTERNET
Procesamiento
on premise
Algoritmos de
Deep Learning
Datos agregados
Data Lake
Imágenes
Detalladas
Total Datos
Plataforma de
Reportería
Video Analytics
32. IOT
HUB
1
2
Registro Detecciones
como JSON en DB
MySQL
Deep Learning
Neural Network
Utilizando recursos de GPU, se ejecutan aplicaciones de Deep Neural Networks generadas en C++, entrenadas para detectar y clasificar los
elementos del contexto del caso (personas, vehículos, etc.). Los mismos procesos definen un “seguimiento inteligente” (track) de cada
elemento detectado, registrando comportamientos en el tiempo.
La información procesada en la etapa previa (flujo CPU->RAM->GPU->VRAM->RAM->CPU) es finalmente transformada en una serie de
datos en la forma de matrices de múltiples coordenadas, IDs e indicadores de estados, los que finalmente se llevan a una base de datos
escrita en una unidad de disco SSD.
VRAM
GPU
Flujo del proceso On-premises
33. 3
Algoritmos validan
condiciones de envío
Se genera una serie de procesos en Python, los que en forma paralela a los procesos de Deep Neural Network, definen zonas
(polígonos) según múltiples criterios, de forma de definir por ejemplo si una persona detectada está entrando o saliendo (cruce del
vector de movimiento sobre los polígonos). Finalmente esta información se filtra y entrega al proceso de IOT-HUB para su sincronización
on-line.
Flujo del proceso On-premises
34. Las funciones avanzadas como caracterización
demográfica o biometría, tienen relación con la
captura de una imagen de alta calidad además de
condiciones del entorno, como luminosidad y nivel
de oclusión. una imagen de frente, siempre
proporcionará una mayor cantidad de datos para
realizar estimaciones o comparaciones avanzadas
Si bien los algoritmos utilizados puedan compensar,
las condiciones reales presentan múltiples desafíos,
por lo que se recomienda contar con más de una
imagen de enrolamiento por persona y una
cantidad apropiada de cámaras para así cubrir la
mayor cantidad de circunstancias posibles.
Imágenes recomendadas para enrolamiento
Consideraciones para Demografía y Biometría
35. Consideraciones para Demografía y Biometría
De igual forma, la calidad de la imagen capturada (en
términos de tamaño y “limpieza” de la misma) resulta
fundamental
Se recomienda contar con imágenes de enrolamiento
con datos del rostro en espacios de 500x500/500x400
pixeles como mínimo, para asegurar la calidad en la
generación de una firma biométrica de calidad. La
comparación contra la captura desde una cámara en
tiempo real resulta ideal bajo las mismas condiciones,
pero pueden realizarse comparaciones apropiadas
contra rostros de hasta 200x200 pixeles.
Si bien resulta posible realizar comparaciones contra
imágenes de un tamaño inferior el impacto en términos
de la calidad de la comparación no lo hacen
recomendable
Tamaño rostro apropiado para enrolamiento y Generación de firma
Biométrica
Relación de una imagen de 100PX de alto
44. There are multiple online
courses about Data Analysis,
Data Science, Visualization,
Machine Learning,.
Tomar cursos en
línea
Conocim iento y cer tificados
45. Python and R are the most used
languages in data analysis. More
than 40 million users.
SQL is from 70’s but still very used
by many companies.
Aprender lenguajes
modernos
Lenguajes de Data -science
46. You can start from an already existing
projects and make small changes.
Look for public datasets and try new ways
to analyze and visualize data. Ask the right
questions.
Hacer proyectos
independientes
P r obar nuevas ideas
47. Github is a code hosting platform for
version control and collaboration. It
allows to create private and public code
repositories.
Start with simple projects and then move
to more complex projects in Github.
Revisar y desarrollar
código en Github
Com par tir códigos