Brindar a las Empresas de seguridad y administradoras de condominios, una plataforma para gestionar las cámaras de seguridad instaladas en sus clientes, utilizando algoritmos de machine learning
2. Hola!
Somos:
Ing. Yury Romero Anaya
Equipo de Tecnología Operación Comercial Perú en Belcorp
Ing. Christian Valdiviezo Altamirano
Responsable de la Unidad de Prevención de Fraude y Riesgo
Operacional en Grupo GSS
5. PLANTEAMIENTO DEL SISTEMA
#BIGDATASUMMIT2018
Idea de Negocio:
Brindar a las Empresas de seguridad y administradoras de condominios,
una plataforma para gestionar las cámaras de seguridad instaladas en
sus clientes, utilizando algoritmos de machine learning y mediante las
cámaras de seguridad, se reconozca al residente registrado, de no
estarlo se activan alertas y notificaciones al centro de control.
6. PLANTEAMIENTO DEL SISTEMA
#BIGDATASUMMIT2018
Registro de Residentes:
Datos de Residentes y
Visitantes en base de datos
Imágenes y Videos.
Detección de
rostros y Extracción
de Características
Captura de las
imágenes en Streaming
1
2
3
7. PLANTEAMIENTO DEL SISTEMA
1. Llegada del
visitante al
ingreso de la
residencia
2. Cámara
captura imagen
del rostro
3. Se aplica el
algoritmo de
reconocimiento
facial
4. Compara el rostro
capturado con los
de la base de datos
5. Plataforma
Verfica si
visitante esta
registrado o no
7. Se brinda el acceso al residente o se realiza el registro del visitante
6. Envío de alertas al centro de control o algún tipo de notificación
Monitor Reconocimiento Facial
8. DESARROLLO DEL SISTEMA
Modelo de Machine Learning:
Se utiliza OpenCV, que es una biblioteca libre de visión artificial, además
FaceNet que es una red neuronal convolucional diseñada por Google,
entrenada para resolver problemas de verificación, reconocimiento y
agrupamiento de manera eficiente de rostros.
Fase 1
Haar Cascades Fase 2
CNN FaceNet
(*) Local Binary Patterns Histogram: http://www.scholarpedia.org/article/Local_Binary_Patterns
Local Binary Patterns
9. DESARROLLO DEL SISTEMA
Fase 1:
Detección y
Captura de Rostros
(Generación de
Datasets)
Fase 2:
Entrenamiento
(Generación del
modelo)
Fase 3:
Reconocimiento
de Rostros
Base de Datos
Lenguaje de
Programación
Librería
Visión
Artificial
Librería
Aprendizaje
Automático
API
Redes
Neuronales
10. DESARROLLO DEL SISTEMA
CNN FACENET:
Capa Pooling
Red Convolucional Profunda
Capa Convolucional
Capa Fully-connected
11. DESARROLLO DEL SISTEMA
CNN FACENET (*):
(*) FaceNet: A Unified Embedding for Face Recognition and Clustering - Schroff, Kalenichenko y Philbin - 17 Jun 2015
Redes Siamesas:
Triplet Loss:
12. “
Precisión
CNN FACENET logró una precisión de
99.63% con el dataset Faces in the Wild
(LFW) y con YouTube Faces DB logró el
95.12%.
“
(*) FaceNet: A Unified Embedding for Face Recognition and Clustering - Schroff, Kalenichenko y Philbin - 17 Jun 2015
CHRISTIAN
Aquí presentar la idea del proyecto, basados en una necesidad de seguridad de las viviendas
Yury
Enfocar la idea, el segmento de negocio esta bien demarcado
Se puede reducir el personal para monitorear accesos
Yury
Enfocar la idea, el segmento de negocio esta bien demarcado
Se puede reducir el personal para monitorear accesos
Yury
Las alarmas o notificaciones son configurables en la plataforma (envio de SMS o Emails)
Christian
FaceNet aprende una red neuronal que codifica una imagen en un vector de 128 valores.
Yuri
Indicar los principales beneficios de cada componente
Christian
Experimentaron con muchas dimensionalidades y eligieron 128-D, ya que fue el de mejor rendimiento.
La selección correcta de triplete es crucial para la convergencia rápida. La principal limitación con respecto al tamaño del lote, sin embargo, es la forma en que seleccionamos los trillizos durables relevantes dentro de los mini lotes.
Christian
La parte más importante de FaceNet reside en el aprendizaje integral del sistema.
la distancia entre todas las imágenes de la cara de la misma identidad es pequeña, mientras que la distancia entre un par de imágenes faciales de diferentes identidades es grande.
la pérdida de triplete también trata de imponer un margen entre cada par de caras de una persona (ancla y positivo) a las caras de los demás. Este margen impone la discriminación a otras identidades.
En lugar de elegir el positivo "más difícil" para un anclaje determinado, utilizaron todos los pares positivos de anclaje dentro del lote mientras se siguen seleccionando los negativos duros (uno para corresponder a cada uno) ancla); lo hacen porque encontraron que esto conduce a una solución más estable y más rápida de convergencia.
Christian
Yuri
Yury
Se puede indicar que también se puede utilizar IoT, para controlar el acceso a las personas