1         Uso de 6D-Vision en la detección de riesgos de                  colisión automovilísticos.                      ...
2                                                                                     5 ESTIMACIÓN DE MOVIMIENTO PROPIO (E...
3Utilizando el mecanismo de visualización se logro determinar               posible riesgo en 0.2 segundos y a lo largo de...
4 Los miembros del grupo de investigación de Daimler                           la identificación de las señales de tránsit...
Próxima SlideShare
Cargando en…5
×

Uso de6-d vision en la deteccion de riesgos de colision automovilisticos

188 visualizaciones

Publicado el

trabajo subido bajo la autorizacion de Jorge Escobar

Publicado en: Tecnología
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
188
En SlideShare
0
De insertados
0
Número de insertados
1
Acciones
Compartido
0
Descargas
3
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Uso de6-d vision en la deteccion de riesgos de colision automovilisticos

  1. 1. 1 Uso de 6D-Vision en la detección de riesgos de colisión automovilísticos. Escobar H. Jorge, Universidad Politécnica Salesiana. jescobarh@est.ups.edu.ec dimensiones), en base a estos datos una computadora puede Abstract—This paper discusses the project "6D-vision" and realizar una advertencia al conductor, o como ya se estáhow is used in the automotive industry for the prevention of car realizando en campos de prueba, una modificación del cursoaccidents by stereoscopic detection of objects, analyzes the del vehículo evitando el incidente.principle on which to base the concept of 6D vision and explainsthe mainly points at which the project works when analyzingimages in real time. El mecanismo estereoscópico de captura de imagen permite que las tomas se realicen en tres dimensiones, de esta forma se Index Terms- 6D vision, Optical Flow, Stereo Vision. puede disponer de la profundidad a la que se encuentran los objetos respecto a la fuente. 1 INTRODUCCIÓN Para procesar la información se realiza un muestreo (10000 puntos por imagen o incluso más) de forma que se puede llegar a predecir con total efectividad la posición de un punto dentroE n la búsqueda de minimizar los accidentes de tránsito relativos al tiempo de respuesta que una persona tiene alvolante, los investigadores Dr. Uwe Franke, Dr. Stefan Gehrig de los siguientes 0.5 segundos.y Dr. Clemens Rabe de la compañía alemana Daimler AG El tiempo necesario para que una persona que conduce(propietaria de marcas como Mercedes-Benz, Maybach y durante condiciones apropiadas reaccione ante un riesgo deSmart) trabajan en un proyecto llamado “6D-vision”, este colisión es de aproximadamente 500 milisegundos, mientrasproyecto busca mediante la utilización de cámaras el reconocer que el tiempo de reacción de un sistema de visión 6D es deposibles riesgos al momento en que el auto se encuentra aproximadamente 200 milisegundos, a esto se le debe sumar eldesplazándose, estos riesgos podrían ser peatones ciclistas o hecho de que el ojo humano no se percata de lo que sucede enbien otros vehículos; el sistema no solamente identifica objetos la totalidad de su campo visual sino que a diferencia de lasino q también realiza una predicción del desplazamiento que cámara suele enfocarse en una zona más pequeña.pudiese desarrollar uno de ellos en las cercanías, de forma quecualquier incidente pueda ser evitado o en el peor de los casos 3 VISIÓN ESTEREOSCÓPICAminimizar los resultados adversos. La visión estereoscópica (Stereo Vision) se basa en dosLa principal ventaja del un sistema como este se presenta en cámaras situadas una a la derecha y otra a la izquierda delsituaciones adversas de manejo, tales como entornos urbanos vehículo pero a una misma altura (similar a un par de ojos), locongestionados y cuando se presentan situaciones que se obtiene son dos imágenes con ligeras diferencia debidoclimatológicas desfavorables, situaciones en las que los a las posiciones de las cámaras, esta diferencia se conocetiempos de respuesta de una persona no solo se ven reducidos como disparidad y es lo que mediante el uso de algoritmos nossino que también pueden producir reacciones indeseadas. permite calcular la profundidad a la que se encuentra un objeto, puesto a que esta diferencia es menor mientras más 2 VISIÓN EN 6D lejos se encuentra de las cámaras. Para comprender más claramente el concepto de visión en Los investigadores de Daimler utilizan un algoritmoseis dimensiones podemos partir de un escenario de riesgo en estereoscópico llamado "Semi-Global Matching" (SGM) elel cual nos encontramos ante un eventual choque, para poder cual utiliza la disparidad entre imágenes vecinas, por lo tanto,tomar cualquier decisión con el fin de evitarlo es necesario realiza un paso de optimización para determinar laconocer la ubicación del objeto respecto a nosotros (estas profundidad. Este algoritmo determina la profundidad de casiserian las primeras tres dimensiones) y la magnitud dirección y todos los puntos de imagen en la escena con total precisión.sentido con que se está desplazando (serian las otras tres
  2. 2. 2 5 ESTIMACIÓN DE MOVIMIENTO PROPIO (EGO-MOTION). La estimación de movimiento de un sistema de cámaras que se encuentra dentro de un vehículo resulta ser un problema a resolver al momento de realizar la digitalización de los datos capturados, pues en un trayecto se pueden presentar cambios bruscos en los ejes de rotación y traslación del automóvil debido a caminos en mal estado (baches) o deslizamientos que se puedan producir, estos cambios en los ejes del vehículo representan un cambio en los ejes de las cámaras (pues se encuentran unidas a este) y se traducen en errores de percepción, pues se estima un movimiento que no es propio de los objetos distantes sino de las cámaras. Gracias a que hoy en día existen sensores de velocidad y rotación (incluso en el eje de la altura), se puede estimar deFig 1. Vista estereoscópica. Se puede apreciar la diferencia entre las 2 tomasrealizado por un conjunto estereoscópico; imagen superior, cámara izquierda; forma precisa el movimiento del automóvil en todos sus ejes,imagen inferior, cámara derecha. (http://www.6d- 6D-vision utiliza una rutina muy eficiente (desarrollada porvision.com/home/stereovision) Hernan Badino miembro investigador) que trabaja con los datos obtenidos por los sensores y la elección de unos pocos El algoritmo ha sido optimizado y desarrollado con el fin de puntos estacionarios en el campo visual de esta forma semantener un nivel de alto rendimiento por la noche y en determina con fiabilidad cuando se trata de un movimientocondiciones meteorológicas adversas. En 2008, en la primera propio o externo.prueba en tiempo real del algoritmo SGM se logro procesar las De esta forma se consolidan los puntos estáticos, y aquellosimágenes estereoscópicas 25 veces por segundo. Con esta errores que se presenten pueden ser minimizados medianteimplementación, cualquier objeto de hasta 50 metros de mecanismos de filtrado de datos.distancia se podía detectar y medir. Si se tiene en cuenta que lacapacidad de visión estéreo humana está entre 10-12m, se 6 RECONOCIMIENTO Y EVASIÓN DE RIESGOS.percibe una gran ayuda al detectar riesgos. Para reconocer cualquier riesgo los investigadores de Daimler trabajan determinando el riesgo de choque con cada 4 FLUJO ÓPTICO. punto del objeto que se aproxima, de tal forma que se puede predecir un choque antes de que la totalidad del cuerpo sea visible, a diferencia de otros métodos que primero identifican la totalidad del cuerpo y luego predicen su movimiento este método realiza la predicción de un punto y el conjunto de todos estos puntos va formando el cuerpo que deseamos evadir.Fig 2. Flujo óptico. Vectores de desplazamiento de vehículos en una curvacerrada. (http://www.6d-vision.com/home/optischerfluss) La percepción de movimiento de los objetos alrededor delvehículo es crucial para el concepto de 6D-Vision, por elloresulta necesario analizar con precisión y velocidad el llamadoflujo óptico (Optical Flow), pues este representa eldesplazamiento que tiene cada punto o pixel durante unasecuencia de imágenes, el principal problema resultante delcálculo del flujo óptico se da en que alrededor del vehículo yen zonas como curvas los desplazamientos que se dan resultanmás grandes, por lo se debió perfeccionar el algoritmo de talforma que dichos desplazamientos puedan ser computados entiempos relativamente bajos, a un bajo costo, con una altavelocidad del vehículo e incluso en condiciones climatológicasadversas, se logro con esto crear un sistema que indica losvectores de desplazamiento del cuerpo a base de colores,indicando los colores más cálidos (el rojo por ejemplo) lacercanía del objeto, y los más fríos (verde o azul) que el objeto Fig 3. Predicción de desplazamiento. Vectores de desplazamiento de un vehículo que aparece abruptamente. (http://www.6d-vision.com/home/4)se encuentra más lejano.
  3. 3. 3Utilizando el mecanismo de visualización se logro determinar posible riesgo en 0.2 segundos y a lo largo de todo el campouna escala básica en la que el color rojo representa un choque visual de la cámara, es decir, se tiene un tiempo deinminente, el amarillo un posible riesgo y el verde ninguna identificación de riesgos menor y con una capacidad visualposibilidad de choque. más elevada, esto abre un campo muy amplio en la asistencia al conductor.El modelado de objetos se realiza por agrupación de vectoresde desplazamiento conforme el cuerpo se acerca al vehículo, Entre las medidas que se presentan para evitar una posiblepara objetos como autos y ciclistas resulta necesario filtrar la colisión no solo se encuentra el uso de un freno de emergencia,información con el objetivo de poder determinar condiciones sino también la posibilidad de realizar una maniobra de girocríticas y no críticas de choque pues estas son dependientes de rápido, que permite seguir en movimiento para no provocarla velocidad, rotación e incluso la masa propia de cada uno, lo una colisión con los autos que se localizan posteriores alcual va a variar la intensidad de la respuesta que el sistema nuestro.presente al momento de tomar una decisión evasiva. 6.1 RECONOCIMIENTO DE PEATONES.El sistema debe prever posibles giros inesperados q puedenconvertir las condiciones normales de manejo en condiciones Cuando el sistema de asistencia reconoce un objeto este buscade choque inminente. establecer si es un peatón o no lo es, este filtrado de información debe realizarse pues no solo se corre el riesgo de provocar un daño mayor (este no se encuentra dentro de ningún vehículo que pueda ayudarle a soportar el impacto), sino también para poder establecer la estrategia adecuada en función de la ubicación y velocidad (como ya se dijo antes uno de las opciones en las que se trabaja es la de girar y esquivar al individuo y no solo frenar) Con este propósito lo que se hace es utilizar “clasificadores” (emparejadores de formas) los cuales son entrenados con varios ejemplos de peatones. Esta técnica es similar a la que se utiliza al tratar de distinguir las señales de tránsito, sin embargo el estándar de las señales de tránsito se encuentra mejor definido que el de las personas; la identificación de peatones presenta dificultades por los cambios que estas presentan, entre otros tenemos:  Todos los peatones visten de distinta manera, por lo que las formas que presentan varían.  Dependiendo de la velocidad con que se mueva una persona y la dirección en que esta está mirando y moviéndose, la forma en la que se la perciba cambiará.  En algunas zonas los peatones se encuentranFig 4. Prueba de maniobra evasiva. Maniobra evasiva automática accionada cubiertos por otros objetos por lo que es necesariopor un sistema 6D-Vision. (http://www.youtube.com/watch?v=MrNVkiiKDUo&feature=player_embedded) que el sistema se encuentre en la capacidad de reconocer una parte visible de un peatón.La mayoría de los accidentes de tránsito que se presentan en  Si existe varias personas se encuentran agrupadas,las ciudades se pudiesen evitar si el conductor mirase justo en esta formación puede producir una clasificaciónel momento preciso en la dirección indicada, sin embargo el errónea.ojo humano solo logra enfocarse en una pequeña área del totalde su campo visual, esto se compensa realizando cambiosconstantes y rápidos en la dirección en la queobservamos(cerca de 2 cambios por segundo), dejando unagran área ciega durante tiempos cortos incluso para elconductor más atento (no se diga para quienes realizan más deuna actividad al volate); el sistema 6D-Vision detecta un
  4. 4. 4 Los miembros del grupo de investigación de Daimler la identificación de las señales de tránsito, incluso en palabrasconsideraron la información provista por los métodos estéreo del mismo Franke (investigador del proyecto) “queremos quede adquisición de datos para lograr mejorar la funcionalidad entienda lo que sucede si un ciclista hace una señal con elde los clasificadores antes mencionados, esta suma de modelos brazo izquierdo. Ése es el gran desafío para el futuro”.de peatones y datos en tiempo real de velocidad y tamañomejora considerablemente la distinción de personas. Otras grandes empresas de la industria automotor cuentanEn la imagen a continuación se muestra un ejemplo, mientras también con sistemas de asistencia al conductor, por ejemploque la imagen del clasificador de pareo muestra una forma más Audi, Ford, Skoda y Mazda ya han construido autos quedifusa, aquella en la que se sobrepondrán los datos de realizan las maniobras al estacionar un vehículo, dejando alvelocidad y sentido resulta más distinguible. conductor únicamente la responsabilidad de aplicar la aceleración necesaria al auto, estos sistemas incluso eligen el lugar apropiado para estacionarse y si el vehículo se mueve a una velocidad muy alta el sistema se desactiva; evidentemente estos sistemas representan una gran ayuda al conductor, sin embargo no vienen instalados en todos los vehículos que se construyen además del elevado costo que tendrían aquellos en los que se planea instalar estos sistemas. Pese a tantas ventajas existen ciertos problemas retrasan proyectos de este tipo, y es que dada la necesidad del procesamiento de tanta información es necesaria la optimización de los procesos lo máximo posible, eso incluye en gran medida el espacio utilizado, y la energía que se consume, siendo estos los principales inconvenientes con los que se han encontrado los investigadores (no todos los autos en el mercado no presentas los mismos espacios que los utilizados en la investigación), no podemos olvidar que se trataFig 5. (Izq.) peatón visto mediante la percepción estereoscópica, (der.) el de una industria que busca dar confort y bienestar, ymismo peatón identificado por el algoritmo clasificador. (http://www.6d- sobreponer la tecnología podría repercutir en las ganancias devision.com/aktuelle-forschung/pedestrian-recognition) la empresa.Los algoritmos de flujo óptico pueden potenciar aun mas a losclasificadores, pero resulta necesario trabajar también en la BIBLIOGRAFÍApredicción de si un peatón va a cruzar o no, un hecho que C. Rabe, U. Franke, S. Gehrig: “6D-Vision”, página oficial del proyecto, Disponible en: http://www.6d-vision.com/puede ir incluso más allá de la técnica (cayendo en el campodel comportamiento humano) pero que también es analizado H. Hirschmüller: "Accurate and Efficient Stereo Processing by Semi-por los investigadores. Global Matching and Mutual Information", in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 20-26 June 2005, San Diego, CA, USA, Volume 2, pp. 807-814. Disponible en: 7 CONCLUSIONES http://www.robotic.dlr.de/fileadmin/robotic/hirschmu/cvpr05hh.pdf C. Rabe, U. Franke, S. Gehrig: “Fast detection of moving objects inProyectos como 6D-Vision representan un gran avance en el complex scenarios”, IEEE Intelligent Vehicles Symposium IV 2007, Istanbulcampo de la industria automotriz y el procesamiento de Disponible en: http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumberimágenes, no solo tiene como objeto el ser una herramienta de =4290147apoyo para el conductor sino que también busca salvar vidas al T. Müller, J. Rannacher, C. Rabe, U. Franke: „Feature- and Depth-poder tomar la decisión en casos de riesgos inminentes en los Supported Modified Total Variation Optical Flow for 3D Motion Fieldque la persona que se encuentra manejando puede Estimation in Real Scenes", IEEE CVPR 2011, Colorado Springs, 20.-25.Junisimplemente no saber cómo actuar. 2011; Disponible en: http://www.6d-vision.de/9- literatur/mueller_cvpr11/mueller11_cvpr11.pdf?attredirects=0&d=1A pesar de que aun no se encuentra equipado en ningún auto,el proyecto avanza con ganas de expandirse mas allá de lo Escobar H. Jorge Estudiante de Ingeniería Electrónica de la Universidad Politécnica Salesiana, ingreso en el año 2009; graduado como bachilleralcanzado hasta la fecha, pues aunque de momento solo se técnico industrial en electricidad en el Colegio Técnico Salesiano, En latrabaja con el punto de vista del conductor es decir el ángulo ciudad de Cuenca en la provincia del Azuay, En Ecuador en el año 2006.frontal de visión (entre los 50°), este busca ampliar la zona deanálisis de forma que se cubra la totalidad del vehículo (esdecir 360°) tratando de evitar colisiones laterales oposteriores; otro de los aspectos en los que se aspira llegar es a

×