Se creo un modelo para la reconstrucción visual 3D de un objeto. En el capítulo cinco está la propuesta de dicho modelo. Los objetos que lograron reconstruir fueron tres y son: un peluche, un cubo y un rostro humano.
Presentamos un algoritmo para la lectura de placas de automóvil. Proponemos un nuevo método de detección de la posición de la placa en una imagen, comparando sus resultados con el método de correlación. Explicamos la implementación de una red neuronal de tres capas entrenada con el algoritmo de retropropagación para el reconocimiento de letras y números. Proponemos un método de verificación para decidir si la imagen seleccionada es realmente una placa, y en caso de que no lo sea, buscar en otra zona.
Este documento presenta cuatro problemas relacionados con curvas de segundo grado, esferas e hipérboles. El primer problema implica dibujar una curva cuadrática de Bézier. Los problemas 2 y 3 implican dibujar esferas utilizando meridianos y en isometría respectivamente. El problema 4 implica dibujar una esfera de radio 50 utilizando circunferencias paralelas a alturas específicas y calcular sus centros y radios. El último problema implica dibujar un hiperboloide de un manto.
Este documento describe diferentes conceptos relacionados con el filtrado de imágenes, incluyendo relaciones básicas entre píxeles como vecindad, conectividad, camino y componente conexa. También describe distintos tipos de filtros y operaciones como aumento y reducción de contraste que se pueden aplicar a imágenes. Finalmente, introduce conceptos clave de filtrado de imágenes como filtros, funciones de transferencia y mejora o realce de elementos en las imágenes.
El documento presenta información sobre Carlos Andrés Días Tordecillas, un estudiante de Tecnología en Gestión Ambiental Industrial en el segundo semestre con código 11220010. El documento también describe brevemente cómo las actividades de concientización ambiental ayudan a crear conciencia sobre los problemas ambientales en el país y cómo es necesario que todas las actividades protejan el medio ambiente para que la comunidad se concientice sobre la importancia de cuidarlo.
El municipio de Río Viejo se encuentra ubicado a orillas del río Magdalena y está compuesto por una subregión plana bañada por ciénagas y lagos y otra subregión montañosa con el pico más alto llamado Cuchilla Cristal. Celebra ferias y fiestas en febrero en honor a la Virgen del Carmen con conciertos, deportes y eventos taurinos. Su economía se basa en la agricultura, ganadería, minería, comercio y pesca.
La Web es un conjunto descentralizado de redes de comunicación interconectadas que permite distribuir y acceder a información a través de Internet. Actúa como un punto de encuentro para los usuarios y ha evolucionado en su uso para unir las inteligencias de personas y objetos a fin de generar la toma de decisiones.
La Unión Europea ha acordado un paquete de sanciones contra Rusia por su invasión de Ucrania. Las sanciones incluyen restricciones a las importaciones de productos rusos de alta tecnología y a las exportaciones de bienes de lujo a Rusia. Además, se congelarán los activos de varios oligarcas rusos y se prohibirá el acceso de los bancos rusos a los mercados financieros de la UE.
El documento analiza el costo ambiental de la sobreexplotación de los recursos naturales como el agotamiento de las fuentes de agua potable debido a la contaminación y su uso agrícola excesivo, dejando a más de mil millones de personas sin acceso al agua. También discute el problema creciente de la basura doméstica, urbana y sanitaria que es difícil de gestionar para los gobiernos municipales.
Presentamos un algoritmo para la lectura de placas de automóvil. Proponemos un nuevo método de detección de la posición de la placa en una imagen, comparando sus resultados con el método de correlación. Explicamos la implementación de una red neuronal de tres capas entrenada con el algoritmo de retropropagación para el reconocimiento de letras y números. Proponemos un método de verificación para decidir si la imagen seleccionada es realmente una placa, y en caso de que no lo sea, buscar en otra zona.
Este documento presenta cuatro problemas relacionados con curvas de segundo grado, esferas e hipérboles. El primer problema implica dibujar una curva cuadrática de Bézier. Los problemas 2 y 3 implican dibujar esferas utilizando meridianos y en isometría respectivamente. El problema 4 implica dibujar una esfera de radio 50 utilizando circunferencias paralelas a alturas específicas y calcular sus centros y radios. El último problema implica dibujar un hiperboloide de un manto.
Este documento describe diferentes conceptos relacionados con el filtrado de imágenes, incluyendo relaciones básicas entre píxeles como vecindad, conectividad, camino y componente conexa. También describe distintos tipos de filtros y operaciones como aumento y reducción de contraste que se pueden aplicar a imágenes. Finalmente, introduce conceptos clave de filtrado de imágenes como filtros, funciones de transferencia y mejora o realce de elementos en las imágenes.
El documento presenta información sobre Carlos Andrés Días Tordecillas, un estudiante de Tecnología en Gestión Ambiental Industrial en el segundo semestre con código 11220010. El documento también describe brevemente cómo las actividades de concientización ambiental ayudan a crear conciencia sobre los problemas ambientales en el país y cómo es necesario que todas las actividades protejan el medio ambiente para que la comunidad se concientice sobre la importancia de cuidarlo.
El municipio de Río Viejo se encuentra ubicado a orillas del río Magdalena y está compuesto por una subregión plana bañada por ciénagas y lagos y otra subregión montañosa con el pico más alto llamado Cuchilla Cristal. Celebra ferias y fiestas en febrero en honor a la Virgen del Carmen con conciertos, deportes y eventos taurinos. Su economía se basa en la agricultura, ganadería, minería, comercio y pesca.
La Web es un conjunto descentralizado de redes de comunicación interconectadas que permite distribuir y acceder a información a través de Internet. Actúa como un punto de encuentro para los usuarios y ha evolucionado en su uso para unir las inteligencias de personas y objetos a fin de generar la toma de decisiones.
La Unión Europea ha acordado un paquete de sanciones contra Rusia por su invasión de Ucrania. Las sanciones incluyen restricciones a las importaciones de productos rusos de alta tecnología y a las exportaciones de bienes de lujo a Rusia. Además, se congelarán los activos de varios oligarcas rusos y se prohibirá el acceso de los bancos rusos a los mercados financieros de la UE.
El documento analiza el costo ambiental de la sobreexplotación de los recursos naturales como el agotamiento de las fuentes de agua potable debido a la contaminación y su uso agrícola excesivo, dejando a más de mil millones de personas sin acceso al agua. También discute el problema creciente de la basura doméstica, urbana y sanitaria que es difícil de gestionar para los gobiernos municipales.
Este documento compara Google Analytics y Alexa, dos herramientas de análisis web. Google Analytics es un servicio gratuito que ofrece información agrupada sobre visitantes, campañas de marketing, rendimiento de contenido y más. Alexa es una subsidiaria de Amazon que clasifica sitios web basados en el tráfico y proporciona estadísticas e historiales de visitas. Si bien ambas herramientas miden el tráfico, sus métodos y datos resultantes a veces difieren.
Este documento presenta una introducción al uso de Microsoft Power Point y la importancia de Internet para los negocios. Explica diferentes temas como hosting, páginas web, presentaciones y concluye resaltando la necesidad de estar informado sobre tecnología para evitar virus y estar actualizado. Recomienda investigar bien los servicios de hosting y estar al tanto de los avances.
La globalización ha conectado las redes agroalimentarias a nivel mundial, pero también ha generado externalidades negativas como la contaminación y el cambio climático que afectan a todos. Es necesario pensar de forma más sistémica para aprovechar los beneficios de la globalización y minimizar sus efectos negativos.
El documento presenta información biográfica y logros de Mahatma Gandhi, líder del movimiento de independencia de la India y pionero de la no violencia. Se detallan sus datos personales, su educación, familia, y su papel central en obtener la independencia de la India a través de tácticas no violentas como la desobediencia civil. También se mencionan algunas de sus frases célebres sobre la verdad, el amor y la no violencia.
Este documento describe las cuatro posibilidades de comunicación que supone la incorporación de las nuevas tecnologías de la información y la comunicación (NNTT) en el entorno educativo: 1) Mismo tiempo, mismo lugar; 2) Mismo tiempo, distinto lugar; 3) Distinto tiempo, mismo lugar; 4) Distinto tiempo, distinto lugar. Para cada posibilidad se provee un ejemplo de cómo podría implementarse en el contexto educativo.
Este documento presenta tres fotografías de un álbum familiar. La primera foto muestra a un niño mordiendo su vestido debido al hambre. La segunda foto captura una salida familiar en un día lluvioso donde el peinado del niño se desacomodó. La tercera foto retrata al niño en una pasarela de modas en una boda con su prima.
La agenda de trabajo de la Comisión de Hacienda y Especial del Presupuesto incluye el estudio de varias iniciativas relacionadas con la distribución de $400 millones de dólares, reformas a la Ley de la Corte de Cuentas, y la incorporación de fondos al presupuesto del Ministerio de Hacienda y FONAVIPO. También considera una exoneración de impuestos y el conocimiento de correspondencia enviada a la comisión.
El documento resume la decisión de un tribunal salvadoreño sobre una acusación de calumnia e difamación contra un funcionario público. El tribunal determinó que no era necesario que la víctima ejerciera su derecho de rectificación antes de presentar la acusación penal, y que el funcionario no gozaba de fuero constitucional. El tribunal concluyó que se cumplieron los requisitos formales para admitir la acusación.
Este documento resume la evolución de la licitación oficial en Castilla y León entre 2008 y el primer semestre de 2012, así como su distribución por administraciones. Muestra que la cantidad prevista, licitada y adjudicada ha ido disminuyendo desde 2008 debido a la crisis, y que la mayor parte de la licitación corresponde a la administración regional. También analiza cómo la crisis ha afectado al número de empresas y trabajadores en el sector de la construcción en la región.
Este documento presenta la primera unidad de un programa de química II sobre el suelo y sus nutrientes para las plantas. La unidad estudiará las propiedades de las sales en el suelo, incluyendo su clasificación, composición, solubilidad y capacidad de conducir electricidad. Los estudiantes aprenderán a identificar cationes y aniones en el suelo, representar y nombrar sales químicas, y explicar el comportamiento de las sales a través de modelos atómicos y de enlace iónico. La unidad se centrará en aumentar las
El documento presenta un resumen de dos páginas de un libro de texto sobre política y economía. Incluye definiciones de política, estado y administración pública según lo descrito en el libro, así como instrucciones para realizar actividades relacionadas con las definiciones de política de Platón y Aristóteles y su relación con la economía.
Selección de citas de: Luisa Alcalde, socia fundadora de Castilla y León Económica; Vidal Sasoon; Alfredo Vela, socio-director de Social Media TIC' & Training; Albert Einstein; y Alberto Cagigas, director de Castilla y León Económica.
El documento describe un evento de marketing para la marca Miele que busca encontrar la lavadora Miele más antigua de España. El evento incluirá un hospitality center, un fun park con juegos como carreras en bolas gigantes, y premios. El objetivo es promover la marca y generar publicidad a través de contenido compartido en redes sociales.
El documento describe el estilo de vida actual y cómo mejorarlo de manera sostenible. Explica que el estilo de vida actual se caracteriza por el consumismo, tráfico vehicular y alto consumo de energía y agua. Luego propone formas de mejorar como reducir el consumo de recursos, reutilizar el agua, reciclar, usar transporte público y educar a los niños sobre la ecología, lo que traería beneficios ecológicos, sociales y económicos.
Este documento describe el uso de redes neuronales profundas para la detección de objetos en imágenes aplicada a vehículos autónomos. Se entrenaron y compararon tres modelos Faster R-CNN para la detección de peatones y baches, utilizando diferentes inicializaciones de parámetros y extractores de características. Los modelos se probaron en una plataforma Nvidia Drive PX2 diseñada para investigación en conducción autónoma.
Este documento describe un proyecto de reconocimiento de figuras utilizando visión artificial. Presenta el diagrama general del programa, que incluye la entrada de imágenes, filtrado, conversión de color, umbralización, preselección, correlación de plantillas y decisión de salida. Explica cada bloque y los algoritmos utilizados como correlación de plantillas. El objetivo es reconocer figuras mediante el análisis de imágenes y proporcionar una salida de acción.
Este documento compara Google Analytics y Alexa, dos herramientas de análisis web. Google Analytics es un servicio gratuito que ofrece información agrupada sobre visitantes, campañas de marketing, rendimiento de contenido y más. Alexa es una subsidiaria de Amazon que clasifica sitios web basados en el tráfico y proporciona estadísticas e historiales de visitas. Si bien ambas herramientas miden el tráfico, sus métodos y datos resultantes a veces difieren.
Este documento presenta una introducción al uso de Microsoft Power Point y la importancia de Internet para los negocios. Explica diferentes temas como hosting, páginas web, presentaciones y concluye resaltando la necesidad de estar informado sobre tecnología para evitar virus y estar actualizado. Recomienda investigar bien los servicios de hosting y estar al tanto de los avances.
La globalización ha conectado las redes agroalimentarias a nivel mundial, pero también ha generado externalidades negativas como la contaminación y el cambio climático que afectan a todos. Es necesario pensar de forma más sistémica para aprovechar los beneficios de la globalización y minimizar sus efectos negativos.
El documento presenta información biográfica y logros de Mahatma Gandhi, líder del movimiento de independencia de la India y pionero de la no violencia. Se detallan sus datos personales, su educación, familia, y su papel central en obtener la independencia de la India a través de tácticas no violentas como la desobediencia civil. También se mencionan algunas de sus frases célebres sobre la verdad, el amor y la no violencia.
Este documento describe las cuatro posibilidades de comunicación que supone la incorporación de las nuevas tecnologías de la información y la comunicación (NNTT) en el entorno educativo: 1) Mismo tiempo, mismo lugar; 2) Mismo tiempo, distinto lugar; 3) Distinto tiempo, mismo lugar; 4) Distinto tiempo, distinto lugar. Para cada posibilidad se provee un ejemplo de cómo podría implementarse en el contexto educativo.
Este documento presenta tres fotografías de un álbum familiar. La primera foto muestra a un niño mordiendo su vestido debido al hambre. La segunda foto captura una salida familiar en un día lluvioso donde el peinado del niño se desacomodó. La tercera foto retrata al niño en una pasarela de modas en una boda con su prima.
La agenda de trabajo de la Comisión de Hacienda y Especial del Presupuesto incluye el estudio de varias iniciativas relacionadas con la distribución de $400 millones de dólares, reformas a la Ley de la Corte de Cuentas, y la incorporación de fondos al presupuesto del Ministerio de Hacienda y FONAVIPO. También considera una exoneración de impuestos y el conocimiento de correspondencia enviada a la comisión.
El documento resume la decisión de un tribunal salvadoreño sobre una acusación de calumnia e difamación contra un funcionario público. El tribunal determinó que no era necesario que la víctima ejerciera su derecho de rectificación antes de presentar la acusación penal, y que el funcionario no gozaba de fuero constitucional. El tribunal concluyó que se cumplieron los requisitos formales para admitir la acusación.
Este documento resume la evolución de la licitación oficial en Castilla y León entre 2008 y el primer semestre de 2012, así como su distribución por administraciones. Muestra que la cantidad prevista, licitada y adjudicada ha ido disminuyendo desde 2008 debido a la crisis, y que la mayor parte de la licitación corresponde a la administración regional. También analiza cómo la crisis ha afectado al número de empresas y trabajadores en el sector de la construcción en la región.
Este documento presenta la primera unidad de un programa de química II sobre el suelo y sus nutrientes para las plantas. La unidad estudiará las propiedades de las sales en el suelo, incluyendo su clasificación, composición, solubilidad y capacidad de conducir electricidad. Los estudiantes aprenderán a identificar cationes y aniones en el suelo, representar y nombrar sales químicas, y explicar el comportamiento de las sales a través de modelos atómicos y de enlace iónico. La unidad se centrará en aumentar las
El documento presenta un resumen de dos páginas de un libro de texto sobre política y economía. Incluye definiciones de política, estado y administración pública según lo descrito en el libro, así como instrucciones para realizar actividades relacionadas con las definiciones de política de Platón y Aristóteles y su relación con la economía.
Selección de citas de: Luisa Alcalde, socia fundadora de Castilla y León Económica; Vidal Sasoon; Alfredo Vela, socio-director de Social Media TIC' & Training; Albert Einstein; y Alberto Cagigas, director de Castilla y León Económica.
El documento describe un evento de marketing para la marca Miele que busca encontrar la lavadora Miele más antigua de España. El evento incluirá un hospitality center, un fun park con juegos como carreras en bolas gigantes, y premios. El objetivo es promover la marca y generar publicidad a través de contenido compartido en redes sociales.
El documento describe el estilo de vida actual y cómo mejorarlo de manera sostenible. Explica que el estilo de vida actual se caracteriza por el consumismo, tráfico vehicular y alto consumo de energía y agua. Luego propone formas de mejorar como reducir el consumo de recursos, reutilizar el agua, reciclar, usar transporte público y educar a los niños sobre la ecología, lo que traería beneficios ecológicos, sociales y económicos.
Este documento describe el uso de redes neuronales profundas para la detección de objetos en imágenes aplicada a vehículos autónomos. Se entrenaron y compararon tres modelos Faster R-CNN para la detección de peatones y baches, utilizando diferentes inicializaciones de parámetros y extractores de características. Los modelos se probaron en una plataforma Nvidia Drive PX2 diseñada para investigación en conducción autónoma.
Este documento describe un proyecto de reconocimiento de figuras utilizando visión artificial. Presenta el diagrama general del programa, que incluye la entrada de imágenes, filtrado, conversión de color, umbralización, preselección, correlación de plantillas y decisión de salida. Explica cada bloque y los algoritmos utilizados como correlación de plantillas. El objetivo es reconocer figuras mediante el análisis de imágenes y proporcionar una salida de acción.
Este documento presenta un proyecto de desarrollo de una aplicación de punteado digital. El objetivo principal es mejorar los algoritmos de punteado existentes mediante el uso de información 3D asociada a una fotografía 2D. El proyecto detalla los objetivos, trabajos previos, planificación, diseño, algoritmos utilizados, resultados y manuales. Explica también problemas encontrados y posibles mejoras futuras. El proyecto concluye que cumple con los objetivos planteados y ofrece una herramienta útil para artistas.
Este documento analiza los modelos de regresión lineal y regresión logística mediante un enfoque matemático riguroso. Primero, examina las hipótesis estadísticas subyacentes y los problemas de optimización derivados. Luego, cubre técnicas de regularización y el uso del descenso del gradiente para obtener los parámetros óptimos. Finalmente, explica métricas de evaluación de modelos y una metodología para encontrar modelos que generalicen bien con nuevos datos. El autor desarrolló un repositorio
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...CIMAT
El presente trabajo propone una metodología para la detección de objetos, utilizando descriptores SIFT para representar a un objeto y un esquema de vecino más cercano para identificar aquellos puntos sobresalientes en una escena que correspondan a un objeto, para posteriormente estimar la ubicación del mismo. El conocimiento de la ubicación de un objeto en la escena facilita la interacción con el usuario. En particular esta se realiza por medio de un sistema de Realidad Aumentada desarrollado como parte de nuestro trabajo de investigación, el cual funge de asistencia a visitantes de museos, particularmente el Museo del Templo Mayor de la Ciudad de México.
Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...Aileen Quintana
En éste trabajo se presenta un estudio basado en aplicaciones de procesamiento de imágenes médicas mediante la implementación de modelos deformables (“Snakes”). El objetivo de este trabajo de investigación es, determinar y caracterizar lesiones correspondientes a tumores del sistema nervioso central mediante el análisis del grado de irregularidad en sus bordes, obtenidos mediante imagenes de resonancia magnética nuclear. Para ello se emplearan técnicas de procesamiento digital de imagenes, las cuales comprenden métodos de segmentación de imágenes tales como: realce de imágenes, establecimiento de umbrales e implementación del método de Snake como contorno activo. Éste último, conforma las fronteras de la lesión al minimizar un funcional de energía, la cual ha sido representada en una serie temporal. Estudiaremos tanto la serie generada del funcional de energía, como el borde correspondiente al Snake una vez que ha conformado el borde de la lesión, mediante el uso de los conceptos de dimensión de correlación y de dimensión fractal respectivamente, los cuales, desde éste punto de vista, representan la herramienta mas eficiente para evaluar características de irregularidad en los bordes de las lesiones.
Para la realización del estudio se contó con un universo de 289 imagenes de resonancia magnética nuclear correspondientes a diversas lesiones del sistema nervioso central las cuales fueron organizadas y clasificadas, encontrandose sólo 19 imagenes correspondientes a tumores del sistema nerviosos central. A estas 19 imagenes se les practicó el procedimiento descrito anteriormente usando el programa Matlab, imágenes que ademas presentan las características particulares de ser estudios de corte axial y pesadas en T2.
Se obtuvo como resultado, la separación de las dos clases de tumores deseadas, por lo que la implementación de este método representa una buena aproximación para la evaluación de la malignidad en lesiones del sistema nervioso central encontrándose que las lesiones, tomando en cuenta la irregularidad presente en sus bordes, pueden ser clasificadas por su valor de dimensión como benignas o malignas. Se encontró que sólo para la dimensión de correlación es posible dicha clasificación pues los valores hallados para la dimensión fractal que se obtuvieron directamente de la figura del Snake no representan diferenciación alguna en el aspecto deseado para ésta clasificación o al menos para el número de imágenes empleadas en el estudio, no fue posible apreciar diferencia alguna. Se pudo observar un aumento del valor de la dimensión de correlación conforme aumenta la variabilidad de los valores de energía en los gráficos, lo cual significa un aumento del valor de la dimensión de correlación conforme aumenta la irregularidad en los bordes de las lesiones.
Este documento presenta una tesis doctoral sobre un sistema de gestión de bases de datos relacionales difusas multipropósito. Propone una ontología para la representación del conocimiento difuso que incluye sub-ontologías para la representación del catálogo extendido y el esquema de datos difusos. También describe la arquitectura del sistema implementado y casos de uso para la definición de datos y manipulación de datos.
Este documento presenta un análisis espacial utilizando R como un sistema de información geográfica. Explica cómo instalar y usar R y RStudio, y realizar operaciones básicas de datos espaciales como importar y exportar datos vectoriales y raster, así como operaciones de análisis espacial básicas para ambos formatos. Además, cubre temas como detección de puntos calientes, análisis de imágenes satelitales, elaboración de mapas e interacción con otros programas SIG.
Este documento presenta la tesis de Claudia Cruz Martínez para obtener el título de Ingeniera en Computación. La tesis describe el diseño y desarrollo de una aplicación de navegación automática reactiva para una silla de ruedas usando datos de profundidad del sensor Kinect y lógica difusa. La aplicación procesa la información de profundidad del Kinect para detectar la dirección con menor probabilidad de colisión expresada en grados, permitiendo movimientos suaves y reacciones ante obstáculos. La evaluación del sistema se realizó
Este documento presenta el diseño y construcción de una plataforma experimental de levitación magnética. Se describe el diseño del sensor de posición basado en un diodo emisor de infrarrojos y dos fototransistores acoplados mediante amplificadores operacionales. También se explica el diseño e implementación de un controlador proporcional derivativo para manipular la corriente del electroimán y mantener la esfera en la posición de referencia. Alternativamente, se implementó un control por modulación de ancho de pulso para reducir el calent
Este documento presenta el acta del veredicto del trabajo especial de grado de Juan Raúl Padrón Griffe, titulado "Generación fractal de diversos tipos de terrenos basada en síntesis de ruido". El trabajo fue defendido el 13 de mayo de 2015 ante un jurado en la Universidad Central de Venezuela. El jurado aprobó el trabajo especial de grado luego de la exposición oral y respuestas a preguntas.
Este documento presenta un libro sobre sistemas operativos. El libro está dividido en tres partes: 1) Sistemas operativos convencionales, 2) Sistemas operativos distribuidos, y 3) Casos de estudio. La primera parte cubre conceptos básicos de sistemas operativos como procesos, planificación, memoria y administración de dispositivos. La segunda parte se enfoca en sistemas operativos distribuidos. La tercera parte presenta casos prácticos para aplicar los conocimientos adquiridos. El documento incl
Este documento presenta un libro sobre sistemas operativos. El libro está dividido en tres partes: 1) sistemas operativos convencionales, 2) sistemas operativos distribuidos, y 3) casos de estudio. Incluye capítulos sobre procesos, planificación, memoria, multiprocesamiento y más. El prólogo y prefacio introducen el libro y sus objetivos de proporcionar conocimientos fundamentales sobre sistemas operativos de una manera accesible y práctica.
Este documento presenta un análisis de dos algoritmos para medir la similitud entre secuencias mitocondriales: el algoritmo de Needleman-Wunsch y el algoritmo de Weiner. El autor implementa estos algoritmos en MATLAB y los evalúa en términos de eficiencia espacial y de tiempo, usando una base de datos de ADN mitocondrial. El objetivo es determinar cuál algoritmo es más adecuado para este tipo de análisis genético.
Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...Edwin Rosario Gabriel
Este documento presenta un estudio experimental comparativo de métodos para estimar la orientación de un cuerpo rígido utilizando sensores inerciales. Describe los diferentes enfoques para representar la orientación y sus ecuaciones cinemáticas. Evaluó algoritmos de estimación determinísticos, estocásticos y observadores no lineales implementados en un DSP. Realizó pruebas en un robot industrial programado para rotaciones en tres ejes, comparando las estimaciones con los perfiles programados para validar la exactitud de cada método.
Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...Sotero Ordones
Este documento presenta un algoritmo iterativo avanzado para el análisis de interferogramas con corrimiento de fase aleatorio. El documento incluye una introducción a la metrología óptica y a la interferometría óptica. También describe métodos previos para el análisis de franjas como el método de transformada de Fourier y algoritmos como el de Carré y de mínimos cuadrados generalizado. Finalmente, presenta un nuevo algoritmo iterativo para resolver el problema de los mínimos cuadrados con corrimiento de fase aleatorio y discute técnic
Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...Jorge Tarlea
This project has consisted on designing and implementing a stereo vision system that is capable of estimating the distances to which some objects of interest are located.
The images acquisition system consists of two rewire cameras serial connected. The
software is implemented in C/C++ programming language, together with the OpenCV computer vision libraries. It is formed by two applications: the rest of them carries out the stereo calibration and the other one corrects the images, generates the disparity maps and calculates the distances.
Esta tesis presenta una metodología para estimar la orientación de superficies planares en escenas urbanas mediante el análisis de múltiples imágenes. El método implica delimitar las superficies planares en las imágenes, calcular homografías entre ellas y estimar la orientación a partir de la descomposición de las homografías. El documento describe el desarrollo de un sistema interactivo que permite al usuario delimitar las superficies y obtener sus orientaciones en cuatro etapas: relacionar imágenes, delimitar superficies,
Similar a RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA (20)
HPE presenta una competició destinada a estudiants, que busca fomentar habilitats tecnològiques i promoure la innovació en un entorn STEAM (Ciència, Tecnologia, Enginyeria, Arts i Matemàtiques). A través de diverses fases, els equips han de resoldre reptes mensuals basats en àrees com algorísmica, desenvolupament de programari, infraestructures tecnològiques, intel·ligència artificial i altres tecnologies. Els millors equips tenen l'oportunitat de desenvolupar un projecte més gran en una fase presencial final, on han de crear una solució concreta per a un conflicte real relacionat amb la sostenibilitat. Aquesta competició promou la inclusió, la sostenibilitat i l'accessibilitat tecnològica, alineant-se amb els Objectius de Desenvolupament Sostenible de l'ONU.
SOPRA STERIA presenta una aplicació destinada a persones amb discapacitat intel·lectual que busca millorar la seva integració laboral i digital. Permet crear currículums de manera senzilla i intuitiva, facilitant així la seva participació en el mercat laboral i la seva independència econòmica. Aquesta iniciativa no només aborda la bretxa digital, sinó que també contribueix a reduir la desigualtat proporcionant eines accessibles i inclusives. A més, "inCV" està alineat amb els Objectius de Desenvolupament Sostenible de l'Agenda 2030, especialment els relacionats amb el treball decent i la reducció de desigualtats.
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...AMADO SALVADOR
Descarga el Catálogo General de Tarifas 2024 de Vaillant, líder en tecnología para calefacción, ventilación y energía solar térmica y fotovoltaica. En Amado Salvador, como distribuidor oficial de Vaillant, te ofrecemos una amplia gama de productos de alta calidad y diseño innovador para tus proyectos de climatización y energía.
Descubre nuestra selección de productos Vaillant, incluyendo bombas de calor altamente eficientes, fancoils de última generación, sistemas de ventilación de alto rendimiento y soluciones de energía solar fotovoltaica y térmica para un rendimiento óptimo y sostenible. El catálogo de Vaillant 2024 presenta una variedad de opciones en calderas de condensación que garantizan eficiencia energética y durabilidad.
Con Vaillant, obtienes más que productos de climatización: control avanzado y conectividad para una gestión inteligente del sistema, acumuladores de agua caliente de gran capacidad y sistemas de aire acondicionado para un confort total. Confía en la fiabilidad de Amado Salvador como distribuidor oficial de Vaillant, y en la resistencia de los productos Vaillant, respaldados por años de experiencia e innovación en el sector.
En Amado Salvador, distribuidor oficial de Vaillant en Valencia, no solo proporcionamos productos de calidad, sino también servicios especializados para profesionales, asegurando que tus proyectos cuenten con el mejor soporte técnico y asesoramiento. Descarga nuestro catálogo y descubre por qué Vaillant es la elección preferida para proyectos de climatización y energía en Amado Salvador.
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)AbrahamCastillo42
Power point, diseñado por estudiantes de ciclo 1 arquitectura de plataformas, esta con la finalidad de dar a conocer el componente hardware llamado tarjeta de video..
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)codesiret
Los protocolos son conjuntos de
normas para formatos de mensaje y
procedimientos que permiten a las
máquinas y los programas de aplicación
intercambiar información.
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaAMADO SALVADOR
Descubre el catálogo general de la gama de productos de refrigeración del fabricante de electrodomésticos Miele, presentado por Amado Salvador distribuidor oficial Miele en Valencia. Como distribuidor oficial de electrodomésticos Miele, Amado Salvador ofrece una amplia selección de refrigeradores, congeladores y soluciones de refrigeración de alta calidad, resistencia y diseño superior de esta marca.
La gama de productos de Miele se caracteriza por su innovación tecnológica y eficiencia energética, garantizando que cada electrodoméstico no solo cumpla con las expectativas, sino que las supere. Los refrigeradores Miele están diseñados para ofrecer un rendimiento óptimo y una conservación perfecta de los alimentos, con características avanzadas como la tecnología de enfriamiento Dynamic Cooling, sistemas de almacenamiento flexible y acabados premium.
En este catálogo, encontrarás detalles sobre los distintos modelos de refrigeradores y congeladores Miele, incluyendo sus especificaciones técnicas, características destacadas y beneficios para el usuario. Amado Salvador, como distribuidor oficial de electrodomésticos Miele, garantiza que todos los productos cumplen con los más altos estándares de calidad y durabilidad.
Explora el catálogo completo y encuentra el refrigerador Miele perfecto para tu hogar con Amado Salvador, el distribuidor oficial de electrodomésticos Miele.
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
1. ´
RECONSTRUCCION VISUAL 3-D : UNA
PERSPECTIVA DEL SISTEMA
Guillermo Enrique Medina Zegarra
Orientador : Dr. Edgar Lobaton 1
Co-Orientador : Dr. Nestor Calvo 2
Tesis profesional presentada al Programa Profesional de
Ingenier´a Inform´tica (Ciencias de la Computaci´n)
ı a o
como parte de los requisitos para obtener el T´tulo Pro-
ı
fesional en Ingenier´a Inform´tica.
ı a
Universidad Cat´lica San Pablo (UCSP)
o
Arequipa - Per´u
Mayo de 2012
1
http://www.ece.ncsu.edu/people/ejlobato
2
https://plus.google.com/102163044101441746442/about
2. Dedico la presente tesis a Dios, sobre
todas las cosas, a mis padres y a mi ma-
m´ Beatriz.
a
3. Abreviaturas
2D Dos Dimensiones
3D Tres Dimensiones
CG Corte de Grafos
CNC Correlaci´n Normalizada Cruzada
o
IMPA Instituto de Matem´tica Pura y Aplicada
a
NCC Normalized Cross-Correlation
PD Programaci´n Din´mica
o a
SDC Suma de las Diferencias al Cuadrado
SVA Suma de los Valores Absolutos
TLD Transformaci´n Lineal Directa
o
3
4. Agradecimientos
Agradezco a Dios, a la Virgen Mar´ y a mi mam´ Beatriz por cuidarme y guiarme a lo
ıa a
largo de mi vida!
Agradezco a mis padres por haberme dado la oportunidad de estudiar en la mejor uni-
versidad del pa´ Ellos siempre estuvier´n conmigo en los momentos m´s dif´
ıs. o a ıciles en mi
vida personal y profesional.
Agradezco a la universidad, por haber contribuido en mi formaci´n profesional y humana,
o
en la carrera que estar´ pr´ximo a culminar. Porque durante mi estad´ en la universi-
e o ıa,
dad, ha permitido moldear en m´ un futuro profesional con una excelente formaci´n
ı, o
integral .
Agradezco a la familia Barrios Neyra, por todo el tiempo que me prest´ su c´mara digital
o a
e instalaciones de su casa, para llevar a cabo la presente investigaci´n.
o
Agradezco a las siguientes personas: Alex Cuadros, Alfredo Miranda, Alfredo Paz, Carlos
Leyton, Christian L´pez del Alamo, Cynthia Pinto, Edgar Lobat´n, Eduardo Tejada, Jes´s
o o u
Mena, John Branch, Jos´ Corrales-Nieves, Juan Carlos Gutierrez, Julio Guevara, Lu´
e ıs
Pareja, Marcel Lazo de la Vega, Nestor Calvo, Olga Senyukova, Regina Ticona y Russell
Stimpson por sus sabios consejos, sugerencias y/o cr´
ıticas constructivas. Los enumer´ en
e
orden alfab´tico seg´n el primer nombre.
e u
Agradezco a mi jurado: Ana Cuadros, Ernesto Cuadros y Raquel Pati˜o por su paciencia
n
y comprensi´n en la edici´n del presente documento de tesis, sin su apoyo esto no hubiera
o o
sido posible.
5. Resumen
El modelar una superficie 3D de un objeto a partir de sus dos im´genes
a
estereosc´picas tiene muchas aplicaciones, tales como: en el campo de los v´
o ıdeo
juegos, en la industria del cine y en las simulaciones de vuelo. El proceso se
basa en la recuperaci´n de la estructura 3D a partir de dos reproyecciones.
o
Una ventaja de generar un modelo de superficie, es permitir la manipulaci´n o
de los datos en un espacio tridimensional (por ejemplo, girar el objeto o crear
deformaciones del mismo) a fin de generar nuevos puntos de vista.
Una arquitectura f´ısica simple fue dise˜ada y creada, para llegar a con-
n
seguir la reconstrucci´n de la superficie de un objeto en donde la secuencia de
o
pasos fue la siguiente: calibraci´n de las c´maras a trav´s del m´todo de Zheng-
o a e e
you Zhang, para obtener la matriz de mapeamiento; rectificaci´n de ambas
o
im´genes, (vistas laterales), para conseguir una alineaci´n de las mismas; ha-
a o
llar los puntos correspondientes con la correlaci´n normalizada cruzada (CNC)
o
de ambas vistas laterales rectificadas; crear la nube de puntos a partir de la
triangulaci´n (intersecci´n) de los puntos correspondientes hallados en las dos
o o
im´genes rectificadas; crear la superficie de la nube de puntos a partir de la
a
triangulaci´n de Delaunay del mapa de disparidad procesado y, finalmente,
o
mapear la textura de la imagen derecha rectificada a la superficie creada de la
triangulaci´n de Delaunay del mapa de disparidad procesado.
o
6. Abstract
Modeling a 3D surface of an object through two stereo images has many
applications, such as: video games, movie flight simulation. The process is ba-
sed on the recovery of 3D structure from two reprojection. One advantage of
generating a surface model is to allow manipulation of data in three dimensio-
nal space ( i.e., rotate the object or create distortions ) to generate new points
of view.
A simple physical architecture was designed and created to be able to get
the reconstruction of the surface of an object where the sequence of steps was as
follows: calibration of the cameras with the Zhengyou Zhang method to obtain
the mapping matrix; rectification of both images (side views) to achieve an
alignment of the same; find the points corresponding to the normalized cross-
correlation (NCC) of the two side views rectified; creating a cloud of points
through the triangulation (intersection) of the corresponding points found in
the two rectified images; create the surface of the cloud of points from the
Delaunay triangulation of the disparity map processed and finally mapping of
the texture of the rectified right image to the surface created from the Delaunay
triangulation of the processed disparity map.
9. ´
INDICE GENERAL
7. Conclusiones y Trabajos Futuros 61
7.1. Recomendaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.2. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Ap´ndices
e 63
A. Caracter´
ısticas t´cnicas de las dos c´maras digitales
e a 64
B. Posiciones del tablero de ajedrez 67
C. Triangulaci´n de Delaunay en el plano 2D
o 69
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 9
10. ´
Indice de cuadros
4.1. Medidas de semejanza en Block Matching . . . . . . . . . . . . . . . . . . . 41
6.1. Par´metros usados para la reconstrucci´n de cada uno de los modelos. . . . 50
a o
6.2. Ajustes t´cnicos en las dos c´maras digitales. . . . . . . . . . . . . . . . . . 51
e a
A.1. Cuadros comparativos de las caracter´ ıstica t´cnicas entre las dos c´maras
e a
digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
A.2. Caracter´
ısticas de la imagen. . . . . . . . . . . . . . . . . . . . . . . . . . . 64
A.3. Caracter´
ısticas de la exposici´n. . . . . . . . . . . . . . . . . . . . . . . . . 65
o
A.4. Caracter´
ısticas de la ´ptica. . . . . . . . . . . . . . . . . . . . . . . . . . . 65
o
A.5. Caracter´
ısticas del flash. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
A.6. Caracter´
ısticas del control del disparo. . . . . . . . . . . . . . . . . . . . . 65
A.7. Caracter´
ısticas de la visualizaci´n. . . . . . . . . . . . . . . . . . . . . . . . 66
o
A.8. Caracter´
ısticas f´
ısicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
10
11. ´
Indice de figuras
1.1. Pintura pre-renacentista y renacentista. (a) Jes´s entrando a Jerusal´n y
u e
(b) La Escuela de Atenas [Ma et al., 2004]. . . . . . . . . . . . . . . . . . . 14
1.2. M´quina de perspectiva [Faugeras, 1993] . . . . . . . . . . . . . . . . . . . 15
a
1.3. (a) Dos vistas y (b) m´ltiples vistas [Hartley and Zisserman, 2004]. . . . . 15
u
1.4. (a) Posici´n de una sola c´mara; (b) iluminaci´n artificial para la adquisi-
o a o
ci´n de im´genes y (c) posici´n de m´ltiples c´maras [Zitnick et al., 2004].
o a o u a 16
1.5. ¿C´mo hallar los puntos correspondientes? [Szeliski, 2011]. . . . . . . . . . 17
o
3.1. Modelo de c´mara pinhole frontal [Ma et al., 2004] . . . . . . . . . . . . . 23
a
3.2. Modelo de c´mara pinhole [Ma et al., 2004] . . . . . . . . . . . . . . . . . . 24
a
3.3. Proyecci´n de perspectiva de un cuadrado [Bakstein., 1999] . . . . . . . . . 26
o
3.4. Proyecci´n de perspectiva de un c´
o ırculo [Heikkil¨ and Silv´n, 1997]
a e . . . . 29
3.5. Analisis geom´trico de dos vistas [Ma et al., 2004] . . . . . . . . . . . . . . 36
e
4.1. Las Figuras 4.1a y 4.1b de la primer fila son las im´genes originales del
a
sistema de visi´n est´reo; las Figuras 4.1c y 4.1d son las im´genes rectifi-
o e a
cadas. Los c´ırculos de color rojo representan a los puntos correspondientes
de ambos planos imagen y las l´ ıneas de color azul a las l´ ıneas epipolares
[Fusiello et al., 2000]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2. (a) y (b) son el par de im´genes correspondientes de Tsukuba y (c) mapa de
a
disparidad de ambas im´genes correspondientes [Scharstein and Szeliski, 2002]. 45
a
5.1. Pipeline de la propuesta de tesis. . . . . . . . . . . . . . . . . . . . . . . . 47
6.1. (a) Distancias entre las dos c´maras digitales y (b) dos tornillos, cuatro
a
volandas y dos mariposas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
11
12. ´
INDICE DE FIGURAS
6.2. (a) Posici´n frontal de ambas c´maras digitales y (b) visor de las dos c´-
o a a
maras laterales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.3. Dos posiciones del tablero de ajedrez. . . . . . . . . . . . . . . . . . . . . . 52
6.4. (a) Selecci´n de las cuatro esquinas de la Figura 6.3a; (b) detecci´n de los
o o
puntos internos de la Figura 6.3b. . . . . . . . . . . . . . . . . . . . . . . . 52
6.5. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas,
a e a
(e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 53
a
6.6. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri-
dimensional, (d) creaci´n de la superficie. . . . . . . . . . . . . . . . . . . . 54
o
6.7. (a) Suavizamiento de la superficie, (b) texturizaci´n de la superficie, (c)
o
vista de costado de la superficie texturizada. . . . . . . . . . . . . . . . . . 54
6.8. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas,
a e a
(e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 55
a
6.9. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri-
dimensional, (d) creaci´n de la superficie. . . . . . . . . . . . . . . . . . . . 56
o
6.10. (a) Suavizamiento de la superficie, (b) texturizaci´n de la superficie, (c)
o
vista de costado de la superficie texturizada. . . . . . . . . . . . . . . . . . 56
6.11. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas,
a e a
(e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 57
a
6.12. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri-
dimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.13. (a) Vista del costado del rostro sin suavizar, (b) vista de frente del rostro
sin suavizar, (c) vista del costado del rostro suavizado, (d) vista de frente
del rostro suavizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.14. (a) Reducci´n del ancho del rostro humano sin texturizar, (b) reducci´n
o o
del ancho del rostro texturizado, (c) vista frontal del rostro sin texturizar
y (d) vista frontal del rostro texturizaci´n. . . . . . . . . . . . . . . . . . . 59
o
6.15. (a) Reconstrucci´n fallida del “cubo m´gico” y (b) fen´meno de “gradas”
o a o
en la reconstrucci´n de la superficie del modelo del “cubo m´gico”. . . . . . 59
o a
6.16. (a) y (b) Im´genes originales defectuosas, (c) mapa de disparidad err´neo
a o
y (d) reconstrucci´n 3D amorfa del “cubo m´gico”. . . . . . . . . . . . . . . 60
o a
B.1. Treinta posiciones de tablero de calibraci´n. . . . . . . . . . . . . . . . . . 67
o
B.0. Treinta posiciones de tablero de calibraci´n (cont...) . . . . . . . . . . . . . 68
o
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 12
13. ´
INDICE DE FIGURAS
C.1. Conjunto de puntos (v´rtices) de P . . . . . . . . . . . . . . . . . . . . . . . 69
e
C.2. Ilustraci´n de la primera propiedad de Delaunay.
o . . . . . . . . . . . . . . 70
C.3. Ilustraci´n de la segunda propiedad de Delaunay. . . . . . . . . . . . . . . 70
o
C.4. (a) Arista ilegal y (b) correcci´n de la arista ilegal. . . . . . . . . . . . . . 71
o
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 13
14. Cap´
ıtulo 1
Introducci´n
o
1.1. Motivaci´n y contexto
o
En el mundo de las Bellas Artes (Arquitectura, Pintura, Escultura y M´sica) hasta
u
la ´poca del Renacimiento (Siglo XVI), los artistas no pod´ dibujar en un cuadro la
e ıan
profundidad de una escena, porque no hab´ los m´todos necesarios para lograrlo, al no
ıan e
existir las t´cnicas para conseguir la tridimensionalidad de una escena en una pintura.
e
Filippo Brunelleschi, Piero della Francesca, Leonardo da Vinci [DaVinci, 2005] y Albert
Durer, llevaron a cabo investigaciones sobre c´mo la visi´n del ojo humano observaba a
o o
un objeto. Dando origen a los puntos de fuga y a la m´quina de perspectiva [Mery, 2004].
a
En la Figura 1.1a se puede ver una pintura pre-renacentista sin un efecto 3D y en
la Figura 1.1b se observa que las l´
ıneas de color celeste convergen en un punto de fuga,
lo cual hace que la pintura tenga profundidad. Los puntos de fuga son rayos imaginarios
que llegan a converger en un solo punto.
(a) (b)
Figura 1.1: Pintura pre-renacentista y renacentista. (a) Jes´s entrando a Jerusal´n y (b)
u e
La Escuela de Atenas [Ma et al., 2004].
14
15. CAP´
ITULO 1. Introducci´n
o
En la Figura 1.2, se puede observar la m´quina de perspectiva, en donde, se visualiza
a
con claridad un punto fijo (punto de fuga), que corresponde a los ojos del artista, en el
cual, convergen todos los rayos (l´
ıneas de color rojo) del objeto. Tambi´n se puede ver un
e
plano que sirve de ayuda al dibujante, para hallar la relaci´n con el objeto.
o
Figura 1.2: M´quina de perspectiva [Faugeras, 1993]
a
Una de las funciones del cerebro humano es crear un escenario en 3D con la infor-
maci´n que percibe de ambos ojos. Llevar a cabo dicho proceso se conoce como visi´n
o o
estereosc´pica [Forsyth and J., 2002] y el area cient´
o ´ ıfica encargada, se conoce como visi´n
o
computacional [Faugeras, 1993] [Cipolla et al., 2010]. Un ejemplo cl´sico, para ver la di-
a
ferencia que percibe cada ojo, es situar el dedo ´ındice de cualquiera de sus dos manos a
una distancia no mayor de 5 cm. delante de su entrecejo, seguidamente cierra los dos ojos
y alternativamente abre y cierra cada ojo. Se observar´ que cada ojo tiene una percepci´n
a o
un poco distinta del dedo ´
ındice y que la distancia entre cada uno de los ojos es conocida
como disparidad binocular [Wildes, 1991].
La visi´n computacional puede reconstruir modelos [Vasudevan et al., 2011] a trav´s
o e
de dos, tres, cuatro o m´ltiples vistas [Ma et al., 2004] [Hartley and Zisserman, 2004] de
u
un mismo objeto; entre m´s im´genes (vistas) exista de un mismo objeto, mejor ser´ la
a a a
reconstrucci´n. En la Figura 1.3a se puede ver la nube de puntos de dos im´genes est´reo
o a e
tomadas a un edificio, y en la Figura 1.3b, se observa otra nube de puntos de un dinosaurio.
Dado que el segundo objeto, el dinosaurio, tiene m´ltiples im´genes o vistas, la nube de
u a
puntos del dinosaurio es mucho mejor a diferencia del primer objeto (el edificio).
(a) (b)
Figura 1.3: (a) Dos vistas y (b) m´ltiples vistas [Hartley and Zisserman, 2004].
u
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 15
16. 1.1. Motivaci´n y contexto
o
Cada una de las vistas puede representar a la misma c´mara o a diferentes c´maras.
a a
Cada c´mara debe estar correctamente posicionada y adecuadamente distribuida en una
a
arquitectura f´ısica [Cipolla et al., 2010]. La posici´n de cada c´mara es muy importante
o a
porque tiene informaci´n de la proyecci´n del objeto a reconstruir. La iluminaci´n na-
o o o
tural o artificial es otro de los problemas en la reconstrucci´n 3D de un modelo, porque
o
determina la intensidad de luz sobre la superfice del objeto.
En la Figura 1.4a se puede ver una imagen representativa de una sola c´mara que to-
a
ma varias im´genes a un buda, que est´ encima de una superficie plana giratoria. El buda
a a
tiene como fuente de iluminaci´n a un foco. En la Figura 1.4b se visualiza la iluminaci´n
o o
artificial para la adquisici´n de im´genes del laboratorio de fotograf´ computacional y v´
o a ıa ı-
deo del Instituto de Matem´tica Pura y Aplicada (IMPA) [VISGRAF., 2012]. En la Figura
a
1.4c se observa la posici´n y distribuci´n de m´ltiples c´maras sobre otro arquitectura
o o u a
f´
ısica [Zitnick et al., 2004].
(a) (b)
(c)
Figura 1.4: (a) Posici´n de una sola c´mara; (b) iluminaci´n artificial para la adquisici´n
o a o o
de im´genes y (c) posici´n de m´ltiples c´maras [Zitnick et al., 2004].
a o u a
Una de las ventajas de la Figura 1.4a es el uso de una superficie plana giratoria
debajo del objeto (buda). El uso de la superficie plana giratoria facilita una mayor preci-
si´n en el ´ngulo de giro del buda. Una desventaja de la Figura 1.4a es el uso de un solo
o a
foco hacia la superficie del objeto. El uso de una sola buj´ es un inconveniente, porque
ıa
no tiene una adecuada iluminaci´n sobre toda la superficie del objeto a reconstruir, dado
o
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 16
17. CAP´
ITULO 1. Introducci´n
o
que la distribuci´n de la iluminaci´n no es la correcta. En la Figura 1.4b hay una correcta
o o
iluminaci´n, porque se puede observar que hay un ambiente controlado con cuatro reflec-
o
tores, que est´n encerrados con un c´
a ırculo de color verde. Otra ventaja de la Figura 1.4b
es el uso de una franela de color negra, que est´ encerrado con un cuadrado de color rojo.
a
El uso de los cuatro reflectores y la franela negra ayudan bastante en el proceso de adqui-
sici´n de im´genes [Barnard and Fischler, 1982] [Gonz´lez and Woods, 1996], porque no
o a a
s´lo se tiene una adecuada iluminaci´n, sino que tambi´n, el uso de la franela negra ayuda
o o e
a eliminar el background del objeto a reconstruir. En la Figura 1.4c se puede ver que dos
tr´
ıpodes sujetan a ocho c´maras a trav´s de un pedazo de fierro. Al lado izquierdo de
a e
cada c´mara existe un cable, con el cual se logra la sincronicidad de las ocho c´maras en
a a
un solo instante de tiempo, consiguiendo con ello, tener varias vista del objeto a recons-
truir [Hartley and Zisserman, 2004]. Por lo tanto se concluye que es necesario tener una
adecuada arquitectura f´ ısica para el correcto posicionamiento, distribuci´n e iluminaci´n
o o
de la(s) c´mara(s).
a
1.2. Planteamiento del Problema
Un primer problema para la reconstrucci´n 3D de un modelo es dise˜ar y crear
o n
una arquitectura f´ısica para la correcta ubicaci´n e ideal distribuci´n de cada c´mara.
o o a
Por lo que, en la presente investigaci´n, se desea ubicar adecuadamente ambas c´maras
o a
sobre una arquitectura f´ısica, para la correcta adquisici´n [Barnard and Fischler, 1982] del
o
par de im´genes estereosc´picas. Se debe de tomar en cuenta una adecuada iluminaci´n
a o o
artificial o natural para el proceso de adquisici´n de im´genes. Un segundo problema es
o a
la calibraci´n de las c´maras [Salvi et al., 2002], lo que significa obtener los par´metros
o a a
necesarios [Heikkil¨ and Silv´n, 1997] para realizar el mapeamiento de un objeto al plano
a e
imagen.
En la Figura 1.5 se observa que el tercer problema, para la reconstrucci´n 3D de un
o
modelo, es saber c´mo hallar los puntos correspondientes [Szeliski, 2011] del par de im´-
o a
genes estereosc´picas. Llevar a cabo la correspondencia de los puntos correspondientes, es
o
un problema demasiado ambiguo y complejo [Forsyth and J., 2002], porque no es sencillo
determinar con precisi´n la correspondencia de dichos puntos, debido a la variaci´n de la
o o
intensidad luminosa, oclusi´n, ruido o textura [Cochran and Medioni, 1992].
o
Figura 1.5: ¿C´mo hallar los puntos correspondientes? [Szeliski, 2011].
o
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 17
18. 1.3. Objetivo general
Un m´todo estad´
e ıstico est´ndar [Mulligan and Daniilidis, 2001], en la b´squeda de
a u
similitudes de dos im´genes estereosc´picas, es la Correlaci´n Normalizada Cruzada (CNC)
a o o
[Ma et al., 2004].
Un cuarto problema es hallar la posici´n correcta de ambos puntos 2D correspon-
o
dientes en el espacio 3D (proceso de rectificaci´n y triangulaci´n) [Fusiello et al., 2000]
o o
[Hartley and Sturm, 1997]. El quinto problema es reconstruir [W¨hler, 2009] y suavizar
o
[Piegl and Tiller, 1997] la superficie a partir de la nube de puntos [Linsen, 2001] resultante
del problema anterior.
1.3. Objetivo general
Proponer un modelo para la reconstrucci´n de una imagen 3D de un objeto, a partir
o
de dos im´genes capturadas por dos c´maras ubicadas adecuadamente.
a a
1.4. Objetivos espec´
ıficos
1. Posicionar correctamente las dos c´maras digitales, en una arquitectura f´
a ısica, para
la adquisici´n de im´genes y calibraci´n.
o a o
2. Hacer la rectificaci´n de las im´genes, para calcular un adecuado mapa de disparidad
o a
a trav´s de la Correlaci´n Normalizada Cruzada.
e o
3. Crear la superficie del objeto a partir de la triangulaci´n de Delaunay del mapa de
o
disparidad.
1.5. Organizaci´n de la tesis
o
En el cap´
ıtulo 2 se hizo una descripci´n sobre el paradigma est´reo computacional
o e
y las etapas de la reconstrucci´n 3D de un modelo. En el cap´
o ıtulo 3 se habla sobre la
calibraci´n de las c´maras y el an´lisis bifocal. En el cap´
o a a ıtulo 4 se comenta sobre la
rectificaci´n y el c´lculo de disparidad. En el cap´
o a ıtulo 5 est´ descrita la secuencia de
a
pasos de la propuesta de tesis. En el cap´ ıtulo 6, se muestran las pruebas y resultados
obtenidos de los objetos utilizados. Finalmente, en el cap´ ıtulo 7 est´n las conclusiones,
a
recomendaciones y trabajos futuros.
En el ap´ndice A est´n las caracter´
e a ısticas t´cnicas de las dos c´maras digitales usadas
e a
en la presente investigaci´n. En el ap´ndice B est´n las treinta posiciones tomadas al
o e a
tablero de ajedrez, para la calibraci´n de la c´mara. En el ap´ndice C, est´n descritas las
o a e a
propiedades de la triangulaci´n de Delaunay en el plano 2D.
o
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 18
19. Cap´
ıtulo 2
Trabajos relacionados
2.1. Consideraciones Iniciales
Con el objetivo de contextualizar, entender los conceptos y trabajos relacionados en
la presente investigaci´n, este cap´
o ıtulo se ha dividido en dos secciones. En la primera se des-
criben los seis pasos del paradigma est´reo computacional [Barnard and Fischler, 1982].
e
En la segunda, se comenta sobre las etapas, en com´n, que tiene la reconstrucci´n 3D de
u o
un modelo [Hartley and Zisserman, 2004] [Ma et al., 2004] [Koch et al., 2000].
2.2. Paradigma est´reo computacional
e
El concepto de la reconstrucci´n 3D a trav´s de la visi´n computacional est´ definido
o e o a
como la recuperaci´n (reconstrucci´n) de las caracter´
o o ısticas (estructura) tridimensionales
de una escena a partir de dos im´genes (vistas) tomadas de diferentes puntos angulares
a
[Mery, 2004], y en donde el paradigma est´reo computacional [Barnard and Fischler, 1982]
e
envuelve los siguientes pasos:
1. Adquisici´n de im´genes.- Las im´genes est´reo pueden ser adquiridas o tomadas de
o a a e
diferentes formas, es decir, pueden variar con respecto al tipo de c´mara (marca), el
a
n´mero de c´maras, la posici´n de las c´maras, la distancia de las c´maras y la re-
u a o a a
soluci´n. Estas son algunas de las consideraciones que se deben de tener en cuenta en
o
el proceso de adquisici´n de las im´genes. La oclusi´n, iluminaci´n y la textura for-
o a o o
man parte de la complejidad del dominio de la escena [Barnard and Fischler, 1982].
2. Modelaci´n de las c´maras.- El modelamiento de las c´maras proyecta las caracter´
o a a ıs-
ticas geom´tricas y f´
e ısicas del mapeamiento de un punto 3D a coordenadas p´ ıxeles.
Seg´n [Weng et al., 2002] el proceso de calibraci´n de una c´mara tiene dos pasos.
u o a
El primer paso es una transformaci´n lineal, en donde, se hallan los par´metros de la
o a
c´mara. El segundo paso resuelve el problema no lineal de la distorsi´n [Tsai, 1987].
a o
19
20. 2.3. Reconstrucci´n 3D de un modelo
o
3. Selecci´n de caracter´
o ısticas.- Consiste en eligir a los candidatos de una imagen de
acuerdo a sus atributos geom´tricos, intensidad, color o textura en una regi´n, borde
e o
o p´ [Ma et al., 2004] [Barnard and Fischler, 1982].
ıxel
4. B´squeda de correspondencias.- Encontrar los puntos correspondientes o puntos ho-
u
m´logos [Birchfield., 1998] en un sistema de visi´n est´reo con dos, tres o m´ltiples
o o e u
vistas es un proceso demasiado complejo y ambiguo, porque no necesariamente se
puede hallar el punto hom´logo en la imagen correspondiente. Esto se debe a cau-
o
sa de los siguientes factores: variaci´n de la intensidad luminosa, oclusi´n, ruido,
o o
textura de los objetos y/o errores de calibraci´n [Cochran and Medioni, 1992].
o
5. Determinaci´n de la profundidad.- Seguidamente de haber resuelto el problema de la
o
b´squeda de correspondencia y hallados los puntos hom´logos, la reconstrucci´n del
u o o
punto tridimensional estar´ dada por la triangulaci´n [Hartley and Sturm, 1997].
a o
6. Interpolaci´n.- Despu´s de haber hallado la profundidad de cada par de puntos
o e
correspondientes, en el paso anterior. Ahora se puede interpolar ciertas zonas o
areas en donde exista una escasez de puntos tridimensionales.
´
2.3. Reconstrucci´n 3D de un modelo
o
Shankar Sastry [Ma et al., 2004], Andrew Zisserman [Hartley and Zisserman, 2004]
y Marc Pollefeys [Koch et al., 2000] dividen la reconstrucci´n 3D de su modelo en los
o
siguientes pasos:
1. Calibraci´n.- Paso en el cual se hallan los par´metros necesarios [Salvi et al., 2002]
o a
para el mapeamiento de un punto 3D al plano imagen.
La matriz de mapeamiento o proyecci´n de perspectiva [Hearn and Baker, 1995] de
o
un punto 3D al plano, se lleva a cabo a trav´s de la matriz de par´metros intr´
e a ınse-
cos [Heikkil¨ and Silv´n, 1997] o matriz de calibraci´n [Ma et al., 2004], que son la
a e o
presentaci´n de las propiedades f´
o ısicas de la c´mara y su optica. Los par´metros de
a ´ a
la matriz de calibraci´n son: la distancia focal (f ), punto principal (ox , oy ), factor
o
de torcimiento (sθ ) y los coeficientes para el cambio de unidades m´tricas a p´
e ıxeles.
La matriz de par´metros extr´
a ınsecos es la posici´n y orientaci´n de la c´mara con
o o a
respecto al punto 3D y est´ representada por una matriz de rotaci´n R y una matriz
a o
de traslaci´n t [Weng et al., 2002] [Zhang, 1999].
o
2. Rectificaci´n.- Seguidamente de haber realizado la calibraci´n de las c´maras y haber
o o a
hallado la matriz de par´metros intr´
a ınsecos y la matriz de par´metros extr´
a ınsecos,
se procede a la rectificaci´n [Fusiello et al., 2000] [Trucco and Verri, 1998] de los
o
planos imagen del par de im´genes del sistema de visi´n estereosc´pica.
a o o
Generalmente la rectificaci´n [Fusiello., 1998] se realiza a trav´s del eje horizontal
o e
con la finalidad de conseguir una alineaci´n del par de l´
o ıneas epipolares correspon-
dientes. Haciendo que la b´squeda de correspondencias sea l´
u ıneal y no cuadr´tica
a
[Cormen et al., 2001].
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 20
21. CAP´
ITULO 2. Trabajos relacionados
Despu´s de haber realizado el proceso de rectificaci´n, el emparejamiento de los
e o
puntos correspondientes [Szeliski, 2011] [Scharstein and Szeliski, 2002] se realiza en
su correspondiente l´
ınea epipolar y no en toda la imagen.
3. C´lculo de disparidad.- Despu´s de haber rectificado al par de im´genes estereos-
a e a
c´picas, los puntos correspondientes se hallan alineados en forma horizontal, pero
o
a´n existe una diferencia entre las coordenadas de dichos puntos hom´logos. Esta
u o
diferencia se llama disparidad [Lecumberry, 2005] [Scharstein and Szeliski, 2002].
4. Reconstrucci´n 3D.- Despu´s de haber llevado a cabo el c´lculo de disparidad o
o e a
distancia asociada a los puntos correspondientes del par de im´genes rectificadas del
a
sistema de visi´n estereosc´pica y, tambi´n haber calculado la matriz de par´metros
o o e a
intr´
ınsecos y la matriz de par´metros extr´
a ınsecos, entonces, ahora se puede encontrar
la localizaci´n de un punto 3D a trav´s de la intersecci´n de dos rectas en el espacio.
o e o
El proceso de intersecci´n de dos rectas en el espacio, se conoce como triangulaci´n
o o
[Hartley and Sturm, 1997]. Cada recta representa a la reproyecci´n del mismo punto
o
3D en cada plano imagen del mismo sistema de visi´n estereosc´pica.
o o
2.4. Consideraciones Finales
B´sicamente la reconstrucci´n 3D de un modelo est´ determinada por la calibraci´n,
a o a o
rectificaci´n, c´lculo de disparidad y finalmente la triangulaci´n de puntos 3D. El para-
o a o
digma est´reo computacional es el m´s completo en hacer una descripci´n de cada uno
e a o
de los pasos asociados para la recuperaci´n de la estructura tridimensional de un objeto,
o
porque tiene una secuencia de pasos bien estructurada y definida.
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 21
22. Cap´
ıtulo 3
Calibraci´n de las c´maras y an´lisis
o a a
bifocal
3.1. Consideraciones Iniciales
Llevar a cabo la proyecci´n de un punto 3D a coordenadas p´
o ıxeles se hace a trav´s
e
de un conjunto de par´metros, que est´n representados en una matriz de mapeamiento
a a
[Heikkil¨ and Silv´n, 1997]. Este conjunto de par´metros se divide en intr´
a e a ınsecos y ex-
tr´
ınsecos. Los par´metros intr´
a ınsecos est´n relacionados con las propiedades f´
a ısicas de
la c´mara y su optica, y los par´metros extr´
a ´ a ınsecos con un movimiento de rotaci´n y o
traslaci´n. La geometr´ epipolar [Ma et al., 2004] [Hartley and Zisserman, 2004] permite
o ıa
entender el an´lisis matem´tico del plano imagen de la c´mara lateral izquierda y el plano
a a a
imagen de la c´mara lateral derecha del sistema de visi´n est´reo.
a o e
3.2. Modelo de c´mara pinhole
a
El modelo de c´mara pinhole no s´lo es el modelo de c´mara m´s b´sico, sino
a o a a a
tambi´n, el modelo m´s utilizado en el area de visi´n de computacional, porque ayuda a
e a ´ o
entender la formaci´n de una imagen desde un punto de vista geom´trico, utilizando la
o e
proyecci´n de perspectiva. Tambi´n existen otros modelos de c´mara [Mer´., 2008] que no
o e a e
ser´n tratados en la presente investigaci´n porque no tienen una relaci´n directa con la
a o o
tesis.
El m´delo de c´mara pinhole consiste en un centro optico o en donde convergen
o a ´
todos los rayos de la proyecci´n y un plano imagen I, en el cual, la imagen es proyectada.
o
El plano imagen est´ ubicado a una distancia focal f del centro ´ptico y es perpendicular
a o
al eje z, como se muestra en la Figura 3.1. Tambi´n se puede observar que, para cualquier
e
punto arbitrario que est´ dentro de dicha l´
e ınea, su proyecci´n ser´ la misma en el plano
o a
imagen I.
22
23. CAP´
ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
o a a
Figura 3.1: Modelo de c´mara pinhole frontal [Ma et al., 2004]
a
Sea p un punto cualquiera en 3D, que est´ expresado en coordenadas no homog´neas
a e
T 3
[Coxeter, 2003] p = [X, Y, Z] ∈ R , ser´ proyectado en el plano imagen I como un
a
punto 2D x. El punto 2D x tambi´n est´ representado en coordenadas no homog´neas
e a e
T 2
x = [x, y] ∈ R . El punto x es la intersecci´n de la recta entre el centro ´ptico o y el
o o
punto p con el plano imagen I. En la ecuaci´n 3.1 se puede observar la representaci´n
o o
matem´tica de la intersecci´n del centro optico o con el punto p de la Figura 3.1 y la
a o ´
notaci´n matem´tica op representa la l´
o a ¯ ınea recta entre el centro optico o y el punto p.
´
x = op ∩ I
¯ (3.1)
Dado que el plano cartesiano R2 se identifica como un plano en un espacio vectorial,
se puede asociar cualquier punto bidimensional como un vector. Ahora, se usar´ la nota-
a
ci´n x como la representaci´n de un vector en coordenadas homog´neas [Coxeter, 2003].
o o e
Tambi´n se utilizar´ la letra en negrita, para expresar un punto cualquiera como un vector.
e a
Una de las ventajas de la Geometr´ Proyectiva es el uso de las coordenadas homog´neas
ıa e
[Coxeter, 2003]. Utilizar coordenadas homog´neas permite colocar un 1 al final del par
e
ordenado, posibilitando la eficiencia en las rotaciones y traslaciones en las transformacio-
nes lineales. En la ecuaci´n 3.2, los puntos x y p est´n en coordenadas homog´nas, y π
o a e
representa a la matriz de mapeamiento [Ma et al., 2004].
π
X
x f 0 0 0
R t Y
Z y = 0 f 0 0
λ := Z , λ ∈ R+ (3.2)
0 1 Z
1 0 0 1 0
1
x π
p
La matriz π es la multiplicaci´n de la matriz Kf y la matriz Π0 de la ecuaci´n 3.3.
o o
En las dos primeras diagonales de la matriz Kf se tiene la distancia focal, y la matriz Π0
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 23
24. 3.3. Calibraci´n
o
a menudo es llamada la matriz de proyecci´n est´ndar o matriz de proyecci´n can´nica
o a o o
[Ma et al., 2004].
f 0 0 0 f 0 0 1 0 0 0
π = 0 f 0 0 = 0 f 0 0 1 0 0
(3.3)
0 0 1 0 0 0 1 0 0 1 0
Kf ×Π0 Kf Π0
Para el caso que el plano imagen I est´ ubicado detr´s de las coordenadas de la
e a
c´mara pinhole, como se muestra en la Figura 3.2, la distancia focal f de la matriz π de
a
la ecucaci´n 3.4 ser´ negativa, porque, el plano imagen I est´ ubicado detr´s del eje de
o a a a
coordenadas de la c´mara. La proyecci´n de cualquier escena u objeto del mundo real,
a o
ser´ proyectada de forma inversa.
a
Figura 3.2: Modelo de c´mara pinhole [Ma et al., 2004]
a
π
X
x f 0 0 0
R t Y
Z y = 0 f 0 0 λ := Z , λ ∈ R+ , f ∈ R− (3.4)
0 1 Z
1 0 0 1 0
1
x π
p
3.3. Calibraci´n
o
La calibraci´n de las c´maras consiste en hallar la matriz de mapeamiento, en-
o a
tre las coordenadas globales a las coordenadas p´ ıxeles. Dicha matriz de mapeamiento
[Ma et al., 2004] o matriz de transformaci´n de perspectiva [Fusiello et al., 2000] tiene
o
definido los par´metros intr´
a ınsecos y extr´
ınsecos [Mer´., 2008] [Heikkil¨ and Silv´n, 1997]
e a e
[Tsai, 1987] que son detallados a continuaci´n:
o
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 24
25. CAP´
ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
o a a
3.3.1. Par´metros intr´
a ınsecos
Debido a que el sistema de medidas de una imagen (coordenadas p´ ıxeles), y el
sistema de medidas de un punto homog´neo 2D x (coordenadas m´tricas) proyectado en
e e
el plano imagen, no son lo mismo, se tiene que hacer una conversi´n entre ambos sistemas
o
de coordenadas a trav´s de la matriz de los par´metros intr´
e a ınsecos.
La matriz de los par´metros intr´
a ınsecos est´ conformado por la distancia focal (f ); el
a
punto principal (ox , oy ), que es la intersecci´n entre el plano imagen I y el eje z del sistema
o
de coordenadas de la c´mara; el factor de torcimiento (sθ ) y los coeficientes (sx , sy ), para
a
el cambio de unidades m´tricas a p´
e ıxeles. La matriz de par´metros intr´
a ınsecos representa
a las propiedades f´
ısicas de la c´mara y su optica.
a ´
En la ecuaci´n 3.5, se puede observar que la matriz K es la multiplicaci´n de las
o o
matrices Ks y Kf . La matriz K es la matriz que contiene a los par´metros intr´
a ınsecos.
Dicha matriz tambi´n es conocida como matriz de calibraci´n [Ma et al., 2004].
e o
f sx f sθ ox sx sθ o x f 0 0
0 f sy oy = 0 sy oy 0 f 0 (3.5)
0 0 1 0 0 1 0 0 1
K Ks Kf
3.3.2. Par´metros extr´
a ınsecos
Los par´metros extr´
a ınsecos definen el movimiento r´ ıgido de traslaci´n y rotaci´n de
o o
las coordenadas globales de un punto cualquiera p = (Xi , Yi , Zi ) del objeto, con respecto
al centro de coordenadas de la c´mara o=(xi , yi , zi ). En la ecuaci´n 3.6, la variable R re-
a o
presenta a la matriz de rotaci´n y t es la matriz de traslaci´n [Heikkil¨ and Silv´n, 1997].
o o a e
xi m11 m12 m13 Xi x0
yi = m21 m22 m23 Yi + y0
(3.6)
zi m31 m32 m33 Zi z0
o R p t
La ecuaci´n 3.7 est´ el modelo generalizado para el mapeamiento de un punto 3D a
o a
coordenadas p´ ıxeles; en dicha ecuaci´n se puede observar la variable lambda (λ), la cual
o
representa a un valor escalar que pertenece a los n´meros reales, y un punto x que ha
u
sido transformado a coordenadas p´ ıxeles homog´neas. Seguidamente, despu´s del signo de
e e
igualdad, est´ la matriz de par´metros intr´
a a ınsecos (K), la matriz de proyecci´n can´nica
o o
(Π0 ), la matriz de par´metros extr´
a ınsecos (R y t) y un punto cualquiera p del objeto en
coordenadas homog´neas.
e
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 25
26. 3.4. M´todos de calibraci´n
e o
π
X
u f sx f sθ ox 1 0 0 0
R t Y
λ v = 0 f sy oy 0 1 0 0 λ∈R (3.7)
0 1 Z
1 0 0 1 0 0 1 0
1
x K Π0
p
3.3.3. Distorsi´n del lente
o
Existen dos tipos de distorsi´n durante el mapeamiento de las coordenadas globales
o
a las coordenadas p´ ıxeles. La primera es una distorsi´n lineal [Bakstein., 1999], que se
o
produce debido a la proyecci´n de perspectiva. Mientras mayor sea la distancia focal, me-
o
nor ser´ la distorsi´n [Mer´., 2008]. En la Figura 3.3 se puede observar, que la proyecci´n
a o e o
de perspectiva de un cuadrado, no conserva la originalidad de su forma (geometr´ ıa).
Figura 3.3: Proyecci´n de perspectiva de un cuadrado [Bakstein., 1999]
o
La segunda distorsi´n es no lineal [Tsai, 1987] [Mer´., 2008] y se debe a la curvatura
o e
del lente. La concavidad de la optica hace que se produzca una deformaci´n en la imagen,
´ o
lo cual har´ que las l´
a ıneas rectas no se observen como tales, sino como curvas.
3.4. M´todos de calibraci´n
e o
Si bien las dos partes del proceso de calibraci´n son: la transformaci´n lineal y la
o o
correcci´n de la distorsi´n [Weng et al., 2002]. Hay m´todos que resuelven cada parte de
o o e
dicho proceso de diferentes formas [Salvi et al., 2002] [Faugeras and Toscani., 1987].
Se ha elegido el m´todo de Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] por la mane-
e a e a e
ra de como da a conocer ambas partes del proceso de calibraci´n y el m´todo de Zhengyou
o e
Zhang [Zhang, 2000], por su robustez y flexibilidad.
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 26
27. CAP´
ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
o a a
3.4.1. El m´todo de Heikkil¨ y Silv´n
e a e
El m´todo de Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] consta de los siguientes
e a e a e
cuatro pasos:
1. El primer paso consiste en hacer una Transformaci´n Lineal Directa (TLD) de las
o
coodenadas homog´neas del objeto (Xi , Yi , Zi , 1) a coordenadas de la imagen (ui , vi ).
e
Para llevar a cabo ello, se utiliza una matriz homog´nea de 3 × 4 llamada matriz
e
A. La ecuaci´n matricial ser´ de la siguiente forma:
o ıa
Xi
ui w i a11 a12 a13 a14
Yi
vi wi = a21 a22 a23 a24
(3.8)
Zi
wi a31 a32 a33 a34
1
A
Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] resuelven los par´metros a11 , . . . , a34
a e a e a
de la matriz A de la TLD eliminando wi . Por consiguiente, el sistema lineal, se
denotar´ de la siguiente manera:
ıa
La = 0 (3.9)
X1 Y1 Z1 1 0 0 0 0 −X1 u1 −Y1 u1 Z1 u1 −u1
0 0 0 0 X1 Y1 Z1 1 −X1 v1 −Y1 v1 Z1 v1 −v1
. . . . . . . . . . . .
.
. .
. .
. . .
. . .
. .
. .
. .
. .
. .
. .
.
Xi Yi Zi 1 0 0 0 0 −Xi ui −Yi ui Zi ui −ui
L=
(3.10)
0 0 0 0 X i Yi Z i 1 −Xi vi −Yi vi Zi vi −vi
. . . . . . . . . . . .
.
. .
. .
. . .
. . .
. .
. .
. .
. .
. .
. .
.
Xn Yn Zn 1 0 0 0 0 −Xn un −Yn un Zn un −un
0 0 0 0 Xn Yn Zn 1 −Xn vn −Yn vn Zn vn −vn
a = [a11 , a12 , a13 , a14 , a21 , a22 , a23 , a24 , a31 , a32 , a33 , a34 ]T (3.11)
Para evitar una soluci´n trivial, en el sistema lineal de la ecuaci´n 3.9, el par´metro
o o a
a34 de la matriz A debe ser uno y Faugeras y Toscani [Faugeras and Toscani., 1987]
sugieren que los par´metros a31 , a32 y a33 , cumplan la siguiente igualdad: a31 + a32 +
a
a33 = 1, la cual garantiza la no singularidad de la matriz A, por lo cual, se encontrar´
a
una soluci´n.
o
Una vez obtenidos los par´metros de la matriz A, Melen [Melen., 1994] hace una
a
descomposici´n RQ a la matriz A, obteniendo la siguiente ecuaci´n:
o o
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 27
28. 3.4. M´todos de calibraci´n
e o
A = λV −1 B −1 F M T
(3.12)
R Q
donde las matrices M y T forman la matriz de rotaci´n y traslaci´n del sistema de
o o
coordenadas del objeto al sistema de coordenadas de la c´mara de la ecuaci´n 3.6.
a o
Las matrices V, B y F representan al punto principal (ox , oy ), los coeficientes para
la distorsi´n lineal (b1 , b2 ) y la distancia focal f respectivamente.
o
1 0 −ox 1 + b1 b2 0 f 0 0
V = 0 1 −oy , B = b2 1 − b1 0 , F = 0 f 0 (3.13)
0 0 1 0 0 1 0 0 1
2. El segundo paso consiste en corregir los componentes de distorsi´n radial y tangen-
o
cial [Tsai, 1987] [Mer´., 2008] de la proyecci´n del punto 3D al plano imagen. El
e o
problema de la existencia de ruido en las im´genes, se resuelve a trav´s de m´
a e ınimos
cuadrados. La funci´n objetivo a minimizar es la siguiente:
o
N N
F = i=1 (Ui − ui )2 + i=1 (Vi − vi )2 (3.14)
Donde:
(Ui , Vi ) representa a los datos reales
(ui , vi ) representa a los datos observados o ideales
Debido a que la funci´n objetivo F a minimizar en la ecuaci´n 3.14 es no lineal,
o o
se utiliza el m´todo de Levenberg-Marquardt [Mor´, 1978] para su optimizaci´n.
e e o
El m´todo de Levenberg-Marquardt es un algoritmo iterativo que busca la mejor
e
soluci´n al problema de m´
o ınimos cuadrados.
3. El tercer paso consiste en corregir la distorsi´n a causa del ´ngulo y el desplazamiento
o a
entre el objeto y el plano imagen.
Como se puede observar en la Figura 3.4, la distancia focal f es la distancia ortogonal
entre O y el plano Π2 . Tambi´n se puede mirar que Γ2 es la proyecci´n de Γ1 en
e o
el plano Π2 . Se utiliza un cono porque es la figura geom´trica m´s representativa
e a
para la proyecci´n del c´
o ırculo Γ1 del plano Π1 al plano Π2 . La proyecci´n puede ser
o
expresada de la siguiente forma:
(X − αZ)2 + (Y − βZ)2 = γ 2 Z 2 (3.15)
Los par´metros α y β especifican la asimetr´ del cono en la direcci´n X y Y.
a ıa o
El par´metro γ especifica la “nitidez” del cono. Dado que el sistema de coordenas
a
Ω1 (X, Y, Z) ∈ R3 , que est´ centrado en el foco de la c´mara O y su eje Z, es
a a
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 28
29. CAP´
ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
o a a
Figura 3.4: Proyecci´n de perspectiva de un c´
o ırculo [Heikkil¨ and Silv´n, 1997]
a e
perpendicular al plano Π1 , y dado que el sistema de coordenadas Ω2 (x, y, z) ∈ R3 ,
que tambi´n est´ centrado en el foco de la c´mara O, y que su eje z es ortogonal al
e a a
plano imagen Π2 , se realiza una transformaci´n de Ω2 a Ω1 , la cual, est´ expresada
o a
en la siguiente ecuaci´n:
o
X a11 a11 a13 x
Y = a21 a22 a23 y (3.16)
Z a31 a32 a33 z
Si formamos una base ortonormal de la transpuesta de cada vector columna de la
matriz de 3 × 3 de la ecuaci´n 3.16, entonces la ecuaci´n 3.15 puede ser expresada
o o
en coordenadas de la c´mara de la siguiente forma:
a
[ (a11 − αa31 )x + (a12 − αa32 )y + (a13 − αa33 )z]2
+ [(a21 − βa31 )x + (a22 − βa32 )y + (a23 − βa33 )z]2
= γ 2 (a31 + a32 y + a33 z)2 (3.17)
Ahora, la intersecci´n de C y el plano Π2 , es Γ2 , y est´ expresada como:
o a
(n2 + k 2 − r2 )x2 + 2(kl + np − rs)xy + (l2 + p2 − s2 )y 2 +
2(km + nq − rt)x + 2(lm + pq − st) + m2 + q 2 − t2 = 0 (3.18)
Donde:
k = a11 − ta31 n = a21 − sa31 r = γa31
l = a12 − ta32 p = a22 − sa32 s = γa32 (3.19)
m = (a13 − ta33 )f q = (a23 − sa33 )f t = γa33 f
En la ecuaci´n 3.18, se puede observar que tiene una forma cuadr´tica y que la
o a
imagen proyectada puede ser un c´
ırculo o una elipse.
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 29
30. 3.4. M´todos de calibraci´n
e o
Si partimos del supuesto que es una elipse, entonces el centro(uc , vc ) puede ser ex-
presado como:
uc = (kp−nl)(lq−pm)−(ks−lr)(tl−ms)−(ns−pr)(wp−qs)
(kp−nl)2 −(ks−lr)2 −(ns−pr)2
(kp−nl)(mn−kq)−(ks−lr)(mr−kt)−(ns−pr)(qr−nt) (3.20)
vc = (kp−nl)2 −(ks−lr)2 −(ns−pr)2
Para conocer cu´l es la proyecci´n del centro del c´
a o ırculo, se considera la situaci´n
o
donde el radio del c´
ırculo es cero (γ = 0). Consecuentemente r, s y t se convierten en
cero, por lo tanto, se obtiene la posici´n de la proyecci´n del punto y la proyecci´n
o o o
del centro del c´
ırculo.
lq−pm mn−kq
u0 = kp−nl
, v0 = kp−nl (3.21)
Una vez calculados los datos de la ecuaci´n 3.20 y la ecuaci´n 3.21, se procede hacer
o o
una correcci´n de la proyecci´n a trav´s de la siguiente ecuaci´n:
o o e o
Ui = Ui − sx su (uc,i − u0,i )
(3.22)
Vi = Vi − sy (vc,i − v0,i )
4. En el cuarto y ultimo paso, se resuelve el problema del back-projection [Pollefeys, 2009],
´
en el cual, se desea recuperar la l´
ınea o recta de las coordenadas de la imagen; esto
se hace a trav´s del modelo de c´mara impl´
e a ıcito de Wei y Ma [Wei and Ma, 1993].
Por lo tanto, se puede expresar el mapeo de (ui , vi ) a (ui , vi ) como:
ui 1 ui + ui (a1 ri + a2 ri ) + 2a3 ui vi + a4(ri + 2ui2 )
2 4 2
= 2 4 2 2 (3.23)
vi G vi + vi (a1 ri + a2 ri ) + a3(ri + 2vi ) + 2a4 ui vi
y
2 2
G = (a5 ri + a6 ui + a7 vi + a8 )ri + 1 (3.24)
donde:
(ui −u0 ) (vi −v0 )
ui = (sx su )
, vi = sy (3.25)
y
ri = ui2 + vi2
Si se comparara el modelo inverso impl´
ıcito al modelo de la c´mara pinhole m´s el
a a
componente de la distorsi´n radial y tangencial, se podr´ observar que el modelo
o ıa
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 30
31. CAP´
ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
o a a
impl´
ıcito tiene componentes que reemplazan a la distorsi´n radial y a la distorsi´n
o o
tangencial.
Para conocer los par´metros desconocidos del modelo inverso, (ui , vi ) y (ui , vi ), es
a
necesaria una grilla, para lo cual, se define:
ui = [−ui ri , −ui ri , −2ui vi , −(ri + 2ui2 ), ui ri , ui ui ri , ui vi ri , ui ri ]T
2 4 2 4 2 2 2
vi = [−vi ri , −vi ri , −(ri + 2vi2 ), −2ui vi , vi ri , vi ui ri , vi vi ri , vi ri ]T
2 4 2 4 2 2 2
T
T = [u1 , v1 , . . . , ui , vi , . . . , un , vn ] (3.26)
p = [a1 , a2 , a3 , a4 , a5 , a6 , a7 , a8 ]T
e = [u1 − u1 , v1 − v1 , . . . , ui − ui , vi − vi , . . . , un − un , vn − vn ]T
Usando la ecuaci´n 3.23 y la ecuaci´n 3.24, se obtiene la siguiente relaci´n:
o o o
e = Tp (3.27)
Ahora, el vector p es estimado a trav´s de m´
e ınimos cuadrados:
p = (T T T )−1 T T e (3.28)
Los par´metros calculados en la ecuaci´n 3.28 son usados en la ecuaci´n 3.23 y
a o o
en la ecuaci´n 3.24 para corregir los coordenadas de la imagen arbitraria (u, v).
o
Entonces las coordenadas reales son obtenidas, por interpolaci´n, en las coordenadas
o
calculadas entre (ui , vi ) y (ui , vi ).
3.4.2. El m´todo de Zhengyou Zhang
e
Zhengyou Zhang desarrollo un m´todo de calibraci´n flexible y robusto [Zhang, 2000]
e o
[Zhang, 1999], donde el criterio utilizado fue el siguiente:
Sea un punto 2D x = [u v]T y un punto 3D p = [X Y Z]T . Se usa x para denotar
ambos puntos en coordenadas homog´neas, por lo tanto, nuevo par de puntos es: x =
e
[u v 1]T y p = [X Y Z 1]T . La relaci´n entre un punto 3D M y su proyecci´n imagen m
o o
est´ definido por:
a
sx = K [R t]p (3.29)
Donde s es un factor arbitrario y (R, t) es la matriz de par´metros extr´
a ınsecos (matriz
de rotaci´n y traslaci´n), que relaciona el sistema de coordenadas globales al sistema de
o o
coordenadas de la c´mara; K es la matriz de par´metros intr´
a a ınsecos.
Plano homogr´fico
a
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 31
32. 3.4. M´todos de calibraci´n
e o
Dado un plano en el espacio 3D existe una unica matriz que mapea este plano
´
homogr´fico a un plano imagen. Si se asume que el eje Z del plano modelo est´ ubicado
a a
en la posici´n cero (Z = 0) del sistema de coordenadas globales, se tiene lo siguiente:
o
s[u v 1]T = K[r1 r2 r3 t][X Y Z 1]T
s[u v 1]T = K[r1 r2 r3 t][X Y 0 1]T
(3.30)
s[u v 1]T = K[r1 r2 t][X Y 1]T
s[u v 1]T = H[X Y 1]T
Como se puede observar, en la ecuaci´n 3.30, H = K[r1 r2 t] y es la matriz homo-
o
gr´fica que mapea el punto p del plano modelo al punto x del plano imagen. Por lo tanto,
a
la ecuaci´n general para el mapeamiento est´ definida por:
o a
sx = H p (3.31)
Para conocer la matriz H de la ecuaci´n 3.31, es necesario crear el siguiente sistema
o
lineal:
CH =0 (3.32)
H11
X1 Y1 Z 1 1 0 −u1 X1 −u1 Y1 −u1 Z1 1
H
0 X1 Y1 Z1 1 −v1 X1 −v1 Y1 −v1 Z1 1 12
. . . . . . . . . H13
.
. .
. .
. .
. .
. .
. .
. .
. .
.
H
Xi Yi Zi 1 0 −ui Xi −ui Yi −ui Zi 1 21
H = 0 (3.33)
0 Xi Yi Zi 1 −vi Xi −vi Yi −vi Zi 1 22
. . . . . . . . . H23
.
. .
. .
. .
. .
. .
. .
. .
. .
. H31
Xn Yn Z n 1 0 −un Xn −un Yn −un Zn 1 H32
0 Xn Yn Zn 1 −vn Xn −vn Yn −vn Zn 1 H33
C H
Donde C es una matriz de 2n × 9. La variable n representa al n´mero de puntos.
u
Para resolver el sistema homog´neo de la ecuaci´n 3.32 son necesarios al menos ocho
e o
puntos para la matriz C . A trav´s de los autovalores y los autovectores de la matriz
e
sim´trica C T C , se hallan los par´metros de la matriz H .
e a
Debido a la existencia de ruido, el punto xi ha sido movido de su posici´n inicial,
o
por lo que, a trav´s de la siguiente funci´n, se minimiza el problema.
e o
2
minH i xi − xi
ˇ (3.34)
Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
ıa a o 32