Este documento describe métodos para estimar el campo de movimiento en imágenes basados en el desplazamiento de bloques. Explica que estos métodos dividen las imágenes en bloques y estiman el movimiento calculando el desplazamiento de cada bloque entre imágenes. Los métodos más comunes se basan en encontrar el bloque en la siguiente imagen que más se parece al bloque actual usando criterios como el error cuadrático medio o la diferencia absoluta media. Estos métodos son ampliamente usados en compresión de video debido a su baja complejidad computacional
Este documento presenta una guía de actividades para visualizar cómo cambia la gráfica de funciones cuadráticas y homográficas cuando se varían sus parámetros, y determinar sus dominios e imágenes. Se explican las funciones cuadráticas y homográficas, y se guía al usuario a observar el comportamiento de las gráficas cuando se mueven los deslizadores y deducir las gráficas de otras funciones. También se recuerdan los conceptos de dominio e imagen y se pide determinarlos para estas funciones.
El documento describe diferentes técnicas de modelado basado en imágenes (IBR), incluyendo IBR puro que usa solo imágenes para renderizar escenas sin modelado 3D, e IBR híbrido que usa imágenes para guiar la reconstrucción de modelos 3D. Se detallan métodos como panoramas cilíndricos, mosaicos concéntricos, puntadas plenópticas, campos de luz, texturas de relieve, reconstrucción con profundidad y optimización no lineal. El IBR ha sido usado en películ
Este documento describe diferentes transformaciones geométricas que se pueden aplicar a imágenes digitales, incluyendo transformaciones afines y no afines. Explica conceptos como rotación, escalado, traslación e interpolación, y cómo estas transformaciones afectan la posición y valores de intensidad de los píxeles. También presenta métodos comunes de interpolación como el del vecino más cercano y la interpolación bilineal.
Los píxeles son puntos de color que forman imágenes. Cada píxel se codifica con bits para representar su color, donde más bits permite más variaciones de color. Las imágenes vectoriales usan objetos geométricos en lugar de píxeles, lo que permite cambiar su tamaño sin pérdida de calidad.
Este documento describe las imágenes vectoriales, que están compuestas de elementos geométricos definidos como vectores en lugar de píxeles. Esto significa que las imágenes vectoriales no sufren pérdida de resolución al ampliarse y pueden someterse a transformaciones geométricas sin distorsión, a diferencia de las imágenes de mapa de bits. También explica los diferentes formatos de archivo de imágenes como GIF, JPG y BMP.
Este documento presenta varios operadores para la detección de bordes en imágenes digitales. Explica el operador de Canny, Sobel, Prewitt y cómo calcular el gradiente. También cubre cómo implementar estos algoritmos y usar las funciones edge y fspecial en MatLab para detectar bordes verticales, horizontales y compuestos. El objetivo es que los estudiantes entiendan y apliquen diferentes métodos para detectar bordes en imágenes.
Este documento define varios conceptos básicos relacionados con imágenes digitales. Explica que un pixel es la unidad mínima de información gráfica, las imágenes vectoriales están compuestas de objetos geométricos definidos matemáticamente, un bit es la unidad mínima de información digital que puede tener valores de 1 o 0, e imágenes de mapa de bits son monocromáticas y almacenan un bit por pixel. También define la resolución de una imagen como la densidad de píxeles medida en píxeles por pulg
Este documento presenta 6 actividades sobre la ecuación de la circunferencia para estudiantes de educación secundaria superior. Las actividades incluyen determinar el centro, radio y ecuación de circunferencias dados puntos o rectas, usando la herramienta Geogebra. Se pide detallar los pasos y herramientas utilizadas. La última actividad pregunta sobre las propiedades matemáticas involucradas.
Este documento presenta una guía de actividades para visualizar cómo cambia la gráfica de funciones cuadráticas y homográficas cuando se varían sus parámetros, y determinar sus dominios e imágenes. Se explican las funciones cuadráticas y homográficas, y se guía al usuario a observar el comportamiento de las gráficas cuando se mueven los deslizadores y deducir las gráficas de otras funciones. También se recuerdan los conceptos de dominio e imagen y se pide determinarlos para estas funciones.
El documento describe diferentes técnicas de modelado basado en imágenes (IBR), incluyendo IBR puro que usa solo imágenes para renderizar escenas sin modelado 3D, e IBR híbrido que usa imágenes para guiar la reconstrucción de modelos 3D. Se detallan métodos como panoramas cilíndricos, mosaicos concéntricos, puntadas plenópticas, campos de luz, texturas de relieve, reconstrucción con profundidad y optimización no lineal. El IBR ha sido usado en películ
Este documento describe diferentes transformaciones geométricas que se pueden aplicar a imágenes digitales, incluyendo transformaciones afines y no afines. Explica conceptos como rotación, escalado, traslación e interpolación, y cómo estas transformaciones afectan la posición y valores de intensidad de los píxeles. También presenta métodos comunes de interpolación como el del vecino más cercano y la interpolación bilineal.
Los píxeles son puntos de color que forman imágenes. Cada píxel se codifica con bits para representar su color, donde más bits permite más variaciones de color. Las imágenes vectoriales usan objetos geométricos en lugar de píxeles, lo que permite cambiar su tamaño sin pérdida de calidad.
Este documento describe las imágenes vectoriales, que están compuestas de elementos geométricos definidos como vectores en lugar de píxeles. Esto significa que las imágenes vectoriales no sufren pérdida de resolución al ampliarse y pueden someterse a transformaciones geométricas sin distorsión, a diferencia de las imágenes de mapa de bits. También explica los diferentes formatos de archivo de imágenes como GIF, JPG y BMP.
Este documento presenta varios operadores para la detección de bordes en imágenes digitales. Explica el operador de Canny, Sobel, Prewitt y cómo calcular el gradiente. También cubre cómo implementar estos algoritmos y usar las funciones edge y fspecial en MatLab para detectar bordes verticales, horizontales y compuestos. El objetivo es que los estudiantes entiendan y apliquen diferentes métodos para detectar bordes en imágenes.
Este documento define varios conceptos básicos relacionados con imágenes digitales. Explica que un pixel es la unidad mínima de información gráfica, las imágenes vectoriales están compuestas de objetos geométricos definidos matemáticamente, un bit es la unidad mínima de información digital que puede tener valores de 1 o 0, e imágenes de mapa de bits son monocromáticas y almacenan un bit por pixel. También define la resolución de una imagen como la densidad de píxeles medida en píxeles por pulg
Este documento presenta 6 actividades sobre la ecuación de la circunferencia para estudiantes de educación secundaria superior. Las actividades incluyen determinar el centro, radio y ecuación de circunferencias dados puntos o rectas, usando la herramienta Geogebra. Se pide detallar los pasos y herramientas utilizadas. La última actividad pregunta sobre las propiedades matemáticas involucradas.
Utp pd_iy_va_sap6 diltacion y erosión binariajcbp_peru
Este documento presenta una sesión sobre dilatación y erosión binaria en procesamiento de imágenes. Explica que la morfología matemática se basa en operaciones de teoría de conjuntos y se puede usar para pre-procesamiento, destacar estructuras de objetos, y describir objetos. Describe que la dilatación agrega pixeles a objetos haciéndolos más grandes, mientras que la erosión extrae "outlayers" haciendo objetos más pequeños. También presenta ejemplos y propiedades de estas operaciones morfoló
Las operaciones morfológicas se utilizan para procesar imágenes digitales mediante técnicas de morfología matemática. Estas operaciones incluyen la dilatación, erosión, apertura, clausura y otras. La dilatación engrosa las imágenes binarias mientras que la erosión las adelgaza. La apertura erosiona y luego dilata la imagen para eliminar ruido, mientras que la clausura dilata y luego erosiona para cerrar agujeros y grietas. Las operaciones morfológicas también se pueden utilizar
Este documento trata sobre diferentes métodos para realizar zoom en una imagen, incluyendo interpolación polinómica y spline cúbico. Presenta los conceptos teóricos de interpolación polinómica de Lagrange y Newton, e introduce la interpolación segmentaria mediante splines lineales, cuadráticos y cúbicos. Incluye ejemplos numéricos para ilustrar el cálculo de cada tipo de spline sobre una nube de puntos dada.
Reconocimiento de acciones humanas en videoanali22
Para reconocer efectivamente acciones se propone el uso de características de apariencia y movimiento para caracterizar una acción. Los experimentos fueron realizados sobre colecciones estándares así como una colección de referencia que fue especialmente elaborada para este trabajo. Los resultados obtenidos son alentadores y comparables a muchos métodos del estado del arte.
Este documento presenta los conceptos básicos de la regresión lineal múltiple. Introduce el modelo de regresión lineal múltiple y sus suposiciones, y explica cómo estimar los parámetros del modelo usando mínimos cuadrados ordinarios. También cubre cómo calcular el error estándar de los estimadores, construir intervalos de confianza, y realizar pruebas de hipótesis sobre los coeficientes. Finalmente, discute cómo realizar predicciones e inferencias basadas en el modelo estimado.
Introduccion al procesamiento de imagenes con matlabF Lliuya
Este documento introduce el procesamiento de imágenes con Matlab. Explica que una imagen digital es una matriz bidimensional donde cada elemento representa un pixel con una intensidad. Matlab almacena imágenes como matrices, permitiendo manipularlas mediante operaciones matriciales. Luego describe cómo leer, visualizar y escribir imágenes, y realizar conversiones entre tipos de datos como uint8, double y lógicos. Finalmente, introduce conceptos como histograma y cómo este puede usarse para analizar propiedades tonales de una imagen.
Este documento presenta un método para analizar la granulometría de una pila de rocas fragmentadas usando el software de código abierto ImageJ. El método involucra importar una imagen de la pila, ajustar el brillo y contraste, segmentar las partículas usando algoritmos de erosión y relleno, y medir propiedades como el área. Los resultados se exportan a una hoja de cálculo para crear una curva granulométrica y analizar la distribución de tamaños de partícula. El método ofrece una alternativa al
area bajo la curva de calculo integral ejerciciosalma735098
Este documento trata sobre el cálculo del área bajo una curva. Explica que calcular este área es fundamental en aplicaciones como determinar el espacio ocupado por una construcción. Presenta un caso práctico sobre calcular el volumen de concreto necesario para una rampa extrema en forma de parábola. También incluye definiciones de conceptos como la regla del trapecio y el teorema fundamental del cálculo para aproximar este tipo de áreas.
Este documento describe cómo utilizar OpenCV y Java para segmentar imágenes mediante la detección de bordes, contornos y el algoritmo de floodfill. Explica que OpenCV proporciona funciones que implementan estos algoritmos de segmentación de forma sencilla. Además, muestra ejemplos de código para aplicar dichas funciones a imágenes y obtener los resultados segmentados.
El documento describe las dos principales formas de manipular la información en una imagen digital: imágenes de mapa de bits y vectoriales. Las imágenes de mapa de bits están formadas por una rejilla de píxeles a los que se les asigna un color y luminancia, mientras que las imágenes vectoriales representan los objetos mediante coordenadas matemáticas, lo que las hace independientes de la resolución. Cada formato se adapta mejor a diferentes tipos de imágenes.
Este documento describe cómo las matemáticas, especialmente el álgebra lineal, son fundamentales para la animación por computadora. Explica que el álgebra lineal permite crear modelos tridimensionales y hacer que se muevan mediante multiplicación de matrices. También describe cómo se usan vectores y matrices para representar objetos 3D, y cómo transformaciones como rotación, traslación y escalado permiten animar los objetos.
Este documento describe los conceptos básicos de las imágenes digitales, incluyendo las diferencias entre imágenes vectoriales e imágenes de mapa de bits, sus ventajas y desventajas. También explica formatos de imágenes comunes, compresión de imágenes, modos de representar el color y la resolución de las imágenes.
La sesión trata sobre las operaciones morfológicas de dilatación y erosión en imágenes en escala de grises. Explica que la morfología matemática se basa en operaciones de teoría de conjuntos y se puede usar para preprocesamiento de imágenes, destacar estructuras de objetos, y describir objetos. Presenta las operaciones básicas de dilatación y erosión en imágenes en escala de grises, mostrando cómo estas operaciones pueden ampliar o reducir regiones de la imagen y cómo se implementan en Matlab.
Este documento compara técnicas básicas de umbralización global basadas en histogramas para procesamiento digital de imágenes. Describe métodos como el mínimo y la entropía de Shannon para determinar un umbral óptimo global que segmente objetos de interés del fondo en una imagen en escala de grises. También explica conceptos como píxeles, imágenes en escala de grises y color, y el histograma como representación de la distribución de intensidades en una imagen.
Utp pd_iy_va_sap6y7 diltacion y erosión binaria - apertura y clausurac09271
Este documento presenta una sesión sobre operaciones morfológicas en procesamiento de imágenes. Explica conceptos clave como dilatación, erosión, apertura, clausura y cómo se aplican estas operaciones usando elementos estructurantes. También cubre aplicaciones como detección de bordes, relleno de regiones y resúmenes de operaciones morfológicas. El objetivo es que los estudiantes aprendan a procesar imágenes digitales usando métodos morfológicos.
Las operaciones morfológicas (OM) son técnicas de procesamiento no lineal de imágenes basadas en la teoría de conjuntos. Existen dos tipos principales de OM: las OM binarias y las OM de niveles de grises. Las OM incluyen dilatación y erosión, las cuales pueden usarse para preprocesamiento de imágenes, destacar estructuras de objetos, y describir objetos. La dilatación engrosa las imágenes mientras que la erosión las adelgaza. Ambas operaciones se implementan utilizando un elemento e
Breve presentación del estándar de codificación HEVC -H.265- Gonzalo Rielo Zurita
Breve presentación del estándar de codificación HEVC -H.265- donde se expone el funcionamiento de los codificadores y decodificadores que utilizan este estándar.
Incluye bibliografía de consulta
En la ciudad de Pasto, estamos revolucionando el acceso a microcréditos y la formalización de microempresarios informales con nuestra aplicación CrediAvanza. Nuestro objetivo es empoderar a los emprendedores locales proporcionándoles una plataforma integral que facilite el acceso a servicios financieros y asesoría profesional.
Utp pd_iy_va_sap6 diltacion y erosión binariajcbp_peru
Este documento presenta una sesión sobre dilatación y erosión binaria en procesamiento de imágenes. Explica que la morfología matemática se basa en operaciones de teoría de conjuntos y se puede usar para pre-procesamiento, destacar estructuras de objetos, y describir objetos. Describe que la dilatación agrega pixeles a objetos haciéndolos más grandes, mientras que la erosión extrae "outlayers" haciendo objetos más pequeños. También presenta ejemplos y propiedades de estas operaciones morfoló
Las operaciones morfológicas se utilizan para procesar imágenes digitales mediante técnicas de morfología matemática. Estas operaciones incluyen la dilatación, erosión, apertura, clausura y otras. La dilatación engrosa las imágenes binarias mientras que la erosión las adelgaza. La apertura erosiona y luego dilata la imagen para eliminar ruido, mientras que la clausura dilata y luego erosiona para cerrar agujeros y grietas. Las operaciones morfológicas también se pueden utilizar
Este documento trata sobre diferentes métodos para realizar zoom en una imagen, incluyendo interpolación polinómica y spline cúbico. Presenta los conceptos teóricos de interpolación polinómica de Lagrange y Newton, e introduce la interpolación segmentaria mediante splines lineales, cuadráticos y cúbicos. Incluye ejemplos numéricos para ilustrar el cálculo de cada tipo de spline sobre una nube de puntos dada.
Reconocimiento de acciones humanas en videoanali22
Para reconocer efectivamente acciones se propone el uso de características de apariencia y movimiento para caracterizar una acción. Los experimentos fueron realizados sobre colecciones estándares así como una colección de referencia que fue especialmente elaborada para este trabajo. Los resultados obtenidos son alentadores y comparables a muchos métodos del estado del arte.
Este documento presenta los conceptos básicos de la regresión lineal múltiple. Introduce el modelo de regresión lineal múltiple y sus suposiciones, y explica cómo estimar los parámetros del modelo usando mínimos cuadrados ordinarios. También cubre cómo calcular el error estándar de los estimadores, construir intervalos de confianza, y realizar pruebas de hipótesis sobre los coeficientes. Finalmente, discute cómo realizar predicciones e inferencias basadas en el modelo estimado.
Introduccion al procesamiento de imagenes con matlabF Lliuya
Este documento introduce el procesamiento de imágenes con Matlab. Explica que una imagen digital es una matriz bidimensional donde cada elemento representa un pixel con una intensidad. Matlab almacena imágenes como matrices, permitiendo manipularlas mediante operaciones matriciales. Luego describe cómo leer, visualizar y escribir imágenes, y realizar conversiones entre tipos de datos como uint8, double y lógicos. Finalmente, introduce conceptos como histograma y cómo este puede usarse para analizar propiedades tonales de una imagen.
Este documento presenta un método para analizar la granulometría de una pila de rocas fragmentadas usando el software de código abierto ImageJ. El método involucra importar una imagen de la pila, ajustar el brillo y contraste, segmentar las partículas usando algoritmos de erosión y relleno, y medir propiedades como el área. Los resultados se exportan a una hoja de cálculo para crear una curva granulométrica y analizar la distribución de tamaños de partícula. El método ofrece una alternativa al
area bajo la curva de calculo integral ejerciciosalma735098
Este documento trata sobre el cálculo del área bajo una curva. Explica que calcular este área es fundamental en aplicaciones como determinar el espacio ocupado por una construcción. Presenta un caso práctico sobre calcular el volumen de concreto necesario para una rampa extrema en forma de parábola. También incluye definiciones de conceptos como la regla del trapecio y el teorema fundamental del cálculo para aproximar este tipo de áreas.
Este documento describe cómo utilizar OpenCV y Java para segmentar imágenes mediante la detección de bordes, contornos y el algoritmo de floodfill. Explica que OpenCV proporciona funciones que implementan estos algoritmos de segmentación de forma sencilla. Además, muestra ejemplos de código para aplicar dichas funciones a imágenes y obtener los resultados segmentados.
El documento describe las dos principales formas de manipular la información en una imagen digital: imágenes de mapa de bits y vectoriales. Las imágenes de mapa de bits están formadas por una rejilla de píxeles a los que se les asigna un color y luminancia, mientras que las imágenes vectoriales representan los objetos mediante coordenadas matemáticas, lo que las hace independientes de la resolución. Cada formato se adapta mejor a diferentes tipos de imágenes.
Este documento describe cómo las matemáticas, especialmente el álgebra lineal, son fundamentales para la animación por computadora. Explica que el álgebra lineal permite crear modelos tridimensionales y hacer que se muevan mediante multiplicación de matrices. También describe cómo se usan vectores y matrices para representar objetos 3D, y cómo transformaciones como rotación, traslación y escalado permiten animar los objetos.
Este documento describe los conceptos básicos de las imágenes digitales, incluyendo las diferencias entre imágenes vectoriales e imágenes de mapa de bits, sus ventajas y desventajas. También explica formatos de imágenes comunes, compresión de imágenes, modos de representar el color y la resolución de las imágenes.
La sesión trata sobre las operaciones morfológicas de dilatación y erosión en imágenes en escala de grises. Explica que la morfología matemática se basa en operaciones de teoría de conjuntos y se puede usar para preprocesamiento de imágenes, destacar estructuras de objetos, y describir objetos. Presenta las operaciones básicas de dilatación y erosión en imágenes en escala de grises, mostrando cómo estas operaciones pueden ampliar o reducir regiones de la imagen y cómo se implementan en Matlab.
Este documento compara técnicas básicas de umbralización global basadas en histogramas para procesamiento digital de imágenes. Describe métodos como el mínimo y la entropía de Shannon para determinar un umbral óptimo global que segmente objetos de interés del fondo en una imagen en escala de grises. También explica conceptos como píxeles, imágenes en escala de grises y color, y el histograma como representación de la distribución de intensidades en una imagen.
Utp pd_iy_va_sap6y7 diltacion y erosión binaria - apertura y clausurac09271
Este documento presenta una sesión sobre operaciones morfológicas en procesamiento de imágenes. Explica conceptos clave como dilatación, erosión, apertura, clausura y cómo se aplican estas operaciones usando elementos estructurantes. También cubre aplicaciones como detección de bordes, relleno de regiones y resúmenes de operaciones morfológicas. El objetivo es que los estudiantes aprendan a procesar imágenes digitales usando métodos morfológicos.
Las operaciones morfológicas (OM) son técnicas de procesamiento no lineal de imágenes basadas en la teoría de conjuntos. Existen dos tipos principales de OM: las OM binarias y las OM de niveles de grises. Las OM incluyen dilatación y erosión, las cuales pueden usarse para preprocesamiento de imágenes, destacar estructuras de objetos, y describir objetos. La dilatación engrosa las imágenes mientras que la erosión las adelgaza. Ambas operaciones se implementan utilizando un elemento e
Breve presentación del estándar de codificación HEVC -H.265- Gonzalo Rielo Zurita
Breve presentación del estándar de codificación HEVC -H.265- donde se expone el funcionamiento de los codificadores y decodificadores que utilizan este estándar.
Incluye bibliografía de consulta
En la ciudad de Pasto, estamos revolucionando el acceso a microcréditos y la formalización de microempresarios informales con nuestra aplicación CrediAvanza. Nuestro objetivo es empoderar a los emprendedores locales proporcionándoles una plataforma integral que facilite el acceso a servicios financieros y asesoría profesional.
Ofrecemos herramientas y metodologías para que las personas con ideas de negocio desarrollen un prototipo que pueda ser probado en un entorno real.
Cada miembro puede crear su perfil de acuerdo a sus intereses, habilidades y así montar sus proyectos de ideas de negocio, para recibir mentorías .
Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...Juan Martín Martín
Criterios de corrección y soluciones al examen de Geografía de Selectividad (EvAU) Junio de 2024 en Castilla La Mancha.
Soluciones al examen.
Convocatoria Ordinaria.
Examen resuelto de Geografía
conocer el examen de geografía de julio 2024 en:
https://blogdegeografiadejuan.blogspot.com/2024/06/soluciones-examen-de-selectividad.html
http://blogdegeografiadejuan.blogspot.com/
RETROALIMENTACIÓN PARA EL EXAMEN ÚNICO AUXILIAR DE ENFERMERIA.docx
T5bn
1. Rafael Molina Estimación del movimiento en la
imagen
1
Estimación del campo de
movimiento en el plano de la
imagen. Métodos basados en
bloques
Rafael Molina Soriano
Depto Ciencias de la Computación e IA
Universidad de Granada
2. Rafael Molina Estimación del movimiento en la
imagen
2
Contenidos
! Introducción
! Métodos basados en el desplazamiento de
bloques.
" Modelos para el movimiento de los bloques.
" Modelos basados en la similitud de bloques.
! Bibliografía.
3. Rafael Molina Estimación del movimiento en la
imagen
3
I. Introducción
Como ya hemos visto en el tema anterior, la estimación del
campo de movimiento es el punto de comienzo para la
solución de muchos problemas de movimiento. Podemos
dividir las técnicas para la estimación del campo de
movimiento que veremos en
•Basadas en la ecuación del flujo óptico (técnicas
diferenciales), (ya visto).
•Basadas en el desplazamiento de bloques (este tema).
•Basadas en el acoplamiento de rasgos entre imágenes (tema
siguiente).
4. Rafael Molina Estimación del movimiento en la
imagen
4
II. Métodos basados en el desplazamiento de
bloques.
La estimación del movimiento bidimensional por métodos
basados en la utilización de bloques es el método utilizado
fundamentalmente para la compensación del movimiento en la
mayoría de los estándares de compresión de video.
Este hecho se debe fundamentalmente a la menor complejidad
hardware.
La estimación del movimiento bidimensional basada en bloques
encuentra también una importante aplicación en el filtrado y
restauración de secuencias de vídeo.
5. Rafael Molina Estimación del movimiento en la
imagen
5
II.1 Modelos para el movimiento por bloques
La forma más sencilla de movimiento es considerar que un
bloque de tamaño LxL en la imagen k centrado en el punto
(x0,y0) coincide con un bloque del mismo tamaño en la imagen
k+1. Es decir:
f(x,y,k)=f(x+d1,y+d2,k+1) (x,y) ∈B centrado en (x0,y0)
Bloque B
Bloque B
Imagen k Imagen k+l
6. Rafael Molina Estimación del movimiento en la
imagen
6
Es importante tener en cuenta que si interpolamos la imagen
por un factor L (es decir, aumentamos el tamaño de las filas y
columnas en 2L elementos podemos obtener estimaciones de
los vectores de desplazamiento a nivel subpíxel, es decir, de
tamaño 1/2L.
Este hecho se ha ido teniendo en cuenta en los diferentes
estándares de compresión de vídeo desde H261-H263 hasta
MPEG1, 2 y MPEG4.
7. Rafael Molina Estimación del movimiento en la
imagen
7
Si consideramos que nuestra imagen k se
divide por bloques que no se solapan y para
cada uno de ellos calculamos los
desplazamientos d1 y d2 tendremos que parte
de la imagen k+l puede obtenerse
simplemente copiando el bloque (obsérvese
que puede haber partes de la imagen k+l que
no aparezcan k).
Si los bloques se solapan podemos tener en
algunos píxeles varios vectores de movimiento
que podríamos combinar, por ejemplo,
mediante medias.
B B’
B B’
k
k+l
8. Rafael Molina Estimación del movimiento en la
imagen
8
La estimación y compensación de movimiento por bloques es
muy utilizada por diferentes razones:
•Sólo hay un vector de movimiento por bloque con lo que se
produce un enorme ahorro computacional.
•Existen implementaciones VLSI de bajo costo.
Sin embargo, este método :
•No funciona bien, por ejemplo si se produce un zoom o
rotación o si existen deformaciones locales.
•Produce artificios por bloques en aplicaciones VLBR, ya que
los bloques utilizados pueden no coincidir con los de los
objetos.
9. Rafael Molina Estimación del movimiento en la
imagen
9
Para aliviar este problema podemos considerar, además de la
traslación
x1’=x1+d1, x2’=x2+d2
transformaciones afines generales
x1’=a1x1+a2x2+d1, x2’=b1x1+b2x2+d2
transformaciones por perspectiva (homografías)
x1’=(a1x1+a2x2+d1)/(b1x1+b2x2+1),
x2’ =(c1x1+c2x2+d2)/(e1x1+e2x2+1),
transformaciones bilineales
x1’=a1x1+a2x2+a3x1x2+d1, x2’=b1x1+b2x2+b3x1x2+d2
Sin embargo, la estimación de los correspondientes parámetros se
hace, obviamente, más complicada.
10. Rafael Molina Estimación del movimiento en la
imagen
10
II.2. Modelos basados en la similitud de
bloques
Estos modelos son los más usados en la estimación de
movimiento para la compresión de vídeo.
La idea es considerar un bloque
de tamaño LxL centrado en el
píxel (x,y) en la imagen k y
buscar en la imagen k+1 el
bloque que más se le parezca.
La búsqueda se suele restringir a
una región (L+2M1)x(L +2M2).
k+1
k
Región de
búsqueda
Mayor
similitud
11. Rafael Molina Estimación del movimiento en la
imagen
11
Los diferentes algoritmos de similitud de bloques difieren
fundamentalmente en tres aspectos:
•El criterio de similitud
•La estrategia de búsqueda
•La determinación del tamaño del bloque
Con relación a la estrategia de búsqueda es obvio que se puede
hacer una búsqueda exhaustiva en la región (L+2M1)x(L +2M2),
aunque es también posible restringir el proceso de búsqueda.
Con relación al tamaño: 8x8 y16x16 son los más usados.
Veamos el criterio de similitud.
12. Rafael Molina Estimación del movimiento en la
imagen
12
Consideremos el píxel (x,y) y centrada en él una ventana B de
tamaño LxL, sea N1=L+2M1, N2=L +2M2 Para los posibles vectores
de desplazamiento (d1,d2), con d1∈{-M1,...,M1} y d2∈{-M2,...,M2},
definimos:
( )∑∈
+++−=
Bnn
kdndnfknnf
NN
ddMSE
),(
2
121121
21
21
21
)1,,(),,(
1
),(
y definimos el estimador de Mínimo Error Cuadrático (MSE) como
),(arg, 21),(2
^
1
^
21
ddMSEmindd dd=
13. Rafael Molina Estimación del movimiento en la
imagen
13
El MSE es un criterio que no se suele utilizar en implementaciones
VLSI. En su lugar se utiliza la diferencia absoluta media (MAD)
dada por
)1,,(),,(
1
),( 121121
),(21
21
21
+++−= ∑∈
kdndnfknnf
NN
ddMAD
Bnn
Definimos el estimador de mínima diferencia absoluta media como
),(arg, 21),(2
^
1
^
21
ddMADmindd dd=
14. Rafael Molina Estimación del movimiento en la
imagen
14
III. Bibliografía
•Horn, B.K.P. , (1986), ‘Robot Vision’, MIT Press.
•Horn, B.K.P. y Schunk, B.G. (1981), ‘Determining optical flow’,
Artificial Intelligence, vol. 17, 185-203.
•Tekalp, A.M., (1996), ‘Digital Video Processing’, Prentice-Hall.
•Trucco, E. y Verri, A., (1998), ‘Introductory Techniques for 3-D
Computer Vision’, Prentice Hall.