SlideShare una empresa de Scribd logo
1 de 21
Clasificador de Mínima Distancia
Algoritmo de Clustering K-means
Procesamiento Digital
de Imágenes
J.C. Gómez Procesamiento Digital de
Imágenes
2
 Clasificación por comparación de patrones
• Cada clase es representada por un vector característico
(patrón) que se obtiene luego de un proceso de
entrenamiento con vectores representando a objetos
pertenecientes a esa clase.
• La técnica de clasificación consiste de los siguientes pasos:
- Entrenamiento de patrones
- Comparación del vector característico correspondiente al
objeto a clasificar con los patrones asociados a cada clase.
- Criterio de decisión
J.C. Gómez Procesamiento Digital de
Imágenes
3
Extracción
Vector
Caract.
Entrenamiento Patrón
Comparación
de patrones
Lógica de
Decisión
Clasificación
Entrenamiento
Objeto a
clasificar
Clase
Fig. 1: Clasificación basada en Comparación de Patrones.
El esquema general está representado en Fig. 1
J.C. Gómez Procesamiento Digital de
Imágenes
4
 Entrenamiento de patrones
En esta etapa se construye un patrón de referencia
asociado a cada clase, basándose en los vectores
característicos de todas las instancias de esa clase usadas
para el entrenamiento. Hay varias formas en que puede
realizarse el entrenamiento.
1.Entrenamiento casual: una única instancia de la clase es
usada como patrón (muy poco robusto).
2.Entrenamiento robusto: se utilizan varias instancias de
cada clase para construir un patrón de la misma.
3.Entrenamiento por clustering: se utiliza un gran número
de instancias de cada clase para construir los patrones
asociados.
J.C. Gómez Procesamiento Digital de
Imágenes
5
En la etapa de comparación de patrones se realiza una
comparación directa entre el vector característico asociado al
objeto a clasificar y todos los posibles patrones aprendidos
en la etapa de entrenamiento, de manera de determinar el
mejor ajuste de acuerdo a algún criterio. Surge la necesidad
de definir una medida de similaridad (distancia) entre
vectores característicos que permita determinar cuál es el
patrón de referencia que mejor se ajusta al vector
característico asociado al objeto a clasificar.
 Comparación de patrones
J.C. Gómez Procesamiento Digital de
Imágenes
6
 Medidas de Distancia (ó Distorsión)
• Una característica fundamental de los sistemas de
clasificación con el enfoque de comparación de patrones
es la forma en que los vectores característicos son
combinados y comparados con los patrones de referencia.
• Para poder realizar estas operaciones es necesario definir
una medida de distancia entre vectores característicos.
Definición: Una distancia entre dos vectores x e y de un
espacio vectorial X es una función a valores reales d(x, y)
sobre el producto Cartesiano , que verifica las
propiedades:
X
X 
     
     
        X
d
d
d
X
d
d
d
X
d














z
y
x
z
y
z
x
y
x
y
x
x
y
y
x
y
x
y
x
y
x
y
x
,
,
,
,
,
,
c
,
,
,
,
b
si
solo
y
si
0
,
y
,
,
,
,
0
a
J.C. Gómez Procesamiento Digital de
Imágenes
7
• Algunas de las medidas de distancia más utilizadas son las
distancias o métricas inducidas por las normas en
espacios .
Por ejemplo, si son las
componentes de dos vectores característicos ,
pueden definirse las siguientes métricas inducidas por las
normas
D
i
f
f i
i ,
,
2
,
1
con
,
'


y
'
f
f
p
L
p
L
  




D
i
i
i f
f
f
f
d
1
'
1 , distancia 1
L
   





D
i
i
i f
f
f
f
d
1
2
'
2 , distancia Euclidea (o )
2
L
J.C. Gómez Procesamiento Digital de
Imágenes
8
• Una medida de distancia muy utilizada que tiene en cuenta
la variabilidad de cada componente del vector caracte-
rístico es la distancia Euclidea ponderada, definida como
   
 
2
'
2
1
,
D
w i i i
i
d f f w f f

  

donde
i
i
w

1

siendo una estima de la varianza de la i-ésima
componente . Aquí, los datos que son menos confiables
(con mayor varianza o dispersión) son pesados menos.
2
i

i
f
J.C. Gómez Procesamiento Digital de
Imágenes
9
• Distancia de Mahalanobis
Cuando el vector característico no es homogéneo, en el sentido de
que está compuesto por características de distinta naturaleza,
puede suceder que las distintas componentes estén en distintas
escalas. Al usar la norma Euclidea, o la norma 1, para calcular la
distancia entre vectores, las componentes en las escalas más
pequeñas casi no tendrán influencia en el valor de la distancia, a
pesar de que esas componentes puedan diferir mucho. Surge
entonces la necesidad de usar distancias normalizadas. Una
posible forma de normalizar la distancia entre un vector x y la media
 del conjunto de vectores al cual pertenece x, para el caso
escalar, es definiendo




x
r
donde  es el desvio estándar del conjunto de vectores, y r es
la distancia normalizada.
(1)
J.C. Gómez Procesamiento Digital de
Imágenes
10
De esta forma un vector que está separado un desvio
estándar de la media, estará a una distancia normalizada
igual a 1 (independientemente de las unidades en que se
mida la distancia).
Esta idea se puede generalizar para el caso de un vector
de dimensión d, definiendo
2
2
2
2
2
2
1
1
1
2







 









 








 

d
d
d
x
x
x
r







Esta definición tiene sentido si cada componente del vector
característico mide propiedades independientes del objeto a
clasificar.
Considerando la expresión (1) para el caso escalar, la
distancia normalizada puede escribirse
J.C. Gómez Procesamiento Digital de
Imágenes
11
   


 

 x
x
r
T
2
2 1
donde 2 es la varianza del conjunto de vectores, que para
el caso multidimensional resulta
   

 


 
x
x
r
T 1
2
donde  es la matriz de covarianza del conjunto de vectores.
Esta formulación de la distancia es más general ya que
tiene en cuenta la interacción entre coeficientes a través de
la matriz de covarianza y se la denominada Distancia de
Mahalanobis.
J.C. Gómez Procesamiento Digital de
Imágenes
12
x : vector característico a clasificar
  T
j
e
kj
N
k
j
e
kj
j
j x
x
N
j

 



 
1
1
1
Matriz de Covarianza
(muestral) de los vectores
de entrenamiento
e
kj
x
     
j
j
T
j
j
M x
x
x
d 

 



1
,



j
N
k
e
kj
j
j x
N 1
1

donde
Media (muestral) de los
vectores de entrenamiento
e
kj
x
Si se tienen Nj vectores de entrenamiento para cada una de
las M clases, la distancia de Mahalanobis entre un vector a
clasificar x, y el vector patrón representativo de la clase j,
resulta
J.C. Gómez Procesamiento Digital de
Imágenes
13
 Clasificador de Mínima Distancia
Denotemos con 1, 2 , ..., M a los vectores promedio
representativos de los patrones 1, 2, ..., M, respectivamente,
obtenidos computando la media muestral de los datos de
entrenamiento correspondientes a cada clase. Es decir



j
N
k
e
kj
j
j x
N 1
1
 j=1, 2, ..., M
Donde es el conjunto de datos de entrenamiento
de la clase j .
  j
N
k
e
kj
x 1

La Fig. 1, representa los datos de entrenamiento agrupados
en clusters para el caso de vectores característicos de
dimensión 3.
J.C. Gómez Procesamiento Digital de
Imágenes
14
1
2
3
x
Fig. 1: Datos de entrenamiento
agrupados en clusters
correspondientes a las distintas
clases.
Una manera obvia de clasificar un objeto representado por el
vector x es computar la distancia de x a cada uno de los
patrones 1, 2 , ..., M y asignar a x la clase cuyo patrón
está a la mínima distancia. Por este motivo este clasificador
se denomina de mínima distancia.
J.C. Gómez Procesamiento Digital de
Imágenes
15
Distancia
Distancia
Distancia

Selector
de
Mínimo
1

2

M

x
Clase
reconocida
 
1
,
x
d
 
2
,
x
d
 
M
x
d 
,
Figura 2: Diagrama en bloques de un clasificador de mínima distancia.
J.C. Gómez Procesamiento Digital de
Imágenes
16
 Algoritmo de Clustering K-means
1. Inicialización: Se eligen arbitrariamente M vectores del con-
junto de L vectores de entrenamiento como patrones iniciales de
cada clase.
2. Búsqueda del vecino más cercano: para cada vector de
entrenamiento se busca el patrón que sea el más cercano (de
acuerdo a la medida de distancia que se esté empleando) y se
asigna el vector de entrenamiento a la celda correspondiente a
esa clase.
3. Actualización de centroides: se actualiza el vector patrón
asociado a cada clase por el centroide de los vectores de
entrenamiento asignados a esa celda.
4. Iteración: Se repiten los pasos 2 y 3 hasta que la distancia
promedio cae por debajo de un umbral predeterminado.
J.C. Gómez Procesamiento Digital de
Imágenes
17
• A la etapa de asignación se la denomina Expectation, en
tanto que a la etapa de actualización de centroides se la
denomina Maximization. De esta forma, el algoritmo de K-
means es una variante del algoritmo EM (Expectation-
Maximization).
Ejemplo: 2 clases, 2 atributos, distancia Euclidea
Centroide
inicial Clase 1
Centroide
inicial Clase 2
J.C. Gómez Procesamiento Digital de
Imágenes
18
Hiperplano de separación
de las clases
Actualización de
los centroides
J.C. Gómez Procesamiento Digital de
Imágenes
19
Actualización de
los centroides
J.C. Gómez Procesamiento Digital de
Imágenes
20
J.C. Gómez Procesamiento Digital de
Imágenes
21
Ejemplo: 3 clases

Más contenido relacionado

Similar a Clasificador_minima_distancia_aplicada.ppt

Estrategias de lectura
Estrategias de lecturaEstrategias de lectura
Estrategias de lectura
tempo16
 
Mapas de características auto-organizativas MAO´s de Kohonen
Mapas de características auto-organizativas MAO´s de KohonenMapas de características auto-organizativas MAO´s de Kohonen
Mapas de características auto-organizativas MAO´s de Kohonen
ESCOM
 
Sesion 07 ClasificacióN
Sesion 07 ClasificacióNSesion 07 ClasificacióN
Sesion 07 ClasificacióN
castille
 
redes neuronales Som
redes neuronales Somredes neuronales Som
redes neuronales Som
ESCOM
 

Similar a Clasificador_minima_distancia_aplicada.ppt (20)

Raices deecuaciones
Raices deecuacionesRaices deecuaciones
Raices deecuaciones
 
Clustering K-Means
Clustering K-MeansClustering K-Means
Clustering K-Means
 
Estrategias de lectura
Estrategias de lecturaEstrategias de lectura
Estrategias de lectura
 
Ud 12 distribuciones bidimensionales
Ud 12 distribuciones bidimensionalesUd 12 distribuciones bidimensionales
Ud 12 distribuciones bidimensionales
 
Examen Parcial 2
Examen Parcial 2Examen Parcial 2
Examen Parcial 2
 
Mapas de características auto-organizativas MAO´s de Kohonen
Mapas de características auto-organizativas MAO´s de KohonenMapas de características auto-organizativas MAO´s de Kohonen
Mapas de características auto-organizativas MAO´s de Kohonen
 
Aplicación de análisis numérico en alabes
Aplicación de análisis numérico en alabesAplicación de análisis numérico en alabes
Aplicación de análisis numérico en alabes
 
Taller de derive
Taller de deriveTaller de derive
Taller de derive
 
K11 c
K11 cK11 c
K11 c
 
Kmedias
KmediasKmedias
Kmedias
 
Medidas de dispersión
Medidas de dispersiónMedidas de dispersión
Medidas de dispersión
 
Sesion 07 ClasificacióN
Sesion 07 ClasificacióNSesion 07 ClasificacióN
Sesion 07 ClasificacióN
 
Analisis trabajo
Analisis trabajoAnalisis trabajo
Analisis trabajo
 
BEIOVol30Num3_estadistica
BEIOVol30Num3_estadisticaBEIOVol30Num3_estadistica
BEIOVol30Num3_estadistica
 
Examen parcial 2
Examen parcial 2Examen parcial 2
Examen parcial 2
 
redes neuronales Som
redes neuronales Somredes neuronales Som
redes neuronales Som
 
Vectores
VectoresVectores
Vectores
 
Vectores
VectoresVectores
Vectores
 
Guia gum e_medida
Guia gum e_medidaGuia gum e_medida
Guia gum e_medida
 
Reconocimiento de Patrones
Reconocimiento de PatronesReconocimiento de Patrones
Reconocimiento de Patrones
 

Último

Inmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJH
Inmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJHInmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJH
Inmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJH
Vivafornai
 
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZTIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
varichard
 
647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf
647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf
647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf
MirkaCBauer
 

Último (20)

REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...
REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...
REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...
 
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdfESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
 
subestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicassubestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicas
 
Inmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJH
Inmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJHInmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJH
Inmunología AMIR 14va EdiciónNM,NLKKJHKLJHKJLBHLKJH
 
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZTIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
 
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTSCONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
 
Cuestionario 20222222222222222222222224.pdf
Cuestionario 20222222222222222222222224.pdfCuestionario 20222222222222222222222224.pdf
Cuestionario 20222222222222222222222224.pdf
 
Trabajo de cristalografia. año 2024 mes de mayo
Trabajo de cristalografia. año 2024 mes de mayoTrabajo de cristalografia. año 2024 mes de mayo
Trabajo de cristalografia. año 2024 mes de mayo
 
1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdf1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdf
 
UNIDAD III Esquemas de comunicacion pptx
UNIDAD III Esquemas de comunicacion pptxUNIDAD III Esquemas de comunicacion pptx
UNIDAD III Esquemas de comunicacion pptx
 
slideshare.vpdfs.com_sensores-magneticos-controles-pptx.pdf
slideshare.vpdfs.com_sensores-magneticos-controles-pptx.pdfslideshare.vpdfs.com_sensores-magneticos-controles-pptx.pdf
slideshare.vpdfs.com_sensores-magneticos-controles-pptx.pdf
 
DIFERENCIA DE COMPRESION Y TENSION EN UN CUERPO
DIFERENCIA DE COMPRESION Y TENSION EN UN CUERPODIFERENCIA DE COMPRESION Y TENSION EN UN CUERPO
DIFERENCIA DE COMPRESION Y TENSION EN UN CUERPO
 
647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf
647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf
647913404-06-Partes-principales-de-las-Perforadoras-manuales-1.pdf
 
las humanidades y su impotancia en la formación integral del ingeniero
las humanidades y su impotancia en la formación integral del ingenierolas humanidades y su impotancia en la formación integral del ingeniero
las humanidades y su impotancia en la formación integral del ingeniero
 
Sesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obrasSesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obras
 
REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptxREGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptx
 
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOSTEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
 
TYPP_Industrialización del Petróleo.pptx
TYPP_Industrialización del Petróleo.pptxTYPP_Industrialización del Petróleo.pptx
TYPP_Industrialización del Petróleo.pptx
 
Ficha Técnica -Cemento YURA Multiproposito TIPO IP.pdf
Ficha Técnica -Cemento YURA  Multiproposito TIPO IP.pdfFicha Técnica -Cemento YURA  Multiproposito TIPO IP.pdf
Ficha Técnica -Cemento YURA Multiproposito TIPO IP.pdf
 
subestaciones electricas, distribucion de energia
subestaciones electricas, distribucion de energiasubestaciones electricas, distribucion de energia
subestaciones electricas, distribucion de energia
 

Clasificador_minima_distancia_aplicada.ppt

  • 1. Clasificador de Mínima Distancia Algoritmo de Clustering K-means Procesamiento Digital de Imágenes
  • 2. J.C. Gómez Procesamiento Digital de Imágenes 2  Clasificación por comparación de patrones • Cada clase es representada por un vector característico (patrón) que se obtiene luego de un proceso de entrenamiento con vectores representando a objetos pertenecientes a esa clase. • La técnica de clasificación consiste de los siguientes pasos: - Entrenamiento de patrones - Comparación del vector característico correspondiente al objeto a clasificar con los patrones asociados a cada clase. - Criterio de decisión
  • 3. J.C. Gómez Procesamiento Digital de Imágenes 3 Extracción Vector Caract. Entrenamiento Patrón Comparación de patrones Lógica de Decisión Clasificación Entrenamiento Objeto a clasificar Clase Fig. 1: Clasificación basada en Comparación de Patrones. El esquema general está representado en Fig. 1
  • 4. J.C. Gómez Procesamiento Digital de Imágenes 4  Entrenamiento de patrones En esta etapa se construye un patrón de referencia asociado a cada clase, basándose en los vectores característicos de todas las instancias de esa clase usadas para el entrenamiento. Hay varias formas en que puede realizarse el entrenamiento. 1.Entrenamiento casual: una única instancia de la clase es usada como patrón (muy poco robusto). 2.Entrenamiento robusto: se utilizan varias instancias de cada clase para construir un patrón de la misma. 3.Entrenamiento por clustering: se utiliza un gran número de instancias de cada clase para construir los patrones asociados.
  • 5. J.C. Gómez Procesamiento Digital de Imágenes 5 En la etapa de comparación de patrones se realiza una comparación directa entre el vector característico asociado al objeto a clasificar y todos los posibles patrones aprendidos en la etapa de entrenamiento, de manera de determinar el mejor ajuste de acuerdo a algún criterio. Surge la necesidad de definir una medida de similaridad (distancia) entre vectores característicos que permita determinar cuál es el patrón de referencia que mejor se ajusta al vector característico asociado al objeto a clasificar.  Comparación de patrones
  • 6. J.C. Gómez Procesamiento Digital de Imágenes 6  Medidas de Distancia (ó Distorsión) • Una característica fundamental de los sistemas de clasificación con el enfoque de comparación de patrones es la forma en que los vectores característicos son combinados y comparados con los patrones de referencia. • Para poder realizar estas operaciones es necesario definir una medida de distancia entre vectores característicos. Definición: Una distancia entre dos vectores x e y de un espacio vectorial X es una función a valores reales d(x, y) sobre el producto Cartesiano , que verifica las propiedades: X X                      X d d d X d d d X d               z y x z y z x y x y x x y y x y x y x y x y x , , , , , , c , , , , b si solo y si 0 , y , , , , 0 a
  • 7. J.C. Gómez Procesamiento Digital de Imágenes 7 • Algunas de las medidas de distancia más utilizadas son las distancias o métricas inducidas por las normas en espacios . Por ejemplo, si son las componentes de dos vectores característicos , pueden definirse las siguientes métricas inducidas por las normas D i f f i i , , 2 , 1 con , '   y ' f f p L p L        D i i i f f f f d 1 ' 1 , distancia 1 L          D i i i f f f f d 1 2 ' 2 , distancia Euclidea (o ) 2 L
  • 8. J.C. Gómez Procesamiento Digital de Imágenes 8 • Una medida de distancia muy utilizada que tiene en cuenta la variabilidad de cada componente del vector caracte- rístico es la distancia Euclidea ponderada, definida como       2 ' 2 1 , D w i i i i d f f w f f      donde i i w  1  siendo una estima de la varianza de la i-ésima componente . Aquí, los datos que son menos confiables (con mayor varianza o dispersión) son pesados menos. 2 i  i f
  • 9. J.C. Gómez Procesamiento Digital de Imágenes 9 • Distancia de Mahalanobis Cuando el vector característico no es homogéneo, en el sentido de que está compuesto por características de distinta naturaleza, puede suceder que las distintas componentes estén en distintas escalas. Al usar la norma Euclidea, o la norma 1, para calcular la distancia entre vectores, las componentes en las escalas más pequeñas casi no tendrán influencia en el valor de la distancia, a pesar de que esas componentes puedan diferir mucho. Surge entonces la necesidad de usar distancias normalizadas. Una posible forma de normalizar la distancia entre un vector x y la media  del conjunto de vectores al cual pertenece x, para el caso escalar, es definiendo     x r donde  es el desvio estándar del conjunto de vectores, y r es la distancia normalizada. (1)
  • 10. J.C. Gómez Procesamiento Digital de Imágenes 10 De esta forma un vector que está separado un desvio estándar de la media, estará a una distancia normalizada igual a 1 (independientemente de las unidades en que se mida la distancia). Esta idea se puede generalizar para el caso de un vector de dimensión d, definiendo 2 2 2 2 2 2 1 1 1 2                                d d d x x x r        Esta definición tiene sentido si cada componente del vector característico mide propiedades independientes del objeto a clasificar. Considerando la expresión (1) para el caso escalar, la distancia normalizada puede escribirse
  • 11. J.C. Gómez Procesamiento Digital de Imágenes 11           x x r T 2 2 1 donde 2 es la varianza del conjunto de vectores, que para el caso multidimensional resulta            x x r T 1 2 donde  es la matriz de covarianza del conjunto de vectores. Esta formulación de la distancia es más general ya que tiene en cuenta la interacción entre coeficientes a través de la matriz de covarianza y se la denominada Distancia de Mahalanobis.
  • 12. J.C. Gómez Procesamiento Digital de Imágenes 12 x : vector característico a clasificar   T j e kj N k j e kj j j x x N j         1 1 1 Matriz de Covarianza (muestral) de los vectores de entrenamiento e kj x       j j T j j M x x x d        1 ,    j N k e kj j j x N 1 1  donde Media (muestral) de los vectores de entrenamiento e kj x Si se tienen Nj vectores de entrenamiento para cada una de las M clases, la distancia de Mahalanobis entre un vector a clasificar x, y el vector patrón representativo de la clase j, resulta
  • 13. J.C. Gómez Procesamiento Digital de Imágenes 13  Clasificador de Mínima Distancia Denotemos con 1, 2 , ..., M a los vectores promedio representativos de los patrones 1, 2, ..., M, respectivamente, obtenidos computando la media muestral de los datos de entrenamiento correspondientes a cada clase. Es decir    j N k e kj j j x N 1 1  j=1, 2, ..., M Donde es el conjunto de datos de entrenamiento de la clase j .   j N k e kj x 1  La Fig. 1, representa los datos de entrenamiento agrupados en clusters para el caso de vectores característicos de dimensión 3.
  • 14. J.C. Gómez Procesamiento Digital de Imágenes 14 1 2 3 x Fig. 1: Datos de entrenamiento agrupados en clusters correspondientes a las distintas clases. Una manera obvia de clasificar un objeto representado por el vector x es computar la distancia de x a cada uno de los patrones 1, 2 , ..., M y asignar a x la clase cuyo patrón está a la mínima distancia. Por este motivo este clasificador se denomina de mínima distancia.
  • 15. J.C. Gómez Procesamiento Digital de Imágenes 15 Distancia Distancia Distancia  Selector de Mínimo 1  2  M  x Clase reconocida   1 , x d   2 , x d   M x d  , Figura 2: Diagrama en bloques de un clasificador de mínima distancia.
  • 16. J.C. Gómez Procesamiento Digital de Imágenes 16  Algoritmo de Clustering K-means 1. Inicialización: Se eligen arbitrariamente M vectores del con- junto de L vectores de entrenamiento como patrones iniciales de cada clase. 2. Búsqueda del vecino más cercano: para cada vector de entrenamiento se busca el patrón que sea el más cercano (de acuerdo a la medida de distancia que se esté empleando) y se asigna el vector de entrenamiento a la celda correspondiente a esa clase. 3. Actualización de centroides: se actualiza el vector patrón asociado a cada clase por el centroide de los vectores de entrenamiento asignados a esa celda. 4. Iteración: Se repiten los pasos 2 y 3 hasta que la distancia promedio cae por debajo de un umbral predeterminado.
  • 17. J.C. Gómez Procesamiento Digital de Imágenes 17 • A la etapa de asignación se la denomina Expectation, en tanto que a la etapa de actualización de centroides se la denomina Maximization. De esta forma, el algoritmo de K- means es una variante del algoritmo EM (Expectation- Maximization). Ejemplo: 2 clases, 2 atributos, distancia Euclidea Centroide inicial Clase 1 Centroide inicial Clase 2
  • 18. J.C. Gómez Procesamiento Digital de Imágenes 18 Hiperplano de separación de las clases Actualización de los centroides
  • 19. J.C. Gómez Procesamiento Digital de Imágenes 19 Actualización de los centroides
  • 20. J.C. Gómez Procesamiento Digital de Imágenes 20
  • 21. J.C. Gómez Procesamiento Digital de Imágenes 21 Ejemplo: 3 clases