SlideShare una empresa de Scribd logo
1 de 8
Descargar para leer sin conexión
1 
Reconocimiento de patrones y m´etodos de 
clasificaci´on en im´agenes digitales 
Miguel Armando L´opez Beltr´an 
Universidad Aut´onoma de Sinaloa 
Facultad de Ciencias de la Tierra y el Espacio 
miguel.armandolb@gmail.com 
Enero 2013 
Resumen—Este es un documento que trata sobre el reconoci-miento 
de patrones y una descripci´on breve sobre clasificadores 
estad´ısticos y redes neuronales. 
I. INTRODUCCI´O 
N 
El procesamiento digital de im´agenes se divide en dos 
aspectos: el procesamiento y el an´alisis de las im´agenes[6]. 
El procesamiento se refiere a la transformaci´on y restaura-ci 
´on y mejoramiento de la im´agenes[6]. 
Por otro lado el an´alisis de im´agenes es un proceso que con-siste 
descubrir, identificar y comprender ciertos patrones y/o 
propiedades que son relevantes en la realizaci´on de cualquier 
trabajo basado en im´agenes digitales[6,8,10,15]. Sin embargo, 
el proceso de an´alisis de im´agenes se dividen en tres ´areas 
b´asicas : 
Procesado de bajo nivel: Son funciones autom´aticas 
y no requieren inteligencia por parte del sistema de 
an´alisis (reducci´on de ruido, realce de contraste, realce 
de caracter´ısticas, etc.). 
Procesado de nivel intermedio: Comprende la extracci´on 
y caracterizaci´on de los componentes de la imagen 
obtenida en el procesos de bajo nivel (segmentaci´on 
(regiones, objetos) descripci´on de objetos y clasificaci´on 
o reconocimiento). 
Procesado de alto nivel: Comprende el reconocmiento 
y la interpretaci´on, an´alisis de la imagen y funciones 
cognitivas. 
Figura 1. Modelo general de procesamiento de im´agenes. Fuente: [10,15] 
Por lo tanto, existe una gran gamma de ´areas en la ciencias 
para las aplicaciones del procesamiento digital de im´agenes, 
entre las principales se encuentra: medicina, biolog´ıa, astro-nom 
´ıa, agricultura, historia, fotograf´ıa, geom´atica, veterinaria, 
etc., en el cual se puede aplicar cualquier nivel de procesa-miento[ 
6,8]. 
Pero para el an´alisis de la imagen en cualquier nivel de 
procesamiento es importante realizar un reconocimiento de 
patrones. 
II. RECONOCIMIENTO DE PATRONES 
El reconocimiento de patrones en im´agenes se encuentra 
en un campo muy amplio en la investigaci´on[3]. El reco-nocimiento 
asigna un nombre a un objeto, bas´andose en la 
informaci´on que proveen sus descriptores, y la interpretaci´on 
asigna su significado a un conjunto de objetos reconocidos[15]. 
Sobrado[18] define el reconocimiento de patrones como: “es 
la categorizaci´on de datos de entrada en clases identificadas, 
por medio de la extracci´on de caracter´ısticas significativas o 
atributos de los datos extra´ıdos de un medio ambiente que 
contiene detalles relevantes”. 
Adem´as Gonz´ales & Woods[10] definen un patr´on como 
“es una descripci´on estructural o cuantitativa de un objeto 
o de alguna otra entidad de inter´es en una imagen, en otras 
palabras es una disposici´on de descriptores” y una clase de 
patrones como “es una familia de patrones que comparten 
algunas propiedades comunes”. 
Por lo tanto, el reconocimiento de patrones de un determi-nado 
espacio son clasificados en un conjunto discreto de clases 
de patrones, en donde cada una de las clases es definida con 
un patr´on representante de la clase y viene dado previamente 
al inicio del proceso de clasificaci´on[16]. 
Por lo tanto, las clases de patrones se representan como 
w1;w2; :::;wn, donde n representa el n´umero total de cla-ses[ 
10,15,16]. 
De acuerdo con Sobrano[18] los sistemas de reconocimiento 
de patrones se pueden identificar en 4 tipos de metodolog´ıas: 
Heur´ısticas: Metodolog´ıa base al uso de la experiencia y 
la intuici´on humana. 
Matem´aticas: Metodolog´ıa que hace uso de las propie-dades 
comunes de los patrones y se basan en reglas 
de clasificaci´on formuladas en un marco matem´atico. Se 
divide en dos ´areas: 
 Determin´ısticas: No requieren de propiedades es-tad 
´ısticas. Ejemplo clasificaci´on por distancia eucli-diana.
2 
Figura 2. Iris etosa, Iris Versicolor, Iris virginica. Fuente: [19]. 
 Estad´ısticas: Aproximaci´on m´as simple que consiste 
en representar a cada patr´on mediante un vector de 
n´umeros, y cada clase por uno o varios patrones 
prototipo. 
Ling¨u´ısticas: Reducen un objeto a un conjunto de ele-mentos 
estructurales o primitivas, a˜nadiendo una sintaxis 
para relacionar estos elementos de forma espacial, es de-cir, 
descomponiendo a los objetos complejos en t´erminos 
de conjuntos de primitivas (arcos, ´angulos, rectas, etc.) 
con reglas para describir la relaci´on espacial entre ellas. 
Redes neuronales artificiales: El an´alisis implica la con-figuraci 
´on de una red de neuronas artificiales y el entre-namiento 
de la red para determinar como las neuronas 
individuales pueden afectar uno a la otra, el modo de 
reconocimiento implica el env´ıo de datos a trav´es de la 
red y la evaluaci´on a que clase se aproximar´a m´as. 
Gonz´ales  Woods y Romo[15], menciona que las princi-pales 
representaciones de patrones utilizados en la pr´actica 
son[10,15]: 
Vectores: Descripciones cuantitativas. 
Cadenas. 
A´rboles: Descripciones estructurales. 
II-A. Patrones vectoriales 
Los patrones vectoriales se representan utilizando letras 
min´usculas en negrita, como x, y, z, se representan como 
matrices (nx1) (ecuaci´on 1)[10]. 
x = 
2 
x1 
x2 
::: 
xn 
664 
3 
775 
(1) 
Donde cada componente, xi representa el i-´esimo descriptor 
y n es el n´umero de descriptores. 
Un ejemplo que da Gonz´ales  Woods[10], es describir 
tres tipos de lirios (Iris setosa, Iris virginica e Iris versicolor 
(Figura 2), por la medida de la longitud y la anchura de sus 
p´etalos. Por lo tanto, se utilizo vectores bidimensionales (ver 
ecuaci´on 2). 
x = 
 
x1 
x2 
 
(2) 
x1 y x2 corresponden a la anchura y longitud del p´etalo de 
las Iris spp. Las tres clases de patrones, se representan por 
w1, w2 y w3. En la figura 3 muestra las medidas de anchura 
y longitud para cada tipo de lirio. Se observa que la elecci´on 
de caracter´ısticas podr´a discriminar perfectamente la clase Iris 
setosa de las otras dos, pero no as´ı las clases Iris versicolor 
e Iris virginica entre s´ı. 
Figura 3. Dos medidas realizadas para tres tipos de lirios. Fuente: [10]. 
Otro m´etodo en la generaci´on de patrones vectoriales es con 
respecto a la firma generada por sus contornos. 
Una firma es una representaci´on funcional unidimensional 
de un contorno y se pueden generar en var´ıas formas. La forma 
m´as simple es representar la distancia desde un punto de vista 
interior, como puede ser el centroide al contorno como una 
funci´on del ´angulo. En otras palabras, la idea b´asica de una 
firma es reducir la representaci´on del contorno a una funci´on 
unidimensional. 
Figura 4. Firma correspondiente a tres objetos. 
En la figura 4 las im´agenes superiores (circulo y cuadrado), 
su firma es en relaci´on entre el ´angulo y la distancia con el 
centroide, mientras que la imagen inferior es en funci´on a su 
contorno. 
II-B. Patrones de cadena 
Las representaciones en forma de cadena generan adecua-damente 
patrones de objetos y otras entidades cuya estructura 
se basa en conexiones relativamente sencillas de sentencias,
3 
que normalmente est´an asociadas a formas de bordes o con-tornos[ 
10]. 
Un ejemplo en reconocimiento de patrones de cadenas que 
presenta Gonz´ales  Woods[10] es un patr´on en forma de 
escalera (figura 5), aunque ´este patr´on puede ser expresado en 
t´erminos de un patr´on vectorial utilizando un m´etodo de firmas 
(figura 4), aunque se perder´ıa la estructura b´asica, que consiste 
en la representaci´on de dos sencillos elementos a y b. Es por 
ello, que es m´as l´ogico definir los elementos a y b y hacer que 
el patr´on sea la cadena de s´ımbolos W = abababab::: como 
se muestra en la figura 5. 
Figura 5. Estructura codificada en t´erminos de los primitivos a y b [10]. 
II-C. Patrones de ´arboles 
Un ´arbol es una estructura jer´arquica aplicada sobre una 
colecci´on de elementos u objetos llamados nodos, donde uno 
es conocido como ra´ız, creando una relaci´on o parentesco entre 
los nodos dando lugar a t´erminos como padre, hijo, hermano, 
antecesor, sucesor, ancestro, etc.[2]. 
Cair´o  Guardati[2] menciona las principales caracter´ısticas 
y propiedades de los ´arboles en general son: 
Todo ´arbol que no es vac´ıo, tiene un ´unico nodo ra´ız. 
Todos los nodos que son descendientes directos (hijos) 
de un mismo nodo (padre), son hermanos. 
Todo nodo que no tiene ramificaciones (hijos), se conoce 
con el nombre de terminal u hoja. 
Todo nodo que no es ra´ız, ni terminal u hoja se conoce 
con el nombre de interior. 
El grado es el n´umero de descendientes directos de un 
determinado nodo. El grado del ´arbol es el m´aximo grado 
de todos los nodos del ´arbol. 
El nivel es el n´umero de arcos que deben ser recorridos 
para llegar a un determinado nodo. Por lo tanto la ra´ız 
tiene un nivel 1. 
La altura del ´arbol es el m´aximo n´umero de niveles de 
todos los nodos del ´arbol. 
Es una t´ecnica potente para muchas aplicaciones, donde la 
mayor´ıa de los esquemas de ordenaci´on jer´arquica dan lugar 
Figura 6. Ciudad de Culiac´an, Sinaloa. Imagen extra´ıda de Google Earth. 
a estructuras de tipo ´arbol, un ejemplo de ello es una imagen 
de fotograf´ıa a´erea o imagen satelital[10]. 
Un ejemplo de ´esta t´ecnica es la siguiente: tomando como 
referencia la ciudad de Culiac´an que representa una imagen 
compuesta de zonas rurales, agr´ıcolas, urbanas, cuerpos de 
agua, caminos terracer´ıa, pavimento, autopistas, etc. La ra´ız 
del ´arbol representa la imagen completa, aunque sus rami-ficaciones 
son muy abstractas, la idea de representaci´on se 
muestra en la figura 7. El nivel siguiente representa las ´areas 
compuestas de v´ıas de comunicaci´on, zonas agr´ıcolas, rurales 
y urbanas, a la vez se componen de m´as nodos, a excepci´on 
del nodo de zona rural el cual termina siendo una hoja. La 
altura del ´arbol est´a basado en 4 niveles, lo cual es suficiente 
para la representaci´on abstracta del ejemplo. 
Figura 7. Representaci´on de ´arbol en base a la figura 6. 
III. RECONOCIMIENTOS DE PATRONES BASADOS EN 
M´E 
TODOS MATEM´A 
TICOS DE DECISI´O 
N 
Uno de los motivos del uso de m´etodos de clasificaci´on 
est´a dada por las caracter´ısticas de los elementos, los cuales 
disponen de cierta caracter´ıstica similares que pueden asig-narse 
a cierta clase, la cual representar´ıa la caracter´ıstica en 
cuesti´on. 
´ Esta semejanza entre los elementos se utilizan para asig-nar 
la clase. Las t´ecnicas de clasificaci´on, proporcionan una 
herramienta para asignar que elementos pertenecen a x clase.
4 
La clasificaci´on de im´agenes parte de un m´etodo y de una 
medida cuantitativa que ayuda a encontrar la semejanza o no, 
entre las partes de la imagen. Los m´etodos pueden aplicar una 
t´ecnica supervisada o no supervisada, con enfoque estad´ıstico 
o de redes neuronales[9]. 
Sin embargo, Chuvieco Salinero[4], menciona un tercer 
m´etodo, los m´etodos mixtos. 
Adem´as, como ya se menciono anteriormente, Sobrano[18] 
menciona que los reconocimientos de patrones que utilizan 
metodolog´ıa matem´atica se dividen en dos: (1) determin´ısticas 
y (2) estad´ısticas. 
Los clasificadores estad´ısticos consideran que los patrones 
de las clases forman una poblaci´on estad´ıstica caracterizada 
por una determinada funci´on de distribuci´on o funci´on de 
densidad, donde las funciones tienen una forma generalmente 
desconocida, por lo tanto los clasificadores intentan ajustarlos 
a los diferentes modelos te´oricos, siguiendo enfoques pa-ram 
´etricos y no param´etricos, los clasificadores determin´ısticas 
no consideran la funci´on de distribuci´on o funci´on de densi-dad[ 
9]. 
Gil et al.[9] menciona algunos ejemplos de clasificadores 
estad´ısticos, los cuales se encuentran: m´axima verosimilitud, 
paralelep´ıpedos, m´ınima distancia, vecino m´as cercano, K-means, 
ISODATA. 
III-A. Clasificaci´on supervisada 
El usuario parte de cierto conocimiento de la zona de estu-dio, 
fundamentalmente el usuario define con m´axima precisi´on 
cada una de las categor´ıas que ´este pretende discriminar, 
antes de efectuar la clasificaci´on, es decir, el usuario al 
conocer la zona de estudio, delimita ´areas representativas de 
las clases a clasificar, ´estas ´areas en cuesti´on se denominan 
“Training Field” (Campos de entrenamiento), el t´ermino de 
campos de entrenamiento sirven para “entrenar” al software 
de clasificaci´on en el reconocimiento de las distintas ´areas, a 
partir de ´este entrenamiento se caracterizan las ´areas de cada 
una de las clases, y se asignan los elementos correspondientes 
en toda la imagen pertenecientes a cada determinada clase. 
El proceso de definici´on de clases representativa se le conoce 
como fases de entrenamiento[1,4,9]. 
Algunos ejemplos de clasificadores supervisados son[9,17]: 
M´axima verosimilitud. 
Paralelep´ıpedos. 
M´ınima distancia. 
Vecino m´as cercano. 
III-B. Clasificaci´on no supervisada 
Se realiza a partir de un conjunto de patrones del que 
no se conoce su clase. B´asicamente se trata de encontrar 
agrupamientos[18]. No es necesario conocer el ´area de estudio 
por parte del usuario que va realizar la clasificaci´on, sin 
embargo tendr´a que interpretar las clases que son generadas 
por la clasificaci´on, por lo tanto la imagen es segmentada al 
n´umero de clases del cual no requiere ning´un muestreo o fase 
de entrenamiento[1,4,9]. 
Algunos ejemplos de clasificadores no supervisados[9,17] 
ISODATA. 
K-means. 
III-C. Clasificaci´on mixta 
De acuerdo con Chuvieco Salinero[4], los m´etodos supervi-sados 
y no supervisados cuentan con ventajas e inconvenientes. 
El m´etodo supervisado resulta muchas veces subjetivo, pues 
el usuario establece a priori unas categor´ıas sin valorar las 
caracter´ısticas de la imagen, el m´etodo no supervisado no 
garantiza que las clases deducidas tengan significado para el 
usuario del producto, adem´as es dif´ıcil su verificaci´on. Con la 
intenci´on de reducir los inconvenientes en ambos m´etodos, se 
han propuesto alternativas que los combinan de alguna forma. 
IV. CLASIFICADORES ESTAD´I 
STICOS 
IV-A. M´axima verosimilitud 
Tambi´en conocido como M´axima probabilidad, es el algo-ritmo 
m´as usado en clasificaci´on de im´agenes, dado que es 
sencillo su aplicaci´on e interpretaci´on de sus resultados[11]. El 
m´etodo utiliza el an´alisis estad´ıstico de medias, varianzas y 
covarianzas de un conjunto de datos de entrenamiento, cuyo 
contenido se supone que tiene una distribuci´on normal[7,17]. 
´ Este clasificador es m´as complejo dado a que demanda 
mayor volumen de c´alculos, sin embargo, es el m´as empleado, 
por su robustez y por ajustar con m´as rigor los p´ıxeles de cada 
clase[17]. 
En la fase de entrenamiento, el algoritmo elabora el reco-nocimiento 
de los patrones de cada clase con los par´ametros 
estad´ısticos de la media, varianza y covarianza de un conjuntos 
de ´areas de entrenamiento localizados en la imagen. En la 
fase de clasificaci´on, se calcula cada p´ıxel (ecuaci´on 3), la 
probabilidad de pertenencia a cada clase, para cada uno de los 
p´ıxeles de la imagen con base a su respuesta del patr´on. Por 
´ultimo el p´ıxel se asigna a la clase de mayor probabilidad de 
permanencia[11]. 
P(HjE) = 
P(EjH)p(H) 
p(E) 
(3) 
Donde: 
P(HjE) es la probabilidad condicionada de la hip´otesis 
H, dado la evidencia E, es decir la probabilidad de que 
el p´ıxel permanezca a cierta clase (Hip´otesis H) tomando 
en cuenta su respuesta del patr´on (Evidencia E). 
p(H) es la probabilidad de que un p´ıxel permanezca a la 
clase considerada en la hip´otesis H sin tomar en cuenta 
su informaci´on de patr´on. 
p(E) es la probabilidad de la evidencia E. 
P(EjH) es la probabilidad condicionada de la evidencia 
E dada la hip´otesis H. 
Chuvieco[4] menciona otra manera de clasificaci´on de m´axi-ma 
verosimilitud en caso de estar trabajando con im´agenes 
monocrom´aticas, que puede calcular la probabilidad de perte-nencia 
a cierta clase de acuerdo con la ecuaci´on 4. 
p(x=A) = 
1 p 
22A 
f 
(NDx  A)2 
22A 
g 
(4) 
Donde:
5 
Figura 8. Ejemplo de paralelep´ıpedo con p´ıxeles sin clasificar. 
p(x=A): Probabilidad de que un p´ıxel x, pertenezca a la 
clase A. 
NDx: Valor del p´ıxel. 
A: Valor medio de la clase. 
A: Varianza de la clase. 
El p´ıxel sera asignado a la clase A s´olo si: p(x=A)  
p(x=B) variando B desde 1 hasta c, siendo c el n´umero de 
clases. 
IV-B. Clasificador paralelep´ıdos 
El clasificador paralelep´ıpedos es computacionalmente efi-ciente 
para clasificar elementos, sin embargo, algunos parale-lep 
´ıpedos se sobreponen[17]. Esto se da a que el usuario fija 
un ´area de dominio para cada una de las clases, teniendo en 
cuenta sus valores centrales y dispersi´on[4]. 
Vmin  Vrx  Vmax (5) 
Donde: 
Vmin: Valor m´ınimo del rango de la clase. 
Vmax: Valor m´aximo del rango de la clase. 
Vrx: Valor correspondiente del pixel. 
Por lo tanto el p´ıxel es asignado a una determinada clase si 
sus valores se encuentran a menos de una determinada distan-cia 
del centro de clases, ´esta distancia se fija por el usuario, 
aunque suele identificarse con la desviaci´on est´andar[4]. 
Algunos inconvenientes en el dise˜no de ´areas de dominio 
pueden implicar: 
Que existan p´ıxeles en zonas comunes a dos o m´as 
categor´ıas. 
Que existan p´ıxeles sin clasificar. 
Es por ello que no es recomendado cuando se consideran 
clases mixtas. 
IV-C. M´ınima distancia 
Es el criterio m´as sencillo para asignar un p´ıxel a una de 
las clases[4], es por ello que es una forma para determinar de 
qu´e clase es miembro un patr´on desconocido x, por lo tanto 
se asigna a la clase m´as cercano a su prototipo . Se puede 
usar la distancia euclidiana para determinar la proximidad o 
cualquier combinaci´on, utilizando la distancia euclidiana, se 
reduce el problema a computar las medidas de distancia[17]. 
La distancia se compara con los valores del patr´on con los 
valores centrales de las clases de la imagen[4]. 
La ecuaci´on m´as empleada es[4]: 
dx;A = 
vuut 
Xm 
i=1 
(ENDA  NDx)2 (6) 
Donde: 
dx;A: medida de la distancia entre el p´ıxel x y la categor´ıa 
A. 
ENDA: Valor medio de la categor´ıa. 
NDx: valor correspondiente al p´ıxel a clasificar. 
No es recomendable para aplicaciones en que las clases de 
patrones est´an cercanas una de otras en el espacio medidas y 
tienen una alta varianza[17]. Sin embargo, es bastante sencillo y 
r´apido de ejecutar, adecuado cuando las distancias entre clases 
es grande comparada con la dispersi´on de los elementos de 
cada clase y delimita a grupos circulares de radio proporcional 
a la situaci´on de cada clase (ver figura 9)[4]. 
Figura 9. Agrupaciones de m´ınima distancia. 
IV-D. Vecino m´as cercano 
Conocido como K-NN por sus siglas en ingl´es (K- Near 
Neighborhood), es un clasificador no param´etrico. Es una 
compilaci´on del clasificador de distancia [14]. La idea b´asica el 
cual se fundamenta ´este clasificador es que un nuevo patr´on 
se va a clasificar en la clase m´as frecuente a la que pertenece 
sus K vecinos m´as cercanos[12]. Es decir, el p´ıxel con patr´on 
x se va asignar a la clase m´as frecuente a la que pertenecen 
sus Kc vecinos m´as cercanos, los vecinos tienen la misma 
importancia de decisi´on, sin considerar las distancias de x. 
En la figura 10 se muestra un ejemplo donde el circulo verde 
representa el patr´on que se desea clasificar a cualquiera de 
las dos clases (cuadrados azules y tri´angulos rojos), tomando 
como referencia 3 vecinos (K3) el circulo se clasificara como 
triangulo, sin embargo, si se toma de referencia 5 vecinos 
(K5), se clasifica como cuadrado. Esto se debe a la cantidad 
de vecinos cercanos al patr´on a clasificar. El par´ametro de 
vecinos siempre es un n´umero impar. 
La principal desventaja es la alta carga computacional, 
dado que se almacenan muchos patrones y se calcula muchas 
distancias[14]. 
Dispone de algunas variantes entre ellas[12] 
K-NN con rechazo. 
K-NN con distancia m´ınima. 
K-NN con distancia media. 
K-NN con ponderaci´on en las variables. 
K-NN con ponderaci´on a clases seleccionadas.
6 
Figura 10. Ejemplo de K-NN 
IV-E. K-Means 
De acuerdo con Sanz[17], el nombre hace referencia a que 
se conoce el n´umero de clases o patrones involucrados, es un 
algoritmo sencillo, eficiente, siempre y cuando se conozca el 
valor de k con exactitud. 
El algoritmo est´a basado en el an´alisis de las varianzas, 
agrupa un conjunto de datos en un n´umero predefinidos de 
clases o grupos. El proceso es el siguiente[5,17]: 
1. Inicia al seleccionar al azar el conjunto de elementos a 
agrupar en k (N´umero de clases) de forma que se pueda 
generar los centroides de la clase. 
2. Continua con un proceso recursivo, en la cual cada 
interacci´on gen´erica n se distribuyen y reasignan los 
patrones del conjunto entre las k clases de acuerdo a 
la menor distancia de la muestra y los centroides en 
dichas clases. 
3. Posteriormente del proceso de reasignaci´on, se actuali-zan 
los centroides, y se procede con el paso anterior de 
nuevo. 
4. El proceso de reasignaci´on no se detiene hasta que 
converge al criterio de parada, es decir, cuando alcanza 
el par´ametro para terminar, como por ejemplo el n´umero 
de interacciones o que los centroides no cambien). 
IV-F. ISODATA 
ISODATA es el acr´onimo de la definici´on en ingl´es: Inter-active 
Self-organizing Data Analysis Techniques[7,17] 
Es similar al K-means[7,17], pero con el agregado de una 
cantidad de par´ametros y operaciones que llevan a mejorar, por 
ejemplo el valor k de K-medias es un valor exacto de clases, en 
ISODATA es un valor esperado del n´umero de clases, es decir 
empieza con A clases e intenta aproximarse a k clases[17]. 
Sin embargo, para la eliminaci´on o persistencia de las clases 
se basa en los criterios[7]: 
Combinaci´on: Si dos centros de clases est´an m´as cercas 
que el umbral definido, se combinan y una nueva media 
es determinada. 
N´umero de miembros de la clase: Si el n´umero de 
miembros de una clase es menor al n´umero determinado, 
est´a clase se disuelve y se asigna a la clase m´as cercana. 
Separaci´on: Si la varianza, el n´umero de miembro o la 
distancia media excede los valores predefinidos, entonces 
el grupo se puede dividir. 
De acuerdo con Sanz[17] las ventajas y desventajas que 
presentan son: 
Provee mejores resultados que el m´etodo de K-medias. 
Es fuertemente dependiente de los par´ametros ingresa-dos, 
por lo que hay que tener suficiente conocimiento 
sobre ellos. 
Permite una mayor interacci´on con el usuario, mediante 
el ajuste de los par´ametros. Si se tiene un conocimiento 
del tipo de la imagen con la que se trabaja logrando 
mejores resultados. 
V. REDES NEURONALES ARTIFICIALES 
Las redes neuronales son modelos matem´aticos basados en 
una estructura que permite procesar entradas de forma similar 
a la que ocurre en el cerebro, est´an compuestas por peque˜nas 
unidades llamadas neuronas que pueden estar entrelazadas 
entre s´ı[3,9]. 
Existen diversos modelos y paradigmas de redes neuro-nales[ 
9] pero el modo de an´alisis implica una configuraci´on 
de la red neuronal y un entrenamiento a la red que permite 
determinar como las neuronas individuales trabajen colectiva-mente 
de diferentes maneras, de modo que el reconocimiento 
implica el env´ıo de datos a trav´es de la red y la evaluaci´on 
a que clase se aproximar´a m´as, en otras palabras una red 
neuronal es una estructura y distribuida de procesamiento 
de informaci´on, compuesta por procesadores elementales in-terconectados 
mediante pesos sin´apticos[9,18]. Generalmente 
las redes neuronales toman una entrada num´erica y produce 
tambi´en una salida num´erica[14]. 
Su principal rasgo es que es un sistema capaz de aprender 
a partir de una colecci´on de datos de entrenamiento, cada 
entrada se multiplica por un peso de conexi´on (Wi;j )[3,14]. 
La implementaci´on de una red neuronal atraviesa por un 
periodo de prueba y error en el dise˜no de la misma antes 
de encontrar el dise˜no satisfactorio[17]. De manera general las 
redes neuronales presentan tres caracter´ısticas: 
Aprendizaje: ´ Esta caracter´ıstica se refiere a que la neu-rona 
de la red dispone de una capacidad de almacenar 
conocimiento a trav´es de un entrenamiento. 
Generalizaci´on: Se refiere a que se obtiene informaci´on 
de salida razonables. 
Adaptabilidad: La red neuronal puede ser nuevamente 
entrenada para funcionar adecuadamente ante los cam-bios. 
El dise˜no de una red consiste en[18] 
Arreglar las neuronas en varias capas. 
Decidir el tipo de conexi´on entre las neuronas de dife-rentes 
capas, as´ı como entre las neuronas de una misma 
capa. 
Decidir la forma en que una neurona recibe una entrada 
y produce una salida.
7 
Figura 11. Esquema de red neuronal. Fuente: [17] 
Determinar el peso de cada conexi´on dentro de la red, 
permitiendo que la red aprenda los valores apropiados de 
los pesos de conexi´on, usando el conjunto de datos de 
entrenamiento. 
Existen muchas arquitecturas de redes neuronales entre ellas 
se encuentran: Perceptrones multicapa o de una sola capa, 
Redes recurrentes y de Hopfield, Redes de Kohonen, RBF 
(Radial Basis Function), resonancia adaptativa, recurrente, 
pulso-acomplado, entre otros m´as[13,17,18]. 
Seg´un Sobrano[18], las redes neuronales artificiales tiene 
muchas similitudes con el reconocimiento estad´ıstico de pa-trones, 
esto dado que concierne en la representaci´on de datos 
y los principios de clasificaci´on, pero en la cuesti´on pr´actica 
son diferentes. Por otro lado menciona algunas ventajas que 
presentan las redes neuronales enfrente a los clasificadores 
estad´ısticos: 
Te´oricamente se pueden determinar cualquier funci´on, 
por lo que son adecuadas en aplicaciones que no son 
f´acilmente descritas anal´ıticamente. 
Excepto por los patrones de entrada, no es necesario 
suministrar informaci´on adicional. 
Se puede aplicar cualquier tipo de datos. 
Se obtienen buenos resultados con datos ruidosos. 
No se hacen hip´otesis acerca de la distribuci´on estad´ıstica 
de las variables de entrada. 
Los modelos neuronales no necesitan un conocimiento a 
priori de los par´ametros internos del clasificador. 
Despu´es de entrenadas son extremadamente r´apidas y 
f´acilmente implementadas. 
En Sobrado[18] se puede encontrar informaci´on sobre los 
pasos de implementaci´on de una red neuronal como clasifica-dor. 
En Ram´ırez  Chac´on[13] realiza una revisi´on de las redes 
neuronales durante la ´ultima d´ecada, lo cual se da una breve 
descripci´on de algunos de las redes neuronales que presentan: 
V-1. Teor´ıa de resonancia adaptativa (ART): ´ Esta red 
puede ser supervisada o no supervisada, su funcionamiento 
es similar al del cerebro humano, divido en un m´odulo de 
comparaci´on, un par´ametro de vigilancia y un modulo de 
reinicio. El modulo de comparaci´on toma el patr´on de entrada 
y lo agrupa en alguna clase conocida por la red, el par´ametro 
de vigilancia se encarga de indicar el grado de pertenencia 
de la entrada a alguna clase dada, si el patr´on no pertenece a 
ninguna clase se crea una nueva. La ventaja de ´esta red es la 
capacidad de agrupar dato acorde a su informaci´on. 
V-2. Red neuronal celular (CNN): Basada en la teor´ıa de 
aut´omatas celulares, permite la interacci´on de vecinos de cada 
unidad en la red. Contiene una cantidad fija de unidades lla-madas 
c´elulas, las cuales son sistemas no lineales, din´amicos 
donde la informaci´on de entrada es codificada para conocer su 
comportamiento. Cada c´elula est´a localmente interconectadas 
con m´ultiples entradas que vienen de otras c´elulas. 
V-3. Perceptr´on multicapa (MLP) y Backpropagation 
(BP): Fue uno de los primeros modelos de redes neuronales, 
se refiere a redes perceptr´on multicapa con funciones de ac-tivaci 
´on sigmoidales que son entrenadas mediante algoritmos 
de aprendizaje de Backpropagation. 
V-4. Red neuronal oscilatoria (ONN): La teor´ıa de ´esta 
red se basa en los est´ımulos con osciladores peri´odicas sin-cronizadas 
en forma de grupos en la corteza visual y es 
posible que sirvan para detectar caracter´ısticas en una escena 
visual, partiendo de esto, se modelan redes con caracter´ısticas 
osciladoras que van sincronizando seg´un el patr´on de entrada. 
Un ejemplo de ´esta red es el modelo de LEGION (locally 
excitatory globally inhibitor oscillator network) en el cual la 
oscilaci´on se genera a partir de la retroalimentaci´on de un 
vecindario de unidades excitables y un inhibidor, en otras 
palabras, cada unidad excitable es estimulada de forma pro-porcional 
a cada entrada formando una retroalimentaci´on con 
el inhibidor y se crea una oscilaci´on cuya forma depende del 
estimulo de entrada. 
V-5. Red neuronal Pulso-Acoplada (PCNN): La red se 
implementa en un modelo de una neurona por p´ıxel y su 
arquitectura tiene tres m´odulos principales: ´arbol de dentritas, 
encadenamiento y generador de pulsos. El ´arbol recibe la 
informaci´on del vecindario y se procesa en el m´odulo de 
encadenamiento y el feeding (otra parte de la red que contiene 
tambi´en valores de entrada), el generador de pulsos tiene un 
umbral din´amico que se basa en el proceso interno que tiene 
la neurona en el feeding y el m´odulo de encadenamiento. 
V-6. Red neuronal recurrente (RNN): Tienen conexio-nes 
formando un ciclo directo, esto permite comportamiento 
dinamicos ´pero con el coste de consumo de mas ´memoria 
que las redes directa. Ejemplos de la red: Hopfield, RNN 
bidireccional y RNN tiempo continuo. 
V-7. Red neuronal con funciones base radial (RBFNN): 
Son redes que contienen funciones de activacion ´de base radial 
que cumplen cierto criterio, generalmente estas ´funciones 
de activacion ´tienen un comportamiento gaussiano, lo cual 
consiste en una red de tres capas: (1) entrada, (2) caja negra 
que contiene funciones de base radial no lineal y (3) salida. 
V-8. Red neuronal probabilisticas (RPNN): En estos ´tipos 
de redes se encuentran red neuronal probabil´ıstica, el algoritmo 
de mezclas gaussianas y la red neuronal aleatoria. La red 
neuronal probabil´ıstica consta de cuatro capas, la cual la 
primera recibe los datos de entrada, la segunda dispone de un 
conjunto de neuronas totalmente conectadas con las neuronas 
de la primera capa con funciones de activacion ´dada por: 
1 
jk(x) = ( 
( 
p 
2)d 
)exp( 
1 
22 (x  mxj 
k)2). Donde d es 
el tama˜no del vector, x es la entrada, mxj 
k es la media de j- 
´esimo vector de diferencia, k es la clase correspondiente y
8 
es un par´ametro de suavizado. La tercera capa es una capa de 
suma que completa la estimaci´on de probabilidad y por ´ultimo 
la capa final los clasifica la entrada de acuerdo a la decisi´on 
bayesiana. 
V-9. Mapa Auto-Organizado de Kohonen (SOM): Es una 
red no supervisada que se basa en un proceso competitivo 
donde cada neurona en una red neuronal se vuelve sensitiva 
a las categor´ıas de los patrones de entrada. Esto es dado que 
se utiliza el aprendizaje competitivo para que las neuronas sin 
una distribuci´on de datos especificas se vaya aproximando a 
la distribuci´on de los datos de entrada. 
VI. CONCLUSIONES 
El reconocimiento de patrones es un paso fundamental para 
el an´alisis e interpretaci´on de una imagen digital, lo cual 
permitir´a ajustar clases de acuerdo a caracter´ısticas relevantes 
que presenten los objetos. Aunque hay una gran diversidad de 
m´etodos de clasificaci´on (heur´ısticas, matem´aticas, ling¨u´ısticas 
y redes neuronales), ´estos ventajas y desventajas para el 
reconocimiento de patrones. Los m´etodos m´as empleados son 
clasificadores estad´ısticos y redes neuronales. 
´ Este trabajo menciona en forma general algunos de los 
clasificadores (estad´ısticos y redes neuronales) m´as usados. 
El cual se logro conocer la gran diversidad de modelos que 
existen para el reconocimiento de patrones. 
Por ´ultimo cabe mencionar que la descripci´on de los cla-sificadores 
es tan solo muy general, para lograr entender 
su funcionamiento, ventajas y desventajas, se requiere una 
revisi´on m´as profunda. 
REFERENCIAS 
[1] R.M. Ayala and M. Menenti. Metodolog´ıa para la 
b´usqueda del mejor clasificador de im´agenes de sat´elite. 
Teledetecci´on, medio ambiente y cambio global, pages 
469–472, 2001. 
[2] Osvaldo Cair´o and Sivia Guardati Buemo. Estructura de 
datos. Mcgraw-Hill, M´exico, 1997. 
[3] Enrique Calot. Reconocimiento de patrones en im´agenes 
m´edicas basado en sistemas inteligenes. Tesis de licen-ciatura, 
Facultad de ingenier´ıa. Universidad de Buenos 
Aires, Buenos Aires, Argentina, 2008. 
[4] Emilio Chuvieco Salinero. Teledetecci´on ambiental: la 
observaci´on de la tierra desde el espacio. Ariel ciencias, 
3ra edition, 2008. 
[5] Crhistian Correa, Constantino Valero, and Pilar Barreiro. 
Procesamiento de im´agenes para la identificaci´on de uva 
y follaje usando t´ecnicas de clasificaci´on no supervisadas. 
In IV Congreso de estudiantes universitarios de ciencia, 
tecnolog´ıa e ingenieria agr´onomica, pages 53–56, 2011. 
[6] R. De la Rosa Flores. Procesamiento de im´agenes 
digitales. In X congreso Nacional en Inform´atica y 
computaci´on, pages 1–5, Puebla, M´exico, 08 al 12 de 
Octubre 2007. Instituto tecnol´ogico de puebla. 
[7] Michael J de Smith, Michael F Goodchild, and Paul A 
Longley. Geospatial analisys: a comprehensive guide 
to principles, techniques and softwares tools. Matador, 
2007. 
[8] Tzitziki Janik Garc´ıa Mora and Jean Francois Mas. Com-paraci 
´on de metodolog´ıas para el mapeo de la cobertura 
y uso del suelo en el sureste de m´exico. Investigaciones 
Geogr´aficas, Bolet´ın del Instituto de Geograf´ıa, UNAM, 
(67):7–19, 2008. 
[9] J. L. Gil, E. B. Garc´ıa, D. R. Ponvert-Delisle, R. S´anchez, 
and M. B. Vega. Enfoques para la clasificaci´on digital de 
im´agenes mono y multiespectrales y su implementaci´on 
en el software cubano TN Estudio V2.0. Revista de 
teledetecci´on, 20:35–52, 2003. 
[10] Rafael C. Gonzales and Richard E. Woods. Tratamiento 
digital de im´agenes. Addison-Wesley, Diaz de Santos, 
1996. 
[11] Jean Francois Mas. Aplicaciones del sensor MODIS para 
el monitoreo del territorio. SEMARNAT, INE, UNAM 
y CIGA, 2011. 
[12] Abdelmalik Moujahid, I˜naki Inza, and Pedro Larraga˜na. 
Tema 5. clasificadores k-nn. S/F. 
[13] Juan Ram´ırez Q. and Mario I. Chac´on M. Redes neu-ronales 
artificiales para el procesamiento de im´agenes, 
una revisi´on de la ´ultima d´ecada. Revista de ingenier´ıa 
el´ectrica, electr´onica y computaci´on, 9(1):7–16, 2011. 
[14] Victor Rodr´ıguez Doncel. Entrenador para el control 
de pr´otesis mio´electricas. http://vroddon.sdf-eu.org/emg/ 
proy.pdf, 2001. Accesado: 22 de Enero de 2013. 
[15] Harold A. Romo R., Fabi´an Ram´ırez M., and Ridier 
Valdivieso B. Detecci´on del bacilo mycobacterium tu-berculosis 
mediante reconocmiento de patrones. Avances 
en sistemas e inform´atica, 4(3):111–166, 2007. 
[16] Jos´e M. Salinas and Carmen Porras. Fundamento psi-cofisico 
del reconocmiento de patrones. Psicothema, 
5(001):161–172, 1993. 
[17] Cecilia Ver´onica Sanz. Razonamiento evidencial din´ami-co: 
Un m´etodo de clasificaci´on aplicado al an´alisis de 
im´agenes hiperespectrales. Tesis doctoral, Universidad 
Nacional de La Plata. Facultad de Ciencias Exactas, 
Argentina, 2002. 
[18] Eddie Angel Sobrado Malpartida. Sistema de visi´on ar-tificial 
para el reconocimiento y manipulaci´on de objetos 
utilizando un brazo robot. Tesis de maestr´ıa, Pontificia 
Universidad Cat´olica del Per´u, Per´u, 2003. 
[19] Kenneth Walker. Other iris from ken walker’s gar-den. 
http://home.astound.net/kenww/my garden/other 
iris.htm, 1999-2003.

Más contenido relacionado

Similar a Reconocimiento de patrones y métodos de clasificación en imágenes digitales

Trabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20verasTrabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20verasArturo Veras
 
Trabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20verasTrabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20verasArturo Veras
 
Presentación modelación superficies
Presentación modelación superficiesPresentación modelación superficies
Presentación modelación superficiesjalexvega
 
Inteligencia artificial etc(avance2) samuel_tiburcio_parra
Inteligencia artificial etc(avance2) samuel_tiburcio_parraInteligencia artificial etc(avance2) samuel_tiburcio_parra
Inteligencia artificial etc(avance2) samuel_tiburcio_parratiburciosam
 
3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptxRam Vazquez
 
Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]
Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]
Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]Vanessa Santiago
 
2015-TFG1 Modelo de mapas logísticos acoplados
2015-TFG1 Modelo de mapas logísticos acoplados2015-TFG1 Modelo de mapas logísticos acoplados
2015-TFG1 Modelo de mapas logísticos acopladosRicardo Lopez-Ruiz
 
Pontificia universidad católica del ecuador topologias de numeros
Pontificia universidad católica del ecuador topologias de numerosPontificia universidad católica del ecuador topologias de numeros
Pontificia universidad católica del ecuador topologias de numerosGabriel Solano
 
1. representación el conocimiento
1. representación el conocimiento1. representación el conocimiento
1. representación el conocimientonorma8avila
 
Tdr elvar mosquera
Tdr elvar mosqueraTdr elvar mosquera
Tdr elvar mosqueraand3s
 
Tdr elvar mosquera
Tdr elvar mosqueraTdr elvar mosquera
Tdr elvar mosqueraand3s
 
Estructura de datos avanzada
Estructura de datos avanzadaEstructura de datos avanzada
Estructura de datos avanzadaMaestros Online
 
Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...
Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...
Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...Yessenia I. Martínez M.
 
Inicio Base de datos(Parte I)
Inicio Base de datos(Parte I)Inicio Base de datos(Parte I)
Inicio Base de datos(Parte I)Yara Añez
 
Analisis y diseño de sistemas
Analisis y diseño de sistemasAnalisis y diseño de sistemas
Analisis y diseño de sistemasjoalmerca6
 

Similar a Reconocimiento de patrones y métodos de clasificación en imágenes digitales (20)

Trabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20verasTrabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20veras
 
Trabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20verasTrabajo%20 informatica%20arturo%20veras
Trabajo%20 informatica%20arturo%20veras
 
Presentación modelación superficies
Presentación modelación superficiesPresentación modelación superficies
Presentación modelación superficies
 
Inteligencia artificial etc(avance2) samuel_tiburcio_parra
Inteligencia artificial etc(avance2) samuel_tiburcio_parraInteligencia artificial etc(avance2) samuel_tiburcio_parra
Inteligencia artificial etc(avance2) samuel_tiburcio_parra
 
Topología matemática
Topología matemáticaTopología matemática
Topología matemática
 
Teoría y aplicación de la estructuración del conocimiento
Teoría y aplicación de la estructuración del conocimientoTeoría y aplicación de la estructuración del conocimiento
Teoría y aplicación de la estructuración del conocimiento
 
3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx
 
Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]
Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]
Modelos%20 Geom% C3% A9tricos%20y%20 Fractales[1]
 
Modelos GeoméTricos Y Fractales
Modelos GeoméTricos Y FractalesModelos GeoméTricos Y Fractales
Modelos GeoméTricos Y Fractales
 
2015-TFG1 Modelo de mapas logísticos acoplados
2015-TFG1 Modelo de mapas logísticos acoplados2015-TFG1 Modelo de mapas logísticos acoplados
2015-TFG1 Modelo de mapas logísticos acoplados
 
Pontificia universidad católica del ecuador topologias de numeros
Pontificia universidad católica del ecuador topologias de numerosPontificia universidad católica del ecuador topologias de numeros
Pontificia universidad católica del ecuador topologias de numeros
 
1. representación el conocimiento
1. representación el conocimiento1. representación el conocimiento
1. representación el conocimiento
 
Tdr elvar mosquera
Tdr elvar mosqueraTdr elvar mosquera
Tdr elvar mosquera
 
Tdr elvar mosquera
Tdr elvar mosqueraTdr elvar mosquera
Tdr elvar mosquera
 
Computacion asignacion 3
Computacion asignacion 3Computacion asignacion 3
Computacion asignacion 3
 
Cuadro dalia
Cuadro daliaCuadro dalia
Cuadro dalia
 
Estructura de datos avanzada
Estructura de datos avanzadaEstructura de datos avanzada
Estructura de datos avanzada
 
Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...
Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...
Visualización de Redes: Herramientas y Técnicas para la Creación y Evaluación...
 
Inicio Base de datos(Parte I)
Inicio Base de datos(Parte I)Inicio Base de datos(Parte I)
Inicio Base de datos(Parte I)
 
Analisis y diseño de sistemas
Analisis y diseño de sistemasAnalisis y diseño de sistemas
Analisis y diseño de sistemas
 

Más de Armando López

Unidad mínima cartografiable
Unidad mínima cartografiableUnidad mínima cartografiable
Unidad mínima cartografiableArmando López
 
Introduccion al sensor MODIS y sus productos
Introduccion al sensor MODIS y sus productosIntroduccion al sensor MODIS y sus productos
Introduccion al sensor MODIS y sus productosArmando López
 
Sistemas de posicionamiento global (GPS)
Sistemas de posicionamiento global (GPS)Sistemas de posicionamiento global (GPS)
Sistemas de posicionamiento global (GPS)Armando López
 
Pruebas de normalidad: Prueba de Anderson-Darling
Pruebas de normalidad: Prueba de Anderson-Darling Pruebas de normalidad: Prueba de Anderson-Darling
Pruebas de normalidad: Prueba de Anderson-Darling Armando López
 

Más de Armando López (6)

Unidad mínima cartografiable
Unidad mínima cartografiableUnidad mínima cartografiable
Unidad mínima cartografiable
 
Evapotranspiracion
Evapotranspiracion Evapotranspiracion
Evapotranspiracion
 
Introduccion al sensor MODIS y sus productos
Introduccion al sensor MODIS y sus productosIntroduccion al sensor MODIS y sus productos
Introduccion al sensor MODIS y sus productos
 
Percepción remota
Percepción remotaPercepción remota
Percepción remota
 
Sistemas de posicionamiento global (GPS)
Sistemas de posicionamiento global (GPS)Sistemas de posicionamiento global (GPS)
Sistemas de posicionamiento global (GPS)
 
Pruebas de normalidad: Prueba de Anderson-Darling
Pruebas de normalidad: Prueba de Anderson-Darling Pruebas de normalidad: Prueba de Anderson-Darling
Pruebas de normalidad: Prueba de Anderson-Darling
 

Último

International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...JaquelineJuarez15
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 

Último (20)

International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sof
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 

Reconocimiento de patrones y métodos de clasificación en imágenes digitales

  • 1. 1 Reconocimiento de patrones y m´etodos de clasificaci´on en im´agenes digitales Miguel Armando L´opez Beltr´an Universidad Aut´onoma de Sinaloa Facultad de Ciencias de la Tierra y el Espacio miguel.armandolb@gmail.com Enero 2013 Resumen—Este es un documento que trata sobre el reconoci-miento de patrones y una descripci´on breve sobre clasificadores estad´ısticos y redes neuronales. I. INTRODUCCI´O N El procesamiento digital de im´agenes se divide en dos aspectos: el procesamiento y el an´alisis de las im´agenes[6]. El procesamiento se refiere a la transformaci´on y restaura-ci ´on y mejoramiento de la im´agenes[6]. Por otro lado el an´alisis de im´agenes es un proceso que con-siste descubrir, identificar y comprender ciertos patrones y/o propiedades que son relevantes en la realizaci´on de cualquier trabajo basado en im´agenes digitales[6,8,10,15]. Sin embargo, el proceso de an´alisis de im´agenes se dividen en tres ´areas b´asicas : Procesado de bajo nivel: Son funciones autom´aticas y no requieren inteligencia por parte del sistema de an´alisis (reducci´on de ruido, realce de contraste, realce de caracter´ısticas, etc.). Procesado de nivel intermedio: Comprende la extracci´on y caracterizaci´on de los componentes de la imagen obtenida en el procesos de bajo nivel (segmentaci´on (regiones, objetos) descripci´on de objetos y clasificaci´on o reconocimiento). Procesado de alto nivel: Comprende el reconocmiento y la interpretaci´on, an´alisis de la imagen y funciones cognitivas. Figura 1. Modelo general de procesamiento de im´agenes. Fuente: [10,15] Por lo tanto, existe una gran gamma de ´areas en la ciencias para las aplicaciones del procesamiento digital de im´agenes, entre las principales se encuentra: medicina, biolog´ıa, astro-nom ´ıa, agricultura, historia, fotograf´ıa, geom´atica, veterinaria, etc., en el cual se puede aplicar cualquier nivel de procesa-miento[ 6,8]. Pero para el an´alisis de la imagen en cualquier nivel de procesamiento es importante realizar un reconocimiento de patrones. II. RECONOCIMIENTO DE PATRONES El reconocimiento de patrones en im´agenes se encuentra en un campo muy amplio en la investigaci´on[3]. El reco-nocimiento asigna un nombre a un objeto, bas´andose en la informaci´on que proveen sus descriptores, y la interpretaci´on asigna su significado a un conjunto de objetos reconocidos[15]. Sobrado[18] define el reconocimiento de patrones como: “es la categorizaci´on de datos de entrada en clases identificadas, por medio de la extracci´on de caracter´ısticas significativas o atributos de los datos extra´ıdos de un medio ambiente que contiene detalles relevantes”. Adem´as Gonz´ales & Woods[10] definen un patr´on como “es una descripci´on estructural o cuantitativa de un objeto o de alguna otra entidad de inter´es en una imagen, en otras palabras es una disposici´on de descriptores” y una clase de patrones como “es una familia de patrones que comparten algunas propiedades comunes”. Por lo tanto, el reconocimiento de patrones de un determi-nado espacio son clasificados en un conjunto discreto de clases de patrones, en donde cada una de las clases es definida con un patr´on representante de la clase y viene dado previamente al inicio del proceso de clasificaci´on[16]. Por lo tanto, las clases de patrones se representan como w1;w2; :::;wn, donde n representa el n´umero total de cla-ses[ 10,15,16]. De acuerdo con Sobrano[18] los sistemas de reconocimiento de patrones se pueden identificar en 4 tipos de metodolog´ıas: Heur´ısticas: Metodolog´ıa base al uso de la experiencia y la intuici´on humana. Matem´aticas: Metodolog´ıa que hace uso de las propie-dades comunes de los patrones y se basan en reglas de clasificaci´on formuladas en un marco matem´atico. Se divide en dos ´areas: Determin´ısticas: No requieren de propiedades es-tad ´ısticas. Ejemplo clasificaci´on por distancia eucli-diana.
  • 2. 2 Figura 2. Iris etosa, Iris Versicolor, Iris virginica. Fuente: [19]. Estad´ısticas: Aproximaci´on m´as simple que consiste en representar a cada patr´on mediante un vector de n´umeros, y cada clase por uno o varios patrones prototipo. Ling¨u´ısticas: Reducen un objeto a un conjunto de ele-mentos estructurales o primitivas, a˜nadiendo una sintaxis para relacionar estos elementos de forma espacial, es de-cir, descomponiendo a los objetos complejos en t´erminos de conjuntos de primitivas (arcos, ´angulos, rectas, etc.) con reglas para describir la relaci´on espacial entre ellas. Redes neuronales artificiales: El an´alisis implica la con-figuraci ´on de una red de neuronas artificiales y el entre-namiento de la red para determinar como las neuronas individuales pueden afectar uno a la otra, el modo de reconocimiento implica el env´ıo de datos a trav´es de la red y la evaluaci´on a que clase se aproximar´a m´as. Gonz´ales Woods y Romo[15], menciona que las princi-pales representaciones de patrones utilizados en la pr´actica son[10,15]: Vectores: Descripciones cuantitativas. Cadenas. A´rboles: Descripciones estructurales. II-A. Patrones vectoriales Los patrones vectoriales se representan utilizando letras min´usculas en negrita, como x, y, z, se representan como matrices (nx1) (ecuaci´on 1)[10]. x = 2 x1 x2 ::: xn 664 3 775 (1) Donde cada componente, xi representa el i-´esimo descriptor y n es el n´umero de descriptores. Un ejemplo que da Gonz´ales Woods[10], es describir tres tipos de lirios (Iris setosa, Iris virginica e Iris versicolor (Figura 2), por la medida de la longitud y la anchura de sus p´etalos. Por lo tanto, se utilizo vectores bidimensionales (ver ecuaci´on 2). x = x1 x2 (2) x1 y x2 corresponden a la anchura y longitud del p´etalo de las Iris spp. Las tres clases de patrones, se representan por w1, w2 y w3. En la figura 3 muestra las medidas de anchura y longitud para cada tipo de lirio. Se observa que la elecci´on de caracter´ısticas podr´a discriminar perfectamente la clase Iris setosa de las otras dos, pero no as´ı las clases Iris versicolor e Iris virginica entre s´ı. Figura 3. Dos medidas realizadas para tres tipos de lirios. Fuente: [10]. Otro m´etodo en la generaci´on de patrones vectoriales es con respecto a la firma generada por sus contornos. Una firma es una representaci´on funcional unidimensional de un contorno y se pueden generar en var´ıas formas. La forma m´as simple es representar la distancia desde un punto de vista interior, como puede ser el centroide al contorno como una funci´on del ´angulo. En otras palabras, la idea b´asica de una firma es reducir la representaci´on del contorno a una funci´on unidimensional. Figura 4. Firma correspondiente a tres objetos. En la figura 4 las im´agenes superiores (circulo y cuadrado), su firma es en relaci´on entre el ´angulo y la distancia con el centroide, mientras que la imagen inferior es en funci´on a su contorno. II-B. Patrones de cadena Las representaciones en forma de cadena generan adecua-damente patrones de objetos y otras entidades cuya estructura se basa en conexiones relativamente sencillas de sentencias,
  • 3. 3 que normalmente est´an asociadas a formas de bordes o con-tornos[ 10]. Un ejemplo en reconocimiento de patrones de cadenas que presenta Gonz´ales Woods[10] es un patr´on en forma de escalera (figura 5), aunque ´este patr´on puede ser expresado en t´erminos de un patr´on vectorial utilizando un m´etodo de firmas (figura 4), aunque se perder´ıa la estructura b´asica, que consiste en la representaci´on de dos sencillos elementos a y b. Es por ello, que es m´as l´ogico definir los elementos a y b y hacer que el patr´on sea la cadena de s´ımbolos W = abababab::: como se muestra en la figura 5. Figura 5. Estructura codificada en t´erminos de los primitivos a y b [10]. II-C. Patrones de ´arboles Un ´arbol es una estructura jer´arquica aplicada sobre una colecci´on de elementos u objetos llamados nodos, donde uno es conocido como ra´ız, creando una relaci´on o parentesco entre los nodos dando lugar a t´erminos como padre, hijo, hermano, antecesor, sucesor, ancestro, etc.[2]. Cair´o Guardati[2] menciona las principales caracter´ısticas y propiedades de los ´arboles en general son: Todo ´arbol que no es vac´ıo, tiene un ´unico nodo ra´ız. Todos los nodos que son descendientes directos (hijos) de un mismo nodo (padre), son hermanos. Todo nodo que no tiene ramificaciones (hijos), se conoce con el nombre de terminal u hoja. Todo nodo que no es ra´ız, ni terminal u hoja se conoce con el nombre de interior. El grado es el n´umero de descendientes directos de un determinado nodo. El grado del ´arbol es el m´aximo grado de todos los nodos del ´arbol. El nivel es el n´umero de arcos que deben ser recorridos para llegar a un determinado nodo. Por lo tanto la ra´ız tiene un nivel 1. La altura del ´arbol es el m´aximo n´umero de niveles de todos los nodos del ´arbol. Es una t´ecnica potente para muchas aplicaciones, donde la mayor´ıa de los esquemas de ordenaci´on jer´arquica dan lugar Figura 6. Ciudad de Culiac´an, Sinaloa. Imagen extra´ıda de Google Earth. a estructuras de tipo ´arbol, un ejemplo de ello es una imagen de fotograf´ıa a´erea o imagen satelital[10]. Un ejemplo de ´esta t´ecnica es la siguiente: tomando como referencia la ciudad de Culiac´an que representa una imagen compuesta de zonas rurales, agr´ıcolas, urbanas, cuerpos de agua, caminos terracer´ıa, pavimento, autopistas, etc. La ra´ız del ´arbol representa la imagen completa, aunque sus rami-ficaciones son muy abstractas, la idea de representaci´on se muestra en la figura 7. El nivel siguiente representa las ´areas compuestas de v´ıas de comunicaci´on, zonas agr´ıcolas, rurales y urbanas, a la vez se componen de m´as nodos, a excepci´on del nodo de zona rural el cual termina siendo una hoja. La altura del ´arbol est´a basado en 4 niveles, lo cual es suficiente para la representaci´on abstracta del ejemplo. Figura 7. Representaci´on de ´arbol en base a la figura 6. III. RECONOCIMIENTOS DE PATRONES BASADOS EN M´E TODOS MATEM´A TICOS DE DECISI´O N Uno de los motivos del uso de m´etodos de clasificaci´on est´a dada por las caracter´ısticas de los elementos, los cuales disponen de cierta caracter´ıstica similares que pueden asig-narse a cierta clase, la cual representar´ıa la caracter´ıstica en cuesti´on. ´ Esta semejanza entre los elementos se utilizan para asig-nar la clase. Las t´ecnicas de clasificaci´on, proporcionan una herramienta para asignar que elementos pertenecen a x clase.
  • 4. 4 La clasificaci´on de im´agenes parte de un m´etodo y de una medida cuantitativa que ayuda a encontrar la semejanza o no, entre las partes de la imagen. Los m´etodos pueden aplicar una t´ecnica supervisada o no supervisada, con enfoque estad´ıstico o de redes neuronales[9]. Sin embargo, Chuvieco Salinero[4], menciona un tercer m´etodo, los m´etodos mixtos. Adem´as, como ya se menciono anteriormente, Sobrano[18] menciona que los reconocimientos de patrones que utilizan metodolog´ıa matem´atica se dividen en dos: (1) determin´ısticas y (2) estad´ısticas. Los clasificadores estad´ısticos consideran que los patrones de las clases forman una poblaci´on estad´ıstica caracterizada por una determinada funci´on de distribuci´on o funci´on de densidad, donde las funciones tienen una forma generalmente desconocida, por lo tanto los clasificadores intentan ajustarlos a los diferentes modelos te´oricos, siguiendo enfoques pa-ram ´etricos y no param´etricos, los clasificadores determin´ısticas no consideran la funci´on de distribuci´on o funci´on de densi-dad[ 9]. Gil et al.[9] menciona algunos ejemplos de clasificadores estad´ısticos, los cuales se encuentran: m´axima verosimilitud, paralelep´ıpedos, m´ınima distancia, vecino m´as cercano, K-means, ISODATA. III-A. Clasificaci´on supervisada El usuario parte de cierto conocimiento de la zona de estu-dio, fundamentalmente el usuario define con m´axima precisi´on cada una de las categor´ıas que ´este pretende discriminar, antes de efectuar la clasificaci´on, es decir, el usuario al conocer la zona de estudio, delimita ´areas representativas de las clases a clasificar, ´estas ´areas en cuesti´on se denominan “Training Field” (Campos de entrenamiento), el t´ermino de campos de entrenamiento sirven para “entrenar” al software de clasificaci´on en el reconocimiento de las distintas ´areas, a partir de ´este entrenamiento se caracterizan las ´areas de cada una de las clases, y se asignan los elementos correspondientes en toda la imagen pertenecientes a cada determinada clase. El proceso de definici´on de clases representativa se le conoce como fases de entrenamiento[1,4,9]. Algunos ejemplos de clasificadores supervisados son[9,17]: M´axima verosimilitud. Paralelep´ıpedos. M´ınima distancia. Vecino m´as cercano. III-B. Clasificaci´on no supervisada Se realiza a partir de un conjunto de patrones del que no se conoce su clase. B´asicamente se trata de encontrar agrupamientos[18]. No es necesario conocer el ´area de estudio por parte del usuario que va realizar la clasificaci´on, sin embargo tendr´a que interpretar las clases que son generadas por la clasificaci´on, por lo tanto la imagen es segmentada al n´umero de clases del cual no requiere ning´un muestreo o fase de entrenamiento[1,4,9]. Algunos ejemplos de clasificadores no supervisados[9,17] ISODATA. K-means. III-C. Clasificaci´on mixta De acuerdo con Chuvieco Salinero[4], los m´etodos supervi-sados y no supervisados cuentan con ventajas e inconvenientes. El m´etodo supervisado resulta muchas veces subjetivo, pues el usuario establece a priori unas categor´ıas sin valorar las caracter´ısticas de la imagen, el m´etodo no supervisado no garantiza que las clases deducidas tengan significado para el usuario del producto, adem´as es dif´ıcil su verificaci´on. Con la intenci´on de reducir los inconvenientes en ambos m´etodos, se han propuesto alternativas que los combinan de alguna forma. IV. CLASIFICADORES ESTAD´I STICOS IV-A. M´axima verosimilitud Tambi´en conocido como M´axima probabilidad, es el algo-ritmo m´as usado en clasificaci´on de im´agenes, dado que es sencillo su aplicaci´on e interpretaci´on de sus resultados[11]. El m´etodo utiliza el an´alisis estad´ıstico de medias, varianzas y covarianzas de un conjunto de datos de entrenamiento, cuyo contenido se supone que tiene una distribuci´on normal[7,17]. ´ Este clasificador es m´as complejo dado a que demanda mayor volumen de c´alculos, sin embargo, es el m´as empleado, por su robustez y por ajustar con m´as rigor los p´ıxeles de cada clase[17]. En la fase de entrenamiento, el algoritmo elabora el reco-nocimiento de los patrones de cada clase con los par´ametros estad´ısticos de la media, varianza y covarianza de un conjuntos de ´areas de entrenamiento localizados en la imagen. En la fase de clasificaci´on, se calcula cada p´ıxel (ecuaci´on 3), la probabilidad de pertenencia a cada clase, para cada uno de los p´ıxeles de la imagen con base a su respuesta del patr´on. Por ´ultimo el p´ıxel se asigna a la clase de mayor probabilidad de permanencia[11]. P(HjE) = P(EjH)p(H) p(E) (3) Donde: P(HjE) es la probabilidad condicionada de la hip´otesis H, dado la evidencia E, es decir la probabilidad de que el p´ıxel permanezca a cierta clase (Hip´otesis H) tomando en cuenta su respuesta del patr´on (Evidencia E). p(H) es la probabilidad de que un p´ıxel permanezca a la clase considerada en la hip´otesis H sin tomar en cuenta su informaci´on de patr´on. p(E) es la probabilidad de la evidencia E. P(EjH) es la probabilidad condicionada de la evidencia E dada la hip´otesis H. Chuvieco[4] menciona otra manera de clasificaci´on de m´axi-ma verosimilitud en caso de estar trabajando con im´agenes monocrom´aticas, que puede calcular la probabilidad de perte-nencia a cierta clase de acuerdo con la ecuaci´on 4. p(x=A) = 1 p 22A f (NDx A)2 22A g (4) Donde:
  • 5. 5 Figura 8. Ejemplo de paralelep´ıpedo con p´ıxeles sin clasificar. p(x=A): Probabilidad de que un p´ıxel x, pertenezca a la clase A. NDx: Valor del p´ıxel. A: Valor medio de la clase. A: Varianza de la clase. El p´ıxel sera asignado a la clase A s´olo si: p(x=A) p(x=B) variando B desde 1 hasta c, siendo c el n´umero de clases. IV-B. Clasificador paralelep´ıdos El clasificador paralelep´ıpedos es computacionalmente efi-ciente para clasificar elementos, sin embargo, algunos parale-lep ´ıpedos se sobreponen[17]. Esto se da a que el usuario fija un ´area de dominio para cada una de las clases, teniendo en cuenta sus valores centrales y dispersi´on[4]. Vmin Vrx Vmax (5) Donde: Vmin: Valor m´ınimo del rango de la clase. Vmax: Valor m´aximo del rango de la clase. Vrx: Valor correspondiente del pixel. Por lo tanto el p´ıxel es asignado a una determinada clase si sus valores se encuentran a menos de una determinada distan-cia del centro de clases, ´esta distancia se fija por el usuario, aunque suele identificarse con la desviaci´on est´andar[4]. Algunos inconvenientes en el dise˜no de ´areas de dominio pueden implicar: Que existan p´ıxeles en zonas comunes a dos o m´as categor´ıas. Que existan p´ıxeles sin clasificar. Es por ello que no es recomendado cuando se consideran clases mixtas. IV-C. M´ınima distancia Es el criterio m´as sencillo para asignar un p´ıxel a una de las clases[4], es por ello que es una forma para determinar de qu´e clase es miembro un patr´on desconocido x, por lo tanto se asigna a la clase m´as cercano a su prototipo . Se puede usar la distancia euclidiana para determinar la proximidad o cualquier combinaci´on, utilizando la distancia euclidiana, se reduce el problema a computar las medidas de distancia[17]. La distancia se compara con los valores del patr´on con los valores centrales de las clases de la imagen[4]. La ecuaci´on m´as empleada es[4]: dx;A = vuut Xm i=1 (ENDA NDx)2 (6) Donde: dx;A: medida de la distancia entre el p´ıxel x y la categor´ıa A. ENDA: Valor medio de la categor´ıa. NDx: valor correspondiente al p´ıxel a clasificar. No es recomendable para aplicaciones en que las clases de patrones est´an cercanas una de otras en el espacio medidas y tienen una alta varianza[17]. Sin embargo, es bastante sencillo y r´apido de ejecutar, adecuado cuando las distancias entre clases es grande comparada con la dispersi´on de los elementos de cada clase y delimita a grupos circulares de radio proporcional a la situaci´on de cada clase (ver figura 9)[4]. Figura 9. Agrupaciones de m´ınima distancia. IV-D. Vecino m´as cercano Conocido como K-NN por sus siglas en ingl´es (K- Near Neighborhood), es un clasificador no param´etrico. Es una compilaci´on del clasificador de distancia [14]. La idea b´asica el cual se fundamenta ´este clasificador es que un nuevo patr´on se va a clasificar en la clase m´as frecuente a la que pertenece sus K vecinos m´as cercanos[12]. Es decir, el p´ıxel con patr´on x se va asignar a la clase m´as frecuente a la que pertenecen sus Kc vecinos m´as cercanos, los vecinos tienen la misma importancia de decisi´on, sin considerar las distancias de x. En la figura 10 se muestra un ejemplo donde el circulo verde representa el patr´on que se desea clasificar a cualquiera de las dos clases (cuadrados azules y tri´angulos rojos), tomando como referencia 3 vecinos (K3) el circulo se clasificara como triangulo, sin embargo, si se toma de referencia 5 vecinos (K5), se clasifica como cuadrado. Esto se debe a la cantidad de vecinos cercanos al patr´on a clasificar. El par´ametro de vecinos siempre es un n´umero impar. La principal desventaja es la alta carga computacional, dado que se almacenan muchos patrones y se calcula muchas distancias[14]. Dispone de algunas variantes entre ellas[12] K-NN con rechazo. K-NN con distancia m´ınima. K-NN con distancia media. K-NN con ponderaci´on en las variables. K-NN con ponderaci´on a clases seleccionadas.
  • 6. 6 Figura 10. Ejemplo de K-NN IV-E. K-Means De acuerdo con Sanz[17], el nombre hace referencia a que se conoce el n´umero de clases o patrones involucrados, es un algoritmo sencillo, eficiente, siempre y cuando se conozca el valor de k con exactitud. El algoritmo est´a basado en el an´alisis de las varianzas, agrupa un conjunto de datos en un n´umero predefinidos de clases o grupos. El proceso es el siguiente[5,17]: 1. Inicia al seleccionar al azar el conjunto de elementos a agrupar en k (N´umero de clases) de forma que se pueda generar los centroides de la clase. 2. Continua con un proceso recursivo, en la cual cada interacci´on gen´erica n se distribuyen y reasignan los patrones del conjunto entre las k clases de acuerdo a la menor distancia de la muestra y los centroides en dichas clases. 3. Posteriormente del proceso de reasignaci´on, se actuali-zan los centroides, y se procede con el paso anterior de nuevo. 4. El proceso de reasignaci´on no se detiene hasta que converge al criterio de parada, es decir, cuando alcanza el par´ametro para terminar, como por ejemplo el n´umero de interacciones o que los centroides no cambien). IV-F. ISODATA ISODATA es el acr´onimo de la definici´on en ingl´es: Inter-active Self-organizing Data Analysis Techniques[7,17] Es similar al K-means[7,17], pero con el agregado de una cantidad de par´ametros y operaciones que llevan a mejorar, por ejemplo el valor k de K-medias es un valor exacto de clases, en ISODATA es un valor esperado del n´umero de clases, es decir empieza con A clases e intenta aproximarse a k clases[17]. Sin embargo, para la eliminaci´on o persistencia de las clases se basa en los criterios[7]: Combinaci´on: Si dos centros de clases est´an m´as cercas que el umbral definido, se combinan y una nueva media es determinada. N´umero de miembros de la clase: Si el n´umero de miembros de una clase es menor al n´umero determinado, est´a clase se disuelve y se asigna a la clase m´as cercana. Separaci´on: Si la varianza, el n´umero de miembro o la distancia media excede los valores predefinidos, entonces el grupo se puede dividir. De acuerdo con Sanz[17] las ventajas y desventajas que presentan son: Provee mejores resultados que el m´etodo de K-medias. Es fuertemente dependiente de los par´ametros ingresa-dos, por lo que hay que tener suficiente conocimiento sobre ellos. Permite una mayor interacci´on con el usuario, mediante el ajuste de los par´ametros. Si se tiene un conocimiento del tipo de la imagen con la que se trabaja logrando mejores resultados. V. REDES NEURONALES ARTIFICIALES Las redes neuronales son modelos matem´aticos basados en una estructura que permite procesar entradas de forma similar a la que ocurre en el cerebro, est´an compuestas por peque˜nas unidades llamadas neuronas que pueden estar entrelazadas entre s´ı[3,9]. Existen diversos modelos y paradigmas de redes neuro-nales[ 9] pero el modo de an´alisis implica una configuraci´on de la red neuronal y un entrenamiento a la red que permite determinar como las neuronas individuales trabajen colectiva-mente de diferentes maneras, de modo que el reconocimiento implica el env´ıo de datos a trav´es de la red y la evaluaci´on a que clase se aproximar´a m´as, en otras palabras una red neuronal es una estructura y distribuida de procesamiento de informaci´on, compuesta por procesadores elementales in-terconectados mediante pesos sin´apticos[9,18]. Generalmente las redes neuronales toman una entrada num´erica y produce tambi´en una salida num´erica[14]. Su principal rasgo es que es un sistema capaz de aprender a partir de una colecci´on de datos de entrenamiento, cada entrada se multiplica por un peso de conexi´on (Wi;j )[3,14]. La implementaci´on de una red neuronal atraviesa por un periodo de prueba y error en el dise˜no de la misma antes de encontrar el dise˜no satisfactorio[17]. De manera general las redes neuronales presentan tres caracter´ısticas: Aprendizaje: ´ Esta caracter´ıstica se refiere a que la neu-rona de la red dispone de una capacidad de almacenar conocimiento a trav´es de un entrenamiento. Generalizaci´on: Se refiere a que se obtiene informaci´on de salida razonables. Adaptabilidad: La red neuronal puede ser nuevamente entrenada para funcionar adecuadamente ante los cam-bios. El dise˜no de una red consiste en[18] Arreglar las neuronas en varias capas. Decidir el tipo de conexi´on entre las neuronas de dife-rentes capas, as´ı como entre las neuronas de una misma capa. Decidir la forma en que una neurona recibe una entrada y produce una salida.
  • 7. 7 Figura 11. Esquema de red neuronal. Fuente: [17] Determinar el peso de cada conexi´on dentro de la red, permitiendo que la red aprenda los valores apropiados de los pesos de conexi´on, usando el conjunto de datos de entrenamiento. Existen muchas arquitecturas de redes neuronales entre ellas se encuentran: Perceptrones multicapa o de una sola capa, Redes recurrentes y de Hopfield, Redes de Kohonen, RBF (Radial Basis Function), resonancia adaptativa, recurrente, pulso-acomplado, entre otros m´as[13,17,18]. Seg´un Sobrano[18], las redes neuronales artificiales tiene muchas similitudes con el reconocimiento estad´ıstico de pa-trones, esto dado que concierne en la representaci´on de datos y los principios de clasificaci´on, pero en la cuesti´on pr´actica son diferentes. Por otro lado menciona algunas ventajas que presentan las redes neuronales enfrente a los clasificadores estad´ısticos: Te´oricamente se pueden determinar cualquier funci´on, por lo que son adecuadas en aplicaciones que no son f´acilmente descritas anal´ıticamente. Excepto por los patrones de entrada, no es necesario suministrar informaci´on adicional. Se puede aplicar cualquier tipo de datos. Se obtienen buenos resultados con datos ruidosos. No se hacen hip´otesis acerca de la distribuci´on estad´ıstica de las variables de entrada. Los modelos neuronales no necesitan un conocimiento a priori de los par´ametros internos del clasificador. Despu´es de entrenadas son extremadamente r´apidas y f´acilmente implementadas. En Sobrado[18] se puede encontrar informaci´on sobre los pasos de implementaci´on de una red neuronal como clasifica-dor. En Ram´ırez Chac´on[13] realiza una revisi´on de las redes neuronales durante la ´ultima d´ecada, lo cual se da una breve descripci´on de algunos de las redes neuronales que presentan: V-1. Teor´ıa de resonancia adaptativa (ART): ´ Esta red puede ser supervisada o no supervisada, su funcionamiento es similar al del cerebro humano, divido en un m´odulo de comparaci´on, un par´ametro de vigilancia y un modulo de reinicio. El modulo de comparaci´on toma el patr´on de entrada y lo agrupa en alguna clase conocida por la red, el par´ametro de vigilancia se encarga de indicar el grado de pertenencia de la entrada a alguna clase dada, si el patr´on no pertenece a ninguna clase se crea una nueva. La ventaja de ´esta red es la capacidad de agrupar dato acorde a su informaci´on. V-2. Red neuronal celular (CNN): Basada en la teor´ıa de aut´omatas celulares, permite la interacci´on de vecinos de cada unidad en la red. Contiene una cantidad fija de unidades lla-madas c´elulas, las cuales son sistemas no lineales, din´amicos donde la informaci´on de entrada es codificada para conocer su comportamiento. Cada c´elula est´a localmente interconectadas con m´ultiples entradas que vienen de otras c´elulas. V-3. Perceptr´on multicapa (MLP) y Backpropagation (BP): Fue uno de los primeros modelos de redes neuronales, se refiere a redes perceptr´on multicapa con funciones de ac-tivaci ´on sigmoidales que son entrenadas mediante algoritmos de aprendizaje de Backpropagation. V-4. Red neuronal oscilatoria (ONN): La teor´ıa de ´esta red se basa en los est´ımulos con osciladores peri´odicas sin-cronizadas en forma de grupos en la corteza visual y es posible que sirvan para detectar caracter´ısticas en una escena visual, partiendo de esto, se modelan redes con caracter´ısticas osciladoras que van sincronizando seg´un el patr´on de entrada. Un ejemplo de ´esta red es el modelo de LEGION (locally excitatory globally inhibitor oscillator network) en el cual la oscilaci´on se genera a partir de la retroalimentaci´on de un vecindario de unidades excitables y un inhibidor, en otras palabras, cada unidad excitable es estimulada de forma pro-porcional a cada entrada formando una retroalimentaci´on con el inhibidor y se crea una oscilaci´on cuya forma depende del estimulo de entrada. V-5. Red neuronal Pulso-Acoplada (PCNN): La red se implementa en un modelo de una neurona por p´ıxel y su arquitectura tiene tres m´odulos principales: ´arbol de dentritas, encadenamiento y generador de pulsos. El ´arbol recibe la informaci´on del vecindario y se procesa en el m´odulo de encadenamiento y el feeding (otra parte de la red que contiene tambi´en valores de entrada), el generador de pulsos tiene un umbral din´amico que se basa en el proceso interno que tiene la neurona en el feeding y el m´odulo de encadenamiento. V-6. Red neuronal recurrente (RNN): Tienen conexio-nes formando un ciclo directo, esto permite comportamiento dinamicos ´pero con el coste de consumo de mas ´memoria que las redes directa. Ejemplos de la red: Hopfield, RNN bidireccional y RNN tiempo continuo. V-7. Red neuronal con funciones base radial (RBFNN): Son redes que contienen funciones de activacion ´de base radial que cumplen cierto criterio, generalmente estas ´funciones de activacion ´tienen un comportamiento gaussiano, lo cual consiste en una red de tres capas: (1) entrada, (2) caja negra que contiene funciones de base radial no lineal y (3) salida. V-8. Red neuronal probabilisticas (RPNN): En estos ´tipos de redes se encuentran red neuronal probabil´ıstica, el algoritmo de mezclas gaussianas y la red neuronal aleatoria. La red neuronal probabil´ıstica consta de cuatro capas, la cual la primera recibe los datos de entrada, la segunda dispone de un conjunto de neuronas totalmente conectadas con las neuronas de la primera capa con funciones de activacion ´dada por: 1 jk(x) = ( ( p 2)d )exp( 1 22 (x mxj k)2). Donde d es el tama˜no del vector, x es la entrada, mxj k es la media de j- ´esimo vector de diferencia, k es la clase correspondiente y
  • 8. 8 es un par´ametro de suavizado. La tercera capa es una capa de suma que completa la estimaci´on de probabilidad y por ´ultimo la capa final los clasifica la entrada de acuerdo a la decisi´on bayesiana. V-9. Mapa Auto-Organizado de Kohonen (SOM): Es una red no supervisada que se basa en un proceso competitivo donde cada neurona en una red neuronal se vuelve sensitiva a las categor´ıas de los patrones de entrada. Esto es dado que se utiliza el aprendizaje competitivo para que las neuronas sin una distribuci´on de datos especificas se vaya aproximando a la distribuci´on de los datos de entrada. VI. CONCLUSIONES El reconocimiento de patrones es un paso fundamental para el an´alisis e interpretaci´on de una imagen digital, lo cual permitir´a ajustar clases de acuerdo a caracter´ısticas relevantes que presenten los objetos. Aunque hay una gran diversidad de m´etodos de clasificaci´on (heur´ısticas, matem´aticas, ling¨u´ısticas y redes neuronales), ´estos ventajas y desventajas para el reconocimiento de patrones. Los m´etodos m´as empleados son clasificadores estad´ısticos y redes neuronales. ´ Este trabajo menciona en forma general algunos de los clasificadores (estad´ısticos y redes neuronales) m´as usados. El cual se logro conocer la gran diversidad de modelos que existen para el reconocimiento de patrones. Por ´ultimo cabe mencionar que la descripci´on de los cla-sificadores es tan solo muy general, para lograr entender su funcionamiento, ventajas y desventajas, se requiere una revisi´on m´as profunda. REFERENCIAS [1] R.M. Ayala and M. Menenti. Metodolog´ıa para la b´usqueda del mejor clasificador de im´agenes de sat´elite. Teledetecci´on, medio ambiente y cambio global, pages 469–472, 2001. [2] Osvaldo Cair´o and Sivia Guardati Buemo. Estructura de datos. Mcgraw-Hill, M´exico, 1997. [3] Enrique Calot. Reconocimiento de patrones en im´agenes m´edicas basado en sistemas inteligenes. Tesis de licen-ciatura, Facultad de ingenier´ıa. Universidad de Buenos Aires, Buenos Aires, Argentina, 2008. [4] Emilio Chuvieco Salinero. Teledetecci´on ambiental: la observaci´on de la tierra desde el espacio. Ariel ciencias, 3ra edition, 2008. [5] Crhistian Correa, Constantino Valero, and Pilar Barreiro. Procesamiento de im´agenes para la identificaci´on de uva y follaje usando t´ecnicas de clasificaci´on no supervisadas. In IV Congreso de estudiantes universitarios de ciencia, tecnolog´ıa e ingenieria agr´onomica, pages 53–56, 2011. [6] R. De la Rosa Flores. Procesamiento de im´agenes digitales. In X congreso Nacional en Inform´atica y computaci´on, pages 1–5, Puebla, M´exico, 08 al 12 de Octubre 2007. Instituto tecnol´ogico de puebla. [7] Michael J de Smith, Michael F Goodchild, and Paul A Longley. Geospatial analisys: a comprehensive guide to principles, techniques and softwares tools. Matador, 2007. [8] Tzitziki Janik Garc´ıa Mora and Jean Francois Mas. Com-paraci ´on de metodolog´ıas para el mapeo de la cobertura y uso del suelo en el sureste de m´exico. Investigaciones Geogr´aficas, Bolet´ın del Instituto de Geograf´ıa, UNAM, (67):7–19, 2008. [9] J. L. Gil, E. B. Garc´ıa, D. R. Ponvert-Delisle, R. S´anchez, and M. B. Vega. Enfoques para la clasificaci´on digital de im´agenes mono y multiespectrales y su implementaci´on en el software cubano TN Estudio V2.0. Revista de teledetecci´on, 20:35–52, 2003. [10] Rafael C. Gonzales and Richard E. Woods. Tratamiento digital de im´agenes. Addison-Wesley, Diaz de Santos, 1996. [11] Jean Francois Mas. Aplicaciones del sensor MODIS para el monitoreo del territorio. SEMARNAT, INE, UNAM y CIGA, 2011. [12] Abdelmalik Moujahid, I˜naki Inza, and Pedro Larraga˜na. Tema 5. clasificadores k-nn. S/F. [13] Juan Ram´ırez Q. and Mario I. Chac´on M. Redes neu-ronales artificiales para el procesamiento de im´agenes, una revisi´on de la ´ultima d´ecada. Revista de ingenier´ıa el´ectrica, electr´onica y computaci´on, 9(1):7–16, 2011. [14] Victor Rodr´ıguez Doncel. Entrenador para el control de pr´otesis mio´electricas. http://vroddon.sdf-eu.org/emg/ proy.pdf, 2001. Accesado: 22 de Enero de 2013. [15] Harold A. Romo R., Fabi´an Ram´ırez M., and Ridier Valdivieso B. Detecci´on del bacilo mycobacterium tu-berculosis mediante reconocmiento de patrones. Avances en sistemas e inform´atica, 4(3):111–166, 2007. [16] Jos´e M. Salinas and Carmen Porras. Fundamento psi-cofisico del reconocmiento de patrones. Psicothema, 5(001):161–172, 1993. [17] Cecilia Ver´onica Sanz. Razonamiento evidencial din´ami-co: Un m´etodo de clasificaci´on aplicado al an´alisis de im´agenes hiperespectrales. Tesis doctoral, Universidad Nacional de La Plata. Facultad de Ciencias Exactas, Argentina, 2002. [18] Eddie Angel Sobrado Malpartida. Sistema de visi´on ar-tificial para el reconocimiento y manipulaci´on de objetos utilizando un brazo robot. Tesis de maestr´ıa, Pontificia Universidad Cat´olica del Per´u, Per´u, 2003. [19] Kenneth Walker. Other iris from ken walker’s gar-den. http://home.astound.net/kenww/my garden/other iris.htm, 1999-2003.