Reconocimiento de patrones y métodos de clasificación en imágenes digitales
1. 1
Reconocimiento de patrones y m´etodos de
clasificaci´on en im´agenes digitales
Miguel Armando L´opez Beltr´an
Universidad Aut´onoma de Sinaloa
Facultad de Ciencias de la Tierra y el Espacio
miguel.armandolb@gmail.com
Enero 2013
Resumen—Este es un documento que trata sobre el reconoci-miento
de patrones y una descripci´on breve sobre clasificadores
estad´ısticos y redes neuronales.
I. INTRODUCCI´O
N
El procesamiento digital de im´agenes se divide en dos
aspectos: el procesamiento y el an´alisis de las im´agenes[6].
El procesamiento se refiere a la transformaci´on y restaura-ci
´on y mejoramiento de la im´agenes[6].
Por otro lado el an´alisis de im´agenes es un proceso que con-siste
descubrir, identificar y comprender ciertos patrones y/o
propiedades que son relevantes en la realizaci´on de cualquier
trabajo basado en im´agenes digitales[6,8,10,15]. Sin embargo,
el proceso de an´alisis de im´agenes se dividen en tres ´areas
b´asicas :
Procesado de bajo nivel: Son funciones autom´aticas
y no requieren inteligencia por parte del sistema de
an´alisis (reducci´on de ruido, realce de contraste, realce
de caracter´ısticas, etc.).
Procesado de nivel intermedio: Comprende la extracci´on
y caracterizaci´on de los componentes de la imagen
obtenida en el procesos de bajo nivel (segmentaci´on
(regiones, objetos) descripci´on de objetos y clasificaci´on
o reconocimiento).
Procesado de alto nivel: Comprende el reconocmiento
y la interpretaci´on, an´alisis de la imagen y funciones
cognitivas.
Figura 1. Modelo general de procesamiento de im´agenes. Fuente: [10,15]
Por lo tanto, existe una gran gamma de ´areas en la ciencias
para las aplicaciones del procesamiento digital de im´agenes,
entre las principales se encuentra: medicina, biolog´ıa, astro-nom
´ıa, agricultura, historia, fotograf´ıa, geom´atica, veterinaria,
etc., en el cual se puede aplicar cualquier nivel de procesa-miento[
6,8].
Pero para el an´alisis de la imagen en cualquier nivel de
procesamiento es importante realizar un reconocimiento de
patrones.
II. RECONOCIMIENTO DE PATRONES
El reconocimiento de patrones en im´agenes se encuentra
en un campo muy amplio en la investigaci´on[3]. El reco-nocimiento
asigna un nombre a un objeto, bas´andose en la
informaci´on que proveen sus descriptores, y la interpretaci´on
asigna su significado a un conjunto de objetos reconocidos[15].
Sobrado[18] define el reconocimiento de patrones como: “es
la categorizaci´on de datos de entrada en clases identificadas,
por medio de la extracci´on de caracter´ısticas significativas o
atributos de los datos extra´ıdos de un medio ambiente que
contiene detalles relevantes”.
Adem´as Gonz´ales & Woods[10] definen un patr´on como
“es una descripci´on estructural o cuantitativa de un objeto
o de alguna otra entidad de inter´es en una imagen, en otras
palabras es una disposici´on de descriptores” y una clase de
patrones como “es una familia de patrones que comparten
algunas propiedades comunes”.
Por lo tanto, el reconocimiento de patrones de un determi-nado
espacio son clasificados en un conjunto discreto de clases
de patrones, en donde cada una de las clases es definida con
un patr´on representante de la clase y viene dado previamente
al inicio del proceso de clasificaci´on[16].
Por lo tanto, las clases de patrones se representan como
w1;w2; :::;wn, donde n representa el n´umero total de cla-ses[
10,15,16].
De acuerdo con Sobrano[18] los sistemas de reconocimiento
de patrones se pueden identificar en 4 tipos de metodolog´ıas:
Heur´ısticas: Metodolog´ıa base al uso de la experiencia y
la intuici´on humana.
Matem´aticas: Metodolog´ıa que hace uso de las propie-dades
comunes de los patrones y se basan en reglas
de clasificaci´on formuladas en un marco matem´atico. Se
divide en dos ´areas:
Determin´ısticas: No requieren de propiedades es-tad
´ısticas. Ejemplo clasificaci´on por distancia eucli-diana.
2. 2
Figura 2. Iris etosa, Iris Versicolor, Iris virginica. Fuente: [19].
Estad´ısticas: Aproximaci´on m´as simple que consiste
en representar a cada patr´on mediante un vector de
n´umeros, y cada clase por uno o varios patrones
prototipo.
Ling¨u´ısticas: Reducen un objeto a un conjunto de ele-mentos
estructurales o primitivas, a˜nadiendo una sintaxis
para relacionar estos elementos de forma espacial, es de-cir,
descomponiendo a los objetos complejos en t´erminos
de conjuntos de primitivas (arcos, ´angulos, rectas, etc.)
con reglas para describir la relaci´on espacial entre ellas.
Redes neuronales artificiales: El an´alisis implica la con-figuraci
´on de una red de neuronas artificiales y el entre-namiento
de la red para determinar como las neuronas
individuales pueden afectar uno a la otra, el modo de
reconocimiento implica el env´ıo de datos a trav´es de la
red y la evaluaci´on a que clase se aproximar´a m´as.
Gonz´ales Woods y Romo[15], menciona que las princi-pales
representaciones de patrones utilizados en la pr´actica
son[10,15]:
Vectores: Descripciones cuantitativas.
Cadenas.
A´rboles: Descripciones estructurales.
II-A. Patrones vectoriales
Los patrones vectoriales se representan utilizando letras
min´usculas en negrita, como x, y, z, se representan como
matrices (nx1) (ecuaci´on 1)[10].
x =
2
x1
x2
:::
xn
664
3
775
(1)
Donde cada componente, xi representa el i-´esimo descriptor
y n es el n´umero de descriptores.
Un ejemplo que da Gonz´ales Woods[10], es describir
tres tipos de lirios (Iris setosa, Iris virginica e Iris versicolor
(Figura 2), por la medida de la longitud y la anchura de sus
p´etalos. Por lo tanto, se utilizo vectores bidimensionales (ver
ecuaci´on 2).
x =
x1
x2
(2)
x1 y x2 corresponden a la anchura y longitud del p´etalo de
las Iris spp. Las tres clases de patrones, se representan por
w1, w2 y w3. En la figura 3 muestra las medidas de anchura
y longitud para cada tipo de lirio. Se observa que la elecci´on
de caracter´ısticas podr´a discriminar perfectamente la clase Iris
setosa de las otras dos, pero no as´ı las clases Iris versicolor
e Iris virginica entre s´ı.
Figura 3. Dos medidas realizadas para tres tipos de lirios. Fuente: [10].
Otro m´etodo en la generaci´on de patrones vectoriales es con
respecto a la firma generada por sus contornos.
Una firma es una representaci´on funcional unidimensional
de un contorno y se pueden generar en var´ıas formas. La forma
m´as simple es representar la distancia desde un punto de vista
interior, como puede ser el centroide al contorno como una
funci´on del ´angulo. En otras palabras, la idea b´asica de una
firma es reducir la representaci´on del contorno a una funci´on
unidimensional.
Figura 4. Firma correspondiente a tres objetos.
En la figura 4 las im´agenes superiores (circulo y cuadrado),
su firma es en relaci´on entre el ´angulo y la distancia con el
centroide, mientras que la imagen inferior es en funci´on a su
contorno.
II-B. Patrones de cadena
Las representaciones en forma de cadena generan adecua-damente
patrones de objetos y otras entidades cuya estructura
se basa en conexiones relativamente sencillas de sentencias,
3. 3
que normalmente est´an asociadas a formas de bordes o con-tornos[
10].
Un ejemplo en reconocimiento de patrones de cadenas que
presenta Gonz´ales Woods[10] es un patr´on en forma de
escalera (figura 5), aunque ´este patr´on puede ser expresado en
t´erminos de un patr´on vectorial utilizando un m´etodo de firmas
(figura 4), aunque se perder´ıa la estructura b´asica, que consiste
en la representaci´on de dos sencillos elementos a y b. Es por
ello, que es m´as l´ogico definir los elementos a y b y hacer que
el patr´on sea la cadena de s´ımbolos W = abababab::: como
se muestra en la figura 5.
Figura 5. Estructura codificada en t´erminos de los primitivos a y b [10].
II-C. Patrones de ´arboles
Un ´arbol es una estructura jer´arquica aplicada sobre una
colecci´on de elementos u objetos llamados nodos, donde uno
es conocido como ra´ız, creando una relaci´on o parentesco entre
los nodos dando lugar a t´erminos como padre, hijo, hermano,
antecesor, sucesor, ancestro, etc.[2].
Cair´o Guardati[2] menciona las principales caracter´ısticas
y propiedades de los ´arboles en general son:
Todo ´arbol que no es vac´ıo, tiene un ´unico nodo ra´ız.
Todos los nodos que son descendientes directos (hijos)
de un mismo nodo (padre), son hermanos.
Todo nodo que no tiene ramificaciones (hijos), se conoce
con el nombre de terminal u hoja.
Todo nodo que no es ra´ız, ni terminal u hoja se conoce
con el nombre de interior.
El grado es el n´umero de descendientes directos de un
determinado nodo. El grado del ´arbol es el m´aximo grado
de todos los nodos del ´arbol.
El nivel es el n´umero de arcos que deben ser recorridos
para llegar a un determinado nodo. Por lo tanto la ra´ız
tiene un nivel 1.
La altura del ´arbol es el m´aximo n´umero de niveles de
todos los nodos del ´arbol.
Es una t´ecnica potente para muchas aplicaciones, donde la
mayor´ıa de los esquemas de ordenaci´on jer´arquica dan lugar
Figura 6. Ciudad de Culiac´an, Sinaloa. Imagen extra´ıda de Google Earth.
a estructuras de tipo ´arbol, un ejemplo de ello es una imagen
de fotograf´ıa a´erea o imagen satelital[10].
Un ejemplo de ´esta t´ecnica es la siguiente: tomando como
referencia la ciudad de Culiac´an que representa una imagen
compuesta de zonas rurales, agr´ıcolas, urbanas, cuerpos de
agua, caminos terracer´ıa, pavimento, autopistas, etc. La ra´ız
del ´arbol representa la imagen completa, aunque sus rami-ficaciones
son muy abstractas, la idea de representaci´on se
muestra en la figura 7. El nivel siguiente representa las ´areas
compuestas de v´ıas de comunicaci´on, zonas agr´ıcolas, rurales
y urbanas, a la vez se componen de m´as nodos, a excepci´on
del nodo de zona rural el cual termina siendo una hoja. La
altura del ´arbol est´a basado en 4 niveles, lo cual es suficiente
para la representaci´on abstracta del ejemplo.
Figura 7. Representaci´on de ´arbol en base a la figura 6.
III. RECONOCIMIENTOS DE PATRONES BASADOS EN
M´E
TODOS MATEM´A
TICOS DE DECISI´O
N
Uno de los motivos del uso de m´etodos de clasificaci´on
est´a dada por las caracter´ısticas de los elementos, los cuales
disponen de cierta caracter´ıstica similares que pueden asig-narse
a cierta clase, la cual representar´ıa la caracter´ıstica en
cuesti´on.
´ Esta semejanza entre los elementos se utilizan para asig-nar
la clase. Las t´ecnicas de clasificaci´on, proporcionan una
herramienta para asignar que elementos pertenecen a x clase.
4. 4
La clasificaci´on de im´agenes parte de un m´etodo y de una
medida cuantitativa que ayuda a encontrar la semejanza o no,
entre las partes de la imagen. Los m´etodos pueden aplicar una
t´ecnica supervisada o no supervisada, con enfoque estad´ıstico
o de redes neuronales[9].
Sin embargo, Chuvieco Salinero[4], menciona un tercer
m´etodo, los m´etodos mixtos.
Adem´as, como ya se menciono anteriormente, Sobrano[18]
menciona que los reconocimientos de patrones que utilizan
metodolog´ıa matem´atica se dividen en dos: (1) determin´ısticas
y (2) estad´ısticas.
Los clasificadores estad´ısticos consideran que los patrones
de las clases forman una poblaci´on estad´ıstica caracterizada
por una determinada funci´on de distribuci´on o funci´on de
densidad, donde las funciones tienen una forma generalmente
desconocida, por lo tanto los clasificadores intentan ajustarlos
a los diferentes modelos te´oricos, siguiendo enfoques pa-ram
´etricos y no param´etricos, los clasificadores determin´ısticas
no consideran la funci´on de distribuci´on o funci´on de densi-dad[
9].
Gil et al.[9] menciona algunos ejemplos de clasificadores
estad´ısticos, los cuales se encuentran: m´axima verosimilitud,
paralelep´ıpedos, m´ınima distancia, vecino m´as cercano, K-means,
ISODATA.
III-A. Clasificaci´on supervisada
El usuario parte de cierto conocimiento de la zona de estu-dio,
fundamentalmente el usuario define con m´axima precisi´on
cada una de las categor´ıas que ´este pretende discriminar,
antes de efectuar la clasificaci´on, es decir, el usuario al
conocer la zona de estudio, delimita ´areas representativas de
las clases a clasificar, ´estas ´areas en cuesti´on se denominan
“Training Field” (Campos de entrenamiento), el t´ermino de
campos de entrenamiento sirven para “entrenar” al software
de clasificaci´on en el reconocimiento de las distintas ´areas, a
partir de ´este entrenamiento se caracterizan las ´areas de cada
una de las clases, y se asignan los elementos correspondientes
en toda la imagen pertenecientes a cada determinada clase.
El proceso de definici´on de clases representativa se le conoce
como fases de entrenamiento[1,4,9].
Algunos ejemplos de clasificadores supervisados son[9,17]:
M´axima verosimilitud.
Paralelep´ıpedos.
M´ınima distancia.
Vecino m´as cercano.
III-B. Clasificaci´on no supervisada
Se realiza a partir de un conjunto de patrones del que
no se conoce su clase. B´asicamente se trata de encontrar
agrupamientos[18]. No es necesario conocer el ´area de estudio
por parte del usuario que va realizar la clasificaci´on, sin
embargo tendr´a que interpretar las clases que son generadas
por la clasificaci´on, por lo tanto la imagen es segmentada al
n´umero de clases del cual no requiere ning´un muestreo o fase
de entrenamiento[1,4,9].
Algunos ejemplos de clasificadores no supervisados[9,17]
ISODATA.
K-means.
III-C. Clasificaci´on mixta
De acuerdo con Chuvieco Salinero[4], los m´etodos supervi-sados
y no supervisados cuentan con ventajas e inconvenientes.
El m´etodo supervisado resulta muchas veces subjetivo, pues
el usuario establece a priori unas categor´ıas sin valorar las
caracter´ısticas de la imagen, el m´etodo no supervisado no
garantiza que las clases deducidas tengan significado para el
usuario del producto, adem´as es dif´ıcil su verificaci´on. Con la
intenci´on de reducir los inconvenientes en ambos m´etodos, se
han propuesto alternativas que los combinan de alguna forma.
IV. CLASIFICADORES ESTAD´I
STICOS
IV-A. M´axima verosimilitud
Tambi´en conocido como M´axima probabilidad, es el algo-ritmo
m´as usado en clasificaci´on de im´agenes, dado que es
sencillo su aplicaci´on e interpretaci´on de sus resultados[11]. El
m´etodo utiliza el an´alisis estad´ıstico de medias, varianzas y
covarianzas de un conjunto de datos de entrenamiento, cuyo
contenido se supone que tiene una distribuci´on normal[7,17].
´ Este clasificador es m´as complejo dado a que demanda
mayor volumen de c´alculos, sin embargo, es el m´as empleado,
por su robustez y por ajustar con m´as rigor los p´ıxeles de cada
clase[17].
En la fase de entrenamiento, el algoritmo elabora el reco-nocimiento
de los patrones de cada clase con los par´ametros
estad´ısticos de la media, varianza y covarianza de un conjuntos
de ´areas de entrenamiento localizados en la imagen. En la
fase de clasificaci´on, se calcula cada p´ıxel (ecuaci´on 3), la
probabilidad de pertenencia a cada clase, para cada uno de los
p´ıxeles de la imagen con base a su respuesta del patr´on. Por
´ultimo el p´ıxel se asigna a la clase de mayor probabilidad de
permanencia[11].
P(HjE) =
P(EjH)p(H)
p(E)
(3)
Donde:
P(HjE) es la probabilidad condicionada de la hip´otesis
H, dado la evidencia E, es decir la probabilidad de que
el p´ıxel permanezca a cierta clase (Hip´otesis H) tomando
en cuenta su respuesta del patr´on (Evidencia E).
p(H) es la probabilidad de que un p´ıxel permanezca a la
clase considerada en la hip´otesis H sin tomar en cuenta
su informaci´on de patr´on.
p(E) es la probabilidad de la evidencia E.
P(EjH) es la probabilidad condicionada de la evidencia
E dada la hip´otesis H.
Chuvieco[4] menciona otra manera de clasificaci´on de m´axi-ma
verosimilitud en caso de estar trabajando con im´agenes
monocrom´aticas, que puede calcular la probabilidad de perte-nencia
a cierta clase de acuerdo con la ecuaci´on 4.
p(x=A) =
1 p
22A
f
(NDx A)2
22A
g
(4)
Donde:
5. 5
Figura 8. Ejemplo de paralelep´ıpedo con p´ıxeles sin clasificar.
p(x=A): Probabilidad de que un p´ıxel x, pertenezca a la
clase A.
NDx: Valor del p´ıxel.
A: Valor medio de la clase.
A: Varianza de la clase.
El p´ıxel sera asignado a la clase A s´olo si: p(x=A)
p(x=B) variando B desde 1 hasta c, siendo c el n´umero de
clases.
IV-B. Clasificador paralelep´ıdos
El clasificador paralelep´ıpedos es computacionalmente efi-ciente
para clasificar elementos, sin embargo, algunos parale-lep
´ıpedos se sobreponen[17]. Esto se da a que el usuario fija
un ´area de dominio para cada una de las clases, teniendo en
cuenta sus valores centrales y dispersi´on[4].
Vmin Vrx Vmax (5)
Donde:
Vmin: Valor m´ınimo del rango de la clase.
Vmax: Valor m´aximo del rango de la clase.
Vrx: Valor correspondiente del pixel.
Por lo tanto el p´ıxel es asignado a una determinada clase si
sus valores se encuentran a menos de una determinada distan-cia
del centro de clases, ´esta distancia se fija por el usuario,
aunque suele identificarse con la desviaci´on est´andar[4].
Algunos inconvenientes en el dise˜no de ´areas de dominio
pueden implicar:
Que existan p´ıxeles en zonas comunes a dos o m´as
categor´ıas.
Que existan p´ıxeles sin clasificar.
Es por ello que no es recomendado cuando se consideran
clases mixtas.
IV-C. M´ınima distancia
Es el criterio m´as sencillo para asignar un p´ıxel a una de
las clases[4], es por ello que es una forma para determinar de
qu´e clase es miembro un patr´on desconocido x, por lo tanto
se asigna a la clase m´as cercano a su prototipo . Se puede
usar la distancia euclidiana para determinar la proximidad o
cualquier combinaci´on, utilizando la distancia euclidiana, se
reduce el problema a computar las medidas de distancia[17].
La distancia se compara con los valores del patr´on con los
valores centrales de las clases de la imagen[4].
La ecuaci´on m´as empleada es[4]:
dx;A =
vuut
Xm
i=1
(ENDA NDx)2 (6)
Donde:
dx;A: medida de la distancia entre el p´ıxel x y la categor´ıa
A.
ENDA: Valor medio de la categor´ıa.
NDx: valor correspondiente al p´ıxel a clasificar.
No es recomendable para aplicaciones en que las clases de
patrones est´an cercanas una de otras en el espacio medidas y
tienen una alta varianza[17]. Sin embargo, es bastante sencillo y
r´apido de ejecutar, adecuado cuando las distancias entre clases
es grande comparada con la dispersi´on de los elementos de
cada clase y delimita a grupos circulares de radio proporcional
a la situaci´on de cada clase (ver figura 9)[4].
Figura 9. Agrupaciones de m´ınima distancia.
IV-D. Vecino m´as cercano
Conocido como K-NN por sus siglas en ingl´es (K- Near
Neighborhood), es un clasificador no param´etrico. Es una
compilaci´on del clasificador de distancia [14]. La idea b´asica el
cual se fundamenta ´este clasificador es que un nuevo patr´on
se va a clasificar en la clase m´as frecuente a la que pertenece
sus K vecinos m´as cercanos[12]. Es decir, el p´ıxel con patr´on
x se va asignar a la clase m´as frecuente a la que pertenecen
sus Kc vecinos m´as cercanos, los vecinos tienen la misma
importancia de decisi´on, sin considerar las distancias de x.
En la figura 10 se muestra un ejemplo donde el circulo verde
representa el patr´on que se desea clasificar a cualquiera de
las dos clases (cuadrados azules y tri´angulos rojos), tomando
como referencia 3 vecinos (K3) el circulo se clasificara como
triangulo, sin embargo, si se toma de referencia 5 vecinos
(K5), se clasifica como cuadrado. Esto se debe a la cantidad
de vecinos cercanos al patr´on a clasificar. El par´ametro de
vecinos siempre es un n´umero impar.
La principal desventaja es la alta carga computacional,
dado que se almacenan muchos patrones y se calcula muchas
distancias[14].
Dispone de algunas variantes entre ellas[12]
K-NN con rechazo.
K-NN con distancia m´ınima.
K-NN con distancia media.
K-NN con ponderaci´on en las variables.
K-NN con ponderaci´on a clases seleccionadas.
6. 6
Figura 10. Ejemplo de K-NN
IV-E. K-Means
De acuerdo con Sanz[17], el nombre hace referencia a que
se conoce el n´umero de clases o patrones involucrados, es un
algoritmo sencillo, eficiente, siempre y cuando se conozca el
valor de k con exactitud.
El algoritmo est´a basado en el an´alisis de las varianzas,
agrupa un conjunto de datos en un n´umero predefinidos de
clases o grupos. El proceso es el siguiente[5,17]:
1. Inicia al seleccionar al azar el conjunto de elementos a
agrupar en k (N´umero de clases) de forma que se pueda
generar los centroides de la clase.
2. Continua con un proceso recursivo, en la cual cada
interacci´on gen´erica n se distribuyen y reasignan los
patrones del conjunto entre las k clases de acuerdo a
la menor distancia de la muestra y los centroides en
dichas clases.
3. Posteriormente del proceso de reasignaci´on, se actuali-zan
los centroides, y se procede con el paso anterior de
nuevo.
4. El proceso de reasignaci´on no se detiene hasta que
converge al criterio de parada, es decir, cuando alcanza
el par´ametro para terminar, como por ejemplo el n´umero
de interacciones o que los centroides no cambien).
IV-F. ISODATA
ISODATA es el acr´onimo de la definici´on en ingl´es: Inter-active
Self-organizing Data Analysis Techniques[7,17]
Es similar al K-means[7,17], pero con el agregado de una
cantidad de par´ametros y operaciones que llevan a mejorar, por
ejemplo el valor k de K-medias es un valor exacto de clases, en
ISODATA es un valor esperado del n´umero de clases, es decir
empieza con A clases e intenta aproximarse a k clases[17].
Sin embargo, para la eliminaci´on o persistencia de las clases
se basa en los criterios[7]:
Combinaci´on: Si dos centros de clases est´an m´as cercas
que el umbral definido, se combinan y una nueva media
es determinada.
N´umero de miembros de la clase: Si el n´umero de
miembros de una clase es menor al n´umero determinado,
est´a clase se disuelve y se asigna a la clase m´as cercana.
Separaci´on: Si la varianza, el n´umero de miembro o la
distancia media excede los valores predefinidos, entonces
el grupo se puede dividir.
De acuerdo con Sanz[17] las ventajas y desventajas que
presentan son:
Provee mejores resultados que el m´etodo de K-medias.
Es fuertemente dependiente de los par´ametros ingresa-dos,
por lo que hay que tener suficiente conocimiento
sobre ellos.
Permite una mayor interacci´on con el usuario, mediante
el ajuste de los par´ametros. Si se tiene un conocimiento
del tipo de la imagen con la que se trabaja logrando
mejores resultados.
V. REDES NEURONALES ARTIFICIALES
Las redes neuronales son modelos matem´aticos basados en
una estructura que permite procesar entradas de forma similar
a la que ocurre en el cerebro, est´an compuestas por peque˜nas
unidades llamadas neuronas que pueden estar entrelazadas
entre s´ı[3,9].
Existen diversos modelos y paradigmas de redes neuro-nales[
9] pero el modo de an´alisis implica una configuraci´on
de la red neuronal y un entrenamiento a la red que permite
determinar como las neuronas individuales trabajen colectiva-mente
de diferentes maneras, de modo que el reconocimiento
implica el env´ıo de datos a trav´es de la red y la evaluaci´on
a que clase se aproximar´a m´as, en otras palabras una red
neuronal es una estructura y distribuida de procesamiento
de informaci´on, compuesta por procesadores elementales in-terconectados
mediante pesos sin´apticos[9,18]. Generalmente
las redes neuronales toman una entrada num´erica y produce
tambi´en una salida num´erica[14].
Su principal rasgo es que es un sistema capaz de aprender
a partir de una colecci´on de datos de entrenamiento, cada
entrada se multiplica por un peso de conexi´on (Wi;j )[3,14].
La implementaci´on de una red neuronal atraviesa por un
periodo de prueba y error en el dise˜no de la misma antes
de encontrar el dise˜no satisfactorio[17]. De manera general las
redes neuronales presentan tres caracter´ısticas:
Aprendizaje: ´ Esta caracter´ıstica se refiere a que la neu-rona
de la red dispone de una capacidad de almacenar
conocimiento a trav´es de un entrenamiento.
Generalizaci´on: Se refiere a que se obtiene informaci´on
de salida razonables.
Adaptabilidad: La red neuronal puede ser nuevamente
entrenada para funcionar adecuadamente ante los cam-bios.
El dise˜no de una red consiste en[18]
Arreglar las neuronas en varias capas.
Decidir el tipo de conexi´on entre las neuronas de dife-rentes
capas, as´ı como entre las neuronas de una misma
capa.
Decidir la forma en que una neurona recibe una entrada
y produce una salida.
7. 7
Figura 11. Esquema de red neuronal. Fuente: [17]
Determinar el peso de cada conexi´on dentro de la red,
permitiendo que la red aprenda los valores apropiados de
los pesos de conexi´on, usando el conjunto de datos de
entrenamiento.
Existen muchas arquitecturas de redes neuronales entre ellas
se encuentran: Perceptrones multicapa o de una sola capa,
Redes recurrentes y de Hopfield, Redes de Kohonen, RBF
(Radial Basis Function), resonancia adaptativa, recurrente,
pulso-acomplado, entre otros m´as[13,17,18].
Seg´un Sobrano[18], las redes neuronales artificiales tiene
muchas similitudes con el reconocimiento estad´ıstico de pa-trones,
esto dado que concierne en la representaci´on de datos
y los principios de clasificaci´on, pero en la cuesti´on pr´actica
son diferentes. Por otro lado menciona algunas ventajas que
presentan las redes neuronales enfrente a los clasificadores
estad´ısticos:
Te´oricamente se pueden determinar cualquier funci´on,
por lo que son adecuadas en aplicaciones que no son
f´acilmente descritas anal´ıticamente.
Excepto por los patrones de entrada, no es necesario
suministrar informaci´on adicional.
Se puede aplicar cualquier tipo de datos.
Se obtienen buenos resultados con datos ruidosos.
No se hacen hip´otesis acerca de la distribuci´on estad´ıstica
de las variables de entrada.
Los modelos neuronales no necesitan un conocimiento a
priori de los par´ametros internos del clasificador.
Despu´es de entrenadas son extremadamente r´apidas y
f´acilmente implementadas.
En Sobrado[18] se puede encontrar informaci´on sobre los
pasos de implementaci´on de una red neuronal como clasifica-dor.
En Ram´ırez Chac´on[13] realiza una revisi´on de las redes
neuronales durante la ´ultima d´ecada, lo cual se da una breve
descripci´on de algunos de las redes neuronales que presentan:
V-1. Teor´ıa de resonancia adaptativa (ART): ´ Esta red
puede ser supervisada o no supervisada, su funcionamiento
es similar al del cerebro humano, divido en un m´odulo de
comparaci´on, un par´ametro de vigilancia y un modulo de
reinicio. El modulo de comparaci´on toma el patr´on de entrada
y lo agrupa en alguna clase conocida por la red, el par´ametro
de vigilancia se encarga de indicar el grado de pertenencia
de la entrada a alguna clase dada, si el patr´on no pertenece a
ninguna clase se crea una nueva. La ventaja de ´esta red es la
capacidad de agrupar dato acorde a su informaci´on.
V-2. Red neuronal celular (CNN): Basada en la teor´ıa de
aut´omatas celulares, permite la interacci´on de vecinos de cada
unidad en la red. Contiene una cantidad fija de unidades lla-madas
c´elulas, las cuales son sistemas no lineales, din´amicos
donde la informaci´on de entrada es codificada para conocer su
comportamiento. Cada c´elula est´a localmente interconectadas
con m´ultiples entradas que vienen de otras c´elulas.
V-3. Perceptr´on multicapa (MLP) y Backpropagation
(BP): Fue uno de los primeros modelos de redes neuronales,
se refiere a redes perceptr´on multicapa con funciones de ac-tivaci
´on sigmoidales que son entrenadas mediante algoritmos
de aprendizaje de Backpropagation.
V-4. Red neuronal oscilatoria (ONN): La teor´ıa de ´esta
red se basa en los est´ımulos con osciladores peri´odicas sin-cronizadas
en forma de grupos en la corteza visual y es
posible que sirvan para detectar caracter´ısticas en una escena
visual, partiendo de esto, se modelan redes con caracter´ısticas
osciladoras que van sincronizando seg´un el patr´on de entrada.
Un ejemplo de ´esta red es el modelo de LEGION (locally
excitatory globally inhibitor oscillator network) en el cual la
oscilaci´on se genera a partir de la retroalimentaci´on de un
vecindario de unidades excitables y un inhibidor, en otras
palabras, cada unidad excitable es estimulada de forma pro-porcional
a cada entrada formando una retroalimentaci´on con
el inhibidor y se crea una oscilaci´on cuya forma depende del
estimulo de entrada.
V-5. Red neuronal Pulso-Acoplada (PCNN): La red se
implementa en un modelo de una neurona por p´ıxel y su
arquitectura tiene tres m´odulos principales: ´arbol de dentritas,
encadenamiento y generador de pulsos. El ´arbol recibe la
informaci´on del vecindario y se procesa en el m´odulo de
encadenamiento y el feeding (otra parte de la red que contiene
tambi´en valores de entrada), el generador de pulsos tiene un
umbral din´amico que se basa en el proceso interno que tiene
la neurona en el feeding y el m´odulo de encadenamiento.
V-6. Red neuronal recurrente (RNN): Tienen conexio-nes
formando un ciclo directo, esto permite comportamiento
dinamicos ´pero con el coste de consumo de mas ´memoria
que las redes directa. Ejemplos de la red: Hopfield, RNN
bidireccional y RNN tiempo continuo.
V-7. Red neuronal con funciones base radial (RBFNN):
Son redes que contienen funciones de activacion ´de base radial
que cumplen cierto criterio, generalmente estas ´funciones
de activacion ´tienen un comportamiento gaussiano, lo cual
consiste en una red de tres capas: (1) entrada, (2) caja negra
que contiene funciones de base radial no lineal y (3) salida.
V-8. Red neuronal probabilisticas (RPNN): En estos ´tipos
de redes se encuentran red neuronal probabil´ıstica, el algoritmo
de mezclas gaussianas y la red neuronal aleatoria. La red
neuronal probabil´ıstica consta de cuatro capas, la cual la
primera recibe los datos de entrada, la segunda dispone de un
conjunto de neuronas totalmente conectadas con las neuronas
de la primera capa con funciones de activacion ´dada por:
1
jk(x) = (
(
p
2)d
)exp(
1
22 (x mxj
k)2). Donde d es
el tama˜no del vector, x es la entrada, mxj
k es la media de j-
´esimo vector de diferencia, k es la clase correspondiente y
8. 8
es un par´ametro de suavizado. La tercera capa es una capa de
suma que completa la estimaci´on de probabilidad y por ´ultimo
la capa final los clasifica la entrada de acuerdo a la decisi´on
bayesiana.
V-9. Mapa Auto-Organizado de Kohonen (SOM): Es una
red no supervisada que se basa en un proceso competitivo
donde cada neurona en una red neuronal se vuelve sensitiva
a las categor´ıas de los patrones de entrada. Esto es dado que
se utiliza el aprendizaje competitivo para que las neuronas sin
una distribuci´on de datos especificas se vaya aproximando a
la distribuci´on de los datos de entrada.
VI. CONCLUSIONES
El reconocimiento de patrones es un paso fundamental para
el an´alisis e interpretaci´on de una imagen digital, lo cual
permitir´a ajustar clases de acuerdo a caracter´ısticas relevantes
que presenten los objetos. Aunque hay una gran diversidad de
m´etodos de clasificaci´on (heur´ısticas, matem´aticas, ling¨u´ısticas
y redes neuronales), ´estos ventajas y desventajas para el
reconocimiento de patrones. Los m´etodos m´as empleados son
clasificadores estad´ısticos y redes neuronales.
´ Este trabajo menciona en forma general algunos de los
clasificadores (estad´ısticos y redes neuronales) m´as usados.
El cual se logro conocer la gran diversidad de modelos que
existen para el reconocimiento de patrones.
Por ´ultimo cabe mencionar que la descripci´on de los cla-sificadores
es tan solo muy general, para lograr entender
su funcionamiento, ventajas y desventajas, se requiere una
revisi´on m´as profunda.
REFERENCIAS
[1] R.M. Ayala and M. Menenti. Metodolog´ıa para la
b´usqueda del mejor clasificador de im´agenes de sat´elite.
Teledetecci´on, medio ambiente y cambio global, pages
469–472, 2001.
[2] Osvaldo Cair´o and Sivia Guardati Buemo. Estructura de
datos. Mcgraw-Hill, M´exico, 1997.
[3] Enrique Calot. Reconocimiento de patrones en im´agenes
m´edicas basado en sistemas inteligenes. Tesis de licen-ciatura,
Facultad de ingenier´ıa. Universidad de Buenos
Aires, Buenos Aires, Argentina, 2008.
[4] Emilio Chuvieco Salinero. Teledetecci´on ambiental: la
observaci´on de la tierra desde el espacio. Ariel ciencias,
3ra edition, 2008.
[5] Crhistian Correa, Constantino Valero, and Pilar Barreiro.
Procesamiento de im´agenes para la identificaci´on de uva
y follaje usando t´ecnicas de clasificaci´on no supervisadas.
In IV Congreso de estudiantes universitarios de ciencia,
tecnolog´ıa e ingenieria agr´onomica, pages 53–56, 2011.
[6] R. De la Rosa Flores. Procesamiento de im´agenes
digitales. In X congreso Nacional en Inform´atica y
computaci´on, pages 1–5, Puebla, M´exico, 08 al 12 de
Octubre 2007. Instituto tecnol´ogico de puebla.
[7] Michael J de Smith, Michael F Goodchild, and Paul A
Longley. Geospatial analisys: a comprehensive guide
to principles, techniques and softwares tools. Matador,
2007.
[8] Tzitziki Janik Garc´ıa Mora and Jean Francois Mas. Com-paraci
´on de metodolog´ıas para el mapeo de la cobertura
y uso del suelo en el sureste de m´exico. Investigaciones
Geogr´aficas, Bolet´ın del Instituto de Geograf´ıa, UNAM,
(67):7–19, 2008.
[9] J. L. Gil, E. B. Garc´ıa, D. R. Ponvert-Delisle, R. S´anchez,
and M. B. Vega. Enfoques para la clasificaci´on digital de
im´agenes mono y multiespectrales y su implementaci´on
en el software cubano TN Estudio V2.0. Revista de
teledetecci´on, 20:35–52, 2003.
[10] Rafael C. Gonzales and Richard E. Woods. Tratamiento
digital de im´agenes. Addison-Wesley, Diaz de Santos,
1996.
[11] Jean Francois Mas. Aplicaciones del sensor MODIS para
el monitoreo del territorio. SEMARNAT, INE, UNAM
y CIGA, 2011.
[12] Abdelmalik Moujahid, I˜naki Inza, and Pedro Larraga˜na.
Tema 5. clasificadores k-nn. S/F.
[13] Juan Ram´ırez Q. and Mario I. Chac´on M. Redes neu-ronales
artificiales para el procesamiento de im´agenes,
una revisi´on de la ´ultima d´ecada. Revista de ingenier´ıa
el´ectrica, electr´onica y computaci´on, 9(1):7–16, 2011.
[14] Victor Rodr´ıguez Doncel. Entrenador para el control
de pr´otesis mio´electricas. http://vroddon.sdf-eu.org/emg/
proy.pdf, 2001. Accesado: 22 de Enero de 2013.
[15] Harold A. Romo R., Fabi´an Ram´ırez M., and Ridier
Valdivieso B. Detecci´on del bacilo mycobacterium tu-berculosis
mediante reconocmiento de patrones. Avances
en sistemas e inform´atica, 4(3):111–166, 2007.
[16] Jos´e M. Salinas and Carmen Porras. Fundamento psi-cofisico
del reconocmiento de patrones. Psicothema,
5(001):161–172, 1993.
[17] Cecilia Ver´onica Sanz. Razonamiento evidencial din´ami-co:
Un m´etodo de clasificaci´on aplicado al an´alisis de
im´agenes hiperespectrales. Tesis doctoral, Universidad
Nacional de La Plata. Facultad de Ciencias Exactas,
Argentina, 2002.
[18] Eddie Angel Sobrado Malpartida. Sistema de visi´on ar-tificial
para el reconocimiento y manipulaci´on de objetos
utilizando un brazo robot. Tesis de maestr´ıa, Pontificia
Universidad Cat´olica del Per´u, Per´u, 2003.
[19] Kenneth Walker. Other iris from ken walker’s gar-den.
http://home.astound.net/kenww/my garden/other
iris.htm, 1999-2003.