Reconocimiento de patrones y métodos de clasificación en imágenes digitales

1
Reconocimiento de patrones y métodos de
clasificación en imágenes digitales
Miguel Armando López Beltrán
Universidad Autónoma de Sinaloa
Facultad de Ciencias de la Tierra y el Espacio
miguel.armandolb@gmail.com
Enero 2013
Resumen—Este es un documento que trata sobre el reconoci-miento
de patrones y una descripción breve sobre clasificadores
estad´ısticos y redes neuronales.
I. INTRODUCCIÓ
N
El procesamiento digital de imágenes se divide en dos
aspectos: el procesamiento y el análisis de las imágenes[6].
El procesamiento se refiere a la transformación y restaura-ci
ón y mejoramiento de la imágenes[6].
Por otro lado el análisis de imágenes es un proceso que con-siste
descubrir, identificar y comprender ciertos patrones y/o
propiedades que son relevantes en la realización de cualquier
trabajo basado en imágenes digitales[6,8,10,15]. Sin embargo,
el proceso de análisis de imágenes se dividen en tres áreas
básicas :
Procesado de bajo nivel: Son funciones automáticas
y no requieren inteligencia por parte del sistema de
análisis (reducción de ruido, realce de contraste, realce
de caracter´ısticas, etc.).
Procesado de nivel intermedio: Comprende la extracción
y caracterización de los componentes de la imagen
obtenida en el procesos de bajo nivel (segmentación
(regiones, objetos) descripción de objetos y clasificación
o reconocimiento).
Procesado de alto nivel: Comprende el reconocmiento
y la interpretación, análisis de la imagen y funciones
cognitivas.
Figura 1. Modelo general de procesamiento de imágenes. Fuente: [10,15]
Por lo tanto, existe una gran gamma de áreas en la ciencias
para las aplicaciones del procesamiento digital de imágenes,
entre las principales se encuentra: medicina, biolog´ıa, astro-nom
´ıa, agricultura, historia, fotograf´ıa, geomática, veterinaria,
etc., en el cual se puede aplicar cualquier nivel de procesa-miento[
6,8].
Pero para el análisis de la imagen en cualquier nivel de
procesamiento es importante realizar un reconocimiento de
patrones.
II. RECONOCIMIENTO DE PATRONES
El reconocimiento de patrones en imágenes se encuentra
en un campo muy amplio en la investigación[3]. El reco-nocimiento
asigna un nombre a un objeto, basándose en la
información que proveen sus descriptores, y la interpretación
asigna su significado a un conjunto de objetos reconocidos[15].
Sobrado[18] define el reconocimiento de patrones como: “es
la categorización de datos de entrada en clases identificadas,
por medio de la extracción de caracter´ısticas significativas o
atributos de los datos extra´ıdos de un medio ambiente que
contiene detalles relevantes”.
Además Gonzáles & Woods[10] definen un patrón como
“es una descripción estructural o cuantitativa de un objeto
o de alguna otra entidad de interés en una imagen, en otras
palabras es una disposición de descriptores” y una clase de
patrones como “es una familia de patrones que comparten
algunas propiedades comunes”.
Por lo tanto, el reconocimiento de patrones de un determi-nado
espacio son clasificados en un conjunto discreto de clases
de patrones, en donde cada una de las clases es definida con
un patrón representante de la clase y viene dado previamente
al inicio del proceso de clasificación[16].
Por lo tanto, las clases de patrones se representan como
w1;w2; :::;wn, donde n representa el número total de cla-ses[
10,15,16].
De acuerdo con Sobrano[18] los sistemas de reconocimiento
de patrones se pueden identificar en 4 tipos de metodolog´ıas:
Heur´ısticas: Metodolog´ıa base al uso de la experiencia y
la intuición humana.
Matemáticas: Metodolog´ıa que hace uso de las propie-dades
comunes de los patrones y se basan en reglas
de clasificación formuladas en un marco matemático. Se
divide en dos áreas:
Determin´ısticas: No requieren de propiedades es-tad
´ısticas. Ejemplo clasificación por distancia eucli-diana.

2
Figura 2. Iris etosa, Iris Versicolor, Iris virginica. Fuente: [19].
Estad´ısticas: Aproximación más simple que consiste
en representar a cada patrón mediante un vector de
números, y cada clase por uno o varios patrones
prototipo.
Lingü´ısticas: Reducen un objeto a un conjunto de ele-mentos
estructurales o primitivas, añadiendo una sintaxis
para relacionar estos elementos de forma espacial, es de-cir,
descomponiendo a los objetos complejos en términos
de conjuntos de primitivas (arcos, ángulos, rectas, etc.)
con reglas para describir la relación espacial entre ellas.
Redes neuronales artificiales: El análisis implica la con-figuraci
ón de una red de neuronas artificiales y el entre-namiento
de la red para determinar como las neuronas
individuales pueden afectar uno a la otra, el modo de
reconocimiento implica el env´ıo de datos a través de la
red y la evaluación a que clase se aproximará más.
Gonzáles Woods y Romo[15], menciona que las princi-pales
representaciones de patrones utilizados en la práctica
son[10,15]:
Vectores: Descripciones cuantitativas.
Cadenas.
A´rboles: Descripciones estructurales.
II-A. Patrones vectoriales
Los patrones vectoriales se representan utilizando letras
minúsculas en negrita, como x, y, z, se representan como
matrices (nx1) (ecuación 1)[10].
x =
2
x1
x2
:::
xn
664
3
775
(1)
Donde cada componente, xi representa el i-ésimo descriptor
y n es el número de descriptores.
Un ejemplo que da Gonzáles Woods[10], es describir
tres tipos de lirios (Iris setosa, Iris virginica e Iris versicolor
(Figura 2), por la medida de la longitud y la anchura de sus
pétalos. Por lo tanto, se utilizo vectores bidimensionales (ver
ecuación 2).
x =

x1
x2

(2)
x1 y x2 corresponden a la anchura y longitud del pétalo de
las Iris spp. Las tres clases de patrones, se representan por
w1, w2 y w3. En la figura 3 muestra las medidas de anchura
y longitud para cada tipo de lirio. Se observa que la elección
de caracter´ısticas podrá discriminar perfectamente la clase Iris
setosa de las otras dos, pero no as´ı las clases Iris versicolor
e Iris virginica entre s´ı.
Figura 3. Dos medidas realizadas para tres tipos de lirios. Fuente: [10].
Otro método en la generación de patrones vectoriales es con
respecto a la firma generada por sus contornos.
Una firma es una representación funcional unidimensional
de un contorno y se pueden generar en var´ıas formas. La forma
más simple es representar la distancia desde un punto de vista
interior, como puede ser el centroide al contorno como una
función del ángulo. En otras palabras, la idea básica de una
firma es reducir la representación del contorno a una función
unidimensional.
Figura 4. Firma correspondiente a tres objetos.
En la figura 4 las imágenes superiores (circulo y cuadrado),
su firma es en relación entre el ángulo y la distancia con el
centroide, mientras que la imagen inferior es en función a su
contorno.
II-B. Patrones de cadena
Las representaciones en forma de cadena generan adecua-damente
patrones de objetos y otras entidades cuya estructura
se basa en conexiones relativamente sencillas de sentencias,

3
que normalmente están asociadas a formas de bordes o con-tornos[
10].
Un ejemplo en reconocimiento de patrones de cadenas que
presenta Gonzáles Woods[10] es un patrón en forma de
escalera (figura 5), aunque éste patrón puede ser expresado en
términos de un patrón vectorial utilizando un método de firmas
(figura 4), aunque se perder´ıa la estructura básica, que consiste
en la representación de dos sencillos elementos a y b. Es por
ello, que es más lógico definir los elementos a y b y hacer que
el patrón sea la cadena de s´ımbolos W = abababab::: como
se muestra en la figura 5.
Figura 5. Estructura codificada en términos de los primitivos a y b [10].
II-C. Patrones de árboles
Un árbol es una estructura jerárquica aplicada sobre una
colección de elementos u objetos llamados nodos, donde uno
es conocido como ra´ız, creando una relación o parentesco entre
los nodos dando lugar a términos como padre, hijo, hermano,
antecesor, sucesor, ancestro, etc.[2].
Cairó Guardati[2] menciona las principales caracter´ısticas
y propiedades de los árboles en general son:
Todo árbol que no es vac´ıo, tiene un único nodo ra´ız.
Todos los nodos que son descendientes directos (hijos)
de un mismo nodo (padre), son hermanos.
Todo nodo que no tiene ramificaciones (hijos), se conoce
con el nombre de terminal u hoja.
Todo nodo que no es ra´ız, ni terminal u hoja se conoce
con el nombre de interior.
El grado es el número de descendientes directos de un
determinado nodo. El grado del árbol es el máximo grado
de todos los nodos del árbol.
El nivel es el número de arcos que deben ser recorridos
para llegar a un determinado nodo. Por lo tanto la ra´ız
tiene un nivel 1.
La altura del árbol es el máximo número de niveles de
todos los nodos del árbol.
Es una técnica potente para muchas aplicaciones, donde la
mayor´ıa de los esquemas de ordenación jerárquica dan lugar
Figura 6. Ciudad de Culiacán, Sinaloa. Imagen extra´ıda de Google Earth.
a estructuras de tipo árbol, un ejemplo de ello es una imagen
de fotograf´ıa aérea o imagen satelital[10].
Un ejemplo de ésta técnica es la siguiente: tomando como
referencia la ciudad de Culiacán que representa una imagen
compuesta de zonas rurales, agr´ıcolas, urbanas, cuerpos de
agua, caminos terracer´ıa, pavimento, autopistas, etc. La ra´ız
del árbol representa la imagen completa, aunque sus rami-ficaciones
son muy abstractas, la idea de representación se
muestra en la figura 7. El nivel siguiente representa las áreas
compuestas de v´ıas de comunicación, zonas agr´ıcolas, rurales
y urbanas, a la vez se componen de más nodos, a excepción
del nodo de zona rural el cual termina siendo una hoja. La
altura del árbol está basado en 4 niveles, lo cual es suficiente
para la representación abstracta del ejemplo.
Figura 7. Representación de árbol en base a la figura 6.
III. RECONOCIMIENTOS DE PATRONES BASADOS EN
MÉ
TODOS MATEMÁ
TICOS DE DECISIÓ
N
Uno de los motivos del uso de métodos de clasificación
está dada por las caracter´ısticas de los elementos, los cuales
disponen de cierta caracter´ıstica similares que pueden asig-narse
a cierta clase, la cual representar´ıa la caracter´ıstica en
cuestión.
´ Esta semejanza entre los elementos se utilizan para asig-nar
la clase. Las técnicas de clasificación, proporcionan una
herramienta para asignar que elementos pertenecen a x clase.

4
La clasificación de imágenes parte de un método y de una
medida cuantitativa que ayuda a encontrar la semejanza o no,
entre las partes de la imagen. Los métodos pueden aplicar una
técnica supervisada o no supervisada, con enfoque estad´ıstico
o de redes neuronales[9].
Sin embargo, Chuvieco Salinero[4], menciona un tercer
método, los métodos mixtos.
Además, como ya se menciono anteriormente, Sobrano[18]
menciona que los reconocimientos de patrones que utilizan
metodolog´ıa matemática se dividen en dos: (1) determin´ısticas
y (2) estad´ısticas.
Los clasificadores estad´ısticos consideran que los patrones
de las clases forman una población estad´ıstica caracterizada
por una determinada función de distribución o función de
densidad, donde las funciones tienen una forma generalmente
desconocida, por lo tanto los clasificadores intentan ajustarlos
a los diferentes modelos teóricos, siguiendo enfoques pa-ram
étricos y no paramétricos, los clasificadores determin´ısticas
no consideran la función de distribución o función de densi-dad[
9].
Gil et al.[9] menciona algunos ejemplos de clasificadores
estad´ısticos, los cuales se encuentran: máxima verosimilitud,
paralelep´ıpedos, m´ınima distancia, vecino más cercano, K-means,
ISODATA.
III-A. Clasificación supervisada
El usuario parte de cierto conocimiento de la zona de estu-dio,
fundamentalmente el usuario define con máxima precisión
cada una de las categor´ıas que éste pretende discriminar,
antes de efectuar la clasificación, es decir, el usuario al
conocer la zona de estudio, delimita áreas representativas de
las clases a clasificar, éstas áreas en cuestión se denominan
“Training Field” (Campos de entrenamiento), el término de
campos de entrenamiento sirven para “entrenar” al software
de clasificación en el reconocimiento de las distintas áreas, a
partir de éste entrenamiento se caracterizan las áreas de cada
una de las clases, y se asignan los elementos correspondientes
en toda la imagen pertenecientes a cada determinada clase.
El proceso de definición de clases representativa se le conoce
como fases de entrenamiento[1,4,9].
Algunos ejemplos de clasificadores supervisados son[9,17]:
Máxima verosimilitud.
Paralelep´ıpedos.
M´ınima distancia.
Vecino más cercano.
III-B. Clasificación no supervisada
Se realiza a partir de un conjunto de patrones del que
no se conoce su clase. Básicamente se trata de encontrar
agrupamientos[18]. No es necesario conocer el área de estudio
por parte del usuario que va realizar la clasificación, sin
embargo tendrá que interpretar las clases que son generadas
por la clasificación, por lo tanto la imagen es segmentada al
número de clases del cual no requiere ningún muestreo o fase
de entrenamiento[1,4,9].
Algunos ejemplos de clasificadores no supervisados[9,17]
ISODATA.
K-means.
III-C. Clasificación mixta
De acuerdo con Chuvieco Salinero[4], los métodos supervi-sados
y no supervisados cuentan con ventajas e inconvenientes.
El método supervisado resulta muchas veces subjetivo, pues
el usuario establece a priori unas categor´ıas sin valorar las
caracter´ısticas de la imagen, el método no supervisado no
garantiza que las clases deducidas tengan significado para el
usuario del producto, además es dif´ıcil su verificación. Con la
intención de reducir los inconvenientes en ambos métodos, se
han propuesto alternativas que los combinan de alguna forma.
IV. CLASIFICADORES ESTADÍ
STICOS
IV-A. Máxima verosimilitud
También conocido como Máxima probabilidad, es el algo-ritmo
más usado en clasificación de imágenes, dado que es
sencillo su aplicación e interpretación de sus resultados[11]. El
método utiliza el análisis estad´ıstico de medias, varianzas y
covarianzas de un conjunto de datos de entrenamiento, cuyo
contenido se supone que tiene una distribución normal[7,17].
´ Este clasificador es más complejo dado a que demanda
mayor volumen de cálculos, sin embargo, es el más empleado,
por su robustez y por ajustar con más rigor los p´ıxeles de cada
clase[17].
En la fase de entrenamiento, el algoritmo elabora el reco-nocimiento
de los patrones de cada clase con los parámetros
estad´ısticos de la media, varianza y covarianza de un conjuntos
de áreas de entrenamiento localizados en la imagen. En la
fase de clasificación, se calcula cada p´ıxel (ecuación 3), la
probabilidad de pertenencia a cada clase, para cada uno de los
p´ıxeles de la imagen con base a su respuesta del patrón. Por
último el p´ıxel se asigna a la clase de mayor probabilidad de
permanencia[11].
P(HjE) =
P(EjH)p(H)
p(E)
(3)
Donde:
P(HjE) es la probabilidad condicionada de la hipótesis
H, dado la evidencia E, es decir la probabilidad de que
el p´ıxel permanezca a cierta clase (Hipótesis H) tomando
en cuenta su respuesta del patrón (Evidencia E).
p(H) es la probabilidad de que un p´ıxel permanezca a la
clase considerada en la hipótesis H sin tomar en cuenta
su información de patrón.
p(E) es la probabilidad de la evidencia E.
P(EjH) es la probabilidad condicionada de la evidencia
E dada la hipótesis H.
Chuvieco[4] menciona otra manera de clasificación de máxi-ma
verosimilitud en caso de estar trabajando con imágenes
monocromáticas, que puede calcular la probabilidad de perte-nencia
a cierta clase de acuerdo con la ecuación 4.
p(x=A) =
1 p
22A
f
(NDx A)2
22A
g
(4)
Donde:

5
Figura 8. Ejemplo de paralelep´ıpedo con p´ıxeles sin clasificar.
p(x=A): Probabilidad de que un p´ıxel x, pertenezca a la
clase A.
NDx: Valor del p´ıxel.
A: Valor medio de la clase.
A: Varianza de la clase.
El p´ıxel sera asignado a la clase A sólo si: p(x=A)
p(x=B) variando B desde 1 hasta c, siendo c el número de
clases.
IV-B. Clasificador paralelep´ıdos
El clasificador paralelep´ıpedos es computacionalmente efi-ciente
para clasificar elementos, sin embargo, algunos parale-lep
´ıpedos se sobreponen[17]. Esto se da a que el usuario fija
un área de dominio para cada una de las clases, teniendo en
cuenta sus valores centrales y dispersión[4].
Vmin Vrx Vmax (5)
Donde:
Vmin: Valor m´ınimo del rango de la clase.
Vmax: Valor máximo del rango de la clase.
Vrx: Valor correspondiente del pixel.
Por lo tanto el p´ıxel es asignado a una determinada clase si
sus valores se encuentran a menos de una determinada distan-cia
del centro de clases, ésta distancia se fija por el usuario,
aunque suele identificarse con la desviación estándar[4].
Algunos inconvenientes en el diseño de áreas de dominio
pueden implicar:
Que existan p´ıxeles en zonas comunes a dos o más
categor´ıas.
Que existan p´ıxeles sin clasificar.
Es por ello que no es recomendado cuando se consideran
clases mixtas.
IV-C. M´ınima distancia
Es el criterio más sencillo para asignar un p´ıxel a una de
las clases[4], es por ello que es una forma para determinar de
qué clase es miembro un patrón desconocido x, por lo tanto
se asigna a la clase más cercano a su prototipo . Se puede
usar la distancia euclidiana para determinar la proximidad o
cualquier combinación, utilizando la distancia euclidiana, se
reduce el problema a computar las medidas de distancia[17].
La distancia se compara con los valores del patrón con los
valores centrales de las clases de la imagen[4].
La ecuación más empleada es[4]:
dx;A =
vuut
Xm
i=1
(ENDA NDx)2 (6)
Donde:
dx;A: medida de la distancia entre el p´ıxel x y la categor´ıa
A.
ENDA: Valor medio de la categor´ıa.
NDx: valor correspondiente al p´ıxel a clasificar.
No es recomendable para aplicaciones en que las clases de
patrones están cercanas una de otras en el espacio medidas y
tienen una alta varianza[17]. Sin embargo, es bastante sencillo y
rápido de ejecutar, adecuado cuando las distancias entre clases
es grande comparada con la dispersión de los elementos de
cada clase y delimita a grupos circulares de radio proporcional
a la situación de cada clase (ver figura 9)[4].
Figura 9. Agrupaciones de m´ınima distancia.
IV-D. Vecino más cercano
Conocido como K-NN por sus siglas en inglés (K- Near
Neighborhood), es un clasificador no paramétrico. Es una
compilación del clasificador de distancia [14]. La idea básica el
cual se fundamenta éste clasificador es que un nuevo patrón
se va a clasificar en la clase más frecuente a la que pertenece
sus K vecinos más cercanos[12]. Es decir, el p´ıxel con patrón
x se va asignar a la clase más frecuente a la que pertenecen
sus Kc vecinos más cercanos, los vecinos tienen la misma
importancia de decisión, sin considerar las distancias de x.
En la figura 10 se muestra un ejemplo donde el circulo verde
representa el patrón que se desea clasificar a cualquiera de
las dos clases (cuadrados azules y triángulos rojos), tomando
como referencia 3 vecinos (K3) el circulo se clasificara como
triangulo, sin embargo, si se toma de referencia 5 vecinos
(K5), se clasifica como cuadrado. Esto se debe a la cantidad
de vecinos cercanos al patrón a clasificar. El parámetro de
vecinos siempre es un número impar.
La principal desventaja es la alta carga computacional,
dado que se almacenan muchos patrones y se calcula muchas
distancias[14].
Dispone de algunas variantes entre ellas[12]
K-NN con rechazo.
K-NN con distancia m´ınima.
K-NN con distancia media.
K-NN con ponderación en las variables.
K-NN con ponderación a clases seleccionadas.

6
Figura 10. Ejemplo de K-NN
IV-E. K-Means
De acuerdo con Sanz[17], el nombre hace referencia a que
se conoce el número de clases o patrones involucrados, es un
algoritmo sencillo, eficiente, siempre y cuando se conozca el
valor de k con exactitud.
El algoritmo está basado en el análisis de las varianzas,
agrupa un conjunto de datos en un número predefinidos de
clases o grupos. El proceso es el siguiente[5,17]:
1. Inicia al seleccionar al azar el conjunto de elementos a
agrupar en k (Número de clases) de forma que se pueda
generar los centroides de la clase.
2. Continua con un proceso recursivo, en la cual cada
interacción genérica n se distribuyen y reasignan los
patrones del conjunto entre las k clases de acuerdo a
la menor distancia de la muestra y los centroides en
dichas clases.
3. Posteriormente del proceso de reasignación, se actuali-zan
los centroides, y se procede con el paso anterior de
nuevo.
4. El proceso de reasignación no se detiene hasta que
converge al criterio de parada, es decir, cuando alcanza
el parámetro para terminar, como por ejemplo el número
de interacciones o que los centroides no cambien).
IV-F. ISODATA
ISODATA es el acrónimo de la definición en inglés: Inter-active
Self-organizing Data Analysis Techniques[7,17]
Es similar al K-means[7,17], pero con el agregado de una
cantidad de parámetros y operaciones que llevan a mejorar, por
ejemplo el valor k de K-medias es un valor exacto de clases, en
ISODATA es un valor esperado del número de clases, es decir
empieza con A clases e intenta aproximarse a k clases[17].
Sin embargo, para la eliminación o persistencia de las clases
se basa en los criterios[7]:
Combinación: Si dos centros de clases están más cercas
que el umbral definido, se combinan y una nueva media
es determinada.
Número de miembros de la clase: Si el número de
miembros de una clase es menor al número determinado,
está clase se disuelve y se asigna a la clase más cercana.
Separación: Si la varianza, el número de miembro o la
distancia media excede los valores predefinidos, entonces
el grupo se puede dividir.
De acuerdo con Sanz[17] las ventajas y desventajas que
presentan son:
Provee mejores resultados que el método de K-medias.
Es fuertemente dependiente de los parámetros ingresa-dos,
por lo que hay que tener suficiente conocimiento
sobre ellos.
Permite una mayor interacción con el usuario, mediante
el ajuste de los parámetros. Si se tiene un conocimiento
del tipo de la imagen con la que se trabaja logrando
mejores resultados.
V. REDES NEURONALES ARTIFICIALES
Las redes neuronales son modelos matemáticos basados en
una estructura que permite procesar entradas de forma similar
a la que ocurre en el cerebro, están compuestas por pequeñas
unidades llamadas neuronas que pueden estar entrelazadas
entre s´ı[3,9].
Existen diversos modelos y paradigmas de redes neuro-nales[
9] pero el modo de análisis implica una configuración
de la red neuronal y un entrenamiento a la red que permite
determinar como las neuronas individuales trabajen colectiva-mente
de diferentes maneras, de modo que el reconocimiento
implica el env´ıo de datos a través de la red y la evaluación
a que clase se aproximará más, en otras palabras una red
neuronal es una estructura y distribuida de procesamiento
de información, compuesta por procesadores elementales in-terconectados
mediante pesos sinápticos[9,18]. Generalmente
las redes neuronales toman una entrada numérica y produce
también una salida numérica[14].
Su principal rasgo es que es un sistema capaz de aprender
a partir de una colección de datos de entrenamiento, cada
entrada se multiplica por un peso de conexión (Wi;j )[3,14].
La implementación de una red neuronal atraviesa por un
periodo de prueba y error en el diseño de la misma antes
de encontrar el diseño satisfactorio[17]. De manera general las
redes neuronales presentan tres caracter´ısticas:
Aprendizaje: ´ Esta caracter´ıstica se refiere a que la neu-rona
de la red dispone de una capacidad de almacenar
conocimiento a través de un entrenamiento.
Generalización: Se refiere a que se obtiene información
de salida razonables.
Adaptabilidad: La red neuronal puede ser nuevamente
entrenada para funcionar adecuadamente ante los cam-bios.
El diseño de una red consiste en[18]
Arreglar las neuronas en varias capas.
Decidir el tipo de conexión entre las neuronas de dife-rentes
capas, as´ı como entre las neuronas de una misma
capa.
Decidir la forma en que una neurona recibe una entrada
y produce una salida.

7
Figura 11. Esquema de red neuronal. Fuente: [17]
Determinar el peso de cada conexión dentro de la red,
permitiendo que la red aprenda los valores apropiados de
los pesos de conexión, usando el conjunto de datos de
entrenamiento.
Existen muchas arquitecturas de redes neuronales entre ellas
se encuentran: Perceptrones multicapa o de una sola capa,
Redes recurrentes y de Hopfield, Redes de Kohonen, RBF
(Radial Basis Function), resonancia adaptativa, recurrente,
pulso-acomplado, entre otros más[13,17,18].
Según Sobrano[18], las redes neuronales artificiales tiene
muchas similitudes con el reconocimiento estad´ıstico de pa-trones,
esto dado que concierne en la representación de datos
y los principios de clasificación, pero en la cuestión práctica
son diferentes. Por otro lado menciona algunas ventajas que
presentan las redes neuronales enfrente a los clasificadores
estad´ısticos:
Teóricamente se pueden determinar cualquier función,
por lo que son adecuadas en aplicaciones que no son
fácilmente descritas anal´ıticamente.
Excepto por los patrones de entrada, no es necesario
suministrar información adicional.
Se puede aplicar cualquier tipo de datos.
Se obtienen buenos resultados con datos ruidosos.
No se hacen hipótesis acerca de la distribución estad´ıstica
de las variables de entrada.
Los modelos neuronales no necesitan un conocimiento a
priori de los parámetros internos del clasificador.
Después de entrenadas son extremadamente rápidas y
fácilmente implementadas.
En Sobrado[18] se puede encontrar información sobre los
pasos de implementación de una red neuronal como clasifica-dor.
En Ram´ırez Chacón[13] realiza una revisión de las redes
neuronales durante la última década, lo cual se da una breve
descripción de algunos de las redes neuronales que presentan:
V-1. Teor´ıa de resonancia adaptativa (ART): ´ Esta red
puede ser supervisada o no supervisada, su funcionamiento
es similar al del cerebro humano, divido en un módulo de
comparación, un parámetro de vigilancia y un modulo de
reinicio. El modulo de comparación toma el patrón de entrada
y lo agrupa en alguna clase conocida por la red, el parámetro
de vigilancia se encarga de indicar el grado de pertenencia
de la entrada a alguna clase dada, si el patrón no pertenece a
ninguna clase se crea una nueva. La ventaja de ésta red es la
capacidad de agrupar dato acorde a su información.
V-2. Red neuronal celular (CNN): Basada en la teor´ıa de
autómatas celulares, permite la interacción de vecinos de cada
unidad en la red. Contiene una cantidad fija de unidades lla-madas
células, las cuales son sistemas no lineales, dinámicos
donde la información de entrada es codificada para conocer su
comportamiento. Cada célula está localmente interconectadas
con múltiples entradas que vienen de otras células.
V-3. Perceptrón multicapa (MLP) y Backpropagation
(BP): Fue uno de los primeros modelos de redes neuronales,
se refiere a redes perceptrón multicapa con funciones de ac-tivaci
ón sigmoidales que son entrenadas mediante algoritmos
de aprendizaje de Backpropagation.
V-4. Red neuronal oscilatoria (ONN): La teor´ıa de ésta
red se basa en los est´ımulos con osciladores periódicas sin-cronizadas
en forma de grupos en la corteza visual y es
posible que sirvan para detectar caracter´ısticas en una escena
visual, partiendo de esto, se modelan redes con caracter´ısticas
osciladoras que van sincronizando según el patrón de entrada.
Un ejemplo de ésta red es el modelo de LEGION (locally
excitatory globally inhibitor oscillator network) en el cual la
oscilación se genera a partir de la retroalimentación de un
vecindario de unidades excitables y un inhibidor, en otras
palabras, cada unidad excitable es estimulada de forma pro-porcional
a cada entrada formando una retroalimentación con
el inhibidor y se crea una oscilación cuya forma depende del
estimulo de entrada.
V-5. Red neuronal Pulso-Acoplada (PCNN): La red se
implementa en un modelo de una neurona por p´ıxel y su
arquitectura tiene tres módulos principales: árbol de dentritas,
encadenamiento y generador de pulsos. El árbol recibe la
información del vecindario y se procesa en el módulo de
encadenamiento y el feeding (otra parte de la red que contiene
también valores de entrada), el generador de pulsos tiene un
umbral dinámico que se basa en el proceso interno que tiene
la neurona en el feeding y el módulo de encadenamiento.
V-6. Red neuronal recurrente (RNN): Tienen conexio-nes
formando un ciclo directo, esto permite comportamiento
dinamicos ´pero con el coste de consumo de mas ´memoria
que las redes directa. Ejemplos de la red: Hopfield, RNN
bidireccional y RNN tiempo continuo.
V-7. Red neuronal con funciones base radial (RBFNN):
Son redes que contienen funciones de activacion ´de base radial
que cumplen cierto criterio, generalmente estas ´funciones
de activacion ´tienen un comportamiento gaussiano, lo cual
consiste en una red de tres capas: (1) entrada, (2) caja negra
que contiene funciones de base radial no lineal y (3) salida.
V-8. Red neuronal probabilisticas (RPNN): En estos ´tipos
de redes se encuentran red neuronal probabil´ıstica, el algoritmo
de mezclas gaussianas y la red neuronal aleatoria. La red
neuronal probabil´ıstica consta de cuatro capas, la cual la
primera recibe los datos de entrada, la segunda dispone de un
conjunto de neuronas totalmente conectadas con las neuronas
de la primera capa con funciones de activacion ´dada por:
1
jk(x) = (
(
p
2)d
)exp(
1
22 (x mxj
k)2). Donde d es
el tamaño del vector, x es la entrada, mxj
k es la media de j-
ésimo vector de diferencia, k es la clase correspondiente y

8
es un parámetro de suavizado. La tercera capa es una capa de
suma que completa la estimación de probabilidad y por último
la capa final los clasifica la entrada de acuerdo a la decisión
bayesiana.
V-9. Mapa Auto-Organizado de Kohonen (SOM): Es una
red no supervisada que se basa en un proceso competitivo
donde cada neurona en una red neuronal se vuelve sensitiva
a las categor´ıas de los patrones de entrada. Esto es dado que
se utiliza el aprendizaje competitivo para que las neuronas sin
una distribución de datos especificas se vaya aproximando a
la distribución de los datos de entrada.
VI. CONCLUSIONES
El reconocimiento de patrones es un paso fundamental para
el análisis e interpretación de una imagen digital, lo cual
permitirá ajustar clases de acuerdo a caracter´ısticas relevantes
que presenten los objetos. Aunque hay una gran diversidad de
métodos de clasificación (heur´ısticas, matemáticas, lingü´ısticas
y redes neuronales), éstos ventajas y desventajas para el
reconocimiento de patrones. Los métodos más empleados son
clasificadores estad´ısticos y redes neuronales.
´ Este trabajo menciona en forma general algunos de los
clasificadores (estad´ısticos y redes neuronales) más usados.
El cual se logro conocer la gran diversidad de modelos que
existen para el reconocimiento de patrones.
Por último cabe mencionar que la descripción de los cla-sificadores
es tan solo muy general, para lograr entender
su funcionamiento, ventajas y desventajas, se requiere una
revisión más profunda.
REFERENCIAS
[1] R.M. Ayala and M. Menenti. Metodolog´ıa para la
búsqueda del mejor clasificador de imágenes de satélite.
Teledetección, medio ambiente y cambio global, pages
469–472, 2001.
[2] Osvaldo Cairó and Sivia Guardati Buemo. Estructura de
datos. Mcgraw-Hill, México, 1997.
[3] Enrique Calot. Reconocimiento de patrones en imágenes
médicas basado en sistemas inteligenes. Tesis de licen-ciatura,
Facultad de ingenier´ıa. Universidad de Buenos
Aires, Buenos Aires, Argentina, 2008.
[4] Emilio Chuvieco Salinero. Teledetección ambiental: la
observación de la tierra desde el espacio. Ariel ciencias,
3ra edition, 2008.
[5] Crhistian Correa, Constantino Valero, and Pilar Barreiro.
Procesamiento de imágenes para la identificación de uva
y follaje usando técnicas de clasificación no supervisadas.
In IV Congreso de estudiantes universitarios de ciencia,
tecnolog´ıa e ingenieria agrónomica, pages 53–56, 2011.
[6] R. De la Rosa Flores. Procesamiento de imágenes
digitales. In X congreso Nacional en Informática y
computación, pages 1–5, Puebla, México, 08 al 12 de
Octubre 2007. Instituto tecnológico de puebla.
[7] Michael J de Smith, Michael F Goodchild, and Paul A
Longley. Geospatial analisys: a comprehensive guide
to principles, techniques and softwares tools. Matador,
2007.
[8] Tzitziki Janik Garc´ıa Mora and Jean Francois Mas. Com-paraci
ón de metodolog´ıas para el mapeo de la cobertura
y uso del suelo en el sureste de méxico. Investigaciones
Geográficas, Bolet´ın del Instituto de Geograf´ıa, UNAM,
(67):7–19, 2008.
[9] J. L. Gil, E. B. Garc´ıa, D. R. Ponvert-Delisle, R. Sánchez,
and M. B. Vega. Enfoques para la clasificación digital de
imágenes mono y multiespectrales y su implementación
en el software cubano TN Estudio V2.0. Revista de
teledetección, 20:35–52, 2003.
[10] Rafael C. Gonzales and Richard E. Woods. Tratamiento
digital de imágenes. Addison-Wesley, Diaz de Santos,
1996.
[11] Jean Francois Mas. Aplicaciones del sensor MODIS para
el monitoreo del territorio. SEMARNAT, INE, UNAM
y CIGA, 2011.
[12] Abdelmalik Moujahid, Iñaki Inza, and Pedro Larragaña.
Tema 5. clasificadores k-nn. S/F.
[13] Juan Ram´ırez Q. and Mario I. Chacón M. Redes neu-ronales
artificiales para el procesamiento de imágenes,
una revisión de la última década. Revista de ingenier´ıa
eléctrica, electrónica y computación, 9(1):7–16, 2011.
[14] Victor Rodr´ıguez Doncel. Entrenador para el control
de prótesis mioélectricas. http://vroddon.sdf-eu.org/emg/
proy.pdf, 2001. Accesado: 22 de Enero de 2013.
[15] Harold A. Romo R., Fabián Ram´ırez M., and Ridier
Valdivieso B. Detección del bacilo mycobacterium tu-berculosis
mediante reconocmiento de patrones. Avances
en sistemas e informática, 4(3):111–166, 2007.
[16] José M. Salinas and Carmen Porras. Fundamento psi-cofisico
del reconocmiento de patrones. Psicothema,
5(001):161–172, 1993.
[17] Cecilia Verónica Sanz. Razonamiento evidencial dinámi-co:
Un método de clasificación aplicado al análisis de
imágenes hiperespectrales. Tesis doctoral, Universidad
Nacional de La Plata. Facultad de Ciencias Exactas,
Argentina, 2002.
[18] Eddie Angel Sobrado Malpartida. Sistema de visión ar-tificial
para el reconocimiento y manipulación de objetos
utilizando un brazo robot. Tesis de maestr´ıa, Pontificia
Universidad Católica del Perú, Perú, 2003.
[19] Kenneth Walker. Other iris from ken walker’s gar-den.
http://home.astound.net/kenww/my garden/other
iris.htm, 1999-2003.

Reconocimiento de patrones y métodos de clasificación en imágenes digitales

Recomendados

Recomendados

Más contenido relacionado

Similar a Reconocimiento de patrones y métodos de clasificación en imágenes digitales

Similar a Reconocimiento de patrones y métodos de clasificación en imágenes digitales (20)

Más de Armando López

Más de Armando López (6)

Último

Último (20)

Reconocimiento de patrones y métodos de clasificación en imágenes digitales