Poslin y Purelin para la Resolución de la Discriminante de una Ecuación y de la Regresión Lineal Simple Respectivamente

1
Utilizaci ón de las Funciones de Activaci ón Poslin
y Purelin para la Resolución de la Discriminante
de una Ecuación y Regresi ón Lineal Simple
Respectivamente.
Henry Quishpe, Student, UNL, and Diego Cuenca, Student, UNL
Tutor: Ing. Henry Paz
F
Abstract—The subject of neural networks, definition, usage,
functions studied activation and learning functions. By studying
these issues using a practical example functions purelin poslin
and activation (an example separately) to demonstrate its cor-rect
operation and use was made, this means that for every
problem using one or more functions is suitable thereto, also
activating a learning function used to train the neuron, namely
that it can respond after alone to different situations learned.
Resumen.- Se estudió el tema de las redes neuronales,
su definición, utilizaci ón, funciones de activaci ón y funciones
de aprendizaje. Con el estudio de estos temas se realiz ó un
ejemplo práctico haciendo uso de las funciones de activaci ón
poslin y purelin (un ejemplo por separado) para demostrar
su correcto funcionamiento y utilizaci ón, esto significa que
para cada problema se hace uso de una o mas funciones de
activaci ón adecuadas al mismo, además se utiliz ó una función
de aprendizaje para entrenar a la neurona, es decir que pueda
responder después por si sola a situaciones diferentes a las
aprendidas.
Index Terms—paper, template, activation functions, neural net-work,
poslin, purelin, function of learning, Feedforwar, Backprop-agation,
trainlm, workspace.
Palabras Claves.- papel, plantilla, función de activaci ón, red
neuronal, poslis, purelin, funión de aprendizaje, espacio de
trabajo, retropropagación.
1 INTRODUCTION
LA presente investigación se refiere al tema
de las redes neuronales artificiales (RNA),
que están inspiradas en el funcionamiento del
cerebro humano, están compuestos por una
gran cantidad de elementos de procesamiento
conectados entre si y operan en forma
paralela.
En la actualidad su utilizaci ón es muy
importante ya que consiguen resolver
problemas relacionados con el reconocimiento
de predicción, codificación, patrones,
clasificaci ón, control, optimización, y en
muchas ramas mas.
La caracter´ıstica principal de esta neurona
artificial es que tiene un aprendizaje inductivo,
es decir no se les indica las reglas para dar
solución, extrae sus propias reglas a partir de
los ejemplos de aprendizaje.
Las RNA están compuestas por tres elemen-tos
los cuales son: lazos sinápticos, mezclador
lineal y una función de activaci ón, está ultima
es de especial importancia ya que permite pro-porcionar
caracter´ısticas lineales y no lineales
al comportamiento de una neurona artificial.
Este articulo se enfoca a la realizaci ón de las
funciones de activaci ón como poslin y purelin,
se realiza un ejemplo por cada una usando la
herramienta de programación matlab.
En la secci ón 2 se habla de las Redes Neu-ronales
Artificiales (RNA), en la cual se hace
una definición, se espedifican sus ventajas y
desventajas, se menciona su arquitectura y los
elementos básicos que las componen.

2
En la secci ón 3 se habla de las funciones de
activaci ón que se van a utilizar para la res-oluci
ón de los problemas ya especificados ante-riormente,
se habla de las condiciones de cada
función.
En la secci ón 4 se habla de las funciones de
aprendizaje, es aqui en donde se especifica que
función se utiliza para cada ejemplo y que tipo
aprendizaje es el utilizado.
En la secci ón 5 se presentan los resultados de
los ejemplos con las funciones poslin y purelin
utilizando la herramienta matlab para la res-oluci
ón del problema.
2 REDES NEURONALES ARTIFICIALES
(RNA)
2.1 Definici ón
Sistema de computación que consta de un gran
número de elemntos simples, muy interconec-tados,
que procesan la informacion respondi-endo
dinámicamente frente a unos est´ımulos
externos. [1]
Una red neuronal artificial (ANN) es un es-quema
de computación distribuida inspirada
en la estructura del sistema nervioso de los
seres humanos. La arquitectura de una red neu-ronal
es formada conectando m´ ultiples proce-sadores
elementales, siendo éste un sistema
adaptivo que pose un algoritmo para ajustar
sus pesos (parámetros libres) para alcanzar los
requerimientos de desempeño del problema
basado en muestras representativas. [2]
2.2 Ventajas y Desventajas
Algunas ventajas de las RNA frente a otros
sistemas de procesamiento de información son:
Las RNA pueden sintetizar algoritmos a
través de un proceso de aprendizaje.
Para utilizar la tecnolog´ıa neural no es
necesario conocer los detalles matemáticos.
Sólo serequiere estar familiarizado con los
datos del trabajo.
La solución de problemas no lineales es
uno de los fuertes de las RNA.
Las desventajas de las redes neurales son:
Las RNA se deben entrenar para cada
problema. Además, es necesario realizar
m´ ultiples pruebas para determinar la ar-quitectura
adecuada.
El entrenamiento es largo y puede con-sumir
varias horas de la computadora
(CPU). Debido a que las redes se entrenan
en lugar de programarlas, éstas necesitan
muchos datos.
Las RNA representan un aspecto complejo
para un observador externo que desee re-alizar
cambios. [3]
2.3 Arquitectura de una red Neuronal
Las redes neuronales se basan en generalizar
información extra´ıda de datos experimentales,
tablas bibliográficas o bases de datos, los cuales
se determinan por expertos humanos. Dichas
redes toman en cuenta las entradas y como sali-das
las se ˜ nales del sistema. Para ello resulta ´ util
la caracterizaci ón de tres tipos de neuronas:de
entrada,de salida y ocultas.
Las neuronas de entrada reciben se ˜ nales
desde un entorno, las cuales son propor-cionadas
por sensores o de otros sectores
del sistema como por ejemplo archivos
de almacenamiento de patrones de apren-dizaje.
Estas neuronas se encuentran agru-padas
en una capa de entrada, las número
de neuronas que la conformas depende de
los datos del problema.
Las neuronas de salida env´ıan su se ˜ nal
directamente fuera del sistema una vez que
ha finalizado el tratamiento de la infor-maci
ón.Se encuentran en la capa de salida
y el número de neuronas depende del
formato esperado de salida de la red.
Las neuronas ocultas reciben est´ımulos y
emiten salidas dentro del sistema, sin man-tener
contacto alguno con el exterior. Aqui
es donde se establece la representación
interna de la neurona.Estas se encuentran
en la capa intermedia y el número de
neuronas depende del tipo y complejidad
del problema a resolver con la red.

3
Fig. 1. Arquitectura de una red neuronal.
2.4 Elementos de un neurona artificial
Una red neuronal esta compuesta de varios
elementos esenciales los cuales le permiten re-solver
algun problema, en la figura 2 se puede
apreciar los elementos básicos que contiene una
neurona artificial:
Fig. 2. Elementos de una neurona artificial.
Entradas.- Son los datos o valores ingresadas
por el ser humano o tambien pueden ser leidos
desde un archivo de almacenamiento.
Pesos.- Por cada entrada existe un peso
relativo el cual proporciona la importancia de
la entrada dentro de la función de agregación
de la neurona. Estos pesos realizan la misma
función que realizan las fuerzas sinápticas
de la neurona biol ógicas. Estos pesos son
modificados en respuesta de los ejemplos
de entranamiento debiado a las reglas de
entrenamiento.
Salidas.- Cada elemento de procesamiento
tiene permitido una salida, la cual puede estar
asociada con un número elevado de otras neu-ronas.
La valor de la salida obtenida resulta de
la función de activaci ón utilizada.
2.5 Red Multicapa Hacia Adelante
Este modelo Feedfoward no tiene retardos
y sus capas son implementadas una a
continuación de otra. Por otro lado éstas
redes tambien son llamadas Retropropagación
(Backpropagation). Utilizan un algoritmo
matemático para el entranamiento de todas las
capas, lo cual permite una mayor eficiencia en
la modificación de los pesos y el bias.
3 FUNCIONES DE ACTIVACI ÓN
Se encarga del cálculo del nivel de activaci ón
de la neurona en función de la entrada total,
también denota la salida de la neurona. Las
funciones utilizadas en este trabajo son las
siguientes:
3.1 Funci ón de Activaci ón Poslin
La función de transferencia poslin devuelve la
salida n si n es mayor que o igual a cero y 0 si
n es menor que cero.
a = 0 ! n 0 (1)
a = n ! n 0 (2)
Fig. 3. Función de Activaci ón poslin.

4
3.2 Funci ón de Activaci ón Purelin
La función de activaci ón purelin es de tipo
lineal, es utilizado en redes ADALINE y a
veces en redes de Retropropagación. Purelin
devuelve la salida n cuando a es igual a n.
a = n (3)
Fig. 4. Función de Activaci ón purelin.
4 FUNCIONES DE APRENDIZAJE
El aprendizaje consiste en la modificación
del comportamiento inducido por la
interacci ón con el entorno y como resultado
de experiencias conducente al establecimiento
de nuevos modelos de respuesta a est´ımulos
externos. [5]
La función que se ha utilizado en los
ejemplos es la de trainlm, ya que esta
actualiza los valores de los pesos y bias de
acuerdo con la optimización de Levenberg-
Marquardt. También conocido como los
m´ınimos cuadrados amortiguados.
Trainlm es a menudo el más rápido algoritmo
de propagación, y es muy recomendable
como primera elecci ón supervisada, aunque s´ı
requiere más memoria que otros algoritmos.
Para el ejemplo con poslin se utiliz ó un
aprendizaje supervisado, donde se conoce
las entradas y salidas deseadas que debe
tener la red, mientras que con purelin se
utiliz ó un aprendizaje no supervisado ya
que no se conocen los valores de salida para
cada entrada, es decir no se puede hacer
correcciones por error.
5 RESULTADOS
Se hizo uso de la herramienta matlab para la
realizaci ón de los respectivos ejemplos, con la
cual se puedo obtener los resultados deseados
los cuales son descritos a continuación:
5.1 Ejemplo práctico con Poslin
Como se digo anteriormente que la función
poslin es de tipo lineal positiva, es decir que
solo presenta datos de salida desde 0 hasta el
infinito positivo, es por ello que el problema
a resolver es sobre la discriminante de una
función de segundo grado para saber cuántas
soluciones reales tiene la ecuación.
ax2 + bx + c = 0 (4)
El ejemplo consiste en entrenar a la neu-rona
para saber cuántas soluciones tiene una
ecuación de segundo grado con el cálculo de la
discriminante, para ello se ingresan los valores
de cada ecuación como a, b y c como entradas,
y las salidas respectivas. Para el cálculo de la
discriminante la cual será la salida de cada
ecuación se hace uso de la siguiente formula:
b2 4ac (5)
Se llama discriminante de la ecuación la cual
permite averiguar en cada ecuación el número
de soluciones. Podemos distinguir tres casos:
1) La ecuación tiene dos soluciones, que son
números reales distintos.
b2 4ac 0 (6)
2) La ecuación tiene una solución doble.
b2 4ac = 0 (7)
3) La ecuación no tiene soluciones reales.
b2 4ac 0 (8)
Los valores de entrada se los obtiene de las
siguientes ecuaciones de segundo grado:
f =
8
:
1) 2x2 5x 4
2) x2 + 2x 1
3) x2 5x + 6
4) x2 + 6x + 9
5) x2 + x 2
6) 2x2 + 5x + 4
(9)

5
Los valores obtenidos de la ecuación
anterior se presentan en la siguiente imagen y
as´ı tambien se presenta la salida que se desea
obtener.
Fig. 5. Valores de Entrada y Salida
En la siguiente imagen se puede apreciar la
representación de la red neuronal.
Fig. 6. Representación de la Red Neuronal
Una vez terminado el entranamiento la
neurona encuentra los valores de los pesos
ideales y el valor del bias.
Fig. 7. Pesos de las entradas
Fig. 8. Valores del Bias
Los Resultados finales son los que se obser-van
en la imagen:
Fig. 9. Resultados Finales
En donde se obtiene las mismas salidas que
las deseadas y ademas se puede apreciar el
número de soluciónes que tiene cada ecuación,
el valor -7 es menor que cero por lo tanto poslin
lo presenta como cero.
5.2 Ejemplo práctico con Purelin
El presente programa resuelve el modelo de
Regresi ón Lineal Simple, que es uno de los
aspectos más relevantes de la Estad´ıstica es
el análisis de la relaci ón o dependencia en-tre
variables, está definido por el siguiente
planeamiento:
1. Planteamiento de la Regresión Lineal.
El comportamiento de una magnitud
económica puede ser explicado a través de
otra:
Y = F(x) (10)
Si se considera que la relaci ón puede ser
de tipo lineal, la formalización vendr´ıa
determinada por una ecuación como la
siguiente:
Y =

6
De forma abreviada el sistema de ecua-ciones
se puede escribir de la siguiente
manera:
Yt =

Poslin y Purelin para la Resolución de la Discriminante de una Ecuación y de la Regresión Lineal Simple Respectivamente

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (18)

Destacado

Destacado (20)

Similar a Poslin y Purelin para la Resolución de la Discriminante de una Ecuación y de la Regresión Lineal Simple Respectivamente

Similar a Poslin y Purelin para la Resolución de la Discriminante de una Ecuación y de la Regresión Lineal Simple Respectivamente (20)

Poslin y Purelin para la Resolución de la Discriminante de una Ecuación y de la Regresión Lineal Simple Respectivamente