2. HISTORIA
• Warren McCulloch y Walter Pitts (1943) crearon un modelo informático
para redes neuronales basados en las matemáticas y algoritmos .
• Este modelo señaló el camino para que la investigación de redes
neuronales se divida en dos enfoques distintos. Un enfoque centrado en
los procesos biológicos en el cerebro y el otro se centró en la aplicación
de redes neuronales para la inteligencia artificial.
3. • Las redes neuronales (también conocidas como sistemas
conexionistas) son un modelo computacional basado en un gran
conjunto de unidades neuronales simples (neuronas artificiales),
4. ¿ QUE ES UNA RED NEURONAL ARTIFICIAL ?
• Es una red compuesta de muchas unidades de procesamiento
simple , cada una puede tener una cantidad pequeña de memoria
local; las unidades están comunicadas a través de conexiones que
usualmente transportan información numérica.
5. ¿ QUE ES UNA RED NEURONAL ARTIFICIAL ?
• Algunas redes neuronales son modelos biológicos y otros no, gran
parte del origen de las redes neuronales proviene del deseo de
producir sistemas artificiales capaces de efectuar procesos
sofisticados, quizás inteligentes, similares a los que realiza el
cerebro humano comúnmente.
7. ¿CÓMO FUNCIONAN?
• Cada unidad neuronal está conectada con muchas
otras y los enlaces entre ellas pueden incrementar o
inhibir el estado de activación de las neuronas
adyacentes.
• Cada unidad neuronal, de forma individual, opera
empleando funciones de suma.
• Estos sistemas aprenden y se forman a sí mismos, en
lugar de ser programados de forma explícita, y
sobresalen en áreas donde la detección de
soluciones o características son difícililes de expresar
con la programación convencional.
8. OBJETIVO
• El objetivo de la red neuronal es resolver los problemas de la misma
manera que el cerebro humano, aunque varias redes neuronales
son más abstractas.
• Los proyectos de redes neurales modernas
suelen trabajar con unos pocos miles a
unos pocos millones de unidades
neuronales y millones de conexiones, que
sigue siendo varios órdenes de magnitud
menos complejo que el cerebro humano y
más cercano a la potencia de cálculo de un
gusano.
9. CARACTERISTICAS
• Aprendizaje Adaptativo: Capacidad de aprender a realizar tareas basada en un
entrenamiento experiencia inicial
• Autoorganización: Una red puede crear su propia organización o representación de la
información que recibe mediante una etapa de aprendizaje.
• Tolerancia a Fallos: La destrucción parcial de una red conduce a
una degradación de su estructura; sin embargo algunas
capacidades de la red se pueden retener, incluso sufriendo un
gran daño.
• Operación en tiempo real: Los computadores neuronales
pueden ser realizados en paralelo, y se diseñan y fabrican
maquinas con hardware especial para obtener tal capacidad.
• Fácil construcción en CI: Se puede obtener chips especializados
para redes neuronales que mejoren su capacidad en ciertas
tareas . Ello facilitara la integracion modular delos sistemas
existentes.
10. ¿ QUE PUEDE HACER UNA RED NEURONAL?
Las Redes Neuronales son útiles para:
• Clasificación de patrones
• Aproximación de funciones
• Mapeo
• En los que exista información imprecisa y con tolerancia a fallos
• Predicción de números aleatorios o semialeatorios
• Procesamiento de enteros largos
• Determinación si un entero largo es primo o compuesto
• Desencriptar algo encriptado por un buen algoritmo.
11. APLICACIONES DE LAS RNA
Generales
• Biología
• Empresa
• Medio Ambiente
• Finanzas
• Manufacturación
• Medicina
• Militar
Especificas
• Reconocimiento de
patrones
• Toma de Decisiones
• Filtrado de Señales
• Control de Robots
12. CONCLUSIONES
• Las Redes Neuronales Artificiales basadas en los sistemas nerviosos
biológicos reproducen al menos el funcionamiento del cerebro
humano, sea en hardware o software
• La construcción de las redes neuronales artificiales hace uso de
metodologías de desarrollo de software.
• Las redes neuronales artificiales tienen un amplio campo de
aplicaciones donde se requiera la solución a problemas, desde
actividades de investigación hasta aplicaciones comerciales e
industriales.
14. DEFINICION
• La forma más sencilla de definir una SVM es como un algoritmo
que aprende mediante ejemplos a asignar etiquetas a objetos.
• Por ejemplo, un SVM puede aprender
a reconocer la actividad fraudulenta
de una tarjeta de crédito examinando
cientos o miles de informes de
actividades para determinar si existe
un fraude o no.
15. • Por otra parte, un SVM puede
aprender a reconocer dígitos
manuscritas examinando una gran
colección de imágenes digitalizadas de
manuscritos, ceros, unos y así
sucesivamente. Las SVM se han
aplicado con éxito a una cada vez más
amplia variedad de aplicaciones
biológicas.
16. • Una Máquina de Soporte Vectorial (SVM) aprende la superficie
decisión de dos clases distintas de los puntos de entrada. Como un
clasificador de una sola clase, la descripción dada por los datos de
los vectores de soporte es capaz de formar una frontera de decisión
alrededor del dominio de los datos de aprendizaje con muy poco o
ningún conocimiento de los datos fuera de esta frontera.
• Los datos son mapeados por medio de un kernel Gaussiano u otro
tipo de kernel a un espacio de características en un espacio
dimensional más alto, donde se busca la máxima separación entre
clases. Esta función de frontera, cuando es traída de regreso al
espacio de entrada, puede separar los datos en todas las clases
distintas, cada una formando un agrupamiento.
17. EJEMPLO
Supongamos que tenemos imágenes de 50 tigres y de 50 elefantes.
VS
Y las digitalizamos en imágenes de 100 x 100 pixeles, entonces tenemos
n= 10 000
X 50 X 50
Ahora, si introdujeramos otra fotografía diferente, queremos responder a la
pregunta ¿es un tigre o un elefante? Asumiendo por supuesto, que es uno u otro.
18. FUNCION KERNEL
• La manera más simple de realizar la separación es mediante una línea recta, un
plano recto o un hiperplano N-dimensional.
• Debido a las limitaciones computacionales de las máquinas de aprendizaje
lineal, éstas no pueden ser utilizadas en la mayoría de las aplicaciones del
mundo real. La representación por medio de funciones Kernel ofrece una
solución a este problema, proyectando la información a un espacio de
características de mayor dimensión el cual aumenta la capacidad computacional
de la máquinas de aprendizaje lineal.
• Es decir, mapearemos el espacio de entradas X a un nuevo espacio de
características de mayor dimensionalidad.
20. TIPOS DE FUNCIONES KERNEL
• Función de base radial Gaussiana: separado por un hiperplano en el espacio
transformado.
21. SVM. Multiclase
• Una nueva versión de SVM
para regresión fue propuesta
en 1996 por Vladimir Vapnik,
Harris Drucker, Chris Burges,
Linda Kaufman y Alex
Smola.[nota].
• La idea básica de SVR consiste
en realizar un mapeo de los
datos de entrenamiento x ∈ X,
a un espacio de mayor
dimensión F a través de un
mapeo no lineal, donde
podemos realizar una
regresión lineal.
• Hay dos filosofías básicas para
resolver el problema de
querer clasificar los datos en
más de dos categorías:
• a) cada categoría es dividida
en otras y todas son
combinadas.
• b) se construyen modelos de
acurdo al número de
categorías.
SVR. Regresión
22. CONCLUSIONES
• A fin de que una máquina de vectores de soporte
que sea eficaz, es necesario utilizar primero un
conjunto de entrada de entrenamiento y los
datos de salida para construir el modelo de
máquina de vectores de soporte que se puede
utilizar para la clasificación de nuevos datos.
• Una vez que la máquina de vectores de soporte
ha sido entrenado, que es capaz de evaluar
nuevas entradas con respecto a la separación de
hiperplano y clasificar en una de las dos
categorías.