1. El documento describe el proceso de data mining y las redes neuronales, incluyendo la preparación de datos, análisis de datos y toma de decisiones.
2. Explica que las redes neuronales aprenden a partir de ejemplos históricos y pueden utilizarse para clasificación, interpolación y predicción.
3. El algoritmo de retropropagación establece un procedimiento para ajustar los pesos y umbrales de una red neuronal multicapa de forma que aprenda de los ejemplos.
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
Redes neuronales
1. DISEÑO AVANZADO DE SISTEMASDISEÑO AVANZADO DE SISTEMAS
TemaTema : DATA MINING Y: DATA MINING Y REDES NEURONALESREDES NEURONALES
DeDe : Victor Lino Silva: Victor Lino Silva
2. Data Mining: definición
Arte/Ciencia de descubrir y aprovechar
en forma automática información
no-obvia y útil en grandes bases de datos
Énfasis en:
• no-obvia (no intuitivas)
• útil (coste vs beneficio)
• grande (proceso automático)
No hay reglas siempre que el proceso sea eficiente en
tiempo, dinero y recursos humanos
Data Mining
3. Tres pasos
Preparación de los datos
Análisis de datos
Toma de decisiones
Redes Neuronales
Data Mining
4. Preparación de datos
Extracción / Integración
Transformación
Selección
Limpieza
Data warehouse
50-80% tiempo del proyecto
Data Mining
5. “Scrubbing, selecting, cleansing, preprocessing,…”
• Eliminar redundancia
• Eliminar datos y variables irrelevantes
• Tratar datos ausentes
media, substitución astuta, interpolación, ignorar, ?
• Corrección errores
• Outliers (datos fuera de rango)
• Verificar consistencia
• Reservar todo preprocesamiento relevante hasta el análisis
Data Mining
6. Anáslisis de datos
Técnicas:
• Árboles de decisión
• Reglas de asociación
• Ajustes (regresiones..)
• Algoritmos genéticos
• Redes neuronales
• …
Tareas conceptuales:
• Clasificación
• Optimización
• Interpolación
• Modelación
• Predicción
• …
Objetivos:
• Target marketing
• Segmentación
• Control
• Predicción ventas
• Descubrir imperfecciones
• …
Data Mining
7. Toma de decisiones
Los resultados del análisis pueden resultar inescrutables
• El analista debe entender el problema a fondo
• Los resultados deben presentarse con honestidad
• El post-procesamiento y la inclusión de factores subjectivos
son a menudo necesarios
• Validación estricta
Data Mining
8. ¿Por qué no se emplea el Data Mining?
• Explotación “bruta” de las bases de datos da resultados sin
sentido o no-competitivos
Sentido común y buena formación = coste elevado
• Sí se emplea, pero poca gente es consciente
Data Mining
10. ¿Qué es una red neuronal?
DatosDatos históricos
variables objetivos
Datos nuevos
variables ??
Las redes neuronales aprenden a partir de ejemplos
Economista/Matemático/Físico/Analista
Aproximante universal
(Permiten un ajuste a partir de ejemplos en
un gran espacio de funciones sin sesgo,
robusto, flexible que implementa
inferencia bayesiana)
Economista/Empresario
Herramienta de predicción
(objetivo, consolidado,
adaptable a problemas complejos,
integrable)
Modelo del cerebro
Redes neuronales
11. Redes neuronales
¿Para qué sirven una red neuronal?
• Clasificación
Clientes buenos/malos, comprometidos o no, asequibles o no
Reconocimiento de patrones
• Interpolación
Adivinar el comportamiento de un nuevo cliente
Crear un nuevo concepto
• Predicción
Ventas, meteorología, finanzas, control de producción
Las redes neuronales pueden ser aplicadas a cualquier
problema de inferencia estadística
12. ¿Cómo funciona una red neuronal?
capa 1
capa 2
capa l
+=
−
−
=
∑ )()1(
)1(
1
)()( l
i
l
j
ln
j
l
ij
l
i tzwfz
Red neuronal
feedforward
multicapa
Redes neuronales
13. Redes neuronales
+=
−
−
=
∑ )()1(
)1(
1
)()( l
i
l
j
ln
j
l
ij
l
i tzwfz
• La función de activación ƒ da flexibilidad para que la respuesta de
cada neurona pueda ser no lineal
• Los pesos w y los umbrales t determinan la forma en que la información
es procesada por cada neurona
• El número de capas y de neuronas por capa definen la
arquitectura de la red neuronal
El algoritmo de aprendizaje por corrección de errores hacia atrás,
“back-propagation” (1985) establece un procedimiento eficiente para
ajustar los pesos y umbrales de una red neuronal de forma que aprenda
ejemplos.
¡Hemos aprendido a aprender!
14. Redes neuronales
T vs C
C
T c
T
CTTC
Entrenamiento
0. w y t aleatorios
1. Introducir un ejempo (T)
2. Output = T
bien
Output = C
error
3. Propagar un cambio de
w and t a través de la red
para reducir el error
4. Repetir con todos los
ejemplos varias veces
Aprendizaje supervisado de T / C
T
Robusto
Universal
Sin sesgo
17. Tarjetas de crédito
1. 50000 clientes reciben la oferta
2. Un red neuronal es entrenada con
las respuestas
3. La red predice la respuesta de los
450000 clientes restantes
Un banco desea ofrecer una nueva tarjeta a sus clientes
Depósitos Salario
Edad Sexo Créditos
Hipotecas Educación
Sí / No
Red neuronal
Ejemplos
19. Promedios sobre redes entrenadas a partir de pesos aleatorios
Si existe un modelo subyacente, las redes son equivalentes
Si no existe un modelo subyacente, las redes producen dispersión
• Lanzamos 100 redes sobre
datos entrenar/validar
• Para cada dato tenemos un
promedio y una dispersión
• Descartamos 3 sigma
Alarmas
Arbitraje
….
-1 sigma
+ 1sigma
NN
Real
Ejemplos
Series temporales de cotizaciones
20. Ejemplos
¿Estoy divorciado?
Una red neuronal ha sido entrenada con
• área del apartamento
• ¿es relevante la virginidad? ¿divorciado?
• salario sí / no
• visitas de los suegros
• salud,..
Acierto: 88%
Matemáticas / Filosofía 100%
21. Reflexión
Existen barreras a superar
cultura informática
gestión inteligente de la información
coste/beneficio
nuevas generaciones
Estamos entrando en la era de la información