SlideShare una empresa de Scribd logo
1 de 12
Análisis y modelación de datos a través de
Minería de Datos y algoritmos evolutivos de
Regresión Lineal Múltiple
Juan Pablo Bribiesca Espinosa
ITAM 2015
Conceptos Básicos
Definición de Base de Datos
Exclusión de candidatos
Definición de variable de Respuesta
Inclusión de Base de Datos
Muestreo Aleatorio sin remplazo
Definición de Clases (tuplas)
Exclusión de datos potencialmente
erróneos y estabilización del modelo
Outliers:
𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑒𝑠 𝐸𝑠𝑡𝑢𝑑𝑒𝑛𝑡𝑖𝑧𝑎𝑑𝑜𝑠:
𝑦𝑖0|𝑟𝑖 > 𝑞𝑡,𝑛−1,0.99995
Apalancamiento:
Distancia de Cook ∶
𝑦𝑖0|𝐷𝑖 > 𝑚𝑎𝑥(𝑞 𝑔𝑎𝑚𝑚𝑎0.9995+0.0005∗ 𝑤−1
, 1)
25
50
75
0 25 50 75 100
horas trabajadas
edad
Amer-Indian-Eskimo Asian-Pac-Islander Black Other White
𝑦𝑖0 = β00 +
𝑗=1
𝑘
𝛽𝑗0 ∗ 𝑥𝑖𝑗 + 𝜀𝑖0 , 𝑖 = 1,2, … , 𝑛
Determinación de Transformaciones
• Modelos no lineales por mínimos cuadrados.
• Relaciones Funcionales - Familias:
– Familia Polinomial
– Familia Exponencial
– Funciones Potencia
– Modelos Rendimiento-Densidad
– Modelos Sigmoidales
– Splines
Determinación de Transformaciones
Correlación de Pearson
Escalamiento
Jerarquización vía Coeficientes de
Determinación Ajustados 𝜌
𝜌 = 𝜌 ∗ 1 − 0.0005 ∗ 𝑑𝑓 − 1
Definición de Transformaciones
𝑦𝑖2 = β02 +
𝑗=1
𝜑∗𝑘
𝛽𝑗2 ∗ 𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑗))
𝑖 = 1,2, … , 𝑛 2
Criterio de Información de Akaike
• Depuración de regresores vía análisis AIC
𝐴𝐼𝐶 = 𝑛 ∗ log 𝑀𝑆 𝑅𝑒𝑠 + 2𝑘
𝑦𝑖3 = β03 +
𝑗=1
𝑘
𝛽𝑗3 ∗ 𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑗))
𝑖 = 1,2, … , 𝑛 3
𝑘 ≤ 𝜑 ∗ 𝑘
Inserción de Relaciones
• 𝐶𝑟𝑖𝑡𝑒𝑟𝑖𝑜:
– 𝑝 − 𝑣𝑎𝑙𝑢𝑒
– 𝑑𝑓 ≤ 4: regresores númericos
– 𝑑𝑓 ≤ 6: Regresores categóricos
𝑌𝑖4 =
𝑗=1
𝑤
𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑗)) ∗ 𝛽𝑗4
+
𝑗=𝑤+1
𝑠
(
𝑟 𝜖 {𝛼,𝛽,…,}
𝜗
𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑟)) ∗ 𝛽𝑗4
)
𝑖 = 1,2, … , 𝑛4
𝜗: candidatos a transformación
𝑎=1
𝜗−1 𝑎∗(𝑎+1)
2
: posibles interacciones
Modelo final
Stepwise AIC
Outliers:
𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑒𝑠 𝐸𝑠𝑡𝑢𝑑𝑒𝑛𝑡𝑖𝑧𝑎𝑑𝑜𝑠:
𝑦𝑖𝐹|𝑟𝑖 > 𝑞𝑡,𝑛−1,0.9995
Distancia de Cook:
𝑦𝑖𝐹|𝐷𝑖 > 𝑚𝑎𝑥 𝑞 𝑔𝑎𝑚𝑚𝑎0.995+0.001∗ 𝑤−1
, 1
𝑖 = 1,2, … , 𝑛 𝐹
𝑤: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑡𝑒𝑟𝑎𝑐𝑖ó𝑛
Criterios
• Análisis Exploratorio de Datos (aproximación)
• Estadísticos:
– Análisis de Varianza.
– Contraste de White.
– Prueba de normalidad de K-S.
“Cuando las estadísticas nos dicen que la
familia mexicana tiene un promedio de cuatro
hijos y medio, nos explicamos por qué
siempre hay uno chaparrito.”
Marco Antonio Almazán

Más contenido relacionado

Destacado

HERRAMIENTAS TIC PARA LA CAPACITACIÓN
HERRAMIENTAS TIC PARA LA CAPACITACIÓN HERRAMIENTAS TIC PARA LA CAPACITACIÓN
HERRAMIENTAS TIC PARA LA CAPACITACIÓN carlosferecheverry
 
Algo mas-que-lavarse-las-manos-
Algo mas-que-lavarse-las-manos-Algo mas-que-lavarse-las-manos-
Algo mas-que-lavarse-las-manos-Diego Llerena
 
Sociedad de la información
Sociedad de la informaciónSociedad de la información
Sociedad de la informaciónSergio Festa
 
2 _17 _KBGE_4
2 _17 _KBGE_42 _17 _KBGE_4
2 _17 _KBGE_4BEREkar
 
Guide des expertes 2013 (version presse ppt)
Guide des expertes 2013 (version presse ppt)Guide des expertes 2013 (version presse ppt)
Guide des expertes 2013 (version presse ppt)expertes
 
Presentación de la célula raúl molina
Presentación de la célula raúl molinaPresentación de la célula raúl molina
Presentación de la célula raúl molinacristigi81
 
Denuncia querellas y acusacion
Denuncia querellas y acusacionDenuncia querellas y acusacion
Denuncia querellas y acusacionelda69
 
Desarrollo personal (2)
Desarrollo personal (2)Desarrollo personal (2)
Desarrollo personal (2)SilviaAlmao
 
Rss 2 individual
Rss 2 individualRss 2 individual
Rss 2 individuallifercaji
 
Los sentidos
Los sentidosLos sentidos
Los sentidosamarcelah
 
REDES SOCIALES
REDES SOCIALESREDES SOCIALES
REDES SOCIALESkarelyy30
 
La privacidad de facebook
La privacidad de facebookLa privacidad de facebook
La privacidad de facebookLizbeth Montoya
 
Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center
Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center
Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center Microsoft Décideurs IT
 

Destacado (20)

Proyecto tecnológico
Proyecto  tecnológicoProyecto  tecnológico
Proyecto tecnológico
 
HERRAMIENTAS TIC PARA LA CAPACITACIÓN
HERRAMIENTAS TIC PARA LA CAPACITACIÓN HERRAMIENTAS TIC PARA LA CAPACITACIÓN
HERRAMIENTAS TIC PARA LA CAPACITACIÓN
 
Algo mas-que-lavarse-las-manos-
Algo mas-que-lavarse-las-manos-Algo mas-que-lavarse-las-manos-
Algo mas-que-lavarse-las-manos-
 
Sociedad de la información
Sociedad de la informaciónSociedad de la información
Sociedad de la información
 
2 _17 _KBGE_4
2 _17 _KBGE_42 _17 _KBGE_4
2 _17 _KBGE_4
 
APA
APAAPA
APA
 
Guide des expertes 2013 (version presse ppt)
Guide des expertes 2013 (version presse ppt)Guide des expertes 2013 (version presse ppt)
Guide des expertes 2013 (version presse ppt)
 
Presentación de la célula raúl molina
Presentación de la célula raúl molinaPresentación de la célula raúl molina
Presentación de la célula raúl molina
 
Denuncia querellas y acusacion
Denuncia querellas y acusacionDenuncia querellas y acusacion
Denuncia querellas y acusacion
 
Desarrollo personal (2)
Desarrollo personal (2)Desarrollo personal (2)
Desarrollo personal (2)
 
Rss 2 individual
Rss 2 individualRss 2 individual
Rss 2 individual
 
Los sentidos
Los sentidosLos sentidos
Los sentidos
 
Landarbaso
LandarbasoLandarbaso
Landarbaso
 
Les éditions 2012
Les éditions 2012Les éditions 2012
Les éditions 2012
 
GIS Day 2015
GIS Day 2015GIS Day 2015
GIS Day 2015
 
RSS
RSSRSS
RSS
 
REDES SOCIALES
REDES SOCIALESREDES SOCIALES
REDES SOCIALES
 
Kiwicha
KiwichaKiwicha
Kiwicha
 
La privacidad de facebook
La privacidad de facebookLa privacidad de facebook
La privacidad de facebook
 
Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center
Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center
Concevoir votre infrastructure Cloud privés avec Hyper-V et System Center
 

Similar a mineria

Curse of dimensionality by MC Ivan Alejando Garcia
Curse of dimensionality by MC Ivan Alejando GarciaCurse of dimensionality by MC Ivan Alejando Garcia
Curse of dimensionality by MC Ivan Alejando GarciaDataLab Community
 
2-Ajuste_de_Curvas.pdf
2-Ajuste_de_Curvas.pdf2-Ajuste_de_Curvas.pdf
2-Ajuste_de_Curvas.pdfVictorZP2
 
Ajuste de curvas metodo de jacobi
Ajuste de curvas  metodo de jacobiAjuste de curvas  metodo de jacobi
Ajuste de curvas metodo de jacobiTefy Ruiz
 
Ajuste de curvas metodo de jacobi
Ajuste de curvas  metodo de jacobiAjuste de curvas  metodo de jacobi
Ajuste de curvas metodo de jacobiTefy Ruiz
 
Control_estadistico_de_procesos_12053684.ppt
Control_estadistico_de_procesos_12053684.pptControl_estadistico_de_procesos_12053684.ppt
Control_estadistico_de_procesos_12053684.pptBrandonPuentes2
 
Monte Carlo simulation
Monte Carlo simulationMonte Carlo simulation
Monte Carlo simulationFer_casas
 
2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricas2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricasdaser wicho
 
2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricas2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricasDarwin Izurieta Calle
 
IT414 CONTROL TEMPORAL 4ta práctica calificada
IT414 CONTROL TEMPORAL 4ta práctica calificadaIT414 CONTROL TEMPORAL 4ta práctica calificada
IT414 CONTROL TEMPORAL 4ta práctica calificadaMiguel Pajuelo Villanueva
 

Similar a mineria (20)

Introducción al Machine Learning
Introducción al Machine LearningIntroducción al Machine Learning
Introducción al Machine Learning
 
Curse of dimensionality by MC Ivan Alejando Garcia
Curse of dimensionality by MC Ivan Alejando GarciaCurse of dimensionality by MC Ivan Alejando Garcia
Curse of dimensionality by MC Ivan Alejando Garcia
 
2-Ajuste_de_Curvas.pdf
2-Ajuste_de_Curvas.pdf2-Ajuste_de_Curvas.pdf
2-Ajuste_de_Curvas.pdf
 
Ajuste de curvas regresion lineal y no lineal
Ajuste de curvas regresion lineal y no linealAjuste de curvas regresion lineal y no lineal
Ajuste de curvas regresion lineal y no lineal
 
Clase8 minisem
Clase8 minisemClase8 minisem
Clase8 minisem
 
Final.docx
Final.docxFinal.docx
Final.docx
 
A9 r55a7
A9 r55a7A9 r55a7
A9 r55a7
 
Sistemas Difusos
Sistemas DifusosSistemas Difusos
Sistemas Difusos
 
Ajuste de curvas metodo de jacobi
Ajuste de curvas  metodo de jacobiAjuste de curvas  metodo de jacobi
Ajuste de curvas metodo de jacobi
 
Ajuste de curvas metodo de jacobi
Ajuste de curvas  metodo de jacobiAjuste de curvas  metodo de jacobi
Ajuste de curvas metodo de jacobi
 
Otto Challenge report
Otto Challenge reportOtto Challenge report
Otto Challenge report
 
Control_estadistico_de_procesos_12053684.ppt
Control_estadistico_de_procesos_12053684.pptControl_estadistico_de_procesos_12053684.ppt
Control_estadistico_de_procesos_12053684.ppt
 
Monte Carlo simulation
Monte Carlo simulationMonte Carlo simulation
Monte Carlo simulation
 
Trabajo practico - Grafos y Matrices (332) - UNA
Trabajo practico - Grafos y Matrices (332) - UNATrabajo practico - Grafos y Matrices (332) - UNA
Trabajo practico - Grafos y Matrices (332) - UNA
 
2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricas2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricas
 
2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricas2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricas
 
02 modelización numerica
02 modelización numerica02 modelización numerica
02 modelización numerica
 
IT414 CONTROL TEMPORAL 4ta práctica calificada
IT414 CONTROL TEMPORAL 4ta práctica calificadaIT414 CONTROL TEMPORAL 4ta práctica calificada
IT414 CONTROL TEMPORAL 4ta práctica calificada
 
Matematicas 9
Matematicas 9Matematicas 9
Matematicas 9
 
Modelos de elección discreta II
Modelos de elección discreta IIModelos de elección discreta II
Modelos de elección discreta II
 

Último

Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Gonzalo Morales Esparza
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzassuperamigo2014
 
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxKevinHeredia14
 
Ejemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociaciónEjemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociaciónlicmarinaglez
 
cuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdfcuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdfjesuseleazarcenuh
 
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptxINTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptxRENANRODRIGORAMIREZR
 
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfPresentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfLuisAlbertoAlvaradoF2
 
PIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptx
PIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptxPIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptx
PIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptxJosePuentePadronPuen
 
Plan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdfPlan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdfdanilojaviersantiago
 
ADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdfADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdfguillencuevaadrianal
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónjesuscub33
 
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONESCULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONESMarielaAldanaMoscoso
 
Como Construir Un Modelo De Negocio.pdf nociones basicas
Como Construir Un Modelo De Negocio.pdf   nociones basicasComo Construir Un Modelo De Negocio.pdf   nociones basicas
Como Construir Un Modelo De Negocio.pdf nociones basicasoscarhernandez98241
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfConstructiva
 
LIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónLIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónBahamondesOscar
 
Buenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasBuenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasmaicholfc
 
modulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmodulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmisssusanalrescate01
 
Presentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxPresentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxIvnAndres5
 
diseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxdiseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxjuanleivagdf
 

Último (20)

Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzas
 
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
 
Ejemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociaciónEjemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociación
 
cuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdfcuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdf
 
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptxINTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
 
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfPresentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
 
PIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptx
PIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptxPIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptx
PIA MATEMATICAS FINANCIERAS SOBRE PROBLEMAS DE ANUALIDAD.pptx
 
Plan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdfPlan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdf
 
ADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdfADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdf
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarización
 
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONESCULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
 
Como Construir Un Modelo De Negocio.pdf nociones basicas
Como Construir Un Modelo De Negocio.pdf   nociones basicasComo Construir Un Modelo De Negocio.pdf   nociones basicas
Como Construir Un Modelo De Negocio.pdf nociones basicas
 
Tarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.pptTarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.ppt
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
 
LIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónLIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de Gestión
 
Buenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasBuenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en droguerias
 
modulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmodulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdf
 
Presentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxPresentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptx
 
diseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxdiseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptx
 

mineria

  • 1. Análisis y modelación de datos a través de Minería de Datos y algoritmos evolutivos de Regresión Lineal Múltiple Juan Pablo Bribiesca Espinosa ITAM 2015
  • 3. Definición de Base de Datos Exclusión de candidatos Definición de variable de Respuesta Inclusión de Base de Datos Muestreo Aleatorio sin remplazo Definición de Clases (tuplas)
  • 4. Exclusión de datos potencialmente erróneos y estabilización del modelo Outliers: 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑒𝑠 𝐸𝑠𝑡𝑢𝑑𝑒𝑛𝑡𝑖𝑧𝑎𝑑𝑜𝑠: 𝑦𝑖0|𝑟𝑖 > 𝑞𝑡,𝑛−1,0.99995 Apalancamiento: Distancia de Cook ∶ 𝑦𝑖0|𝐷𝑖 > 𝑚𝑎𝑥(𝑞 𝑔𝑎𝑚𝑚𝑎0.9995+0.0005∗ 𝑤−1 , 1) 25 50 75 0 25 50 75 100 horas trabajadas edad Amer-Indian-Eskimo Asian-Pac-Islander Black Other White 𝑦𝑖0 = β00 + 𝑗=1 𝑘 𝛽𝑗0 ∗ 𝑥𝑖𝑗 + 𝜀𝑖0 , 𝑖 = 1,2, … , 𝑛
  • 5. Determinación de Transformaciones • Modelos no lineales por mínimos cuadrados. • Relaciones Funcionales - Familias: – Familia Polinomial – Familia Exponencial – Funciones Potencia – Modelos Rendimiento-Densidad – Modelos Sigmoidales – Splines
  • 6. Determinación de Transformaciones Correlación de Pearson Escalamiento Jerarquización vía Coeficientes de Determinación Ajustados 𝜌 𝜌 = 𝜌 ∗ 1 − 0.0005 ∗ 𝑑𝑓 − 1 Definición de Transformaciones 𝑦𝑖2 = β02 + 𝑗=1 𝜑∗𝑘 𝛽𝑗2 ∗ 𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑗)) 𝑖 = 1,2, … , 𝑛 2
  • 7. Criterio de Información de Akaike • Depuración de regresores vía análisis AIC 𝐴𝐼𝐶 = 𝑛 ∗ log 𝑀𝑆 𝑅𝑒𝑠 + 2𝑘 𝑦𝑖3 = β03 + 𝑗=1 𝑘 𝛽𝑗3 ∗ 𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑗)) 𝑖 = 1,2, … , 𝑛 3 𝑘 ≤ 𝜑 ∗ 𝑘
  • 8. Inserción de Relaciones • 𝐶𝑟𝑖𝑡𝑒𝑟𝑖𝑜: – 𝑝 − 𝑣𝑎𝑙𝑢𝑒 – 𝑑𝑓 ≤ 4: regresores númericos – 𝑑𝑓 ≤ 6: Regresores categóricos 𝑌𝑖4 = 𝑗=1 𝑤 𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑗)) ∗ 𝛽𝑗4 + 𝑗=𝑤+1 𝑠 ( 𝑟 𝜖 {𝛼,𝛽,…,} 𝜗 𝐼(𝑡𝑟𝑎𝑛𝑠(𝑥𝑖𝑟)) ∗ 𝛽𝑗4 ) 𝑖 = 1,2, … , 𝑛4 𝜗: candidatos a transformación 𝑎=1 𝜗−1 𝑎∗(𝑎+1) 2 : posibles interacciones
  • 9. Modelo final Stepwise AIC Outliers: 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑒𝑠 𝐸𝑠𝑡𝑢𝑑𝑒𝑛𝑡𝑖𝑧𝑎𝑑𝑜𝑠: 𝑦𝑖𝐹|𝑟𝑖 > 𝑞𝑡,𝑛−1,0.9995 Distancia de Cook: 𝑦𝑖𝐹|𝐷𝑖 > 𝑚𝑎𝑥 𝑞 𝑔𝑎𝑚𝑚𝑎0.995+0.001∗ 𝑤−1 , 1 𝑖 = 1,2, … , 𝑛 𝐹 𝑤: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑡𝑒𝑟𝑎𝑐𝑖ó𝑛
  • 10. Criterios • Análisis Exploratorio de Datos (aproximación) • Estadísticos: – Análisis de Varianza. – Contraste de White. – Prueba de normalidad de K-S.
  • 11.
  • 12. “Cuando las estadísticas nos dicen que la familia mexicana tiene un promedio de cuatro hijos y medio, nos explicamos por qué siempre hay uno chaparrito.” Marco Antonio Almazán