SlideShare una empresa de Scribd logo
TÉCNICAS DE ANÁLISIS: ASOCIACIÓN
raineropenschool.com
Rainer Open School – Big Data
INTRODUCCIÓN
El establecimiento de reglas de asociación es
una estrategia de aprendizaje no supervisado
para detectar relaciones “interesantes” en un
conjunto de datos.
raineropenschool.com
APLICACIONES
Las aplicaciones de este tipo de análisis tienen
una gran implantación en el mercado de
consumo, hasta el punto que la técnica se
llama “análisis de cestas de la compra”.
raineropenschool.com
CARACTERÍSTICAS
 Son técnicas de análisis descriptivo; revelan lo
que hay, incluso cuando la relación es
completamente insospechada
 No hacen predicciones, ni en el resultado ni
para el futuro. Comportamientos pasados no
garantizan comportamientos futuros.
 Son estrategias de fuerza bruta, por lo que
pueden llegar a consumir muchos recursos.
raineropenschool.com
CONCEPTO DE RELACIÓN
Decimos que hay una relación entre dos
elementos, cuando aparecen juntos
demasiado a menudo como para sea un hecho
aleatorio y existe un valor comercial en él.
raineropenschool.com
REGLAS DE ENUNCIACIÓN
Decimos que “cuando observamos X, también
se observa Y”, con la convención X -> Y. Ambos
elementos de la relación se denominan “carga
del lado izquierdo y derecho” (LHS, RHS).
raineropenschool.com
CONCEPTO DE ITEMSET
Un “itemset” es una colección de elementos
(desde 1 a n) cuyos componentes mantienen
una relación entre sí. Un itemset de k
elementos se denomina k-itemset.
raineropenschool.com
ALGORITMO DE APRIORI
Uno de los algoritmos de análisis de asociación
más tempranos e influyentes es el de Apriori.
Se basa en el uso del “soporte” como
elemento de referencia en la criba de datos.
raineropenschool.com
CONCEPTO DE SOPORTE
El “soporte” es un valor de referencia,
expresado en porcentaje o en tanto por uno. Se
establece de forma arbitraria por el analista y
define el umbral de criba.
raineropenschool.com
CRITERIO DE SOPORTE MÍNIMO
Por ejemplo, dado un soporte del 0’8 para un
conjunto L, superarán la criba (serán
“frecuentes”) aquellos artículos que estén
presentes en más del 80% de los tickets.
raineropenschool.com
PROPIEDAD DE APRIORI
Si un itemset se considera frecuente, cualquier
subconjunto del itemset mantiene esta
consideración. Este razonamiento se denomina
“propiedad de cierre a la baja”.
raineropenschool.com
ALGORITMO DE APRIORI
El algoritmo de Apriori “barre” el conjunto de
elementos por completo en sucesivas
iteraciones, eliminando los itemsets que no
superan el soporte definido.
raineropenschool.com
ESQUEMA DE APLICACIÓN DEL MÉTODO
1. En la primera iteración, L1, se recorre todo el
conjunto de datos, valorando itemsets de 1
elemento. Los que no superan el soporte, se
eliminan del análisis.
2. En la segunda iteración, L2, los itemsets
supervivientes se emparejan en 2-itemsets,
aplicando la misma regla.
3. El resultado es un conjunto de reglas de
asociación.
raineropenschool.com
FIABILIDAD DE LAS ASOCIACIONES
Confianza X → 𝑌 =
𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝑋 ∩ 𝑌)
𝑆𝑜𝑝𝑜𝑟𝑡𝑒(𝑋)
La confianza (confidence) es el porcentaje de
transacciones que contienen los dos
elementos de la regla, entre todos los que
contienen el primer elemento.
raineropenschool.com
ASCENSO DE LAS ASOCIACIONES
Ascenso X → 𝑌 =
𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝑋 ∩ 𝑌)
𝑆𝑜𝑝𝑜𝑟𝑡𝑒 𝑋 ∗ 𝑆𝑜𝑝𝑜𝑟𝑡𝑒(𝑌)
El ascenso (lift) es una medida de cómo de
probable es que ambos elementos de una
regla aparezcan juntos más a menudo que
separados.
raineropenschool.com
APALANCAMIENTO DE LAS ASOCIACIONES
Apalancamiento X → 𝑌 =
𝑆𝑜𝑝𝑜𝑟𝑡𝑒 𝑋 ∩ 𝑌 − 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 𝑋 ∗ 𝑆𝑜𝑝𝑜𝑟𝑡𝑒(𝑌)
El apalancamiento (leverage) es la probabilidad
neta de que los dos elementos de la regla
aparezcan juntos, respecto a su independencia
estadística.
raineropenschool.com
INTERPRETACIÓN DE LAS MÉTRICAS
 Confianza es la posibilidad de identificar
relaciones consistentes, pero no sabemos si
son una mera casualidad.
 El ascenso es un valor de esa incidencia
estadística.
 El apalancamiento nos dice qué probabilidad
hay de que ocurra esa asociación, respecto al
primer elemento de la misma.
raineropenschool.com
DEBILIDADES DEL MÉTODO
 Aunque es un proceso de criba que reduce el
campo de datos, la estrategia de fuerza bruta
puede requerir un enorme uso de recursos.
 El algoritmo identifica asociaciones, pero éstas
no tienen por qué tener ningún significado ni
mantenerse en el tiempo.
 La definición del soporte es una decisión
arbitraria.
raineropenschool.com
ESTRATEGIAS DE MEJORA DE LA EFICIENCIA
 Particionamiento del conjunto de datos.
 Muestreo aleatorio.
 Reduccionismo en las transacciones.
 Recuento por condensación.
 Recuento dinámico.
raineropenschool.com
CONCLUSIONES
 La detección de reglas de asociación es un
conjunto de estrategias para detectar
relaciones entre elementos de un conjunto.
 Son esquemas de aprendizaje automático, no
supervisado, descriptivos y no predictivos.
 Pueden ser computacionalmente intensos.
 Dependen de algunas decisiones subjetivas.
raineropenschool.com
LECTURAS RECOMENDADAS
Data Science & Big Data
Statistics
EMC Education Services
ISBN: 978-1118876138
http://amzn.to/1QTNWH7
Capítulo 5, por lo que se
refiere a esta presenta-
ción
raineropenschool.com
SOBRE EL AUTOR
Rafael Morales
Consultor y formador en
 Sistemas de información (IT).
 Gestión de proyectos (PM).
 Aseguramiento de la calidad (QA).
 Facility Management (FM).
En LinkedIn: http://bit.ly/2mgxbmx
Email: contacto@rafael-morales.com
raineropenschool.com
OTROS CONTENIDOS
Puedes encontrar las notas de
esta conferencia y otras del
mismo autor en Amazon:
http://amzn.to/1Rp8yM9
También puedes seguir las
novedades y convocatorias de
nuevos seminarios, cursillos y
presentaciones en
raineropenschool.com
raineropenschool.com

Más contenido relacionado

La actualidad más candente

Monografia 1: Escala de Medición. Juan Carlos Rengel.
Monografia 1: Escala de Medición. Juan Carlos Rengel. Monografia 1: Escala de Medición. Juan Carlos Rengel.
Monografia 1: Escala de Medición. Juan Carlos Rengel.
JUNIORMARCANO1
 
Definición conceptual y operacional de las variables
Definición conceptual y operacional de las variablesDefinición conceptual y operacional de las variables
Definición conceptual y operacional de las variables
Ramses Rojas Castillo
 
Paquetes Estadisticos
Paquetes EstadisticosPaquetes Estadisticos
Paquetes Estadisticos
aguiarka
 
Momento de inercia con respecto a ejes paralelos
Momento de inercia con respecto a ejes paralelosMomento de inercia con respecto a ejes paralelos
Momento de inercia con respecto a ejes paralelos
Martin Andrade Pacheco
 
Analisis estructural . Roynert gomez
Analisis estructural  . Roynert gomezAnalisis estructural  . Roynert gomez
Analisis estructural . Roynert gomez
Roynert Gomez
 
Tipos de columnas
Tipos de columnasTipos de columnas
Tipos de columnas
Almary Alvarado
 
Diseños de investigacion 2011
Diseños de investigacion 2011Diseños de investigacion 2011
Diseños de investigacion 2011
Juan Diego González Hidalgo
 
Analisis y procesamiento de datos
Analisis y procesamiento de datosAnalisis y procesamiento de datos
Analisis y procesamiento de datos
Niko Humpire
 
4. ed capítulo iv análisis estructural
4. ed capítulo iv análisis estructural4. ed capítulo iv análisis estructural
4. ed capítulo iv análisis estructural
julio sanchez
 
Anclajes metálicos
Anclajes metálicosAnclajes metálicos
Anclajes metálicos
Sergio Pérez Soto
 
Esfuerzos introduccion
Esfuerzos introduccionEsfuerzos introduccion
Esfuerzos introduccion
froimaralonzo
 
Tabla distribución normal 1 cola derecha
Tabla distribución normal 1 cola derechaTabla distribución normal 1 cola derecha
Tabla distribución normal 1 cola derecha
Francisco Molina
 
Reglas
ReglasReglas
Hipótesis y Variables
Hipótesis y VariablesHipótesis y Variables
Hipótesis y Variables
scgambiental
 
Equipo 2 "Clasificación de los diseños experimentales"
Equipo 2 "Clasificación de los diseños experimentales"Equipo 2 "Clasificación de los diseños experimentales"
Equipo 2 "Clasificación de los diseños experimentales"
RosarioFL
 
Armaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, Ecuaciones
Armaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, EcuacionesArmaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, Ecuaciones
Armaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, Ecuaciones
brayan_jose
 
Modelos, Tipos y Diseños
Modelos, Tipos y DiseñosModelos, Tipos y Diseños
Modelos, Tipos y Diseños
CONASIN PERU
 
RESISTENCIA DE MATERIALES - DEFORMACION SIMPLE
RESISTENCIA DE MATERIALES - DEFORMACION SIMPLERESISTENCIA DE MATERIALES - DEFORMACION SIMPLE
RESISTENCIA DE MATERIALES - DEFORMACION SIMPLE
Ofinalca/Santa Teresa del Tuy
 
Clase 10 diseños de investigación
Clase 10 diseños de investigaciónClase 10 diseños de investigación
Clase 10 diseños de investigación
DORIS ELENA DÁVILA VIGIL
 
Tipos de investigacion
Tipos de investigacionTipos de investigacion
Tipos de investigacion
José Supo
 

La actualidad más candente (20)

Monografia 1: Escala de Medición. Juan Carlos Rengel.
Monografia 1: Escala de Medición. Juan Carlos Rengel. Monografia 1: Escala de Medición. Juan Carlos Rengel.
Monografia 1: Escala de Medición. Juan Carlos Rengel.
 
Definición conceptual y operacional de las variables
Definición conceptual y operacional de las variablesDefinición conceptual y operacional de las variables
Definición conceptual y operacional de las variables
 
Paquetes Estadisticos
Paquetes EstadisticosPaquetes Estadisticos
Paquetes Estadisticos
 
Momento de inercia con respecto a ejes paralelos
Momento de inercia con respecto a ejes paralelosMomento de inercia con respecto a ejes paralelos
Momento de inercia con respecto a ejes paralelos
 
Analisis estructural . Roynert gomez
Analisis estructural  . Roynert gomezAnalisis estructural  . Roynert gomez
Analisis estructural . Roynert gomez
 
Tipos de columnas
Tipos de columnasTipos de columnas
Tipos de columnas
 
Diseños de investigacion 2011
Diseños de investigacion 2011Diseños de investigacion 2011
Diseños de investigacion 2011
 
Analisis y procesamiento de datos
Analisis y procesamiento de datosAnalisis y procesamiento de datos
Analisis y procesamiento de datos
 
4. ed capítulo iv análisis estructural
4. ed capítulo iv análisis estructural4. ed capítulo iv análisis estructural
4. ed capítulo iv análisis estructural
 
Anclajes metálicos
Anclajes metálicosAnclajes metálicos
Anclajes metálicos
 
Esfuerzos introduccion
Esfuerzos introduccionEsfuerzos introduccion
Esfuerzos introduccion
 
Tabla distribución normal 1 cola derecha
Tabla distribución normal 1 cola derechaTabla distribución normal 1 cola derecha
Tabla distribución normal 1 cola derecha
 
Reglas
ReglasReglas
Reglas
 
Hipótesis y Variables
Hipótesis y VariablesHipótesis y Variables
Hipótesis y Variables
 
Equipo 2 "Clasificación de los diseños experimentales"
Equipo 2 "Clasificación de los diseños experimentales"Equipo 2 "Clasificación de los diseños experimentales"
Equipo 2 "Clasificación de los diseños experimentales"
 
Armaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, Ecuaciones
Armaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, EcuacionesArmaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, Ecuaciones
Armaduras, tipos, clasificaciones, aplicaciones en la Ingeniería, Ecuaciones
 
Modelos, Tipos y Diseños
Modelos, Tipos y DiseñosModelos, Tipos y Diseños
Modelos, Tipos y Diseños
 
RESISTENCIA DE MATERIALES - DEFORMACION SIMPLE
RESISTENCIA DE MATERIALES - DEFORMACION SIMPLERESISTENCIA DE MATERIALES - DEFORMACION SIMPLE
RESISTENCIA DE MATERIALES - DEFORMACION SIMPLE
 
Clase 10 diseños de investigación
Clase 10 diseños de investigaciónClase 10 diseños de investigación
Clase 10 diseños de investigación
 
Tipos de investigacion
Tipos de investigacionTipos de investigacion
Tipos de investigacion
 

Destacado

Implantación del Sprint zero
Implantación del Sprint zeroImplantación del Sprint zero
Implantación del Sprint zero
Rafael Morales
 
Introducción a Big Data
Introducción a Big DataIntroducción a Big Data
Introducción a Big Data
Rafael Morales
 
Técnicas de análisis: Clustering
Técnicas de análisis: ClusteringTécnicas de análisis: Clustering
Técnicas de análisis: Clustering
Rafael Morales
 
El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big Data
Rafael Morales
 
Guion Didactico Gimp
Guion Didactico GimpGuion Didactico Gimp
Guion Didactico Gimp
Rafael Morales
 
Educacion y TIC
Educacion y TICEducacion y TIC
Educacion y TIC
Rafael Morales Gamboa
 
Personal Kanban
Personal KanbanPersonal Kanban
Personal Kanban
Rafael Morales
 
Introducción a la tecnología cluster
Introducción a la tecnología clusterIntroducción a la tecnología cluster
Introducción a la tecnología cluster
Rafael Morales
 
Cómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShareCómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShare
Pedro Bermudez Talavera
 
How to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your NicheHow to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your Niche
Leslie Samuel
 

Destacado (10)

Implantación del Sprint zero
Implantación del Sprint zeroImplantación del Sprint zero
Implantación del Sprint zero
 
Introducción a Big Data
Introducción a Big DataIntroducción a Big Data
Introducción a Big Data
 
Técnicas de análisis: Clustering
Técnicas de análisis: ClusteringTécnicas de análisis: Clustering
Técnicas de análisis: Clustering
 
El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big Data
 
Guion Didactico Gimp
Guion Didactico GimpGuion Didactico Gimp
Guion Didactico Gimp
 
Educacion y TIC
Educacion y TICEducacion y TIC
Educacion y TIC
 
Personal Kanban
Personal KanbanPersonal Kanban
Personal Kanban
 
Introducción a la tecnología cluster
Introducción a la tecnología clusterIntroducción a la tecnología cluster
Introducción a la tecnología cluster
 
Cómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShareCómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShare
 
How to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your NicheHow to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your Niche
 

Similar a Técnicas de análisis: Reglas de asociación

Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
Bryan Barragan
 
Pensamiento sistemico en los negocios
Pensamiento sistemico en los negociosPensamiento sistemico en los negocios
Pensamiento sistemico en los negocios
Juan Carlos Fernández
 
Sesión 5
Sesión 5Sesión 5
Sesión 5
Paulina Escalera
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
anasoniaapaza
 
_Mundo de los Datos (1).pdf
_Mundo de los Datos  (1).pdf_Mundo de los Datos  (1).pdf
_Mundo de los Datos (1).pdf
KamZee1
 
SIMULACIÓN DE SISTEMAS-UNIDAD I.ppt
SIMULACIÓN DE SISTEMAS-UNIDAD I.pptSIMULACIÓN DE SISTEMAS-UNIDAD I.ppt
SIMULACIÓN DE SISTEMAS-UNIDAD I.ppt
UGMA
 
Ingenieria de Sistemas
Ingenieria de SistemasIngenieria de Sistemas
Ingenieria de Sistemas
ksimanca18
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
DavidAcurio2
 
sistemas basados en reglas (sbr).pptx
sistemas basados en reglas (sbr).pptxsistemas basados en reglas (sbr).pptx
sistemas basados en reglas (sbr).pptx
CarlosJoseMorataya
 
The fisher assumptions and how to check them
The fisher assumptions and how to check themThe fisher assumptions and how to check them
The fisher assumptions and how to check them
Alex
 
Informe de Pronósticos en los Negocios
Informe de Pronósticos en los NegociosInforme de Pronósticos en los Negocios
Informe de Pronósticos en los Negocios
any1289
 
Sistemas Basados en Reglas
Sistemas Basados en ReglasSistemas Basados en Reglas
Sistemas Basados en Reglas
Kevin Herrarte
 
Reglasproduccion
ReglasproduccionReglasproduccion
Sistemas de razonamiento
Sistemas de razonamientoSistemas de razonamiento
Sistemas de razonamiento
Drivers y Sistem
 
Práctica nº 1
Práctica nº 1Práctica nº 1
Práctica nº 1
Tensor
 
1.5 Procesos de simulación.
1.5 Procesos de simulación. 1.5 Procesos de simulación.
1.5 Procesos de simulación.
avengers92
 
Resúmen t istemas
Resúmen t istemasResúmen t istemas
Resúmen t istemas
magdalenacapelli
 
Introduccion al modelamiento
Introduccion al modelamientoIntroduccion al modelamiento
Introduccion al modelamiento
Eder Dueñas tenorio
 
SIMULACION DE SISTEMAS
SIMULACION DE SISTEMASSIMULACION DE SISTEMAS
SIMULACION DE SISTEMAS
DARWINHECTORCARDENAS
 
Análisis multivariante
Análisis multivarianteAnálisis multivariante
Análisis multivariante
Anet Vargas
 

Similar a Técnicas de análisis: Reglas de asociación (20)

Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Pensamiento sistemico en los negocios
Pensamiento sistemico en los negociosPensamiento sistemico en los negocios
Pensamiento sistemico en los negocios
 
Sesión 5
Sesión 5Sesión 5
Sesión 5
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
_Mundo de los Datos (1).pdf
_Mundo de los Datos  (1).pdf_Mundo de los Datos  (1).pdf
_Mundo de los Datos (1).pdf
 
SIMULACIÓN DE SISTEMAS-UNIDAD I.ppt
SIMULACIÓN DE SISTEMAS-UNIDAD I.pptSIMULACIÓN DE SISTEMAS-UNIDAD I.ppt
SIMULACIÓN DE SISTEMAS-UNIDAD I.ppt
 
Ingenieria de Sistemas
Ingenieria de SistemasIngenieria de Sistemas
Ingenieria de Sistemas
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
sistemas basados en reglas (sbr).pptx
sistemas basados en reglas (sbr).pptxsistemas basados en reglas (sbr).pptx
sistemas basados en reglas (sbr).pptx
 
The fisher assumptions and how to check them
The fisher assumptions and how to check themThe fisher assumptions and how to check them
The fisher assumptions and how to check them
 
Informe de Pronósticos en los Negocios
Informe de Pronósticos en los NegociosInforme de Pronósticos en los Negocios
Informe de Pronósticos en los Negocios
 
Sistemas Basados en Reglas
Sistemas Basados en ReglasSistemas Basados en Reglas
Sistemas Basados en Reglas
 
Reglasproduccion
ReglasproduccionReglasproduccion
Reglasproduccion
 
Sistemas de razonamiento
Sistemas de razonamientoSistemas de razonamiento
Sistemas de razonamiento
 
Práctica nº 1
Práctica nº 1Práctica nº 1
Práctica nº 1
 
1.5 Procesos de simulación.
1.5 Procesos de simulación. 1.5 Procesos de simulación.
1.5 Procesos de simulación.
 
Resúmen t istemas
Resúmen t istemasResúmen t istemas
Resúmen t istemas
 
Introduccion al modelamiento
Introduccion al modelamientoIntroduccion al modelamiento
Introduccion al modelamiento
 
SIMULACION DE SISTEMAS
SIMULACION DE SISTEMASSIMULACION DE SISTEMAS
SIMULACION DE SISTEMAS
 
Análisis multivariante
Análisis multivarianteAnálisis multivariante
Análisis multivariante
 

Último

LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Emisor Digital
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
brayansangar73
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
riveroarlett5b
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
defola5717
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
MarcoPolo545324
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
diegozuniga768
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
MedTechBiz
 
Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
eleandroth
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
NereaMolina10
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
agustincarranza11
 
INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
YulEz1
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
christianllacchasand
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
SantiagoMejia99
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
DilmerCarranza
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
GustavoTello19
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
DivergenteDespierto
 

Último (18)

LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
 
Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
 
INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
 

Técnicas de análisis: Reglas de asociación

  • 1. TÉCNICAS DE ANÁLISIS: ASOCIACIÓN raineropenschool.com Rainer Open School – Big Data
  • 2. INTRODUCCIÓN El establecimiento de reglas de asociación es una estrategia de aprendizaje no supervisado para detectar relaciones “interesantes” en un conjunto de datos. raineropenschool.com
  • 3. APLICACIONES Las aplicaciones de este tipo de análisis tienen una gran implantación en el mercado de consumo, hasta el punto que la técnica se llama “análisis de cestas de la compra”. raineropenschool.com
  • 4. CARACTERÍSTICAS  Son técnicas de análisis descriptivo; revelan lo que hay, incluso cuando la relación es completamente insospechada  No hacen predicciones, ni en el resultado ni para el futuro. Comportamientos pasados no garantizan comportamientos futuros.  Son estrategias de fuerza bruta, por lo que pueden llegar a consumir muchos recursos. raineropenschool.com
  • 5. CONCEPTO DE RELACIÓN Decimos que hay una relación entre dos elementos, cuando aparecen juntos demasiado a menudo como para sea un hecho aleatorio y existe un valor comercial en él. raineropenschool.com
  • 6. REGLAS DE ENUNCIACIÓN Decimos que “cuando observamos X, también se observa Y”, con la convención X -> Y. Ambos elementos de la relación se denominan “carga del lado izquierdo y derecho” (LHS, RHS). raineropenschool.com
  • 7. CONCEPTO DE ITEMSET Un “itemset” es una colección de elementos (desde 1 a n) cuyos componentes mantienen una relación entre sí. Un itemset de k elementos se denomina k-itemset. raineropenschool.com
  • 8. ALGORITMO DE APRIORI Uno de los algoritmos de análisis de asociación más tempranos e influyentes es el de Apriori. Se basa en el uso del “soporte” como elemento de referencia en la criba de datos. raineropenschool.com
  • 9. CONCEPTO DE SOPORTE El “soporte” es un valor de referencia, expresado en porcentaje o en tanto por uno. Se establece de forma arbitraria por el analista y define el umbral de criba. raineropenschool.com
  • 10. CRITERIO DE SOPORTE MÍNIMO Por ejemplo, dado un soporte del 0’8 para un conjunto L, superarán la criba (serán “frecuentes”) aquellos artículos que estén presentes en más del 80% de los tickets. raineropenschool.com
  • 11. PROPIEDAD DE APRIORI Si un itemset se considera frecuente, cualquier subconjunto del itemset mantiene esta consideración. Este razonamiento se denomina “propiedad de cierre a la baja”. raineropenschool.com
  • 12. ALGORITMO DE APRIORI El algoritmo de Apriori “barre” el conjunto de elementos por completo en sucesivas iteraciones, eliminando los itemsets que no superan el soporte definido. raineropenschool.com
  • 13. ESQUEMA DE APLICACIÓN DEL MÉTODO 1. En la primera iteración, L1, se recorre todo el conjunto de datos, valorando itemsets de 1 elemento. Los que no superan el soporte, se eliminan del análisis. 2. En la segunda iteración, L2, los itemsets supervivientes se emparejan en 2-itemsets, aplicando la misma regla. 3. El resultado es un conjunto de reglas de asociación. raineropenschool.com
  • 14. FIABILIDAD DE LAS ASOCIACIONES Confianza X → 𝑌 = 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝑋 ∩ 𝑌) 𝑆𝑜𝑝𝑜𝑟𝑡𝑒(𝑋) La confianza (confidence) es el porcentaje de transacciones que contienen los dos elementos de la regla, entre todos los que contienen el primer elemento. raineropenschool.com
  • 15. ASCENSO DE LAS ASOCIACIONES Ascenso X → 𝑌 = 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝑋 ∩ 𝑌) 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 𝑋 ∗ 𝑆𝑜𝑝𝑜𝑟𝑡𝑒(𝑌) El ascenso (lift) es una medida de cómo de probable es que ambos elementos de una regla aparezcan juntos más a menudo que separados. raineropenschool.com
  • 16. APALANCAMIENTO DE LAS ASOCIACIONES Apalancamiento X → 𝑌 = 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 𝑋 ∩ 𝑌 − 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 𝑋 ∗ 𝑆𝑜𝑝𝑜𝑟𝑡𝑒(𝑌) El apalancamiento (leverage) es la probabilidad neta de que los dos elementos de la regla aparezcan juntos, respecto a su independencia estadística. raineropenschool.com
  • 17. INTERPRETACIÓN DE LAS MÉTRICAS  Confianza es la posibilidad de identificar relaciones consistentes, pero no sabemos si son una mera casualidad.  El ascenso es un valor de esa incidencia estadística.  El apalancamiento nos dice qué probabilidad hay de que ocurra esa asociación, respecto al primer elemento de la misma. raineropenschool.com
  • 18. DEBILIDADES DEL MÉTODO  Aunque es un proceso de criba que reduce el campo de datos, la estrategia de fuerza bruta puede requerir un enorme uso de recursos.  El algoritmo identifica asociaciones, pero éstas no tienen por qué tener ningún significado ni mantenerse en el tiempo.  La definición del soporte es una decisión arbitraria. raineropenschool.com
  • 19. ESTRATEGIAS DE MEJORA DE LA EFICIENCIA  Particionamiento del conjunto de datos.  Muestreo aleatorio.  Reduccionismo en las transacciones.  Recuento por condensación.  Recuento dinámico. raineropenschool.com
  • 20. CONCLUSIONES  La detección de reglas de asociación es un conjunto de estrategias para detectar relaciones entre elementos de un conjunto.  Son esquemas de aprendizaje automático, no supervisado, descriptivos y no predictivos.  Pueden ser computacionalmente intensos.  Dependen de algunas decisiones subjetivas. raineropenschool.com
  • 21. LECTURAS RECOMENDADAS Data Science & Big Data Statistics EMC Education Services ISBN: 978-1118876138 http://amzn.to/1QTNWH7 Capítulo 5, por lo que se refiere a esta presenta- ción raineropenschool.com
  • 22. SOBRE EL AUTOR Rafael Morales Consultor y formador en  Sistemas de información (IT).  Gestión de proyectos (PM).  Aseguramiento de la calidad (QA).  Facility Management (FM). En LinkedIn: http://bit.ly/2mgxbmx Email: contacto@rafael-morales.com raineropenschool.com
  • 23. OTROS CONTENIDOS Puedes encontrar las notas de esta conferencia y otras del mismo autor en Amazon: http://amzn.to/1Rp8yM9 También puedes seguir las novedades y convocatorias de nuevos seminarios, cursillos y presentaciones en raineropenschool.com raineropenschool.com