SlideShare una empresa de Scribd logo
1 de 137
 
 
Módulo de Recuperación Módulo de Adaptación
 
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],hombre mujer ?
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object]
Temperature Headache Temperature Flu e1  yes  normal  no e2  yes  high  yes e3  yes  very high  yes e4  no  normal  no e5  no  high  no   e6  no  very high  no yes yes {e2} no no {e5} yes yes {e3} no no {e6} normal no {e1, e4} Headache high {e2, e5} very   high Headache {e3,e6}
<0,0> <x 15 ,x 16 > <x 3 ,x 4 > <x 5 ,x 6 > <x 9 ,x 10 > <x 11 ,x 12 > <x 1 ,x 2 > <x 7 ,x 8 > <x 21 ,x 22 > <x 17 ,x 18 > <x 13 ,x 14 > <x 19 ,x 20 > <x 23 ,x 24 > f(x)= w x+ b
<0,0> <x 15 ,x 16 > <x 3 ,x 4 > <x 5 ,x 6 > <x 9 ,x 10 > <x 11 ,x 12 > <x 1 ,x 2 > <x 7 ,x 8 > <x 21 ,x 22 > <x 17 ,x 18 > <x 13 ,x 14 > <x 19 ,x 20 > <x 23 ,x 24 > Muchas posibilidades !
<0,0> <x 15 ,x 16 > <x 3 ,x 4 > <x 5 ,x 6 > <x 9 ,x 10 > <x 11 ,x 12 > <x 1 ,x 2 > <x 7 ,x 8 > <x 21 ,x 22 > <x 17 ,x 18 > <x 13 ,x 14 > <x 19 ,x 20 > <x 23 ,x 24 > Margen
<0,0> e 1 Margen
<0,0> f(z)= w z+ b z modelo
Uso de las funciones núcleo (kernel functions)
 
[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
Toda unidad  u j  (excepto las de entradas) calcula una nueva activación  u ' j S j  representa el nivel de voltaje que excita la neurona u ' j  denota la intensidad de la salida resultante de la neurona. j 1 2 n . . . w 1 j w 2 j w nj
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Curvas ROC
[object Object],[object Object],[object Object]
[object Object]
[object Object],[object Object],[object Object],Corpus of Texts Colección de objetos Algoritmo de agrupamiento Grupo 1 Grupo 2 Grupo  k . . . Tan disimilares como sea posible (Heterogeneidad) Tan similares como sea posible (Homogeneidad)
[object Object],[object Object],[object Object],[object Object]
Algoritmo de agrupamiento . . . Corpus of Texts Corpus de textos Tópico 1 Tópico 2 Tópico k
Algoritmo de agrupamiento de documentos Cluster 1 Document 1: <TOPICS><D>cocoa</D></TOPICS> Document 3: <TOPICS><D>cocoa</D></TOPICS> Document 4: <TOPICS><D>cocoa</D></TOPICS> Document 5: <TOPICS><D>cocoa</D></TOPICS> Document 6: <TOPICS><D>cocoa</D></TOPICS> Document 7: <TOPICS><D>cocoa</D></TOPICS> Document 8: <TOPICS><D>cocoa</D></TOPICS> Document 9: <TOPICS><D>cocoa</D></TOPICS> Document 10: <TOPICS><D>cocoa</D></TOPICS> Cluster 2 Document 60: <TOPICS><D>silver</D></TOPICS> Document 61: <TOPICS><D>silver</D></TOPICS> Document 62: <TOPICS><D>silver</D></TOPICS> Document 63: <TOPICS><D>silver</D></TOPICS> Document 64: <TOPICS><D>silver</D></TOPICS> Document 65: <TOPICS><D>silver</D></TOPICS> Document 66: <TOPICS><D>silver</D></TOPICS> Document 67: <TOPICS><D>silver</D></TOPICS> Document 68: <TOPICS><D>silver</D></TOPICS> Document 69: <TOPICS><D>silver</D></TOPICS> Document 70: <TOPICS><D>silver</D></TOPICS> Cluster 17 Document 71: <TOPICS><D>reserves</D></TOPICS> Document 72: <TOPICS><D>reserves</D></TOPICS> Document 74: <TOPICS><D>reserves</D></TOPICS> Document 77: <TOPICS><D>reserves</D></TOPICS> Document 80: <TOPICS><D>reserves</D></TOPICS> … Reuters-21578 Text Categorization Collection, 135 topics http://www.daviddlewis.com/resources/testcollections/reuters21578
BioMed Central's open access full-text corpus for data mining research  Algoritmo de agrupamiento de documentos
Solapado Determinista Aglomerativo Divisivo Probabilístico (Fuzzy)  =1 Posibilístico DURO JERÁRQUICO BORROSO
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
A D C E B A D C E B El número de clusters depende de  “ donde dibujemos la línea”
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],C 1 C 2 i j a ij
[object Object],[object Object],[object Object],[object Object],C 1 C 2 C 1 C 2
[object Object],[object Object],C 1 C 2 avg
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],pequeña grande grande!
[object Object]
[object Object],Cuando    = 1, la forma de calcular la distancia entre los objetos se llama la métrica  Manhattan .  Si     =2, nos referimos a la distancia Euclidiana.  Para los valores       2, estamos en presencia de la métrica  Supermum
Métrica Camberra
Correlación de Pearson es el valor promedio que toma el  atributo h  en el conjunto de datos
[object Object],[object Object],[object Object],[object Object],[object Object]
Para pesos binarios C  es el número de términos que  D i   y  D j  tienen en común,  y  A  y  B  son el número de términos de  D i  y  D j  respectivamente
A  es el número de palabras que describen a  D i ,  B  es el número de palabras que describen a  D j  y  C  es el número de palabras que aparecen tanto en  D i  como en  D j . Para pesos binarios
Más usado D i D j 
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],Nürnberger, A. Klose, A. Kruse, R.  Clustering of Document Collection to Support Interactive Text Exploration.  Studies in Classification, Data Analysis and Knowledge Organization. Exploratory Data Analysis in Empirical Research. Proceedings of the 25th Annuals Conference of the Gesellschaft für Klassification. pp 291-299. 2001.
[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],Algoritmos Estrella Condensado y Estrella Generalizado
Ejemplo de agrupamiento con el algoritmo  Star  donde influye el orden de los datos   Ejemplo de la obtención de clusters ilógicos según agrupamiento  Star  debido a que dos estrellas nunca pueden ser vecinas.
[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],… …
[object Object],[object Object]
Fuente: Newman, M. E. J. Detecting community structure in networks. The European Physical Journal B, 38(2). pp.  321-330. 2004. Potencial que tiene una arista para controlar el flujo de información en el grafo. Favorece a las aristas que se encuentran entre grupos y desfavorecen las incidentes a nodos de un mismo grupo.  Si una arista actúa en la interacción de muchos nodos su nivel de intermediación debe ser alto.
[object Object],[object Object],[object Object],[object Object],[object Object]
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 21 22 20 19
[object Object],[object Object]
Intermediación diferencial  -intermediación Diferencial geodésico c -vecindad Fuente: A. Ochoa, L. Arco. Differential Betweenness in complex networks clustering. CIARP. LNCS. Vol. 5197. pp. 222-229. 2008.
[object Object],[object Object],[object Object],[object Object],[object Object],Mientras que el algoritmo GN tiene la complejidad  O ( m 2 n ).
[object Object],[object Object],[object Object],[object Object],[object Object]
1  BioMed Central ha publicado 22003 artículos http://www.biomedcentral.com/info/abou t/datamining/ 2  Colección Reuters-21578 disponible en el sitio web de David D. Lewis http://www.research.att.com/~lewis 3  IEEE Congress on Evolutionary Computation, suministrada por Nees Jan van Eck y Rudolf Kruse  Corpus Cantidad de documentos Cantidad de grupos Distribución de documentos por grupos BioMed 1 31 2 Grupo 1 =[1..11]  Grupo 2 =[12..31] Reuters 2 29 2 Grupo 1 =[1..12]  Grupo 2 =[13..29] CEC2006 3 29 2 Grupo 1 =[1..18]  Grupo 2 =[19..29]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],Fuente:  “An effective document clustering method using user-adaptable distance metrics”. Han-joon Kim y Sang-goo Lee.  Proceedings of the Symposium on Applied computing. Madrid.  ACM. 2002.
[object Object],[object Object],[object Object],Fuente:  “Semi-supervised clustering with user feedback”. D. Cohn y otros. Technical Report TR2003-1892, Cornell University, 2003.
[object Object],[object Object],[object Object],[object Object],Fuente:  “Personalized Hierarchical Clustering”. Korinna Bade y Andreas Nürnberger. Proceedings of the International Conference on Web Intelligence. Washington, DC. IEEE Computer Society. 2006.
[object Object],[object Object],[object Object],[object Object],Fuente:  “Personalized Hierarchical Clustering”. Korinna Bade y Andreas Nürnberger. Proceedings of the International Conference on Web Intelligence. Washington, DC. IEEE Computer Society. 2006.
[object Object],[object Object]
[object Object],[object Object],El conocimiento del dominio contribuye a determinar qué tipo de agrupamiento se va a utilizar con el objetivo de obtener los mejores resultados .
[object Object],[object Object],Fuente: X. Xu, N. Yuruk, Z. Feng, T. Schweiger. SCAN: A structural clustering algorithm for networks. ACM. KDD. 2007.
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],Fuente:  Newman, M. E. J. The structure and function of networks. Computer Physics Communications, 147: 40-45. 2002.
Fuente: Radicchi, F., Castellano, C., Cecconi, F., Loreto, V. and Parisi, D. Defining and identifying communities in networks. PNAS Proc. National Academic of Science USA, 101(9). 2004.
Fuente: Girvan, M. and Newman, M. E. J. Community structure in social and biological networks. PNAS Proc. National Academy of Science USA, 99(12): 7821-7826. 2002.
Fuente: Newman, M. E. J. and Girvan, M. Finding and evaluating community structure in networks. Physical Review E, 69(026113). 2004.
Fuente: Newman, M. E. J. Analysis of weighted networks. Physical Review E, 70. 2004. El ancho de las aristas indica su peso. Los colores de los vértices indican los grupos. Varias investigaciones muestran que el lenguaje existe en una red  small-world . Fuente: Ferrer, R. and Solé, R. V. The small world of human language. Proc. R. Soc. Lond. B, 268(1482): 2261-2265. 2001.
Nodos: documentos Aristas: conexiones de los documentos con una similitud coseno superior a un umbral fijado. Grupos:  [0..27] talk.politics.guns [28..58] talk.politics.mideast Fuente: Colección 20-newsgroups disponible en http://www.ai.mit.edu/people/jrennie/20Newsgroups
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object],Dunn Bezdek
[object Object],[object Object]
[object Object],[object Object],[object Object]
[object Object],donde el número de documentos de la clase   i   que están asignados al cluster  j   p ij   la probabilidad que un miembro del clusters  j  pertenezca a la clase  i   La entropía de cada cluster  j
[object Object],[object Object],n ij   es el número de miembros de la clase  i   en el cluster  j ,  n j   es el número de miembros del cluster  j  y  n i  es el número de miembros de la clase  i
[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],Fuente: L. Arco y otros. On clustering validity measures and the Rough Set Theory. MICAI 2006. IEEE Computer Society.
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Evaluación del instrumento de medición Confiabilidad Validez Contenido Criterio Constructo Pruebas de Wilcoxon a Resultados con y sin ruido Correlación con medidas internas Correlación con medidas externas Propiedades que se chequean
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
L/G C/G/A Peso Umbral Max/Min P/C Costo Entropía L&G Grupos Si No Min P Bajo Precisión Local - No No Max P Bajo Cubrimiento Local - No No Max P Bajo Medida-F Local - No Si Max P Bajo Información Mutua Local - No No Max P Bajo Estadístico Kappa Global Grupos No No Max P Alto Medida-F Global Global Clases Si Si Max P Bajo MAP&R Global Clases No No Max P&C Bajo Error del agrupamiento Global Pares No No Min P&C Alto Cluster Recall Global Pares No No Max P&C Alto Cluster Precision Global Pares No No Max P&C Alto Estadístico Rand Global Pares No No Max P&C Alto Coeficiente Jaccard Global Pares No No Max P&C Alto Índice de F&M Global Pares No No Max P&C Alto
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Mide en qué grado la clase está incluida en el grupo. Busca correspondencia de cada grupo con las clases. Mide en qué grado el grupo cubre la clase. Media armónica de Precisión y Cubrimiento EM (?) EM (3) E 0.1825 0.2241 Pr 1 0.9271 Re 0.6 0.9067 OFM 0.7239 0.9048 EM (3) 9.33% incorrectos grupos 0 1 2 Iris-setosa 0 50 0 Iris-versicolor 50 0 27 Iris-virginica 14 0 36 EM (?) 40% incorrectos grupos 0 1 2 3 4 Iris-setosa 28 0 0 22 0 Iris-versicolor 0 0 27 0 23 Iris-virginica 0 35 15 0 0
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Objetivo Valora Integral Indep.Forma Centro Ruido Diversos tamaños Umbral Índice C Densidad de los grupos No Si No No No No Similitud Global Cohesión de los grupos (Local) No No No No Si No Dunn original Grupos compactos y bien separados (razón) Si No No Si Si No Dunn-Bezdek Grupos compactos y bien separados (razón) Si No Si Si Si No Bezdek general Grupos compactos y bien separados (razón) Si Si No No Si No Davies-Bouldin Dispersión de los grupos y su separación Si No Si No Si No Índice SD Suma pesada de la distancia intra-grupo y entre grupos Si No Si No No No Índice S_Dbw Suma pesada de la distancia intra-grupo y entre grupos Si No No No Si No Índice Silueta Grupos compactos y bien separados Si No No Si Si No
Objetivo Valora  Integral Indep.Forma Centro Ruido Diversos tamaños Umbral FOM Estimar número de grupos Si Si No No No Si Expansión Árbol de expansión mínimo No Si No Si No Si Conductancia Árbol de expansión mínimo (permite ponderar vértices) No Si No Si No Si Conectividad parcial pesada Conectividad de las aristas pesadas por grupos No Si No No Si Si Densidad esperada Densidad de los grupos por peso de las aristas No Si No No Si Si Modularidad Interconexiones antes y después del agrupamiento Si Si No Si Si Si Índice de tendencia del agrupamiento Forma grafo k-partito con las relaciones entre los k grupos No Si No No Si Si
Objetivo Valora  Integral Indep.Forma Centro Ruido Diversos tamaños Umbral Medida de la fortaleza de las conexiones Identifica grupos débiles y fuertes (solo conexiones) No Si No No Si Si Medida de la interacción Promedio de la interacción intra-grupo entre el promedio de la interacción con nodos externos No Si No Si Si Si Precisión del grupo Razón de los objetos típicos del grupo y los relacionados con él Si (local) Si No No Si Si Calidad del grupo Porciento de objetos bien asignados al grupo Si (local) Si No No Si Si Precisión generalizada del agrupamiento Precisión global ponderada por grupos Si Si No No Si Si Calidad generalizada del agrupamiento Calidad global ponderada por grupos Si Si No No Si Si
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Más contenido relacionado

Similar a Sistemas basados en casos

Jflambert lyada - ayudantia matematicas discretas
Jflambert   lyada - ayudantia matematicas discretasJflambert   lyada - ayudantia matematicas discretas
Jflambert lyada - ayudantia matematicas discretas
Francisco Lambert Obediente
 
Jflambert lyada - ayudantia ordenamiento y teo maestro
Jflambert   lyada - ayudantia ordenamiento y teo maestroJflambert   lyada - ayudantia ordenamiento y teo maestro
Jflambert lyada - ayudantia ordenamiento y teo maestro
Francisco Lambert Obediente
 
5. inecuaciones con valor absoluto
5. inecuaciones con valor absoluto5. inecuaciones con valor absoluto
5. inecuaciones con valor absoluto
sitayanis
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
TATHYYYYY
 
Clustering
ClusteringClustering
Clustering
luisfe
 

Similar a Sistemas basados en casos (20)

Jflambert lyada - ayudantia matematicas discretas
Jflambert   lyada - ayudantia matematicas discretasJflambert   lyada - ayudantia matematicas discretas
Jflambert lyada - ayudantia matematicas discretas
 
Jflambert lyada - ayudantia ordenamiento y teo maestro
Jflambert   lyada - ayudantia ordenamiento y teo maestroJflambert   lyada - ayudantia ordenamiento y teo maestro
Jflambert lyada - ayudantia ordenamiento y teo maestro
 
Aprendizaje automático I - Sesión 2 Caso Práctico.pdf
Aprendizaje automático I - Sesión 2 Caso Práctico.pdfAprendizaje automático I - Sesión 2 Caso Práctico.pdf
Aprendizaje automático I - Sesión 2 Caso Práctico.pdf
 
Aprendizaje no supervisado
Aprendizaje no supervisadoAprendizaje no supervisado
Aprendizaje no supervisado
 
Clase 2. unidad_2
Clase 2. unidad_2Clase 2. unidad_2
Clase 2. unidad_2
 
Clase 2. unidad_2
Clase 2. unidad_2Clase 2. unidad_2
Clase 2. unidad_2
 
Tecnicas de Busqueda en IA
Tecnicas de Busqueda en IATecnicas de Busqueda en IA
Tecnicas de Busqueda en IA
 
5. inecuaciones con valor absoluto
5. inecuaciones con valor absoluto5. inecuaciones con valor absoluto
5. inecuaciones con valor absoluto
 
Método de conteo
Método  de conteoMétodo  de conteo
Método de conteo
 
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De CréditoMétodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
 
Tarea chi cuadrado
Tarea chi cuadradoTarea chi cuadrado
Tarea chi cuadrado
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Sistemas Lineales
Sistemas LinealesSistemas Lineales
Sistemas Lineales
 
Clustering
ClusteringClustering
Clustering
 
Clustering
ClusteringClustering
Clustering
 
Normalidad uni y multivariante en r
Normalidad uni y multivariante en rNormalidad uni y multivariante en r
Normalidad uni y multivariante en r
 
Introducción a la programación y la informática. Tema 6
Introducción a la programación y la informática. Tema 6Introducción a la programación y la informática. Tema 6
Introducción a la programación y la informática. Tema 6
 
Aprendizaje de un perceptrón simple
Aprendizaje de un perceptrón simpleAprendizaje de un perceptrón simple
Aprendizaje de un perceptrón simple
 
Introducción a Machine Learning
Introducción a Machine Learning   Introducción a Machine Learning
Introducción a Machine Learning
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.ppt
 

Más de Luis Álamo

Sistemas Basados en Casos IUT
Sistemas Basados en Casos IUTSistemas Basados en Casos IUT
Sistemas Basados en Casos IUT
Luis Álamo
 
Reglas y hechos IA
Reglas y hechos IAReglas y hechos IA
Reglas y hechos IA
Luis Álamo
 
Alojamiento de páginas web
Alojamiento de páginas webAlojamiento de páginas web
Alojamiento de páginas web
Luis Álamo
 
Desarrollo de Páginas Web
Desarrollo de Páginas WebDesarrollo de Páginas Web
Desarrollo de Páginas Web
Luis Álamo
 
Estandarización de paginas web
Estandarización de paginas webEstandarización de paginas web
Estandarización de paginas web
Luis Álamo
 
Horario laboratorio1oct2011 ene2012
Horario laboratorio1oct2011 ene2012Horario laboratorio1oct2011 ene2012
Horario laboratorio1oct2011 ene2012
Luis Álamo
 
Formato control asistencia sevicio comunitario
Formato control asistencia sevicio comunitarioFormato control asistencia sevicio comunitario
Formato control asistencia sevicio comunitario
Luis Álamo
 
Búsquedas heurísticas
Búsquedas heurísticasBúsquedas heurísticas
Búsquedas heurísticas
Luis Álamo
 
Introducción a la inteligencia artificial profesora iris albarran
Introducción a la inteligencia artificial   profesora iris albarranIntroducción a la inteligencia artificial   profesora iris albarran
Introducción a la inteligencia artificial profesora iris albarran
Luis Álamo
 

Más de Luis Álamo (12)

Sistemas Basados en Casos IUT
Sistemas Basados en Casos IUTSistemas Basados en Casos IUT
Sistemas Basados en Casos IUT
 
Reglas y hechos IA
Reglas y hechos IAReglas y hechos IA
Reglas y hechos IA
 
Alojamiento de páginas web
Alojamiento de páginas webAlojamiento de páginas web
Alojamiento de páginas web
 
Desarrollo de Páginas Web
Desarrollo de Páginas WebDesarrollo de Páginas Web
Desarrollo de Páginas Web
 
Estandarización de paginas web
Estandarización de paginas webEstandarización de paginas web
Estandarización de paginas web
 
Horario laboratorio1oct2011 ene2012
Horario laboratorio1oct2011 ene2012Horario laboratorio1oct2011 ene2012
Horario laboratorio1oct2011 ene2012
 
Formato control asistencia sevicio comunitario
Formato control asistencia sevicio comunitarioFormato control asistencia sevicio comunitario
Formato control asistencia sevicio comunitario
 
Búsquedas heurísticas
Búsquedas heurísticasBúsquedas heurísticas
Búsquedas heurísticas
 
Introducción a la inteligencia artificial profesora iris albarran
Introducción a la inteligencia artificial   profesora iris albarranIntroducción a la inteligencia artificial   profesora iris albarran
Introducción a la inteligencia artificial profesora iris albarran
 
PNF Informática
PNF InformáticaPNF Informática
PNF Informática
 
Polimorfismo
PolimorfismoPolimorfismo
Polimorfismo
 
Polimorfismo
PolimorfismoPolimorfismo
Polimorfismo
 

Último

🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
EliaHernndez7
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
pvtablets2023
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
jlorentemartos
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 

Último (20)

ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdf
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
semana 4 9NO Estudios sociales.pptxnnnn
semana 4  9NO Estudios sociales.pptxnnnnsemana 4  9NO Estudios sociales.pptxnnnn
semana 4 9NO Estudios sociales.pptxnnnn
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADOTIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptx
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.
 

Sistemas basados en casos

  • 1.  
  • 2.  
  • 3. Módulo de Recuperación Módulo de Adaptación
  • 4.  
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15. Temperature Headache Temperature Flu e1 yes normal no e2 yes high yes e3 yes very high yes e4 no normal no e5 no high no e6 no very high no yes yes {e2} no no {e5} yes yes {e3} no no {e6} normal no {e1, e4} Headache high {e2, e5} very high Headache {e3,e6}
  • 16. <0,0> <x 15 ,x 16 > <x 3 ,x 4 > <x 5 ,x 6 > <x 9 ,x 10 > <x 11 ,x 12 > <x 1 ,x 2 > <x 7 ,x 8 > <x 21 ,x 22 > <x 17 ,x 18 > <x 13 ,x 14 > <x 19 ,x 20 > <x 23 ,x 24 > f(x)= w x+ b
  • 17. <0,0> <x 15 ,x 16 > <x 3 ,x 4 > <x 5 ,x 6 > <x 9 ,x 10 > <x 11 ,x 12 > <x 1 ,x 2 > <x 7 ,x 8 > <x 21 ,x 22 > <x 17 ,x 18 > <x 13 ,x 14 > <x 19 ,x 20 > <x 23 ,x 24 > Muchas posibilidades !
  • 18. <0,0> <x 15 ,x 16 > <x 3 ,x 4 > <x 5 ,x 6 > <x 9 ,x 10 > <x 11 ,x 12 > <x 1 ,x 2 > <x 7 ,x 8 > <x 21 ,x 22 > <x 17 ,x 18 > <x 13 ,x 14 > <x 19 ,x 20 > <x 23 ,x 24 > Margen
  • 19. <0,0> e 1 Margen
  • 20. <0,0> f(z)= w z+ b z modelo
  • 21. Uso de las funciones núcleo (kernel functions)
  • 22.  
  • 23.
  • 24.
  • 25.
  • 26.
  • 27. Toda unidad u j (excepto las de entradas) calcula una nueva activación u ' j S j representa el nivel de voltaje que excita la neurona u ' j denota la intensidad de la salida resultante de la neurona. j 1 2 n . . . w 1 j w 2 j w nj
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37. Algoritmo de agrupamiento . . . Corpus of Texts Corpus de textos Tópico 1 Tópico 2 Tópico k
  • 38. Algoritmo de agrupamiento de documentos Cluster 1 Document 1: <TOPICS><D>cocoa</D></TOPICS> Document 3: <TOPICS><D>cocoa</D></TOPICS> Document 4: <TOPICS><D>cocoa</D></TOPICS> Document 5: <TOPICS><D>cocoa</D></TOPICS> Document 6: <TOPICS><D>cocoa</D></TOPICS> Document 7: <TOPICS><D>cocoa</D></TOPICS> Document 8: <TOPICS><D>cocoa</D></TOPICS> Document 9: <TOPICS><D>cocoa</D></TOPICS> Document 10: <TOPICS><D>cocoa</D></TOPICS> Cluster 2 Document 60: <TOPICS><D>silver</D></TOPICS> Document 61: <TOPICS><D>silver</D></TOPICS> Document 62: <TOPICS><D>silver</D></TOPICS> Document 63: <TOPICS><D>silver</D></TOPICS> Document 64: <TOPICS><D>silver</D></TOPICS> Document 65: <TOPICS><D>silver</D></TOPICS> Document 66: <TOPICS><D>silver</D></TOPICS> Document 67: <TOPICS><D>silver</D></TOPICS> Document 68: <TOPICS><D>silver</D></TOPICS> Document 69: <TOPICS><D>silver</D></TOPICS> Document 70: <TOPICS><D>silver</D></TOPICS> Cluster 17 Document 71: <TOPICS><D>reserves</D></TOPICS> Document 72: <TOPICS><D>reserves</D></TOPICS> Document 74: <TOPICS><D>reserves</D></TOPICS> Document 77: <TOPICS><D>reserves</D></TOPICS> Document 80: <TOPICS><D>reserves</D></TOPICS> … Reuters-21578 Text Categorization Collection, 135 topics http://www.daviddlewis.com/resources/testcollections/reuters21578
  • 39. BioMed Central's open access full-text corpus for data mining research Algoritmo de agrupamiento de documentos
  • 40. Solapado Determinista Aglomerativo Divisivo Probabilístico (Fuzzy)  =1 Posibilístico DURO JERÁRQUICO BORROSO
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46. A D C E B A D C E B El número de clusters depende de “ donde dibujemos la línea”
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
  • 59. Correlación de Pearson es el valor promedio que toma el atributo h en el conjunto de datos
  • 60.
  • 61. Para pesos binarios C es el número de términos que D i y D j tienen en común, y A y B son el número de términos de D i y D j respectivamente
  • 62. A es el número de palabras que describen a D i , B es el número de palabras que describen a D j y C es el número de palabras que aparecen tanto en D i como en D j . Para pesos binarios
  • 63. Más usado D i D j 
  • 64.
  • 65.
  • 66.
  • 67.
  • 68.
  • 69.
  • 70.
  • 71.
  • 72.
  • 73.
  • 74.
  • 75.
  • 76. Ejemplo de agrupamiento con el algoritmo Star donde influye el orden de los datos Ejemplo de la obtención de clusters ilógicos según agrupamiento Star debido a que dos estrellas nunca pueden ser vecinas.
  • 77.
  • 78.
  • 79.
  • 80.
  • 81. Fuente: Newman, M. E. J. Detecting community structure in networks. The European Physical Journal B, 38(2). pp. 321-330. 2004. Potencial que tiene una arista para controlar el flujo de información en el grafo. Favorece a las aristas que se encuentran entre grupos y desfavorecen las incidentes a nodos de un mismo grupo. Si una arista actúa en la interacción de muchos nodos su nivel de intermediación debe ser alto.
  • 82.
  • 83. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 21 22 20 19
  • 84.
  • 85.
  • 86. Intermediación diferencial  -intermediación Diferencial geodésico c -vecindad Fuente: A. Ochoa, L. Arco. Differential Betweenness in complex networks clustering. CIARP. LNCS. Vol. 5197. pp. 222-229. 2008.
  • 87.
  • 88.
  • 89. 1 BioMed Central ha publicado 22003 artículos http://www.biomedcentral.com/info/abou t/datamining/ 2 Colección Reuters-21578 disponible en el sitio web de David D. Lewis http://www.research.att.com/~lewis 3 IEEE Congress on Evolutionary Computation, suministrada por Nees Jan van Eck y Rudolf Kruse Corpus Cantidad de documentos Cantidad de grupos Distribución de documentos por grupos BioMed 1 31 2 Grupo 1 =[1..11] Grupo 2 =[12..31] Reuters 2 29 2 Grupo 1 =[1..12] Grupo 2 =[13..29] CEC2006 3 29 2 Grupo 1 =[1..18] Grupo 2 =[19..29]
  • 90.
  • 91.
  • 92.
  • 93.
  • 94.
  • 95.
  • 96.
  • 97.
  • 98.
  • 99.
  • 100.
  • 101.
  • 102.
  • 103. Fuente: Radicchi, F., Castellano, C., Cecconi, F., Loreto, V. and Parisi, D. Defining and identifying communities in networks. PNAS Proc. National Academic of Science USA, 101(9). 2004.
  • 104. Fuente: Girvan, M. and Newman, M. E. J. Community structure in social and biological networks. PNAS Proc. National Academy of Science USA, 99(12): 7821-7826. 2002.
  • 105. Fuente: Newman, M. E. J. and Girvan, M. Finding and evaluating community structure in networks. Physical Review E, 69(026113). 2004.
  • 106. Fuente: Newman, M. E. J. Analysis of weighted networks. Physical Review E, 70. 2004. El ancho de las aristas indica su peso. Los colores de los vértices indican los grupos. Varias investigaciones muestran que el lenguaje existe en una red small-world . Fuente: Ferrer, R. and Solé, R. V. The small world of human language. Proc. R. Soc. Lond. B, 268(1482): 2261-2265. 2001.
  • 107. Nodos: documentos Aristas: conexiones de los documentos con una similitud coseno superior a un umbral fijado. Grupos: [0..27] talk.politics.guns [28..58] talk.politics.mideast Fuente: Colección 20-newsgroups disponible en http://www.ai.mit.edu/people/jrennie/20Newsgroups
  • 108.
  • 109.
  • 110.
  • 111.
  • 112.
  • 113.
  • 114.
  • 115.
  • 116.
  • 117.
  • 118.
  • 119.
  • 120.
  • 121.
  • 122.
  • 123.
  • 124.
  • 125. Evaluación del instrumento de medición Confiabilidad Validez Contenido Criterio Constructo Pruebas de Wilcoxon a Resultados con y sin ruido Correlación con medidas internas Correlación con medidas externas Propiedades que se chequean
  • 126.
  • 127. L/G C/G/A Peso Umbral Max/Min P/C Costo Entropía L&G Grupos Si No Min P Bajo Precisión Local - No No Max P Bajo Cubrimiento Local - No No Max P Bajo Medida-F Local - No Si Max P Bajo Información Mutua Local - No No Max P Bajo Estadístico Kappa Global Grupos No No Max P Alto Medida-F Global Global Clases Si Si Max P Bajo MAP&R Global Clases No No Max P&C Bajo Error del agrupamiento Global Pares No No Min P&C Alto Cluster Recall Global Pares No No Max P&C Alto Cluster Precision Global Pares No No Max P&C Alto Estadístico Rand Global Pares No No Max P&C Alto Coeficiente Jaccard Global Pares No No Max P&C Alto Índice de F&M Global Pares No No Max P&C Alto
  • 128.
  • 129.
  • 130. Mide en qué grado la clase está incluida en el grupo. Busca correspondencia de cada grupo con las clases. Mide en qué grado el grupo cubre la clase. Media armónica de Precisión y Cubrimiento EM (?) EM (3) E 0.1825 0.2241 Pr 1 0.9271 Re 0.6 0.9067 OFM 0.7239 0.9048 EM (3) 9.33% incorrectos grupos 0 1 2 Iris-setosa 0 50 0 Iris-versicolor 50 0 27 Iris-virginica 14 0 36 EM (?) 40% incorrectos grupos 0 1 2 3 4 Iris-setosa 28 0 0 22 0 Iris-versicolor 0 0 27 0 23 Iris-virginica 0 35 15 0 0
  • 131.
  • 132. Objetivo Valora Integral Indep.Forma Centro Ruido Diversos tamaños Umbral Índice C Densidad de los grupos No Si No No No No Similitud Global Cohesión de los grupos (Local) No No No No Si No Dunn original Grupos compactos y bien separados (razón) Si No No Si Si No Dunn-Bezdek Grupos compactos y bien separados (razón) Si No Si Si Si No Bezdek general Grupos compactos y bien separados (razón) Si Si No No Si No Davies-Bouldin Dispersión de los grupos y su separación Si No Si No Si No Índice SD Suma pesada de la distancia intra-grupo y entre grupos Si No Si No No No Índice S_Dbw Suma pesada de la distancia intra-grupo y entre grupos Si No No No Si No Índice Silueta Grupos compactos y bien separados Si No No Si Si No
  • 133. Objetivo Valora Integral Indep.Forma Centro Ruido Diversos tamaños Umbral FOM Estimar número de grupos Si Si No No No Si Expansión Árbol de expansión mínimo No Si No Si No Si Conductancia Árbol de expansión mínimo (permite ponderar vértices) No Si No Si No Si Conectividad parcial pesada Conectividad de las aristas pesadas por grupos No Si No No Si Si Densidad esperada Densidad de los grupos por peso de las aristas No Si No No Si Si Modularidad Interconexiones antes y después del agrupamiento Si Si No Si Si Si Índice de tendencia del agrupamiento Forma grafo k-partito con las relaciones entre los k grupos No Si No No Si Si
  • 134. Objetivo Valora Integral Indep.Forma Centro Ruido Diversos tamaños Umbral Medida de la fortaleza de las conexiones Identifica grupos débiles y fuertes (solo conexiones) No Si No No Si Si Medida de la interacción Promedio de la interacción intra-grupo entre el promedio de la interacción con nodos externos No Si No Si Si Si Precisión del grupo Razón de los objetos típicos del grupo y los relacionados con él Si (local) Si No No Si Si Calidad del grupo Porciento de objetos bien asignados al grupo Si (local) Si No No Si Si Precisión generalizada del agrupamiento Precisión global ponderada por grupos Si Si No No Si Si Calidad generalizada del agrupamiento Calidad global ponderada por grupos Si Si No No Si Si
  • 135.
  • 136.
  • 137.

Notas del editor

  1. If the boundary region is small, we will obtain better results of quality, accuracy and weighted accuracy of classification measures. We propose to use quality, accuracy and weighted accuracy of classification measures to validate clustering results, considering the application of accuracy and quality of approximation measures to validate each cluster. If  ( Ci )=1, Ci is crisp (exact) with respect to set of terms which describes this cluster of documents, if  ( Ci )&lt;1, Ci is rough (vague) with respect of terms which describes this cluster of documents, clusteri is a rough cluster.