SlideShare una empresa de Scribd logo
19-5-2014 
Actividad de perfiles de FACEBOOK en la ciudad de Loja 
Mineria de Datos 
Lizzette Betancourt 
Mishele Lojan 
UTPL
Actividad de perfiles de FACEBOOK en la ciudad de Loja 
Tema: 
“Actividad de perfiles de FACEBOOK en la ciudad de Loja” 
Objetivos: 
Objetivo General: 
 Conocer la afluencia, con la que las personas de la ciudad de Loja utilizan la red social Facebook. 
Objetivos Específicos: 
 Extraer datos significativos de los perfiles de “Facebook” de una muestra tomada de la ciudad y provincia de Loja 
 Intentar descubrir patrones de interacción de los usuario lojanos con la red social “Facebook” 
 Transformar los datos obtenidos en Facebook a una estructura comprensible para su uso posterior “Gestionamiento de Datos” 
 Utilizar los algoritmos de minería de datos aprendidos a lo largo de la materia. 
Dataset Usado 
El dataset utilizado ha sido creado en formato .arff ( Attribute Relation File Format ), este dataset contiene datos han sido extraídos de diferentes perfiles de “Facebook” , en los cuales podemos destacar los atributos :
 Nombre 
 Amigos en común 
 Numero de Amigos 
 Universitario (Estudiante universitario) 
 Sexo 
 Lugar nacimiento 
 Lugar donde vive 
 Carrera 
 Publicaciones (Datos compartidos en Facebook) 
 Situación sentimental. 
Los datos que se encuentran en el dataset son de tipo Nominal, Numérico y String. 
Dichos atributos han sido seleccionados teniendo en cuenta la afluencia con que los usuarios proporcionan esta información.
Algoritmos Usados (Referencia Teórica) 
Algoritmo A priori 
Este algoritmo se basa en el conocimiento previo o “a priori” de los conjuntos frecuentes, esto sirve para reducir el espacio de búsqueda y aumentar la eficiencia. 
Caracteristicas: 
 Encuentra itemsets frecuentes usando generación de candidatos 
 Solo se generan aquellos itemsets candidatos que cumplan la propiedad apriori 
 Entrada: minimum support count + transacciones 
 Salida: itemsets frecuentes del tamaño más grande posible + frecuencia para cada itemset 
Algoritmo K-means 
K-means es una algoritmo de tipo no jerárquico que se basa en las distancias entre centroides (cada centroide es el centro de un grupo) para generar el agrupamiento en k clusters previamente solicitados. 
El algoritmo no es determinista por lo que cada ejecución podría generar resultados muy variados dependiendo del método de elección de los centriodes, además de que podría alcanzar un estado en el que nunca cumpla la condición de parada y por tanto nunca converja. 
La base del algoritmo es fácil y por lo general sus órdenes de duración y recursos requeridos son bajos lo que lo hace una buena opción cuando existen limitaciones de hardware. El algoritmo básico podría resumirse como sigue: 
 Calcular las distancias entre los documentos por analizar. 
 Asignar a K elementos como los centroides iniciales, esto se puede hacer de manera aleatoria o a través de dividir los elementos en los lugares intermedios donde debería haber una división. 
 Asignar cada uno de los objetos al grupo que contiene el centroide más cercano. 
 Una vez asignados los objetos, recalcular las posiciones de los centroides
Justificación del uso de Algoritmos 
Algoritmo A priori: Hemos escogido este algoritmo porque aquí nos permite asociar datos nominales, estableciendo reglas de asociación de los datos de nuestro dataset, además este nos permite relacionar diferentes atributos de la tabla. 
Algoritmo K-means Hemos escogido este algoritmos porque nos permite ver la frecuencia con las que los datos, aparecen en el dataset, además este nos permite reconocer los “vecino más cercanos” de un dato, mediante graficas estadísticas. 
Experimentación 
En primer lugar realizaremos un árbol de decisión J48 el cual nos permitirá ver los datos de una manera mas clara. 
Seleccionaremos el dataset con los datos obtenidos de Facebook y procederemos a la elaboración del árbol de decisión, debemos tener él cuenta que los datos del archivo .arff deben ser tipos de dato nominal.
A continuación realizaremos la clasificación de los datos con el algoritmo A PRIORI, en el cual escogeremos los datos de tipo nominal, con 10 reglas y una confianza de 0,9 debemos tener en cuenta que la proximidad a 1 nos presentara reglas con una frecuencia más fija. En los resultados posteriores podremos experimentar cambiando los datos de confianza, los números de reglas y el tipo de indexamiento. 
Al realizar el algoritmo KMeans seleccionaremos igualmente los datos de tipo nominal de los cuales estableceremos la columna de “carrera” como dato a ser clusterizado, también podemos cambiar los datos de el algoritmo, modificando el nuero de iteraciones realizadas y el numero cluster´s deseados
Análisis de Resultados 
ALGORITMO A PRIORI 
Realizando la ejecución del algoritmo A priori con 10 reglas y una confidencialidad de 0.9, hemos obtenido los siguientes datos 
 En la regla #1 podemos observar de nuestra muestra de 60 personas, 56 de ellas viven en la ciudad de Loja, y son universitarios. 
 En la regla #2 podemos observar de nuestra muestra de 60 personas, que 44 de ellas han nacido en Loja y son universitarios. 
 La situación sentimental de nuestra muestra es negativa, por lo tanto podemos afirmar que no tienen una relación o prefieren no publicarla en Facebook. 
 También podemos decir que la mayoría de universitarion que no tienen una relación viven en la ciudad de Loja, y son de sexo Femenino.
Realizando la ejecución del algoritmo A priori con 15 reglas y una confidencialidad de 0.3, hemos obtenido los siguientes datos: 
 En la regla #4 podemos observar que 39 personas de nuestra muestra son universitarios, viven en Loja y no tienen una situacion sentimental. 
 Podemos observar que la mayoria de nuestra muestra son nacidos en Loja y viven en Loja. 
Realizando la ejecución del algoritmo A priori con 20 reglas, un nivel de significancia de -1 y una convicción de 0.9, hemos obtenido los siguientes datos: 
 En la regla 7 podemos observar que la mayoria de publicaciones son hechas por personas de sexo masculino, nacidos en Loja y son universitarios. 
 En la regla #8 y #11 podemos observar que la mayoria de publicaciones son estados publicados por personas que tienen una situacion sentimental. 
 En la regla #19 nos indica que la mayoria de personas que su nacimiento no es en Loja, no tienen relaciones sentimentales.
ALGORITMO K-MEANS 
La ejecucion del algoritmo k-means podemos observar que los tipos de datos de nuestro dataset son clasificados dependiendo de cuanto se repite un dato. 
Ejecutando el algoritmo k-means filtrado por el tipo de carreras que hay obtenemos los siguientes datos. 
 La mayoria de estudiantes universitarios son de Ing. En Sistemas
Al filtrar los datos para el tipo de publicaciones que realizan los usuarios de Facebook podemos afirmar que en su mayoria las publicacion que realizan son estados, 
Al revisar los datos de las tablas y realizando una clusterizacion por la carrera que tienen y la situación sentimental podemos decir que existe valores equitativos de personas que tienen y no relación sentimental.
Al revisar los datos de las tablas y realizando una clusterización por sexo y situación sentimental podemos decir que la mayoría de personas de sexo Femenino tienen una relación sentimental y las personas que más realizan publicaciones son de sexo femenino. 
Conclusiones 
 Podemos concluir que la mayoría de personas que usan el Facebook son de sexo femenino y son las que realizan mayores publicaciones de imágenes (fotos). 
 El 70% de la muestra son estudiantes universitarios que viven en la ciudad de Loja. 
 El 26% de la muestra son estudiantes universitarios que no son nacidos en la ciudad de Loja y no tienen ninguna relación sentimental. 
 La utilización de los algoritmos a priori y k-means nos a permitido conocer los diferentes tipos de filtrado y clasificación de datos. 
 Según nuestro criterio, coincidimos que el algoritmos k-means siendo correctamente utilizado es el que nos brinda mayor y mas clara información acerca de los datos.

Más contenido relacionado

Destacado

Victoiree
VictoireeVictoiree
Victoiree
Plof
 
Programme femmes et_pouvoir
Programme femmes et_pouvoirProgramme femmes et_pouvoir
Programme femmes et_pouvoir
Fadhila BRAHIMI
 
Bicarbonato de na
Bicarbonato de naBicarbonato de na
Bicarbonato de na
SALUD Y VIDA INTEGRAL
 
Presentacion calidad gases popayan
Presentacion calidad gases popayanPresentacion calidad gases popayan
Presentacion calidad gases popayan
andortizco
 
Gabriel García Moreno
Gabriel García MorenoGabriel García Moreno
Gabriel García Moreno
F3rch4
 
30745566 conchas-de-abanico-en-salsa-bretonne
30745566 conchas-de-abanico-en-salsa-bretonne30745566 conchas-de-abanico-en-salsa-bretonne
30745566 conchas-de-abanico-en-salsa-bretonne
Henry Paul Durand Calle
 
Analisador de espectros.odp
Analisador de espectros.odpAnalisador de espectros.odp
Analisador de espectros.odp
Damián
 
Mantenimiento Preventivo CPU y Teclado_Equipo 3
Mantenimiento Preventivo CPU y Teclado_Equipo 3Mantenimiento Preventivo CPU y Teclado_Equipo 3
Mantenimiento Preventivo CPU y Teclado_Equipo 3
Saida Mellina Villegas
 
Management advice for family farm in the ‘Office du Niger’ zone in Mali.
Management advice for family farm in the ‘Office du Niger’ zone in Mali.Management advice for family farm in the ‘Office du Niger’ zone in Mali.
Management advice for family farm in the ‘Office du Niger’ zone in Mali.
Technical Centre for Agricultural and Rural Cooperation ACP-EU (CTA)
 
Diapo valentin septembre 2011
Diapo valentin   septembre 2011Diapo valentin   septembre 2011
Diapo valentin septembre 2011YoukiYouk
 
Liberalsmo en chile
Liberalsmo  en chileLiberalsmo  en chile
Liberalsmo en chile
Colegio Academia Iquique
 
Croisière sur le data lake
Croisière sur le data lakeCroisière sur le data lake
Croisière sur le data lake
David Morel
 
propiedades de los suelos
 propiedades de los suelos propiedades de los suelos
propiedades de los suelos
Henry Paul Durand Calle
 
Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...
Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...
Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...
Mission Val de Loire
 
El niño y la margarita
El niño y la margaritaEl niño y la margarita
El niño y la margarita
majoteros
 
Mopti tournée vers son "fleuve" et respectueuse de ses zones humides
Mopti tournée vers son "fleuve" et respectueuse de ses zones humidesMopti tournée vers son "fleuve" et respectueuse de ses zones humides
Mopti tournée vers son "fleuve" et respectueuse de ses zones humides
Mission Val de Loire
 
Sin título 2
Sin título 2Sin título 2
Sin título 2
Refuerzo
 
Mªángeles martín macarenac carmenpérez
Mªángeles martín macarenac carmenpérezMªángeles martín macarenac carmenpérez
Mªángeles martín macarenac carmenpérezcariam
 
Cobertura MóVil
Cobertura  MóVilCobertura  MóVil
Cobertura MóVil
francoriveros
 
Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso
Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso
Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso
Technical Centre for Agricultural and Rural Cooperation ACP-EU (CTA)
 

Destacado (20)

Victoiree
VictoireeVictoiree
Victoiree
 
Programme femmes et_pouvoir
Programme femmes et_pouvoirProgramme femmes et_pouvoir
Programme femmes et_pouvoir
 
Bicarbonato de na
Bicarbonato de naBicarbonato de na
Bicarbonato de na
 
Presentacion calidad gases popayan
Presentacion calidad gases popayanPresentacion calidad gases popayan
Presentacion calidad gases popayan
 
Gabriel García Moreno
Gabriel García MorenoGabriel García Moreno
Gabriel García Moreno
 
30745566 conchas-de-abanico-en-salsa-bretonne
30745566 conchas-de-abanico-en-salsa-bretonne30745566 conchas-de-abanico-en-salsa-bretonne
30745566 conchas-de-abanico-en-salsa-bretonne
 
Analisador de espectros.odp
Analisador de espectros.odpAnalisador de espectros.odp
Analisador de espectros.odp
 
Mantenimiento Preventivo CPU y Teclado_Equipo 3
Mantenimiento Preventivo CPU y Teclado_Equipo 3Mantenimiento Preventivo CPU y Teclado_Equipo 3
Mantenimiento Preventivo CPU y Teclado_Equipo 3
 
Management advice for family farm in the ‘Office du Niger’ zone in Mali.
Management advice for family farm in the ‘Office du Niger’ zone in Mali.Management advice for family farm in the ‘Office du Niger’ zone in Mali.
Management advice for family farm in the ‘Office du Niger’ zone in Mali.
 
Diapo valentin septembre 2011
Diapo valentin   septembre 2011Diapo valentin   septembre 2011
Diapo valentin septembre 2011
 
Liberalsmo en chile
Liberalsmo  en chileLiberalsmo  en chile
Liberalsmo en chile
 
Croisière sur le data lake
Croisière sur le data lakeCroisière sur le data lake
Croisière sur le data lake
 
propiedades de los suelos
 propiedades de los suelos propiedades de los suelos
propiedades de los suelos
 
Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...
Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...
Zones humides, un contrat pour la restauration et l’entretien d’annexes hydra...
 
El niño y la margarita
El niño y la margaritaEl niño y la margarita
El niño y la margarita
 
Mopti tournée vers son "fleuve" et respectueuse de ses zones humides
Mopti tournée vers son "fleuve" et respectueuse de ses zones humidesMopti tournée vers son "fleuve" et respectueuse de ses zones humides
Mopti tournée vers son "fleuve" et respectueuse de ses zones humides
 
Sin título 2
Sin título 2Sin título 2
Sin título 2
 
Mªángeles martín macarenac carmenpérez
Mªángeles martín macarenac carmenpérezMªángeles martín macarenac carmenpérez
Mªángeles martín macarenac carmenpérez
 
Cobertura MóVil
Cobertura  MóVilCobertura  MóVil
Cobertura MóVil
 
Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso
Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso
Financement Chaine De Valueur De La Filiere Riz De Bagre Burkina Faso
 

Similar a actividad de perfiles de facebook en la ciudad de loja- Mineria de Datos

9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la Investigacion9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la Investigacion
Edison Coimbra G.
 
Manual spss
Manual spssManual spss
Manual spss
katherynthali
 
Manual spss
Manual spssManual spss
Manual spss
jhonarciniegas
 
Manual spss
Manual spssManual spss
Manual spss
KaRo Arciniegas
 
Manual spss
Manual spssManual spss
Manual spss
jesepozo1992
 
Manual spss
Manual spssManual spss
Manual spss
jesepozo1992
 
Manual spss
Manual spssManual spss
El algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datosEl algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datos
Facultad de Ciencias Económicas - Universidad Nacional de Cuyo
 
El algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datosEl algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datos
Facultad de Ciencias Económicas - Universidad Nacional de Cuyo
 
Exposicion Tema Analisis De Datos
Exposicion Tema Analisis De DatosExposicion Tema Analisis De Datos
Exposicion Tema Analisis De Datos
Jesus III Juarez Cruz
 
Manual spss
Manual spssManual spss
Manual spss
jonathanupec
 
ETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACIONETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACION
Anibal Alejandro Gomez Garcia
 
Taller méxico análisis
Taller méxico análisisTaller méxico análisis
Taller méxico análisis
SocialTIC
 
1.5 Procesos de simulación.
1.5 Procesos de simulación. 1.5 Procesos de simulación.
1.5 Procesos de simulación.
avengers92
 
Mini manual R commander
Mini manual R commanderMini manual R commander
Mini manual R commander
Andrés M-g
 
Acceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorAcceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidor
Jomicast
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
Marilyn Jaramillo
 
Bases de datos deductivas
Bases de datos deductivas Bases de datos deductivas
Bases de datos deductivas
natar25
 
BLOG, CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdf
BLOG, CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdfBLOG, CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdf
BLOG, CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdf
danielabolaos17
 
Practicando análisis cibermétrico en redes de investigadores
Practicando análisis cibermétrico en redes de investigadoresPracticando análisis cibermétrico en redes de investigadores
Practicando análisis cibermétrico en redes de investigadores
Elwin Huaman
 

Similar a actividad de perfiles de facebook en la ciudad de loja- Mineria de Datos (20)

9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la Investigacion9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la Investigacion
 
Manual spss
Manual spssManual spss
Manual spss
 
Manual spss
Manual spssManual spss
Manual spss
 
Manual spss
Manual spssManual spss
Manual spss
 
Manual spss
Manual spssManual spss
Manual spss
 
Manual spss
Manual spssManual spss
Manual spss
 
Manual spss
Manual spssManual spss
Manual spss
 
El algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datosEl algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datos
 
El algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datosEl algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datos
 
Exposicion Tema Analisis De Datos
Exposicion Tema Analisis De DatosExposicion Tema Analisis De Datos
Exposicion Tema Analisis De Datos
 
Manual spss
Manual spssManual spss
Manual spss
 
ETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACIONETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACION
 
Taller méxico análisis
Taller méxico análisisTaller méxico análisis
Taller méxico análisis
 
1.5 Procesos de simulación.
1.5 Procesos de simulación. 1.5 Procesos de simulación.
1.5 Procesos de simulación.
 
Mini manual R commander
Mini manual R commanderMini manual R commander
Mini manual R commander
 
Acceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorAcceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidor
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 
Bases de datos deductivas
Bases de datos deductivas Bases de datos deductivas
Bases de datos deductivas
 
BLOG, CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdf
BLOG, CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdfBLOG, CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdf
BLOG, CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.pdf
 
Practicando análisis cibermétrico en redes de investigadores
Practicando análisis cibermétrico en redes de investigadoresPracticando análisis cibermétrico en redes de investigadores
Practicando análisis cibermétrico en redes de investigadores
 

Último

Rinitis alérgica-1.pdfuhycrbibxgvyvyjimomom
Rinitis alérgica-1.pdfuhycrbibxgvyvyjimomomRinitis alérgica-1.pdfuhycrbibxgvyvyjimomom
Rinitis alérgica-1.pdfuhycrbibxgvyvyjimomom
DanielaLoaeza5
 
PRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICA
PRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICAPRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICA
PRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICA
carmenquintana18
 
Características de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptxCaracterísticas de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptx
MONICADELROCIOMUNZON1
 
Ducto Barras para instalaciones electricas
Ducto Barras para instalaciones electricasDucto Barras para instalaciones electricas
Ducto Barras para instalaciones electricas
Edgar Najera
 
EXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdf
EXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdfEXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdf
EXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdf
hugodennis88
 
Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...
Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...
Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...
andressalas92
 
Presentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calorPresentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calor
GerardoBracho3
 
DISEÑO DE PLANTA TIPO CELULAR - Diseño de Plantas
DISEÑO DE PLANTA TIPO CELULAR - Diseño de PlantasDISEÑO DE PLANTA TIPO CELULAR - Diseño de Plantas
DISEÑO DE PLANTA TIPO CELULAR - Diseño de Plantas
HalmarMiranda
 
tema alcanos cicloalcanos de quimica.pdf
tema alcanos cicloalcanos de quimica.pdftema alcanos cicloalcanos de quimica.pdf
tema alcanos cicloalcanos de quimica.pdf
veronicaluna80
 
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOSSISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
micoltadaniel2024
 
Presentación- de motor a combustión -diesel.pptx
Presentación- de motor a combustión -diesel.pptxPresentación- de motor a combustión -diesel.pptx
Presentación- de motor a combustión -diesel.pptx
ronnyrocha223
 
Estructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegaciónEstructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegación
AlvaroEduardoConsola1
 
Clase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieriaClase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieria
leonidasbajalquepuch
 
Presentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdfPresentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdf
jdcumarem02
 
Propiedades Electricas de los Materiales
Propiedades Electricas de los MaterialesPropiedades Electricas de los Materiales
Propiedades Electricas de los Materiales
rogeliorodriguezt
 
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTOOPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
GERARDO GONZALEZ
 
Control de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptxControl de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptx
alexanderlara1198
 
Operaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica MaizOperaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica Maiz
carolina838317
 
Estilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdf
Estilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdfEstilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdf
Estilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdf
ElisaLen4
 
PRINCIPALES CARACTERISTICAS DE EL PH.pptx
PRINCIPALES CARACTERISTICAS DE EL PH.pptxPRINCIPALES CARACTERISTICAS DE EL PH.pptx
PRINCIPALES CARACTERISTICAS DE EL PH.pptx
MONICADELROCIOMUNZON1
 

Último (20)

Rinitis alérgica-1.pdfuhycrbibxgvyvyjimomom
Rinitis alérgica-1.pdfuhycrbibxgvyvyjimomomRinitis alérgica-1.pdfuhycrbibxgvyvyjimomom
Rinitis alérgica-1.pdfuhycrbibxgvyvyjimomom
 
PRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICA
PRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICAPRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICA
PRIMERA Y SEGUNDA LEY DE LA TERMODINÁMICA
 
Características de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptxCaracterísticas de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptx
 
Ducto Barras para instalaciones electricas
Ducto Barras para instalaciones electricasDucto Barras para instalaciones electricas
Ducto Barras para instalaciones electricas
 
EXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdf
EXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdfEXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdf
EXPOSICIÓN NTP IEC 60364-1 - Orlando Chávez Chacaltana.pdf
 
Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...
Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...
Libro Epanet, guía explicativa de los pasos a seguir para analizar redes hidr...
 
Presentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calorPresentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calor
 
DISEÑO DE PLANTA TIPO CELULAR - Diseño de Plantas
DISEÑO DE PLANTA TIPO CELULAR - Diseño de PlantasDISEÑO DE PLANTA TIPO CELULAR - Diseño de Plantas
DISEÑO DE PLANTA TIPO CELULAR - Diseño de Plantas
 
tema alcanos cicloalcanos de quimica.pdf
tema alcanos cicloalcanos de quimica.pdftema alcanos cicloalcanos de quimica.pdf
tema alcanos cicloalcanos de quimica.pdf
 
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOSSISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
 
Presentación- de motor a combustión -diesel.pptx
Presentación- de motor a combustión -diesel.pptxPresentación- de motor a combustión -diesel.pptx
Presentación- de motor a combustión -diesel.pptx
 
Estructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegaciónEstructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegación
 
Clase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieriaClase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieria
 
Presentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdfPresentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdf
 
Propiedades Electricas de los Materiales
Propiedades Electricas de los MaterialesPropiedades Electricas de los Materiales
Propiedades Electricas de los Materiales
 
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTOOPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
 
Control de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptxControl de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptx
 
Operaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica MaizOperaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica Maiz
 
Estilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdf
Estilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdfEstilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdf
Estilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdf
 
PRINCIPALES CARACTERISTICAS DE EL PH.pptx
PRINCIPALES CARACTERISTICAS DE EL PH.pptxPRINCIPALES CARACTERISTICAS DE EL PH.pptx
PRINCIPALES CARACTERISTICAS DE EL PH.pptx
 

actividad de perfiles de facebook en la ciudad de loja- Mineria de Datos

  • 1. 19-5-2014 Actividad de perfiles de FACEBOOK en la ciudad de Loja Mineria de Datos Lizzette Betancourt Mishele Lojan UTPL
  • 2. Actividad de perfiles de FACEBOOK en la ciudad de Loja Tema: “Actividad de perfiles de FACEBOOK en la ciudad de Loja” Objetivos: Objetivo General:  Conocer la afluencia, con la que las personas de la ciudad de Loja utilizan la red social Facebook. Objetivos Específicos:  Extraer datos significativos de los perfiles de “Facebook” de una muestra tomada de la ciudad y provincia de Loja  Intentar descubrir patrones de interacción de los usuario lojanos con la red social “Facebook”  Transformar los datos obtenidos en Facebook a una estructura comprensible para su uso posterior “Gestionamiento de Datos”  Utilizar los algoritmos de minería de datos aprendidos a lo largo de la materia. Dataset Usado El dataset utilizado ha sido creado en formato .arff ( Attribute Relation File Format ), este dataset contiene datos han sido extraídos de diferentes perfiles de “Facebook” , en los cuales podemos destacar los atributos :
  • 3.  Nombre  Amigos en común  Numero de Amigos  Universitario (Estudiante universitario)  Sexo  Lugar nacimiento  Lugar donde vive  Carrera  Publicaciones (Datos compartidos en Facebook)  Situación sentimental. Los datos que se encuentran en el dataset son de tipo Nominal, Numérico y String. Dichos atributos han sido seleccionados teniendo en cuenta la afluencia con que los usuarios proporcionan esta información.
  • 4. Algoritmos Usados (Referencia Teórica) Algoritmo A priori Este algoritmo se basa en el conocimiento previo o “a priori” de los conjuntos frecuentes, esto sirve para reducir el espacio de búsqueda y aumentar la eficiencia. Caracteristicas:  Encuentra itemsets frecuentes usando generación de candidatos  Solo se generan aquellos itemsets candidatos que cumplan la propiedad apriori  Entrada: minimum support count + transacciones  Salida: itemsets frecuentes del tamaño más grande posible + frecuencia para cada itemset Algoritmo K-means K-means es una algoritmo de tipo no jerárquico que se basa en las distancias entre centroides (cada centroide es el centro de un grupo) para generar el agrupamiento en k clusters previamente solicitados. El algoritmo no es determinista por lo que cada ejecución podría generar resultados muy variados dependiendo del método de elección de los centriodes, además de que podría alcanzar un estado en el que nunca cumpla la condición de parada y por tanto nunca converja. La base del algoritmo es fácil y por lo general sus órdenes de duración y recursos requeridos son bajos lo que lo hace una buena opción cuando existen limitaciones de hardware. El algoritmo básico podría resumirse como sigue:  Calcular las distancias entre los documentos por analizar.  Asignar a K elementos como los centroides iniciales, esto se puede hacer de manera aleatoria o a través de dividir los elementos en los lugares intermedios donde debería haber una división.  Asignar cada uno de los objetos al grupo que contiene el centroide más cercano.  Una vez asignados los objetos, recalcular las posiciones de los centroides
  • 5. Justificación del uso de Algoritmos Algoritmo A priori: Hemos escogido este algoritmo porque aquí nos permite asociar datos nominales, estableciendo reglas de asociación de los datos de nuestro dataset, además este nos permite relacionar diferentes atributos de la tabla. Algoritmo K-means Hemos escogido este algoritmos porque nos permite ver la frecuencia con las que los datos, aparecen en el dataset, además este nos permite reconocer los “vecino más cercanos” de un dato, mediante graficas estadísticas. Experimentación En primer lugar realizaremos un árbol de decisión J48 el cual nos permitirá ver los datos de una manera mas clara. Seleccionaremos el dataset con los datos obtenidos de Facebook y procederemos a la elaboración del árbol de decisión, debemos tener él cuenta que los datos del archivo .arff deben ser tipos de dato nominal.
  • 6. A continuación realizaremos la clasificación de los datos con el algoritmo A PRIORI, en el cual escogeremos los datos de tipo nominal, con 10 reglas y una confianza de 0,9 debemos tener en cuenta que la proximidad a 1 nos presentara reglas con una frecuencia más fija. En los resultados posteriores podremos experimentar cambiando los datos de confianza, los números de reglas y el tipo de indexamiento. Al realizar el algoritmo KMeans seleccionaremos igualmente los datos de tipo nominal de los cuales estableceremos la columna de “carrera” como dato a ser clusterizado, también podemos cambiar los datos de el algoritmo, modificando el nuero de iteraciones realizadas y el numero cluster´s deseados
  • 7. Análisis de Resultados ALGORITMO A PRIORI Realizando la ejecución del algoritmo A priori con 10 reglas y una confidencialidad de 0.9, hemos obtenido los siguientes datos  En la regla #1 podemos observar de nuestra muestra de 60 personas, 56 de ellas viven en la ciudad de Loja, y son universitarios.  En la regla #2 podemos observar de nuestra muestra de 60 personas, que 44 de ellas han nacido en Loja y son universitarios.  La situación sentimental de nuestra muestra es negativa, por lo tanto podemos afirmar que no tienen una relación o prefieren no publicarla en Facebook.  También podemos decir que la mayoría de universitarion que no tienen una relación viven en la ciudad de Loja, y son de sexo Femenino.
  • 8. Realizando la ejecución del algoritmo A priori con 15 reglas y una confidencialidad de 0.3, hemos obtenido los siguientes datos:  En la regla #4 podemos observar que 39 personas de nuestra muestra son universitarios, viven en Loja y no tienen una situacion sentimental.  Podemos observar que la mayoria de nuestra muestra son nacidos en Loja y viven en Loja. Realizando la ejecución del algoritmo A priori con 20 reglas, un nivel de significancia de -1 y una convicción de 0.9, hemos obtenido los siguientes datos:  En la regla 7 podemos observar que la mayoria de publicaciones son hechas por personas de sexo masculino, nacidos en Loja y son universitarios.  En la regla #8 y #11 podemos observar que la mayoria de publicaciones son estados publicados por personas que tienen una situacion sentimental.  En la regla #19 nos indica que la mayoria de personas que su nacimiento no es en Loja, no tienen relaciones sentimentales.
  • 9. ALGORITMO K-MEANS La ejecucion del algoritmo k-means podemos observar que los tipos de datos de nuestro dataset son clasificados dependiendo de cuanto se repite un dato. Ejecutando el algoritmo k-means filtrado por el tipo de carreras que hay obtenemos los siguientes datos.  La mayoria de estudiantes universitarios son de Ing. En Sistemas
  • 10. Al filtrar los datos para el tipo de publicaciones que realizan los usuarios de Facebook podemos afirmar que en su mayoria las publicacion que realizan son estados, Al revisar los datos de las tablas y realizando una clusterizacion por la carrera que tienen y la situación sentimental podemos decir que existe valores equitativos de personas que tienen y no relación sentimental.
  • 11. Al revisar los datos de las tablas y realizando una clusterización por sexo y situación sentimental podemos decir que la mayoría de personas de sexo Femenino tienen una relación sentimental y las personas que más realizan publicaciones son de sexo femenino. Conclusiones  Podemos concluir que la mayoría de personas que usan el Facebook son de sexo femenino y son las que realizan mayores publicaciones de imágenes (fotos).  El 70% de la muestra son estudiantes universitarios que viven en la ciudad de Loja.  El 26% de la muestra son estudiantes universitarios que no son nacidos en la ciudad de Loja y no tienen ninguna relación sentimental.  La utilización de los algoritmos a priori y k-means nos a permitido conocer los diferentes tipos de filtrado y clasificación de datos.  Según nuestro criterio, coincidimos que el algoritmos k-means siendo correctamente utilizado es el que nos brinda mayor y mas clara información acerca de los datos.