SlideShare una empresa de Scribd logo
1 de 10
DISEÑO DE CIRCUITO
MODERNO
COMPONENTES DE
INFORMÁTICA
REDES
PROCESADOR
INFORMÁTICA EN LA
NUBE
SERVIDOR
Objetivo:
Mostrar el uso de un modelo de no supervisado, a través del proceso de Clustering, haciendo uso del algoritmo K-Means.
Para esta finalidad, vamos a analizar la existencia de patrones mezclando datos de un estudio de uso de redes sociales
(https://thesocialmediafamily.com/informe-redes-sociales/#mc_embed_signup_scroll) , con medidas como la tasa de desempleo,
Población sedentaria, Salario medio por hora, Parques m2 por habitante, en 50 ciudades españolas (https://www.ine.es/).
A partir de las fuentes antes mencionadas, se ha elaborado un dataset con 50 observaciones, el cual tiene las siguientes variables:
• Variables obteniedas del estudio de uso de redes sociales  ‘Comunidad’, 'Ciudad', 'Cantidad de perfiles facebook’, 'Usuarios
jóvenes (18-39)’, 'Usuarios adultos (40-64)', 'Usuarios mayores (+ 65)', 'Hombres’, 'Mujeres', 'Población’.
• Variables obtenidas del INE: 'Tasa desempleo ciudad', '% Población sedentaria’, 'Salario medio por hora', 'Parques m2/hab’. Están
expresados porcentualmente.
Para que los datos de todas las variables, tengan una escala similar, se indican valores porcentuales en función de la población. Por
ejemplo el campo 'Cantidad de perfiles facebook’ indica el porcentaje de usuarios, respecto a la población, para cada ciudad.
Es importante comentar que los datos del primer grupo son datos del 2020, y los datos obtenidos del INE son datos, que en su
momento reflejaban la realidad del 2017, no obstante nos servirán para mostrar el potencial del proceso de Clustering.
Análisis de las medidas estadísticas:
• La media de la cantidad de perfiles de facebook ronda alrededor del 70%.
• Podemos observar que la desviación de cantidad de perfiles de facebook que tienen las ciudades, es de 24.14 puntos de media. Esto nos indica
una alta variabilidad, a diferencia de las otras variables.
• El valor mínimo y máximo están bastante alejados.
• Podemos destacar también, en base a los cuartiles, que 25 ciudades analizadas tienen un porcentaje de usuarios de facebook inferior al 69,78%
y las otras 25 ciudades tienen un porcentaje de usuarios superior al 69,78%. Además 12 ciudades (25%), tienen un porcentaje de usuarios de
facebook superior al 89%.
• Hay ciudades donde existen personas que tienen más de una cuenta facebook ( > 100% de la población).
Distribución de los datos:
Se puede observar que, salvo las
variables “Usuarios adultos (40-64)” y
“Usuarios mayores (+65)”, las variables
son más menos uniformes.
Análisis de Correlación.
Se puede observar que las variables
'Cantidad de perfiles facebook’,
'Usuarios jóvenes (18-39)’, 'Usuarios
adultos (40-64)', 'Usuarios mayores (+
65)', 'Hombres’, 'Mujeres’ están
altamente correlacionados. Y era de
esperarse, el cálculo de todas ellas,
exceptuando la primera, está en
función de de la variable ‘'Cantidad
de perfiles facebook’.
Dada esta correlación, podríamos
obviar esta variables en el análisis
(exceptuando ‘Cantidad de perfiles
facebook’ desde luego). No obstante,
como indicaremos más adelante, tanto
considerándolas como no, se obtienen
resultados muy parecidos.
Identificación Nº Clusters
Utilizando la Curva Elbow, el número
de clusters recomendado es 3.
En el gráfico de la derecha,
confirmamos ese número con análisis
silhouette. Para el caso de 3 Clusters,
el score de cada cluster es superior al
score promedio, del mismo modo la
proporción de los datos es más
uniforme.
Clusters
Se muestra gráficamente los clusters
creados para las variables ‘Cantidad
de perfiles facebook’, ‘Tasa
desempleo ciudad’ , ‘% Población
sedentaria’, y ‘Salario medio por
hora’
Conclusiones:
• Se han agrupado las 50 ciudades españolas en 3 grupos o clusters.
• Los grupos obedecen a ciudades que tienen altas cantidades de perfiles facebook (96,23%), ciudades con niveles medios (66,42%), y
ciudades con cantidades de usuarios inferiores al 50% de su población (42,68%)
• De los 3 grupos, destacamos el Cluster 2.
• Existe un alto porcentaje de perfiles facebook (96,23%).
• En este grupo hay 18 ciudades donde además se observa un alto porcentaje de mujeres que usan facebook, respecto a los hombres
(comparado con los demás grupos).
• Presenta un porcentaje de usuarios entre 18 y 39 años, así como usuarios entre 40 y 64 años, bastante mayor comparado con los otros
grupos.
• La tasa de Población sedentaria y tasa de desempleo es superior a los otros Clusters.
• Podemos observar además que de las variables obtenidas del INE, la variable ‘% Población sedentaria’ es más significativa que las otras, por
tanto podríamos pensar que el nivel de sedentarismo en una ciudad, influye de alguna manera en el uso de la red social facebook.
Las ciudades del grupo 2 son: Alicante, Almería, Barcelona, Bilbao, Castellón de la plana, Granada, Huelva, La Coruña, Las Palmas de G.C.,
Madrid, Málaga, Murcia, Palma, Santa Cruz de Tenerife, Santander, Sevilla, Tarragona y Valencia
PROCESO
Acceso
necesario
Determinar
escala
Seleccionar
tecnología

Más contenido relacionado

Similar a Análisis de patrones de uso de redes sociales y variables socioeconómicas mediante clustering K-Means en 50 ciudades españolas

Estudio IAB de Redes Sociales en España 2020
Estudio IAB de Redes Sociales en España 2020Estudio IAB de Redes Sociales en España 2020
Estudio IAB de Redes Sociales en España 2020Alfredo Vela Zancada
 
Estudio de Redes Sociales 2020 IAB & ELOGIA
Estudio de Redes Sociales 2020 IAB & ELOGIAEstudio de Redes Sociales 2020 IAB & ELOGIA
Estudio de Redes Sociales 2020 IAB & ELOGIATecnocible
 
Estudio anual de redes sociales 2020 IAB
Estudio anual de redes sociales 2020 IABEstudio anual de redes sociales 2020 IAB
Estudio anual de redes sociales 2020 IABRichard Canabate
 
IAB Estudio Anual de Redes Sociales 2017 #IAB2017
IAB Estudio Anual de Redes Sociales 2017 #IAB2017IAB Estudio Anual de Redes Sociales 2017 #IAB2017
IAB Estudio Anual de Redes Sociales 2017 #IAB2017Gemma Alcalá
 
Estudio Anual de Redes Sociales 2017 en España
Estudio Anual de Redes Sociales 2017 en EspañaEstudio Anual de Redes Sociales 2017 en España
Estudio Anual de Redes Sociales 2017 en EspañaBegoña González Arango
 
Iab estudioredessociales 2017_vreducida
Iab estudioredessociales 2017_vreducidaIab estudioredessociales 2017_vreducida
Iab estudioredessociales 2017_vreducidaSusana Pavón
 
Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)
Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)
Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)Marketing4eCommerce
 
Estudio Redes Sociales 2017
Estudio Redes Sociales 2017Estudio Redes Sociales 2017
Estudio Redes Sociales 2017OptimediaSpain
 
Estudio Redes Sociales en España 2017 (iab)
Estudio Redes Sociales en España 2017 (iab)Estudio Redes Sociales en España 2017 (iab)
Estudio Redes Sociales en España 2017 (iab)Alfredo Vela Zancada
 
Estudio anual de redes sociales 2017 de iabspain
Estudio anual de redes sociales 2017 de iabspainEstudio anual de redes sociales 2017 de iabspain
Estudio anual de redes sociales 2017 de iabspainMaría Tejero Salcedo
 
Estudio redes sociales 2017 iab
Estudio redes sociales 2017 iabEstudio redes sociales 2017 iab
Estudio redes sociales 2017 iabXimo Salas
 
estudio-anual-redes-sociales-2020_vreducida.pdf
estudio-anual-redes-sociales-2020_vreducida.pdfestudio-anual-redes-sociales-2020_vreducida.pdf
estudio-anual-redes-sociales-2020_vreducida.pdfARLETNAOMICRUZARPI
 
Estudio anual-redes-sociales-2020 vreducida (1)
Estudio anual-redes-sociales-2020 vreducida (1)Estudio anual-redes-sociales-2020 vreducida (1)
Estudio anual-redes-sociales-2020 vreducida (1)Susana Pavón
 
Estudio Consumidor Boliviano
Estudio Consumidor BolivianoEstudio Consumidor Boliviano
Estudio Consumidor BolivianoMarcelo Duran
 

Similar a Análisis de patrones de uso de redes sociales y variables socioeconómicas mediante clustering K-Means en 50 ciudades españolas (20)

Estudio IAB de Redes Sociales en España 2020
Estudio IAB de Redes Sociales en España 2020Estudio IAB de Redes Sociales en España 2020
Estudio IAB de Redes Sociales en España 2020
 
Estudio de Redes Sociales 2020 IAB & ELOGIA
Estudio de Redes Sociales 2020 IAB & ELOGIAEstudio de Redes Sociales 2020 IAB & ELOGIA
Estudio de Redes Sociales 2020 IAB & ELOGIA
 
Estudio Anual Redes Sociales 2020 IAB
Estudio Anual Redes Sociales 2020 IABEstudio Anual Redes Sociales 2020 IAB
Estudio Anual Redes Sociales 2020 IAB
 
Estudio anual de redes sociales 2020 IAB
Estudio anual de redes sociales 2020 IABEstudio anual de redes sociales 2020 IAB
Estudio anual de redes sociales 2020 IAB
 
IAB Estudio Anual de Redes Sociales 2017 #IAB2017
IAB Estudio Anual de Redes Sociales 2017 #IAB2017IAB Estudio Anual de Redes Sociales 2017 #IAB2017
IAB Estudio Anual de Redes Sociales 2017 #IAB2017
 
Estudio Anual de Redes Sociales 2017
Estudio Anual de Redes Sociales 2017Estudio Anual de Redes Sociales 2017
Estudio Anual de Redes Sociales 2017
 
Estudio Anual de Redes Sociales 2017 en España
Estudio Anual de Redes Sociales 2017 en EspañaEstudio Anual de Redes Sociales 2017 en España
Estudio Anual de Redes Sociales 2017 en España
 
Iab estudioredessociales 2017_vreducida
Iab estudioredessociales 2017_vreducidaIab estudioredessociales 2017_vreducida
Iab estudioredessociales 2017_vreducida
 
Estudio anual redes sociales 2017 IAB
Estudio anual redes sociales 2017 IABEstudio anual redes sociales 2017 IAB
Estudio anual redes sociales 2017 IAB
 
Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)
Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)
Estudio anual de redes sociales en España 2017 (IAB Spain y Elogia)
 
Estudio Anual Redes Sociales 2017
Estudio Anual Redes Sociales 2017Estudio Anual Redes Sociales 2017
Estudio Anual Redes Sociales 2017
 
Estudio Redes Sociales 2017
Estudio Redes Sociales 2017Estudio Redes Sociales 2017
Estudio Redes Sociales 2017
 
Estudio Anual Redes Sociales 2017. IAB España
Estudio Anual Redes Sociales 2017. IAB EspañaEstudio Anual Redes Sociales 2017. IAB España
Estudio Anual Redes Sociales 2017. IAB España
 
Estudio RRSS 2017
Estudio RRSS 2017Estudio RRSS 2017
Estudio RRSS 2017
 
Estudio Redes Sociales en España 2017 (iab)
Estudio Redes Sociales en España 2017 (iab)Estudio Redes Sociales en España 2017 (iab)
Estudio Redes Sociales en España 2017 (iab)
 
Estudio anual de redes sociales 2017 de iabspain
Estudio anual de redes sociales 2017 de iabspainEstudio anual de redes sociales 2017 de iabspain
Estudio anual de redes sociales 2017 de iabspain
 
Estudio redes sociales 2017 iab
Estudio redes sociales 2017 iabEstudio redes sociales 2017 iab
Estudio redes sociales 2017 iab
 
estudio-anual-redes-sociales-2020_vreducida.pdf
estudio-anual-redes-sociales-2020_vreducida.pdfestudio-anual-redes-sociales-2020_vreducida.pdf
estudio-anual-redes-sociales-2020_vreducida.pdf
 
Estudio anual-redes-sociales-2020 vreducida (1)
Estudio anual-redes-sociales-2020 vreducida (1)Estudio anual-redes-sociales-2020 vreducida (1)
Estudio anual-redes-sociales-2020 vreducida (1)
 
Estudio Consumidor Boliviano
Estudio Consumidor BolivianoEstudio Consumidor Boliviano
Estudio Consumidor Boliviano
 

Último

Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Reducción de la pobreza en Sexenio de AMLO (2018-2024).pdf
Reducción de la pobreza en Sexenio de AMLO (2018-2024).pdfReducción de la pobreza en Sexenio de AMLO (2018-2024).pdf
Reducción de la pobreza en Sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfJC Díaz Herrera
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...JC Díaz Herrera
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 

Último (20)

Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Reducción de la pobreza en Sexenio de AMLO (2018-2024).pdf
Reducción de la pobreza en Sexenio de AMLO (2018-2024).pdfReducción de la pobreza en Sexenio de AMLO (2018-2024).pdf
Reducción de la pobreza en Sexenio de AMLO (2018-2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdf
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 

Análisis de patrones de uso de redes sociales y variables socioeconómicas mediante clustering K-Means en 50 ciudades españolas

  • 3. Objetivo: Mostrar el uso de un modelo de no supervisado, a través del proceso de Clustering, haciendo uso del algoritmo K-Means. Para esta finalidad, vamos a analizar la existencia de patrones mezclando datos de un estudio de uso de redes sociales (https://thesocialmediafamily.com/informe-redes-sociales/#mc_embed_signup_scroll) , con medidas como la tasa de desempleo, Población sedentaria, Salario medio por hora, Parques m2 por habitante, en 50 ciudades españolas (https://www.ine.es/). A partir de las fuentes antes mencionadas, se ha elaborado un dataset con 50 observaciones, el cual tiene las siguientes variables: • Variables obteniedas del estudio de uso de redes sociales  ‘Comunidad’, 'Ciudad', 'Cantidad de perfiles facebook’, 'Usuarios jóvenes (18-39)’, 'Usuarios adultos (40-64)', 'Usuarios mayores (+ 65)', 'Hombres’, 'Mujeres', 'Población’. • Variables obtenidas del INE: 'Tasa desempleo ciudad', '% Población sedentaria’, 'Salario medio por hora', 'Parques m2/hab’. Están expresados porcentualmente. Para que los datos de todas las variables, tengan una escala similar, se indican valores porcentuales en función de la población. Por ejemplo el campo 'Cantidad de perfiles facebook’ indica el porcentaje de usuarios, respecto a la población, para cada ciudad. Es importante comentar que los datos del primer grupo son datos del 2020, y los datos obtenidos del INE son datos, que en su momento reflejaban la realidad del 2017, no obstante nos servirán para mostrar el potencial del proceso de Clustering.
  • 4. Análisis de las medidas estadísticas: • La media de la cantidad de perfiles de facebook ronda alrededor del 70%. • Podemos observar que la desviación de cantidad de perfiles de facebook que tienen las ciudades, es de 24.14 puntos de media. Esto nos indica una alta variabilidad, a diferencia de las otras variables. • El valor mínimo y máximo están bastante alejados. • Podemos destacar también, en base a los cuartiles, que 25 ciudades analizadas tienen un porcentaje de usuarios de facebook inferior al 69,78% y las otras 25 ciudades tienen un porcentaje de usuarios superior al 69,78%. Además 12 ciudades (25%), tienen un porcentaje de usuarios de facebook superior al 89%. • Hay ciudades donde existen personas que tienen más de una cuenta facebook ( > 100% de la población).
  • 5. Distribución de los datos: Se puede observar que, salvo las variables “Usuarios adultos (40-64)” y “Usuarios mayores (+65)”, las variables son más menos uniformes.
  • 6. Análisis de Correlación. Se puede observar que las variables 'Cantidad de perfiles facebook’, 'Usuarios jóvenes (18-39)’, 'Usuarios adultos (40-64)', 'Usuarios mayores (+ 65)', 'Hombres’, 'Mujeres’ están altamente correlacionados. Y era de esperarse, el cálculo de todas ellas, exceptuando la primera, está en función de de la variable ‘'Cantidad de perfiles facebook’. Dada esta correlación, podríamos obviar esta variables en el análisis (exceptuando ‘Cantidad de perfiles facebook’ desde luego). No obstante, como indicaremos más adelante, tanto considerándolas como no, se obtienen resultados muy parecidos.
  • 7. Identificación Nº Clusters Utilizando la Curva Elbow, el número de clusters recomendado es 3. En el gráfico de la derecha, confirmamos ese número con análisis silhouette. Para el caso de 3 Clusters, el score de cada cluster es superior al score promedio, del mismo modo la proporción de los datos es más uniforme.
  • 8. Clusters Se muestra gráficamente los clusters creados para las variables ‘Cantidad de perfiles facebook’, ‘Tasa desempleo ciudad’ , ‘% Población sedentaria’, y ‘Salario medio por hora’
  • 9. Conclusiones: • Se han agrupado las 50 ciudades españolas en 3 grupos o clusters. • Los grupos obedecen a ciudades que tienen altas cantidades de perfiles facebook (96,23%), ciudades con niveles medios (66,42%), y ciudades con cantidades de usuarios inferiores al 50% de su población (42,68%) • De los 3 grupos, destacamos el Cluster 2. • Existe un alto porcentaje de perfiles facebook (96,23%). • En este grupo hay 18 ciudades donde además se observa un alto porcentaje de mujeres que usan facebook, respecto a los hombres (comparado con los demás grupos). • Presenta un porcentaje de usuarios entre 18 y 39 años, así como usuarios entre 40 y 64 años, bastante mayor comparado con los otros grupos. • La tasa de Población sedentaria y tasa de desempleo es superior a los otros Clusters. • Podemos observar además que de las variables obtenidas del INE, la variable ‘% Población sedentaria’ es más significativa que las otras, por tanto podríamos pensar que el nivel de sedentarismo en una ciudad, influye de alguna manera en el uso de la red social facebook. Las ciudades del grupo 2 son: Alicante, Almería, Barcelona, Bilbao, Castellón de la plana, Granada, Huelva, La Coruña, Las Palmas de G.C., Madrid, Málaga, Murcia, Palma, Santa Cruz de Tenerife, Santander, Sevilla, Tarragona y Valencia