SlideShare una empresa de Scribd logo
INICIATIVA BARCELONA OPEN DATA
ESCOLA CIUTADANA DE DADES
Análisis de datos de Redes Sociales
● Obtención de datos a través de API (Twitter,
Facebook)
● Procesamiento de datos 1
● Procesamiento de datos 2
● Análisis de redes sociales
Extracción, procesamiento y visualización
Todos los contenidos del presente módulo
se pueden encontrar en Github.
https://github.com/carlosguadian/Analisis-Da
tos-Redes-Sociales-IBOD
La ciencia de los datos y el científico
El porqué del análisis de datos
La Ciencia de datos es un campo
interdisciplinario que involucra métodos
científicos, procesos y sistemas para
extraer conocimiento o un mejor
entendimiento de datos en sus diferentes
formas, ya sea estructurados o no
estructurados, lo cual es una continuación
de algunos campos de análisis de datos
como la estadística, la minería de datos, el
aprendizaje automático y la analítica
predictiva.
“El Científico de Datos
es un profesional que
combinando conocimientos de
matemáticas, estadística y
programación, se encarga de
analizar los grandes
volúmenes de datos.”
Objetivo
Al término de esta sesión debéis de:
● Tener conocimiento de cómo acceder y
extraer información de las API de TW y FB
● Utilizar herramientas para la consolidación
de datos como Open Refine
● Saber utilizar una hoja de cálculo para
calcular indicadores y generar archivos de
análisis
● Realizar un análisis de redes con Gephi
detectando usuarios relevantes y
sub-comunidades.
Obtención de datos de la API
Twitter y Facebook
● Extraer datos de la API de Twitter
○ Definir una app
○ Uso de R
○ Extracción de datos
● Extraer datos de la API de Facebook
○ Uso de Netvizz
○ Extracción de datos
Materiales disponibles en:
https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IBOD/tr
ee/master/01-datos-api
Objetivo
Al finalizar este módulo deberéis tener un
conocimiento básico del uso de R y RStudio para
poder extraer datos de perfiles de la API de
Twitter
¿Qué experiencia
tenéis en
programación?
Obtención de datos de la API
Twitter
Métodos de acceso a la API
A la API de Twitter se puede acceder
de diferentes maneras. La opción más
habitual es mediante una aplicación,
o mediante un lenguaje de
programación como R, Python, Java...
En nuestro caso lo haremos utilizando
R y RStudio junto con el paquete
TwitteR
Obtención de datos de la API
Twitter
R
R es un lenguaje y un entorno para la informática estadística y
los gráficos.
R proporciona una amplia variedad de modelos estadísticos y
técnicas gráficas, y es muy extensible mediante paquetes.
R está disponible como Software Libre bajo los términos de la
GNU General Public License de la Fundación de Software Libre
en forma de código fuente.
Obtención de datos de la API
Twitter
RStudio
RStudio es un entorno de desarrollo integrado (IDE) para R
(lenguaje de programación) . Incluye una consola, editor de
sintaxis que apoya la ejecución de código, así como
herramientas para el trazado, la depuración y la gestión del
espacio de trabajo.
RStudio está disponible para Windows, Mac y Linux o para
navegadores conectados a RStudio Server o RStudio Server
Pro (Debian / Ubuntu, RedHat / CentOS, y SUSE Linux).
Obtención de datos de la API
Twitter
Paquete TwitteR
TwitteR es un paquete R que proporciona acceso a la API de
Twitter. La mayoría de la funcionalidad de la API se admiten,
con un sesgo hacia las llamadas API que son más útiles en el
análisis de datos en lugar de la interacción diaria.
Ejercicio
Se compone de las siguientes partes:
● Definir una app en Twitter
● Descargar e instalar R y RStudio
● Descargar el archivo twitter-info-perfiles.R
● Completar con los datos de la API
● Seleccionar un usuario con pocos
seguidores y ejecutar el script de
seguidores
● Exportar los datos a un fichero csv
Obtención de datos de la API
Facebook
Netvizz
Es una aplicación que se encuentra en Facebook.
Netvizz es una herramienta que extrae datos de diferentes
secciones de Facebook, en particular grupos y páginas. Las
salidas de archivos se pueden analizar fácilmente en el
software estándar.
Obtención de datos de la API
Facebook
Módulo de datos de página
Este módulo obtiene mensajes (especifique el último n o un
intervalo de fechas) en una página y crea una serie de archivos:
● Un archivo tabular (tsv) que lista una serie de métricas para cada publicación.
● Un archivo tabular (tsv) que lista las estadísticas básicas por día para el período cubierto
por las publicaciones seleccionadas.
● Un archivo tabular (tsv) que enumera el número de usuarios de página por país (sólo para
los 45 principales países).
● Un archivo tabular (tsv) que contiene el texto de los comentarios de los usuarios (usuarios
anónimos).
● Un archivo de gráfico bipartito (gdf) que muestra mensajes, usuarios (anónimos) y
conexiones entre los dos. Un usuario está conectado a un puesto si ha comentado o
reaccionado en él.
Ejercicio
● Seleccionaremos una página, buscaremos
su ID y la introducimos en el formulario
● Recuperar los post publicados entre el 1 y
el 7 de marzo.
● Pedir todos los datos, no sólo los de la
página, también los de los usuarios.
● Comprobar qué tipos de archivo ha
generado.
Procesamiento de datos 1
Open Refine
● Procesamiento de datos
● Instalación de Open Refine
● Uso de GREL para extracción de:
○ Hashtags
○ Url
○ Menciones
Materiales disponibles en:
https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IBOD/tr
ee/master/02-procesamiento-datos%201
Objetivo
Al finalizar este módulo deberéis tener un
conocimiento básico del uso de Open Refine para
consolidar extracción de datos.
¿Encontráis siempre
datasets en perfectas
condiciones para
analizar?
Procesamiento de datos 1
Open Refine
OpenRefine (antes Google Refine) es una poderosa herramienta
para trabajar con datos desordenados: limpiarlo;
Transformándolo de un formato a otro; Y ampliarlo con
servicios web y datos externos.
Desde el 2 de octubre de 2012, Google no está apoyando
activamente este proyecto, que ahora se ha renombrado a
OpenRefine. El desarrollo de proyectos, la documentación y la
promoción están ahora plenamente apoyados por voluntarios.
url: http://openrefine.org/
Procesamiento de datos 1
Open Refine
En nuestro caso tenemos un dataset de tweets, con el que vamos a hacer lo
siguiente:
● Extraer url utilizadas
● Extraer hashtags utilizados
● Extraer menciones utilizadas
Con estos datos adicionales vamos a poder calcular determinar lo más
popular:
● Lo más compartido
● De lo que más se ha hablado
● A quién se ha mencionado más
El fichero resultante nos servirá para calcular diferentes archivos
relacionales para utilizarlos en Gephi
Procesamiento de datos 1
Open Refine
Instalación
Nos bajaremos e instalaremos Open Refine
url: http://openrefine.org/download.html
Ejecución
Al ejecutar Open Refine se abre una pestaña en el navegador,
que es dónde se trabaja.
Datos: Descargar y abrir
Utilizaremos el fichero tweets-opendata.csv
Procesamiento de datos 1
Open Refine
Extracción de URLs
1. Abrir Open Refine
2. Crear un nuevo proyecto importando el csv con los tweets
3. Crear una nueva columna basada en “text” llamada “links”
4. Edit column
5. Add column based on this column
6. Introducir el nombre de la nueva columna
7. Seleccionar como lenguaje GREL
8. En expression introducir lo siguiente:
filter(split(value, " "),v,startsWith(v,"http")).join("||")
Ejercicio
● Repetir la misma operación para extraer
menciones y hashtags del dataset
● Exportar a csv el archivo resultante.
Antes de proceder con los pasos del punto anterior para la
extracción de usuarios (del 3 al 8 adaptando nombres de
columnas), hay que homogeneizar el texto. Es decir, convertir todo
el texto a minúsculas.
Procesamiento de datos 2
Google Sheets
● Cálculo de indicadores de comunidad
○ Ratio de comunidad
○ Actividad media diaria
● Generación de archivos de grafo
○ Menciones, quién ha usado qué hashtags y quién ha
compartido qué urls
Materiales disponibles en:
https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IB
OD/tree/master/03%20procesamiento-datos%202
Objetivo
Al finalizar este módulo deberéis tener un
conocimiento básico del uso de Google Sheets
generando indicadores básicos de comunidad
para Twitter y generar archivos relacionales para
Gephi.
¿Calculáis indicadores
propios? ¿O sólo utilizáis
los proporcionados?
Procesamiento de datos 2
Google Sheets
● Antes de proceder al análisis de datos comprobar la
localización de la página archivo > configuración hoja de
cálculo > locale
● Es importante que la hoja de cálculo tenga la localización
de Estados Unidos.
● Hay diferencia en el carácter que define el decimal en los
números.
● En EEUU es un ., mientras que en el sistema no anglosajón
el decimal es una ,.
● La mayoría de aplicaciones / apis trabajan por defecto con
el . para definir los decimales.
Procesamiento de datos 2
Google Sheets
Ratio de comunidad = seguidos / seguidores
Nos va a servir para poder tener un primer criterio para
determinar la calidad de un usuario.
● Ratio > 1 Si la ratio es superior a uno significa que sigue a
más usuarios que le siguen a él.
● Ratio < 1 Si la ratio es inferior a uno, significa que le siguen
más usuarios que los que él sigue.
Procesamiento de datos 2
Google Sheets
Para la actividad diaria calcularemos la media de tweets por
día para determinar:
● Si es un bot: Un usuario con una media de tweets diaria muy
elevada (por encima de 25 tweets diarios de media hay que
empezar a desconfiar) es muy probable que sea una cuenta
automatizada.
● Si es un usuario que sólo utiliza twitter para informarse, para
leer. No para participar. Estos usuarios tendrán una media
muy baja. Podemos empezar a considerarlos como tales
cuando la media es inferior a 1
Ejercicio
● Para realizar estos cálculos utilizaremos el
archivo de seguidores generado en el primer
módulo con los seguidores de un perfil de
Twitter.
● Abrirlo en un archivo nuevo de Google Sheets
● Generar una columna llamada Ratio
Comunidad y generar la fórmula para dividir
los usuarios seguidos entre los seguidores.
Ejercicio
Para calcular la actividad media diaria de los
usuarios:
1. Convetir la columna “created” en “fecha” y
“hora” mediante un split.
2. Generar una columna nueva con la fecha
actual.
3. Obtener en una nueva columna el total de
días que hace que está activo.
4. Calcular la actividad media diaria.
Procesamiento de datos 2
Google Sheets
Generación de archivos relacionales
Utilizaremos Google Sheets para generar archivos relacionales
para poder utilizarlos en Gephi:
● Archivo de grafo de menciones para poder determinar a los
usuarios clave y determinar sub-comunidades.
● Archivo de grafo de url para ver qué usuarios las han
compartido
● Archivo de grafo de hashtags para determinar cómo se han
utilizado, y cuales han tenido más relevancia.
Ejercicio
1. Importar el archivo resultante del proceso con
Open Refine en un archivo nuevo de Google
Sheets
2. Generar los siguientes archivos de grafo:
a. Menciones entre usuarios
b. Usuarios > hashtags
c. Usuarios > url
3. Exportar los archivos de grafo cada uno a un
archivo .csv
Antes de exportar, recordar borrar las cabeceras de
las columnas, sino al abrirlo en **Gephi**, éste
considerará que los nombres de las columnas
también son nodos relacionados.
Análisis de Redes Sociales
Gephi
Análisis de Redes Sociales
● Conceptos Básicos sobre Teoría de Grafos y el
análisis de Redes
● Uso de Gephi para el cálculo de medidas de
centralidad y detección de subcomunidades
Materiales disponibles en:
https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IB
OD/tree/master/04%20analisis-redes-sociales
Objetivo
El objetivo de este módulo es tener el
conocimiento básico de uso de Gephi para
procesar un archivo de grafo, poder determinar
los nodos relevantes en base a medidas de
centralidad y el cálculo de subcomunidades.
¿Qué podemos analizar
con #ARS?
Procesamiento de datos 2
Conceptos básicos análisis de redes
Análisis de Redes
● Es el área encargada de analizar las redes mediante la
teoría de redes
● Las redes pueden ser de diversos tipos: social, transporte,
biológica, internet, información, etc.
● El estudio se centra en la asociación y medida de las
relaciones y flujos entre las personas, grupos,
organizaciones, computadoras, sitios web...
● Los nodos en la red, en este caso, son personas y grupos
mientras que los enlaces muestran relaciones o flujos entre
los nodos.
Procesamiento de datos 2
Conceptos básicos análisis de redes
Nodos y Aristas
● Nodo: Representa cada uno de los
elementos relacionados que vamos a
analizar. Si analizamos una conversación
de Twitter, los nodos son los usuarios.
● Arista: Representa la relación entre dos
nodos. Por ejemplo en la conversación de
Twitter, esta puede ser representada por
RT o menciones entre usuarios. El grosor
de las aristas nos mostrará la intensidad
con la que se ha producido.
Procesamiento de datos 2
Conceptos básicos análisis de redes
Comunidades
● Saber cómo se han relacionado los nodos
en el grafo analizado, nos puede aportar
una visión clara de lo que ha sucedido.
● En función de la intensidad de las
relaciones y de la cercanía con otros
nodos se puede determinar que
sub-comunidades se han generado.
● Mediante la visualización se puede
determinar si una conversación ha estado
muy polarizada.
Procesamiento de datos 2
Conceptos básicos análisis de redes
Tipos de grafo
● Por el tipo de relación: Encontramos dos tipos de grafo
en función de si las relaciones son direccionales o no.
Por lo tanto hay dirigidos y no dirigidos.
● Si hay uno o más tipos de nodos: En el caso de analizar
sólo las menciones entre usuarios, tenemos un sólo tipo
de nodos. En el caso de analizar cómo han utilizado los
hashtags los usuarios, nos encontramos ante un grafo
bipartito.
Procesamiento de datos 2
Conceptos básicos análisis de redes
Medidas de centralidad
Hay cuatro medidas de centralidad ampliamente utilizadas:
● La centralidad de grado («degree centrality»): Tiene en
cuenta el número de relaciones entre los nodos.
● La cercanía («closeness») Tiene en cuenta la distancia de un
nodo respecto del resto de los componentes del grafo.
● La intermediación («betweenness») Determina qué usuarios
son esenciales en la unión entre diferentes grupos del grafo.
● La centralidad de vector propio («eigenvector centrality»)
Nos muestra qué nodos son los más relevantes.
Procesamiento de datos 2
Gephi
● Es software open-source de análisis de redes y
visualización Permite analizar y visualizar archivos
de grafo.
● Permite trabajar con diferentes tipos de archivos
de grafo; .graphml, .gexf, .gdf, .gephi... E importar
datos desde archivos .csv tanto para la generación
de nodos, como la de aristas.
● Gephi ha sido utilizado en proyectos de
académicos de investigación, periodismo y en otro
lugares,
● Gephi es la herramienta que utilizaremos para
realizar el análisis de redes.
● Descargar Gephi e instalarlo
● Abrir Gephi y el csv generado en el módulo
anterior con las menciones Archivo > Abrir
● Aplicar el layout Force Atlas 2
● En Estadísticas calcular la centralidad de vector
propio y la modularidad
● Aplicar formato a los nodos. Para el tamaño
utilizaremos la medida de centralidad
Eigenvector. Para el color utilizaremos el valor
Modularity Class
● Ir a previsualización
● Exportar archivo
Ejercicio

Más contenido relacionado

La actualidad más candente

Ejercicios pilas y_colas
Ejercicios pilas y_colasEjercicios pilas y_colas
Ejercicios pilas y_colaskelvinst
 
Diseño de Entradas
Diseño de EntradasDiseño de Entradas
Diseño de Entradas
JHector Bl
 
Estructura de Datos: Lista
Estructura de Datos: ListaEstructura de Datos: Lista
Estructura de Datos: Lista
Emerson Garay
 
Herramientas para llevar a cabo un Sistema de Información
Herramientas para llevar a cabo un Sistema de InformaciónHerramientas para llevar a cabo un Sistema de Información
Herramientas para llevar a cabo un Sistema de Información
jgbd127
 
Áreas de auditoría en informática
Áreas de auditoría en informáticaÁreas de auditoría en informática
Áreas de auditoría en informática
knmp86
 
Metodo de ordenacion por Insercion
 Metodo de ordenacion por Insercion Metodo de ordenacion por Insercion
Metodo de ordenacion por InsercionMateo Falcon
 
1 - Modelo Entidad Relacion
1 - Modelo Entidad Relacion1 - Modelo Entidad Relacion
1 - Modelo Entidad Relacion
JuGGaLoFX
 
Estrategias o métodos para el desarrollo de sistemas
Estrategias o métodos para el desarrollo de sistemasEstrategias o métodos para el desarrollo de sistemas
Estrategias o métodos para el desarrollo de sistemas
maricelaguilar
 
Trabajo final de sistemologia con correciones
Trabajo final de sistemologia con correcionesTrabajo final de sistemologia con correciones
Trabajo final de sistemologia con correciones
Andres Carlos
 
proyecto conexion netbeans con Mysql
proyecto conexion netbeans con Mysqlproyecto conexion netbeans con Mysql
proyecto conexion netbeans con Mysql
BrenditaLr
 
DB1 Unidad 9: Concurrencia
DB1 Unidad 9: ConcurrenciaDB1 Unidad 9: Concurrencia
DB1 Unidad 9: Concurrencia
Franklin Parrales Bravo
 
Analisis y diseño de sistemas de información clase 2
Analisis y diseño de sistemas de información clase 2Analisis y diseño de sistemas de información clase 2
Analisis y diseño de sistemas de información clase 2Sebas Castro
 
Modelado funcional casos de uso
Modelado funcional casos de usoModelado funcional casos de uso
Modelado funcional casos de uso
Robert Rodriguez
 
Bases de datos y sistemas de informacion
Bases de datos y sistemas de informacionBases de datos y sistemas de informacion
Bases de datos y sistemas de informacion
Arizay Carrillo Carrascal
 
13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...
13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...
13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...
Uriel Herrera
 
Del Modelo Entidad-Relación al Modelo relacional
Del Modelo Entidad-Relación al Modelo relacionalDel Modelo Entidad-Relación al Modelo relacional
Del Modelo Entidad-Relación al Modelo relacional
Luis Eduardo Pelaez Valencia
 
Diseño de un Sistema de Informacion
Diseño de un Sistema de InformacionDiseño de un Sistema de Informacion
Diseño de un Sistema de Informacion
josue salas
 
2-3-mapas-conceptuales.pdf
2-3-mapas-conceptuales.pdf2-3-mapas-conceptuales.pdf
2-3-mapas-conceptuales.pdf
Ram Vazquez
 

La actualidad más candente (20)

Ejercicios pilas y_colas
Ejercicios pilas y_colasEjercicios pilas y_colas
Ejercicios pilas y_colas
 
Diseño de Entradas
Diseño de EntradasDiseño de Entradas
Diseño de Entradas
 
Modelo cmmi
Modelo cmmiModelo cmmi
Modelo cmmi
 
Estructura de Datos: Lista
Estructura de Datos: ListaEstructura de Datos: Lista
Estructura de Datos: Lista
 
Herramientas para llevar a cabo un Sistema de Información
Herramientas para llevar a cabo un Sistema de InformaciónHerramientas para llevar a cabo un Sistema de Información
Herramientas para llevar a cabo un Sistema de Información
 
Áreas de auditoría en informática
Áreas de auditoría en informáticaÁreas de auditoría en informática
Áreas de auditoría en informática
 
Metodo de ordenacion por Insercion
 Metodo de ordenacion por Insercion Metodo de ordenacion por Insercion
Metodo de ordenacion por Insercion
 
1 - Modelo Entidad Relacion
1 - Modelo Entidad Relacion1 - Modelo Entidad Relacion
1 - Modelo Entidad Relacion
 
Estrategias o métodos para el desarrollo de sistemas
Estrategias o métodos para el desarrollo de sistemasEstrategias o métodos para el desarrollo de sistemas
Estrategias o métodos para el desarrollo de sistemas
 
Trabajo final de sistemologia con correciones
Trabajo final de sistemologia con correcionesTrabajo final de sistemologia con correciones
Trabajo final de sistemologia con correciones
 
proyecto conexion netbeans con Mysql
proyecto conexion netbeans con Mysqlproyecto conexion netbeans con Mysql
proyecto conexion netbeans con Mysql
 
DB1 Unidad 9: Concurrencia
DB1 Unidad 9: ConcurrenciaDB1 Unidad 9: Concurrencia
DB1 Unidad 9: Concurrencia
 
Analisis y diseño de sistemas de información clase 2
Analisis y diseño de sistemas de información clase 2Analisis y diseño de sistemas de información clase 2
Analisis y diseño de sistemas de información clase 2
 
Modelado funcional casos de uso
Modelado funcional casos de usoModelado funcional casos de uso
Modelado funcional casos de uso
 
Quick Sort
Quick SortQuick Sort
Quick Sort
 
Bases de datos y sistemas de informacion
Bases de datos y sistemas de informacionBases de datos y sistemas de informacion
Bases de datos y sistemas de informacion
 
13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...
13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...
13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...
 
Del Modelo Entidad-Relación al Modelo relacional
Del Modelo Entidad-Relación al Modelo relacionalDel Modelo Entidad-Relación al Modelo relacional
Del Modelo Entidad-Relación al Modelo relacional
 
Diseño de un Sistema de Informacion
Diseño de un Sistema de InformacionDiseño de un Sistema de Informacion
Diseño de un Sistema de Informacion
 
2-3-mapas-conceptuales.pdf
2-3-mapas-conceptuales.pdf2-3-mapas-conceptuales.pdf
2-3-mapas-conceptuales.pdf
 

Similar a Curs 2.7. Análisis de datos de redes sociales

Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
andresedogonzalez
 
Análisis y procesamiento de datos para descubrir conocimiento
Análisis y procesamiento de datos para descubrir conocimientoAnálisis y procesamiento de datos para descubrir conocimiento
Análisis y procesamiento de datos para descubrir conocimiento
Alex Rayón Jerez
 
Auditoria Administrativa 1
Auditoria Administrativa 1Auditoria Administrativa 1
Auditoria Administrativa 1
darusb
 
Project Clase 1 Introduccion
Project Clase 1 IntroduccionProject Clase 1 Introduccion
Project Clase 1 Introducciondarusb
 
Python - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de DatosPython - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de Datos
Roman Herrera
 
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
DEMSSHILLLEONELCOUTI
 
TICS
TICSTICS
Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Jio Nox
 
Departamento de tecnología e informática.pdf
Departamento de tecnología e informática.pdfDepartamento de tecnología e informática.pdf
Departamento de tecnología e informática.pdf
AnnaSofaMoraEsquivel
 
Herramientas de internet
Herramientas de internetHerramientas de internet
Herramientas de internet
JairoGaray
 
EasyData: OpenData and easy access
EasyData: OpenData and easy accessEasyData: OpenData and easy access
EasyData: OpenData and easy access
Juan Vazquez Murga
 
Guía Redes e Internet parte 5.pdf
Guía Redes e Internet parte 5.pdfGuía Redes e Internet parte 5.pdf
Guía Redes e Internet parte 5.pdf
AlbertoAndresMosquer
 
Formato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jisFormato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jis
Javier Correa
 
Formato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jisFormato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jis
Javier Correa
 
CMS - Metodología de trabajo EMEPE
CMS - Metodología de trabajo EMEPECMS - Metodología de trabajo EMEPE
CMS - Metodología de trabajo EMEPE
Fernando Feller
 
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasDesarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Guillermo Álvaro Rey
 
Software Libre-2023 PRESENTACIÓN SISTEMAS.pptx
Software Libre-2023 PRESENTACIÓN SISTEMAS.pptxSoftware Libre-2023 PRESENTACIÓN SISTEMAS.pptx
Software Libre-2023 PRESENTACIÓN SISTEMAS.pptx
janicemamani2019
 
Definiciones básicas-de-spss2
Definiciones básicas-de-spss2Definiciones básicas-de-spss2
Definiciones básicas-de-spss2
Christian401
 
Formato espacio de aprendizaje u2 ea2
Formato espacio de aprendizaje u2 ea2Formato espacio de aprendizaje u2 ea2
Formato espacio de aprendizaje u2 ea2
Javier Correa
 

Similar a Curs 2.7. Análisis de datos de redes sociales (20)

Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
 
Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
 
Análisis y procesamiento de datos para descubrir conocimiento
Análisis y procesamiento de datos para descubrir conocimientoAnálisis y procesamiento de datos para descubrir conocimiento
Análisis y procesamiento de datos para descubrir conocimiento
 
Auditoria Administrativa 1
Auditoria Administrativa 1Auditoria Administrativa 1
Auditoria Administrativa 1
 
Project Clase 1 Introduccion
Project Clase 1 IntroduccionProject Clase 1 Introduccion
Project Clase 1 Introduccion
 
Python - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de DatosPython - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de Datos
 
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
 
TICS
TICSTICS
TICS
 
Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Minería de datos (práctica twitter)
Minería de datos (práctica twitter)
 
Departamento de tecnología e informática.pdf
Departamento de tecnología e informática.pdfDepartamento de tecnología e informática.pdf
Departamento de tecnología e informática.pdf
 
Herramientas de internet
Herramientas de internetHerramientas de internet
Herramientas de internet
 
EasyData: OpenData and easy access
EasyData: OpenData and easy accessEasyData: OpenData and easy access
EasyData: OpenData and easy access
 
Guía Redes e Internet parte 5.pdf
Guía Redes e Internet parte 5.pdfGuía Redes e Internet parte 5.pdf
Guía Redes e Internet parte 5.pdf
 
Formato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jisFormato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jis
 
Formato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jisFormato espacio de aprendizaje u2 ea2 jis
Formato espacio de aprendizaje u2 ea2 jis
 
CMS - Metodología de trabajo EMEPE
CMS - Metodología de trabajo EMEPECMS - Metodología de trabajo EMEPE
CMS - Metodología de trabajo EMEPE
 
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasDesarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
 
Software Libre-2023 PRESENTACIÓN SISTEMAS.pptx
Software Libre-2023 PRESENTACIÓN SISTEMAS.pptxSoftware Libre-2023 PRESENTACIÓN SISTEMAS.pptx
Software Libre-2023 PRESENTACIÓN SISTEMAS.pptx
 
Definiciones básicas-de-spss2
Definiciones básicas-de-spss2Definiciones básicas-de-spss2
Definiciones básicas-de-spss2
 
Formato espacio de aprendizaje u2 ea2
Formato espacio de aprendizaje u2 ea2Formato espacio de aprendizaje u2 ea2
Formato espacio de aprendizaje u2 ea2
 

Más de Iniciativa Barcelona Open Data

Presentació Programa Acadèmic FormacióxDonesxBarris
Presentació Programa Acadèmic FormacióxDonesxBarrisPresentació Programa Acadèmic FormacióxDonesxBarris
Presentació Programa Acadèmic FormacióxDonesxBarris
Iniciativa Barcelona Open Data
 
Programa Acadèmic FormacióxDonesxBarris
Programa Acadèmic FormacióxDonesxBarrisPrograma Acadèmic FormacióxDonesxBarris
Programa Acadèmic FormacióxDonesxBarris
Iniciativa Barcelona Open Data
 
Presentacions DATAVIZ La tecnòloga .pdf
Presentacions DATAVIZ La tecnòloga .pdfPresentacions DATAVIZ La tecnòloga .pdf
Presentacions DATAVIZ La tecnòloga .pdf
Iniciativa Barcelona Open Data
 
Datos x Comercio
Datos x ComercioDatos x Comercio
OpenDataDay2022_IgnasiServià
OpenDataDay2022_IgnasiServiàOpenDataDay2022_IgnasiServià
OpenDataDay2022_IgnasiServià
Iniciativa Barcelona Open Data
 
OpenDataDay2022_SusanaGil
OpenDataDay2022_SusanaGilOpenDataDay2022_SusanaGil
OpenDataDay2022_SusanaGil
Iniciativa Barcelona Open Data
 
OpenDataDay2022_KarmaPeiro
OpenDataDay2022_KarmaPeiroOpenDataDay2022_KarmaPeiro
OpenDataDay2022_KarmaPeiro
Iniciativa Barcelona Open Data
 
OpenDataDay2022_OriolRoselló
OpenDataDay2022_OriolRosellóOpenDataDay2022_OriolRoselló
OpenDataDay2022_OriolRoselló
Iniciativa Barcelona Open Data
 
OpenDataDay2022_PepBudi
OpenDataDay2022_PepBudiOpenDataDay2022_PepBudi
OpenDataDay2022_PepBudi
Iniciativa Barcelona Open Data
 
OpenDataDay2022_XescaSerra
OpenDataDay2022_XescaSerraOpenDataDay2022_XescaSerra
OpenDataDay2022_XescaSerra
Iniciativa Barcelona Open Data
 
Presentació projecte Dades x Comerç
Presentació projecte Dades x ComerçPresentació projecte Dades x Comerç
Presentació projecte Dades x Comerç
Iniciativa Barcelona Open Data
 
Roberto Fraile - Proyecto LORD
Roberto Fraile - Proyecto LORDRoberto Fraile - Proyecto LORD
Roberto Fraile - Proyecto LORD
Iniciativa Barcelona Open Data
 
Maria Quiles - Inteligencia Artificial Industrial
Maria Quiles - Inteligencia Artificial IndustrialMaria Quiles - Inteligencia Artificial Industrial
Maria Quiles - Inteligencia Artificial Industrial
Iniciativa Barcelona Open Data
 
Pol Colomer - Caso de uso Reby
Pol Colomer - Caso de uso RebyPol Colomer - Caso de uso Reby
Pol Colomer - Caso de uso Reby
Iniciativa Barcelona Open Data
 
Juantomás - Unir PDP en Inteligencia Artificial 2020
Juantomás - Unir PDP en Inteligencia Artificial 2020Juantomás - Unir PDP en Inteligencia Artificial 2020
Juantomás - Unir PDP en Inteligencia Artificial 2020
Iniciativa Barcelona Open Data
 
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_scLourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
Iniciativa Barcelona Open Data
 
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
Iniciativa Barcelona Open Data
 
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro LlorenteWorkshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
Iniciativa Barcelona Open Data
 
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
Iniciativa Barcelona Open Data
 
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecteJornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
Iniciativa Barcelona Open Data
 

Más de Iniciativa Barcelona Open Data (20)

Presentació Programa Acadèmic FormacióxDonesxBarris
Presentació Programa Acadèmic FormacióxDonesxBarrisPresentació Programa Acadèmic FormacióxDonesxBarris
Presentació Programa Acadèmic FormacióxDonesxBarris
 
Programa Acadèmic FormacióxDonesxBarris
Programa Acadèmic FormacióxDonesxBarrisPrograma Acadèmic FormacióxDonesxBarris
Programa Acadèmic FormacióxDonesxBarris
 
Presentacions DATAVIZ La tecnòloga .pdf
Presentacions DATAVIZ La tecnòloga .pdfPresentacions DATAVIZ La tecnòloga .pdf
Presentacions DATAVIZ La tecnòloga .pdf
 
Datos x Comercio
Datos x ComercioDatos x Comercio
Datos x Comercio
 
OpenDataDay2022_IgnasiServià
OpenDataDay2022_IgnasiServiàOpenDataDay2022_IgnasiServià
OpenDataDay2022_IgnasiServià
 
OpenDataDay2022_SusanaGil
OpenDataDay2022_SusanaGilOpenDataDay2022_SusanaGil
OpenDataDay2022_SusanaGil
 
OpenDataDay2022_KarmaPeiro
OpenDataDay2022_KarmaPeiroOpenDataDay2022_KarmaPeiro
OpenDataDay2022_KarmaPeiro
 
OpenDataDay2022_OriolRoselló
OpenDataDay2022_OriolRosellóOpenDataDay2022_OriolRoselló
OpenDataDay2022_OriolRoselló
 
OpenDataDay2022_PepBudi
OpenDataDay2022_PepBudiOpenDataDay2022_PepBudi
OpenDataDay2022_PepBudi
 
OpenDataDay2022_XescaSerra
OpenDataDay2022_XescaSerraOpenDataDay2022_XescaSerra
OpenDataDay2022_XescaSerra
 
Presentació projecte Dades x Comerç
Presentació projecte Dades x ComerçPresentació projecte Dades x Comerç
Presentació projecte Dades x Comerç
 
Roberto Fraile - Proyecto LORD
Roberto Fraile - Proyecto LORDRoberto Fraile - Proyecto LORD
Roberto Fraile - Proyecto LORD
 
Maria Quiles - Inteligencia Artificial Industrial
Maria Quiles - Inteligencia Artificial IndustrialMaria Quiles - Inteligencia Artificial Industrial
Maria Quiles - Inteligencia Artificial Industrial
 
Pol Colomer - Caso de uso Reby
Pol Colomer - Caso de uso RebyPol Colomer - Caso de uso Reby
Pol Colomer - Caso de uso Reby
 
Juantomás - Unir PDP en Inteligencia Artificial 2020
Juantomás - Unir PDP en Inteligencia Artificial 2020Juantomás - Unir PDP en Inteligencia Artificial 2020
Juantomás - Unir PDP en Inteligencia Artificial 2020
 
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_scLourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
 
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
 
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro LlorenteWorkshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
 
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
 
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecteJornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
 

Último

3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
nahumrondanurbano
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Emisor Digital
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
mvargasleveau
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
SantiagoMejia99
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
ManuelaReina3
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
JC Díaz Herrera
 
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdfMINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
RicardoNacevilla1
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
DieguinhoSalazar
 
Instituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdfInstituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdf
JC Díaz Herrera
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
JosMuoz943377
 
PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.
MELANYANELKACRUZLEON
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
Emisor Digital
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
IrapuatoCmovamos
 
mapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundariamapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundaria
ManuelAlbertoHeredia1
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
MelanieYuksselleCarr
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
brayansangar73
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
diegozuniga768
 

Último (19)

3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
 
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdfMINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
 
Instituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdfInstituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdf
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
 
PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
 
mapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundariamapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundaria
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
 

Curs 2.7. Análisis de datos de redes sociales

  • 1. INICIATIVA BARCELONA OPEN DATA ESCOLA CIUTADANA DE DADES
  • 2. Análisis de datos de Redes Sociales ● Obtención de datos a través de API (Twitter, Facebook) ● Procesamiento de datos 1 ● Procesamiento de datos 2 ● Análisis de redes sociales Extracción, procesamiento y visualización
  • 3. Todos los contenidos del presente módulo se pueden encontrar en Github. https://github.com/carlosguadian/Analisis-Da tos-Redes-Sociales-IBOD
  • 4. La ciencia de los datos y el científico El porqué del análisis de datos La Ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva. “El Científico de Datos es un profesional que combinando conocimientos de matemáticas, estadística y programación, se encarga de analizar los grandes volúmenes de datos.”
  • 5. Objetivo Al término de esta sesión debéis de: ● Tener conocimiento de cómo acceder y extraer información de las API de TW y FB ● Utilizar herramientas para la consolidación de datos como Open Refine ● Saber utilizar una hoja de cálculo para calcular indicadores y generar archivos de análisis ● Realizar un análisis de redes con Gephi detectando usuarios relevantes y sub-comunidades.
  • 6. Obtención de datos de la API Twitter y Facebook ● Extraer datos de la API de Twitter ○ Definir una app ○ Uso de R ○ Extracción de datos ● Extraer datos de la API de Facebook ○ Uso de Netvizz ○ Extracción de datos Materiales disponibles en: https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IBOD/tr ee/master/01-datos-api
  • 7. Objetivo Al finalizar este módulo deberéis tener un conocimiento básico del uso de R y RStudio para poder extraer datos de perfiles de la API de Twitter
  • 9. Obtención de datos de la API Twitter Métodos de acceso a la API A la API de Twitter se puede acceder de diferentes maneras. La opción más habitual es mediante una aplicación, o mediante un lenguaje de programación como R, Python, Java... En nuestro caso lo haremos utilizando R y RStudio junto con el paquete TwitteR
  • 10. Obtención de datos de la API Twitter R R es un lenguaje y un entorno para la informática estadística y los gráficos. R proporciona una amplia variedad de modelos estadísticos y técnicas gráficas, y es muy extensible mediante paquetes. R está disponible como Software Libre bajo los términos de la GNU General Public License de la Fundación de Software Libre en forma de código fuente.
  • 11. Obtención de datos de la API Twitter RStudio RStudio es un entorno de desarrollo integrado (IDE) para R (lenguaje de programación) . Incluye una consola, editor de sintaxis que apoya la ejecución de código, así como herramientas para el trazado, la depuración y la gestión del espacio de trabajo. RStudio está disponible para Windows, Mac y Linux o para navegadores conectados a RStudio Server o RStudio Server Pro (Debian / Ubuntu, RedHat / CentOS, y SUSE Linux).
  • 12. Obtención de datos de la API Twitter Paquete TwitteR TwitteR es un paquete R que proporciona acceso a la API de Twitter. La mayoría de la funcionalidad de la API se admiten, con un sesgo hacia las llamadas API que son más útiles en el análisis de datos en lugar de la interacción diaria.
  • 13. Ejercicio Se compone de las siguientes partes: ● Definir una app en Twitter ● Descargar e instalar R y RStudio ● Descargar el archivo twitter-info-perfiles.R ● Completar con los datos de la API ● Seleccionar un usuario con pocos seguidores y ejecutar el script de seguidores ● Exportar los datos a un fichero csv
  • 14. Obtención de datos de la API Facebook Netvizz Es una aplicación que se encuentra en Facebook. Netvizz es una herramienta que extrae datos de diferentes secciones de Facebook, en particular grupos y páginas. Las salidas de archivos se pueden analizar fácilmente en el software estándar.
  • 15. Obtención de datos de la API Facebook Módulo de datos de página Este módulo obtiene mensajes (especifique el último n o un intervalo de fechas) en una página y crea una serie de archivos: ● Un archivo tabular (tsv) que lista una serie de métricas para cada publicación. ● Un archivo tabular (tsv) que lista las estadísticas básicas por día para el período cubierto por las publicaciones seleccionadas. ● Un archivo tabular (tsv) que enumera el número de usuarios de página por país (sólo para los 45 principales países). ● Un archivo tabular (tsv) que contiene el texto de los comentarios de los usuarios (usuarios anónimos). ● Un archivo de gráfico bipartito (gdf) que muestra mensajes, usuarios (anónimos) y conexiones entre los dos. Un usuario está conectado a un puesto si ha comentado o reaccionado en él.
  • 16. Ejercicio ● Seleccionaremos una página, buscaremos su ID y la introducimos en el formulario ● Recuperar los post publicados entre el 1 y el 7 de marzo. ● Pedir todos los datos, no sólo los de la página, también los de los usuarios. ● Comprobar qué tipos de archivo ha generado.
  • 17. Procesamiento de datos 1 Open Refine ● Procesamiento de datos ● Instalación de Open Refine ● Uso de GREL para extracción de: ○ Hashtags ○ Url ○ Menciones Materiales disponibles en: https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IBOD/tr ee/master/02-procesamiento-datos%201
  • 18. Objetivo Al finalizar este módulo deberéis tener un conocimiento básico del uso de Open Refine para consolidar extracción de datos.
  • 19. ¿Encontráis siempre datasets en perfectas condiciones para analizar?
  • 20. Procesamiento de datos 1 Open Refine OpenRefine (antes Google Refine) es una poderosa herramienta para trabajar con datos desordenados: limpiarlo; Transformándolo de un formato a otro; Y ampliarlo con servicios web y datos externos. Desde el 2 de octubre de 2012, Google no está apoyando activamente este proyecto, que ahora se ha renombrado a OpenRefine. El desarrollo de proyectos, la documentación y la promoción están ahora plenamente apoyados por voluntarios. url: http://openrefine.org/
  • 21. Procesamiento de datos 1 Open Refine En nuestro caso tenemos un dataset de tweets, con el que vamos a hacer lo siguiente: ● Extraer url utilizadas ● Extraer hashtags utilizados ● Extraer menciones utilizadas Con estos datos adicionales vamos a poder calcular determinar lo más popular: ● Lo más compartido ● De lo que más se ha hablado ● A quién se ha mencionado más El fichero resultante nos servirá para calcular diferentes archivos relacionales para utilizarlos en Gephi
  • 22. Procesamiento de datos 1 Open Refine Instalación Nos bajaremos e instalaremos Open Refine url: http://openrefine.org/download.html Ejecución Al ejecutar Open Refine se abre una pestaña en el navegador, que es dónde se trabaja. Datos: Descargar y abrir Utilizaremos el fichero tweets-opendata.csv
  • 23. Procesamiento de datos 1 Open Refine Extracción de URLs 1. Abrir Open Refine 2. Crear un nuevo proyecto importando el csv con los tweets 3. Crear una nueva columna basada en “text” llamada “links” 4. Edit column 5. Add column based on this column 6. Introducir el nombre de la nueva columna 7. Seleccionar como lenguaje GREL 8. En expression introducir lo siguiente: filter(split(value, " "),v,startsWith(v,"http")).join("||")
  • 24. Ejercicio ● Repetir la misma operación para extraer menciones y hashtags del dataset ● Exportar a csv el archivo resultante. Antes de proceder con los pasos del punto anterior para la extracción de usuarios (del 3 al 8 adaptando nombres de columnas), hay que homogeneizar el texto. Es decir, convertir todo el texto a minúsculas.
  • 25. Procesamiento de datos 2 Google Sheets ● Cálculo de indicadores de comunidad ○ Ratio de comunidad ○ Actividad media diaria ● Generación de archivos de grafo ○ Menciones, quién ha usado qué hashtags y quién ha compartido qué urls Materiales disponibles en: https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IB OD/tree/master/03%20procesamiento-datos%202
  • 26. Objetivo Al finalizar este módulo deberéis tener un conocimiento básico del uso de Google Sheets generando indicadores básicos de comunidad para Twitter y generar archivos relacionales para Gephi.
  • 27. ¿Calculáis indicadores propios? ¿O sólo utilizáis los proporcionados?
  • 28. Procesamiento de datos 2 Google Sheets ● Antes de proceder al análisis de datos comprobar la localización de la página archivo > configuración hoja de cálculo > locale ● Es importante que la hoja de cálculo tenga la localización de Estados Unidos. ● Hay diferencia en el carácter que define el decimal en los números. ● En EEUU es un ., mientras que en el sistema no anglosajón el decimal es una ,. ● La mayoría de aplicaciones / apis trabajan por defecto con el . para definir los decimales.
  • 29. Procesamiento de datos 2 Google Sheets Ratio de comunidad = seguidos / seguidores Nos va a servir para poder tener un primer criterio para determinar la calidad de un usuario. ● Ratio > 1 Si la ratio es superior a uno significa que sigue a más usuarios que le siguen a él. ● Ratio < 1 Si la ratio es inferior a uno, significa que le siguen más usuarios que los que él sigue.
  • 30. Procesamiento de datos 2 Google Sheets Para la actividad diaria calcularemos la media de tweets por día para determinar: ● Si es un bot: Un usuario con una media de tweets diaria muy elevada (por encima de 25 tweets diarios de media hay que empezar a desconfiar) es muy probable que sea una cuenta automatizada. ● Si es un usuario que sólo utiliza twitter para informarse, para leer. No para participar. Estos usuarios tendrán una media muy baja. Podemos empezar a considerarlos como tales cuando la media es inferior a 1
  • 31. Ejercicio ● Para realizar estos cálculos utilizaremos el archivo de seguidores generado en el primer módulo con los seguidores de un perfil de Twitter. ● Abrirlo en un archivo nuevo de Google Sheets ● Generar una columna llamada Ratio Comunidad y generar la fórmula para dividir los usuarios seguidos entre los seguidores.
  • 32. Ejercicio Para calcular la actividad media diaria de los usuarios: 1. Convetir la columna “created” en “fecha” y “hora” mediante un split. 2. Generar una columna nueva con la fecha actual. 3. Obtener en una nueva columna el total de días que hace que está activo. 4. Calcular la actividad media diaria.
  • 33. Procesamiento de datos 2 Google Sheets Generación de archivos relacionales Utilizaremos Google Sheets para generar archivos relacionales para poder utilizarlos en Gephi: ● Archivo de grafo de menciones para poder determinar a los usuarios clave y determinar sub-comunidades. ● Archivo de grafo de url para ver qué usuarios las han compartido ● Archivo de grafo de hashtags para determinar cómo se han utilizado, y cuales han tenido más relevancia.
  • 34.
  • 35. Ejercicio 1. Importar el archivo resultante del proceso con Open Refine en un archivo nuevo de Google Sheets 2. Generar los siguientes archivos de grafo: a. Menciones entre usuarios b. Usuarios > hashtags c. Usuarios > url 3. Exportar los archivos de grafo cada uno a un archivo .csv Antes de exportar, recordar borrar las cabeceras de las columnas, sino al abrirlo en **Gephi**, éste considerará que los nombres de las columnas también son nodos relacionados.
  • 36. Análisis de Redes Sociales Gephi Análisis de Redes Sociales ● Conceptos Básicos sobre Teoría de Grafos y el análisis de Redes ● Uso de Gephi para el cálculo de medidas de centralidad y detección de subcomunidades Materiales disponibles en: https://github.com/carlosguadian/Analisis-Datos-Redes-Sociales-IB OD/tree/master/04%20analisis-redes-sociales
  • 37. Objetivo El objetivo de este módulo es tener el conocimiento básico de uso de Gephi para procesar un archivo de grafo, poder determinar los nodos relevantes en base a medidas de centralidad y el cálculo de subcomunidades.
  • 39. Procesamiento de datos 2 Conceptos básicos análisis de redes Análisis de Redes ● Es el área encargada de analizar las redes mediante la teoría de redes ● Las redes pueden ser de diversos tipos: social, transporte, biológica, internet, información, etc. ● El estudio se centra en la asociación y medida de las relaciones y flujos entre las personas, grupos, organizaciones, computadoras, sitios web... ● Los nodos en la red, en este caso, son personas y grupos mientras que los enlaces muestran relaciones o flujos entre los nodos.
  • 40. Procesamiento de datos 2 Conceptos básicos análisis de redes Nodos y Aristas ● Nodo: Representa cada uno de los elementos relacionados que vamos a analizar. Si analizamos una conversación de Twitter, los nodos son los usuarios. ● Arista: Representa la relación entre dos nodos. Por ejemplo en la conversación de Twitter, esta puede ser representada por RT o menciones entre usuarios. El grosor de las aristas nos mostrará la intensidad con la que se ha producido.
  • 41. Procesamiento de datos 2 Conceptos básicos análisis de redes Comunidades ● Saber cómo se han relacionado los nodos en el grafo analizado, nos puede aportar una visión clara de lo que ha sucedido. ● En función de la intensidad de las relaciones y de la cercanía con otros nodos se puede determinar que sub-comunidades se han generado. ● Mediante la visualización se puede determinar si una conversación ha estado muy polarizada.
  • 42. Procesamiento de datos 2 Conceptos básicos análisis de redes Tipos de grafo ● Por el tipo de relación: Encontramos dos tipos de grafo en función de si las relaciones son direccionales o no. Por lo tanto hay dirigidos y no dirigidos. ● Si hay uno o más tipos de nodos: En el caso de analizar sólo las menciones entre usuarios, tenemos un sólo tipo de nodos. En el caso de analizar cómo han utilizado los hashtags los usuarios, nos encontramos ante un grafo bipartito.
  • 43. Procesamiento de datos 2 Conceptos básicos análisis de redes Medidas de centralidad Hay cuatro medidas de centralidad ampliamente utilizadas: ● La centralidad de grado («degree centrality»): Tiene en cuenta el número de relaciones entre los nodos. ● La cercanía («closeness») Tiene en cuenta la distancia de un nodo respecto del resto de los componentes del grafo. ● La intermediación («betweenness») Determina qué usuarios son esenciales en la unión entre diferentes grupos del grafo. ● La centralidad de vector propio («eigenvector centrality») Nos muestra qué nodos son los más relevantes.
  • 44. Procesamiento de datos 2 Gephi ● Es software open-source de análisis de redes y visualización Permite analizar y visualizar archivos de grafo. ● Permite trabajar con diferentes tipos de archivos de grafo; .graphml, .gexf, .gdf, .gephi... E importar datos desde archivos .csv tanto para la generación de nodos, como la de aristas. ● Gephi ha sido utilizado en proyectos de académicos de investigación, periodismo y en otro lugares, ● Gephi es la herramienta que utilizaremos para realizar el análisis de redes.
  • 45. ● Descargar Gephi e instalarlo ● Abrir Gephi y el csv generado en el módulo anterior con las menciones Archivo > Abrir ● Aplicar el layout Force Atlas 2 ● En Estadísticas calcular la centralidad de vector propio y la modularidad ● Aplicar formato a los nodos. Para el tamaño utilizaremos la medida de centralidad Eigenvector. Para el color utilizaremos el valor Modularity Class ● Ir a previsualización ● Exportar archivo Ejercicio