El documento presenta un taller sobre el análisis de redes sociales aplicado a la identificación de comunidades de coautores en la revista Estudios Gerenciales. El taller consiste en cuatro pasos: 1) descargar datos, 2) normalizar la información, 3) organizar los datos, y 4) analizar la red y generar insumos para un informe. El análisis muestra que 3 de 10 comunidades concentran el 83% de los vínculos entre los años 2000-2022.
SESIÓN DE APRENDIZAJE N° 5 SEMANA 7 CYT I BIMESTRE ESTUDIANTES.pdf
Comunidades de coautoría en revista gerencial colombiana
1. -TALLER-
Identificación de comunidades a partir
de los metadatos a nivel de autor
[Social Network Analysis (SNA) / Análisis de Redes Sociales (ARS)]
Adolfo A. Abadía
3. ● Técnica matemática que permite la evaluación simultánea de relaciones
○ Al interior de un grupo (network).
○ Las cualidades de los miembros de cada grupo (nodes) y sus vínculos (edges) a partir de diadas.
○ Los vínculos pueden ser:
■ Directos (que indican una dirección de la relación) o no directos.
■ Ponderados (que indican frecuencia) o no ponderados.
● Estrategia de visualización de datos que usa los grafos para presentar
información asociada a patrones de vínculos
○ Mapeo de información desde una base matrix que en su forma visual ayuda al análisis e
interpretaciones de estructuras de vínculos colectivos.
● Medidas de redes sociales asociadas a distintos enfoques del ARS
○ Medidas de Integridad (MI): tienden a demostrar la fuerza y coherencia de los vínculos entre nodos.
○ Medidas de Centralidad (MC): este indicador establece la distribución de poder (degree), cercanía
(closeness) e influencia (betweenness) de los actores de una red social.
¿Qué es el Análisis de Redes Sociales (ARS)?
4. ● Relaciones sociales estructuradas ⇒ Estudio de la conducta de los
individuos a nivel micro, los patrones de relaciones (la estructura de la red) a
nivel macro, y las interacciones entre los dos niveles (Sanz, 2003).
● Imperativo anti-categórico ⇒ Explica procesos sociales no a partir del
comportamiento de los individuos basándose, exclusivamente, en los atributos
de los actores. Contraposición a análisis individualista (Rodríguez, 2005).
● Propiedades sistémicas ⇒ Comprender la posición que ocupan los elementos
en una estructura social, es comprender la organización de sus relaciones
típicas (Requena, 1996).
Citas tomas de Brand Monsalve y Castañeda Pareja (2021).
¿Cómo entender el Análisis de Redes Sociales (ARS)?
5. Vínculos directos y ponderados. Vínculos no directos ni ponderados.
Ejemplo de Grafos
6. ● Pregunta guía ¿Cómo dar cuenta de las comunidades de co-autores de la
revista Estudios Gerenciales a partir de los metadatos a nivel de autor según
lugar de origen entre 2000-2022?
○ Metadatos a nivel de autor ⇒ Atributos de nodos: nombre, filiación, ciudad, país, etc.
○ Comunidades ⇒ Característica del vínculo: co-palabras, co-citación, co-autoría, etc.
○ Otros ⇒ Productividad (área del nodo), Frecuencia (vínculo ponderado), etc.
● Taller práctico (aproximación metodológica)
○ Primer paso: descargar los recursos para el estudio.
○ Segundo paso: normalización y depuración de la información descargada (datos).
○ Tercer paso: organización de la información para su reconocimiento en Gephi.
○ Cuarto paso: análisis y construcción de insumos para un informe.
¿Qué vamos a hacer?
7.
8. ● Delimitación de la información descargada (datos)
○ Revista: Estudios Gerenciales - EG (ISSN 0123-5923 // 2665-6744 (en línea)).
○ Periodo de análisis: 23 años (2000-2022).
○ Tipo de documento: artículo de investigación (research article).
○ Criterio mínimo de inclusión: información de país.
● Normalización
○ Nombre de autores: depurar duplicados y errores de digitacion.
○ País: depurar duplicados y combinación de idiomas.
○ Ciudad: depurar duplicados (para caso en que se cumpla País = Colombia).
Primer paso: descargar los recursos para el estudio
Segundo paso: Delimitación y normalización de la información descargada (datos)
● Descargar datos ⇒ Scielo Analytics (https://analytics.scielo.org/w/reports).
● Descargar software ⇒ Gephi (https://gephi.org/).
● Otras herramientas ⇒ Sheet Google Drive (o MS Excel).
9. ● Archivo 1 (Nodos)
○ ID ⇒ Lugar de origen de cada autor (País y si país es igual a Colombia, entonces ciudad).
○ Atributo 1 ⇒ Número de artículos (agregado)
● Archivo 2 (Vínculos)
○ Source ⇒ Lugar de origen del co-autor 1 en un artículo.
○ Target ⇒. Lugar de origen del co-autor n en el mismo artículo.
○ El total de vínculos por artículo = número de combinaciones sin repeticiones de coautores del
artículo.
➢ n
Ck
= n! / k!(n-k)! ; n=número de autores, k=número de elementos por combinación.
● Detalles importantes
○ ID (archivo 2) = Source y Target (archivo 1) ⇒ Vínculo entre los archivos.
○ Atributos extras ⇒ Sí se puede incluir características adicionales en ambos archivos.
○ Tipo de vínculos: no directos (sin indicativo de una dirección).
○ Frecuencia del vínculo ⇒ Sumar la coincidencia entre mismos pares de nodos.
○ Reemplazo de caracteres ⇒ á-é-í-ó-ú-ñ por a-e-i-o-u-n
Tercer paso: Organización de la información para su reconocimiento en Gephi
10. Cuarto paso (a): análisis y construcción de insumos para un informe
Grafo ⇒ Red de co-autoría según lugar de
origen de los autores de la revista EG
entre 2000-2022
● Estructura de la red:
○ Nodos: 56 / Vínculos: 86.
● Métricas del grafo:
○ Diámetro: 5
○ Densidad: 0,056
○ Comunidades: 10
■ Azul: 46% / Verde: 21% / Naranja: 16% [83%]
○ Average Clustering Coefficient: 0,485
11. Cuarto paso (b): análisis y construcción de insumos para un informe
Grafo ⇒ Red de co-autoría según lugar de
origen de los autores de la revista EG
entre 2000-2022 [83% de anterior red]
● Estructura de la red:
○ Nodos: 74 / Vínculos: 84.
● Medidas de Centralidad (nodos):
Relevancia Cercanía Influencia Eigenvector
Cali Cali Cali Cali
Bogotá Bogotá Bogotá Bogotá
España España España España
Cartagena Palmira Medellín Bucaramanga
Chile Armenia Argentina Chile
12. Cuarto paso: análisis y construcción de insumos para un informe
Nivel micro
● Cali, Bogotá y España, en ese orden, son nodos centrales por relevancia,
cercanía, influencia y cercanía entre nodos relevantes (eigenvector).
● Chile es un nodo central en términos de relevancia y eigenvector.
● Cartagena, Palmira y Armenia, Medellín, y Bucaramanga son nodos centrales
en solo una métrica: relevancia, cercanía, influencia y eigenvector,
respectivamente.
Nivel macro
● 3 de 10 comunidades concentran el 83% de los vínculos.
○ 28 de 56 nodos de la red / 39 de 86 vínculos de la red.
● Densidad: 0,056 ⇒ Red significativamente dispersa.
● Clustering Coefficient: 0,485
13. Sobre SNA
● Scott, J. (2017). Social Network Analysis. Thousand Oaks: SAGE Publications.
https://uk.sagepub.com/en-gb/eur/social-network-analysis/book249668
● Brand Monsalve, E.G.: Castañeda Pareja, I.N. (2021). Análisis de redes sociales: Conceptos y
técnicas para la investigación social. Medellín: Universidad de Antioquia.
https://doi.org/10.2307/j.ctv1rnpj6k
● Bastian, M.; Heymann, S.; Jacomy, M. (2009). Gephi: An open-source software for exploring and
manipulating networks. International AAAI Conference on Weblogs and Social Media (Association for
the Advancement of Artificial Intelligence). USA. https://doi.org/10.1609/icwsm.v3i1.13937
● Kumar, S. (2015). Co-authorship networks: A review of the literature. Aslib Journal of Information
Management, 67(1), 55-73. https://doi.org/10.1108/AJIM-09-2014-0116
Ejemplos aplicados
● Abadía, A.A. (2023). Co-authorship Networks and Scholarly Books: A Methodological Approach from
a University Press Case Study. Revista CS, (40), 101-140. https://doi.org/10.18046/recs.i40.5858
● Alonso-Cifuentes, J.C.; Carabali, J.A. (2019). Breve tutorial para visualizar y calcular métricas de
redes (grafos) en R (para económicas). Icesi Economics Lecture Notes, 7. Cali: Universidad Icesi.
https://ideas.repec.org/p/col/000559/018170.html
Literatura sugerida