El presente trabajo realiza un análisis cibermetrico de una red de investigadores, una red de revistas y una red de palabras claves, este análisis se realiza con carácter práctico y exploratorio. La metodología empleada en la cual se apoya este trabajo es la cibermetria el cual permite la obtención de medidas de densidad, grados de centralidad, grados de intermediación, grados de cercanía de los actores en general de los cuales se deducen el análisis de comunidades. Los resultados obtenidos de las redes analizadas se representan gráficamente para una mejor comprensión.
Practicando análisis cibermétrico en redes de investigadores
1. Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Revistas, autores y palabras clave: Un análisis
cibermétrico
Elwin Luis Huaman Quispe
elwin@usal.es
Resumen
El presente trabajo realiza un análisis cibermetrico de una red de investigadores, una red de revistas y una red de palabras
claves, este análisis se realiza con carácter práctico y exploratorio. La metodología empleada en la cual se apoya este trabajo
es la cibermetria el cual permite la obtención de medidas de densidad, grados de centralidad, grados de intermediación,
grados de cercanía de los actores en general de los cuales se deducen el análisis de comunidades. Los resultados obtenidos
de las redes analizadas se representan gráficamente para una mejor comprensión.
Palabras Clave: Cibermetria, análisis de redes, pajek, gephi
Créditos: Para realizar este trabajo, se ha revisado literatura científica de: F Sánchez-Pita, JL Alonso-Berrocal (2013): “Los
sitios Web de centros de investigación biosanitaria de Castilla y León. Un análisis cibermétrico”, en Revista Latina de
Comunicación Social, 68. La Laguna (Tenerife): Universidad de La Laguna, páginas 383 a 419, Retrieved April, 24 from
http://www.revistalatinacs.org/068/paper/982_Salamanca/16_Sanchez.html
1. Introducción
Desde siempre hay una preocupación por saber cuál
es el comportamiento de las redes sociales, no solo
en el ámbito del ciberespacio sino también en el
ámbito de la sociedad, hoy en día y cada vez más
existe un importante avance por comprender y
analizar estas relaciones, para ello muchos
investigadores emplean la Cibermetría para intentar
comprender y desvelar este comportamiento,
también cabe mencionar que este análisis parte del
concepto de redes y este se aplica a todo los ámbitos
de la humanidad en el que existan más de 1
participante. En este informe se pretende en concreto
comprender y analizar desde una perspectiva
practica el grado de relaciones que se tiene dentro de
la red Author.net más que en las otras redes.
Teniendo en cuanta la investigación como punto de
partida, podemos decir que existe una estrecha
relación dentro de los investigadores, es decir uno
puede estar relacionado con otro o no lo puede estar,
pero un investigador puede tener muchas relaciones
así como tampoco las puede tener, entonces ahí
nace la premisa de saber quién tiene más poder, mas
relaciones, más comunicación dentro de la dimensión
investigadora, es por eso que se necesita saber esta
información porque a simple vista no se puede ver,
para ello existe el análisis de redes. Una vez que
comprendemos estos conceptos podemos hablar de
medidas que nos dicen en qué grado mayor o menor
es importante un investigador o que pasa si este
investigador se va. Para muchas Universidades es
muy importante el campo de la investigación, porque
pueden mejorar sus objetivos si sabes esta
información o quizá también tomar mejores
decisiones.
Por todo esto este informe pretende reforzar la
capacidad práctica, de comprensión, análisis e
interpretación. Todo esto bajo una perspectiva
Cibermétrica así como su representación gráfica.
1.1. Justificación
El presente análisis cibermétrico se fundamenta en el
estudio y comprensión de medidas que ayuden la
representación de los datos; Journal, Author,
Keyword.
Estas redes fueron proporcionadas por terceros, de
los cuales se pudieron extraer los datos de los
autores, las revistas y palabras claves.
Por lo tanto el análisis cuantitativo que se pretende
realizar se apoya completamente en la cibermetria y
dentro de ello la posibilidad de analizar las
comunidades que se han podido establecer.
1.2. Objeto y objetivos de la investigación
Analizar bajo parámetros cibermetricos los datos;
Journal.net, Author.net, Keyword.net proporcionadas
por JL Alonso-Berrocal.
Dicho esto se pretende desde una perspectiva
cuantitativa obtener medidas cibermetricas y su
respectiva representación gráfica, lo cual facilitara la
comprensión.
1.3. Cibermetría y antecedentes
El termino Cibermetría se definió por Shiri en 1998 y
a partir de ello se establece otro aspecto a investigar
en el ciberespacio.
Hoy la Cibermetría centra su aplicación como una
solución que aborda la explosión documental,
basado en las conexiones y estructuras web. Y así
2. 2
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
poder determinar que documentos son más
relevantes y tiene más valor respecto de los demás
en función de las medidas establecidas en la
Cibermetría.
2. Método
2.1. Planteamiento y metodología
Se empleó una metodología cuantitativa para obtener
las medidas, índices, comunidades y su
representación gráfica, Para nuestro caso se aplican
a Autores, Revistas y Palabras claves.
2.2. Software utilizado
2.2.1. Pajek
Es un programa que permite el análisis y la
visualización de redes mediante algoritmo (Pajek,
2014). Pajek permite el cálculo de las medidas como;
Densidad, Diámetro, Grado de centralidad de
entrada, Grado de centralidad de salida, Relación de
nodos en función de la teoría Bow-Tie y su
representación gráfica.
Las acciones realizadas con Pajek consisten en
cargar los ficheros autor.net, journal.net,
keyword.net, esto nos permitirá la obtención de las
medidas y nodos representativos.
Para el proceso de representación de los gráficos se
utilizó del algoritmo Fruchterman Reingold.
2.2.2. Gephi
Gephi es un programa que permite analizar redes y
sobre todo está enfocado en su presentación gráfica,
también nos permite calcular las medidas; Nodos con
mayor grado de entrada, Nodos con mayor grado de
salida, nodos con mayor grado de intermediación,
Nodos con mayor grado de cercanía.
Debo mencionar que se ha encontrado problemas
durante el desarrollo de su representación en redes
grandes, puesto que la red Journals.net no puede
procesarla.
2.3. Índices y medidas aplicables
2.3.1. Densidad
La Densidad mide la proporción de enlaces que
existen entre las relaciones posibles de una red en
concreto. Los valores varían entre 0 y 1, siendo mejor
los cercanos a 1. También cabe mencionar el
diámetro que es el número de clicks necesarios que
se deben dar para llegar de un nodo en concreto al
nodo más lejano.
2.3.2. Diámetro
Esta medida permite conocer el número de clicks
necesario que se debe dar para llegar de un nodo en
concreto al nodo más lejano.
2.3.3. Grado
El grado permite medir el número de enlaces directos
que tiene un nodo que puede ser; grado de entrada
o grado de salida.
2.3.4. Grado de Entrada
El grado de entrada o indegree, indica la cantidad de
nodos que apuntan a este.
2.3.5. Grado de Salida
El grado de salida o outdegree, indica la cantidad de
nodos a los que apunta este.
2.3.6. Grado de intermediación
También conocido como betweenness, este grado
permite detallar que punto en concreto un nodo de la
red se encuentra en una posición intermedia con
respecto de la red. A mayor grado mejor. Es decir
mide el número de veces que un nodo aparece en las
rutas existentes en la red.
2.3.7. Grado de cercanía
Este grado es llamado también closeness, permite
mostrar la distancia media de cada nodo con el
conjunto de nodos que conforman la red, es decir un
nodo con mejor capacidad para el envió y la
recepción de información. A mayor grado mejor.
2.3.8. Pagerank
Esta medida determina la valoración de una página
web a través del número de enlaces que recibe
desde otras páginas y también por la importancia de
las páginas que le enlazan.
2.3.9. Hubs-autoridades
Permite obtener información de cómo se dirigen las
relaciones en sentido global. Los Hubs, son nodos de
los cuales parten muchas relaciones es decir tiene un
grado de salida mayor. Las Autoridades, son los
nodos que reciben muchas relaciones, es decir que
tiene un grado de entrada muy grande.
2.3.10. Comunidades
Nos permite hallar las redes de comunidades, para
ello utiliza dos parámetros que son; La modularidad
y el número de Clusters.
2.4. Representación gráfica de redes
Entendiendo un grafo como un conjunto de puntos y
líneas que pueden determinar una dirección y/o
camino y llegan a ser dirigidos o no dirigidos.
(Sánchez-Pita & Alonso-Berrocal, 2013)
3. 3
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 1. Grafo dirigido y no dirigido
Estas representaciones gráficas favorecen la
visualización y la correcta interpretación de los datos,
esta representación de los datos también permite su
visualización por una matriz de adyacencia.
Para la representación gráfica de los grafos de los
datos se utiliza el software Gephi, bajo la
visualización del algoritmo Fruchterman & Reingold
que permite la colocación de los nodos según su
fuerza de repulsión.
Figura. 2. Algoritmos
Fuente: www.revistalatinacs.org
También cabe mencionar que para la representación
y análisis de comunidades tendremos que utilizar el
algoritmo Force Atlas.
Figura. 3. Algoritmo forcé Atlas
3. Resultados
3.1. Propiedades de las redes
Como bien dijimos en las medidas e índices, que la
mejor densidad se acerca más a 1, sin embargo
podemos apreciar que las tres redes; Author, Journal
y Keywords tiene una densidad inferior a 0,30 lo que
indica que se debería trabajar más en establecer las
relaciones y comunicaciones entre sus distintos
nodos.
Figura. 4. Densidad
Respecto del diámetro podemos mencionar que la
red journal necesita de 37 pasos para llegar de un
nodo.journal al nodo.journal más alejado.
Figura. 5. Diámetro de redes
3.2. Centralidad de las redes
El grado de centralidad indica cuanto más próximo a
0 es mucho mejor. Sin embargo podemos apreciar
que todo el conjunto de redes oscila entre 0,57 y 0,60.
0,27
0,25
0,11
0,00
0,05
0,10
0,15
0,20
0,25
0,30
Author Journal Keyword
Densidad
6
37
10
0
10
20
30
40
Author Journal Keyword
Diametro
4. 4
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 6. Centralidad de Entrada
Figura. 7. Centralidad de Salida
3.3. Representación gráfica de las redes
A continuación se representan gráficamente las
redes especificando su clasificación.
3.3.1. Grafos de Authors.net
En este grafo se puede apreciar al ID 13, que
pertenece al autor BAR-ILAN, J con un grado de
entrada de 247.
Figura. 8. Grado de Entrada
Figura. 9. Lista top 5 con mayor grado de entrada
En el siguiente grafico podemos apreciar al ID 333
que pertenece a SPINK, A con un grado de salida de
275.
Figura. 10. Grado de salida
Figura. 11. Lista top 5 con mayor grado de salida
En los siguientes gráficos podemos apreciar los
grados de intermediación y cercanía.
0,58
0,57
0,60
0,55
0,56
0,57
0,58
0,59
0,60
0,61
Author Journal Keyword
InDegree
0,58
0,57
0,60
0,55
0,56
0,57
0,58
0,59
0,60
0,61
Author Journal Keyword
OutDegree
5. 5
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 12. Grado de Intermediación
Figura. 13. Lista top 5 con mayor grado de
intermediación
Figura. 14. Grado de Cercanía
Figura. 15. Lista top 5 con mayor grado de Cercanía
3.3.2. Grafos de Keywords.net
En este grafo se puede apreciar al ID 1, que
pertenece al keyword RESEARCH con un grado de
entrada de 585.
Figura. 16. Grado de Entrada
Figura. 17. Lista top 5 con mayor grado de entrada
En el siguiente grafico podemos apreciar al ID 445
que pertenece al Keyword PROGRAMMING con un
grado de salida de 189.
6. 6
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 18. Grado de salida
Figura. 19. Lista top 5 con mayor grado de salida
En los siguientes gráficos podemos apreciar los
grados de intermediación y cercanía.
Figura. 20. Grado de Intermediación
Figura. 21. Lista top 5 con mayor grado de
intermediación
Figura. 22. Grado de Cercanía
Figura. 23. Lista top 5 con mayor grado de Cercanía
3.4. Posicionamiento de las redes
A continuación se muestran listas top 5 con mejores
valores, que indican el pagerank de los authors y
Keywords respectivamente. Sin embargo estos datos
son demostrativos y prácticos.
7. 7
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 24. Authors, Lista Top 5 de Pagerank
Figura. 25. Keywords, lista Top 5 de Pagerank.
3.5. Análisis de comunidades
A continuación se presenta la representación gráfica
de las comunidades que existen dentro de
authors.net y dentro de keywords.net. Luego de su
análisis.
3.5.1. Comunidades authors.net
En esta red se puede apreciar un grado de
modularidad de 0,38 y 5 comunidades o cluster.
Figura. 26. Porcentaje de comunidades
Figura. 27. Comunidades
3.5.2. Comunidades keywords.net
En esta red se puede apreciar un grado de
modularidad de 0,39 y 7 comunidades o cluster.
Figura. 28. Porcentaje de comunidades
8. 8
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 29. Comunidades
3.6. Resumen
ÍNDICES AUTHOR JOURNAL KEYWORD
Vertices 405 2079 831
Lines 21742 537217 36654
Densidad 0,27 0,25 0,11
Diametro 6 37 10
InDegree 0,58 0,57 0,60
OutDegree 0,58 0,57 0,60
Betweenness 0,04 0,01 0,05
Closeness Input 0,58 0,54 0,50
Closeness Output 0,58 0,54 0,50
Hubs Authori 0,09 0,06 0,10
Modularidad 0,38 0,46 0,39
Cluster 5 7 7
4. Conclusiones
Luego del análisis cibermetrico realizado a las redes
authors.net, journals.net y keywords.net se puede
decir que el análisis se ha enfocado
cuantitativamente, y que ha permite el cumplimiento
de los objetivos. También se menciona lo siguiente:
Primero: de las 3 redes analizadas 1 es lista de
autores, otra lista de revistas y la tercera es una lista
de palabras clave, entonces los análisis no son
comparativos, pero si apreciativos.
Segundo: la red journals.net tiene mejores
relaciones ya que en las medidas de grado y
densidad mantiene mejores valores respecto de los
demás.
Tercero: El único autor que presenta mayor grado de
intermediación y grado de salida es el ID 333 del
autor Spink, A. debe ser considerado importante.
Cuarto: Basado en resultados podemos decir que la
red de authors.net tiene una conectividad buena ya
que contiene un valor de 6 en el diámetro de su red.
El presente trabajo se ha realizado como trabajo 2 de
la asignatura: Gestión de contenidos y análisis de
redes en entornos digitales del master en sistemas
de información digital.
5. Bibliografía
Pajek. (2014). pajek [Pajek Wiki]. Retrieved April 24,
2014, from
http://pajek.imfm.si/doku.php?id=pajek
Sánchez-Pita, F., & Alonso-Berrocal, J. L. (2013). Los
sitios Web de centros de investigación
biosanitaria de Castilla y León. Un análisis
cibermétrico. doi:10.4185/RLCS-2013-982
6. Anexos
Los anexos considerados para el trabajo, son los
siguientes:
Authors.gephi
Authors.net
Authros.paj
Journals.paj
Journals.net
Keyword.gephi
Keywords.net
Keywords.paj
También se incluyen las imagines para su mejor
visualización a zoom completo:
Author Comunidades.png
Keyword Comunidades.png
9. 9
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
6.1. Anexo: Author comunidades
10. 10
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
6.2. Anexo: Keywords comunidades