Flujo potencial, conceptos básicos y ejemplos resueltos.
Roles de las comunidades twitter Espe 2016
1. Roles en comunidades de interés sobre el servicio
de redes sociales de Twitter
José Gabriel Espinosa Ramireza
, Katherine Tarazona Mezab
, Miguel Giancarlo Ormaza Cevallosc
a
SINI/Facultad I/Universidad de las Ciencias Informáticas
b
Ciencias Sociales del Comportamiento/Facultad de Ciencias Humanísticas y Sociales/Escuela de Psicología Preclínica,
Universidad Técnica de Manabí
c
Ciencias Administrativas/Facultad de Ciencias Administrativas y Económicas/Escuela de Administración,
Universidad Técnica de Manabí
jgespinosa@uci.cu, atarazona@utm.edu.ec, mormaza@utm.edu.ec
Resumen— Entre los servicios de redes sociales disponibles en
Internet se destaca el ofrecido por Twitter. Este se distingue por
ser un servicio de microblogging de gran aceptación a nivel
mundial. En el mismo los usarios van estableciendo los lazos que
constituyen el núcleo de la red social. Sobre estas relaciones se
realiza el intercambio de información, permitiendo que
mediante su estudio sea posible determinar el rol que desempeña
cada usuario, en un segmento de la red social. Este trabajo
pretende abordar un estudio de los roles de la comunidad de
interés generada entorno al Presidente de los Estados Unidos,
Barack Obama y su representatividad en el mundo. Su alcance
es netamente académico y se escogió esta personalidad por la
gran cantidad de contenidos que se generan entorno al mismo.
Se describen las herramientas informáticas empleadas, así como
los algoritmos utilizados y la interpretación de los valores
obtenidos en el marco del contexto social. El objetivo de la
presente investigación es obtener una visión del segmento de la
red social relativo al tema abordado en la que sea posible
esclarecer los roles que juegan los usuarios de acuerdo a las
relaciones activas (retweet, mencion, y cita) que se pueden
establecer dentro del sitio de redes sociales Twitter. De esta
forma se obtiene una perspectiva que profundiza en la
estructura de la red social, más allá del conteo de seguidores y
seguidos.
Palabras Claves— análisis de redes sociales, detección de roles
, métricas de centralidad, redes sociales, Twitter.
Abstract— Among social networking services available on the
Internet stands that offered by Twitter. This is distinguished by
being a microblogging service widely accepted worldwide.
Through it the users are establishing links that constitute the
core of the social network. Over these relations the information
exchange is performed, allowing their study to determine the
role played by each user within a segment of the network. This
work is addressed to study of the roles within the community of
interest generated around the President of the United States,
Barack Obama and his worldwide significancy. Its scope is
purely academic and this personality was chosen by the vast
amount of content that are generated around him. Information
technologies tools, as well as the algorithms used and the
interpretation of the values obtained under the social context are
described. The aim of this research is to obtain an insight into
the segment of the social network on the issue addressed in
which it is possible to clarify the roles that users play according
to active relationships (retweet, mention, and cites) that can be
set within the social networking site Twitter. Thus a perspective
that delves into the structure of the social network, beyond the
counting of followers and followed by.
Keywords— centrality metrics, role detection, social networking
analysis, social networks, Twitter.
I. INTRODUCCIÓN
Lo social es inherente a la naturaleza del ser humano, para
su desarrollo el hombre necesita del intercambio con sus
semejantes. Cada persona a lo largo de su vida va creando
lazos con otras sobre los que se construyen su propia red
social. Las redes sociales siempre han acompañado al ser
humano en su desarrollo, pero no fue hasta tiempos recientes
cuando estas se han hecho más tangibles gracias a la aparición
de sitios de redes sociales en Internet.
Los sitios de redes sociales se definen como aquellos
servicios basados en la Web que permiten al individuo
construir un perfil público o semipúblico dentro de las
fronteras del sistema y elaborar una lista de usuarios con los
que se conecta y navegar a través de las listas de conexiones
de otros usuarios [1].
En el año 2006 surge el servicio de redes sociales sobre
Internet denominado como Twitter. Aunque en sus inicios
Twitter solo estaba relacionado con el servico de mensajes
cortos, SMS (del inglés Short Message Service), de la
plataforma telefónica móvil, no demoró en hacerse de un
sólido lugar en Internet acaparando la atención del público a
nivel global [2].
Twitter es una red de información en tiempo real que
brinda las últimas historias, ideas, opiniones y noticias [3].
Dado que la entidad fundamental de esta red social es el
tweet, mensaje corto de apenas 140 caracteres, la misma se
enmarca dentro de la tendencia del microblogging.
Twitter es una poderosísima herramienta que permite
llegar al individuo de forma directa e inmediata. La
inmensidad de los contenidos que se generan en Twitter es
una fuente de información formidable de la cual auxiliarse
2. para la toma de decisiones sobre un tema en específico, así
como para desarrollar campañas de divulgación de forma
coordinada, efectiva y eficiente [4].
Para comprender mejor la dinámica de esta red social es
necesario auxiliarse de técnicas de análisis de redes sociales,
tales como la detección de roles en comunidades de interés
mediante la aplicación de métricas de centralidad. De esta
manera es posible obtener una visión estructurada de los roles
que desempeñan los miembros de una comunidad sobre
determinado tópico en específico.
El propósito de la presente investigación, netamente
académica, es representar la red social activa que se sustenta
sobre las relaciones de mención, cita y retweet, que incluyan
cadenas de texto previamente seleccionadas y relacionadas
con el presidente de los Estados Unidos, Barack Obama.
Para esto se especifica cómo se recolectaron los datos, se
diseñaron y elaboraron las herramientas para la ejecución del
estudio, así como el cálculo de las métricas que se utilizaron.
Y la interpretación de los análisis tanto en lo cantitativo como
desde el punto de vista cualitativo.
Diariamente se generan más de 500 000 000 mensajes en
el sitio de redes sociales Twitter. Además este servicio cuenta
con una media de 316 000 000 de usuarios activos,
mensualmente [5]. Es por esta razón que si se desea realizar
un estudio sobre una comunidad de interés, aunque esta sea
relativamente reducida, el número de usuarios y de mensajes
que se debe manejar continuará siendo grande, por lo que es
necesario auxiliarse de herramientas informáticas para la
ejecución del mismo.
El presente está estructurado en las secciónes de “método”,
“análisis de resultados” y “conclusiones”. En la sección
“método” se enumeran y describen las herramientas
informáticas utilizadas en la investigación, las métricas, los
algoritmos y métodos aplicados.
En la sección “análisis de los resultados” se describen los
datos obtenidos producto de la investigación y los mismos
son interpretados de acuerdo al contexto. Finalmente se arriba
a la sección “conclusiones” en la cual se resume el aporte de
la investigación así como son propuestas nuevas líneas de
investigación.
II. MÉTODO
A. API de Twitter
El primer paso para el análisis de redes sociales sobre los
datos que ofrece el sitio de redes sociales Twitter es la
recopilación de los tweets sobre la comunidad de interés. Para
esto se hace uso de las facilidades que para la integración con
terceros que ofrece el servicio de Twitter.
Twitter pone a disposición de los desarrolladores dos APIs
(interfaz de programación de aplicaciones del inglés,
application programming interface) el API REST, y el API
de streaming. El API REST provee interfaces simples para la
mayoría de las funcionalidades de Twitter. Entre las
operaciones que se pueden realizar a través del API REST se
encuentran la generación de tweets, gestión de mensajes
directos, mensajes no públicos entre usuarios, gestión de las
relaciones de seguimiento de usuarios, obtención de datos
geográficos, obtención de tendencias y la realización de
búsquedas, entre otras. El API REST está enfocada hacia la
ejecución de solicitudes de usuarios individuales.
El API de streaming se diferencia del API REST por ser
más compleja y estar orientada a un flujo de datos en tiempo
real mientras se mantenga la conexión [6]. El API de
streaming ofrece servicios mediante el flujo de usuario y el
flujo de sitio. El primero está diseñado para proveer un flujo
de datos y eventos específicos al usuario autenticado,
mientras que el segundo se utiliza para la realización de varias
acciones en representación de múltiples usuarios [7][8].
Tanto el API REST como el API de streaming son
utilizadas por las aplicaciones para comunicarse con los
servicios de Twitter, haciendo un cuidadoso balance de carga
para mantenerse dentro de los límites permitidos por Twitter.
De esta manera se pueden construir grandes colecciones
datos.
Para hacer uso el API de streaming con el propósito de
captar los tweets recuperados se desarrolló una aplicación
informática. Para la cual se utilizó el lenguaje de
programación Java y la biblioteca Hosebird Client (hbc) para
la conexión con el API de streaming de Twitter.
La aplicación captura y guarda los tweets, en la misma
medida que los recibe. Para su almacenamiento, y posterior
utilización, los tweets se mantienen con el mismo formato en
que son recibidos en un clúster de Elasticsearch. Mientras que
con el propósito de facilitar el cálculo de las métricas de
centralidad, se extraen los usuarios y las relaciones entre estos
para almacenar esta información en una base de datos
orientada a grafos sobre Neo4J.
B. Análisis de redes sociales y métricas de
centralidad estudiadas
“El análisis de redes sociales puede ser definido como la
disciplina de indagar en los patrones de las relaciones entre
los actores, así como los patrones de las interrelaciones sobre
los actores a diferentes niveles (tales como personas y
grupos)” [9].
El análisis de redes sociales se utiliza como una manera
estructurada de analizar el grado de relación informal entre
las personas, o incluso entre las organizaciones. El análisis de
redes sociales hace visibles estos patrones de interacción, que
no se encuentran explícitos, para identificar grupos
importantes con el fin de facilitar la colaboración eficaz [10].
Para la identificación de grupos y roles, existen diversos
algoritmos y medidas de centralidad que en conjunto pueden
determinar con un alto grado de precisión en qué medida un
usuario cumple una determinada función. Dentro de las
3. medidas de centralidad, hay cuatro que son ampliamente
utilizadas en el análisis de redes: centralidad de grado de
entrada y grado de salida, centralidad de intermediación, y
centralidad de cercanía [11].
La centralidad de grado es la más simple de las medidas de
centralidad. Corresponde al número de enlaces que posee un
individuo con los demás. En caso de que se pueda establecer
una dirección en el enlace se establecen dos criterios, grado
de entrada y grado de salida. En el sentido de relaciones
interpersonales, el primero puede interpretarse como una
medida de popularidad, mientras que el segundo como una
medida de sociabilidad [12]. El grado de salida, está dado por
la cantidad de transacciones que tienen como origen al nodo
estudiado, y el grado de entrada se basa en la cantidad de
transacciones en las que el nodo sea el destinatario.
La centralidad de intermediación se basa en el número de
caminos más cortos que pasan a través de un usuario. Los
usuarios con una alta intermediación juegan el rol de conectar
a los diferentes grupos, son los agentes y conectores que
mantienen juntos a los demás. Estando “en medio” significa
que un usuario tiene la capacidad de controlar el flujo de
información entre la mayoría del resto. Los individuos con
alta intermediación son los pivotes en el flujo de
conocimiento de la red. Los usuarios con mayor
intermediación también resultan en el mayor incremento en
la distancia típica entre los demás cuando son retirados [12].
Determinar qué nodos presentan una alta intermediación
en la red social de la comunidad de interés permite identificar
cuáles usuarios pueden servir como puentes para organizar
grupos, o constituyen factores críticos para la difusión de la
información dentro de la comunidad estudiada. Esta métrica
de centralidad impacta directamente sobre el poder de
convocatoria, y organización, ya que contribuye a identificar
los nodos críticos que sirven como puentes entre los
diferentes conjuntos de nodos en la red social.
La centralidad de cercanía puede ser considerada como una
medida de cuánto tiempo tomará para que la información se
propague desde un nodo determinado a los otros nodos en la
red. Para esto se calcula la distancia de cada nodo de la red
con respecto a los demás [12].
Esta métrica de centralidad puede ser muy útil a la hora de
elaborar campañas de divulgación o lanzar convocatorias,
puesto que permite optimizar los resultados del esfuerzo
invertido en la propagación de la información.
Los algoritmos para identificar los roles de un nodo u
usuario de una red social, no son excluyentes, y brindan la
información de en qué grado un usuario se desenvuelve en un
rol, lo que permite establecer comparaciones entre los
miembros de la red.
Para el cálculo de las métricas de intermediación se utilizó
el algoritmo desarrollado por Brander [13]. Este algoritmo
permite una reducción notable en los tiempos de ejecución
para el cálculo de las métricas de centralidad relacionadas
con el cálculo del camino mínimo. El incremento en la
eficiencia ofrecido por este algoritmo se basa en una nueva
técnica de acumulación que permite extender las capacidades
de cálculo a redes mayores y la evaluación simultánea de
métricas basadas en el cómputo del camino más corto.
Teniendo en cuenta que el grafo generado por cada tipo de
relación es direccionado y no ponderado, se decidió utilizar
la variante del algoritmo de Brander basada en un glotón
(breadth-first search). De esta forma se calcula el índice de
centralidad resolviendo para cada vértice el problema de los
caminos más cortos, con un único origen. Al finalizar cada
iteración las dependencias del origen hacia cada uno de los
otros vértices son sumadas a la centralidad de este [13].
Para el cálculo de la centralidad de intermediación y
cercanía se desarrolló una implementación lineal del
algoritmo propuesto por Brander , utilizando el lenguaje de
programación Java. Para el cálculo de las métricas de
centralidad de grado de salida y grado de entrada, se utilizan
los mecanismos de consultas del propio Neo4j. De esta
manera el cálculo de las métricas se ubica dentro del servidor
de base de datos Neo4j, en forma de servicios para ser
consumidos por otros componentes o aplicaciones externas,
mediante un API REST.
Figura. 1. Segmento de código del glotón implementado para
pluggin de Neo4j encargado el cálculo de las métricas de
centralidad.
C. Componentes de la solución
Una vez se recibe un tweet proveniente del servicio del API
de Twitter es necesario almacenarlo para su posterior análisis.
Para esto se utiliza el motor de búsqueda Elasticsearch,
basado en Apache Lucene [14] y el sistema de gestión de
bases de datos orientada a grafos Neo4j.
El uso de dos sistemas de almacenamiento tiene su
fundamento en la necesidad de guardar íntegramente el tweet
y a la vez modelar en un grafo las relaciones. En este grafo
los usuarios se representan como nodos y las relaciones
activas de mención, cita o retweet como aristas entre estos.
Cada una de estas aristas, es representada en la base de datos,
manteniendo el identificador del tweet y una marca temporal
como atributos.
Elasticsearch es una herramienta libre y de código abierto,
4. liberada bajo los términos de la licencia Apache 2. Su
flexibilidad e independencia de la plataforma permite que se
pueda utilizar en entornos tanto locales como remotos [15].
Se diferencia de otros motores de búsqueda por hacer pública
la gestión y consulta de estos índices mediante un API REST.
Figura. 2. Representación de un subconjunto de los datos
almacenados en el sistema de base de datos orientado a grafos
Neo4j.
Este motor de búsqueda ofrece un alto grado de fiabilidad
y escalabilidad, permitiendo una fácil configuración de las
búsquedas usando clústeres. Además, ofrece seguridad ya que
puede funcionar de forma aislada dentro de la red.
Elasticsearch no requiere un esquema fijo de datos como las
base de datos relacionales (SQL, del inglés structured query
language), esta característica le posibilita realizar búsquedas
sobre datos arbitrarios en aplicaciones que manejan grandes
volúmenes de datos [15].
Elasticsearch además ofrece facilidades para su integración
punto a punto con otras herramientas. Para la realización de
consultas sobre las comunidades de tweets y visualización de
los resultados, en gráficas comparativas, se emplea la
herramienta Kibana.
Kibana es una plataforma de código abierto para el análisis
y la visualización diseñada para integrarse con Elasticsearch.
La misma puede ser utilizada para buscar, visualizar e
interactuar con los datos almacenados en los índices de
Elasticsearch. Fácilmente se pueden realizar análisis
avanzados de datos y visualizarlos en varios gráficos, tablas
y mapas [16].
Kibana facilita la comprensión de la información contenida
en grandes volúmenes de datos. Al utilizar interfaces
compatibles con los navegadores Web permite crear
rápidamente gráficas en las que se muestran los cambios sobre
las consultas realizadas a Elasticsearch en tiempo real [16].
Figura. 3. Panel de Kibana dentro de la aplicación.
Haciendo uso de una instancia de Kibana se obtienen las
facilidades necesarias para realizar consultas sobre las
colecciones de tweets en base a requerimientos de información
específicos. Kibana ofrece un alto nivel de flexibilidad para el
estudio de las comunidades de interés, pero el mismo no está
diseñado para realizar la detección de roles. Para esta tarea fue
necesario desarrollar una aplicación de propósito específico.
Como anteriormente se mencionó para almacenar la
representación del grafo de los usuarios de la comunidad se
utiliza el gestor de base de datos Neo4J. A diferencia de los
sistemas de gestión de base de datos tradicionales no
almacena los datos en forma de tablas y relaciones, en lugar
de esto representa los datos como nodos y relaciones de un
grafo [17]. El mismo ofrece las facilidades para extender sus
funcionalidades mediante el desarrollo de plugins que le
añadan nuevas características. Las funcionalidades necesarias
para el cálculo de estas métricas de centralidad, sobre el
algoritmo de Brander, fueron encapsuladas en un plugin
desarrollado utilizando el lenguaje de programación Java y
expuestas mediante el API REST de Neo4J.
Los componentes desarrollados fueron integrados para que
acometieran el estudio, en el flujo que se describe a
continuación. Los tweets son recuperados mediante el
componente para conexión con el API de stream de Twitter,
para ser inmediatamente almacenados, tal y como se
recibieron, en ElasticSearch y a la vez ser procesados para la
extracción de los autores, los usuarios mencionados, y los
5. autores de retweet. Los datos extraidos del procesamiento del
tweet serán almacenados en la base de datos de Neo4J,
conformando un grafo dirijido, y no ponderado en el cual los
usuarios se representan como nodos y las relaciones son las
aristas. Mediante una tarea programada se ejecuta una
aplicación periódicamente que tiene como objetivo consultar
el API Rest de Neo4J, para obtener los resultados de la
detección de roles y almacenar estos resultados en
Elasticsearch. Estos resultados son guardados con la adición
de una marca temporal, que sirva para rastrear
cronológicamente como se ha comportado cada usuario en el
desempeño de cada rol.
III. ANÁLISIS DE RESULTADOS
Los resultados establecen las relaciones entre los datos
obtenidos, el problema de investigación, el método y el
soporte teórico de la revisión de la literatura. Los resultados
se presentan en una secuencia lógica y se recomienda
presentarlos de forma sintetizada en tablas, figuras, etc.
Dado que el propósito de la presente investigación es
académico se conformó una colección pequeña de 50 653
tweets, de los cuales se extrajeron 35 035 usuarios, 34 401
relaciones de mención, 2 745 relaciones de cita y 24 392 de
retweet. Estos tweets tienen en común que en su cuerpo
incluyen el nombre de pila del presidente de los Estados
Unidos, “Obama”. Los tweets recuperados fueron tratados
para extraer las relaciones de mención, cita y retweet, así
como los usuarios implicados en estas. Es importante destacar
que el conjunto de tweets estudiados es realmente pequeño
para los que se generan a diario, incluso para un sólo término
de búsqueda.
La relación de retweet, se establece cuando un usuario
selecciona el tweet generado por otro para realizar la acción
de comunicarlo a sus seguidores. Esta relación extiende el
alcance de la capacidad de comunicación de la fuente original
a los seguidores del usuario que realiza el retweet y afianza el
contenido del mensaje.
Las relaciones de cita tienen lugar cuando se toma el tweet
de otro usuario y se le adiciona algún comentario. Este tipo
de relación además de ser similar al retweet, incluye
valoraciones del intermediario que pueden tener diferentes
matices. El grafo que se genera por este tipo de relación tiene
la importancia de que tienen embebida la emisión de criterio
y establecimiento de posturas sobre los contenidos de los
tweets.
Las menciones ocurren cuando en el cuerpo del tweet se
incluye el nombre de usuario, precedido por el carácter de
arroba, “@”. Esto se utiliza para realizar una referencia
directa al usuario en cuestión, y puede ser tomada en cuenta
como una referencia de la relevancia de un usuario.
El análisis realizado está orientado a las relaciones antes
mencionadas, a continuación se exponen un resumen de los
resultados encontrados, y se hace una valoración de estos de
acuerdo a la implicación de la métrica expuesta para el
funcionamiento de la red social estudiada.
TABLA I
INTERMEDIACIÓN DE LA RELACIÓN DE MENCIÓN
Usuario Intermediación
PLAYTRUMPSCARD 0.005%
ROTNSCOUNDREL 0.004%
HORSESHORT 0.004%
LIBERTYBELL1000 0.004%
HALE4JESUS 0.004%
DESTINBEACH22 0.003%
GAETASUSAN 0.002%
DSF2020 0.002%
STEPH93065 0.002%
JIMLIBERTARIAN 0.002%
Los resultados obtenidos del análisis de intermediación
para la relación de mención se muestran en la tabla I. Estos
resultados pueden interpretarse como los usuarios que son
centro de la polémica de la red. Es decir aquellos que son
propensos a generar temas de debate, que conlleven que los
otros usuarios los mencionen en sus tweets, en muchos casos
en forma de respuesta.
El perfil social de estos usuarios los hacen propicios para
comunicar temas de actualidad ya que tienen una comunidad
de usuarios que se mantienen pendientes de sus
publicaciones, transformándose en generadores de estados de
opinión. Cuentan con una comunidad activa de seguidores
que se muestran receptivos y emiten reacciones a las
publicaciones de los primeros, y que a la vez contribuyen a la
socialización de los contenidos en la red.
Los usuarios con una alta intermediación de la relación de
mención se distinguen por ser puntos de conección entre las
subredes conformadas por las relaciones de mención. Estos
usuarios sirven de puente entre los subconjuntos de usuarios
y los temas tratados.
En la tabla II se muestran los 10 usuarios más relevantes
en la métrica de intermediación por la relación de retweet.
Varios de estos usuarios se encuentran también entre los más
relevantes como se mostró en la tabla I para la misma métrica
en la relación de mención, por lo que además de ser
generadores de estados de opinión, cuentan con un número de
partidiarios que sustentan sus criterios. Lo cual se manifiesta
a través de los retweets que son emitidos.
TABLA II
INTERMEDIACIÓN DE LA RELACIÓN DE RETWEET
6. Usuario Intermediación
ROTNSCOUNDREL 0.002%
HALE4JESUS 0.002%
LIBERTYBELL1000 0.001%
GAETASUSAN 0.001%
GENGSPATTON 0.001%
DESTINBEACH22 0.001%
CARMINEZOZZORA 0.001%
K1ERRY 0.001%
ARAYA_HOPE____ 0.001%
WESTXGAL 0.001%
El grado de entrada para la relación de retweet, se
interpreta como el componente de la popularidad y
efectividad de una cuenta de usuario. El resultado de esta
métrica puede ser apreciado en la tabla III.
Un usuario con alto grado de entrada para la relación de
retweet, tiene altas posibilidades de que los contenidos que
ponga en la red social sean reflejados por otros usuarios.
Estos usuarios son de interés para incrementar la efectividad
de las campañas comunicacionales pues permiten
incrementar el alcance de las mismas de forma natural.
TABLA III
GRADO DE ENTRADA DE LA RELACIÓN DE RETWEET
Usuario Grado de entrada
WORLDSTARFUNNY 6.08%
BARACKOBAMA 2.525%
REJECTS 1.89%
YOUAKEECOPYYY 1.644%
GQMAGAZINE 1.423%
BENSHAPIRO 1.291%
LOVENAAJI 1.201%
MRARVINGER 1.045%
ARAYA_HOPE____ 0.779%
DEARYOUFROMWE 0.738%
Mientras que en la tabla IV se puede apreciar el resultado
del análisis para el grado de salida de la relación de retweet.
Los usuarios que tienen un alto grado de salida para la
relación de retweet son aquellos que realizan el mayor
número de retweets de otros usuarios. Es una expresión de la
sociabilidad del usuario y de la permeabilidad del mismo para
socializar el mensaje con sus seguidores.
TABLA IV
GRADO DE SALIDA DE LA RELACIÓN DE RETWEET
Usuario Grado de salida
REALITYCHEK2015 0.164%
SONGBIRDCD 0.139%
LCHARRE93 0.123%
IDESIGNWIS 0.111%
TERRI_GEORGIA 0.102%
WINNI4U 0.086%
CLARISSAMEHLER 0.082%
KORRIFOSTER 0.082%
LAW1GLORIA 0.078%
TAHERDAVOODI 0.078%
IV. CONCLUSIONES
Como resultado de esta investigación se ha construido una
herramienta informática compuesta, que permite extraer las
relaciones de cita, retweet, y mención, así como realizar
análisis de detección de roles sobre estas.
Como resultado del análisis de roles realizado sobre la
comunidad de tweets estudiada es posible determinar cuales
usuarios ofrecen mejores posibilidades para servir como
comunicadores, o intermediarios sobre un tema específico.
Permitiendo optimizar el esfuerzo y los recursos a la hora de
planificar o evaluar alguna campaña comunicacional en esta
red social.
La presente investigación sienta las bases para el desarrollo
de otras sobre, la paralelización del cálculo de las métricas
abordadas, el uso de operadores de lógica difusa para
determinar la relevancia de los usuarios. Así como el
desarrollo de otras investigaciones que tengan como objetivo
específico otras redes sociales o servicios en Internet.
REFERENCIAS
[1] D. M. Boyd, y N. B. Ellison, “Social Network Sites: Definition,
History, and Scholarship”. Journal of Computer-Mediated
Communication, vol. 13, No. 1, pp. 210 - 230. 2007.
[2] Merrian-Webster, “Dictionary”. Available: http://www.merriam-
webster.com/dictionary/microblogging . 2014.
[3] Twitter.com, “Sobre”. Location: https://about.twitter.com/. 2014.
[4] L. Bode, y K. E. Darlymple. “Politics in 140 Characters or Less:
Campaign Communication, Network Interaction, and Political
Participation on Twitter”. 2014. Available:
http://dx.doi.org/10.1080/15377857.2014.959686
[5] Twitter.com, “Company”. Available:
https://about.twitter.com/company. 2015.
[6] Twitter.com, “The Straming APIs”. Available:
https://dev.twitter.com/docs/api/streaming. 2014.
[7] Twitter.com, “User streams”. Available:
https://dev.twitter.com/docs/streaming/userstreams. 2014.
[8] Twitter.com, “Site streams”. Available:
https://dev.twitter.com/docs/streaming/streams/site. 2014.
7. [9] L. R. Breiger, “The Analysis of Social Networks”, Handbook of Data
Analysis, Sage Publications, London, pp 505-526. 2004.
[10] V. Umadevi, “Case Stury: Centrality Measure Analysis on Co-
Authorships Network”. Journal of Global Research in Computer
Science, Vol. 4, No. 1, ISSN-2229-371X, 2013.
[11] C. J. Figueiras, “Subsistema de detección de roles de usuarios dentro
de comunidades de interés de Twitter”, Universidad de las Ciencias
Informáticas. La Habana. 2014.
[12] M. Tsvetovat, “Social Network Analisis for startups: Finding
connections on the social web”. O'Relly Media. 2011.
[13] U. Branders, “A Faster Algorithm for Betweenness Centrality”.
University of Konstanz. 2015.
[14] M. Meloni, “Analizando logs en 5 minutos con ELK”, Available:
http://bitnegro.blogspot.com/2014_12_01_archive.html. 2015.
[15] Mimacom, “Active sus bases de datos. Encuentra la información con
Elasticsearch”, Available: http://www.mimacom.es/soluciones-open-
source/enterprise-search. 2015.
[16] Elastic, “Kibana User Guide 4.1”. Available:
http://www.elastic.co/guide/en/kibana/current/introduction.html.
2015.
[17] Neo4j, “The Neo4j Manual v2.3.3”. Available:
http://neo4j.com/docs/stable/re01.html. 2016.