SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
Roles en comunidades de interés sobre el servicio
de redes sociales de Twitter
José Gabriel Espinosa Ramireza
, Katherine Tarazona Mezab
, Miguel Giancarlo Ormaza Cevallosc
a
SINI/Facultad I/Universidad de las Ciencias Informáticas
b
Ciencias Sociales del Comportamiento/Facultad de Ciencias Humanísticas y Sociales/Escuela de Psicología Preclínica,
Universidad Técnica de Manabí
c
Ciencias Administrativas/Facultad de Ciencias Administrativas y Económicas/Escuela de Administración,
Universidad Técnica de Manabí
jgespinosa@uci.cu, atarazona@utm.edu.ec, mormaza@utm.edu.ec
Resumen— Entre los servicios de redes sociales disponibles en
Internet se destaca el ofrecido por Twitter. Este se distingue por
ser un servicio de microblogging de gran aceptación a nivel
mundial. En el mismo los usarios van estableciendo los lazos que
constituyen el núcleo de la red social. Sobre estas relaciones se
realiza el intercambio de información, permitiendo que
mediante su estudio sea posible determinar el rol que desempeña
cada usuario, en un segmento de la red social. Este trabajo
pretende abordar un estudio de los roles de la comunidad de
interés generada entorno al Presidente de los Estados Unidos,
Barack Obama y su representatividad en el mundo. Su alcance
es netamente académico y se escogió esta personalidad por la
gran cantidad de contenidos que se generan entorno al mismo.
Se describen las herramientas informáticas empleadas, así como
los algoritmos utilizados y la interpretación de los valores
obtenidos en el marco del contexto social. El objetivo de la
presente investigación es obtener una visión del segmento de la
red social relativo al tema abordado en la que sea posible
esclarecer los roles que juegan los usuarios de acuerdo a las
relaciones activas (retweet, mencion, y cita) que se pueden
establecer dentro del sitio de redes sociales Twitter. De esta
forma se obtiene una perspectiva que profundiza en la
estructura de la red social, más allá del conteo de seguidores y
seguidos.
Palabras Claves— análisis de redes sociales, detección de roles
, métricas de centralidad, redes sociales, Twitter.
Abstract— Among social networking services available on the
Internet stands that offered by Twitter. This is distinguished by
being a microblogging service widely accepted worldwide.
Through it the users are establishing links that constitute the
core of the social network. Over these relations the information
exchange is performed, allowing their study to determine the
role played by each user within a segment of the network. This
work is addressed to study of the roles within the community of
interest generated around the President of the United States,
Barack Obama and his worldwide significancy. Its scope is
purely academic and this personality was chosen by the vast
amount of content that are generated around him. Information
technologies tools, as well as the algorithms used and the
interpretation of the values obtained under the social context are
described. The aim of this research is to obtain an insight into
the segment of the social network on the issue addressed in
which it is possible to clarify the roles that users play according
to active relationships (retweet, mention, and cites) that can be
set within the social networking site Twitter. Thus a perspective
that delves into the structure of the social network, beyond the
counting of followers and followed by.
Keywords— centrality metrics, role detection, social networking
analysis, social networks, Twitter.
I. INTRODUCCIÓN
Lo social es inherente a la naturaleza del ser humano, para
su desarrollo el hombre necesita del intercambio con sus
semejantes. Cada persona a lo largo de su vida va creando
lazos con otras sobre los que se construyen su propia red
social. Las redes sociales siempre han acompañado al ser
humano en su desarrollo, pero no fue hasta tiempos recientes
cuando estas se han hecho más tangibles gracias a la aparición
de sitios de redes sociales en Internet.
Los sitios de redes sociales se definen como aquellos
servicios basados en la Web que permiten al individuo
construir un perfil público o semipúblico dentro de las
fronteras del sistema y elaborar una lista de usuarios con los
que se conecta y navegar a través de las listas de conexiones
de otros usuarios [1].
En el año 2006 surge el servicio de redes sociales sobre
Internet denominado como Twitter. Aunque en sus inicios
Twitter solo estaba relacionado con el servico de mensajes
cortos, SMS (del inglés Short Message Service), de la
plataforma telefónica móvil, no demoró en hacerse de un
sólido lugar en Internet acaparando la atención del público a
nivel global [2].
Twitter es una red de información en tiempo real que
brinda las últimas historias, ideas, opiniones y noticias [3].
Dado que la entidad fundamental de esta red social es el
tweet, mensaje corto de apenas 140 caracteres, la misma se
enmarca dentro de la tendencia del microblogging.
Twitter es una poderosísima herramienta que permite
llegar al individuo de forma directa e inmediata. La
inmensidad de los contenidos que se generan en Twitter es
una fuente de información formidable de la cual auxiliarse
para la toma de decisiones sobre un tema en específico, así
como para desarrollar campañas de divulgación de forma
coordinada, efectiva y eficiente [4].
Para comprender mejor la dinámica de esta red social es
necesario auxiliarse de técnicas de análisis de redes sociales,
tales como la detección de roles en comunidades de interés
mediante la aplicación de métricas de centralidad. De esta
manera es posible obtener una visión estructurada de los roles
que desempeñan los miembros de una comunidad sobre
determinado tópico en específico.
El propósito de la presente investigación, netamente
académica, es representar la red social activa que se sustenta
sobre las relaciones de mención, cita y retweet, que incluyan
cadenas de texto previamente seleccionadas y relacionadas
con el presidente de los Estados Unidos, Barack Obama.
Para esto se especifica cómo se recolectaron los datos, se
diseñaron y elaboraron las herramientas para la ejecución del
estudio, así como el cálculo de las métricas que se utilizaron.
Y la interpretación de los análisis tanto en lo cantitativo como
desde el punto de vista cualitativo.
Diariamente se generan más de 500 000 000 mensajes en
el sitio de redes sociales Twitter. Además este servicio cuenta
con una media de 316 000 000 de usuarios activos,
mensualmente [5]. Es por esta razón que si se desea realizar
un estudio sobre una comunidad de interés, aunque esta sea
relativamente reducida, el número de usuarios y de mensajes
que se debe manejar continuará siendo grande, por lo que es
necesario auxiliarse de herramientas informáticas para la
ejecución del mismo.
El presente está estructurado en las secciónes de “método”,
“análisis de resultados” y “conclusiones”. En la sección
“método” se enumeran y describen las herramientas
informáticas utilizadas en la investigación, las métricas, los
algoritmos y métodos aplicados.
En la sección “análisis de los resultados” se describen los
datos obtenidos producto de la investigación y los mismos
son interpretados de acuerdo al contexto. Finalmente se arriba
a la sección “conclusiones” en la cual se resume el aporte de
la investigación así como son propuestas nuevas líneas de
investigación.
II. MÉTODO
A. API de Twitter
El primer paso para el análisis de redes sociales sobre los
datos que ofrece el sitio de redes sociales Twitter es la
recopilación de los tweets sobre la comunidad de interés. Para
esto se hace uso de las facilidades que para la integración con
terceros que ofrece el servicio de Twitter.
Twitter pone a disposición de los desarrolladores dos APIs
(interfaz de programación de aplicaciones del inglés,
application programming interface) el API REST, y el API
de streaming. El API REST provee interfaces simples para la
mayoría de las funcionalidades de Twitter. Entre las
operaciones que se pueden realizar a través del API REST se
encuentran la generación de tweets, gestión de mensajes
directos, mensajes no públicos entre usuarios, gestión de las
relaciones de seguimiento de usuarios, obtención de datos
geográficos, obtención de tendencias y la realización de
búsquedas, entre otras. El API REST está enfocada hacia la
ejecución de solicitudes de usuarios individuales.
El API de streaming se diferencia del API REST por ser
más compleja y estar orientada a un flujo de datos en tiempo
real mientras se mantenga la conexión [6]. El API de
streaming ofrece servicios mediante el flujo de usuario y el
flujo de sitio. El primero está diseñado para proveer un flujo
de datos y eventos específicos al usuario autenticado,
mientras que el segundo se utiliza para la realización de varias
acciones en representación de múltiples usuarios [7][8].
Tanto el API REST como el API de streaming son
utilizadas por las aplicaciones para comunicarse con los
servicios de Twitter, haciendo un cuidadoso balance de carga
para mantenerse dentro de los límites permitidos por Twitter.
De esta manera se pueden construir grandes colecciones
datos.
Para hacer uso el API de streaming con el propósito de
captar los tweets recuperados se desarrolló una aplicación
informática. Para la cual se utilizó el lenguaje de
programación Java y la biblioteca Hosebird Client (hbc) para
la conexión con el API de streaming de Twitter.
La aplicación captura y guarda los tweets, en la misma
medida que los recibe. Para su almacenamiento, y posterior
utilización, los tweets se mantienen con el mismo formato en
que son recibidos en un clúster de Elasticsearch. Mientras que
con el propósito de facilitar el cálculo de las métricas de
centralidad, se extraen los usuarios y las relaciones entre estos
para almacenar esta información en una base de datos
orientada a grafos sobre Neo4J.
B. Análisis de redes sociales y métricas de
centralidad estudiadas
“El análisis de redes sociales puede ser definido como la
disciplina de indagar en los patrones de las relaciones entre
los actores, así como los patrones de las interrelaciones sobre
los actores a diferentes niveles (tales como personas y
grupos)” [9].
El análisis de redes sociales se utiliza como una manera
estructurada de analizar el grado de relación informal entre
las personas, o incluso entre las organizaciones. El análisis de
redes sociales hace visibles estos patrones de interacción, que
no se encuentran explícitos, para identificar grupos
importantes con el fin de facilitar la colaboración eficaz [10].
Para la identificación de grupos y roles, existen diversos
algoritmos y medidas de centralidad que en conjunto pueden
determinar con un alto grado de precisión en qué medida un
usuario cumple una determinada función. Dentro de las
medidas de centralidad, hay cuatro que son ampliamente
utilizadas en el análisis de redes: centralidad de grado de
entrada y grado de salida, centralidad de intermediación, y
centralidad de cercanía [11].
La centralidad de grado es la más simple de las medidas de
centralidad. Corresponde al número de enlaces que posee un
individuo con los demás. En caso de que se pueda establecer
una dirección en el enlace se establecen dos criterios, grado
de entrada y grado de salida. En el sentido de relaciones
interpersonales, el primero puede interpretarse como una
medida de popularidad, mientras que el segundo como una
medida de sociabilidad [12]. El grado de salida, está dado por
la cantidad de transacciones que tienen como origen al nodo
estudiado, y el grado de entrada se basa en la cantidad de
transacciones en las que el nodo sea el destinatario.
La centralidad de intermediación se basa en el número de
caminos más cortos que pasan a través de un usuario. Los
usuarios con una alta intermediación juegan el rol de conectar
a los diferentes grupos, son los agentes y conectores que
mantienen juntos a los demás. Estando “en medio” significa
que un usuario tiene la capacidad de controlar el flujo de
información entre la mayoría del resto. Los individuos con
alta intermediación son los pivotes en el flujo de
conocimiento de la red. Los usuarios con mayor
intermediación también resultan en el mayor incremento en
la distancia típica entre los demás cuando son retirados [12].
Determinar qué nodos presentan una alta intermediación
en la red social de la comunidad de interés permite identificar
cuáles usuarios pueden servir como puentes para organizar
grupos, o constituyen factores críticos para la difusión de la
información dentro de la comunidad estudiada. Esta métrica
de centralidad impacta directamente sobre el poder de
convocatoria, y organización, ya que contribuye a identificar
los nodos críticos que sirven como puentes entre los
diferentes conjuntos de nodos en la red social.
La centralidad de cercanía puede ser considerada como una
medida de cuánto tiempo tomará para que la información se
propague desde un nodo determinado a los otros nodos en la
red. Para esto se calcula la distancia de cada nodo de la red
con respecto a los demás [12].
Esta métrica de centralidad puede ser muy útil a la hora de
elaborar campañas de divulgación o lanzar convocatorias,
puesto que permite optimizar los resultados del esfuerzo
invertido en la propagación de la información.
Los algoritmos para identificar los roles de un nodo u
usuario de una red social, no son excluyentes, y brindan la
información de en qué grado un usuario se desenvuelve en un
rol, lo que permite establecer comparaciones entre los
miembros de la red.
Para el cálculo de las métricas de intermediación se utilizó
el algoritmo desarrollado por Brander [13]. Este algoritmo
permite una reducción notable en los tiempos de ejecución
para el cálculo de las métricas de centralidad relacionadas
con el cálculo del camino mínimo. El incremento en la
eficiencia ofrecido por este algoritmo se basa en una nueva
técnica de acumulación que permite extender las capacidades
de cálculo a redes mayores y la evaluación simultánea de
métricas basadas en el cómputo del camino más corto.
Teniendo en cuenta que el grafo generado por cada tipo de
relación es direccionado y no ponderado, se decidió utilizar
la variante del algoritmo de Brander basada en un glotón
(breadth-first search). De esta forma se calcula el índice de
centralidad resolviendo para cada vértice el problema de los
caminos más cortos, con un único origen. Al finalizar cada
iteración las dependencias del origen hacia cada uno de los
otros vértices son sumadas a la centralidad de este [13].
Para el cálculo de la centralidad de intermediación y
cercanía se desarrolló una implementación lineal del
algoritmo propuesto por Brander , utilizando el lenguaje de
programación Java. Para el cálculo de las métricas de
centralidad de grado de salida y grado de entrada, se utilizan
los mecanismos de consultas del propio Neo4j. De esta
manera el cálculo de las métricas se ubica dentro del servidor
de base de datos Neo4j, en forma de servicios para ser
consumidos por otros componentes o aplicaciones externas,
mediante un API REST.
Figura. 1. Segmento de código del glotón implementado para
pluggin de Neo4j encargado el cálculo de las métricas de
centralidad.
C. Componentes de la solución
Una vez se recibe un tweet proveniente del servicio del API
de Twitter es necesario almacenarlo para su posterior análisis.
Para esto se utiliza el motor de búsqueda Elasticsearch,
basado en Apache Lucene [14] y el sistema de gestión de
bases de datos orientada a grafos Neo4j.
El uso de dos sistemas de almacenamiento tiene su
fundamento en la necesidad de guardar íntegramente el tweet
y a la vez modelar en un grafo las relaciones. En este grafo
los usuarios se representan como nodos y las relaciones
activas de mención, cita o retweet como aristas entre estos.
Cada una de estas aristas, es representada en la base de datos,
manteniendo el identificador del tweet y una marca temporal
como atributos.
Elasticsearch es una herramienta libre y de código abierto,
liberada bajo los términos de la licencia Apache 2. Su
flexibilidad e independencia de la plataforma permite que se
pueda utilizar en entornos tanto locales como remotos [15].
Se diferencia de otros motores de búsqueda por hacer pública
la gestión y consulta de estos índices mediante un API REST.
Figura. 2. Representación de un subconjunto de los datos
almacenados en el sistema de base de datos orientado a grafos
Neo4j.
Este motor de búsqueda ofrece un alto grado de fiabilidad
y escalabilidad, permitiendo una fácil configuración de las
búsquedas usando clústeres. Además, ofrece seguridad ya que
puede funcionar de forma aislada dentro de la red.
Elasticsearch no requiere un esquema fijo de datos como las
base de datos relacionales (SQL, del inglés structured query
language), esta característica le posibilita realizar búsquedas
sobre datos arbitrarios en aplicaciones que manejan grandes
volúmenes de datos [15].
Elasticsearch además ofrece facilidades para su integración
punto a punto con otras herramientas. Para la realización de
consultas sobre las comunidades de tweets y visualización de
los resultados, en gráficas comparativas, se emplea la
herramienta Kibana.
Kibana es una plataforma de código abierto para el análisis
y la visualización diseñada para integrarse con Elasticsearch.
La misma puede ser utilizada para buscar, visualizar e
interactuar con los datos almacenados en los índices de
Elasticsearch. Fácilmente se pueden realizar análisis
avanzados de datos y visualizarlos en varios gráficos, tablas
y mapas [16].
Kibana facilita la comprensión de la información contenida
en grandes volúmenes de datos. Al utilizar interfaces
compatibles con los navegadores Web permite crear
rápidamente gráficas en las que se muestran los cambios sobre
las consultas realizadas a Elasticsearch en tiempo real [16].
Figura. 3. Panel de Kibana dentro de la aplicación.
Haciendo uso de una instancia de Kibana se obtienen las
facilidades necesarias para realizar consultas sobre las
colecciones de tweets en base a requerimientos de información
específicos. Kibana ofrece un alto nivel de flexibilidad para el
estudio de las comunidades de interés, pero el mismo no está
diseñado para realizar la detección de roles. Para esta tarea fue
necesario desarrollar una aplicación de propósito específico.
Como anteriormente se mencionó para almacenar la
representación del grafo de los usuarios de la comunidad se
utiliza el gestor de base de datos Neo4J. A diferencia de los
sistemas de gestión de base de datos tradicionales no
almacena los datos en forma de tablas y relaciones, en lugar
de esto representa los datos como nodos y relaciones de un
grafo [17]. El mismo ofrece las facilidades para extender sus
funcionalidades mediante el desarrollo de plugins que le
añadan nuevas características. Las funcionalidades necesarias
para el cálculo de estas métricas de centralidad, sobre el
algoritmo de Brander, fueron encapsuladas en un plugin
desarrollado utilizando el lenguaje de programación Java y
expuestas mediante el API REST de Neo4J.
Los componentes desarrollados fueron integrados para que
acometieran el estudio, en el flujo que se describe a
continuación. Los tweets son recuperados mediante el
componente para conexión con el API de stream de Twitter,
para ser inmediatamente almacenados, tal y como se
recibieron, en ElasticSearch y a la vez ser procesados para la
extracción de los autores, los usuarios mencionados, y los
autores de retweet. Los datos extraidos del procesamiento del
tweet serán almacenados en la base de datos de Neo4J,
conformando un grafo dirijido, y no ponderado en el cual los
usuarios se representan como nodos y las relaciones son las
aristas. Mediante una tarea programada se ejecuta una
aplicación periódicamente que tiene como objetivo consultar
el API Rest de Neo4J, para obtener los resultados de la
detección de roles y almacenar estos resultados en
Elasticsearch. Estos resultados son guardados con la adición
de una marca temporal, que sirva para rastrear
cronológicamente como se ha comportado cada usuario en el
desempeño de cada rol.
III. ANÁLISIS DE RESULTADOS
Los resultados establecen las relaciones entre los datos
obtenidos, el problema de investigación, el método y el
soporte teórico de la revisión de la literatura. Los resultados
se presentan en una secuencia lógica y se recomienda
presentarlos de forma sintetizada en tablas, figuras, etc.
Dado que el propósito de la presente investigación es
académico se conformó una colección pequeña de 50 653
tweets, de los cuales se extrajeron 35 035 usuarios, 34 401
relaciones de mención, 2 745 relaciones de cita y 24 392 de
retweet. Estos tweets tienen en común que en su cuerpo
incluyen el nombre de pila del presidente de los Estados
Unidos, “Obama”. Los tweets recuperados fueron tratados
para extraer las relaciones de mención, cita y retweet, así
como los usuarios implicados en estas. Es importante destacar
que el conjunto de tweets estudiados es realmente pequeño
para los que se generan a diario, incluso para un sólo término
de búsqueda.
La relación de retweet, se establece cuando un usuario
selecciona el tweet generado por otro para realizar la acción
de comunicarlo a sus seguidores. Esta relación extiende el
alcance de la capacidad de comunicación de la fuente original
a los seguidores del usuario que realiza el retweet y afianza el
contenido del mensaje.
Las relaciones de cita tienen lugar cuando se toma el tweet
de otro usuario y se le adiciona algún comentario. Este tipo
de relación además de ser similar al retweet, incluye
valoraciones del intermediario que pueden tener diferentes
matices. El grafo que se genera por este tipo de relación tiene
la importancia de que tienen embebida la emisión de criterio
y establecimiento de posturas sobre los contenidos de los
tweets.
Las menciones ocurren cuando en el cuerpo del tweet se
incluye el nombre de usuario, precedido por el carácter de
arroba, “@”. Esto se utiliza para realizar una referencia
directa al usuario en cuestión, y puede ser tomada en cuenta
como una referencia de la relevancia de un usuario.
El análisis realizado está orientado a las relaciones antes
mencionadas, a continuación se exponen un resumen de los
resultados encontrados, y se hace una valoración de estos de
acuerdo a la implicación de la métrica expuesta para el
funcionamiento de la red social estudiada.
TABLA I
INTERMEDIACIÓN DE LA RELACIÓN DE MENCIÓN
Usuario Intermediación
PLAYTRUMPSCARD 0.005%
ROTNSCOUNDREL 0.004%
HORSESHORT 0.004%
LIBERTYBELL1000 0.004%
HALE4JESUS 0.004%
DESTINBEACH22 0.003%
GAETASUSAN 0.002%
DSF2020 0.002%
STEPH93065 0.002%
JIMLIBERTARIAN 0.002%
Los resultados obtenidos del análisis de intermediación
para la relación de mención se muestran en la tabla I. Estos
resultados pueden interpretarse como los usuarios que son
centro de la polémica de la red. Es decir aquellos que son
propensos a generar temas de debate, que conlleven que los
otros usuarios los mencionen en sus tweets, en muchos casos
en forma de respuesta.
El perfil social de estos usuarios los hacen propicios para
comunicar temas de actualidad ya que tienen una comunidad
de usuarios que se mantienen pendientes de sus
publicaciones, transformándose en generadores de estados de
opinión. Cuentan con una comunidad activa de seguidores
que se muestran receptivos y emiten reacciones a las
publicaciones de los primeros, y que a la vez contribuyen a la
socialización de los contenidos en la red.
Los usuarios con una alta intermediación de la relación de
mención se distinguen por ser puntos de conección entre las
subredes conformadas por las relaciones de mención. Estos
usuarios sirven de puente entre los subconjuntos de usuarios
y los temas tratados.
En la tabla II se muestran los 10 usuarios más relevantes
en la métrica de intermediación por la relación de retweet.
Varios de estos usuarios se encuentran también entre los más
relevantes como se mostró en la tabla I para la misma métrica
en la relación de mención, por lo que además de ser
generadores de estados de opinión, cuentan con un número de
partidiarios que sustentan sus criterios. Lo cual se manifiesta
a través de los retweets que son emitidos.
TABLA II
INTERMEDIACIÓN DE LA RELACIÓN DE RETWEET
Usuario Intermediación
ROTNSCOUNDREL 0.002%
HALE4JESUS 0.002%
LIBERTYBELL1000 0.001%
GAETASUSAN 0.001%
GENGSPATTON 0.001%
DESTINBEACH22 0.001%
CARMINEZOZZORA 0.001%
K1ERRY 0.001%
ARAYA_HOPE____ 0.001%
WESTXGAL 0.001%
El grado de entrada para la relación de retweet, se
interpreta como el componente de la popularidad y
efectividad de una cuenta de usuario. El resultado de esta
métrica puede ser apreciado en la tabla III.
Un usuario con alto grado de entrada para la relación de
retweet, tiene altas posibilidades de que los contenidos que
ponga en la red social sean reflejados por otros usuarios.
Estos usuarios son de interés para incrementar la efectividad
de las campañas comunicacionales pues permiten
incrementar el alcance de las mismas de forma natural.
TABLA III
GRADO DE ENTRADA DE LA RELACIÓN DE RETWEET
Usuario Grado de entrada
WORLDSTARFUNNY 6.08%
BARACKOBAMA 2.525%
REJECTS 1.89%
YOUAKEECOPYYY 1.644%
GQMAGAZINE 1.423%
BENSHAPIRO 1.291%
LOVENAAJI 1.201%
MRARVINGER 1.045%
ARAYA_HOPE____ 0.779%
DEARYOUFROMWE 0.738%
Mientras que en la tabla IV se puede apreciar el resultado
del análisis para el grado de salida de la relación de retweet.
Los usuarios que tienen un alto grado de salida para la
relación de retweet son aquellos que realizan el mayor
número de retweets de otros usuarios. Es una expresión de la
sociabilidad del usuario y de la permeabilidad del mismo para
socializar el mensaje con sus seguidores.
TABLA IV
GRADO DE SALIDA DE LA RELACIÓN DE RETWEET
Usuario Grado de salida
REALITYCHEK2015 0.164%
SONGBIRDCD 0.139%
LCHARRE93 0.123%
IDESIGNWIS 0.111%
TERRI_GEORGIA 0.102%
WINNI4U 0.086%
CLARISSAMEHLER 0.082%
KORRIFOSTER 0.082%
LAW1GLORIA 0.078%
TAHERDAVOODI 0.078%
IV. CONCLUSIONES
Como resultado de esta investigación se ha construido una
herramienta informática compuesta, que permite extraer las
relaciones de cita, retweet, y mención, así como realizar
análisis de detección de roles sobre estas.
Como resultado del análisis de roles realizado sobre la
comunidad de tweets estudiada es posible determinar cuales
usuarios ofrecen mejores posibilidades para servir como
comunicadores, o intermediarios sobre un tema específico.
Permitiendo optimizar el esfuerzo y los recursos a la hora de
planificar o evaluar alguna campaña comunicacional en esta
red social.
La presente investigación sienta las bases para el desarrollo
de otras sobre, la paralelización del cálculo de las métricas
abordadas, el uso de operadores de lógica difusa para
determinar la relevancia de los usuarios. Así como el
desarrollo de otras investigaciones que tengan como objetivo
específico otras redes sociales o servicios en Internet.
REFERENCIAS
[1] D. M. Boyd, y N. B. Ellison, “Social Network Sites: Definition,
History, and Scholarship”. Journal of Computer-Mediated
Communication, vol. 13, No. 1, pp. 210 - 230. 2007.
[2] Merrian-Webster, “Dictionary”. Available: http://www.merriam-
webster.com/dictionary/microblogging . 2014.
[3] Twitter.com, “Sobre”. Location: https://about.twitter.com/. 2014.
[4] L. Bode, y K. E. Darlymple. “Politics in 140 Characters or Less:
Campaign Communication, Network Interaction, and Political
Participation on Twitter”. 2014. Available:
http://dx.doi.org/10.1080/15377857.2014.959686
[5] Twitter.com, “Company”. Available:
https://about.twitter.com/company. 2015.
[6] Twitter.com, “The Straming APIs”. Available:
https://dev.twitter.com/docs/api/streaming. 2014.
[7] Twitter.com, “User streams”. Available:
https://dev.twitter.com/docs/streaming/userstreams. 2014.
[8] Twitter.com, “Site streams”. Available:
https://dev.twitter.com/docs/streaming/streams/site. 2014.
[9] L. R. Breiger, “The Analysis of Social Networks”, Handbook of Data
Analysis, Sage Publications, London, pp 505-526. 2004.
[10] V. Umadevi, “Case Stury: Centrality Measure Analysis on Co-
Authorships Network”. Journal of Global Research in Computer
Science, Vol. 4, No. 1, ISSN-2229-371X, 2013.
[11] C. J. Figueiras, “Subsistema de detección de roles de usuarios dentro
de comunidades de interés de Twitter”, Universidad de las Ciencias
Informáticas. La Habana. 2014.
[12] M. Tsvetovat, “Social Network Analisis for startups: Finding
connections on the social web”. O'Relly Media. 2011.
[13] U. Branders, “A Faster Algorithm for Betweenness Centrality”.
University of Konstanz. 2015.
[14] M. Meloni, “Analizando logs en 5 minutos con ELK”, Available:
http://bitnegro.blogspot.com/2014_12_01_archive.html. 2015.
[15] Mimacom, “Active sus bases de datos. Encuentra la información con
Elasticsearch”, Available: http://www.mimacom.es/soluciones-open-
source/enterprise-search. 2015.
[16] Elastic, “Kibana User Guide 4.1”. Available:
http://www.elastic.co/guide/en/kibana/current/introduction.html.
2015.
[17] Neo4j, “The Neo4j Manual v2.3.3”. Available:
http://neo4j.com/docs/stable/re01.html. 2016.

Más contenido relacionado

Similar a Roles de las comunidades twitter Espe 2016

Las redes sociales
Las redes socialesLas redes sociales
Las redes socialesSolangeAlban
 
193001 Pérez - Rivera - Luisa Rivera.pdf
193001 Pérez - Rivera - Luisa Rivera.pdf193001 Pérez - Rivera - Luisa Rivera.pdf
193001 Pérez - Rivera - Luisa Rivera.pdfrosaliamllaca
 
Atrapados en la redes sociales
Atrapados en la redes socialesAtrapados en la redes sociales
Atrapados en la redes socialesBarrios Eva Roxana
 
Las redes sociales joselyn tapia
Las redes sociales joselyn tapiaLas redes sociales joselyn tapia
Las redes sociales joselyn tapiajoselynthalya
 
Redes sociales 294135
Redes sociales 294135Redes sociales 294135
Redes sociales 294135oswaldodiaz50
 
Las redes sociales en internet. Virginia y Ruth
Las redes sociales en internet. Virginia y RuthLas redes sociales en internet. Virginia y Ruth
Las redes sociales en internet. Virginia y Ruthruthperezmolina
 
Las redes sociales
Las redes sociales Las redes sociales
Las redes sociales yamhrkl
 
Benemérito universidad autónoma de puebla ensayo dhtic
Benemérito universidad  autónoma de puebla ensayo dhticBenemérito universidad  autónoma de puebla ensayo dhtic
Benemérito universidad autónoma de puebla ensayo dhticpxxx
 
Las redes sociales (Web 2.0)
Las redes sociales (Web 2.0)Las redes sociales (Web 2.0)
Las redes sociales (Web 2.0)Yiovanna Gonzalez
 
Redes sociales guissela
Redes sociales guisselaRedes sociales guissela
Redes sociales guisselaXavier Pillajo
 
Trabajo convergencia tecnologica 1
Trabajo convergencia tecnologica 1Trabajo convergencia tecnologica 1
Trabajo convergencia tecnologica 1JenniferPatricia6
 
Trabajo convergencia tecnologica 1 (1)
Trabajo convergencia tecnologica 1 (1)Trabajo convergencia tecnologica 1 (1)
Trabajo convergencia tecnologica 1 (1)barreraricardog
 

Similar a Roles de las comunidades twitter Espe 2016 (20)

Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Espo ed
Espo edEspo ed
Espo ed
 
Mod7 tema3rrs senui
Mod7 tema3rrs senuiMod7 tema3rrs senui
Mod7 tema3rrs senui
 
Las redes sociales
Las redes socialesLas redes sociales
Las redes sociales
 
193001 Pérez - Rivera - Luisa Rivera.pdf
193001 Pérez - Rivera - Luisa Rivera.pdf193001 Pérez - Rivera - Luisa Rivera.pdf
193001 Pérez - Rivera - Luisa Rivera.pdf
 
Atrapados en la redes sociales
Atrapados en la redes socialesAtrapados en la redes sociales
Atrapados en la redes sociales
 
Las redes sociales joselyn tapia
Las redes sociales joselyn tapiaLas redes sociales joselyn tapia
Las redes sociales joselyn tapia
 
Redes sociales 294135
Redes sociales 294135Redes sociales 294135
Redes sociales 294135
 
Redes sociales xp
Redes sociales xpRedes sociales xp
Redes sociales xp
 
Los medios sociales en la sociedad actual
Los medios sociales en la sociedad actualLos medios sociales en la sociedad actual
Los medios sociales en la sociedad actual
 
Las redes sociales en internet. Virginia y Ruth
Las redes sociales en internet. Virginia y RuthLas redes sociales en internet. Virginia y Ruth
Las redes sociales en internet. Virginia y Ruth
 
Las redes sociales
Las redes sociales Las redes sociales
Las redes sociales
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Presentación inf
Presentación infPresentación inf
Presentación inf
 
Benemérito universidad autónoma de puebla ensayo dhtic
Benemérito universidad  autónoma de puebla ensayo dhticBenemérito universidad  autónoma de puebla ensayo dhtic
Benemérito universidad autónoma de puebla ensayo dhtic
 
Las redes sociales (Web 2.0)
Las redes sociales (Web 2.0)Las redes sociales (Web 2.0)
Las redes sociales (Web 2.0)
 
Evaluacion cisneros galeano
Evaluacion cisneros   galeanoEvaluacion cisneros   galeano
Evaluacion cisneros galeano
 
Redes sociales guissela
Redes sociales guisselaRedes sociales guissela
Redes sociales guissela
 
Trabajo convergencia tecnologica 1
Trabajo convergencia tecnologica 1Trabajo convergencia tecnologica 1
Trabajo convergencia tecnologica 1
 
Trabajo convergencia tecnologica 1 (1)
Trabajo convergencia tecnologica 1 (1)Trabajo convergencia tecnologica 1 (1)
Trabajo convergencia tecnologica 1 (1)
 

Más de ticsocialesec

Analisis paginas web Espe 2016
Analisis paginas web Espe 2016Analisis paginas web Espe 2016
Analisis paginas web Espe 2016ticsocialesec
 
Datos abiertos Espe 2016
Datos abiertos Espe 2016Datos abiertos Espe 2016
Datos abiertos Espe 2016ticsocialesec
 
Agenda espe investiga 2017 (2)
Agenda espe investiga 2017 (2)Agenda espe investiga 2017 (2)
Agenda espe investiga 2017 (2)ticsocialesec
 
ESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el uso de las TIC´S
ESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el  uso de las TIC´SESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el  uso de las TIC´S
ESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el uso de las TIC´Sticsocialesec
 
Presentación inteligencia artificial (ronny rocahono)
Presentación inteligencia artificial (ronny rocahono)Presentación inteligencia artificial (ronny rocahono)
Presentación inteligencia artificial (ronny rocahono)ticsocialesec
 
ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO DOM...
ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO  DOM...ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO  DOM...
ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO DOM...ticsocialesec
 
ITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓN
ITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓNITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓN
ITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓNticsocialesec
 
ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...
ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...
ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...ticsocialesec
 
ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)
ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)
ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)ticsocialesec
 
ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...
ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...
ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...ticsocialesec
 
ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...
ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...
ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...ticsocialesec
 
016 la domótica articulo_juliana_castro (2_a)
016 la domótica articulo_juliana_castro (2_a)016 la domótica articulo_juliana_castro (2_a)
016 la domótica articulo_juliana_castro (2_a)ticsocialesec
 
ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...
ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...
ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...ticsocialesec
 
ITIN SD 014 TICS EN LA GESTIÓN EMPRESARIAL
ITIN SD 014 TICS EN LA GESTIÓN EMPRESARIALITIN SD 014 TICS EN LA GESTIÓN EMPRESARIAL
ITIN SD 014 TICS EN LA GESTIÓN EMPRESARIALticsocialesec
 
ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...
ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...
ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...ticsocialesec
 
ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...
ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...
ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...ticsocialesec
 
ITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVAR
ITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVARITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVAR
ITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVARticsocialesec
 
ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO EN LA PROVINCIA DE SANTO DOMINGO...
ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO  EN LA PROVINCIA DE SANTO DOMINGO...ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO  EN LA PROVINCIA DE SANTO DOMINGO...
ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO EN LA PROVINCIA DE SANTO DOMINGO...ticsocialesec
 
ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...
ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...
ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...ticsocialesec
 
ITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’S
ITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’SITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’S
ITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’Sticsocialesec
 

Más de ticsocialesec (20)

Analisis paginas web Espe 2016
Analisis paginas web Espe 2016Analisis paginas web Espe 2016
Analisis paginas web Espe 2016
 
Datos abiertos Espe 2016
Datos abiertos Espe 2016Datos abiertos Espe 2016
Datos abiertos Espe 2016
 
Agenda espe investiga 2017 (2)
Agenda espe investiga 2017 (2)Agenda espe investiga 2017 (2)
Agenda espe investiga 2017 (2)
 
ESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el uso de las TIC´S
ESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el  uso de las TIC´SESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el  uso de las TIC´S
ESPE SD INVESTIGA 03 - Mejorar la economía de las Pymes con el uso de las TIC´S
 
Presentación inteligencia artificial (ronny rocahono)
Presentación inteligencia artificial (ronny rocahono)Presentación inteligencia artificial (ronny rocahono)
Presentación inteligencia artificial (ronny rocahono)
 
ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO DOM...
ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO  DOM...ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO  DOM...
ITIN SD 001 USO DE LA GEO LOCALIZACIÓN EN EL TRANSPORTE PÚBLICO DE SANTO DOM...
 
ITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓN
ITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓNITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓN
ITIN SD 021 INFLUENCIA DE LAS REDES SOCIALES EN LA EDUCACIÓN
 
ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...
ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...
ITIN SD 020 PROPUESTA DE IMPLEMENTACIÓN DE UNA APP PARA ANDROID, SOBRE LA SAL...
 
ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)
ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)
ITIN SD 019 IMPORTANCIA DE LA TECNOLOGIA EN LA EDUCACION PRIMARIA (borrador)
 
ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...
ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...
ITIN SD 018 PROPUESTA PARA EL USO EFICIENTE E INTELIGENTE DE LA ENERGÍA EN LA...
 
ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...
ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...
ITIN SD 017 USO DE LA GAMIFICACION PARA IDENTIFICAR PROBLEMAS DE SALUD POR EL...
 
016 la domótica articulo_juliana_castro (2_a)
016 la domótica articulo_juliana_castro (2_a)016 la domótica articulo_juliana_castro (2_a)
016 la domótica articulo_juliana_castro (2_a)
 
ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...
ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...
ITIN SD 015 Como incide la tecnología en el desarrollo del niño preescolar (b...
 
ITIN SD 014 TICS EN LA GESTIÓN EMPRESARIAL
ITIN SD 014 TICS EN LA GESTIÓN EMPRESARIALITIN SD 014 TICS EN LA GESTIÓN EMPRESARIAL
ITIN SD 014 TICS EN LA GESTIÓN EMPRESARIAL
 
ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...
ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...
ITIN SD 013 PROPUESTA PARA LA APLICACIÓN DE LAS TIC`S EN EL PROCESO EDUCATIVO...
 
ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...
ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...
ITIN SD 012 IMPLEMENTACIÓN Y DESAROLLO DE LA INTELIGENCIA ARTIFICIAL EN APLIC...
 
ITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVAR
ITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVARITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVAR
ITIN SD 011 ALFABETIZACIÓN DIGITAL EN LA URB. SUEÑO DE BOLIVAR
 
ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO EN LA PROVINCIA DE SANTO DOMINGO...
ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO  EN LA PROVINCIA DE SANTO DOMINGO...ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO  EN LA PROVINCIA DE SANTO DOMINGO...
ESPE SD 010 UTILIDAD DEL DINERO ELECTRÓNICO EN LA PROVINCIA DE SANTO DOMINGO...
 
ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...
ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...
ITIN SD 009 ANÁLISIS DE APLICACIONES MÓVILES PARA LA EDUCACIÓN EN EL ÁREA DE ...
 
ITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’S
ITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’SITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’S
ITIN SD 008 MEJORAR LA ECONOMÍA DE LAS PYMES CON EL USO DE LAS TIC’S
 

Último

Introducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.pptIntroducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.pptEduardoCorado
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Francisco Javier Mora Serrano
 
TALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación públicaTALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación públicaSantiagoSanchez353883
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaSHERELYNSAMANTHAPALO1
 
Diapositiva de Topografía Nivelación simple y compuesta
Diapositiva de Topografía Nivelación simple y compuestaDiapositiva de Topografía Nivelación simple y compuesta
Diapositiva de Topografía Nivelación simple y compuestajeffsalazarpuente
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdfAnthonyTiclia
 
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfPresentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfMIGUELANGELCONDORIMA4
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfKEVINYOICIAQUINOSORI
 
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa  tipos y funcionamientoCaldera Recuperadora de químicos en celulosa  tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa tipos y funcionamientoRobertoAlejandroCast6
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptxGARCIARAMIREZCESAR
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaXimenaFallaLecca1
 
Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxEverardoRuiz8
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7luisanthonycarrascos
 
Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...
Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...
Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...SuannNeyraChongShing
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfDanielaVelasquez553560
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALKATHIAMILAGRITOSSANC
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTFundación YOD YOD
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.ALEJANDROLEONGALICIA
 

Último (20)

Introducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.pptIntroducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.ppt
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
 
TALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación públicaTALLER PAEC preparatoria directamente de la secretaria de educación pública
TALLER PAEC preparatoria directamente de la secretaria de educación pública
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresa
 
Diapositiva de Topografía Nivelación simple y compuesta
Diapositiva de Topografía Nivelación simple y compuestaDiapositiva de Topografía Nivelación simple y compuesta
Diapositiva de Topografía Nivelación simple y compuesta
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
 
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfPresentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdf
 
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdfVALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
 
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa  tipos y funcionamientoCaldera Recuperadora de químicos en celulosa  tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
 
Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptx
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7
 
Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...
Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...
Polimeros.LAS REACCIONES DE POLIMERIZACION QUE ES COMO EN QUIMICA LLAMAMOS A ...
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdf
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NIST
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.
 

Roles de las comunidades twitter Espe 2016

  • 1. Roles en comunidades de interés sobre el servicio de redes sociales de Twitter José Gabriel Espinosa Ramireza , Katherine Tarazona Mezab , Miguel Giancarlo Ormaza Cevallosc a SINI/Facultad I/Universidad de las Ciencias Informáticas b Ciencias Sociales del Comportamiento/Facultad de Ciencias Humanísticas y Sociales/Escuela de Psicología Preclínica, Universidad Técnica de Manabí c Ciencias Administrativas/Facultad de Ciencias Administrativas y Económicas/Escuela de Administración, Universidad Técnica de Manabí jgespinosa@uci.cu, atarazona@utm.edu.ec, mormaza@utm.edu.ec Resumen— Entre los servicios de redes sociales disponibles en Internet se destaca el ofrecido por Twitter. Este se distingue por ser un servicio de microblogging de gran aceptación a nivel mundial. En el mismo los usarios van estableciendo los lazos que constituyen el núcleo de la red social. Sobre estas relaciones se realiza el intercambio de información, permitiendo que mediante su estudio sea posible determinar el rol que desempeña cada usuario, en un segmento de la red social. Este trabajo pretende abordar un estudio de los roles de la comunidad de interés generada entorno al Presidente de los Estados Unidos, Barack Obama y su representatividad en el mundo. Su alcance es netamente académico y se escogió esta personalidad por la gran cantidad de contenidos que se generan entorno al mismo. Se describen las herramientas informáticas empleadas, así como los algoritmos utilizados y la interpretación de los valores obtenidos en el marco del contexto social. El objetivo de la presente investigación es obtener una visión del segmento de la red social relativo al tema abordado en la que sea posible esclarecer los roles que juegan los usuarios de acuerdo a las relaciones activas (retweet, mencion, y cita) que se pueden establecer dentro del sitio de redes sociales Twitter. De esta forma se obtiene una perspectiva que profundiza en la estructura de la red social, más allá del conteo de seguidores y seguidos. Palabras Claves— análisis de redes sociales, detección de roles , métricas de centralidad, redes sociales, Twitter. Abstract— Among social networking services available on the Internet stands that offered by Twitter. This is distinguished by being a microblogging service widely accepted worldwide. Through it the users are establishing links that constitute the core of the social network. Over these relations the information exchange is performed, allowing their study to determine the role played by each user within a segment of the network. This work is addressed to study of the roles within the community of interest generated around the President of the United States, Barack Obama and his worldwide significancy. Its scope is purely academic and this personality was chosen by the vast amount of content that are generated around him. Information technologies tools, as well as the algorithms used and the interpretation of the values obtained under the social context are described. The aim of this research is to obtain an insight into the segment of the social network on the issue addressed in which it is possible to clarify the roles that users play according to active relationships (retweet, mention, and cites) that can be set within the social networking site Twitter. Thus a perspective that delves into the structure of the social network, beyond the counting of followers and followed by. Keywords— centrality metrics, role detection, social networking analysis, social networks, Twitter. I. INTRODUCCIÓN Lo social es inherente a la naturaleza del ser humano, para su desarrollo el hombre necesita del intercambio con sus semejantes. Cada persona a lo largo de su vida va creando lazos con otras sobre los que se construyen su propia red social. Las redes sociales siempre han acompañado al ser humano en su desarrollo, pero no fue hasta tiempos recientes cuando estas se han hecho más tangibles gracias a la aparición de sitios de redes sociales en Internet. Los sitios de redes sociales se definen como aquellos servicios basados en la Web que permiten al individuo construir un perfil público o semipúblico dentro de las fronteras del sistema y elaborar una lista de usuarios con los que se conecta y navegar a través de las listas de conexiones de otros usuarios [1]. En el año 2006 surge el servicio de redes sociales sobre Internet denominado como Twitter. Aunque en sus inicios Twitter solo estaba relacionado con el servico de mensajes cortos, SMS (del inglés Short Message Service), de la plataforma telefónica móvil, no demoró en hacerse de un sólido lugar en Internet acaparando la atención del público a nivel global [2]. Twitter es una red de información en tiempo real que brinda las últimas historias, ideas, opiniones y noticias [3]. Dado que la entidad fundamental de esta red social es el tweet, mensaje corto de apenas 140 caracteres, la misma se enmarca dentro de la tendencia del microblogging. Twitter es una poderosísima herramienta que permite llegar al individuo de forma directa e inmediata. La inmensidad de los contenidos que se generan en Twitter es una fuente de información formidable de la cual auxiliarse
  • 2. para la toma de decisiones sobre un tema en específico, así como para desarrollar campañas de divulgación de forma coordinada, efectiva y eficiente [4]. Para comprender mejor la dinámica de esta red social es necesario auxiliarse de técnicas de análisis de redes sociales, tales como la detección de roles en comunidades de interés mediante la aplicación de métricas de centralidad. De esta manera es posible obtener una visión estructurada de los roles que desempeñan los miembros de una comunidad sobre determinado tópico en específico. El propósito de la presente investigación, netamente académica, es representar la red social activa que se sustenta sobre las relaciones de mención, cita y retweet, que incluyan cadenas de texto previamente seleccionadas y relacionadas con el presidente de los Estados Unidos, Barack Obama. Para esto se especifica cómo se recolectaron los datos, se diseñaron y elaboraron las herramientas para la ejecución del estudio, así como el cálculo de las métricas que se utilizaron. Y la interpretación de los análisis tanto en lo cantitativo como desde el punto de vista cualitativo. Diariamente se generan más de 500 000 000 mensajes en el sitio de redes sociales Twitter. Además este servicio cuenta con una media de 316 000 000 de usuarios activos, mensualmente [5]. Es por esta razón que si se desea realizar un estudio sobre una comunidad de interés, aunque esta sea relativamente reducida, el número de usuarios y de mensajes que se debe manejar continuará siendo grande, por lo que es necesario auxiliarse de herramientas informáticas para la ejecución del mismo. El presente está estructurado en las secciónes de “método”, “análisis de resultados” y “conclusiones”. En la sección “método” se enumeran y describen las herramientas informáticas utilizadas en la investigación, las métricas, los algoritmos y métodos aplicados. En la sección “análisis de los resultados” se describen los datos obtenidos producto de la investigación y los mismos son interpretados de acuerdo al contexto. Finalmente se arriba a la sección “conclusiones” en la cual se resume el aporte de la investigación así como son propuestas nuevas líneas de investigación. II. MÉTODO A. API de Twitter El primer paso para el análisis de redes sociales sobre los datos que ofrece el sitio de redes sociales Twitter es la recopilación de los tweets sobre la comunidad de interés. Para esto se hace uso de las facilidades que para la integración con terceros que ofrece el servicio de Twitter. Twitter pone a disposición de los desarrolladores dos APIs (interfaz de programación de aplicaciones del inglés, application programming interface) el API REST, y el API de streaming. El API REST provee interfaces simples para la mayoría de las funcionalidades de Twitter. Entre las operaciones que se pueden realizar a través del API REST se encuentran la generación de tweets, gestión de mensajes directos, mensajes no públicos entre usuarios, gestión de las relaciones de seguimiento de usuarios, obtención de datos geográficos, obtención de tendencias y la realización de búsquedas, entre otras. El API REST está enfocada hacia la ejecución de solicitudes de usuarios individuales. El API de streaming se diferencia del API REST por ser más compleja y estar orientada a un flujo de datos en tiempo real mientras se mantenga la conexión [6]. El API de streaming ofrece servicios mediante el flujo de usuario y el flujo de sitio. El primero está diseñado para proveer un flujo de datos y eventos específicos al usuario autenticado, mientras que el segundo se utiliza para la realización de varias acciones en representación de múltiples usuarios [7][8]. Tanto el API REST como el API de streaming son utilizadas por las aplicaciones para comunicarse con los servicios de Twitter, haciendo un cuidadoso balance de carga para mantenerse dentro de los límites permitidos por Twitter. De esta manera se pueden construir grandes colecciones datos. Para hacer uso el API de streaming con el propósito de captar los tweets recuperados se desarrolló una aplicación informática. Para la cual se utilizó el lenguaje de programación Java y la biblioteca Hosebird Client (hbc) para la conexión con el API de streaming de Twitter. La aplicación captura y guarda los tweets, en la misma medida que los recibe. Para su almacenamiento, y posterior utilización, los tweets se mantienen con el mismo formato en que son recibidos en un clúster de Elasticsearch. Mientras que con el propósito de facilitar el cálculo de las métricas de centralidad, se extraen los usuarios y las relaciones entre estos para almacenar esta información en una base de datos orientada a grafos sobre Neo4J. B. Análisis de redes sociales y métricas de centralidad estudiadas “El análisis de redes sociales puede ser definido como la disciplina de indagar en los patrones de las relaciones entre los actores, así como los patrones de las interrelaciones sobre los actores a diferentes niveles (tales como personas y grupos)” [9]. El análisis de redes sociales se utiliza como una manera estructurada de analizar el grado de relación informal entre las personas, o incluso entre las organizaciones. El análisis de redes sociales hace visibles estos patrones de interacción, que no se encuentran explícitos, para identificar grupos importantes con el fin de facilitar la colaboración eficaz [10]. Para la identificación de grupos y roles, existen diversos algoritmos y medidas de centralidad que en conjunto pueden determinar con un alto grado de precisión en qué medida un usuario cumple una determinada función. Dentro de las
  • 3. medidas de centralidad, hay cuatro que son ampliamente utilizadas en el análisis de redes: centralidad de grado de entrada y grado de salida, centralidad de intermediación, y centralidad de cercanía [11]. La centralidad de grado es la más simple de las medidas de centralidad. Corresponde al número de enlaces que posee un individuo con los demás. En caso de que se pueda establecer una dirección en el enlace se establecen dos criterios, grado de entrada y grado de salida. En el sentido de relaciones interpersonales, el primero puede interpretarse como una medida de popularidad, mientras que el segundo como una medida de sociabilidad [12]. El grado de salida, está dado por la cantidad de transacciones que tienen como origen al nodo estudiado, y el grado de entrada se basa en la cantidad de transacciones en las que el nodo sea el destinatario. La centralidad de intermediación se basa en el número de caminos más cortos que pasan a través de un usuario. Los usuarios con una alta intermediación juegan el rol de conectar a los diferentes grupos, son los agentes y conectores que mantienen juntos a los demás. Estando “en medio” significa que un usuario tiene la capacidad de controlar el flujo de información entre la mayoría del resto. Los individuos con alta intermediación son los pivotes en el flujo de conocimiento de la red. Los usuarios con mayor intermediación también resultan en el mayor incremento en la distancia típica entre los demás cuando son retirados [12]. Determinar qué nodos presentan una alta intermediación en la red social de la comunidad de interés permite identificar cuáles usuarios pueden servir como puentes para organizar grupos, o constituyen factores críticos para la difusión de la información dentro de la comunidad estudiada. Esta métrica de centralidad impacta directamente sobre el poder de convocatoria, y organización, ya que contribuye a identificar los nodos críticos que sirven como puentes entre los diferentes conjuntos de nodos en la red social. La centralidad de cercanía puede ser considerada como una medida de cuánto tiempo tomará para que la información se propague desde un nodo determinado a los otros nodos en la red. Para esto se calcula la distancia de cada nodo de la red con respecto a los demás [12]. Esta métrica de centralidad puede ser muy útil a la hora de elaborar campañas de divulgación o lanzar convocatorias, puesto que permite optimizar los resultados del esfuerzo invertido en la propagación de la información. Los algoritmos para identificar los roles de un nodo u usuario de una red social, no son excluyentes, y brindan la información de en qué grado un usuario se desenvuelve en un rol, lo que permite establecer comparaciones entre los miembros de la red. Para el cálculo de las métricas de intermediación se utilizó el algoritmo desarrollado por Brander [13]. Este algoritmo permite una reducción notable en los tiempos de ejecución para el cálculo de las métricas de centralidad relacionadas con el cálculo del camino mínimo. El incremento en la eficiencia ofrecido por este algoritmo se basa en una nueva técnica de acumulación que permite extender las capacidades de cálculo a redes mayores y la evaluación simultánea de métricas basadas en el cómputo del camino más corto. Teniendo en cuenta que el grafo generado por cada tipo de relación es direccionado y no ponderado, se decidió utilizar la variante del algoritmo de Brander basada en un glotón (breadth-first search). De esta forma se calcula el índice de centralidad resolviendo para cada vértice el problema de los caminos más cortos, con un único origen. Al finalizar cada iteración las dependencias del origen hacia cada uno de los otros vértices son sumadas a la centralidad de este [13]. Para el cálculo de la centralidad de intermediación y cercanía se desarrolló una implementación lineal del algoritmo propuesto por Brander , utilizando el lenguaje de programación Java. Para el cálculo de las métricas de centralidad de grado de salida y grado de entrada, se utilizan los mecanismos de consultas del propio Neo4j. De esta manera el cálculo de las métricas se ubica dentro del servidor de base de datos Neo4j, en forma de servicios para ser consumidos por otros componentes o aplicaciones externas, mediante un API REST. Figura. 1. Segmento de código del glotón implementado para pluggin de Neo4j encargado el cálculo de las métricas de centralidad. C. Componentes de la solución Una vez se recibe un tweet proveniente del servicio del API de Twitter es necesario almacenarlo para su posterior análisis. Para esto se utiliza el motor de búsqueda Elasticsearch, basado en Apache Lucene [14] y el sistema de gestión de bases de datos orientada a grafos Neo4j. El uso de dos sistemas de almacenamiento tiene su fundamento en la necesidad de guardar íntegramente el tweet y a la vez modelar en un grafo las relaciones. En este grafo los usuarios se representan como nodos y las relaciones activas de mención, cita o retweet como aristas entre estos. Cada una de estas aristas, es representada en la base de datos, manteniendo el identificador del tweet y una marca temporal como atributos. Elasticsearch es una herramienta libre y de código abierto,
  • 4. liberada bajo los términos de la licencia Apache 2. Su flexibilidad e independencia de la plataforma permite que se pueda utilizar en entornos tanto locales como remotos [15]. Se diferencia de otros motores de búsqueda por hacer pública la gestión y consulta de estos índices mediante un API REST. Figura. 2. Representación de un subconjunto de los datos almacenados en el sistema de base de datos orientado a grafos Neo4j. Este motor de búsqueda ofrece un alto grado de fiabilidad y escalabilidad, permitiendo una fácil configuración de las búsquedas usando clústeres. Además, ofrece seguridad ya que puede funcionar de forma aislada dentro de la red. Elasticsearch no requiere un esquema fijo de datos como las base de datos relacionales (SQL, del inglés structured query language), esta característica le posibilita realizar búsquedas sobre datos arbitrarios en aplicaciones que manejan grandes volúmenes de datos [15]. Elasticsearch además ofrece facilidades para su integración punto a punto con otras herramientas. Para la realización de consultas sobre las comunidades de tweets y visualización de los resultados, en gráficas comparativas, se emplea la herramienta Kibana. Kibana es una plataforma de código abierto para el análisis y la visualización diseñada para integrarse con Elasticsearch. La misma puede ser utilizada para buscar, visualizar e interactuar con los datos almacenados en los índices de Elasticsearch. Fácilmente se pueden realizar análisis avanzados de datos y visualizarlos en varios gráficos, tablas y mapas [16]. Kibana facilita la comprensión de la información contenida en grandes volúmenes de datos. Al utilizar interfaces compatibles con los navegadores Web permite crear rápidamente gráficas en las que se muestran los cambios sobre las consultas realizadas a Elasticsearch en tiempo real [16]. Figura. 3. Panel de Kibana dentro de la aplicación. Haciendo uso de una instancia de Kibana se obtienen las facilidades necesarias para realizar consultas sobre las colecciones de tweets en base a requerimientos de información específicos. Kibana ofrece un alto nivel de flexibilidad para el estudio de las comunidades de interés, pero el mismo no está diseñado para realizar la detección de roles. Para esta tarea fue necesario desarrollar una aplicación de propósito específico. Como anteriormente se mencionó para almacenar la representación del grafo de los usuarios de la comunidad se utiliza el gestor de base de datos Neo4J. A diferencia de los sistemas de gestión de base de datos tradicionales no almacena los datos en forma de tablas y relaciones, en lugar de esto representa los datos como nodos y relaciones de un grafo [17]. El mismo ofrece las facilidades para extender sus funcionalidades mediante el desarrollo de plugins que le añadan nuevas características. Las funcionalidades necesarias para el cálculo de estas métricas de centralidad, sobre el algoritmo de Brander, fueron encapsuladas en un plugin desarrollado utilizando el lenguaje de programación Java y expuestas mediante el API REST de Neo4J. Los componentes desarrollados fueron integrados para que acometieran el estudio, en el flujo que se describe a continuación. Los tweets son recuperados mediante el componente para conexión con el API de stream de Twitter, para ser inmediatamente almacenados, tal y como se recibieron, en ElasticSearch y a la vez ser procesados para la extracción de los autores, los usuarios mencionados, y los
  • 5. autores de retweet. Los datos extraidos del procesamiento del tweet serán almacenados en la base de datos de Neo4J, conformando un grafo dirijido, y no ponderado en el cual los usuarios se representan como nodos y las relaciones son las aristas. Mediante una tarea programada se ejecuta una aplicación periódicamente que tiene como objetivo consultar el API Rest de Neo4J, para obtener los resultados de la detección de roles y almacenar estos resultados en Elasticsearch. Estos resultados son guardados con la adición de una marca temporal, que sirva para rastrear cronológicamente como se ha comportado cada usuario en el desempeño de cada rol. III. ANÁLISIS DE RESULTADOS Los resultados establecen las relaciones entre los datos obtenidos, el problema de investigación, el método y el soporte teórico de la revisión de la literatura. Los resultados se presentan en una secuencia lógica y se recomienda presentarlos de forma sintetizada en tablas, figuras, etc. Dado que el propósito de la presente investigación es académico se conformó una colección pequeña de 50 653 tweets, de los cuales se extrajeron 35 035 usuarios, 34 401 relaciones de mención, 2 745 relaciones de cita y 24 392 de retweet. Estos tweets tienen en común que en su cuerpo incluyen el nombre de pila del presidente de los Estados Unidos, “Obama”. Los tweets recuperados fueron tratados para extraer las relaciones de mención, cita y retweet, así como los usuarios implicados en estas. Es importante destacar que el conjunto de tweets estudiados es realmente pequeño para los que se generan a diario, incluso para un sólo término de búsqueda. La relación de retweet, se establece cuando un usuario selecciona el tweet generado por otro para realizar la acción de comunicarlo a sus seguidores. Esta relación extiende el alcance de la capacidad de comunicación de la fuente original a los seguidores del usuario que realiza el retweet y afianza el contenido del mensaje. Las relaciones de cita tienen lugar cuando se toma el tweet de otro usuario y se le adiciona algún comentario. Este tipo de relación además de ser similar al retweet, incluye valoraciones del intermediario que pueden tener diferentes matices. El grafo que se genera por este tipo de relación tiene la importancia de que tienen embebida la emisión de criterio y establecimiento de posturas sobre los contenidos de los tweets. Las menciones ocurren cuando en el cuerpo del tweet se incluye el nombre de usuario, precedido por el carácter de arroba, “@”. Esto se utiliza para realizar una referencia directa al usuario en cuestión, y puede ser tomada en cuenta como una referencia de la relevancia de un usuario. El análisis realizado está orientado a las relaciones antes mencionadas, a continuación se exponen un resumen de los resultados encontrados, y se hace una valoración de estos de acuerdo a la implicación de la métrica expuesta para el funcionamiento de la red social estudiada. TABLA I INTERMEDIACIÓN DE LA RELACIÓN DE MENCIÓN Usuario Intermediación PLAYTRUMPSCARD 0.005% ROTNSCOUNDREL 0.004% HORSESHORT 0.004% LIBERTYBELL1000 0.004% HALE4JESUS 0.004% DESTINBEACH22 0.003% GAETASUSAN 0.002% DSF2020 0.002% STEPH93065 0.002% JIMLIBERTARIAN 0.002% Los resultados obtenidos del análisis de intermediación para la relación de mención se muestran en la tabla I. Estos resultados pueden interpretarse como los usuarios que son centro de la polémica de la red. Es decir aquellos que son propensos a generar temas de debate, que conlleven que los otros usuarios los mencionen en sus tweets, en muchos casos en forma de respuesta. El perfil social de estos usuarios los hacen propicios para comunicar temas de actualidad ya que tienen una comunidad de usuarios que se mantienen pendientes de sus publicaciones, transformándose en generadores de estados de opinión. Cuentan con una comunidad activa de seguidores que se muestran receptivos y emiten reacciones a las publicaciones de los primeros, y que a la vez contribuyen a la socialización de los contenidos en la red. Los usuarios con una alta intermediación de la relación de mención se distinguen por ser puntos de conección entre las subredes conformadas por las relaciones de mención. Estos usuarios sirven de puente entre los subconjuntos de usuarios y los temas tratados. En la tabla II se muestran los 10 usuarios más relevantes en la métrica de intermediación por la relación de retweet. Varios de estos usuarios se encuentran también entre los más relevantes como se mostró en la tabla I para la misma métrica en la relación de mención, por lo que además de ser generadores de estados de opinión, cuentan con un número de partidiarios que sustentan sus criterios. Lo cual se manifiesta a través de los retweets que son emitidos. TABLA II INTERMEDIACIÓN DE LA RELACIÓN DE RETWEET
  • 6. Usuario Intermediación ROTNSCOUNDREL 0.002% HALE4JESUS 0.002% LIBERTYBELL1000 0.001% GAETASUSAN 0.001% GENGSPATTON 0.001% DESTINBEACH22 0.001% CARMINEZOZZORA 0.001% K1ERRY 0.001% ARAYA_HOPE____ 0.001% WESTXGAL 0.001% El grado de entrada para la relación de retweet, se interpreta como el componente de la popularidad y efectividad de una cuenta de usuario. El resultado de esta métrica puede ser apreciado en la tabla III. Un usuario con alto grado de entrada para la relación de retweet, tiene altas posibilidades de que los contenidos que ponga en la red social sean reflejados por otros usuarios. Estos usuarios son de interés para incrementar la efectividad de las campañas comunicacionales pues permiten incrementar el alcance de las mismas de forma natural. TABLA III GRADO DE ENTRADA DE LA RELACIÓN DE RETWEET Usuario Grado de entrada WORLDSTARFUNNY 6.08% BARACKOBAMA 2.525% REJECTS 1.89% YOUAKEECOPYYY 1.644% GQMAGAZINE 1.423% BENSHAPIRO 1.291% LOVENAAJI 1.201% MRARVINGER 1.045% ARAYA_HOPE____ 0.779% DEARYOUFROMWE 0.738% Mientras que en la tabla IV se puede apreciar el resultado del análisis para el grado de salida de la relación de retweet. Los usuarios que tienen un alto grado de salida para la relación de retweet son aquellos que realizan el mayor número de retweets de otros usuarios. Es una expresión de la sociabilidad del usuario y de la permeabilidad del mismo para socializar el mensaje con sus seguidores. TABLA IV GRADO DE SALIDA DE LA RELACIÓN DE RETWEET Usuario Grado de salida REALITYCHEK2015 0.164% SONGBIRDCD 0.139% LCHARRE93 0.123% IDESIGNWIS 0.111% TERRI_GEORGIA 0.102% WINNI4U 0.086% CLARISSAMEHLER 0.082% KORRIFOSTER 0.082% LAW1GLORIA 0.078% TAHERDAVOODI 0.078% IV. CONCLUSIONES Como resultado de esta investigación se ha construido una herramienta informática compuesta, que permite extraer las relaciones de cita, retweet, y mención, así como realizar análisis de detección de roles sobre estas. Como resultado del análisis de roles realizado sobre la comunidad de tweets estudiada es posible determinar cuales usuarios ofrecen mejores posibilidades para servir como comunicadores, o intermediarios sobre un tema específico. Permitiendo optimizar el esfuerzo y los recursos a la hora de planificar o evaluar alguna campaña comunicacional en esta red social. La presente investigación sienta las bases para el desarrollo de otras sobre, la paralelización del cálculo de las métricas abordadas, el uso de operadores de lógica difusa para determinar la relevancia de los usuarios. Así como el desarrollo de otras investigaciones que tengan como objetivo específico otras redes sociales o servicios en Internet. REFERENCIAS [1] D. M. Boyd, y N. B. Ellison, “Social Network Sites: Definition, History, and Scholarship”. Journal of Computer-Mediated Communication, vol. 13, No. 1, pp. 210 - 230. 2007. [2] Merrian-Webster, “Dictionary”. Available: http://www.merriam- webster.com/dictionary/microblogging . 2014. [3] Twitter.com, “Sobre”. Location: https://about.twitter.com/. 2014. [4] L. Bode, y K. E. Darlymple. “Politics in 140 Characters or Less: Campaign Communication, Network Interaction, and Political Participation on Twitter”. 2014. Available: http://dx.doi.org/10.1080/15377857.2014.959686 [5] Twitter.com, “Company”. Available: https://about.twitter.com/company. 2015. [6] Twitter.com, “The Straming APIs”. Available: https://dev.twitter.com/docs/api/streaming. 2014. [7] Twitter.com, “User streams”. Available: https://dev.twitter.com/docs/streaming/userstreams. 2014. [8] Twitter.com, “Site streams”. Available: https://dev.twitter.com/docs/streaming/streams/site. 2014.
  • 7. [9] L. R. Breiger, “The Analysis of Social Networks”, Handbook of Data Analysis, Sage Publications, London, pp 505-526. 2004. [10] V. Umadevi, “Case Stury: Centrality Measure Analysis on Co- Authorships Network”. Journal of Global Research in Computer Science, Vol. 4, No. 1, ISSN-2229-371X, 2013. [11] C. J. Figueiras, “Subsistema de detección de roles de usuarios dentro de comunidades de interés de Twitter”, Universidad de las Ciencias Informáticas. La Habana. 2014. [12] M. Tsvetovat, “Social Network Analisis for startups: Finding connections on the social web”. O'Relly Media. 2011. [13] U. Branders, “A Faster Algorithm for Betweenness Centrality”. University of Konstanz. 2015. [14] M. Meloni, “Analizando logs en 5 minutos con ELK”, Available: http://bitnegro.blogspot.com/2014_12_01_archive.html. 2015. [15] Mimacom, “Active sus bases de datos. Encuentra la información con Elasticsearch”, Available: http://www.mimacom.es/soluciones-open- source/enterprise-search. 2015. [16] Elastic, “Kibana User Guide 4.1”. Available: http://www.elastic.co/guide/en/kibana/current/introduction.html. 2015. [17] Neo4j, “The Neo4j Manual v2.3.3”. Available: http://neo4j.com/docs/stable/re01.html. 2016.