Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.
1 de 59

#VEM Coleta de dados relacionais

5

Compartir

Descargar para leer sin conexión

Slides da oficina de coleta de dados relacionais aplicada na UFF em 2017.

Libros relacionados

Gratis con una prueba de 30 días de Scribd

Ver todo

Audiolibros relacionados

Gratis con una prueba de 30 días de Scribd

Ver todo

#VEM Coleta de dados relacionais

  1. 1. COLETA DE nas mídias sociais Marcelo alves
  2. 2. COLETA DE nas mídias sociais instrutor •Doutorando pelo PPGCOM/UFF; • Estuda comunicação política em rede; • Sócio-diretor da Vértice Inteligência; • Pesquisador do laboratório de mídia e democracia (LAMIDE/UFF), orientado por Afonso de Albuquerque; • Publica textos no blog www.marceloalves.org
  3. 3. N = 532 fan-pages A = 8.654 arestas Rede antipetista na eleição de 2014
  4. 4. COLETA DE nas mídias sociais c Quais objetos ou temas de pesquisa dos alunos para coleta de dados?
  5. 5. COLETA DE nas mídias sociais O que você vai aprender •O básico da concepção teórica da análise de redes; • Processos de coletas de dados relacionais; • Leitura da documentação da Graph API do Facebook • Métodos de construções de queries; • Funcionamento e prática com Facepager; • Extrair dados das pesquisas dos alunos; • Tratamento e manipulação de dados relacionais; • Importar dados no Gephi.
  6. 6. COLETA DE nas mídias sociais c CONCEITOS TEÓRICOS GERAIS (prometoser breve)
  7. 7. COLETA DE nas mídias sociais Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014)
  8. 8. COLETA DE nas mídias sociais Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014) • Lógicas de rede não estão tomando o lugar da lógica de massa; • As plataformas de mídias sociais seguem outras regras do jogo; • A mídia de massa e o conteúdo jornalístico continuam sendo uma das principais fontes de informação; • As duas lógicas não são estáticas, mas estão em evolução
  9. 9. COLETA DE nas mídias sociais Sistemasmidiáticoshíbridos–Chadwick(2013) • “O sistema midiático híbrido é baseado em conflito e cooperaçãoentre lógicas novas e antigas; mas também possui considerável grau de interdependênciaentre estas lógicas” (Chadwick, 2013, p. 207) • Convergência midiática – ambos os sistemas estão entrelaçados • Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede “Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e Svensson, 2014, p. 12).
  10. 10. COLETA DE nas mídias sociais Repertóriosdigitaisemredesehibridismoorganizacional(Chadwick,2007) Duas tendências paralelas 1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de movimentos sociais; Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de redes sedimentárias. “Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras – como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em rede” (Chadwick, 2007, p. 286) 2) Novas formas organizacionais que só podem existir na internet estão surgindo. “Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste resultado é a hibridez organizacional”
  11. 11. COLETA DE nas mídias sociais Ociclodeinformaçãopolítica–Chadwick(2011) Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar, apurar, escrever, editar, compilar e apresentar material jornalístico. • Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos produtivos das redações e a noticiabilidade • Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite política e midiática Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação política. • Maior número e maior diversidade de atores • Estruturas temporais mais rápidas e complexas • Inclui participantes que tangenciam as elites políticas e midiáticas • Diversificação das fontes de informação •Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.
  12. 12. COLETA DE nas mídias sociais Oquetemosatéaqui? • Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política. • As elites perdem a exclusividade do acesso e do controle de meios de criação de informação. • Diversos repertórios de expressão política surgem para além das burocracias partidárias e jornalísticas. • Tudo isso está em permanente movimento e relacionamento. A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto é a cobertura da imprensa ou propagandas políticas oficiais. Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais criadas em torno daquele agente e todas as negociações com os demais envolvidos.
  13. 13. COLETA DE nas mídias sociais c Contudo, num ambiente midiático híbrido, com surgimento de blogs, lideranças de opinião nativas digitais e uma infinidade de outros fenômenos, Como delimitar o corpus de pesquisa?
  14. 14. COLETA DE nas mídias sociais Esferapúblicaemrede(Benkleretal.2013,p.04)–conceitoprovisório • A esfera pública em rede é uma arena alternativa para o discurso e debate público, uma arena que é menos dominada pelas grandes organizações midiáticas, menos sujeita ao controle do governo e mais aberta a participação ampla. • A esfera pública em rede é manifesta como um ecossistema complexo de canais de comunicação que coletivamente oferecem um ambiente que conduz a expressão política e a criação de diversas formas organizacionais. • Uma série de estudos já evidenciou que elites políticas e midiáticas continuam dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de indivíduos não organizados.
  15. 15. COLETA DE nas mídias sociais Oquesãoredessociais?(WASSERMAN eFAUST,1994) • A diferença fundamental entre análise de redes e análise estatística é a inclusão de conceitos e de informações sobre os relacionamentos entre as unidades de análise do estudo. • Em vez de focar nos atributos das unidades individualmente, estuda as características como emergentes do processo de relacionamento social. • O conceito de redes enfatiza que cada indivíduo tem ligações com outros indivíduos; • As Redes Sociais referem-se a um conjunto de atores e as relações entre eles; • Modelar a estrutura e buscar compreender sua influência no grupo
  16. 16. COLETA DE nas mídias sociais Componentesbásicosdaanálisederedes cator claços cclusters crede Componente individual Ligações entre atores Subconjuntos identificados pela densidade Totalidade de atores e ligações da amostra
  17. 17. COLETA DE nas mídias sociais c O que são dados relacionais? Duas informações distintas Atributos dos atores Arestas de saída e chegada
  18. 18. COLETA DE nas mídias sociais Métodosdigitais–RichardRogers(2004) • A web como fonte de dados; • Virada computacional nas ciências sociais; • Rastros gerados espontaneamente • Análises de hiperlinks • Blogosferas políticas • Repercussão no Twitter • Comunidades no Facebook
  19. 19. COLETA DE nas mídias sociais Doistipos deredesnainternet(recuero,2009) • Redes associativas ou de filiação – possuem ligações mais estáveis, duradouras. Gera o efeito de filiação a um grupo. Exemplo: seguir páginas e fazer amizades; • Redes emergentes – são compostas por ligações circunstanciais, criadas a partir de ações comunicativas ad hoc. Exemplo: menções, retuítes, compartilhamentos.
  20. 20. COLETA DE nas mídias sociais c O que são APIs? Application programming interface
  21. 21. COLETA DE nas mídias sociais Políticasdecessãodedadosdafacebookgraphapi • As políticas de cessão de dados de cada plataforma são documentadas nas APIs; • APIs são tanto documentos técnicos, quanto reflexos das diretrizes empresariais de fornecimento de dados; • APIs são modificadas frequentemente, de acordo com as necessidades e interesses mercadológicos das organizações; • As documentações mostram quais requisições são possíveis (queries), em qual volume (rate limit) e com quais parâmetros.
  22. 22. Versionamento das apis do facebook COLETA DE nas mídias sociais
  23. 23. Vamos praticar? https://developers.facebook.com/tools/explorer/ COLETA DE nas mídias sociais
  24. 24. COLETA DE nas mídias sociais Comoconstruirumaquery?Orientaçãoaid • {id} + fields = {campos} • Retorno em Javascript Object Notation (JSON) • JSON é exibido na tela e convertido para tabulação • Construindo query no navegador • https://graph.facebook.com/v2.6/ + id / {requisição} ?access_token= {token de acesso} https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddk uF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVs QiblwFj6KOhkZD
  25. 25. Aplicativos acadêmicos
  26. 26. COLETA DE nas mídias sociais c Qual ferramenta utilizar?
  27. 27. COLETA DE nas mídias sociais Diferençasnasapisdefacebooketwitter
  28. 28. COLETA DE nas mídias sociais Técnicasdeamostragememmétodosdigitais(rieder,2012) • População – volume completo de usuários e publicações de uma determinada plataforma. Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizando dados populacionais= (Freelon et al., 2016); • Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. No entanto, como não se sabe a população, há uma série de problemas derivados; • Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter. Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015. • Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos pela API. • Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos. • Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no resultado. Minha dissertação e tese. • Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.
  29. 29. COLETA DE nas mídias sociais AdaptandoosmétodosparacoletarelacionalnoFacebook(cf.BRUNSEBURGESS,2014) • A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags. Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook é plataforma pouco utilizada em pesquisas de métodos digitais. • No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e pelos cidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais que concentra maior público. • Assim, surge a questão, como realizar desenhos de pesquisa especificamente para o Facebook? • A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatos durante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opção ignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos. • É isso que pretendo captar com meus projetos. • Para tanto, aposto no método de amostragem por grafos e bola de neve.
  30. 30. COLETA DE nas mídias sociais Facepager-TillKeylingejakobjunger • Ferramenta desenvolvida para a dissertação; • Código aberto; • Programando em Python 2.7; • Introduz boa parte dos conceitos de data mining, como query, data munging, data storage, log de processos... • É uma interface para se comunicar com a API e fazer o trabalho pesado; • Alto grau de liberdade para os usuários operarem as requisições; • Funciona com Facebook e Twitter;
  31. 31. Vamospraticar? retorno metadados Jsonkey Sistema query
  32. 32. COLETA DE nas mídias sociais Etapasdomapeamentodefan-pages(BRUNS,2007; ADAMetal.,2015) • Lista de nós-sementes; • Nós-sementes devem ser temáticos e homogêneos. • Bola de neve – crawling com 1 ou 2 graus de profundidade; • Limpeza do resultado; • Manipulação de dados – lista de nós e arestas; • Importação no Gephi; • Categorização dos atores Como montar uma lista de sementes?
  33. 33. COLETA DE nas mídias sociais Afunçãosearch Notação: /search ? type= {user, page, event, group, place} & q= {palavra+chave} & fields= search?type=page&q=dilma+rousseff&fields=id,name,link,description, category Fazer testes de acordo com as pesquisas dos alunos
  34. 34. COLETA DE nas mídias sociais Afunçãouserlike Notação: id ? fields = likes {aninhamento de parâmetros} dilmarousseff?fields=likes{name, category, id, link, about} Fazer testes de acordo com as pesquisas dos alunos
  35. 35. COLETA DE nas mídias sociais Documentaçãodasfan-pages Query <user>/likes?fields=name,username,about,talking_about_count,fan_co unt,category,link,bio,description,emails,location,new_like_count,start_inf o,website,id JSON keys name id username category about bio description fan_count talking_about_count emails.0 website link location.city location.state location.longitude location.latitude
  36. 36. COLETA DE nas mídias sociais c Prática de mapeamento de fan-pages
  37. 37. COLETA DE nas mídias sociais TRATAMENTODEDADOS Filtros para limpeza de logs; Preparação das listas de nós e arestas Arestas Funçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506) Criar source e target Nós – Eliminar duplicatas
  38. 38. COLETA DE nas mídias sociais Mesolevel-aDocumentaçãodaspublicações Query comments.limit(1).summary(true),likes.limit(1).summary(true),picture,sto ry,from,to,description,source,link,created_time,message,type,id,status_t ype,name,story_tags,caption, reactions.limit(1).summary(true), shares name from.name from.category from.id to.data.*.id to.data.*.name story_tags sharedposts.data posts.data story link caption message_tags message status_type type shares.count created_time updated_time reactions.summary.total_count likes.summary.total_count comments.summary.total_count shares.count
  39. 39. COLETA DE nas mídias sociais Fluxodecomuinicaçãoentreaspáginas Endpoints Links – referentes aos links compartilhados nas publicações. Só registrando quando a postagem é de tipo LINK; Caption – referente ao domónio do link; Message_tags – perfis marcados na mensagem (similar a @mention); Status_type – identificar compartilhamentos e links; Story_tags – fluxo de compartilhamento To – Perfis mencionados With_tags – Com quem estou.
  40. 40. COLETA DE nas mídias sociais c Prática de fluxos de publicações
  41. 41. COLETA DE nas mídias sociais Referências ADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp. Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015. ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016. BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth of Networks: How Social Production Transforms Markets and Freedom, 2006. BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawler research tool. First Monday, v. 12, n. 5, 2007. CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n. 3, p. 283-301, 2007. CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the “Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011. CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013. FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,# Blacklivesmatter, and the online struggle for offline justice. 2016. KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: A theoretical approach. New media & society, v. 17, n. 8, p. 1241-1257, 2015. RECUERO, Raquel. Redes sociais na internet. Sulina, 2009. RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012. ROGERS, Richard. Information politics on the Web. MIT Press, 2004. WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridge university press, 1994.
  42. 42. COLETA DE nas mídias sociais Obrigado! marceloalves.ufsj@hotmail.com

×