Sistema de Bibliotecas UCS - Cantos do fim do século
Seminário Sociologia na era do Big Data
1. Universidade Federal de Goiás
Faculdade de Informação e Comunicação
Programa de Pós-graduação em Comunicação
Disciplina/Curso: Métodos digitais
Docente responsável: Dr. Dalton Martins
Discentes: M.e Filipe Barbosa e Esp. Jéssica Bazzo
2. SEMINÁRIO PARA A DISCIPLINA DE
MÉTODOS DIGITAIS
APRESENTAÇÃO:
FILIPE BARBOSA E JÉSSICA BAZZO
3. TÍTULO DO ARTIGO-BASE DA APRESENTAÇÃO:
SOCIOLOGY IN THE ERA OF BIG DATA: THE ASCENT OF
FORENSIC SOCIAL SCIENCE
POR:
Daniel A. McFarland
(Stanford University)
Kevin Lewis
(University of California)
Amir Goldberg
(Stanford University)
PALAVRAS-CHAVE:
Big Data; Ciência Social Computacional; Sociologia da Ciência; Ciência Social
Forense.
4. MINI RESUMO
O surgimento dos big data representa um divisor de águas
para as ciências sociais. Estes novos dados demandam novos
métodos que reduzam/simplifiquem sua dimensionalidade,
que identifiquem novos padrões e relações e que prevejam
resultados, desde a etnografia computacional e a linguística
computacional à ciência de rede, ao aprendizado de máquina
e aos experimentos in loco.
4
5. SOBRE OS AUTORES
Daniel A. McFarland
(Stanford University)
Kevin Lewis
(University of California)
Amir Goldberg
(Stanford University)
6. Academic
Professor of Education and, by courtesy,
of Sociology and of Organizational
Behavior at the Graduate School of
Education, Stanford University
(Stanford, California, USA)
Education
PhD, University of Chicago, Sociology
MA, University of Chicago, Sociology
BA, University of Chicago, Philosophy
Administrative
Director at the Stanford Center for
Computational Social Science (2012 - 2016)
Daniel A. McFarland
6
7. Research areas
• Social and organizational dynamics of educational systems;
• adolescent relationships, social structures, and identities;
• interdisciplinary collaboration and intellectual innovation;
• relational sociology;
• big data and methodological advances in social networks
and language modeling.
Daniel A. McFarland
7
8. Academic
Assistant professor of sociology at the University
of California (San Diego, California, USA)
Education
PhD, Harvard University, Sociology
MA, Harvard University, Sociology
BA, University of California, San Diego (Summa
Cum Laude), Sociology and Philosophy with
Mathematics Minor
Kevin Lewis
8
9. Research areas
• Complex web of relationships and individual behavior;
• formation and maintaining of social ties; network ties and peer
influence;
• network ties, “micro-level” dynamics, “macro-level” outcomes,
racial segregation and cultural diffusion;
• online data sources, “digital footprints” and human interaction in
society.
Kevin Lewis
9
10. Academic
Associate Professor of Sociology (by courtesy) at
the School of Humanities and Sciences, Stanford
University (Stanford, California, USA)
Education
PhD, Princeton University, Sociology
MA, Goldsmiths College, University of London,
Sociology
BA, Tel Aviv University, Computer Science &
Film Studies (double major)
Amir Goldberg
10
11. Research areas
• Organization studies, cultural sociology and network science;
• network structures, interaction and emergence of social meanings;
• new cultural categories, people and organizational actors
interaction;
• computationally intensive network and language-based methods.
Amir Goldberg
11
16. UNIVERSIDADE DE STANFORD, PALO ALTO
“coração do vale”(MARTEL, 2015)
ALGUNS CENTROS E PROGRAMAS DE ENSINO, DESENVOLVIMENTO E
PESQUISA DA STANFORD UNIVERSITY
• CENTER FOR COMPUTATIONAL SOCIAL SCIENCES
• CLARK CENTER
• STANFORD RESEARCH PARK
• STANFORD TECHNOLOGY VENTURES PROGRAM
16
17. CENTER FOR COMPUTATIONAL SOCIAL SCIENCES
“Using data science to understand changes in human interactions”
(STANFORD, 2016)
17
18. CENTER FOR COMPUTATIONAL SOCIAL SCIENCES
“The Center supports social science research by using
computational techniques to analyze big data. Today huge
amounts of data are available to use for research on
human behavior: website clicks, medical records, social
media data. This data can be used to address larger societal
issues of inequality, healthcare, education, democracy, and
more.” (STANFORD, 2016)
18
19. A INTERDISCIPLINARIDADE EM STANFORD
William Miller (apud MARTEL, 2015, p.24) ― professor
emérito da Graduate School of Business de Stanford ―
defende que a “interdisciplinaridade pode dar origem a
inovações importantes, além do campo delimitado de
cada um”; e o professor Aron Rodrigue (apud MARTEL,
2015, p.25) lembra que a diversidade da comunidade
desta universidade é também de ordem cultural, com
cerca 35% das pessoas de origem asiática, por exemplo.
19
21. INTRODUÇÃO
• Grande expansão das bases de dados (big data);
• Novos meios tecnológicos de coleta e análise de dados, a
partir das engenharias;
• Ciência Social Computacional;
• Convergência entre diferentes culturas de investigação: a
engenharia, disciplinas da ciência social e a indústria de
mídia social.
21
22. INTRODUÇÃO
• Há, portanto, a “convergência” de perspectivas científicas,
métodos e tecnologias;
• Esta convergência significa que o big data tem o potencial
para se tornar uma “zona de trocas";
• Pesquisadores de paradigmas completamente diferentes
colaboram entre si para trocar ferramentas, informação e
conhecimento;
22
23. INTRODUÇÃO
Pergunta motriz:
Testemunharemos uma era de recombinação intelectual, a
formação de um paradigma, ou um momento de colonização,
em que o campo da sociologia e suas tradições são subvertidos
para outros campos como o da ciência da computação?
23
25. O ÚLTIMO MOMENTO “DIVISOR DE ÁGUAS”
• Em grande parte das ciências sociais, a tendência tem sido
aumentar a quantificação, especialmente, após terem sido
apropriadas pelo Estado para pesquisas de survey;
• Métodos estatísticos de ciência, tecnologia, engenharia e
matemática (STEM – Science, technology, engineering and
mathematics) foram importados para as ciências sociais;
• A modelagem estatística se tornou uma tecnologia
computacional e viabilizou cálculos mais sofisticados.
25
26. O ÚLTIMO MOMENTO “DIVISOR DE ÁGUAS”
• Com isso, as ciências sociais (em especial, a sociologia) foram
se afastando dos estudos de comunidade mais etnográficos e
adotaram uma perspectiva individualista metodológica;
• Com a pesquisa de survey e os modelos estatísticos históricos
vieram suposições sobre atores sociais e sua inter-relação;
• Porém, estas suposições baseadas em quantificações nunca
foram creditadas como leituras precisas da vida social, e nem
como desenvolvimento do individualismo metodológico;
26
27. O ÚLTIMO MOMENTO “DIVISOR DE ÁGUAS”
• Apesar disso, estas suposições foram reconhecidas como
subprodutos necessários à realização de pesquisas
estatísticas em vista da grande quantidade de dados.
• Não obstante a difícil aceitação dessas pesquisas, devido a
sua imprecisão, estas foram compilando evidencias e se
tornando cada vez mais centrais à investigação sociológica
dominante.
27
28. O ÚLTIMO MOMENTO “DIVISOR DE ÁGUAS”
• As pesquisas de levantamento e modelagem estatística também
institucionalizaram o teste hipotético como parte do paradigma
científico dominante nas ciências sociais;
• Gerações de pesquisadores foram treinadas a fazer perguntas de
pesquisa em termos de falsear hipóteses, as quais eles deveriam
refutar com evidências estatísticas;
• Esta mudança de paradigma implica que a teoria deve preceder
a coleta de dados e que a pesquisa deve encontrar uma base
estatística para um conjunto preconcebido de hipóteses.
28
29. O ÚLTIMO MOMENTO “DIVISOR DE ÁGUAS”
• Portanto, as mudanças não foram endógenas à sociologia, elas
foram o resultado de campos que convergiram para abranger a
estatística, e suas grandes pesquisas de levantamento e survey;
• Vale ressaltar, contudo, que estas mudanças resultaram também
de demandas industriais (marketing), militares (estudos) e
governamentais (censos).
29
31. O atual momento "divisor de águas"
• Mudanças de paradigmas normalmente surgem de
mudanças fundamentais na natureza do conteúdo da
pesquisa;
• Como consequência do big data, o conteúdo de pesquisa
da ciência social está passando por tal mudança;
• Com isso, surgem novas técnicas e métodos analíticos;
31
32. O atual momento "divisor de águas"
•Nas ciências sociais, esta mudança incorre em novos
complexos de conhecimento informacional de dados;
•Com esta mudança técnica virá uma mudança teórica,
no pensar a comunidade, ou nas redes de parcerias e
recursos de que esta comunidade é composta.
32
34. Novos Dados
• A noção de “big data” não capta adequadamente o conjunto
de mudanças que estão transformando os dados atuais;
• É indispensável considerar a mudança na própria coleta de
dados, que se dá por meio de registros digitais de todo tipo;
• E isto se deve a mudanças lideradas pela indústria de
tecnologia, que têm tornado ubíquos registros digitais de
todo tipo.
34
35. Novos Dados
• Hoje, um número crescente de organizações detém dados
digitais sobre milhões de pessoas e seus hábitos em rede;
• Nós vivemos em uma “era da engenharia”, na qual contamos
com a tecnologia para uma variedade de tarefas, tornando-a
quase onipresente;
• Deste modo, os tipos de dados que são coletados e o alcance
dos contextos nos quais são fornecidos são notáveis.
35
36. Novos Dados
• Estes dados não são (apenas) informação expressa por
uma pessoa em particular colocada em uma determinada
relação com um pesquisador;
• Na sua maioria, são dados sobre comportamentos sociais
efetivados e sobre pessoas em suas atividades diárias;
• São "pegadas digitais" da atividade humana;
36
37. Novos Dados
• Os dados não são mediados por entrevistadores, mas
por uma tecnologia, dispositivo, ou interface;
• Estes são criados não para um uso artificial de pesquisa,
mas para fins privados ou institucionais;
• Em outras palavras, estes dados não necessitam de uma
hipótese de pesquisa orientadora para serem gerados.
37
38. Novos Dados
Os big data e os avanços computacionais apresentam uma
mudança de paradigma para a sociologia:
1. Fornecem acesso a dados sobre comportamentos sociais
básicos, mas até agora raramente documentados;
2. Eliminam a necessidade de desenhar amostras em
contextos nos quais o completo universo dos dados está já
documentado.
38
39. Novos Dados
• Porém, estes enormes corpus não estruturados de dados
exigem uma imensa potência computacional para serem
tornados inteligíveis;
• Contudo, a vantagem desta desordem reside no fato de os
pesquisadores poderem agora indutivamente construir
uma teoria a partir do zero, ao invés de testar hipóteses.
39
40. Novos Dados
• Porém, dados maiores e mais amplos não significam que
agora temos dados precisos e generalizáveis;
• Estes estão propensos ao erro e a vieses, pois cada
conjunto de big data tende a ser um único “mergulho"
adentro uma plataforma eletrônica e social;
40
41. Novos Dados
Além disso, há ainda questões que variam no fornecimento
individual de dados:
• as pessoas têm acesso a dispositivos tecnológicos (por
exemplo, smartphones e a internet)?
• são pessoas que usam muito estas tecnologias (por exemplo,
extrovertidos)?
• são pessoas que geram tipos específicos de registros em
acumulação (por exemplo, acadêmicos que publicam artigos
em plataformas e redes sociais específicas)?
41
42. Novos Dados
Mediante isto, uma pergunta que vale a pena ser feita é:
A escala, largura e profundidade destas novas informações irão
compensar as preocupações com os vieses da amostragem e a
falta de dados, e ainda permitir inferências válidas?
A resposta a esta questão não se dá nem no sentido de ignorar
os problemas dos big data, nem de invalidá-los como uma fonte
confiável de informação, mas de considerá-los na sua adequação
a cada tipo de pesquisa, de modo que os big data são sim mais
propensos a fornecer subsídios às generalizações sobre grandes
corpus e mais imprecisos para tratar de contextos específicos.
42
44. Novas Técnicas
• As bases de dados se ampliaram de tal forma que algumas das
antigas técnicas estatísticas se tornaram inaplicáveis;
• Os novos dados necessitam novos métodos de tratamento e
manuseio para que possam ser tornados informação;
• A expansão advinda com os big data gerou uma série de novas
técnicas computacionais e renovou os métodos tradicionais;
44
45. Novas Técnicas
Etnografia computacional
• É a abordagem mais comum na atualidade;
• Esta é etnográfica pelos pesquisadores procederem por indução,
mas, diferentemente da idiossincrasia dos relatórios tradicionais,
agora podem compartilhar os dados e reproduzir os resultados uns
dos outros;
• O processo de descoberta começa com um palpite inicial ou intuição
de como o fenômeno social surge.
• E, depois, os pesquisadores buscam por padrões nos dados, os quais
são reconstruídos dentro de uma narrativa que pode explicar o
fenômeno.
45
46. Novas Técnicas
Etnografia computacional
• Dada a natureza dos dados, os estudiosos começam a examinar
tendências e testar uma variedade de correlações para visualizar o que
está acontecendo;
• E quando encontram um resultado interessante, eles ilustram isso em
uma variedade de maneiras e, então, reavaliam e desenvolvem suas
teorias com a observação continuada;
• Tais exemplos podem ser encontrados em muitos dos estudos
descritivos usando big data.
46
47. Novas Técnicas
Novos métodos surgiram para confrontar esses dados,
adquiridos (especialmente) a partir de ligações (relacionais e de
eventos) e de textos (significados); as questões que estão sendo
feitas sobre estes dados são questões de simplificação e lógica:
• como reduzimos esses dados brutos a dados manuseáveis, mas
mantendo suas dimensões de significado?
• que tipos de padrões conseguimos discernir nesses dados?
47
48. Principais variedades de método na Ciência Social Computacional:
1. A primeira surge no campo da linguística computacional e é usada para
identificar padrões em falas e textos;
2. A segunda surge na ciência de rede (uma confluência de pesquisadores
de redes sociais entre ciência da computação e ciência social) e é
usada para identificar padrões em larga escala e ligações dinâmicas;
3. Uma terceira diz respeito a algoritmos que empregam esses recursos (e
outros) para predizer resultados variados, muitos dos quais adotam a
abordagem da aprendizagem de máquina, entretanto, uma de tipo
aumentada por modelagem de simulação.
4. Uma quarta abordagem decorre da interação humano-computador e
se utiliza da experimentação para tirar vantagem da larga escala, com
análises em tempo real de experiências de usuários em plataformas
de redes sociais, para, a partir destas, identificar relações causais.
48
49. Novas Técnicas
1 Linguística computacional
• A linguística computacional surgiu a partir da sobreposição
da linguística, da inteligência artificial e da ciência cognitiva,
procurando desenvolver modelos matemáticos para a
tradução automática de idiomas;
• A linguística computacional criou técnicas para transformar
falas em informações quantificáveis e também métodos para
identificar usos temáticos de texto, reconhecimento de
sentenças, etc.;
49
50. Novas Técnicas
1 Linguística computacional
• Aos cientistas sociais, isso provê uma infinidade de
métodos para análise linguística, muitos dos quais com a
aparência de teorias interacionais e sociolinguísticas;
• Em particular, a modelagem por tópicos transforma vastos
reservatórios de texto em sub-linguagens, ou em grupos de
palavras frequentemente utilizadas juntas;
• E, por exemplo, métricas de distâncias que aproximam textos
uns dos outros, utilizadas para simplificar e dar sentido para
grandes corpos de texto.
50
51. Novas Técnicas
2 Ciência de Rede
• Uniu esforços de análise da rede de cientistas da computação,
de físicos e de cientistas sociais metodologicamente orientados,
e que estudam as redes sociais;
• Estes estudos têm focado: ligações entre sites, trocas de e-mail
e em dados relacionais, extraídos a partir de uma variedade de
mídias sociais. Por exemplo, seguidores no Twitter, ou para
amizades e postagens de fotos no Facebook;
51
52. Novas Técnicas
2 Ciência de Rede
• Na indústria, esses recursos podem prever uma variedade
de resultados importantes aos negócios;
• Engenheiros tomam esses dados e desenvolvem modelos
para otimizar ações de marketing e impulsionar compra,
permanecimento do consumidor no site, etc.
52
53. Novas Técnicas
3 Aprendizagem de máquina
• Esta é uma ferramenta poderosa e que ajuda empresas e
pesquisadores em questões de engenharia;
• Por exemplo, na linguística computacional, a aprendizagem de
máquina é o próprio fundamento da tradução automática;
• O algoritmo prossegue identificando sequências de palavras
comuns entre traduções verificadas, e como um “conjunto de
treino” do crescimento de traduções conhecidas, vai criando,
por probabilidade, predições “precisas” sobre as associações
de palavras possíveis nos “conjuntos teste” de textos futuros.
53
54. Novas Técnicas
3 Aprendizagem de máquina
• A abordagem do aprendizado de máquina combinada com
teoria e pesquisa pode levar a bons resultados científicos.
• A perspectiva a-teórica do aprendizado de máquina pode
revelar padrões não previstos na teoria, ou uma nova maneira
de formular a teoria, a qual talvez o analista deixou passar.
• Portanto, a aprendizagem de máquina por si só (e por design)
resulta em pouco ou nenhum conhecimento (como é evidente
nos tradutores automáticos), caso não haja esforços para dela
derivar uma teoria ou explicação.
54
55. Novas Técnicas
4 Métodos Experimentais e Interação Homem-Máquina
• Um grande número de empresas e estudiosos se preocupa com
o estabelecimento de métodos experimentais para identificar
se o que muda em um ambiente social gera um efeito desejado;
• Estes experimentos acontecem em estudos de interação
humano-computador, em que plataformas de internet
oferecem condições ideais para o controle experimental.
• Experimentos on-line têm o beneficio de melhor controlar as
condições e estimar o efeito de um tratamento único ou de
intervenção em uma grande amostra de indivíduos.
55
56. Novas Técnicas
4 Métodos Experimentais e Interação Homem-Máquina
• O mesmo está a surgir para os cientistas que estudam mídia
social e big data, e, cada vez mais, revistas acadêmicas
evidenciam este tipo de teste como mais conclusivos que outros;
• Esses experimentos são executados de forma rápida e, em
seguida, ou produto se altera e/ou se continua com a fórmula;
• Porém, há pouco esforço para executar estudos secundários, e,
raramente, os resultados dos experimentos individuais são
coordenados para produzir contribuições sintéticas.
56
58. NOVAS LINHAS DE INVESTIGAÇÃO
•Questões sociais antigas de investigação científica são
abordadas novamente a partir novos ângulos;
•A vivência em um mundo de acesso aos big data criou
um novo conjunto de perguntas a serem investigadas;
•Novas linhas de investigação, as quais correspondem
também a mudanças teóricas.
58
59. NOVAS LINHAS DE INVESTIGAÇÃO
Exemplo 1 – Democracia e debate político:
• Uma antiga questão da ciência social melhor respondida nos
dias de hoje diz respeito ao bom funcionamento da democracia
pelo diálogo;
• Os pesquisadores de hoje têm acesso a todo tipo dado e
técnicas analíticas relevantes;
• Cientistas políticos e também os entrevistadores podem
examinar gravações, transcrições, blogs, opiniões, gravações
em C-Span, legislação, tweets, enquetes em curso, e pesquisas
de intenção de voto;
59
60. NOVAS LINHAS DE INVESTIGAÇÃO
Exemplo 1 – Democracia e debate político:
• Os pesquisadores têm acesso a registros que dizem quando,
onde, como e por quem as opiniões têm sido emitidas, e dados
transmitidos sobre como os espectadores reagem diretamente a
um debate, evento ou discurso, e isso em tempo real.
• Meios para discernir quem desempenha a “melhor” ou “pior”
performance em debates políticos, por exemplo; mas, claro,
“melhor” e “pior” podem ser definidos de inúmeras formas,
segundo o problema da pesquisa;
60
61. NOVAS LINHAS DE INVESTIGAÇÃO
Exemplo 2 – Desigualdade:
• Não mais limitados aos registros periódicos e esparsos de censos
e levantamentos, os pesquisadores podem observar as pessoas
se movendo cotidianamente;
• Eles têm registros de quando as pessoas entram em contato com
diferentes torres de telefonia celular, onde seus telefones e PCs
são registrados, e podem rastrear o movimento individual por
meio de sistemas de posicionamento global (GPS) em telefones;
• Com isso conhecem informações de grande importância sobre
onde, quando e precisamente em que medida as pessoas estão
realmente segregadas;
61
62. NOVAS LINHAS DE INVESTIGAÇÃO
Exemplo 2 – Desigualdade:
• Além destes novos dados, uma enorme variedade e quantidade
de dados coletados tradicionalmente pelo censo, polícia, serviços
de saúde e prefeitura estão agora sendo digitalizados e
conectados;
• De mão destes e dos big data, pesquisadores podem novamente
avaliar questões sobre a desigualdade, agora também em termos
de segregação, padrões de comportamento e acesso a uma
variedade de serviços sociais.
62
63. NOVAS LINHAS DE INVESTIGAÇÃO
• Com novos dados e novas tecnologias chegam também novas
questões de pesquisa e novos problemas;
• Sobrecarga de informação disponível – um problema
considerável hoje;
• Com os crescentes corpos de dados públicos e descobertas
maiores ainda em dados privados, há uma pressão para
minerá-los a fim de lhes extrair informação útil;
63
64. NOVAS LINHAS DE INVESTIGAÇÃO
• Mas que informação é útil? Para as empresas, é o que funciona –
ou que cria um resultado desejado; para os cientistas a que se
encaixa em explicações plausíveis dos fenômenos sociais – ou
que responde a uma pergunta de pesquisa;
• Em muitos casos, as empresas estão começando a ligar seus
dados com os conjuntos de dados públicos, construindo assim
bases de informações mais ricas sobre os consumidores;
• Os cientistas esperam usar tais conjuntos de dados ligados para
tratar de questões de interesse público, tais como observar em
que medida certas políticas públicas funcionam;
64
65. NOVAS LINHAS DE INVESTIGAÇÃO
• Nesta nova era (das mídias sociais, registros digitais, e muitos
trilhões de eventos transacionais), novas tecnologias e modos de
análise podem identificar vestígios de atividade pertencentes à
maioria de nós;
• Assim, questões sobre privacidade e ética em relação aos big data
se tornarão cada vez mais importantes, em vista de situações tais
como de crime cibernético ou da busca desenfreada por lucros e
o abuso do marketing digital.
65
67. BIG DATA COMO “ZONA DE TROCAS”
• Estas novas questões e problemas serão o foco dos cientistas
sociais, bem como de engenheiros (cientistas da computação),
tanto na academia quanto na indústria;
• Pesquisadores de cada um destes domínios passaram a se
preocupar com os mesmos tipos de dados, e usarão conjuntos
semelhantes de técnicas analíticas para transformar esses dados
em informações utilizáveis;
• Assim, os big data têm o potencial de se tornar uma espécie de
"zona de trocas" entre domínios, e de criar uma convergência nas
redes sociais e intelectuais que as envolvem, fazendo fruir o novo
paradigma das ciências sociais;
67
71. INCORPORAÇÕES TEÓRICAS
• Há quadros de pesquisa muito distintos e perspectivas gerais
funcionando quando se trata da análise de big data;
• Os autores acreditam que a realidade das colaborações para análise
dos big data atual levam à negociação e troca de conhecimentos;
• Argumentam que já estão a presenciar a partilha de conhecimentos
entre cientistas sociais e cientistas da computação, que usam os
mesmos dados e métodos;
• Ambos parecem estar adotando o foco em links e textos, e parecem
estar cada vez mais adotando perspectivas que evitem o
individualismo metodológico em favor de um relacionalismo ou um
transacionalismo metodológico;
71
73. INCORPORAÇÕES TEÓRICAS
• As abordagens das várias áreas diferem na forma como os
mesmos dados e métodos são utilizados, nas formas diferentes
como conduziriam uma mesma proposta de estudo;
• Isso é notório em casos de colaborações interdisciplinares, e nas
divisões de trabalho ou incorporações de perspectivas que delas
resultam;
• Uma hibridização completa pode ser difícil de se cumprir para
cientistas e engenheiros formados, mas novos pesquisadores irão
fundir essas perspectivas de novas maneiras, criando linguagens
híbridas, e que podem formar novos campos e disciplinas.
73
76. EXISTE ESPERANÇA DE SÍNTESE?
Há esperança para uma forma recíproca de troca e síntese teórica
entre os campos das ciências sociais e engenharias?
Segundo os autores, a esperança de síntese reside no que eles
chamam de Ciência Social Forense. Trata-se de uma abordagem
que combina perspectivas aplicadas e teoricamente dirigidas, assim
como, abordagens dedutivas e indutivas, mutuamente. Utiliza-se a
teoria para orientar parcialmente a exploração dedutiva dos dados,
enquanto se utiliza, ao mesmo tempo, a indução para descobrir
qual teoria oferece uma explicação ou mesmo para reformar a
teoria utilizada de antemão.
76
77. EXISTE ESPERANÇA DE SÍNTESE?
Ciência Social Forense
• No caso de uma cena de crime, o cientista forense se
aproxima da configuração com um arsenal de ferramentas e
entendimentos de cenas de assassinato. Nesta, as teorias e as
evidências coevoluem de forma rápida, interativa e em ritmo
acelerado;
• Assim, os métodos dedutivos de mineração de dados e de
previsão automática de interações não são os resultados da
pesquisa para o cientista social forense, mas apenas o seu
primeiro passo;
77
78. EXISTE ESPERANÇA DE SÍNTESE?
Exemplo 1 - Análise do consumo de filmes na plataforma Netflix
Neste caso, a partir das predições providas pelos algoritmos, o cientista
social forense deverá ainda buscar responder questões como:
• Qual dos componentes neste algoritmo explica o gosto cultural, e a
quais processos cognitivos e sociais eles correspondem?
• Será que eles se relacionam com o conteúdo dos filmes que estão
sendo avaliados?
• Ou com a identidade das pessoas que os consomem?
• Ou talvez à maneira pela qual as pessoas influenciam-se mutuamente
por meio de suas escolhas de consumo?
78
79. EXISTE ESPERANÇA DE SÍNTESE?
Ciência Social Forense
Segundo os autores, para se tornarem aparatos de
construir teorias, as ferramentas forenses das ciências
sociais precisam identificar padrões nos dados e, em
seguida, rastreá-los de volta a construções analíticas
significativas.
79
80. EXISTE ESPERANÇA DE SÍNTESE?
Ciência Social Forense
• Segundo os autores, a ciência social forense é promissora e
particularmente interessante no que diz respeito a objetos
textuais não estruturados e dados audiovisuais, os quais até
agora têm escapado às ciências sociais;
• A era dos big data pode também representar uma mudança
de paradigma para o construtivismo científico, o qual deve
metodicamente explorar e teorizar sobre os processos pelos
quais o significado é coletivamente negociado, por meio de
interações interpessoais, e com as máquinas.
80
82. CONCLUSÃO
O FUTURO DA SOCIOLOGIA E OS BIG DATA
• O surgimento dos big data é um divisor de águas para as
ciências sociais, semelhante ao observado na estatística, em
pesquisas de meados do século passado;
• Estamos testemunhando uma mudança do individualismo
metodológico para um transacionalismo metodológico, e
uma abertura para uma ampla gama de teorias sociais sobre
interação, focos de atenção e significados de uso;
82
83. CONCLUSÃO
O FUTURO DA SOCIOLOGIA E OS BIG DATA
• Os big data não são apenas grandes, mas ricos e, muitas das
vezes, dizem respeito à forma e ao conteúdo das
comunicações (links e textos) em diversos fenômenos sociais;
• Assim, há a procura por novos métodos, que reduzam sua
dimensionalidade, identifiquem padrões e relações,
prevejam resultados e possibilitem experimentos in loco,
revelando formas de alterar relações sociais nas direções
desejadas (como no caso de políticas públicas, por exemplo).
83
84. CONCLUSÃO
O FUTURO DA SOCIOLOGIA E OS BIG DATA
Os big data e os novos métodos disponíveis geraram também
uma revisitação a antigos questionamentos da ciência social
(agora potencialmente respondíveis em um nível societário) e
permitiu a criação de linhas de pesquisa inteiramente novas
(em grande parte graças às novas tecnologias de informação
e comunicação, que ao mesmo tempo mediam e registram
uma variedade impressionante de experiências sociais).
84
85. CONCLUSÃO
O FUTURO DA SOCIOLOGIA E OS BIG DATA
• Estas transformações são também resultado da convergência do
trabalho de engenheiros de empresas privadas com o de cientistas
sociais e da computação por estas mesmas recrutados, em que
todos estão focados na informação social digital recolhida dos big
data gerados por grande parcelas de populações humanas;
• No entanto, o foco e preocupação compartilhados por aqueles
estão em desacordo com o fato de que há consideráveis diferenças
entre os quadros de investigação de engenheiros (da indústria) e
de cientistas sociais, o que pode levar uma área a colonizar a outra;
85
86. CONCLUSÃO
O FUTURO DA SOCIOLOGIA E OS BIG DATA
• No momento, estamos experimentando um alto nível de inovação
tecnológica, em que soluções de engenharia para problemas
práticos têm maior valor, tanto financeira e simbolicamente,
quanto em termos de explicação e entendimento científico;
• Isto inclui uma variedade de razões estruturais, como o fato de que
questões e soluções de engenharia são muito mais aplicadas às
preocupações empresariais, e, portanto, para obtenção de lucro;
• Assim, os cientistas sociais dependem da sua capacidade de adotar
uma abordagem computacional e utilizarem sua teoria como uma
reflexão posterior que ajuda a melhor explicar dados encontrados.
86
87. CONCLUSÃO
O FUTURO DA SOCIOLOGIA E OS BIG DATA
Apesar destas condições estruturais, os autores acreditam que uma
abordagem híbrida nos termos de uma Ciência Social Forense pode
ser mais propícia e bem sucedida a longo prazo. Os autores dizem
ainda que não defendem esta posição somente porque esta parece
defensável em uma época de teorias pluralistas, mas porque, em
uma era pragmática, comparações críticas de abordagens e esforços
para fornecer explanações robustas permitirão maior contribuição
ao conhecimento científico como um todo.
87
88. Referências
MARTEL, Frédéric. Smart: o que você não sabe sobre a internet.
Tradução Clóvis Marques. Rio de Janeiro: Cilivilização Brasileira, 2015.
MCFARLAND, Daniel A.; LEWIS, Kevin; GOLDBERG, Amir. Sociology in
the Era of Big Data: The Ascent of Forensic Social Science. Published
online: 17 set. 2015. Springer: New York, 2015. DOI 10.1007/s12108-
015-9291-8. Acesso em: 27 out. 2016. Disponível em:
<https://www.gsb.stanford.edu/sites/gsb/files/publication-
pdf/amsoc.pdf>.
STANFORD. Center for Computational Social Sciences. 2016. Acesso
em: 30 out. 2016. Disponível em: <https://iriss.stanford.edu/css>.
88