Palestra de Marcio Argollo de Menezes no 3º Seminário Big Data Brasil. Marcio participou da Mesa: A Força da Rede.
Big data não é um grande volume de dados. O que justifica a relevância do conceito é o fato dos dados serem gerados em uma rede complexa conhecida como WWW. Dados conectados, Network Science e pensamento exponencial serão os temas dessa mesa.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
3º Seminário Big Data Brasil - Marcio Argollo - Redes Complexas
1. Redes complexas
Marcio Argollo de Menezes
Universidade Federal Fluminense
Instituto Nacional de Ciência e Tecnologia – Sistemas Complexos
complex.if.uff.br
4. Systems approach in Physics
Abstraction of irrelevant (to scale) details
Functional relation between abstract elements
Fundamental laws
Orbit of planets, pressure of hot gases, etc...
Ideal gas law
(D. Bernoulli, 1738)
5. Systems approach in Physics
Abstraction of irrelevant (to scale) details
Functional relation between abstract elements
Fundamental laws
Orbit of planets, pressure of hot gases, etc...
Ideal gas law
(D. Bernoulli, 1738)
Atomic theory
(E.Rutherford, 1911)
Quantum theory
(E.Scrhödinger, 1926)
7. Redes: um paradigma de sistemas interagentes
Grafos: Euler (1736) e as “Sete Pontes de Koenigsberg”
“Será possível percorrer a cidade utilizando todas as pontes, sem repetir
nenhuma delas?”
8. Redes: um paradigma de sistemas interagentes
Grafos: Euler (1736) e as “Sete Pontes de Koenigsberg”
- Abstração do problema
- Discriminação de elementos relevantes
- Redução de complexidade sem perda de informação relevante
9. A experiência de Milgram
Stanley Milgram "The Small World Problem”, Psychology Today 2: 60-67 (1967).
http://en.wikipedia.org/wiki/Small_world_phenomenon
• Remetentes aleatoriamente escolhidos na costa leste dos EUA
• Destinatário na costa oeste
• Se remetente conhece o destinatário pessoalmente, entrega a carta
• Se não conhecer, entrega para amigo que possa conhecer o destinatário
10. • Remetentes aleatoriamente escolhidos na costa leste dos EUA
• Destinatário na costa oeste
• Se remetente conhece o destinatário pessoalmente, entrega a carta
• Se não conhecer, entrega para amigo que possa conhecer o destinatário
l15=2 [125]
l17=4 [1346 7]
…
< l > = ??
1
2
3
4
5
6
7
A experiência de Milgram
Stanley Milgram "The Small World Problem”, Psychology Today 2: 60-67 (1967).
http://en.wikipedia.org/wiki/Small_world_phenomenon
11. • Remetentes aleatoriamente escolhidos na costa leste dos EUA
• Destinatário na costa oeste
• Se remetente conhece o destinatário pessoalmente, entrega a carta
• Se não conhecer, entrega para amigo que possa conhecer o destinatário
“Seis graus de liberdade”
N ~ 106
pessoas nos EUA
<l> ~ 6 amigos
A experiência de Milgram
Stanley Milgram "The Small World Problem”, Psychology Today 2: 60-67 (1967).
http://en.wikipedia.org/wiki/Small_world_phenomenon
12. Pál ErdösPál Erdös
(1913-1996)
Grafos Aleatórios de Erdös-Rényi
P. Erdos and A. Renyi. On random graphs. Publ. Math. Debrecen, 6:290--297, 1959.
http://en.wikipedia.org/wiki/Paul_Erdos
13. Pál ErdösPál Erdös
(1913-1996)
Pares de sítios
conectados c/
prob. p
Grafos Aleatórios de Erdös-Rényi
P. Erdös and A. Rényi. On random graphs. Publ. Math. Debrecen, 6:290--297, 1959.
http://en.wikipedia.org/wiki/Paul_Erdos
14. Pares de sítios
conectados c/
prob. p
Grafos Aleatórios de Erdös-Rényi
P. Erdös and A. Rényi. On random graphs. Publ. Math. Debrecen, 6:290--297, 1959.
http://en.wikipedia.org/wiki/Paul_Erdos
Poisson distribution
15. Pál ErdösPál Erdös
(1913-1996)
Grafos Aleatórios de Erdös-Rényi
P. Erdös and A. Rényi. On random graphs. Publ. Math. Debrecen, 6:290--297, 1959.
http://en.wikipedia.org/wiki/Paul_Erdos
“Seis graus de liberdade”
N ~ 106
<l> ~ 6 amigos
16.
17.
18. ACTOR CONNECTIVITIES
N = 212,250 atores
k = 28.78
P(k) ~k-
Days of Thunder
(1990) Far and Away
(1992) Eyes Wide
Shut (1999)
=2.3
oracleofbacon.org
19. A Internet
• 1957 - União Soviética lança com sucesso o Sputnik
• 1962 - DoD cria sistema de informação resistente a desastres (nucleares)
20. A Internet
• 1957 - União Soviética lança com sucesso o Sputnik
• 1962 - DoD cria sistema de informação resistente a desastres (nucleares)
• Militares transferem sistema para universidades (ARPANET)
21. A Internet
• 1957 - União Soviética lança com sucesso o Sputnik
• 1962 - DoD cria sistema de informação resistente a desastres (nucleares)
• Militares transferem sistemas para universidades (ARPANET)
• NSFNET - Backbone + sub-redes (MCI, Sprint)
22. A Internet
• 1957 - União Soviética lança com sucesso o Sputnik
• 1962 - DoD cria sistema de informação resistente a desastres (nucleares)
• Militares transferem sistemas para universidades (ARPANET)
• NSFNET - Backbone + sub-redes (MCI, Sprint)
• Aumento exponencial no número de sub-redes
23. World Wide Web
800 milhões de páginas
(S. Lawrence, 1999)
ROBOT: Coleciona
todos os links de
uma dada página e
segue buscando por
outras
recursivamente.
Sítios: Páginas de hipertexto
Ligações: Links de hipertexto
R. Albert, H. Jeong, A-L Barabasi, Nature, 401 130 (1999)
24. 800 milhões de páginas
(S. Lawrence, 1999)
Sítios: Páginas de hipertexto
Ligações: Links de hipertexto
R. Albert, H. Jeong, A-L Barabasi, Nature, 401 130 (1999)
out= 2.45 in = 2.1
World Wide Web
25. Sex-web
Nodes: people (Females; Males)
Links: sexual relationships
4781 Suecos entre 18-74 anos
“The Web of Human Sexual Contacts”
F.Liljeros et al. Nature (2001) 411: 908
26. # Reação# Reação FórmulaFórmula EnzimaEnzima
11 2 ATP + Ac2 ATP + Ac AcCoAAcCoA acsacs
22 AcPAcP ATP + AcATP + Ac ackAackA
33 AcPAcP ATP + AcATP + Ac ackEackE
44 HHexex ATPATP atp_eatp_e
NN 41.257 ATP + 3.547 NAD + 0.205 G6P …41.257 ATP + 3.547 NAD + 0.205 G6P … Biomassa Biomassa
Cadeias de reações metabólicas (em verdade, redes)
27. Cadeias de reações metabólicas (em verdade, redes)
# Reação# Reação FórmulaFórmula EnzimaEnzima
11 2 ATP + Ac2 ATP + Ac AcCoAAcCoA acsacs
22 AcPAcP ATP + AcATP + Ac ackAackA
33 AcPAcP ATP + AcATP + Ac ackEackE
44 HHexex ATPATP atp_eatp_e
NN 41.257 ATP + 3.547 NAD + 0.205 G6P …41.257 ATP + 3.547 NAD + 0.205 G6P … Biomassa Biomassa
28.
29.
30. k ~ 6
P(k=500) ~ 10-99
NWWW ~ 109
N(k=500)~10-90
What did we expect?
P(k=500) ~ 10-6
NWWW ~ 109
N(k=500) ~ 103
We find:
out= 2.45 in = 2.1
31. O que isso significa?
Exponential Network Scale-free Network
32. Vantagens e desvantagens da topologia scale-free
• Resistente a uma falha ocasional de algum de seus elementos
• Extremamente sensível a ataques intencionais aos Hubs.
33. Nature 408 307 (2000)
…
“One way to understand the p53 network
is to compare it to the Internet.
The cell, like the Internet, appears to
be a ‘scale-free network’.”
34. Metabolismo: consumo seletivo de nutrientes
# Reação Fórmula Enzima
1 2 ATP + Ac AcCoA acs
2 AcP ATP + Ac ackA
3 AcP ATP + Ac ackE
4 Hex ATP atp_e
N 41.257 ATP + 3.547 NAD + 0.205 G6P … Biomassa -
37. Experiments with E. Coli: selective substrate consumption
Lac-operon and diauxic growth
(Monod):
“Lactose is consumed only after
glucose is depleted from the medium”
Genetic regulation of lactate production
Evolutive origin of regulation
Impact of limited solvent capacity on metabolic rate,
enzyme activities and metabolite concentrations of S.
cerevisiae glycolysis, A. Vazquez, M. Argollo de Menezes,
A.-L. Barabási and Z.N. Oltvai, PLoS Computational Biology
4:10, 1-6 (2008).
Impact of the solvent capacity constraint on E. coli
metabolis , A. Vazquez, Q. Beg, M. Argollo de Menezes, J.
Ernst, Z. Bar-Joseph, A.-L. Barabási, L. Boros and Z.N. Oltvai,
BMC Systems Biology 2,2:7 (2008).
Intracellular crowding defines the mode and sequence of
substrate uptake by Escherichia coli and constraints its
metabolic activity ,Q. Beg, A. Vazquez, J. Ernst, M. Argollo
de Menezes, Z. Bar-Joseph, A.-L. Barabási and Z.N. Oltvai.
Proc. Natl. Acad. Sci. 104, 12663 (2007).
42. Evolução
“Árvore da vida” (Darwin, 1859) “Anel da vida”
Ochiai, K., Yamanaka, T Kimura K and Sawada, O (1959)
Inheritance of drug resistance (and its tranfer) between
Shigella strains and Between Shigella and E.coli strains.
Hihon Iji Shimpor 1861: 34