3. Introdução
O objetivo do slide é apresentar os
conceitos básicos do Big Data e suas
aplicações.
2
4. O que é
De acordo com o site da IBM:
“Big data is being generated by
everything around us at all times. Every
digital process and social media
exchange produces it. Systems,
sensors and mobile devices transmit it.
Big data is arriving from multiple
sources at an alarming velocity, volume
and variety. ”
3
5. O que é
Podemos dizer que Big Data é
um termo usado para lidar com
dados em massa, além da
capacidade dos bancos de
dados comuns. Big Data trata
de muita informação com
velocidade e precisão.
4
7. Conceitos
Volume: Hoje a quantidade de dados
produzidos no mundo é absurdamente
grande.
Velocidade: Para manipular grandes
volumes é fundamental que o
processo seja veloz, até mesmo em
tempo real, caso contrário seria
caótico. Pense em cartão de crédito.
6
8. Conceitos
Variedade: Consequente do volume, a
variedade está em dados estruturados
(armazenados na Oracle por exemplo)
e não estruturados, oriundos de
diversas fontes.
7
9. Aplicação
O Big Data, além de lidar com muitos
dados variados, ele precisa de trabalhar
com o suporte de aplicação para esses
dados em constante crescimento.
Os Banco de Dados tradicionais
( MySQL e Oracle) não são flexiveis
suficiente para tal serviço.
8
10. Aplicação
Então o NoSQL foi criado (significa
“not only SQL” -Structured Query
Language). Ele é uma espécie de
banco de dados que possibilita o
armazenamento dos dados
inclusos no Big Data de maneira
flexível.
9
11. Aplicação
Não é porque o NoSQL foi criado
que os bancos de dados
tradicionais irão desaparecer.
Existem casos e casos, que nem
sempre o NoSQL é necessário,
como por exemplo em empresas
de pequeno porte.
10
13. Aplicação
Quando tratamos de Big Data, um
NoSQL sozinho não pode fazer todo o
serviço. É necessário portanto de uma
ferramenta que maneja o volume de
dados, como o Hadoop, que é o mais
conhecido.
12
14. Hadoop
O Hadoop é uma plataforma open
source desenvolvido pela Apache, que
processa e analisa grandes volumes de
dados, sejam eles estruturados ou não.
O que ele faz é basicamente dividir os
dados através em vários computadores,
usando modelos de programação
simples.
13
15. Hadoop
Hadoop casa-se bem com o Big Data
por vários motivos:
Open source, que permite
customização e se torna suscetível à
melhorias;
Economico, visto que é gratuito;
Tolerante a falhas, com o recurso de
replicação de dados;
14
16. Hadoop
Ele é flexivel, permitindo o
processamento de quantidades
maiores de dados, acrescentando
computadores sem configurações
complexas.
15
17. Conclusão
Hoje o mundo está completamente
conectado e a todo instante surge uma
informação nova. Para acompanhar
tudo isso, a tecnologia tem que arrumar
maneiras eficientes. O Big Data foi uma
solução que promete facilitar ainda
mais o futuro da informação.
16
18. Extras
Video que explica por desenho o que
é Big Data:
http://www.youtube.com/watch?v=qD5
S6yZXaVI
TEDTalks:
http://www.youtube.com/watch?v=Zr02f
MBfuRA