O documento discute os principais conceitos e tecnologias relacionadas a Big Data, incluindo a transformação de dados em informações, análise em nuvem, ecossistema e infraestrutura para Big Data. Casos de sucesso mostram como empresas usaram serviços AWS como EMR, Redshift e Data Pipeline para obter visibilidade, reduzir custos e acelerar processos analíticos.
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Big Data na Nuvem
1. Big Data na AWS
Eduardo Horai
AWS Solutions Architect
2. Vários Tutoriais , treinamentos e mentoria em
português
Inscreva-se agora !!
http://awshub.com.br
3. Agenda
1. Introdução a Big Data
2. Transformando dado em informação
3. Analítico e Computação nas nuvens
4. Ecossistema Big Data
5. Infraestrutura tecnológica para Big Data
5. Uma das definições de Big Data
Quando a quantidade de dados começa a ficar tão grande que você tem
que começar a inovar no jeito de coletar, armazenar, organizar, analisar
e compartilhar a informação.
10. Dados gerados
Disponivel para análise
Volume de dados
Gartner: User Survey Analysis: Key Trends Shaping the Future of Data Center Infrastructure Through 2011
IDC: Worldwide Business Analytics Software 2012–2016 Forecast and 2011 Vendor Shares
11.
12. Elasticidade e alta escalabilidade
+
Sem capital adiantado
+
Paga apenas por uso
+
Disponível por demanda
Remove
todos os
limites
=
18. • O Operador Nacional do Sistema Elétrico
(ONS) é uma empresa privada, responsável
pelo planejamento e operação da geração e
transmissão de energia elétrica no Sistema
Interligado Nacional (SIN).
• Com cerca de 800 funcionários, em 5 localidades
(Rio de Janeiro, Recife, Florianópolis e Brasília), o
ONS é uma empresa intensiva em informações
com uso contínuo de modelos matemáticos que
requer HPC (High Performance Computing e Big
Data)
“A Amazon Web Services permitiu provisionar clusters de alto
desempenho em minutos, rodando em paralelo, reduzindo
significantemente o tempo total de processamento”.
“Com isso, percebemos
que a AWSé
magicamente, muito
mais rápida,
elástica e barata
que nossos blades
atuais”
- Sérgio Mafra
19. • Prover ao ONS uma plataforma de maior
capacidade de processamento, permitindo
obter uma redução no tempo de solução dos
modelos matemáticos, com custo adequado ao
tempo de utilização, de fácil gestão do
ambiente em cluster e que fosse transparente
para a organização.
• Permitir o “time-to-market” para a área de TI,
detendo o conhecimento e a responsividade às
demandas inesperadas provenientes das áreas
da organização.
O Desafio
“Scotty, We Need More Power”
20. • Redução de cerca de 40% no tempo de
resolução dos modelos matemáticos de
planejamento eletro-energéticos, com custo
30% inferior.
• Condição de analisar 5 estratégias de utilização
dos modelos Newave/Decomp em prazo
recorde (1 semana), com a execução de 600
casos. O prazo on-premises seria de 3 semanas,
incompatível com o compromisso acordado
com o MME.
Sobre a o Papel da AWS e Benefícios
alcançados
23. • MercadoPago é a plataforma de pagamentos
do Mercado Livre, utilizada em mais de cem mil
sites de toda a América Latina.
• O MercadoPago precisava de uma visão real do
e-commerce no Brasil, tanto no âmbito
estratégico quanto no tático. Para alcançar essa
visão, a tecnologia tem um papel fundamental.
“Com o AWS, conseguimos montar uma
visão inédita do e-commerce brasileiro”.
“Sem o AWS, teria sido
financeiramente
inviável executar
esse projeto”
24. O Desafio
• O mercado de e-commerce no Brasil sofre da
falta de informação. Não existem números
precisos sobre a quantidade de sites, muito
menos da participação de mercado dos
diferentes prestadores de serviço (plataformas,
meios de pagamento, etc.)
• Para se obter essas informações de maneira
efetiva, é necessário um processo massivo de
coleta e processamento de informações.
25. Sobre o Papel da AWS e Benefícios
alcançados
PARAGRAFO RESUMO
CASO _ KEY WORDS
de BENEFICIO,
DESAFIO VENCIDO –
RESUMO DO CASO EM
UM PARAGRAFO
• Com o AWS, foi possível montar um processo
escalável que visita quase todos os sites da
internet brasileira (2.5 Milhões) 1x por semana.
• Do ínico do projeto até hoje, já foram mais de
16 bilhões de páginas visitadas, mais de 700TB
de dados processados, e já poupamos mais de
R$ 250 mil com a AWS.
• Montamos o 1º mapa compreensivo da web
brasileira.
60. Mobilidade dos dados
Gerados e armazenados na AWS
Transferência de dados entrante é gratuito
Multipart upload para S3
Media física (EUA apenas)
AWS Direct Connect
Replicação de AMIs e snapshots
68. S3
DynamoDB EMR
HBase on EMR RDS
Redshift
On premisesLogs de App
Pedidos
do dia
Acesso do
usuário
ERP/Prod
utos
Histórico de
compras
Recomendações
de compra
Analítico de
recomendação
75. Analysis of Data Can Transform Society
Create new business
models and improve
organizational
processes.
Enhance scientific
understanding, drive
innovation, and
accelerate medical cures.
Increase public safety
and improve
energy efficiency with
smart grids.
76. Democratizing Analytics gets Value out of Big Data
Unlock Value in
Silicon
Support Open
Platforms
Deliver Software Value
77. Intel at the Intersection of Big Data
Enabling exascale
computing on massive data
sets
Helping enterprises
build open
interoperable clouds
Contributing code
and fostering
ecosystem
HPC Cloud Open Source
78. Intel at the Heart of the Cloud
Server
Storage
Network
80. Scale-Out Platform Optimizations for Big Data
Cost-effective performance
•Intel® Advanced Vector Extension Technology
•Intel® Turbo Boost Technology 2.0
•Intel® Advanced Encryption Standard New
Instructions Technology
81. Intel® Advanced Vector Extensions Technology
1 : Performance comparison using Linpack benchmark. See backup for configuration details.
For more legal information on performance forecasts go to http://www.intel.com/performance
81
• Newest in a long line of
processor instruction
innovations
• Increases floating point
operations per clock up to
2X1 performance
Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark,
are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should
consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other
products.
82. Intel® Turbo Boost Technology 2.0
More Performance
Higher turbo speeds maximize
performance for single and
multi-threaded applications
83. Intel® Advanced Encryption
Standard New Instructions
• Processor assistance for
performing AES encryption
7 new instructions
• Makes enabled encryption
software faster and stronger
84. Power of the Platform built by Intel
Richer
user
experiences
4HRS
50%
Reduction
10MIN
80%
Reduction 50%
Reduction 40%
Reduction
TeraSort for
1TB sort
Intel®
Xeon®
Processor
E5 2600
Solid-State
Drive 10G
Ethernet Intel® Apache
Hadoop
Previous
Intel®
Xeon®
Processor
86. Get 600 Hours of Free
Supercomputing Time!
www.powerof60.com
What can you
do in 60 minutes?
87.
88. Resumo
1. Introdução a Big Data
2. Transformando dado em informação
3. Analítico e Computação nas nuvens
4. Ecossistema Big Data
5. Infraestrutura tecnológica para Big Data