SlideShare una empresa de Scribd logo
1 de 37
© 2021, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon Confidential and Trademark.
AWSWebinar Series Brasil
Andre Fellipe
Arquiteto de Soluções
Os benefícios de migrar seus workloads de Big
Data para a AWS
Como interagir durante o evento?
Você tem um projeto e
quer conversar com o
time comercial da
AWS?
Acesse o LIVE CHAT
neste QR code ou pelo
link enviado no chat do
evento.
Perguntas & Respostas ao
vivo durante todo o
evento
Tire suas dúvidas com os
especialistas da AWS!
Clique no símbolo “?” e
envie suas perguntas.
O recurso mais valioso já
não é petróleo, mas os
dados.
*Copyright: The Economist, 2017, David Parkins
Mais dados Mais personas Demanda por tomada
de decisão mais
rápida
As novas realidades que os clientes estão enfrentando
.
Os clientes querem mais valor de seus dados
U S AD O P O R
M U I T AS
P E S S O AS
C R E S C E N D O
E X P O N E N C I AL M E N T
E
D E N O V AS
F O N TE S
D I V E R S I D AD E AN A L I S A D O P O R
M U I TO S
AP L I C A T I V O S
- Instalação de hardware e software, configuração, correção,
backups;
- Problemas de desempenho e alta disponibilidade;
- Planejamento de capacidade;
- Segurança e conformidade.
Serviços de analytics gerenciados por conta própria
consomem tempo, são complexos e caros
Por que Big Data na AWS?
Mais fácil de construir Infraestrutura
mais segura
Abrangência Escalável e
econômico
1 2 3 4
1. Mais fácil de construir data lakes e analytics
Data lake
S3
Relatórios
Consultas Ad Hoc
Big Data Analytics
Data Warehousing
Analytics
Machine Learning
AWS Lake
Formation
2. Abrangência
Dados, visualização,
engajamento e
machine learning
Analytics
Data lakes
Governança
Dashboards Predictive
Analytics
Engajamento de
usuários
Dados
Data
Warehousing
Processamento
Consultas
interativas
Análise
Operacional
Analytics em
tempo real
Processamento
Serverless
Infraestrutura Catálogo de
Dados & ETL
Segurança &
Gerenciamento
Migração &
Streaming
3. Infraestrutura mais segura
Os clientes precisam ter vários níveis de segurança, gerenciamento de identidade e acesso,
criptografia e conformidade para proteger seu data lake
Identidade
AWS IAM
AWS SSO
Amazon Cloud Directory
AWS Directory Service
AWS Organizations
Encriptação
AWS Certificate Manager
AWS Key Management
Service
Criptografia em repouso
Criptografia em trânsito
Traga suas próprias chaves,
suporte HSM
Conformidade
AWS Artifact
Amazon Inspector
Amazon Cloud HSM
Amazon Cognito
AWS CloudTrail
Segurança
Amazon GuardDuty
AWS Shield
AWS WAF
Amazon Macie
VPC
4. Infraestrutura mais escalável, econômica e de alto
desempenho para analytics
Cinco camadas de
armazenamento
Mais de 200 tipos de
instância para atender
as necessidades
Instâncias sob
demanda, reservadas
e spot
Interfaces de rede de
largura de banda de
100 Gbps
Desafios de clusters on-premises
Computação e armazenamento acoplados
• O armazenamento cresce junto
com a computação;
• Os requisitos de computação
variam.
Fortemente
acoplado
Computação
Armazenamento
A replicação aumenta o custo
3x
• Os dados são replicados várias
vezes;
• Normalmente, apenas em um data
center.
Recursos escassos ou subutilizados
0
20
40
60
80
100
120
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Reprocessamento
Picos semanais
Estável
Competição pelos mesmos recursos
Hadoop
Hive Spark
Limitações em atualizações
• Transformação em grande escala: Map/Reduce, Hive, Pig, Spark;
• Consultas interativas: Impala, Spark SQL, Presto;
• Machine Learning: Spark ML, MxNet, Tensorflow;
• Notebooks interativos: Jupyter, Zeppelin;
• NoSQL: HBase.
A separação de recursos cria silos
Hive Spark
Amazon EMR
Amazon EMR
• Serviço gerenciado para executar aplicativos do ecossistema
Hadoop, como Spark, Hive, Presto e muitos outros;
• Pode processar grandes volumes de dados armazenados no
Amazon S3 (EMRFS), HDFS, Amazon DynamoDB, Amazon
Redshift, Amazon Kinesis, Kafka e outras fontes de dados;
• Use clusters transitórios, Managed Scaling, Amazon Simple
Storage Service (Amazon S3) e Instâncias Spot para cortar
custos.
Amazon EMR
Execute facilmente Spark, Hive, Presto, HBase, Flink e mais aplicativos de big data na AWS
Melhor
desempenho com
menor custo
Workloads Spark rodam 2,4x mais
rápido em comparação ao open
source
Redução de custos com EC2 Spot e
Instâncias Reservadas
Faturamento por segundo para
flexibilidade
Use o
armazenamento S3
Processe dados em S3 com
segurança e alto desempenho
usando o EMRFS
Escale computação e
armazenamento independentes
um do outro
Últimas versões
Atualizado com as estruturas de
código aberto mais recentes em
30 dias
Suporte para open source
populares como Flink e Hudi
Totalmente gerenciado, sem
configuração de cluster,
provisionamento de nó ou ajuste
de cluster
Escala automática vertical e
horizontal para atender às
demandas
Fácil e Escalável
Custos otimizados com o Amazon EMR
• Menos tempo de
administração para
gerenciar e suportar
clusters;
• Sem custos de antemão:
aquisição e instalação de
hardware;
• Economize em custos
operacionais - espaço no
data center, energia,
refrigeração, etc.
Suporte Taxa
Suporte
On-premises EMR
Server Costs
Hardware—Server, Rack, Chassis,
PDUs, Tor Switches (+Maintenance)
Software—OS, Virtualization Licenses
(+Maintenance)
Network Costs
Network Hardware—LAN Switches,
Load Balancer Bandwidth costs
Software—Network Monitoring
IT Labor Costs
Server admin, virtualization admin,
storage admin, network admin,
support team
Extras
Project planning, advisors, legal,
contractors, managed services, training,
cost of capital
Benefícios
Desacople armazenamento e computação
Computação
Metastore
Amazon RDS
AWS Glue
Data
Catalog
Amazon EMR
Amazon Athena
Amazon Redshift
Spectrum
Amazon S3
Armazenamento
Ferramentas open source no Amazon EMR
Cluster 1 Cluster 2
Cluster 3 Cluster 4
Zona de Disponibilidade B
Amazon S3
Zona de Disponibilidade A
Recuperação de desastres integrada
Pausar ou encerrar clusters
Amazon EMR Amazon EMR
Amazon S3 Amazon S3 Amazon S3
Separação lógica
Rearquitetar clusters monolíticos para construídos
com finalidade específica:
• Criação de clusters transitórios e / ou persistentes;
• Separando clusters por aplicativo;
• Separando clusters por versão do aplicativo.
Cluster monolítico tradicional
Clusters de propósito específico
vs. As considerações de design são:
• Como você envia trabalhos ou constrói pipelines;
• Persistindo seus dados no S3;
• Armazenamento de metadados fora do cluster;
• Por quanto tempo o job é executado;
• Quais aplicativos são necessários.
EMR Managed Scaling
Auto Scaling group
Amazon EMR
Instâncias Spot
- Mais rápido;
- Menor custo.
Nó
Auto Scaling
Conceitos básicos
Sobre clusters e nós
• O componente central do Amazon EMR é o cluster.
Um cluster é uma coleção de instâncias do Amazon
Elastic Compute Cloud (Amazon EC2);
• Cada instância do cluster é chamada de nó;
• Cada nó tem uma função dentro do cluster;
• O Amazon EMR também instala diferentes
componentes de software em cada tipo de nó, dando a
cada nó uma função em um aplicativo distribuído.
Master
EMR cluster
Task
Core
HDFS HDFS
Os Core Nodes podem ser
adicionados e removidos
sem problemas.
O Master Node deve
continuar em execução.
O cluster pode tolerar a
perda de Task Nodes.
Tipos de Nó
Opções de deployment flexíveis do Amazon EMR
A AWS oferece mais opções de instância do que qualquer outro
provedor de nuvem. Escolha a instância que oferece o melhor
desempenho ou custo para sua carga de trabalho, incluindo
Graviton2. Aproveite as vantagens das instâncias On-Demand,
Reserved e Spot para otimizar os custos.
Configure, implante, gerencie e dimensione o EMR em seus
ambientes locais, assim como você faria na nuvem. O AWS Outposts
oferece serviços, infraestrutura e modelos operacionais da AWS para
praticamente qualquer data center, espaço de colocation ou instalação
on-premises.
Use EMR para automatizar o provisionamento, gerenciamento e
escalonamento de jobs do Apache Spark no Amazon Elastic
Kubernetes Service (EKS) e aproveite o runtime otimizado.
Demonstração
Obrigado!
Fique por dentro das
próximas sessões
Acesse a agenda de
webinars neste QR code
e inscreva-se!
QR CODE
Conte-nos o que achou
do webinar
Clique em “sair” para
responder uma rápida
pesquisa de satisfação.

Más contenido relacionado

La actualidad más candente

Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAmazon Web Services LATAM
 
Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...
Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...
Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...Amazon Web Services LATAM
 
Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway - CM...
Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway -  CM...Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway -  CM...
Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway - CM...Amazon Web Services
 
Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS - ARC201 - ...
Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS -  ARC201 - ...Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS -  ARC201 - ...
Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS - ARC201 - ...Amazon Web Services
 
AWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lake
AWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lakeAWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lake
AWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lakeAmazon Web Services LATAM
 
DevOps aplicado à AWS - DEM07 - Sao Paulo Summit
DevOps aplicado à AWS -  DEM07 - Sao Paulo SummitDevOps aplicado à AWS -  DEM07 - Sao Paulo Summit
DevOps aplicado à AWS - DEM07 - Sao Paulo SummitAmazon Web Services
 
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...Amazon Web Services
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Amazon Web Services
 
AWS Webinar Series Brasil: Modernize seus Workloads Windows na AWS
AWS Webinar Series Brasil: Modernize seus Workloads Windows na AWSAWS Webinar Series Brasil: Modernize seus Workloads Windows na AWS
AWS Webinar Series Brasil: Modernize seus Workloads Windows na AWSAmazon Web Services LATAM
 
Visualizando dados de Big Data com Amazon QuickSight
Visualizando dados de Big Data com Amazon QuickSightVisualizando dados de Big Data com Amazon QuickSight
Visualizando dados de Big Data com Amazon QuickSightAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...
Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...
Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...Amazon Web Services LATAM
 

La actualidad más candente (20)

Construindo um data lake na nuvem aws
Construindo um data lake na nuvem awsConstruindo um data lake na nuvem aws
Construindo um data lake na nuvem aws
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
 
Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...
Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...
Uma visão geral da infraestrutura da AWS e como ela pode ajudar seu aplicativ...
 
Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway - CM...
Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway -  CM...Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway -  CM...
Sessão Avançada: Armazenamento Híbrido na Nuvem com AWS Storage Gateway - CM...
 
Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS - ARC201 - ...
Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS -  ARC201 - ...Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS -  ARC201 - ...
Arquiteturas e Estratégias para Criar Aplicações Modernas na AWS - ARC201 - ...
 
Padrões de Arquitetura na Nuvem da AWS
Padrões de Arquitetura na Nuvem da AWSPadrões de Arquitetura na Nuvem da AWS
Padrões de Arquitetura na Nuvem da AWS
 
AWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lake
AWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lakeAWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lake
AWS Storage Day - Por que o Amazon S3 é o melhor lugar para criar seu data lake
 
DevOps aplicado à AWS - DEM07 - Sao Paulo Summit
DevOps aplicado à AWS -  DEM07 - Sao Paulo SummitDevOps aplicado à AWS -  DEM07 - Sao Paulo Summit
DevOps aplicado à AWS - DEM07 - Sao Paulo Summit
 
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
 
Introducao à Nuvem da Amazon Web Services
Introducao à Nuvem da Amazon Web ServicesIntroducao à Nuvem da Amazon Web Services
Introducao à Nuvem da Amazon Web Services
 
AWS Webinar Series Brasil: Modernize seus Workloads Windows na AWS
AWS Webinar Series Brasil: Modernize seus Workloads Windows na AWSAWS Webinar Series Brasil: Modernize seus Workloads Windows na AWS
AWS Webinar Series Brasil: Modernize seus Workloads Windows na AWS
 
Visualizando dados de Big Data com Amazon QuickSight
Visualizando dados de Big Data com Amazon QuickSightVisualizando dados de Big Data com Amazon QuickSight
Visualizando dados de Big Data com Amazon QuickSight
 
Hands on de privacidade com AWS
Hands on de privacidade com AWSHands on de privacidade com AWS
Hands on de privacidade com AWS
 
Escalando com segurança na AWS
Escalando com segurança na AWSEscalando com segurança na AWS
Escalando com segurança na AWS
 
AWS Database Day - Português
AWS Database Day - PortuguêsAWS Database Day - Português
AWS Database Day - Português
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
Construindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWSConstruindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWS
 
Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...
Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...
Usando Amazon CloudFront para aumentar performance, disponibilidade e cache n...
 

Similar a Os benefícios de migrar seus workloads de Big Data para a AWS

Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSAmazon Web Services LATAM
 
Desenvolvendo aplicações móveis na Nuvem
Desenvolvendo aplicações móveis na NuvemDesenvolvendo aplicações móveis na Nuvem
Desenvolvendo aplicações móveis na NuvemJose Papo, MSc
 
Migrando seu workload de Big Data para o Amazon EMR
Migrando seu workload de Big Data para o Amazon EMRMigrando seu workload de Big Data para o Amazon EMR
Migrando seu workload de Big Data para o Amazon EMRAmazon Web Services LATAM
 
Porque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web ServicesPorque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web ServicesAmazon Web Services LATAM
 
Webinar: O que é computação em nuvem com a AWS?
Webinar: O que é computação em nuvem com a AWS?Webinar: O que é computação em nuvem com a AWS?
Webinar: O que é computação em nuvem com a AWS?Amazon Web Services
 
Introduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação WebIntroduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação WebAlessandro Binhara
 
Building blocks #1 - Primeiros passos na Amazon Web Services
Building blocks #1 - Primeiros passos na Amazon Web ServicesBuilding blocks #1 - Primeiros passos na Amazon Web Services
Building blocks #1 - Primeiros passos na Amazon Web ServicesAmazon Web Services LATAM
 
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...Amazon Web Services LATAM
 

Similar a Os benefícios de migrar seus workloads de Big Data para a AWS (20)

Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
 
Desenvolvendo aplicações móveis na Nuvem
Desenvolvendo aplicações móveis na NuvemDesenvolvendo aplicações móveis na Nuvem
Desenvolvendo aplicações móveis na Nuvem
 
Construindo um Data Lake na AWS
Construindo um Data Lake na AWSConstruindo um Data Lake na AWS
Construindo um Data Lake na AWS
 
Arquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXIArquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXI
 
Migrando seu workload de Big Data para o Amazon EMR
Migrando seu workload de Big Data para o Amazon EMRMigrando seu workload de Big Data para o Amazon EMR
Migrando seu workload de Big Data para o Amazon EMR
 
Porque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web ServicesPorque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web Services
 
Primeiros Passos na AWS
Primeiros Passos na AWSPrimeiros Passos na AWS
Primeiros Passos na AWS
 
Construindo seu Data Lake na AWS
Construindo seu Data Lake na AWSConstruindo seu Data Lake na AWS
Construindo seu Data Lake na AWS
 
Webinar: O que é computação em nuvem com a AWS?
Webinar: O que é computação em nuvem com a AWS?Webinar: O que é computação em nuvem com a AWS?
Webinar: O que é computação em nuvem com a AWS?
 
Introduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação WebIntroduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação Web
 
Primeiros Passos na AWS
Primeiros Passos na AWSPrimeiros Passos na AWS
Primeiros Passos na AWS
 
Bancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWSBancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWS
 
Segurança
SegurançaSegurança
Segurança
 
Building blocks #1 - Primeiros passos na Amazon Web Services
Building blocks #1 - Primeiros passos na Amazon Web ServicesBuilding blocks #1 - Primeiros passos na Amazon Web Services
Building blocks #1 - Primeiros passos na Amazon Web Services
 
Rodando SAP na AWS
Rodando SAP na AWSRodando SAP na AWS
Rodando SAP na AWS
 
Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2
 
Otimizacao de custo summit 2015
Otimizacao de custo summit 2015Otimizacao de custo summit 2015
Otimizacao de custo summit 2015
 
Introducao a aws storage backup e archiving
Introducao a aws storage backup e archivingIntroducao a aws storage backup e archiving
Introducao a aws storage backup e archiving
 
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...
 
Primeiros Passos na AWS
Primeiros Passos na AWSPrimeiros Passos na AWS
Primeiros Passos na AWS
 

Más de Amazon Web Services LATAM

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAmazon Web Services LATAM
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAmazon Web Services LATAM
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSAmazon Web Services LATAM
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAmazon Web Services LATAM
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosAmazon Web Services LATAM
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSAmazon Web Services LATAM
 
AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...
AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...
AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...Amazon Web Services LATAM
 
Os benefícios de realizar backup na nuvem AWS
Os benefícios de realizar backup na nuvem AWSOs benefícios de realizar backup na nuvem AWS
Os benefícios de realizar backup na nuvem AWSAmazon Web Services LATAM
 
Los beneficios de realizar backup en la nube de AWS
Los beneficios de realizar backup en la nube de AWSLos beneficios de realizar backup en la nube de AWS
Los beneficios de realizar backup en la nube de AWSAmazon Web Services LATAM
 

Más de Amazon Web Services LATAM (20)

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWS
 
Bases de datos NoSQL en AWS
Bases de datos NoSQL en AWSBases de datos NoSQL en AWS
Bases de datos NoSQL en AWS
 
Construyendo un data lake en la nube aws
Construyendo un data lake en la nube awsConstruyendo un data lake en la nube aws
Construyendo un data lake en la nube aws
 
AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...
AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...
AWS Webinar Series Latinoamérica: Cómo salir de su datacenter y modernizar la...
 
Os benefícios de realizar backup na nuvem AWS
Os benefícios de realizar backup na nuvem AWSOs benefícios de realizar backup na nuvem AWS
Os benefícios de realizar backup na nuvem AWS
 
Los beneficios de realizar backup en la nube de AWS
Los beneficios de realizar backup en la nube de AWSLos beneficios de realizar backup en la nube de AWS
Los beneficios de realizar backup en la nube de AWS
 

Os benefícios de migrar seus workloads de Big Data para a AWS

  • 1. © 2021, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon Confidential and Trademark. AWSWebinar Series Brasil Andre Fellipe Arquiteto de Soluções Os benefícios de migrar seus workloads de Big Data para a AWS
  • 2. Como interagir durante o evento? Você tem um projeto e quer conversar com o time comercial da AWS? Acesse o LIVE CHAT neste QR code ou pelo link enviado no chat do evento. Perguntas & Respostas ao vivo durante todo o evento Tire suas dúvidas com os especialistas da AWS! Clique no símbolo “?” e envie suas perguntas.
  • 3. O recurso mais valioso já não é petróleo, mas os dados. *Copyright: The Economist, 2017, David Parkins
  • 4. Mais dados Mais personas Demanda por tomada de decisão mais rápida As novas realidades que os clientes estão enfrentando .
  • 5. Os clientes querem mais valor de seus dados U S AD O P O R M U I T AS P E S S O AS C R E S C E N D O E X P O N E N C I AL M E N T E D E N O V AS F O N TE S D I V E R S I D AD E AN A L I S A D O P O R M U I TO S AP L I C A T I V O S
  • 6. - Instalação de hardware e software, configuração, correção, backups; - Problemas de desempenho e alta disponibilidade; - Planejamento de capacidade; - Segurança e conformidade. Serviços de analytics gerenciados por conta própria consomem tempo, são complexos e caros
  • 7. Por que Big Data na AWS? Mais fácil de construir Infraestrutura mais segura Abrangência Escalável e econômico 1 2 3 4
  • 8. 1. Mais fácil de construir data lakes e analytics Data lake S3 Relatórios Consultas Ad Hoc Big Data Analytics Data Warehousing Analytics Machine Learning AWS Lake Formation
  • 9. 2. Abrangência Dados, visualização, engajamento e machine learning Analytics Data lakes Governança Dashboards Predictive Analytics Engajamento de usuários Dados Data Warehousing Processamento Consultas interativas Análise Operacional Analytics em tempo real Processamento Serverless Infraestrutura Catálogo de Dados & ETL Segurança & Gerenciamento Migração & Streaming
  • 10. 3. Infraestrutura mais segura Os clientes precisam ter vários níveis de segurança, gerenciamento de identidade e acesso, criptografia e conformidade para proteger seu data lake Identidade AWS IAM AWS SSO Amazon Cloud Directory AWS Directory Service AWS Organizations Encriptação AWS Certificate Manager AWS Key Management Service Criptografia em repouso Criptografia em trânsito Traga suas próprias chaves, suporte HSM Conformidade AWS Artifact Amazon Inspector Amazon Cloud HSM Amazon Cognito AWS CloudTrail Segurança Amazon GuardDuty AWS Shield AWS WAF Amazon Macie VPC
  • 11. 4. Infraestrutura mais escalável, econômica e de alto desempenho para analytics Cinco camadas de armazenamento Mais de 200 tipos de instância para atender as necessidades Instâncias sob demanda, reservadas e spot Interfaces de rede de largura de banda de 100 Gbps
  • 12. Desafios de clusters on-premises
  • 13. Computação e armazenamento acoplados • O armazenamento cresce junto com a computação; • Os requisitos de computação variam. Fortemente acoplado Computação Armazenamento
  • 14. A replicação aumenta o custo 3x • Os dados são replicados várias vezes; • Normalmente, apenas em um data center.
  • 15. Recursos escassos ou subutilizados 0 20 40 60 80 100 120 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Reprocessamento Picos semanais Estável
  • 16. Competição pelos mesmos recursos Hadoop Hive Spark
  • 17. Limitações em atualizações • Transformação em grande escala: Map/Reduce, Hive, Pig, Spark; • Consultas interativas: Impala, Spark SQL, Presto; • Machine Learning: Spark ML, MxNet, Tensorflow; • Notebooks interativos: Jupyter, Zeppelin; • NoSQL: HBase.
  • 18. A separação de recursos cria silos Hive Spark
  • 20. Amazon EMR • Serviço gerenciado para executar aplicativos do ecossistema Hadoop, como Spark, Hive, Presto e muitos outros; • Pode processar grandes volumes de dados armazenados no Amazon S3 (EMRFS), HDFS, Amazon DynamoDB, Amazon Redshift, Amazon Kinesis, Kafka e outras fontes de dados; • Use clusters transitórios, Managed Scaling, Amazon Simple Storage Service (Amazon S3) e Instâncias Spot para cortar custos.
  • 21. Amazon EMR Execute facilmente Spark, Hive, Presto, HBase, Flink e mais aplicativos de big data na AWS Melhor desempenho com menor custo Workloads Spark rodam 2,4x mais rápido em comparação ao open source Redução de custos com EC2 Spot e Instâncias Reservadas Faturamento por segundo para flexibilidade Use o armazenamento S3 Processe dados em S3 com segurança e alto desempenho usando o EMRFS Escale computação e armazenamento independentes um do outro Últimas versões Atualizado com as estruturas de código aberto mais recentes em 30 dias Suporte para open source populares como Flink e Hudi Totalmente gerenciado, sem configuração de cluster, provisionamento de nó ou ajuste de cluster Escala automática vertical e horizontal para atender às demandas Fácil e Escalável
  • 22. Custos otimizados com o Amazon EMR • Menos tempo de administração para gerenciar e suportar clusters; • Sem custos de antemão: aquisição e instalação de hardware; • Economize em custos operacionais - espaço no data center, energia, refrigeração, etc. Suporte Taxa Suporte On-premises EMR Server Costs Hardware—Server, Rack, Chassis, PDUs, Tor Switches (+Maintenance) Software—OS, Virtualization Licenses (+Maintenance) Network Costs Network Hardware—LAN Switches, Load Balancer Bandwidth costs Software—Network Monitoring IT Labor Costs Server admin, virtualization admin, storage admin, network admin, support team Extras Project planning, advisors, legal, contractors, managed services, training, cost of capital
  • 24. Desacople armazenamento e computação Computação Metastore Amazon RDS AWS Glue Data Catalog Amazon EMR Amazon Athena Amazon Redshift Spectrum Amazon S3 Armazenamento
  • 25. Ferramentas open source no Amazon EMR
  • 26. Cluster 1 Cluster 2 Cluster 3 Cluster 4 Zona de Disponibilidade B Amazon S3 Zona de Disponibilidade A Recuperação de desastres integrada
  • 27. Pausar ou encerrar clusters Amazon EMR Amazon EMR Amazon S3 Amazon S3 Amazon S3
  • 28. Separação lógica Rearquitetar clusters monolíticos para construídos com finalidade específica: • Criação de clusters transitórios e / ou persistentes; • Separando clusters por aplicativo; • Separando clusters por versão do aplicativo. Cluster monolítico tradicional Clusters de propósito específico vs. As considerações de design são: • Como você envia trabalhos ou constrói pipelines; • Persistindo seus dados no S3; • Armazenamento de metadados fora do cluster; • Por quanto tempo o job é executado; • Quais aplicativos são necessários.
  • 29. EMR Managed Scaling Auto Scaling group Amazon EMR
  • 30. Instâncias Spot - Mais rápido; - Menor custo. Nó Auto Scaling
  • 32. Sobre clusters e nós • O componente central do Amazon EMR é o cluster. Um cluster é uma coleção de instâncias do Amazon Elastic Compute Cloud (Amazon EC2); • Cada instância do cluster é chamada de nó; • Cada nó tem uma função dentro do cluster; • O Amazon EMR também instala diferentes componentes de software em cada tipo de nó, dando a cada nó uma função em um aplicativo distribuído.
  • 33. Master EMR cluster Task Core HDFS HDFS Os Core Nodes podem ser adicionados e removidos sem problemas. O Master Node deve continuar em execução. O cluster pode tolerar a perda de Task Nodes. Tipos de Nó
  • 34. Opções de deployment flexíveis do Amazon EMR A AWS oferece mais opções de instância do que qualquer outro provedor de nuvem. Escolha a instância que oferece o melhor desempenho ou custo para sua carga de trabalho, incluindo Graviton2. Aproveite as vantagens das instâncias On-Demand, Reserved e Spot para otimizar os custos. Configure, implante, gerencie e dimensione o EMR em seus ambientes locais, assim como você faria na nuvem. O AWS Outposts oferece serviços, infraestrutura e modelos operacionais da AWS para praticamente qualquer data center, espaço de colocation ou instalação on-premises. Use EMR para automatizar o provisionamento, gerenciamento e escalonamento de jobs do Apache Spark no Amazon Elastic Kubernetes Service (EKS) e aproveite o runtime otimizado.
  • 36.
  • 37. Obrigado! Fique por dentro das próximas sessões Acesse a agenda de webinars neste QR code e inscreva-se! QR CODE Conte-nos o que achou do webinar Clique em “sair” para responder uma rápida pesquisa de satisfação.