SlideShare una empresa de Scribd logo
1 de 44
Descargar para leer sin conexión
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Américo de Paula – Solutions Architect Manager
@americop
Big Data: Arquitecturas y mejores
prácticas en AWS
La cantidad de datos no para de crecer
Volumen
Velocidad
Variedad
Multitud de herramientas
Amazon
Glacier
Amazon S3 Amazon DynamoDB
Amazon RDS
Amazon EMR
Amazon
Redshift
Amazon
Kinesis
Lambda Amazon ML
Amazon SQS
ElastiCache
Amazon DynamoDB
Streams
Amazon ES
Amazon Kinesis
Analytics
Amazon
QuickSight AWS Glue
Desafíos en Big Data
¿Por qué?
¿Cómo?
¿Cuáles herramientas usar?
¿Existe una arquitectura de referencia?
1. Desacoplamiento
• Datos → Almacenamiento → Procesamiento →
Almacenamiento → Análisis → Respuestas
2. Herramienta adecuada para cada fase
• Estructura de datos, desempeño, patrones de acceso
3. Enfoque su esfuerzo en lo que es diferencial
• Use serverless y servicios gerenciados
Principios básicos de arquitectura
4. Almacenamiento completo
• Mantenga la mayor cantidad de datos
5. Control de costos
• Big data ≠ big cost
6. Potencie sus aplicaciones con AI/ML
Principios básicos de arquitectura
Recolectar Almacenar
Procesar /
Analizar
Consumir
Tiempo para responder (Latencia)
Desempeño
Costo
Proceso de Big Data
RECOLECCIÓN
RECOLECCIÓN
Devices
Sensors
IoT platforms
AWS IoT STREAMS
IoT
EventosStream de datos
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
FILES
Transportededatos
Import/expo
rt
Archivos
Archivos de Log
Archivos de media
Mobile apps
Web apps
Data centers AWS Direct
Connect
RECORDS
Aplicaciones
Transacciones
Datos estructurados
Registros de BD
Tipos de datos
ALMACENAMIENTO
RECOLECCIÓN
Devices
Sensors
IoT platforms
AWS IoT STREAMS
IoT
EventosStream de datos
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
FILES
Transportededatos
Import/expo
rt
Archivos
Archivos de Log
Archivos de media
Mobile apps
Web apps
Data centers AWS Direct
Connect
RECORDS
Aplicaciones
Transacciones
Datos estructurados
Registros de BD
Tipos de datos ALMACENAMIENTO
Relational DB
In-memory
NoSQL
Archivos/
Objetos
Stream
storage
RECOLECCIÓN
Devices
Sensors
IoT platforms
AWS IoT STREAMS
IoT
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
FILES
DataTransport&Logging
Import/expo
rt
Mobile apps
Web apps
Data centers AWS Direct
Connect
RECORDS
Applications
ALMACENAMIENTO
Relational DB
In-memory
NoSQL
Archivos/
Objetos
Stream
storage
RECOLECCIÓN
Devices
Sensors
IoT platforms
AWS IoT STREAMS
IoT
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
FILES
DataTransport&Logging
Import/expo
rt
Mobile apps
Web apps
Data centers AWS Direct
Connect
RECORDS
Applications
ALMACENAMIENTO
NoSQL
In-memory
SQL
Archivos/
Objetos
Apache Kafka
• Alto desempeño, distribuida
Amazon Kinesis Streams
• Gerenciado
Amazon Kinesis Firehose
• Adiciona entrega en un
almacenamiento
Stream Storage
Amazon Kinesis
Firehose
Amazon Kinesis
Streams
Apache Kafka
Desacoplar
Búfer persistente
Múltiples streams
Preserva el orden
Consumo en paralelo
4 4 3 3 2 2 1 1
4 3 2 1
4 3 2 1
4 3 2 1
4 3 2 1
4 4 3 3 2 2 1 1
shard 1 / partition 1
shard 2 / partition 2
Consumer 1
Cantidad
de rojo =4
Cant. de
violeta= 4
Consumer 2
Cantidad
de azul=4
Cantidad de
verde=4
DynamoDB stream Amazon Kinesis stream Kafka topic
¿Por qué usar Stream Storage?
¿ Cuál tipo de storage de filas utilizar?
Hot Warm
Amazon
Kinesis
Streams
Amazon
Kinesis
Firehose
Apache
Kafka (on Amazon
EC2)
Amazon
SQS
(Standard)
Amazon SQS
(FIFO)
AWS managed Yes Yes No Yes Yes
Guaranteed ordering Yes No Yes No Yes
Delivery (deduping) At least once At least once At least/At
most/exactly once
At least once Exactly once
Data retention period 7 days N/A Configurable 14 days 14 days
Availability 3 AZ 3 AZ Configurable 3 AZ 3 AZ
Scale /
throughput
No limit /
~ shards
No limit /
automatic
No limit /
~ nodes
No limits /
automatic
300 TPS /
queue
Parallel consumption Yes No Yes No No
Stream MapReduce Yes N/A Yes N/A N/A
Row/object size 1 MB Destination
row/object size
Configurable 256 KB 256 KB
Cost Low Low Low (+admin) Low-medium Low-medium
RECOLECCIÓN
Devices
Sensors
IoT platforms
AWS IoT STREAMS
IoT
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
FILES
DataTransport&Logging
Import/expo
rt
Mobile apps
Web apps
Data centers AWS Direct
Connect
RECORDS
Applications
ALMACENAMIENTO
NoSQL
In-memory
SQL
Archivos/
Objetos
Amazon Kinesis
Firehose
Amazon Kinesis
Streams
Apache Kafka
RECOLECCIÓN
Devices
Sensors
IoT platforms
AWS IoT STREAMS
IoT
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
FILES
DataTransport&Logging
Import/expo
rt
Mobile apps
Web apps
Data centers AWS Direct
Connect
RECORDS
Applications
ALMACENAMIENTO
NoSQL
In-memory
SQL
Amazon Kinesis
Firehose
Amazon Kinesis
Streams
Apache Kafka
Amazon S3
Servicio gerenciado de
almacenamiento de objetos;
almacena y recupera cualquier
cantidad de datos
Amazon S3
Stream
Storage de Objetos
HDFS y capas de storage
• HDFS como capa de almacenamiento
“hot”
• Amazon S3 Standard para acceso
frecuente
• Amazon S3 Standard – IA acceso
infrecuente
• Amazon Glacier para archivamiento
S3 Analytics: Ayuda a optimizar la
estrategia
S3 Analytics
RECOLECCIÓN
Devices
Sensors
IoT platforms
AWS IoT STREAMS
IoT
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
FILES
DataTransport&Logging
Import/expo
rt
Mobile apps
Web apps
Data centers AWS Direct
Connect
RECORDS
Applications
ALMACENAMIENTO
NoSQL
In-memory
SQL
Amazon Kinesis
Firehose
Amazon Kinesis
Streams
Apache Kafka
Amazon S3
Stream
Amazon
DynamoDB
Amazon RDS
Amazon Aurora
File
Mobile apps
Web apps
Devices
Sensors
IoT platforms
AWS IoT
Data centers AWS Direct
Connect
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
RECORDS
FILES
STREAMS
LoggingIoTApplications
Amazon S3
Amazon DAX
Amazon ElastiCache
Import/expo
rt
SQLNoSQLCache
Amazon ElastiCache
• Memcached o Redis - Gerenciado
Amazon DynamoDB Accelerator
(DAX)
• Cache in-memory – Gerenciado, para
DynamoDB
Amazon DynamoDB
• NoSQL database - Gerenciado
Amazon RDS
• BD Relacional - Gerenciado
Cache & Database
Apache Kafka
Amazon Kinesis
Streams
Amazon Kinesis
Firehose
Hot
Stream
RECOLECCIÓN ALMACENAMIENTO
Lo que debemos evitar
Capa de Base de Datos
Lo que debemos hacer
SearchIn-memory SQLNoSQLGraphDB
Amazon RDS/AuroraAmazon DynamoDBAmazon ElastiCache Amazon
DynamoDB
Acclerator
SAP HANA
Amazon ES Amazon
CloudSearch
Capa de Base de Datos
¿ Cómo escoger el almacenamiento ?
1. Estructura de datos → Esquema fijo, JSON, Key/Value, Grafos
2. Patrón de acceso → Almacenar en el formato en que se accederá
3. Características de tiempo → Hot, warm, cold
4. Costo → Optimizar
Estructura de datos y Patrones de acceso
Patrones de acceso Piense en:
Put/Get (key, value) In-memory, NoSQL
Relaciones simples → 1:N, M:N NoSQL
Múltiples tablas, “join” complejos, transaccional, SQL SQL
Faceting, Search Search
Grafos GraphDB
Estructura Piense en:
Esquema fijo SQL, NoSQL
No esquema (JSON) NoSQL, Search
Key/Value In-memory, NoSQL
Grafos GraphDB
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon
ElastiCache
Amazon
DAX
Amazon
DynamoDB
Amazon
RDS (Aurora)
Amazon ES Amazon S3
Amazon
Glacier
Latencia µs-ms µs-ms ms ms, sec ms,sec ms,sec,min
(~ size)
hrs
Volumen de
datos
GB GB GB–TBs
(sin límite)
GB–TB
(64 TB max)
GB–TB MB–PB
(sin límite)
GB–PB
(sin límite)
Tamaño del
item
B-KB KB
(400 KB max)
KB
(400 KB max)
KB
(64 KB max)
B-KB
(2 GB max)
KB-TB
(5 TB max)
GB
(40 TB max)
Tasa de
acceso
Alto – Muy
Alto
Alto – Muy
Alto
Muy Alto
(sin límite)
Alto Alto Bajo – Alto
(sin límite)
Muy bajo
Costo
GB/mes
$$ $$ ¢¢ ¢¢ ¢¢ ¢ ¢4/10
Durabilidad Bajo -
moderado
NA Muy Alto Muy Alto Alto Muy Alto Muy Alto
Disponibilida
d
Alto
2 AZ
Alto
3 AZ
Muy Alto
3 AZ
Muy Alto
3 AZ
Alto
2 AZ
Muy Alto
3 AZ
Muy Alto
3 AZ
Hot data Warm data Cold data
¿ Cómo escoger el almacenamiento ?
Procesar /
Analizar
Amazon Redshift
& Spectrum
Amazon Athena
BatchInteractive
Amazon ES
Analítica: Interactiva y Batch
• Amazon ES
• Elasticsearch - Gerenciado
• Amazon Redshift + Spectrum
• Data Warehouse - Gerenciado
• Spectrum: Queries hacia Amazon S3
• Amazon Athena
• Queries hacia Amazon S3 - Serverless
• Amazon EMR
• Hadoop Framework - Gerenciado
Presto
Amazon
EMR
Procesar / Analizar
Analítica: Tiempo Real
Spark Streaming - Amazon EMR
Amazon Kinesis Analytics
• SQL para Streaming data - Gerenciado
Amazon KCL
• Amazon Kinesis Client Library
AWS Lambda
• Ejecución de código - Serverless
• Diferentes triggers – p.ex: S3 , Kinesis
KCL
Apps
AWS Lambda
Amazon Kinesis
Analytics
Stream
Streaming
Amazon EMR
Procesar / Analizar
• Servicios de alto nivel
• Amazon Lex
• Amazon Polly
• Amazon Rekognition
• Transcribe, Translate, Comprehend
• Managed ML Platforms
• Amazon ML
• Amazon SageMaker
• AWS Deep Learning AMI
• Pre-Instalado con MXNet, TensorFlow,
Caffe2 (and Caffe), Theano, Torch,
Microsoft Cognitive Toolkit, Keras
Amazon AI
Procesar / Analizar
Predictive
AmazonAI
Lex PollyAML Rekognition
AWS DL AMI
Desarrolladores
Científicos de
datos
Expertos en
Deep Learning
Analítica: Predictiva
¿Qué tipo de Analítica usar?
Batch
Minutos a horas
Ejemplo: Reportes periódicos
Amazon EMR
Interactiva
Segundos
Ejemplo : Dashboards autoservicio
Amazon Redshift, Amazon Athena, Amazon EMR (Presto, Spark)
Stream
Milisegundos a segundos
Ejemplo : Alertas de operación, métricas granulares
Amazon EMR (Spark Streaming), Amazon Kinesis Analytics, KCL,
AWS Lambda, etc.
Predictiva
Milisegundos (tiempo real) a minutos (batch)
Ejemplo : Detección de fraude, Predicción de demanda,
Reconocimiento
Amazon AI (Lex, Polly, ML, Amazon Rekognition), Amazon EMR
(Spark ML), Deep Learning AMI (MXNet, TensorFlow, Theano, Torch, CNTK,
and Caffe)
Streaming
Amazon Kinesis
Analytics
KCL
Apps
AWS Lambda
Stream
Amazon EMR
Fast
Amazon ES
Amazon Redshift
& Spectrum
Presto
Amazon
EMR
Amazon Athena
BatchInteractive
FastSlow
Predictive
AmazonAI
Lex PollyAML Rekognition
AWS DL AMI
Procesar / Analizar
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon Redshift Amazon Redshift
Spectrum
Amazon Athena Amazon EMR
Presto Spark Hive
Use case Optimized for data
warehousing
Query S3 data from
Amazon Redshift
Interactive Queries
over S3 data
Interactive
Query
General
purpose
Batch
Scale/Throughput ~Nodes ~Nodes Automatic ~ Nodes
Managed Service Yes Yes Yes, Serverless Yes
Storage Local storage Amazon S3 Amazon S3 Amazon S3, HDFS
Optimization Columnar storage,
data compression,
and zone maps
AVRO, PARQUET
TEXT, SEQ
RCFILE, ORC, etc.
AVRO, PARQUET
TEXT, SEQ
RCFILE, ORC, etc.
Framework dependent
Metadata Amazon Redshift
Catalog
Glue Catalog Glue Catalog Glue Catalog or
Hive Meta-store
Auth/Access controls IAM, Users, groups,
and access controls
IAM, Users, groups,
and access controls
IAM IAM, LDAP & Kerberos
UDF support Yes (Scalar) Yes (Scalar) No Yes
Slow
¿ Qué herramientas analíticas usar?
¿ Y acerca de ETLs?
ETL
Partners de Integración
AWS Glue
ETL – Gerenciado – Serverless
Data Catalog Job Authoring Job Execution
AWS Glue
Procesar / AnalizarALMACENAMIENTO
Apache Kafka
Amazon Kinesis
Streams
Amazon Kinesis
Firehose
Amazon
DynamoDB
Amazon ElastiCache
Amazon RDS
Amazon Aurora
HotHotWarm
SQLNoSQLCacheFileStream
Mobile apps
Web apps
Devices
Sensors
IoT platforms
AWS IoT
Data centers AWS Direct
Connect
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
RECORDS
FILES
STREAMS
DataTransport&LoggingIoTApplications
Slow
Amazon S3
Amazon ES
Amazon Redshift
& Spectrum
Presto
Amazon
EMR
Fast
Amazon Athena
BatchInteractive
Amazon DAX
Import/expo
rt
Predictive
AmazonAI
Lex PollyAML Rekognition
AWS DL AMI
ETL
Streaming
Amazon Kinesis
Analytics
KCL
Apps
Fast
Stream
Amazon EMR
AWS Lambda
Fast
CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
CONSUMO
• Aplicaciones BI/AI
• Amazon EC2 o Containers
• AWS Greengrass
• Ciencia de datos
• Notebooks
• DS Platforms
• IDEs
• Análisis y Visualización
• Amazon QuickSight
• Tableau
• ….
ETL
Amazon QuickSight
Analysis&visualization
Model
Train/
Eval
Models
Deploy
DataSceince
AI Apps
Amazon ECS
Apps
AWS Greengrass
Predictive
AmazonAI
Lex PollyAML Rekognition
AWS DL AMI
Business
users
DevOps
Data Scientists
CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
Y ahora, todo junto …
Streaming
Amazon Kinesis
Analytics
KCL
Apps
AWS Lambda
Amazon ES
Apache Kafka
Amazon Kinesis
Streams
Amazon Kinesis
Firehose
Amazon
DynamoDB
Amazon ElastiCache
Amazon RDS
Amazon Aurora
HotHotWarm
Fast
Stream
SQLNoSQLCacheFileStream
Mobile apps
Web apps
Devices
Sensors
IoT platforms
AWS IoT
Data centers AWS Direct
Connect
Migration
Snowball
Logging
Amazon
CloudWatch
AWS
CloudTrail
RECORDS
FILES
STREAMS
Amazon QuickSight
Analysis&visualizationDataSceince
DataTransport&LoggingIoTApplications
Amazon EMR
Amazon Redshift
& Spectrum
Presto
Amazon
EMR
FastSlow
Amazon Athena
BatchInteractivePredictive
AmazonAI
Amazon S3
Amazon DAX
Import/expo
rt
Lex PollyAML Rekognition
AWS DL AMI
AI Apps
Amazon ECS
Apps
Model
Train/
Eval
Models
Deploy
ETL
AWS Greengrass
CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
Patrones de diseño
Analítica en
tiempo real
Amazon EMR
KCL app
AWS Lambda
Spark
Streaming
Amazon
AI
Predicción (tiempo real)
Amazon
ElastiCache
(Redis)
Amazon
DynamoDB
Amazon
RDS
Amazon
ES
Materialización
KPI
Procesamiento
Almacenamiento
Amazon
Kinesis
Amazon Kinesis
Analytics
Amazon
SNS NotificacionesAlertas
Amazon
S3
Log
Amazon
KinesisFan out Downstream
Analítica
interactiva
y batch
procesamiento
almacenamiento Batch
Interactiva
Amazon EMR
Hive
Pig
Spark
Amazon
AI
Predicción Batch
Predicción tiempo real
Amazon S3
Files
Amazon
Kinesis
Firehose
Amazon Kinesis
Analytics
Amazon Redshift
Amazon ES
Consumo
Amazon EMR
Presto
Spark
Amazon Athena
Tiempo real
Materialización
Interactivo
y
Batch
Data Lake
Amazon S3
Amazon Redshift
Amazon EMR
Presto
Hive
Pig
Spark
Amazon
ElastiCache
Amazon
DynamoDB
Amazon
RDS
Amazon
ES
AWS Lambda
Spark Streaming
on Amazon EMR
Aplicaciones
Amazon
Kinesis
KCL
Amazon
AI
Amazon
DynamoDB
Amazon
RDS
CDC o Export
Transacciones
Stream
Archivos
Amazon Kinesis
Analytics
Amazon Athena
Amazon Kinesis
Firehose
Amazon ES
Arquitectura
de
Referencia
-
Data lake
CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
1. Desacople
2. Use la herramienta adecuada
3. Use servicios gerenciados
4. Almacene todos los datos relevantes
5. Controle los costos
6. Potencie sus aplicaciones con AI/ML
Resumen
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Gracias!
Américo de Paula – Solutions Architect Manager
@americop
Big Data: Arquitecturas y mejores
prácticas en AWS

Más contenido relacionado

La actualidad más candente

Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City SummitGeneración de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City SummitAmazon Web Services
 
Acelere la velocidad de migración a la nube - MXO214 - Mexico City Summit
Acelere la velocidad de migración a la nube - MXO214 - Mexico City SummitAcelere la velocidad de migración a la nube - MXO214 - Mexico City Summit
Acelere la velocidad de migración a la nube - MXO214 - Mexico City SummitAmazon Web Services
 
Treinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City Summit
Treinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City SummitTreinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City Summit
Treinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City SummitAmazon Web Services
 
Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...
Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...
Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...Amazon Web Services LATAM
 
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...Amazon Web Services
 
Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...
Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...
Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...Amazon Web Services
 
Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...
Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...
Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...Amazon Web Services LATAM
 
Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...Amazon Web Services
 
Big Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWSBig Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWSAmazon Web Services LATAM
 
AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS
AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWSAWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS
AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWSAmazon Web Services LATAM
 
Session #4 - Achieving Business Value with AWS
Session #4 - Achieving Business Value with AWSSession #4 - Achieving Business Value with AWS
Session #4 - Achieving Business Value with AWSAmazon Web Services LATAM
 
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...Amazon Web Services
 
AWS Cloud Experience CA: Prepare su gente para la nube
AWS Cloud Experience CA: Prepare su gente para la nubeAWS Cloud Experience CA: Prepare su gente para la nube
AWS Cloud Experience CA: Prepare su gente para la nubeAmazon Web Services LATAM
 
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...Amazon Web Services LATAM
 
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloudAWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloudAmazon Web Services LATAM
 
Arquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generaciónArquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generaciónAmazon Web Services LATAM
 
AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...
AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...
AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...Amazon Web Services LATAM
 
AWS para organizaciones sin ánimo de lucro
AWS para organizaciones sin ánimo de lucroAWS para organizaciones sin ánimo de lucro
AWS para organizaciones sin ánimo de lucroAmazon Web Services
 

La actualidad más candente (20)

Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City SummitGeneración de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
 
Acelere la velocidad de migración a la nube - MXO214 - Mexico City Summit
Acelere la velocidad de migración a la nube - MXO214 - Mexico City SummitAcelere la velocidad de migración a la nube - MXO214 - Mexico City Summit
Acelere la velocidad de migración a la nube - MXO214 - Mexico City Summit
 
Treinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City Summit
Treinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City SummitTreinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City Summit
Treinta arquitecturas sin servidores en 30 minutos - MXO209 - Mexico City Summit
 
Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...
Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...
Innovation Track AWS Cloud Experience Argentina - Nuevos Paradigmas de Arquit...
 
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
 
Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...
Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...
Cómputo de usuario final en AWS con Amazon WorkSpaces y Amazon AppStream - MX...
 
[Webinar] AWS Storage Day - Español
[Webinar] AWS Storage Day - Español[Webinar] AWS Storage Day - Español
[Webinar] AWS Storage Day - Español
 
Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...
Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...
Innovation Track AWS Cloud Experience Argentina - Novedades de Distribución d...
 
Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...
 
Big Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWSBig Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWS
 
AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS
AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWSAWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS
AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS
 
Session #4 - Achieving Business Value with AWS
Session #4 - Achieving Business Value with AWSSession #4 - Achieving Business Value with AWS
Session #4 - Achieving Business Value with AWS
 
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
 
AWS Cloud Experience CA: Prepare su gente para la nube
AWS Cloud Experience CA: Prepare su gente para la nubeAWS Cloud Experience CA: Prepare su gente para la nube
AWS Cloud Experience CA: Prepare su gente para la nube
 
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
 
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloudAWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
 
Arquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generaciónArquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generación
 
AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...
AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...
AWS Initiate Day Mexico City | Big Data y AI - Impulsando la información y ag...
 
AWS en Español
AWS en EspañolAWS en Español
AWS en Español
 
AWS para organizaciones sin ánimo de lucro
AWS para organizaciones sin ánimo de lucroAWS para organizaciones sin ánimo de lucro
AWS para organizaciones sin ánimo de lucro
 

Similar a Big Data: Arquitectura y mejores prácticas en AWS

Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSAmazon Web Services LATAM
 
Patrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSPatrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSAmazon Web Services LATAM
 
AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...
AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...
AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...Amazon Web Services
 
AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat...
 AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat... AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat...
AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat...Amazon Web Services LATAM
 
Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS Amazon Web Services LATAM
 
Servicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWSServicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWSAmazon Web Services LATAM
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosAmazon Web Services LATAM
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosAmazon Web Services LATAM
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSAmazon Web Services LATAM
 
Creando su primera aplicación Big Data en AWS
Creando su primera aplicación Big Data en AWSCreando su primera aplicación Big Data en AWS
Creando su primera aplicación Big Data en AWSAmazon Web Services LATAM
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 
AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...
AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...
AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...Amazon Web Services
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 

Similar a Big Data: Arquitectura y mejores prácticas en AWS (20)

Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWS
 
Patrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSPatrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWS
 
AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...
AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...
AWS Summit Bogotá Track Avanzado: Arquitecturas y mejores practicas de big da...
 
AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat...
 AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat... AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat...
AWS Summits América Latina 2015 Arquitecturas y mejores practicas de Big Dat...
 
Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS
 
Servicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWSServicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWS
 
Introducción a Big Data en AWS
Introducción a Big Data en AWSIntroducción a Big Data en AWS
Introducción a Big Data en AWS
 
AWS Analytics Experience Argentina
AWS Analytics Experience Argentina AWS Analytics Experience Argentina
AWS Analytics Experience Argentina
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuarios
 
Servicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWSServicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWS
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuarios
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWS
 
Creando su primera aplicación Big Data en AWS
Creando su primera aplicación Big Data en AWSCreando su primera aplicación Big Data en AWS
Creando su primera aplicación Big Data en AWS
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...
AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...
AWS Presentacion Universidad de los Andes "Escalando para sus primeros 10 Mil...
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
Sistema de Bases de Datos AWS
Sistema de Bases de Datos AWSSistema de Bases de Datos AWS
Sistema de Bases de Datos AWS
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
Como reducir costos en AWS
Como reducir costos en AWSComo reducir costos en AWS
Como reducir costos en AWS
 

Más de Amazon Web Services LATAM

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAmazon Web Services LATAM
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAmazon Web Services LATAM
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSAmazon Web Services LATAM
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSAmazon Web Services LATAM
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAmazon Web Services LATAM
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAmazon Web Services LATAM
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosAmazon Web Services LATAM
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSAmazon Web Services LATAM
 

Más de Amazon Web Services LATAM (20)

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
 
Simplifique o seu BI com a AWS
Simplifique o seu BI com a AWSSimplifique o seu BI com a AWS
Simplifique o seu BI com a AWS
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
 

Último

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 

Último (16)

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 

Big Data: Arquitectura y mejores prácticas en AWS

  • 1. © 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Américo de Paula – Solutions Architect Manager @americop Big Data: Arquitecturas y mejores prácticas en AWS
  • 2. La cantidad de datos no para de crecer Volumen Velocidad Variedad
  • 3. Multitud de herramientas Amazon Glacier Amazon S3 Amazon DynamoDB Amazon RDS Amazon EMR Amazon Redshift Amazon Kinesis Lambda Amazon ML Amazon SQS ElastiCache Amazon DynamoDB Streams Amazon ES Amazon Kinesis Analytics Amazon QuickSight AWS Glue
  • 4. Desafíos en Big Data ¿Por qué? ¿Cómo? ¿Cuáles herramientas usar? ¿Existe una arquitectura de referencia?
  • 5. 1. Desacoplamiento • Datos → Almacenamiento → Procesamiento → Almacenamiento → Análisis → Respuestas 2. Herramienta adecuada para cada fase • Estructura de datos, desempeño, patrones de acceso 3. Enfoque su esfuerzo en lo que es diferencial • Use serverless y servicios gerenciados Principios básicos de arquitectura
  • 6. 4. Almacenamiento completo • Mantenga la mayor cantidad de datos 5. Control de costos • Big data ≠ big cost 6. Potencie sus aplicaciones con AI/ML Principios básicos de arquitectura
  • 7. Recolectar Almacenar Procesar / Analizar Consumir Tiempo para responder (Latencia) Desempeño Costo Proceso de Big Data
  • 9. RECOLECCIÓN Devices Sensors IoT platforms AWS IoT STREAMS IoT EventosStream de datos Migration Snowball Logging Amazon CloudWatch AWS CloudTrail FILES Transportededatos Import/expo rt Archivos Archivos de Log Archivos de media Mobile apps Web apps Data centers AWS Direct Connect RECORDS Aplicaciones Transacciones Datos estructurados Registros de BD Tipos de datos
  • 11. RECOLECCIÓN Devices Sensors IoT platforms AWS IoT STREAMS IoT EventosStream de datos Migration Snowball Logging Amazon CloudWatch AWS CloudTrail FILES Transportededatos Import/expo rt Archivos Archivos de Log Archivos de media Mobile apps Web apps Data centers AWS Direct Connect RECORDS Aplicaciones Transacciones Datos estructurados Registros de BD Tipos de datos ALMACENAMIENTO Relational DB In-memory NoSQL Archivos/ Objetos Stream storage
  • 12. RECOLECCIÓN Devices Sensors IoT platforms AWS IoT STREAMS IoT Migration Snowball Logging Amazon CloudWatch AWS CloudTrail FILES DataTransport&Logging Import/expo rt Mobile apps Web apps Data centers AWS Direct Connect RECORDS Applications ALMACENAMIENTO Relational DB In-memory NoSQL Archivos/ Objetos Stream storage
  • 13. RECOLECCIÓN Devices Sensors IoT platforms AWS IoT STREAMS IoT Migration Snowball Logging Amazon CloudWatch AWS CloudTrail FILES DataTransport&Logging Import/expo rt Mobile apps Web apps Data centers AWS Direct Connect RECORDS Applications ALMACENAMIENTO NoSQL In-memory SQL Archivos/ Objetos Apache Kafka • Alto desempeño, distribuida Amazon Kinesis Streams • Gerenciado Amazon Kinesis Firehose • Adiciona entrega en un almacenamiento Stream Storage Amazon Kinesis Firehose Amazon Kinesis Streams Apache Kafka
  • 14. Desacoplar Búfer persistente Múltiples streams Preserva el orden Consumo en paralelo 4 4 3 3 2 2 1 1 4 3 2 1 4 3 2 1 4 3 2 1 4 3 2 1 4 4 3 3 2 2 1 1 shard 1 / partition 1 shard 2 / partition 2 Consumer 1 Cantidad de rojo =4 Cant. de violeta= 4 Consumer 2 Cantidad de azul=4 Cantidad de verde=4 DynamoDB stream Amazon Kinesis stream Kafka topic ¿Por qué usar Stream Storage?
  • 15. ¿ Cuál tipo de storage de filas utilizar? Hot Warm Amazon Kinesis Streams Amazon Kinesis Firehose Apache Kafka (on Amazon EC2) Amazon SQS (Standard) Amazon SQS (FIFO) AWS managed Yes Yes No Yes Yes Guaranteed ordering Yes No Yes No Yes Delivery (deduping) At least once At least once At least/At most/exactly once At least once Exactly once Data retention period 7 days N/A Configurable 14 days 14 days Availability 3 AZ 3 AZ Configurable 3 AZ 3 AZ Scale / throughput No limit / ~ shards No limit / automatic No limit / ~ nodes No limits / automatic 300 TPS / queue Parallel consumption Yes No Yes No No Stream MapReduce Yes N/A Yes N/A N/A Row/object size 1 MB Destination row/object size Configurable 256 KB 256 KB Cost Low Low Low (+admin) Low-medium Low-medium
  • 16. RECOLECCIÓN Devices Sensors IoT platforms AWS IoT STREAMS IoT Migration Snowball Logging Amazon CloudWatch AWS CloudTrail FILES DataTransport&Logging Import/expo rt Mobile apps Web apps Data centers AWS Direct Connect RECORDS Applications ALMACENAMIENTO NoSQL In-memory SQL Archivos/ Objetos Amazon Kinesis Firehose Amazon Kinesis Streams Apache Kafka
  • 17. RECOLECCIÓN Devices Sensors IoT platforms AWS IoT STREAMS IoT Migration Snowball Logging Amazon CloudWatch AWS CloudTrail FILES DataTransport&Logging Import/expo rt Mobile apps Web apps Data centers AWS Direct Connect RECORDS Applications ALMACENAMIENTO NoSQL In-memory SQL Amazon Kinesis Firehose Amazon Kinesis Streams Apache Kafka Amazon S3 Servicio gerenciado de almacenamiento de objetos; almacena y recupera cualquier cantidad de datos Amazon S3 Stream Storage de Objetos
  • 18. HDFS y capas de storage • HDFS como capa de almacenamiento “hot” • Amazon S3 Standard para acceso frecuente • Amazon S3 Standard – IA acceso infrecuente • Amazon Glacier para archivamiento S3 Analytics: Ayuda a optimizar la estrategia S3 Analytics
  • 19. RECOLECCIÓN Devices Sensors IoT platforms AWS IoT STREAMS IoT Migration Snowball Logging Amazon CloudWatch AWS CloudTrail FILES DataTransport&Logging Import/expo rt Mobile apps Web apps Data centers AWS Direct Connect RECORDS Applications ALMACENAMIENTO NoSQL In-memory SQL Amazon Kinesis Firehose Amazon Kinesis Streams Apache Kafka Amazon S3 Stream
  • 20. Amazon DynamoDB Amazon RDS Amazon Aurora File Mobile apps Web apps Devices Sensors IoT platforms AWS IoT Data centers AWS Direct Connect Migration Snowball Logging Amazon CloudWatch AWS CloudTrail RECORDS FILES STREAMS LoggingIoTApplications Amazon S3 Amazon DAX Amazon ElastiCache Import/expo rt SQLNoSQLCache Amazon ElastiCache • Memcached o Redis - Gerenciado Amazon DynamoDB Accelerator (DAX) • Cache in-memory – Gerenciado, para DynamoDB Amazon DynamoDB • NoSQL database - Gerenciado Amazon RDS • BD Relacional - Gerenciado Cache & Database Apache Kafka Amazon Kinesis Streams Amazon Kinesis Firehose Hot Stream RECOLECCIÓN ALMACENAMIENTO
  • 21. Lo que debemos evitar Capa de Base de Datos
  • 22. Lo que debemos hacer SearchIn-memory SQLNoSQLGraphDB Amazon RDS/AuroraAmazon DynamoDBAmazon ElastiCache Amazon DynamoDB Acclerator SAP HANA Amazon ES Amazon CloudSearch Capa de Base de Datos
  • 23. ¿ Cómo escoger el almacenamiento ? 1. Estructura de datos → Esquema fijo, JSON, Key/Value, Grafos 2. Patrón de acceso → Almacenar en el formato en que se accederá 3. Características de tiempo → Hot, warm, cold 4. Costo → Optimizar
  • 24. Estructura de datos y Patrones de acceso Patrones de acceso Piense en: Put/Get (key, value) In-memory, NoSQL Relaciones simples → 1:N, M:N NoSQL Múltiples tablas, “join” complejos, transaccional, SQL SQL Faceting, Search Search Grafos GraphDB Estructura Piense en: Esquema fijo SQL, NoSQL No esquema (JSON) NoSQL, Search Key/Value In-memory, NoSQL Grafos GraphDB
  • 25. © 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon ElastiCache Amazon DAX Amazon DynamoDB Amazon RDS (Aurora) Amazon ES Amazon S3 Amazon Glacier Latencia µs-ms µs-ms ms ms, sec ms,sec ms,sec,min (~ size) hrs Volumen de datos GB GB GB–TBs (sin límite) GB–TB (64 TB max) GB–TB MB–PB (sin límite) GB–PB (sin límite) Tamaño del item B-KB KB (400 KB max) KB (400 KB max) KB (64 KB max) B-KB (2 GB max) KB-TB (5 TB max) GB (40 TB max) Tasa de acceso Alto – Muy Alto Alto – Muy Alto Muy Alto (sin límite) Alto Alto Bajo – Alto (sin límite) Muy bajo Costo GB/mes $$ $$ ¢¢ ¢¢ ¢¢ ¢ ¢4/10 Durabilidad Bajo - moderado NA Muy Alto Muy Alto Alto Muy Alto Muy Alto Disponibilida d Alto 2 AZ Alto 3 AZ Muy Alto 3 AZ Muy Alto 3 AZ Alto 2 AZ Muy Alto 3 AZ Muy Alto 3 AZ Hot data Warm data Cold data ¿ Cómo escoger el almacenamiento ?
  • 27. Amazon Redshift & Spectrum Amazon Athena BatchInteractive Amazon ES Analítica: Interactiva y Batch • Amazon ES • Elasticsearch - Gerenciado • Amazon Redshift + Spectrum • Data Warehouse - Gerenciado • Spectrum: Queries hacia Amazon S3 • Amazon Athena • Queries hacia Amazon S3 - Serverless • Amazon EMR • Hadoop Framework - Gerenciado Presto Amazon EMR Procesar / Analizar
  • 28. Analítica: Tiempo Real Spark Streaming - Amazon EMR Amazon Kinesis Analytics • SQL para Streaming data - Gerenciado Amazon KCL • Amazon Kinesis Client Library AWS Lambda • Ejecución de código - Serverless • Diferentes triggers – p.ex: S3 , Kinesis KCL Apps AWS Lambda Amazon Kinesis Analytics Stream Streaming Amazon EMR Procesar / Analizar
  • 29. • Servicios de alto nivel • Amazon Lex • Amazon Polly • Amazon Rekognition • Transcribe, Translate, Comprehend • Managed ML Platforms • Amazon ML • Amazon SageMaker • AWS Deep Learning AMI • Pre-Instalado con MXNet, TensorFlow, Caffe2 (and Caffe), Theano, Torch, Microsoft Cognitive Toolkit, Keras Amazon AI Procesar / Analizar Predictive AmazonAI Lex PollyAML Rekognition AWS DL AMI Desarrolladores Científicos de datos Expertos en Deep Learning Analítica: Predictiva
  • 30. ¿Qué tipo de Analítica usar? Batch Minutos a horas Ejemplo: Reportes periódicos Amazon EMR Interactiva Segundos Ejemplo : Dashboards autoservicio Amazon Redshift, Amazon Athena, Amazon EMR (Presto, Spark) Stream Milisegundos a segundos Ejemplo : Alertas de operación, métricas granulares Amazon EMR (Spark Streaming), Amazon Kinesis Analytics, KCL, AWS Lambda, etc. Predictiva Milisegundos (tiempo real) a minutos (batch) Ejemplo : Detección de fraude, Predicción de demanda, Reconocimiento Amazon AI (Lex, Polly, ML, Amazon Rekognition), Amazon EMR (Spark ML), Deep Learning AMI (MXNet, TensorFlow, Theano, Torch, CNTK, and Caffe) Streaming Amazon Kinesis Analytics KCL Apps AWS Lambda Stream Amazon EMR Fast Amazon ES Amazon Redshift & Spectrum Presto Amazon EMR Amazon Athena BatchInteractive FastSlow Predictive AmazonAI Lex PollyAML Rekognition AWS DL AMI Procesar / Analizar
  • 31. © 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon Redshift Amazon Redshift Spectrum Amazon Athena Amazon EMR Presto Spark Hive Use case Optimized for data warehousing Query S3 data from Amazon Redshift Interactive Queries over S3 data Interactive Query General purpose Batch Scale/Throughput ~Nodes ~Nodes Automatic ~ Nodes Managed Service Yes Yes Yes, Serverless Yes Storage Local storage Amazon S3 Amazon S3 Amazon S3, HDFS Optimization Columnar storage, data compression, and zone maps AVRO, PARQUET TEXT, SEQ RCFILE, ORC, etc. AVRO, PARQUET TEXT, SEQ RCFILE, ORC, etc. Framework dependent Metadata Amazon Redshift Catalog Glue Catalog Glue Catalog Glue Catalog or Hive Meta-store Auth/Access controls IAM, Users, groups, and access controls IAM, Users, groups, and access controls IAM IAM, LDAP & Kerberos UDF support Yes (Scalar) Yes (Scalar) No Yes Slow ¿ Qué herramientas analíticas usar?
  • 32. ¿ Y acerca de ETLs? ETL Partners de Integración AWS Glue ETL – Gerenciado – Serverless Data Catalog Job Authoring Job Execution AWS Glue Procesar / AnalizarALMACENAMIENTO
  • 33. Apache Kafka Amazon Kinesis Streams Amazon Kinesis Firehose Amazon DynamoDB Amazon ElastiCache Amazon RDS Amazon Aurora HotHotWarm SQLNoSQLCacheFileStream Mobile apps Web apps Devices Sensors IoT platforms AWS IoT Data centers AWS Direct Connect Migration Snowball Logging Amazon CloudWatch AWS CloudTrail RECORDS FILES STREAMS DataTransport&LoggingIoTApplications Slow Amazon S3 Amazon ES Amazon Redshift & Spectrum Presto Amazon EMR Fast Amazon Athena BatchInteractive Amazon DAX Import/expo rt Predictive AmazonAI Lex PollyAML Rekognition AWS DL AMI ETL Streaming Amazon Kinesis Analytics KCL Apps Fast Stream Amazon EMR AWS Lambda Fast CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
  • 35. • Aplicaciones BI/AI • Amazon EC2 o Containers • AWS Greengrass • Ciencia de datos • Notebooks • DS Platforms • IDEs • Análisis y Visualización • Amazon QuickSight • Tableau • …. ETL Amazon QuickSight Analysis&visualization Model Train/ Eval Models Deploy DataSceince AI Apps Amazon ECS Apps AWS Greengrass Predictive AmazonAI Lex PollyAML Rekognition AWS DL AMI Business users DevOps Data Scientists CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
  • 36. Y ahora, todo junto …
  • 37. Streaming Amazon Kinesis Analytics KCL Apps AWS Lambda Amazon ES Apache Kafka Amazon Kinesis Streams Amazon Kinesis Firehose Amazon DynamoDB Amazon ElastiCache Amazon RDS Amazon Aurora HotHotWarm Fast Stream SQLNoSQLCacheFileStream Mobile apps Web apps Devices Sensors IoT platforms AWS IoT Data centers AWS Direct Connect Migration Snowball Logging Amazon CloudWatch AWS CloudTrail RECORDS FILES STREAMS Amazon QuickSight Analysis&visualizationDataSceince DataTransport&LoggingIoTApplications Amazon EMR Amazon Redshift & Spectrum Presto Amazon EMR FastSlow Amazon Athena BatchInteractivePredictive AmazonAI Amazon S3 Amazon DAX Import/expo rt Lex PollyAML Rekognition AWS DL AMI AI Apps Amazon ECS Apps Model Train/ Eval Models Deploy ETL AWS Greengrass CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
  • 39. Analítica en tiempo real Amazon EMR KCL app AWS Lambda Spark Streaming Amazon AI Predicción (tiempo real) Amazon ElastiCache (Redis) Amazon DynamoDB Amazon RDS Amazon ES Materialización KPI Procesamiento Almacenamiento Amazon Kinesis Amazon Kinesis Analytics Amazon SNS NotificacionesAlertas Amazon S3 Log Amazon KinesisFan out Downstream
  • 40. Analítica interactiva y batch procesamiento almacenamiento Batch Interactiva Amazon EMR Hive Pig Spark Amazon AI Predicción Batch Predicción tiempo real Amazon S3 Files Amazon Kinesis Firehose Amazon Kinesis Analytics Amazon Redshift Amazon ES Consumo Amazon EMR Presto Spark Amazon Athena
  • 41. Tiempo real Materialización Interactivo y Batch Data Lake Amazon S3 Amazon Redshift Amazon EMR Presto Hive Pig Spark Amazon ElastiCache Amazon DynamoDB Amazon RDS Amazon ES AWS Lambda Spark Streaming on Amazon EMR Aplicaciones Amazon Kinesis KCL Amazon AI Amazon DynamoDB Amazon RDS CDC o Export Transacciones Stream Archivos Amazon Kinesis Analytics Amazon Athena Amazon Kinesis Firehose Amazon ES
  • 42. Arquitectura de Referencia - Data lake CONSUMOProcesar / AnalizarALMACENAMIENTORECOLECCIÓN
  • 43. 1. Desacople 2. Use la herramienta adecuada 3. Use servicios gerenciados 4. Almacene todos los datos relevantes 5. Controle los costos 6. Potencie sus aplicaciones con AI/ML Resumen
  • 44. © 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Gracias! Américo de Paula – Solutions Architect Manager @americop Big Data: Arquitecturas y mejores prácticas en AWS