SlideShare una empresa de Scribd logo
1 de 40
Creación de Data lakes y análisis de datos en AWS:
prácticas recomendadas para patrones
Eduardo Patiño Balaguera
Arquitecto de soluciones para Sector Público
Email: balague@amazon.com
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Big Data: diversos tipos de retos
VisualizaciónVariabilidad
Volumen Velocidad Variedad Veracidad Valor
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
A menudo, los retos se plantean porque:
https://www.promptcloud.com
https://john-popelaars.blogspot.com
https://www.signiant.com
https://www.linkedin.com/pulse/world-today-data-rich-information-poor-
guru-p-mohapatra-pmp/
Los datos aumentan
más deprisa que nunca
Aumenta la variedad
de los datos
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Data lakes en AWS ayudan a abordar estos retos
Integran y almacenan
rápidamente cualquier tipo de
datos
Aportan al mismo tiempo
información detallada
y seguridad...
Ejecutan la herramienta adecuada
para el trabajo adecuado sin tener
que copiar manualmente los datos
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Data lakes en AWS
Análisis
Aprendizajeautomático
Movimiento de datos
en tiempo real
Movimiento
de datos
Data lakes en
AWS
tradicional
Adquisición
Inteligencia
Catálogo
de almacenamiento
Variedad de
herramientas
de procesamiento
El análisis se
desacopla del
almacenamiento/
catálogo
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Qué datos tengo?
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Qué datos tengo?
Gartner:
"Durante el año 2018, el 80 % de los Data lakes no incluirán capacidades de
administración de metadatos, lo que hará que sean poco eficientes"
"Los metadatos nos ayudan a encontrar los datos en el lago de datos"
Data lakes en AWS
Almacenamiento | Almacenamiento para archivado | Catálogo de datos
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Componentes de AWS Glue
Creación de trabajosCatálogo de datos Ejecución de trabajos
Compatible con el metastore de Apache Hive
Integrado con servicios de AWS Rastreo y
detección automáticos de datos
Detección
Genera automáticamente
código ETL Python
y Apache Spark Edición,
depuración y uso compartido
Desarrollo
Ejecución sin servidor
Programación flexible
Monitorización y alertas
Implementación
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Qué pueden detectar los
crawlers?
Rol de IAM
Crawler de AWS Glue
Bases de datos
Amazon
Redshift
Amazon S3
Conexión de JDBC
Conexión de objetos
Clasificadores integrados
MySQL
MariaDB
PostreSQL
Aurora
Oracle
Amazon Redshift
Avro
Parquet
ORC
XML
JSON y JSONPaths
AWS CloudTrail
BSON
Registros
(Apache (Grok), Linux (Grok), MS (Grok), Ruby, Redis
y muchos más)
Delimitados
(coma, barra vertical, tabulador, punto y coma)
< SIEMPRE CRECIENDO…>
Creación de clasificadores
personalizados adicionales
Amazon
DynamoDB
Conexión de NoSQL
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Pero tengo mis propios formatos de datos...?
− Hay un clasificador personalizado para ello...
Basado en filas
Clasificador GROK
Un patrón de grok es un
conjunto designado de
expresiones regulares
(regex) que se usan para
que los datos coincidan
con una línea cada vez
XML
Clasificador XML
La etiqueta XML que
define una fila de tabla
en el documento XML
JSON
Clasificador JSON
Ruta de JSON al objeto, la
matriz o el valor que define
una fila de la tabla que se
está creando. Escriba el
nombre con sintaxis JSON
de punto o corchete y
utilizando los operadores
compatibles de AWS Glue
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Otras maneras de llenar el catálogo
Llamar a la API CreateTable de
AWS Glue
Crear una tabla manualmente Instrucción DDL (en Amazon Athena o Amazon EMR)
Metaalmacén
de Apache Hive
AWS GLUE ETL CATÁLOGO DE DATOS DE
AWS GLUE
Importar desde el metaalmacén de
Apache Hive
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Cómo agrego datos en mi Data lake?
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Cómo obtengo valor?
Amazon SageMaker
AMI de aprendizaje profundo de AWS
Amazon Rekognition
Amazon Lex
AWS DeepLens
Amazon Comprehend
Amazon Translate
Amazon Transcribe
Amazon Polly
Amazon Athena
Amazon EMR
Amazon Redshift
Amazon Elasticsearch Service
Amazon Kinesis
Amazon QuickSight
Conexión directa AWS
AWS Snowball
AWS Snowmobile
AWS Database Migration Service
AWS IoT Core
Amazon Kinesis Data Firehose
Amazon Kinesis Data Streams
Amazon Kinesis Video Streams
Data lakes en AWS
Almacenamiento | Almacenamiento para archivado | Catálogo de datos
AnálisisAprendizaje automático
Movimiento de datos
en tiempo real
Movimiento de datos tradicional
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Incorpore datos según el tipo de datos
Abierto y completo
• Movimiento de datos desde centros de datos
locales
• Conexión de red dedicada
• Dispositivos seguros
• Contenedor de envío reforzado
• Migración de bases de datos
• Gateway que permite a las aplicaciones escribir en la
la nube
• Movimiento de datos desde orígenes en tiempo
real
• Conectar dispositivos aAWS
• Streaming de datos en tiempo real
• Streaming de vídeo en tiempo real
Conexión directa AWS
AWS Snowball
AWS Snowmobile
AWS Database Migration Service
AWS Storage Gateway
AWS IoT Core
Amazon Kinesis Data Firehose
Amazon Kinesis Data Streams
Amazon Kinesis Video Streams
Movimiento de datos
desde orígenes en
tiempo real
Movimiento de datos
desde sus centros de datos
Amazon S3
Amazon Glacie r
AWS Glue
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Data lakes y movimiento de datos en tiempo real en AWS
Amazon
Kinesis Data
Firehose
Catálogo de
datos de
AWS Glue
Datos de
Amazon S3
Datalakes
en AWS
Amazon
Kinesis Data
Streams
Definición de
datos
Agente de Kinesis
Apache Kafka
AWS SDK
LOG4J
Flume
Fluentd
AWS Mobile SDK
Kinesis Producer Library
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
IMPORTANTE: incorpore los datos sin formato...
Abierto y completo
Amazon S3
Amazon Glacie r
AWS Glue
• Almacene los datos sin formato:
• ANTES DE
• Transformarlos
• Analizarlos
• Manipularlos
• Hacerles... cualquier... cosa
CSV
ORC
Grok
Avro
Parquet
JSON
• Esto se convierte en su fuente de registro
a la que siempre puede volver...
• Las políticas de ciclo de vida le permiten pasar a
un almacenamiento en caliente o
en frío.
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Almacenamiento por capas para optimizar el precio o el rendimiento
• Almacenamiento por capas para optimizar el
precio o el rendimiento
• Amazon S3 Estándar
• Amazon S3 Estándar - Acceso poco frecuente
• Amazon S3 Única zona - Acceso poco frecuente
• Amazon Glacier
• Migración entre capas en función de políticas
basadas en el ciclo de vida
• Almacenamiento de datos a 0,023 USD*/GB/mes
con Amazon S3
• Almacenamiento de datos a 0,004 USD*/GB/mes
con Amazon Glacier
Amazon
S3Estándar
Amazon S3 Estándar
Acceso poco
frecuente
Amazon
Glacier
Activo Poco
frecuente
Archivo
Costo más bajo
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Conjuntos de datos en el data lake?
Conjuntos de datos sin formato: conjuntos de datos inmutables a los
que siempre puede volver.
• Sin prestar atención a las complejidades de cómo se almacenan los
datos a través del catálogo y SerDes
Optimización del análisis y el aprendizaje automático:
Conjuntos de datos seleccionados, optimizados para consultas, para su
consumo en un amplio abanico de herramientas
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Preparación de datos sin formato para su consumo
Datos sin formato almacenados en lagos de datos
Preparación:
Normalizados
Con particiones
Comprimidos
Optimizados para
almacenamiento
Extracción - Carga - Transformación
Incorporación
sin formato
Conjuntos
de datos
seleccionados
Catálogo de datos
ETL
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Qué herramienta tengo que utilizar para
analizar mis datos?
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
¿Cómo obtengo valor?
Amazon SageMaker
AMI de aprendizaje profundo de AWS
Amazon Rekognition
Amazon Lex
AWS DeepLens
Amazon Comprehend
Amazon Translate
Amazon Transcribe
Amazon Polly
Amazon Athena
Amazon EMR
Amazon Redshift
Amazon Elasticsearch Service
Amazon Kinesis
Amazon QuickSight
Conexión directa AWS
AWS Snowball
AWS Snowmobile
AWS Database Migration Service
AWS IoT Core
Amazon Kinesis Data Firehose
Amazon Kinesis Data Streams
Amazon Kinesis Video Streams
Data lake
en AWS
Almacenamiento | Almacenamiento para archivado | Catálogo de datos
AnálisisAprendizaje automático
Movimiento de datos
en tiempo real
Movimiento de datos tradicional
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Herramientas diferentes para usuarios diferentes...
Informes de
negocios
Catálogo
de datos
Almacenamiento
central
SagemakerAprendizaje automático/Aprendizaje profundo
Científicos
de datos
Ingeniero
de datos
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Amazon Athena: análisis interactivo
Servicio de consultas interactivo que analiza datos en Amazon S3 mediante SQL estándar
No es necesario configurar o administrar una infraestructura ni cargar datos
Capacidad para ejecutar consultas SQL en datos archivados en Amazon Glacier (disponible
próximamente)
$ SQL
Consulta al instante
Sin gastos de
configuración: solo
tiene que señalar a
Amazon S3
y comenzar
a consultar.
Pago por consulta
Pague solo por las
consultas realizadas.
Ahórrese entre un 30 %
y un 90 % en costos por
consulta gracias a la
compresión.
Abierto
Interfaz de ANSI SQL,
controladores JDBC/ODBC,
varios formatos, tipos de
compresión y combinación
y tipos de datos complejos.
Fácil
Sin servidor: sin
infraestructura, ni
administración.
Integrado con Amazon
QuickSight.
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Amazon EMR: procesamiento de big data
Análisis y ML a escala
Diecinueve proyectos de código abierto: Apache Hadoop, Spark, HBase y Presto, entre otros
Seguridad de nivel empresarial
$
Últimas versiones
Actualizado con los
marcos de código abierto
más recientes en un plazo
máximo de 30 días tras el
lanzamiento.
Bajo costo
Facturación flexible con
facturación por segundo,
spot de Amazon EC2,
instancias reservadas
y Auto Scaling para
reducir los costos entre
50 % y un 80 %.
Uso de almacenamiento
de Amazon S3
Procese directamente los
datos con seguridad en el
lago de datos de Amazon
S3 con un alto
rendimiento mediante el
conector EMRFS.
Fácil
Lance Hadoop o Spark
completamente
administrados en cuestión
de minutos; no tendrá que
configurar nodos ni
aprovisionarlos ni ajustar
clústeres.
Lago de datos
100110000100101011100
1010101110010101000
00111100101100101
010001100001
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Análisis de Hadoop/Spark en AWS
YARN (administrador de recursos de Hadoop)
NoSQLAprendizaje
automático
Tiempo realInteractivoScriptLote
Lago de datos
en AWS
Amazon S3
Amazon EMR
Hadoop/Spark administrado
Almacenamiento de objetos
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Inclusión en el catálogo de datos común
Amazon S3
Clúster de Spark interactivo
Amazon EMR
Amazon EMR
EMRFS
HDFS
Trabajo de ETL transitorio
Origen de confianza
EMRFS
HDFS
Describe los datos
Instancia de
base de datos
MySQL
Vistadedatosunificados
Catálogo de
datos de
AWS Glue
Almacena los datos
…
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Amazon Redshift: almacenamiento de datos
Almacén de datos rápido, sencillo y completamente administrado por una décima parte de
su costo
Procesamiento masivo en paralelo a escala de gigabytes a petabytes
De escalado rápido
Tecnología de
almacenamiento en
columnas para mejorar la
eficiencia de E/S y escalar
el rendimiento de las
consultas.
$
Económico
Pague solo 1000 USD por
terabyte al año, una
décima parte de lo que
cuestan las soluciones de
almacén de datos
tradicionales; comience
con 0,25 USD la hora.
Formatos de archivo
abiertos
Seguro
Audítelo todo; cifre datos
de un extremo a otro,
certificación y
conformidad extensos.
Analice formatos de datos
optimizados en el último
SSD y todos los formatos
de datos abiertos en
Amazon S3.
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Data warehouse...
Almacén de datos de Amazon Redshift Datos relacionales
Escala de gigabytes a petabytes
Informes y análisis
Definición del esquema antes de cargarse los
datos
AWS ETL
de Glue
Local
Amazon
QuickSight
Herramienta de BI
existente o nueva
COPY
de Redshift
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Un Data lake no es un Enterprise Data Warehouse
Complementa el EDW (no lo sustituye). El EDW puede proceder del lago de datos.
Esquema al leer (sin esquemas predefinidos). Esquema al escribir (esquemas predefinidos).
Datos estructurados/semiestructurados/sin estructura. Solo datos estructurados.
Rápida incorporación de datos o contenido nuevo. Introducir nuevo contenido es laborioso.
Ciencia de datos + Predicción/Análisis avanzado
+ Casos de uso de BI.
Casos de uso de BI.
Datos en el nivel de detalle/precisión de bajo nivel. Datos en el nivel de detalle de resumen/agregado.
SLA con definición flexible. SLA estrictos (programas de producción).
Herramientas flexibles
(código abierto/herramientas para análisis avanzados).
Flexibilidad limitada de las herramientas (solo SQL).
Almacenamiento elástico y capacidad de cómputo:
desacoplados.
Entornos con tamaño explícito; la computación y el
almacenamiento se escalan linealmente.
Data Lake
EDW
(Data Warehouse)
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Amazon Redshift Spectrum
Amplíe el almacenamiento de datos hasta el nivel de exabytes en lagos de datos de Amazon S3
Data lake en
Amazon S3
Datos de Amazon
Redshift
Amazon Redshift Spectrum
Consultas de exabytes de Redshift SQL en Amazon S3
Una datos entre Redshift y Amazon S3
Escalado independiente de los recursos de informática y
almacenamiento
Rendimiento estable de las consultas y simultaneidad ilimitada
Formatos de datos CSV, ORC, Grok, Avro y Parquet
Pague solo por la cantidad de datos analizados
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
A m a z o n R e d s h i f S p e c t r u m
R e a l i c e c o n s u l t a s
e n s u D a t a l a k e
Amazon
Redshift
JDBC/ODBC
...
1 2 3 4 N
Amazon Redshift
Spectrum
Reduzca la informática sin
servidores
Catálogo de datos
de AWS Glue
Comandos
COPY
Datos
calientes
Realice
consultas
directamente en
el Data lake
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Los data lakes amplían el almacén de datos tradicional
Almacén de datos
Inteligencia empresarial
OLTP ERP CRM LOB
• Datos relacionales y no relacionales
• Escala deTB-EB
• Diferentes motores de análisis
• Análisis y almacenamiento de bajo costo
Dispositivos
inteligentes
Web Sensores Redes
sociales
Data lake
Procesamiento de big data,
aprendizaje automático en tiempo real
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Aprendizaje automático
y big data
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Impulso del aprendizaje automático con big data
Mejores
decisiones
Almacenamiento de
objetos
Bases de datos
Almacén de datos
Análisis de streaming
BI
Hadoop
Spark/Presto
Elasticsearch
Mejores
productos
Aprendizaje automático
Aprendizaje profundo/
inteligencia artificial
Más
usuarios
Más
datos
Secuencia de clics
Actividad de usuario
Contenido generado
Compras
Clics
Número de Me gusta
Datos de sensor
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Agilidad en el aprendizaje automático
Amazon SageMaker
AMIdeaprendizajeprofundodeAWS
Amazon Rekognition
Amazon Lex
AWS DeepLens
Amazon Comprehend
Amazon Translate
Amazon Transcribe
Amazon Polly
Amazon Athena
Amazon EMR
Amazon Redshift
Amazon Elasticsearch Service
Amazon Kinesis
Amazon QuickSight
Conexión directa AWS
AWS Snowball
AWS Snowmobile
AWS Database Migration Service
AWS IoT Core
Amazon Kinesis Data Firehose
Amazon Kinesis Data Streams
Amazon Kinesis Video Streams
Data lake
en AWSAlmacenamiento | Almacenamiento para archivado | Catálogo de datos
AnálisisAprendizajeautomático
Movimiento de datosMovimiento de datos
en tiempo realen las instalaciones
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
En resumen...
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Ideas Clave
• Los Data lakes y los Data Warehouse se complementan entre sí.
• Bajo acoplamiento, pero de alto rendimiento.
• Almacenamiento, análisis, administración de metadatos, etc.
• Proteja sus análisis de cara al futuro.
• Elección de la herramienta más adecuada para el trabajo.
• Elasticidad y numerosos clústeres para objetivos exclusivos.
• Sustitución de la planificación de capacidad por el modelo de consumo.
• No se olvide de administrar los metadatos.
© 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos.
Uso de la capa de almacenamiento y el formato de datos
adecuado
Estructura de datos → Esquema fijo, JSON, clave-valor.
Patrones de acceso → Almacene los datos en el formato en
que vaya a obtener acceso a ellos.
Características de los datos → Calientes, templados, fríos.
Costo → Costo adecuado.
http://bit.ly/2JDdCzN
¡Gracias!

Más contenido relacionado

La actualidad más candente

Prácticas para aumentar su nivel de seguridad en la Nube AWS
Prácticas para aumentar su nivel de seguridad en la Nube AWSPrácticas para aumentar su nivel de seguridad en la Nube AWS
Prácticas para aumentar su nivel de seguridad en la Nube AWSAmazon Web Services LATAM
 
Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...
Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...
Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...Amazon Web Services
 
Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...
Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...
Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...Amazon Web Services LATAM
 
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloudAWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloudAmazon Web Services LATAM
 
Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSAmazon Web Services LATAM
 
Arquitecturas Serverless con IoT, Machine Learning y Asistentes de Voz
Arquitecturas Serverless con IoT, Machine Learning y Asistentes de VozArquitecturas Serverless con IoT, Machine Learning y Asistentes de Voz
Arquitecturas Serverless con IoT, Machine Learning y Asistentes de VozAmazon Web Services LATAM
 
Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...
Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...
Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...Amazon Web Services LATAM
 
¿Qué base de datos usar y cuándo? - MXO206 - Mexico City Summit
¿Qué base de datos usar y cuándo? - MXO206 - Mexico City Summit¿Qué base de datos usar y cuándo? - MXO206 - Mexico City Summit
¿Qué base de datos usar y cuándo? - MXO206 - Mexico City SummitAmazon Web Services
 
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...Amazon Web Services LATAM
 
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...Amazon Web Services
 
AWS Webinar Series Latinoamérica: Inteligencia artificial en Retail
AWS Webinar Series Latinoamérica: Inteligencia artificial en RetailAWS Webinar Series Latinoamérica: Inteligencia artificial en Retail
AWS Webinar Series Latinoamérica: Inteligencia artificial en RetailAmazon Web Services LATAM
 
Arquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generaciónArquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generaciónAmazon Web Services LATAM
 
Evaluación y prácticas para migrar a la nube
Evaluación y prácticas para migrar a la nubeEvaluación y prácticas para migrar a la nube
Evaluación y prácticas para migrar a la nubeAmazon Web Services LATAM
 
Optimización de costos en migraciones a la nube AWS
Optimización de costos en migraciones a la nube AWSOptimización de costos en migraciones a la nube AWS
Optimización de costos en migraciones a la nube AWSAmazon Web Services LATAM
 
Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...Amazon Web Services
 
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...Amazon Web Services
 
AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...
AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...
AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...Amazon Web Services LATAM
 
AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...
AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...
AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...Amazon Web Services LATAM
 
10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...
10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...
10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...Amazon Web Services
 
Migration Day - Migración a AWS: La base de la transformación empresarial
Migration Day - Migración a AWS: La base de la transformación empresarialMigration Day - Migración a AWS: La base de la transformación empresarial
Migration Day - Migración a AWS: La base de la transformación empresarialAmazon Web Services LATAM
 

La actualidad más candente (20)

Prácticas para aumentar su nivel de seguridad en la Nube AWS
Prácticas para aumentar su nivel de seguridad en la Nube AWSPrácticas para aumentar su nivel de seguridad en la Nube AWS
Prácticas para aumentar su nivel de seguridad en la Nube AWS
 
Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...
Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...
Arquitecturas y estrategias para generar aplicaciones modernas en AWS - MXO20...
 
Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...
Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...
Transformation Track AWS Cloud Experience Argentina - Mejores Practicas en Am...
 
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloudAWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
AWS Cloud Experience CA: Mejores prácticas en ambientes hibridos onpremise/cloud
 
Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWS
 
Arquitecturas Serverless con IoT, Machine Learning y Asistentes de Voz
Arquitecturas Serverless con IoT, Machine Learning y Asistentes de VozArquitecturas Serverless con IoT, Machine Learning y Asistentes de Voz
Arquitecturas Serverless con IoT, Machine Learning y Asistentes de Voz
 
Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...
Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...
Transformation Track AWS Cloud Experience Argentina - Despegando y Desarrolla...
 
¿Qué base de datos usar y cuándo? - MXO206 - Mexico City Summit
¿Qué base de datos usar y cuándo? - MXO206 - Mexico City Summit¿Qué base de datos usar y cuándo? - MXO206 - Mexico City Summit
¿Qué base de datos usar y cuándo? - MXO206 - Mexico City Summit
 
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
AWS Cloud Experience CA: Nuevos Paradigmas de Arquitecturas en la Nube (Serve...
 
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
Impulsando la innovación con arquitectura de contenedores - MXO202 - Mexico C...
 
AWS Webinar Series Latinoamérica: Inteligencia artificial en Retail
AWS Webinar Series Latinoamérica: Inteligencia artificial en RetailAWS Webinar Series Latinoamérica: Inteligencia artificial en Retail
AWS Webinar Series Latinoamérica: Inteligencia artificial en Retail
 
Arquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generaciónArquitecturas de comercio electrónico de la próxima generación
Arquitecturas de comercio electrónico de la próxima generación
 
Evaluación y prácticas para migrar a la nube
Evaluación y prácticas para migrar a la nubeEvaluación y prácticas para migrar a la nube
Evaluación y prácticas para migrar a la nube
 
Optimización de costos en migraciones a la nube AWS
Optimización de costos en migraciones a la nube AWSOptimización de costos en migraciones a la nube AWS
Optimización de costos en migraciones a la nube AWS
 
Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...Descubriendo información relevante de manera sencilla: Inteligencia artificia...
Descubriendo información relevante de manera sencilla: Inteligencia artificia...
 
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
Influencia del aprendizaje automático para mejorar el valor comercial - MXO20...
 
AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...
AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...
AWS Initiate Day Mexico City | Conduciendo la transformación digital utilizan...
 
AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...
AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...
AWS Cloud Experience CA: Desplegando y Desarrollando Aplicaciones Modernas en...
 
10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...
10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...
10 best practices to accelerate your cloud migration - SVC203 - Mexico City A...
 
Migration Day - Migración a AWS: La base de la transformación empresarial
Migration Day - Migración a AWS: La base de la transformación empresarialMigration Day - Migración a AWS: La base de la transformación empresarial
Migration Day - Migración a AWS: La base de la transformación empresarial
 

Similar a AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS

Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City SummitGeneración de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City SummitAmazon Web Services
 
Building and governing modern data lakes and data warehouses - ADB201 - Mexic...
Building and governing modern data lakes and data warehouses - ADB201 - Mexic...Building and governing modern data lakes and data warehouses - ADB201 - Mexic...
Building and governing modern data lakes and data warehouses - ADB201 - Mexic...Amazon Web Services
 
AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...
AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...
AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...Amazon Web Services LATAM
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSAmazon Web Services LATAM
 
Webinar: Ask the Experts - Big Data (Español)
Webinar: Ask the Experts - Big Data (Español)Webinar: Ask the Experts - Big Data (Español)
Webinar: Ask the Experts - Big Data (Español)Amazon Web Services LATAM
 
AnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web ServicAnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web ServicSoftware Guru
 
AnalyticZ - De la A a la Z con Amazon Web Services
AnalyticZ - De la A a la Z con Amazon Web ServicesAnalyticZ - De la A a la Z con Amazon Web Services
AnalyticZ - De la A a la Z con Amazon Web ServicesAmazon Web Services LATAM
 
Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...
Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...
Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...Amazon Web Services LATAM
 
The Importance of Cloud Security [Spanish]
The Importance of Cloud Security [Spanish]The Importance of Cloud Security [Spanish]
The Importance of Cloud Security [Spanish]Amazon Web Services
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSAmazon Web Services LATAM
 
AWS purpose-built database strategy: The right tool for the right job - ADB30...
AWS purpose-built database strategy: The right tool for the right job - ADB30...AWS purpose-built database strategy: The right tool for the right job - ADB30...
AWS purpose-built database strategy: The right tool for the right job - ADB30...Amazon Web Services
 
Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...
Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...
Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...Amazon Web Services
 

Similar a AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS (20)

Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City SummitGeneración de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
Generación de lagos de datos y analítica sobre AWS - MXO204 - Mexico City Summit
 
Building and governing modern data lakes and data warehouses - ADB201 - Mexic...
Building and governing modern data lakes and data warehouses - ADB201 - Mexic...Building and governing modern data lakes and data warehouses - ADB201 - Mexic...
Building and governing modern data lakes and data warehouses - ADB201 - Mexic...
 
Innovación Amazon
Innovación AmazonInnovación Amazon
Innovación Amazon
 
AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...
AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...
AWS Initiate Day Mexico City | Migración de datos a la nube, explorando sus o...
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWS
 
Webinar: Ask the Experts - Big Data (Español)
Webinar: Ask the Experts - Big Data (Español)Webinar: Ask the Experts - Big Data (Español)
Webinar: Ask the Experts - Big Data (Español)
 
AnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web ServicAnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web Servic
 
AnalyticZ - De la A a la Z con Amazon Web Services
AnalyticZ - De la A a la Z con Amazon Web ServicesAnalyticZ - De la A a la Z con Amazon Web Services
AnalyticZ - De la A a la Z con Amazon Web Services
 
Empezando con AWS [Spanish}
Empezando con AWS [Spanish}Empezando con AWS [Spanish}
Empezando con AWS [Spanish}
 
AWS Database Day - Español
AWS Database Day - EspañolAWS Database Day - Español
AWS Database Day - Español
 
Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...
Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...
Session #3 - Agile Transformation in the Cloud: "Culture eats strategy for br...
 
The Importance of Cloud Security [Spanish]
The Importance of Cloud Security [Spanish]The Importance of Cloud Security [Spanish]
The Importance of Cloud Security [Spanish]
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
AWS Summit Lima 2015: Key Note Presentation
AWS Summit Lima 2015: Key Note PresentationAWS Summit Lima 2015: Key Note Presentation
AWS Summit Lima 2015: Key Note Presentation
 
AWS purpose-built database strategy: The right tool for the right job - ADB30...
AWS purpose-built database strategy: The right tool for the right job - ADB30...AWS purpose-built database strategy: The right tool for the right job - ADB30...
AWS purpose-built database strategy: The right tool for the right job - ADB30...
 
Construyendo un data lake en la nube aws
Construyendo un data lake en la nube awsConstruyendo un data lake en la nube aws
Construyendo un data lake en la nube aws
 
Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...
Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...
Lleve la inteligencia al borde del IoT con AWS Greengrass - MXO205 - Mexico C...
 

Más de Amazon Web Services LATAM

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAmazon Web Services LATAM
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAmazon Web Services LATAM
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSAmazon Web Services LATAM
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSAmazon Web Services LATAM
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAmazon Web Services LATAM
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAmazon Web Services LATAM
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosAmazon Web Services LATAM
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSAmazon Web Services LATAM
 

Más de Amazon Web Services LATAM (20)

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
 
Simplifique o seu BI com a AWS
Simplifique o seu BI com a AWSSimplifique o seu BI com a AWS
Simplifique o seu BI com a AWS
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
 

Último

La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 

Último (19)

La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 

AWS Initiate Day Mexico City | Building Data Lakes & Analytics on AWS

  • 1. Creación de Data lakes y análisis de datos en AWS: prácticas recomendadas para patrones Eduardo Patiño Balaguera Arquitecto de soluciones para Sector Público Email: balague@amazon.com
  • 2. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Big Data: diversos tipos de retos VisualizaciónVariabilidad Volumen Velocidad Variedad Veracidad Valor
  • 3. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. A menudo, los retos se plantean porque: https://www.promptcloud.com https://john-popelaars.blogspot.com https://www.signiant.com https://www.linkedin.com/pulse/world-today-data-rich-information-poor- guru-p-mohapatra-pmp/ Los datos aumentan más deprisa que nunca Aumenta la variedad de los datos
  • 4. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Data lakes en AWS ayudan a abordar estos retos Integran y almacenan rápidamente cualquier tipo de datos Aportan al mismo tiempo información detallada y seguridad... Ejecutan la herramienta adecuada para el trabajo adecuado sin tener que copiar manualmente los datos
  • 5. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Data lakes en AWS Análisis Aprendizajeautomático Movimiento de datos en tiempo real Movimiento de datos Data lakes en AWS tradicional Adquisición Inteligencia Catálogo de almacenamiento Variedad de herramientas de procesamiento El análisis se desacopla del almacenamiento/ catálogo
  • 6. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Qué datos tengo?
  • 7. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Qué datos tengo? Gartner: "Durante el año 2018, el 80 % de los Data lakes no incluirán capacidades de administración de metadatos, lo que hará que sean poco eficientes" "Los metadatos nos ayudan a encontrar los datos en el lago de datos" Data lakes en AWS Almacenamiento | Almacenamiento para archivado | Catálogo de datos
  • 8. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Componentes de AWS Glue Creación de trabajosCatálogo de datos Ejecución de trabajos Compatible con el metastore de Apache Hive Integrado con servicios de AWS Rastreo y detección automáticos de datos Detección Genera automáticamente código ETL Python y Apache Spark Edición, depuración y uso compartido Desarrollo Ejecución sin servidor Programación flexible Monitorización y alertas Implementación
  • 9. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Qué pueden detectar los crawlers? Rol de IAM Crawler de AWS Glue Bases de datos Amazon Redshift Amazon S3 Conexión de JDBC Conexión de objetos Clasificadores integrados MySQL MariaDB PostreSQL Aurora Oracle Amazon Redshift Avro Parquet ORC XML JSON y JSONPaths AWS CloudTrail BSON Registros (Apache (Grok), Linux (Grok), MS (Grok), Ruby, Redis y muchos más) Delimitados (coma, barra vertical, tabulador, punto y coma) < SIEMPRE CRECIENDO…> Creación de clasificadores personalizados adicionales Amazon DynamoDB Conexión de NoSQL
  • 10. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Pero tengo mis propios formatos de datos...? − Hay un clasificador personalizado para ello... Basado en filas Clasificador GROK Un patrón de grok es un conjunto designado de expresiones regulares (regex) que se usan para que los datos coincidan con una línea cada vez XML Clasificador XML La etiqueta XML que define una fila de tabla en el documento XML JSON Clasificador JSON Ruta de JSON al objeto, la matriz o el valor que define una fila de la tabla que se está creando. Escriba el nombre con sintaxis JSON de punto o corchete y utilizando los operadores compatibles de AWS Glue
  • 11. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Otras maneras de llenar el catálogo Llamar a la API CreateTable de AWS Glue Crear una tabla manualmente Instrucción DDL (en Amazon Athena o Amazon EMR) Metaalmacén de Apache Hive AWS GLUE ETL CATÁLOGO DE DATOS DE AWS GLUE Importar desde el metaalmacén de Apache Hive
  • 12. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Cómo agrego datos en mi Data lake?
  • 13. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Cómo obtengo valor? Amazon SageMaker AMI de aprendizaje profundo de AWS Amazon Rekognition Amazon Lex AWS DeepLens Amazon Comprehend Amazon Translate Amazon Transcribe Amazon Polly Amazon Athena Amazon EMR Amazon Redshift Amazon Elasticsearch Service Amazon Kinesis Amazon QuickSight Conexión directa AWS AWS Snowball AWS Snowmobile AWS Database Migration Service AWS IoT Core Amazon Kinesis Data Firehose Amazon Kinesis Data Streams Amazon Kinesis Video Streams Data lakes en AWS Almacenamiento | Almacenamiento para archivado | Catálogo de datos AnálisisAprendizaje automático Movimiento de datos en tiempo real Movimiento de datos tradicional
  • 14. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Incorpore datos según el tipo de datos Abierto y completo • Movimiento de datos desde centros de datos locales • Conexión de red dedicada • Dispositivos seguros • Contenedor de envío reforzado • Migración de bases de datos • Gateway que permite a las aplicaciones escribir en la la nube • Movimiento de datos desde orígenes en tiempo real • Conectar dispositivos aAWS • Streaming de datos en tiempo real • Streaming de vídeo en tiempo real Conexión directa AWS AWS Snowball AWS Snowmobile AWS Database Migration Service AWS Storage Gateway AWS IoT Core Amazon Kinesis Data Firehose Amazon Kinesis Data Streams Amazon Kinesis Video Streams Movimiento de datos desde orígenes en tiempo real Movimiento de datos desde sus centros de datos Amazon S3 Amazon Glacie r AWS Glue
  • 15. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Data lakes y movimiento de datos en tiempo real en AWS Amazon Kinesis Data Firehose Catálogo de datos de AWS Glue Datos de Amazon S3 Datalakes en AWS Amazon Kinesis Data Streams Definición de datos Agente de Kinesis Apache Kafka AWS SDK LOG4J Flume Fluentd AWS Mobile SDK Kinesis Producer Library
  • 16. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. IMPORTANTE: incorpore los datos sin formato... Abierto y completo Amazon S3 Amazon Glacie r AWS Glue • Almacene los datos sin formato: • ANTES DE • Transformarlos • Analizarlos • Manipularlos • Hacerles... cualquier... cosa CSV ORC Grok Avro Parquet JSON • Esto se convierte en su fuente de registro a la que siempre puede volver... • Las políticas de ciclo de vida le permiten pasar a un almacenamiento en caliente o en frío.
  • 17. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Almacenamiento por capas para optimizar el precio o el rendimiento • Almacenamiento por capas para optimizar el precio o el rendimiento • Amazon S3 Estándar • Amazon S3 Estándar - Acceso poco frecuente • Amazon S3 Única zona - Acceso poco frecuente • Amazon Glacier • Migración entre capas en función de políticas basadas en el ciclo de vida • Almacenamiento de datos a 0,023 USD*/GB/mes con Amazon S3 • Almacenamiento de datos a 0,004 USD*/GB/mes con Amazon Glacier Amazon S3Estándar Amazon S3 Estándar Acceso poco frecuente Amazon Glacier Activo Poco frecuente Archivo Costo más bajo
  • 18. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Conjuntos de datos en el data lake? Conjuntos de datos sin formato: conjuntos de datos inmutables a los que siempre puede volver. • Sin prestar atención a las complejidades de cómo se almacenan los datos a través del catálogo y SerDes Optimización del análisis y el aprendizaje automático: Conjuntos de datos seleccionados, optimizados para consultas, para su consumo en un amplio abanico de herramientas
  • 19. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Preparación de datos sin formato para su consumo Datos sin formato almacenados en lagos de datos Preparación: Normalizados Con particiones Comprimidos Optimizados para almacenamiento Extracción - Carga - Transformación Incorporación sin formato Conjuntos de datos seleccionados Catálogo de datos ETL
  • 20. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Qué herramienta tengo que utilizar para analizar mis datos?
  • 21. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. ¿Cómo obtengo valor? Amazon SageMaker AMI de aprendizaje profundo de AWS Amazon Rekognition Amazon Lex AWS DeepLens Amazon Comprehend Amazon Translate Amazon Transcribe Amazon Polly Amazon Athena Amazon EMR Amazon Redshift Amazon Elasticsearch Service Amazon Kinesis Amazon QuickSight Conexión directa AWS AWS Snowball AWS Snowmobile AWS Database Migration Service AWS IoT Core Amazon Kinesis Data Firehose Amazon Kinesis Data Streams Amazon Kinesis Video Streams Data lake en AWS Almacenamiento | Almacenamiento para archivado | Catálogo de datos AnálisisAprendizaje automático Movimiento de datos en tiempo real Movimiento de datos tradicional
  • 22. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Herramientas diferentes para usuarios diferentes... Informes de negocios Catálogo de datos Almacenamiento central SagemakerAprendizaje automático/Aprendizaje profundo Científicos de datos Ingeniero de datos
  • 23. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Amazon Athena: análisis interactivo Servicio de consultas interactivo que analiza datos en Amazon S3 mediante SQL estándar No es necesario configurar o administrar una infraestructura ni cargar datos Capacidad para ejecutar consultas SQL en datos archivados en Amazon Glacier (disponible próximamente) $ SQL Consulta al instante Sin gastos de configuración: solo tiene que señalar a Amazon S3 y comenzar a consultar. Pago por consulta Pague solo por las consultas realizadas. Ahórrese entre un 30 % y un 90 % en costos por consulta gracias a la compresión. Abierto Interfaz de ANSI SQL, controladores JDBC/ODBC, varios formatos, tipos de compresión y combinación y tipos de datos complejos. Fácil Sin servidor: sin infraestructura, ni administración. Integrado con Amazon QuickSight.
  • 24. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Amazon EMR: procesamiento de big data Análisis y ML a escala Diecinueve proyectos de código abierto: Apache Hadoop, Spark, HBase y Presto, entre otros Seguridad de nivel empresarial $ Últimas versiones Actualizado con los marcos de código abierto más recientes en un plazo máximo de 30 días tras el lanzamiento. Bajo costo Facturación flexible con facturación por segundo, spot de Amazon EC2, instancias reservadas y Auto Scaling para reducir los costos entre 50 % y un 80 %. Uso de almacenamiento de Amazon S3 Procese directamente los datos con seguridad en el lago de datos de Amazon S3 con un alto rendimiento mediante el conector EMRFS. Fácil Lance Hadoop o Spark completamente administrados en cuestión de minutos; no tendrá que configurar nodos ni aprovisionarlos ni ajustar clústeres. Lago de datos 100110000100101011100 1010101110010101000 00111100101100101 010001100001
  • 25. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Análisis de Hadoop/Spark en AWS YARN (administrador de recursos de Hadoop) NoSQLAprendizaje automático Tiempo realInteractivoScriptLote Lago de datos en AWS Amazon S3 Amazon EMR Hadoop/Spark administrado Almacenamiento de objetos
  • 26. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Inclusión en el catálogo de datos común Amazon S3 Clúster de Spark interactivo Amazon EMR Amazon EMR EMRFS HDFS Trabajo de ETL transitorio Origen de confianza EMRFS HDFS Describe los datos Instancia de base de datos MySQL Vistadedatosunificados Catálogo de datos de AWS Glue Almacena los datos …
  • 27. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Amazon Redshift: almacenamiento de datos Almacén de datos rápido, sencillo y completamente administrado por una décima parte de su costo Procesamiento masivo en paralelo a escala de gigabytes a petabytes De escalado rápido Tecnología de almacenamiento en columnas para mejorar la eficiencia de E/S y escalar el rendimiento de las consultas. $ Económico Pague solo 1000 USD por terabyte al año, una décima parte de lo que cuestan las soluciones de almacén de datos tradicionales; comience con 0,25 USD la hora. Formatos de archivo abiertos Seguro Audítelo todo; cifre datos de un extremo a otro, certificación y conformidad extensos. Analice formatos de datos optimizados en el último SSD y todos los formatos de datos abiertos en Amazon S3.
  • 28. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Data warehouse... Almacén de datos de Amazon Redshift Datos relacionales Escala de gigabytes a petabytes Informes y análisis Definición del esquema antes de cargarse los datos AWS ETL de Glue Local Amazon QuickSight Herramienta de BI existente o nueva COPY de Redshift
  • 29. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Un Data lake no es un Enterprise Data Warehouse Complementa el EDW (no lo sustituye). El EDW puede proceder del lago de datos. Esquema al leer (sin esquemas predefinidos). Esquema al escribir (esquemas predefinidos). Datos estructurados/semiestructurados/sin estructura. Solo datos estructurados. Rápida incorporación de datos o contenido nuevo. Introducir nuevo contenido es laborioso. Ciencia de datos + Predicción/Análisis avanzado + Casos de uso de BI. Casos de uso de BI. Datos en el nivel de detalle/precisión de bajo nivel. Datos en el nivel de detalle de resumen/agregado. SLA con definición flexible. SLA estrictos (programas de producción). Herramientas flexibles (código abierto/herramientas para análisis avanzados). Flexibilidad limitada de las herramientas (solo SQL). Almacenamiento elástico y capacidad de cómputo: desacoplados. Entornos con tamaño explícito; la computación y el almacenamiento se escalan linealmente. Data Lake EDW (Data Warehouse)
  • 30. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Amazon Redshift Spectrum Amplíe el almacenamiento de datos hasta el nivel de exabytes en lagos de datos de Amazon S3 Data lake en Amazon S3 Datos de Amazon Redshift Amazon Redshift Spectrum Consultas de exabytes de Redshift SQL en Amazon S3 Una datos entre Redshift y Amazon S3 Escalado independiente de los recursos de informática y almacenamiento Rendimiento estable de las consultas y simultaneidad ilimitada Formatos de datos CSV, ORC, Grok, Avro y Parquet Pague solo por la cantidad de datos analizados
  • 31. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. A m a z o n R e d s h i f S p e c t r u m R e a l i c e c o n s u l t a s e n s u D a t a l a k e Amazon Redshift JDBC/ODBC ... 1 2 3 4 N Amazon Redshift Spectrum Reduzca la informática sin servidores Catálogo de datos de AWS Glue Comandos COPY Datos calientes Realice consultas directamente en el Data lake
  • 32. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Los data lakes amplían el almacén de datos tradicional Almacén de datos Inteligencia empresarial OLTP ERP CRM LOB • Datos relacionales y no relacionales • Escala deTB-EB • Diferentes motores de análisis • Análisis y almacenamiento de bajo costo Dispositivos inteligentes Web Sensores Redes sociales Data lake Procesamiento de big data, aprendizaje automático en tiempo real
  • 33. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Aprendizaje automático y big data
  • 34. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Impulso del aprendizaje automático con big data Mejores decisiones Almacenamiento de objetos Bases de datos Almacén de datos Análisis de streaming BI Hadoop Spark/Presto Elasticsearch Mejores productos Aprendizaje automático Aprendizaje profundo/ inteligencia artificial Más usuarios Más datos Secuencia de clics Actividad de usuario Contenido generado Compras Clics Número de Me gusta Datos de sensor
  • 35. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Agilidad en el aprendizaje automático Amazon SageMaker AMIdeaprendizajeprofundodeAWS Amazon Rekognition Amazon Lex AWS DeepLens Amazon Comprehend Amazon Translate Amazon Transcribe Amazon Polly Amazon Athena Amazon EMR Amazon Redshift Amazon Elasticsearch Service Amazon Kinesis Amazon QuickSight Conexión directa AWS AWS Snowball AWS Snowmobile AWS Database Migration Service AWS IoT Core Amazon Kinesis Data Firehose Amazon Kinesis Data Streams Amazon Kinesis Video Streams Data lake en AWSAlmacenamiento | Almacenamiento para archivado | Catálogo de datos AnálisisAprendizajeautomático Movimiento de datosMovimiento de datos en tiempo realen las instalaciones
  • 36. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. En resumen...
  • 37. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Ideas Clave • Los Data lakes y los Data Warehouse se complementan entre sí. • Bajo acoplamiento, pero de alto rendimiento. • Almacenamiento, análisis, administración de metadatos, etc. • Proteja sus análisis de cara al futuro. • Elección de la herramienta más adecuada para el trabajo. • Elasticidad y numerosos clústeres para objetivos exclusivos. • Sustitución de la planificación de capacidad por el modelo de consumo. • No se olvide de administrar los metadatos.
  • 38. © 2019, Amazon Web Services, Inc. o sus empresas afiliadas. Reservados todos los derechos. Uso de la capa de almacenamiento y el formato de datos adecuado Estructura de datos → Esquema fijo, JSON, clave-valor. Patrones de acceso → Almacene los datos en el formato en que vaya a obtener acceso a ellos. Características de los datos → Calientes, templados, fríos. Costo → Costo adecuado.

Notas del editor

  1. Añadir nombre del orador y cargo
  2. Volumen - IoT, Sensores , Reporte de ciudadanos Velocidad - Miles de dispositivos mandando informacion Variedad en diferentes formatos o de diferentes fuentes Veracidad Valor de la informacion - No solo enviar data por enviar (dark Data)
  3. Cada Organizacion genera datos cierto , el reto es sacar valor a los datos para tomar decisions inteligentes Encontrar las herramientas adecuadas para las personas adecuadas No lo digo yo , veamos que dicen los analistas 88% Data no estructurada - Mucha info s9n explotar 50% de crecimiento de datos año contra año entre 2010 y 2020 Tenemos ya PT porday de clientes que suben informacion , esperamos ahora exabytes Sensores y Social media estan aportando mucho del crecimiento de la data
  4. Ahora bien , los Datalakes extiendes esa funcionalidad, Los datalekes no reemplazan , pero si extienden la funcionalidad en los motores de analisis ya no procesamos solo datos historicos , y datos relacionales Escalamos a TB o EX Tenemos nuevos retos , mas datos, mas escala , nueva tecnologia, no queremos tener un solo motor, ya que uno solo no puede proveer todas las funcionalidades Queremos tener multiple motores de analisis Incluso Podemos aplicar machine learning sobre el Datalake Pero como se ve esto del lado de AWS Amazon S3 99.99999999% Capacidades de Seguridad , cumplimiento y auditoria Datos estructurados y no estructurados Imagenes , Audio 2 veces mas integraciones con socio
  5. Demo Copy de Data a s3 Ingesta ( si funciona internet )
  6. Datos descubribles
  7. AWS Glue es un Servicio de ETL ( Extraccion carg ay transformacion ) Tiene diferentes capacidades, 1. Catalogo central ( temenos un storage central que soporta multiples formatos de datos , es importante tener un catalogo central , por que si queremos pasar d eun solo motro de analiticos a multiple motores de analiticos, esta es la manera de siemplificar el proceso , teniendo un unico catalogo de datos )
  8. Usar Glue para hacer la vida mas facil Diferentes origenes de datos para enviar datos a Amazon S3 , y usar Glue para verificar los datos para extrar los metadatos y cataloger los datos para que sean consumidos Para popular el catalogo se pued ehacer de diferentes maneras .. Crear tablas manualmente , usar hive DDL , API , Si tiene Hive metasotre actualmente, este se puede importer sobre el servicio de glue
  9. Amazon S3 holds trillions of objects and regularly peaks at millions of requests per second. More than 130,000 databases have been migrated using AWS Database Migration Service
  10. Temperatura de los datos
  11. More than 10,000 customers use Amazon Redshift.
  12. Siguiente paso .. La evolucion … Llevar imagenes al datalake y procesar esas imagenes que los estudiantes dejan , meme, que data puedo sacar de eso , como puedo detector los snetimientos en una palabra etc Esto podran verlo en Nuestra sesion de Machine Learning que tendremos posterior mente a las 12:45