Ingeniería y Ciencia de Datos
Berenice Herrera Maya Ormaza
Sobre nosotras
Berenice Maya
@mjormy
Hace un par de décadas...
¿Quién era dueño del
Hardware?
¿Quién manejaba la
electricidad, redes de
comunicación, etc?
Nosotros pagábamos
por..
¡Todo!
Servidor local
Aparición de los Data Centers...
¿Quién es dueño del HW? ¿Quién maneja la
electricidad, redes de
comunicación, etc?
Nosotros pagamos por..
Data Centers Hardware + EspacioData Center
La nube...
¿Quién es dueño del HW? ¿Quién maneja la
electricidad, redes de
comunicación, etc?
Nosotros pagamos por..
La nube (Google,
Amazon, Microsoft)
Lo que usamos
únicamente
“The most powerful infrastructure of the planet”
Algunos hitos importantes..
Aparición de App Engine
Herramientas de apoyo para Big Data: Big Query y Prediction API
Procesamiento paralelo con Dataproc
Evolución de Prediction Engine a Machine Learning Engine
Moviéndose a “la nube”
Backoffice
Business Applications
¿Por qué GCP?
Backoffice
Business Applications
Procesamiento y Confiabilidad
Aggregates
Cloud SQL
Inventory Counts
Analytics
BigQuery
Data Warehouse
Processing
Cloud Dataflow
Inventory Streams
Hosted Models
ML Engine
Transformación de negocio
Foundation
Big Data
Machine Learning
Data handling
Storage & Databases
Foundation
Big Data
Machine Learning
Data handling
Storage & Databases
Compute
Engine
Big Data
Machine Learning
Data handling
Foundation
Storage & Databases
Cloud
Bigtable
Cloud
Datastore
Cloud
SQL
Cloud
Storage
Cloud
Spanner
Storage & Databases
Big Data
BigQuery Cloud Datalab
Machine Learning
Data handling
Foundation
https://cloud.google.com/storage-options/
Big Data
Machine Learning
Cloud Machine
Learning
Cloud Vision
API
Cloud Natural
Language API
Cloud
Translation
API
Cloud Video
Intelligence API
Storage & Databases
Data handling
Foundation
Machine Learning
Data handling
Cloud
Dataproc
Cloud
Dataprep
Cloud
Dataflow
Cloud
Pub/Sub
Cloud IoT
Core
Big Data
Storage & Databases
Foundation
Escalabilidad &
Confiabilidad
Locación de cómputo
Mecanismos de cómputo
y obtención de insights
Ciclo de vida
Ingestión
Exploración y
Visualización
Procesamiento y
análisis
Almacenamiento
{...}
Limpieza
Transformación
Consolidación
Predicción
Tendencias
Patrones
Recomendaciones
...
Ingest
Pipeline
s
Storage
Analytics
Application &
Presentation
App
Engine
Cloud
Storage
Cloud
Pub/Sub
Logging
Cloud
Dataflow
Cloud
Datastore
Cloud
Bigtable
Cloud
Dataproc
Compute
Engine
BigQuery
Cloud
Datalab
ML Engine
Transfer
service
DEMO
¿PREGUNTAS?
¡GRACIAS!
Berenice Herrera
bherrera@thoughtworks.com
Maya Ormaza
mormaza@thoughtworks.com
@mjormy
Google Cloud Platform AWS
Interfaz
- Consola de GCP, Data Prep
-Interfaz de línea de comando que usa
google-cloud-ML-engine para controlar los
procesos de Tensor Flow
- Consola de Amazon Machine Learning
- Interfaz de línea de comando de Amazon
ETL
- Big Query, Hadoop (Map Reduce) - Elastic Map Reduce
Machine Learning
Acceso a los algoritmos utilizados por Google
y construcción y entrenamiento de modelos
personalizados
- ML APIs para análisis multimedia (imagen,
video, lenguaje natural)
Aplica algoritmos de aprendizaje automático
con propósito general para datos
almacenados en AWS
Eficiencia de costos
Contrato mínimo de un mes con descuentos
sustanciales por uso frecuente o extendido en
el tiempo
Contrato mínimo de 1 año
Comparativa GCP Vs AWS

Google Cloud Platform - Intro to Data Engineering and Data Science