Yecely Díaz 

yecely.diaz@gmail.com
Automatizando ideas
con Apache Airflow
Agenda
01
03
02
04
05
¿Qué es Apache
Airflow?
Historia real
Operadores
DAG
Demo
Historia real
Equipo de finanzas
Script + BD
1:00 am 6:00 am
Actualizar la consulta
Descargar CSV
Ejecutar su script
8:00 am 9:00 am
Validación de los archivos
Generar reporte
Subir a S3
Enviar correo de
confirmación
‣ “Es una plataforma que programáticamente puede crear, planificar y
monitorizar flujos de trabajo (DAGs).”

‣ Secuencias de tareas ejecutadas por una planificación o evento.

‣ Creado en 2014 por Maxime Beauchemin (@mistercrunch).

‣ Sistema de gestión de workflow de Airbnb.
¿Qué es Apache Airflow?
‣ Airflow se unió al programa Incubator de Apache Software Foundation en
marzo de 2016
‣ Anunció Airflow como un proyecto de nivel superior en enero de 2019.
‣ En 2018 se integró en el stack de Google Cloud
¿Qué es Apache Airflow?
DAG
Válido
Gráficos acíclicos dirigidos - Directed Acyclic Graphs
DAG
Inválido
‣ Python

‣ Ejecución, planificación y distribución de tareas

‣ Monitoreo, logging y alertas

‣ Pruebas unitarias

‣ Plugins
‣ Interface de línea de comandos (CLI) e Interface de usuario (UI) 



Ventajas
‣ No es intuitivo para usuarios nuevos

‣ Configuración del ambiente

‣ Sin soporte nativo para Windows

Desventajas
Componentes principales
Operadores
‣ DAGs. Describen como ejecutan el flujo de trabajo
‣ Operadores determinan lo que realmente hace una tarea

‣ Pueden compartir comunicación (XComs)
Componentes principales
Operadores
‣ BashOperator

‣ PythonOperator

‣ EmailOperator

‣ SimpleHttpOperator

‣ MySqlOperator, SqliteOperator…

‣ DockerOperator

‣ S3Operator

‣ SlackAPIOperators

‣ Sensores
Historia real
Equipo de finanzas
Script + BD
1:00 am 6:00 am
Actualizar la consulta
Descargar CSV
Ejecutar su script
8:00 am 9:00 am
Validación de los archivos
Generar reporte
Subir a S3
Enviar correo de
confirmación
Demo
‣ Docker
‣ Astronomer CLI (https://github.com/astronomer/astro-cli#installing-astro)


Ejecución local
‣ CI/CD. Integración continua y distribución continua
‣ Google Cloud Platform
‣ Amazon EKS (AWS Managed Kubernetes) 
‣ Astronomer (https://www.astronomer.io/)
¿Y en producción?
Dudas y comentarios
@silvercorp
yecely.diaz@gmail.com
Automatizando ideas con Apache Airflow
Automatizando ideas con Apache Airflow
Automatizando ideas con Apache Airflow
Automatizando ideas con Apache Airflow
Automatizando ideas con Apache Airflow

Automatizando ideas con Apache Airflow