HERRAMIENTAS ETL
TALEND OPEN STUDIO
Data Integration
Índice
Introducción
Herramientas ETL
Las dos grandes
Conociendo Talend
Trabajando con Talend
Ejemplo Práctico
Introducción
Complejidad de los sistemas actuales
Nuevas necesidades de negocio
La realidad empresarial
Necesidades de integración
Herramientas ETL
Wikipedia
“ETL son las siglas en inglés de Extraer, Transformar y
Cargar (Extract, Transform and Load). Es el proceso que permite a
las organizaciones mover datos desde múltiples fuentes,
reformatearlos y limpiarlos, y cargarlos en otra base de datos,data
mart, o data warehouse para analizar, o en otro sistema operacional
para apoyar un proceso de negocio.”
Herramientas ETL
Etapas del proceso
Extracción
Obtener datos desde sistemas origen
Homogeneización de estructuras
Preparar los datos para el procesamiento
Herramientas ETL
Etapas del proceso
Transformación
Aplicar reglas de negocio
Acciones comunes:
- Filtro de columnas
- Normalización / Desnormalización
- Mapeo de valores
- Cálculos de KPIs
Herramientas ETL
Etapas del proceso
Carga
Volcado de datos en sistema de destino
Diferentes estrategias de escritura
Conociendo Talend
Entorno gráfico Open-Source
IDE basado en Eclipse
Más de 600 componentes disponibles
Generador código Java
Basado en Jobs o Trabajos
Conociendo Talend
Ecosistema TOS: data integration, mdm, esb,
bigdata, etc
Distribuciones Communiy y Enterprise
Resultado final : sh y war
Conociendo Talend
Casos de Uso comunes
Migración de Datos
Intercambio de Ficheros entre sistemas
Sincronización de Datos
Conociendo Talend
Community vs Enterprise distribution
Entorno de trabajo colaborativo
Análisis del flujo de datos
Ayudas en la depuración
Exportación avanzada de documentación
Usos de Joblets
Soporte profesional
Las dos Grandes
Kettle
Pentaho Data Integration
Entorno de desarrollo escritorio (Spoon)
Basado en Java
Desarrollo ágil e intuitivo
Resultado final en ficheros XML (.kjb .ktr)
Basado en los conceptos de trabajos y
transformaciones
Kettle
Talend vs Kettle
CARACTERÍSTICA

Talend

Kettle

Funcionamiento

Generador de código
Java

Interprete Java

Facilidad de uso

Curva de aprendizaje
más empinada

Muy sencillo

Más restrictivo

Más libertad

Definición de esquemas

Documentación de apoyo

Componentes

Abundante

Más componentes

Menos Componentes
Talend vs Kettle
CARACTERÍSTICA
Velocidad de proceso

Plataformas

Talend

Kettle

Talend puede ser más rápido dependiendo de los
componentes utilizados.
SpagoBI
JasperServer

Pentaho
Trabajando con Talend
Jobs
Contextos
Metadata
Componentes
Ejemplo Práctico
OpenAnalytics - Taller de Talend 13/02/2014

OpenAnalytics - Taller de Talend 13/02/2014