SlideShare una empresa de Scribd logo
1 de 41
Talend Open Studio
Alejandro Alberca Manzaneque
Índice
 Introducción
 ETL
 Características
 Conceptos
 Jobs
 Componentes más importantes
 Algunos ejemplos
Índice
 Introducción
 ETL
 Características
 Conceptos
 Jobs
 Componentes más importantes
 Algunos ejemplos
Índice
 Introducción
 ETL
 Características
 Conceptos
 Jobs
 Componentes más importantes
 Algunos ejemplos
Características
 Herramienta GPL basada en Eclipse para la
gestión y la integración de datos.
 Basada en la programación por componentes
 Desarrollo principalmente gráfico
 Amplia gama de componentes y conectores
 Permite parametrizar los datos usados mediante
Metadatos y Contextos.
 Versionado de elementos
 Depuración del código generado
Índice
 Introducción
 ETL
 Características
 Conceptos
 Jobs
 Componentes más importantes
 Algunos ejemplos
Conceptos (I)
 Proyecto o Workspace: el espacio de trabajo
en el que se agrupan el resto de elementos. Se
usará un proyecto / Workspace para cada
aplicación: ARP, GINCO, CHORUS, etc.
 Business Models: modelos teóricos del
negocio. En el MCC no lo vamos a usar.
 Jobs: procesos de transformación de datos con
los que vamos a trabajar principalmente.
Conceptos (II)
 Componentes: son las subtareas que forman
los Jobs. Se comunican entre ellos mediante
conectores.
 Contextos: son agrupaciones de variables
globales del proyecto.
 Rutinas: son fragmentos de código escritos en
Java que son usados para realizar acciones
sobre los datos no contempladas en la
funcionalidad de los componentes.
Conceptos (III)
 Plantillas SQL: plantillas de consultas escritas
con SQL y Java con sintaxis parecida a la de
JSP.
 Ejemplo de plantilla SQL (OracleFilterRow):
<%
EXTRACT(__SCHEMA__);
EXTRACT(__SCHEMA_TARGET__);
%>
INSERT INTO <%=__TABLE_NAME_TARGET__%> (<%=
StringUtils.list(__SCHEMA_TARGET_NAME__, ",") %>)
SELECT <%= StringUtils.list(__SCHEMA_NAME__, ",") %> FROM <%=
__TABLE_NAME__ %>
WHERE <%=__WHERE_CLAUSE__%>;
Conceptos (IV)
 Metadatos: en ellos se guardan y pueden ser
reutilizados en Jobs y componentes:
 Conexiones de bases de datos
 Esquemas de bases de datos
 Ficheros de todo tipo (XML, CSV, Excel,
Posicionales, mediante expresiones regulares, etc.)
 Servicios web
 Conexiones FTP, LDAP, etc.
Conceptos (V)
 Documentación: en este apartado se pueden
almacenar documentos y ficheros relacionados
con el proyecto.
Conceptos (VI)
 Papelera de reciclaje (recycle bin): si se borra
un Job, un elemento del repositorio, contexto,
etc. se manda a la papelera de reciclaje antes
de poder ser borrado de forma definitiva.
Conceptos (VII)
Índice
 Introducción
 ETL
 Características
 Conceptos
 Jobs
 Componentes más importantes
 Algunos ejemplos
Jobs (I)
 Son los procesos que realizan las
transformaciones de los datos.
 Están definidos por la composición y las
relaciones entre los componentes que los
forman.
 Para desarrollar un Job lo que hay que hacer es
básicamente agregarle componentes,
comunicarlos entre ellos y configurarlos.
Jobs (II)
 Ejemplo de Job sencillo:
 Se lee de un fichero XML
 Se guarda el contenido con otro formato en otro
fichero XML
<movies>
<movie>
<title>A History of Violence</title>
<year>2005</year>
<country>USA</country>
<genre>Crime</genre>
<summary>Tom Stall, a humble family man and owner of a
popular neighborhood restaurant, lives a quiet but
fulfilling existence … SPOILERS NO!
</summary>
</movie>
….
Jobs (III)
 Ejemplo de Job sencillo:
 Se transforma el formato anterior en el siguiente:
<peliculas>
<pelicula>
<titulo>A History of Violence</titulo>
<año>2005</año>
<pais>USA</pais>
<genero>Crime</genero>
</pelicula>
Jobs (IV)
Esquema de entrada:
Jobs (V)
Esquema de salida:
Jobs (VI)
Resultado de la ejecución en la Consola:
Jobs (VII)
Los Jobs de Talend pueden depurarse como una aplicación
Java pulsando la opción “Java Debug” :
Jobs (VIII)
Ejemplo del Job en la perspectiva de depuración:
Jobs (IX)
Los datos de los Jobs también pueden depurarse pulsando la opción
“Traces Debug” para mostrar los datos conforme se vayan procesando:
Jobs (X)
Si algún componente tuviera alguna señal de error o de warning, estos
errores/advertencias se pueden consultar en la pestaña “Problems” así
como en la pestaña “Code” si el error/warning estuviera en el código
fuente
Índice
 Introducción
 ETL
 Características
 Conceptos
 Jobs
 Componentes más importantes
 Algunos ejemplos
Componentes más importantes
 Los Componentes son las “subtareas” que se
realizan dentro de un Job.
 Todos los Componentes de la aplicación se
encuentran en la Paleta de Componentes a la
derecha de la aplicación.
Componentes más importantes
 Se puede localizar un componente escribiendo
el texto en el campo ‘find component…’ para
que aparezcan todos los componentes cuyo
nombre sea similar al valor especificado.
Componentes más importantes
 tMessageBox
Componentes más importantes
 tPrejob y tPostjob
Componentes más importantes
 tRowGenerator
Componentes más importantes
 tFilterRow
Componentes más importantes
 tWarn
Componentes más importantes
 tLogCatcher
 Si en un Job se añaden componentes ‘tWarn’ pero no
se añade un tLogCatcher, no se mostrarán los logs
por consola.
Componentes más importantes
 tDie
 Escribe en el log, pero no mata el proceso, salvo que
se especifique de forma explícita.
Componentes más importantes
 tAggregateRow
 Sirve para obtener valores agrupados. Es decir,
valores obtenidos de la agrupación de alguno de los
valores de entrada (suma, media, máximo, mínimo,
etc.)
Componentes más importantes
 tSortRow
 Sirve para ordenar los registros mediante los valores
de determinadas columnas.
Componentes más importantes
 tMap (I)
 Componente para unificar los registros
correspondientes a varias fuentes de datos.
 Ejemplo. Supongamos las siguientes dos fuentes de
datos:
Componentes más importantes
 tMap (II)
Componentes más importantes
 tMap (III)
Índice
 Introducción
 ETL
 Características
 Conceptos
 Jobs
 Componentes más importantes
 Algunos ejemplos
Gracias por vuestra atención

Más contenido relacionado

Similar a Charla Talend Open Studio

CREACION DE DLL Y USO (Ejemplo desarrollado)
CREACION DE DLL Y USO (Ejemplo desarrollado)CREACION DE DLL Y USO (Ejemplo desarrollado)
CREACION DE DLL Y USO (Ejemplo desarrollado)Darwin Durand
 
Elementos básicos de un lenguaje de alto nivel
Elementos básicos de un lenguaje de alto nivelElementos básicos de un lenguaje de alto nivel
Elementos básicos de un lenguaje de alto nivelRicardo Axel
 
12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)
12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)
12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)Luis Fernando Aguas Bucheli
 
Elementos basicos c
Elementos basicos cElementos basicos c
Elementos basicos cJuan Torres
 
C++ BUILDER APUNTES .pdf
C++ BUILDER APUNTES .pdfC++ BUILDER APUNTES .pdf
C++ BUILDER APUNTES .pdfkabern
 
Diapositivs~Elementos_basicos_C.pdf
Diapositivs~Elementos_basicos_C.pdfDiapositivs~Elementos_basicos_C.pdf
Diapositivs~Elementos_basicos_C.pdfFtimaAF
 
Periodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open SourcePeriodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open SourceStratebi
 
Elementos basicos cpp_oto2014
Elementos basicos cpp_oto2014Elementos basicos cpp_oto2014
Elementos basicos cpp_oto2014joshram
 
05introduccionhtml 100901142734-phpapp02
05introduccionhtml 100901142734-phpapp0205introduccionhtml 100901142734-phpapp02
05introduccionhtml 100901142734-phpapp02SoftArt2014
 
ModeladoETL.pdf
ModeladoETL.pdfModeladoETL.pdf
ModeladoETL.pdfVAOC1984
 
Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)
Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)
Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)YESSICA GUERRERO
 
Proveedores nativos
Proveedores nativosProveedores nativos
Proveedores nativosJosue Perez
 
Sesión5 applets
Sesión5 appletsSesión5 applets
Sesión5 appletsUniversidad
 

Similar a Charla Talend Open Studio (20)

Frameworks de templates y xml
Frameworks de templates y xmlFrameworks de templates y xml
Frameworks de templates y xml
 
CREACION DE DLL Y USO (Ejemplo desarrollado)
CREACION DE DLL Y USO (Ejemplo desarrollado)CREACION DE DLL Y USO (Ejemplo desarrollado)
CREACION DE DLL Y USO (Ejemplo desarrollado)
 
Elementos básicos de un lenguaje de alto nivel
Elementos básicos de un lenguaje de alto nivelElementos básicos de un lenguaje de alto nivel
Elementos básicos de un lenguaje de alto nivel
 
12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)
12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)
12-Unidad 2: Aplicaciones Windows Form-2.3: Acceso a datos ADO.NET (ejemplos)
 
Hora 12
Hora 12Hora 12
Hora 12
 
El programa de marcacióny sus cambios - Equipo Producción SciELO Brasil
El programa de marcacióny sus cambios - Equipo Producción SciELO BrasilEl programa de marcacióny sus cambios - Equipo Producción SciELO Brasil
El programa de marcacióny sus cambios - Equipo Producción SciELO Brasil
 
sesion 01- HTML5
sesion 01- HTML5sesion 01- HTML5
sesion 01- HTML5
 
Elementos basicos c
Elementos basicos cElementos basicos c
Elementos basicos c
 
Programacion orientada a objetos Java
Programacion orientada a objetos JavaProgramacion orientada a objetos Java
Programacion orientada a objetos Java
 
C++ BUILDER APUNTES .pdf
C++ BUILDER APUNTES .pdfC++ BUILDER APUNTES .pdf
C++ BUILDER APUNTES .pdf
 
Diapositivs~Elementos_basicos_C.pdf
Diapositivs~Elementos_basicos_C.pdfDiapositivs~Elementos_basicos_C.pdf
Diapositivs~Elementos_basicos_C.pdf
 
Periodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open SourcePeriodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open Source
 
Elementosbasicosc
Elementosbasicosc Elementosbasicosc
Elementosbasicosc
 
Elementos basicos cpp_oto2014
Elementos basicos cpp_oto2014Elementos basicos cpp_oto2014
Elementos basicos cpp_oto2014
 
05introduccionhtml 100901142734-phpapp02
05introduccionhtml 100901142734-phpapp0205introduccionhtml 100901142734-phpapp02
05introduccionhtml 100901142734-phpapp02
 
ModeladoETL.pdf
ModeladoETL.pdfModeladoETL.pdf
ModeladoETL.pdf
 
Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)
Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)
Dialnet tecnicas demodeladodeprocesosdeetl-unarevisiondealte-4271531 (1)
 
Proveedores nativos
Proveedores nativosProveedores nativos
Proveedores nativos
 
Sesión5 applets
Sesión5 appletsSesión5 applets
Sesión5 applets
 
REPORTES
REPORTESREPORTES
REPORTES
 

Último

SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdfAnaBelindaArmellonHi
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 

Último (20)

SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 

Charla Talend Open Studio

  • 1. Talend Open Studio Alejandro Alberca Manzaneque
  • 2. Índice  Introducción  ETL  Características  Conceptos  Jobs  Componentes más importantes  Algunos ejemplos
  • 3. Índice  Introducción  ETL  Características  Conceptos  Jobs  Componentes más importantes  Algunos ejemplos
  • 4. Índice  Introducción  ETL  Características  Conceptos  Jobs  Componentes más importantes  Algunos ejemplos
  • 5. Características  Herramienta GPL basada en Eclipse para la gestión y la integración de datos.  Basada en la programación por componentes  Desarrollo principalmente gráfico  Amplia gama de componentes y conectores  Permite parametrizar los datos usados mediante Metadatos y Contextos.  Versionado de elementos  Depuración del código generado
  • 6. Índice  Introducción  ETL  Características  Conceptos  Jobs  Componentes más importantes  Algunos ejemplos
  • 7. Conceptos (I)  Proyecto o Workspace: el espacio de trabajo en el que se agrupan el resto de elementos. Se usará un proyecto / Workspace para cada aplicación: ARP, GINCO, CHORUS, etc.  Business Models: modelos teóricos del negocio. En el MCC no lo vamos a usar.  Jobs: procesos de transformación de datos con los que vamos a trabajar principalmente.
  • 8. Conceptos (II)  Componentes: son las subtareas que forman los Jobs. Se comunican entre ellos mediante conectores.  Contextos: son agrupaciones de variables globales del proyecto.  Rutinas: son fragmentos de código escritos en Java que son usados para realizar acciones sobre los datos no contempladas en la funcionalidad de los componentes.
  • 9. Conceptos (III)  Plantillas SQL: plantillas de consultas escritas con SQL y Java con sintaxis parecida a la de JSP.  Ejemplo de plantilla SQL (OracleFilterRow): <% EXTRACT(__SCHEMA__); EXTRACT(__SCHEMA_TARGET__); %> INSERT INTO <%=__TABLE_NAME_TARGET__%> (<%= StringUtils.list(__SCHEMA_TARGET_NAME__, ",") %>) SELECT <%= StringUtils.list(__SCHEMA_NAME__, ",") %> FROM <%= __TABLE_NAME__ %> WHERE <%=__WHERE_CLAUSE__%>;
  • 10. Conceptos (IV)  Metadatos: en ellos se guardan y pueden ser reutilizados en Jobs y componentes:  Conexiones de bases de datos  Esquemas de bases de datos  Ficheros de todo tipo (XML, CSV, Excel, Posicionales, mediante expresiones regulares, etc.)  Servicios web  Conexiones FTP, LDAP, etc.
  • 11. Conceptos (V)  Documentación: en este apartado se pueden almacenar documentos y ficheros relacionados con el proyecto.
  • 12. Conceptos (VI)  Papelera de reciclaje (recycle bin): si se borra un Job, un elemento del repositorio, contexto, etc. se manda a la papelera de reciclaje antes de poder ser borrado de forma definitiva.
  • 14. Índice  Introducción  ETL  Características  Conceptos  Jobs  Componentes más importantes  Algunos ejemplos
  • 15. Jobs (I)  Son los procesos que realizan las transformaciones de los datos.  Están definidos por la composición y las relaciones entre los componentes que los forman.  Para desarrollar un Job lo que hay que hacer es básicamente agregarle componentes, comunicarlos entre ellos y configurarlos.
  • 16. Jobs (II)  Ejemplo de Job sencillo:  Se lee de un fichero XML  Se guarda el contenido con otro formato en otro fichero XML <movies> <movie> <title>A History of Violence</title> <year>2005</year> <country>USA</country> <genre>Crime</genre> <summary>Tom Stall, a humble family man and owner of a popular neighborhood restaurant, lives a quiet but fulfilling existence … SPOILERS NO! </summary> </movie> ….
  • 17. Jobs (III)  Ejemplo de Job sencillo:  Se transforma el formato anterior en el siguiente: <peliculas> <pelicula> <titulo>A History of Violence</titulo> <año>2005</año> <pais>USA</pais> <genero>Crime</genero> </pelicula>
  • 20. Jobs (VI) Resultado de la ejecución en la Consola:
  • 21. Jobs (VII) Los Jobs de Talend pueden depurarse como una aplicación Java pulsando la opción “Java Debug” :
  • 22. Jobs (VIII) Ejemplo del Job en la perspectiva de depuración:
  • 23. Jobs (IX) Los datos de los Jobs también pueden depurarse pulsando la opción “Traces Debug” para mostrar los datos conforme se vayan procesando:
  • 24. Jobs (X) Si algún componente tuviera alguna señal de error o de warning, estos errores/advertencias se pueden consultar en la pestaña “Problems” así como en la pestaña “Code” si el error/warning estuviera en el código fuente
  • 25. Índice  Introducción  ETL  Características  Conceptos  Jobs  Componentes más importantes  Algunos ejemplos
  • 26. Componentes más importantes  Los Componentes son las “subtareas” que se realizan dentro de un Job.  Todos los Componentes de la aplicación se encuentran en la Paleta de Componentes a la derecha de la aplicación.
  • 27. Componentes más importantes  Se puede localizar un componente escribiendo el texto en el campo ‘find component…’ para que aparezcan todos los componentes cuyo nombre sea similar al valor especificado.
  • 29. Componentes más importantes  tPrejob y tPostjob
  • 33. Componentes más importantes  tLogCatcher  Si en un Job se añaden componentes ‘tWarn’ pero no se añade un tLogCatcher, no se mostrarán los logs por consola.
  • 34. Componentes más importantes  tDie  Escribe en el log, pero no mata el proceso, salvo que se especifique de forma explícita.
  • 35. Componentes más importantes  tAggregateRow  Sirve para obtener valores agrupados. Es decir, valores obtenidos de la agrupación de alguno de los valores de entrada (suma, media, máximo, mínimo, etc.)
  • 36. Componentes más importantes  tSortRow  Sirve para ordenar los registros mediante los valores de determinadas columnas.
  • 37. Componentes más importantes  tMap (I)  Componente para unificar los registros correspondientes a varias fuentes de datos.  Ejemplo. Supongamos las siguientes dos fuentes de datos:
  • 40. Índice  Introducción  ETL  Características  Conceptos  Jobs  Componentes más importantes  Algunos ejemplos
  • 41. Gracias por vuestra atención