SlideShare una empresa de Scribd logo
1 de 9
Descargar para leer sin conexión
CASO PRÁCTICO
Para nuestro caso práctico en este trabajo de investigación, utilizaremos Pentaho Data
Integrator para realizar el proceso ETL como fuente un archivo plano y como destino una base
de datos (que simule un Data Warehouse) en MySQL.
Como vemos nuestra base de datos esta vacia (No contiene Tablas)
Para iniciar necesitamos crear una base de datos ya sea en SQL SERVER y MySQL u otro.
A. EXTRACION
1. Iniciamos P D I (Pentaho Data Integrator) y creamos una nueva transformación
(Tranformacion1)
2. Creamos una nueva conexión en Conexiones a Base de Datos
Ingresamos los datos de nuestro servidor de MySQL (nombre de la maquina, usurio y
contraseña, base de datos a la cual conectarse y probamos la conexión.
En caso de no conectar por algún error probar los conectores de DBMs.
3. En la pestaña de DISEÑO vamos a escribir Excel (Para seleccionar archivo fuente Excel
Y procedemos a editar para seleccionas qué libros (tablas) vamos a transformar y
cargar.
4. Para nuestro caso escogeremos un arcivo Excel (Sucursales.xlsx) y procedemos a
añadir (en a pestaña de Ficheros)
En la pestaña de Hojas seleccionas las hojas que será nuestras tablas en este caso (TSUCURSAL)
En la pestaña de Contenido debe estar los check box de la siguiente manera
Y en la pestaña Campos seleccionamos en obtener campos y tendremos:
Pre visualizamos el archivo (las primeras 1000) filas
Y sabremos que si funciona el cargado.
B. TRANSFORMACION
5. Para la transformación usamos un componente que se llama Seleccionar valor que
permite configurar los tipos de valores de los campos así como los nombres de los
mismos campos, con la opción de omitir campos que no se necesitaran.
Y configuramos ende a al que necesitamos para cumplir los requerimientos establecidos.
Renombraos los campos
Eliminamos campos que no deseamos (esto funcionaria para eliminar campos que no infieren
en nada de nuestra solución BI)
Configuramos el cambio que haremos en la estructura de los datos de nuestro origen:
Nota: en estas opciones debemos cargar los campos que deseamos y eliminamos con
(DEL/SUP) los que no interesan.
C. CARGA o LOAD
6. Para la carga seleccionamos el objeto de Salida Tabla
Procedemos a editar esta sección creando la tabla T_SUCURSAL y con la conexión que
realizamos al inicio.
Obtendremos los nombres de los campos ya cambiados en el proceso de
Transformación
Escogemos SQL para ver si se realiza la creación de la tabla.
Y ejecutamos
Notamos que solo hay 9 campos de los 10 pues como el primer campo es secuencial no se
cambiara de tipo de dato.
7. Ahora su ejecutamos nuestro proceso ETL
8. Verificamos que todo ejecute correctamente y los resultados los veremos en MySQL

Más contenido relacionado

Similar a Caso práctico etl pentaho my sql

Similar a Caso práctico etl pentaho my sql (20)

Primeros pasos con Talent Open Studio TOS : Importando datos
Primeros pasos con Talent Open Studio TOS : Importando datosPrimeros pasos con Talent Open Studio TOS : Importando datos
Primeros pasos con Talent Open Studio TOS : Importando datos
 
Proyecto De Aplicacion A La Bases Datos
Proyecto De Aplicacion A La Bases DatosProyecto De Aplicacion A La Bases Datos
Proyecto De Aplicacion A La Bases Datos
 
scribd.vpdfs.com_sql-server-tutorial.pdf
scribd.vpdfs.com_sql-server-tutorial.pdfscribd.vpdfs.com_sql-server-tutorial.pdf
scribd.vpdfs.com_sql-server-tutorial.pdf
 
SENTENCIAS DE SQL SERVER
SENTENCIAS DE SQL SERVERSENTENCIAS DE SQL SERVER
SENTENCIAS DE SQL SERVER
 
Universidad politecnica amazonica
Universidad politecnica amazonicaUniversidad politecnica amazonica
Universidad politecnica amazonica
 
Implementacion de bases de datos en mysql
Implementacion de bases de datos en mysqlImplementacion de bases de datos en mysql
Implementacion de bases de datos en mysql
 
SQL-BYRON-COBO
SQL-BYRON-COBOSQL-BYRON-COBO
SQL-BYRON-COBO
 
Access Clase 02
Access Clase 02Access Clase 02
Access Clase 02
 
Expo
ExpoExpo
Expo
 
lenguaje transact
lenguaje transactlenguaje transact
lenguaje transact
 
lenguaje transact
lenguaje transactlenguaje transact
lenguaje transact
 
2. ssis 2008 r2
2. ssis 2008 r22. ssis 2008 r2
2. ssis 2008 r2
 
Unidad DidáCtica V Sql Interactivo
Unidad DidáCtica V Sql InteractivoUnidad DidáCtica V Sql Interactivo
Unidad DidáCtica V Sql Interactivo
 
Slideshare
SlideshareSlideshare
Slideshare
 
Control jtable con base de datos
Control jtable con base de datosControl jtable con base de datos
Control jtable con base de datos
 
SQL Visual Basic 6.0
SQL Visual Basic 6.0SQL Visual Basic 6.0
SQL Visual Basic 6.0
 
Control JTable con base de datos
Control JTable con base de datosControl JTable con base de datos
Control JTable con base de datos
 
Clase 2 El lenguaje DDL de SQL
Clase 2 El lenguaje DDL de SQLClase 2 El lenguaje DDL de SQL
Clase 2 El lenguaje DDL de SQL
 
LABORATORIO DE PROGRAMACIÓN I.
LABORATORIO DE PROGRAMACIÓN I.LABORATORIO DE PROGRAMACIÓN I.
LABORATORIO DE PROGRAMACIÓN I.
 
Lenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-proLenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-pro
 

Último

celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicaFlor Idalia Espinoza Ortega
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoFundación YOD YOD
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuaDANNYISAACCARVAJALGA
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxPryhaSalam
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 

Último (20)

celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamica
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativo
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
Repaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia GeneralRepaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia General
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahua
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 

Caso práctico etl pentaho my sql

  • 1. CASO PRÁCTICO Para nuestro caso práctico en este trabajo de investigación, utilizaremos Pentaho Data Integrator para realizar el proceso ETL como fuente un archivo plano y como destino una base de datos (que simule un Data Warehouse) en MySQL. Como vemos nuestra base de datos esta vacia (No contiene Tablas) Para iniciar necesitamos crear una base de datos ya sea en SQL SERVER y MySQL u otro. A. EXTRACION 1. Iniciamos P D I (Pentaho Data Integrator) y creamos una nueva transformación (Tranformacion1)
  • 2. 2. Creamos una nueva conexión en Conexiones a Base de Datos Ingresamos los datos de nuestro servidor de MySQL (nombre de la maquina, usurio y contraseña, base de datos a la cual conectarse y probamos la conexión. En caso de no conectar por algún error probar los conectores de DBMs. 3. En la pestaña de DISEÑO vamos a escribir Excel (Para seleccionar archivo fuente Excel Y procedemos a editar para seleccionas qué libros (tablas) vamos a transformar y cargar.
  • 3. 4. Para nuestro caso escogeremos un arcivo Excel (Sucursales.xlsx) y procedemos a añadir (en a pestaña de Ficheros) En la pestaña de Hojas seleccionas las hojas que será nuestras tablas en este caso (TSUCURSAL)
  • 4. En la pestaña de Contenido debe estar los check box de la siguiente manera Y en la pestaña Campos seleccionamos en obtener campos y tendremos: Pre visualizamos el archivo (las primeras 1000) filas
  • 5. Y sabremos que si funciona el cargado. B. TRANSFORMACION 5. Para la transformación usamos un componente que se llama Seleccionar valor que permite configurar los tipos de valores de los campos así como los nombres de los mismos campos, con la opción de omitir campos que no se necesitaran. Y configuramos ende a al que necesitamos para cumplir los requerimientos establecidos. Renombraos los campos Eliminamos campos que no deseamos (esto funcionaria para eliminar campos que no infieren en nada de nuestra solución BI)
  • 6. Configuramos el cambio que haremos en la estructura de los datos de nuestro origen: Nota: en estas opciones debemos cargar los campos que deseamos y eliminamos con (DEL/SUP) los que no interesan.
  • 7. C. CARGA o LOAD 6. Para la carga seleccionamos el objeto de Salida Tabla Procedemos a editar esta sección creando la tabla T_SUCURSAL y con la conexión que realizamos al inicio. Obtendremos los nombres de los campos ya cambiados en el proceso de Transformación
  • 8. Escogemos SQL para ver si se realiza la creación de la tabla. Y ejecutamos Notamos que solo hay 9 campos de los 10 pues como el primer campo es secuencial no se cambiara de tipo de dato. 7. Ahora su ejecutamos nuestro proceso ETL
  • 9. 8. Verificamos que todo ejecute correctamente y los resultados los veremos en MySQL