SlideShare una empresa de Scribd logo
1 de 16
Descargar para leer sin conexión
UNIVERSIDAD MAYOR DE SAN SIMÓN
FACULTAD DE CIENCIAS Y TECNOLOGÍA
CARRERA DE INGENIERÍA DE SISTEMAS
INFORME
TRABAJO DE ANALISIS
DE DATOS HERRAMIENTA PENTAHO
INTEGRANTES:
Ayub Rodríguez Eduardo (Ing. de sistemas)
Granados Gutiérrez Alberto (Ing. de sistemas)
Loayza Semo Miguel Jorge (Ing. de sistemas)
Reque Zeballos Jenny (Ing. de sistemas)
MATERIA:
Bussines Intelligence - Big Data
DOCENTE:
Ing. Calancha Navia Boris Marcelo
2 - 2021
I. INTRODUCCIÓN
El presente desarrollo del tema está basado en la herramienta PENTAHO que permite
el análisis de datos, podemos mencionar que en el marco empresarial es de vital
importancia para la toma de decisiones que coadyuben de manera eficiente para que
la organización se siga superando.
Dentro del manejo de la herramienta Pentaho podemos mencionar algunas
características importantes para el desarrollo y análisis de la información
Si no se es rápido en la toma de decisiones o, peor aún, si no se toma ninguna decisión
ni acción por miedo, incertidumbre o indecisión, las empresas se verán superadas y se
encontrarán al borde del fracaso y la desaparición.
Lo positivo es que existen softwares y herramientas que nos ayudan a tomar mejores
decisiones, como es el caso de los Sistemas de Analítica Avanzada, en los cuales se
emplean tecnologías como el Big Data o el Business Intelligence que permiten analizar
los datos y la información existentes en una empresa.
De esta manera es que vamos a desarrollar el proyecto utilizando la herramienta de
análisis de datos PENTAHO el cual nos ayudará para la toma de decisiones que brinden
mayor superación a la organización.
II. DESARROLLO DEL TRABAJO
Tomando en cuenta la base que se entrega del proyecto por parte del docente, se
pasará a desarrollar diferentes etapas en las cuales se mostrará como es el manejo de
la herramienta para lograr analizar los datos para nuestra toma de decisiones:
Modelo de la base de datos:
1. En base al modelo anterior se realiza el proceso ETL con Pentaho, como se
muestra a continuación:
Teniendo en cuenta los puntos a desarrollar, vamos a empezar el trabajo
mostrando las diferentes etapas para hacer el proceso ETL, para ello debemos
tener realizado el modelo estrella donde se va a guardar nuestra información.
Modelo estrella
PASOS PARA REALIZAR EL PROCESO ETL CON PENTAHO
Paso 1: Iniciar los módulos Apache y MySQL
Aquí lo que vamos hacer es presionar sobre el botón admin para abrir en el navegador
Paso 2: Abrir el host local en el navegador
Paso 3: subir el modelo Estrella a la base de datos MARKET_DW
Una vez concluido todo este proceso lo que vamos hacer utilizar la herramienta pentaho
para realizar el ETL.
Abrir la herramienta de análisis de datos PENTAHO
vamos agregar los datos de entradas y salidas
TRABAJANDO CON LOS DATOS DE ENTRADA
Agregamos el archivo de entrada de datos de Access y la agregamos.
Obtenemos las tablas con el siguiente botón
Seleccionamos las tablas a utilizar de la lista que se despliega. Luego presionamos OK
Por ejemplo, seleccionamos la tabla ventas, y luego presionamos sobre el botón Get
tables
Mostramos los campos de la tabla ventas
Mostramos el contenido de la tabla ventas
Para terminar, presionamos sobre el botón OK
Concluido la entrada de datos y seleccionada las tablas a utilizar se tiene lista la entrada
de datos para el desarrollo y posterior proceso y salida de la información.
COMENZAMOS EL PROCESO DE TRANSFORMACION.
Aquí podemos observar el mapping del proceso para la transformación
Antes que todo vamos la conexión con la base de datos para ver que realmente funciona
Llenamos los datos para nuestra conexión, y presionamos sobre el botón test para la
verificación de nuestra conexión.
Podemos verificar que nuestra conexión está bien, presionamos sobre el botón OK, y de
la ventana principal también Ok para terminar nuestra conexión
SALIDA DE LOS DATOS
Una vez finalizada la configuración de salida ejecutamos para validar nuestra
transformación
Observamos que todo está bien, con eso concluye la transformación ETL
2. Primero, completar la tabla Ventas con el campo totalVenta que incluye el
cálculo de Kilos vendidos por el Precio de los Productos
(Ventas.Kilos*Productos.Precio) para todos los datos asociados en Ventas.
En esta etapa vamos a realizar el modelo estrella, completando los campos que
se nos pide en el trabajo, en este caso de la tabla ventas debemos tener el campo
TotalVenta,
Base de datos original.
Modelo estrella con el campo TotalVenta y los campos que se necesitan para la
solución.
3. Realizar el proceso ETL usando la herramienta spoon de Pentaho, para obtener
el Data Warehouse o Datamart) SupermercadoDW en MySQL
Verificamos nuestro gestor para ver que se han creado que nuestras tablas donde
se va almacenar nuestro Data Warehouse
4. Para obtener el DW MARKET_DW se debe modelar el modelo estrella que
involucre las dimensiones y hechos necesarios para responder las consultas:
Mostramos nuestro modelo estrella con los cuales resolveremos puntos que a
continuación se detallan para su análisis.
• Productos vendidos considerando las cantidades (kilos) y los
montos totales (totalVenta), asociando a las Fechas y los
Vendedores.
• Se lo considera y se mejorar el grado de granularidad de la
consulta incluyendo a los Grupos de Productos.
El proceso anterior se muestra en el esquema siguiente
encerrado en azul.
III. CONCLUSIONES
En conclusión, como se puede observar a lo largo del proyecto utilizando la
herramienta PENTAHO la cual manejamos para realizar el proceso ETL, decimos que
es una muy buena herramienta que ayuda en la obtención de diferentes data
werehouse.
Es en este sentido que la gran cantidad de datos que podemos tener la podemos
utilizar de buena manera haciendo una refinación de esta información obteniendo
los datos que realmente necesitamos, de esta manera podemos trabajar en ellos,
analizarlos y posteriormente tomar decisiones que nos ayude a seguir sobresaliendo
en el ámbito de trabajo empresarial.
Hacer el estudio de los diferentes datos de la información no pareciera importante,
pero es ahí donde muchos están equivocados, puesto que este es el punto mas
sobresaliente en la toma de decisiones que nos enfocará en mejoramiento de
nuestra empresa u organización.
Como hemos visto para ello es necesariamente importante conocer la base de datos
y crear un modelo estrella que nos permita tener las referencias necesarias y
correctas para la información que vamos a utilizar, es por ello que el modelo estrella
de nuestro proyecto involucra tablas y dimensiones muy importantes que nos
servirá para realizar el proceso de transformación obteniendo netamente lo que
vamos a utilizar.
Para el proyecto trabajamos con diferentes datos como son: los datos del vendedor,
su población, la cantidad de kilos que ha vendido, si es guapo o no lo es, el producto
que ha vendido, y todo esto lo hemos obtenido primero realizando nuestro modelo
estrella, y como observamos hemos logrado tener datos muy importantes en
nuestras tablas de salida como mostramos anteriormente.
Con esto PENTAHO es una muy potente herramienta para la creación de DATA
WEREHOUSE y creación de los procesos ETL que lo involucran en la obtención de la
información y refinamiento de las mismas.

Más contenido relacionado

Similar a INFORME PENTAHO Big data 2_2021.pdf

BUSINESS INTELIGENCE
BUSINESS INTELIGENCEBUSINESS INTELIGENCE
BUSINESS INTELIGENCEUNEMIGrupo6
 
BUSINESS INTELIGENCE
BUSINESS INTELIGENCEBUSINESS INTELIGENCE
BUSINESS INTELIGENCEUNEMIGrupo6
 
Paq estad757uptp grupop-estadistico
Paq estad757uptp grupop-estadisticoPaq estad757uptp grupop-estadistico
Paq estad757uptp grupop-estadisticoJoseMujica2015
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.docaldair441257
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfssuser9189ac1
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfssuser80cb03
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfGiancarlosLuisVilaCu
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfssuser80cb03
 
Triggers y Stored Procedures con MicroOLAP Database Designer
Triggers y Stored Procedures con MicroOLAP Database DesignerTriggers y Stored Procedures con MicroOLAP Database Designer
Triggers y Stored Procedures con MicroOLAP Database Designervictorsalas
 
Exposicion Business Intelligence
Exposicion Business IntelligenceExposicion Business Intelligence
Exposicion Business IntelligenceUNEMI
 
Diagrama de Pareto.pdf
Diagrama de Pareto.pdfDiagrama de Pareto.pdf
Diagrama de Pareto.pdfMaraJosPareja
 
Manual acceso a datos vb.net
Manual acceso a datos vb.netManual acceso a datos vb.net
Manual acceso a datos vb.netcedido
 
18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_biJose Antonio Perez Vega
 
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...Alex Lolol
 
Trabajo de tecnología
Trabajo de tecnología Trabajo de tecnología
Trabajo de tecnología leliluis09
 
Diagrama de pareto
Diagrama de paretoDiagrama de pareto
Diagrama de paretoJuliana BL
 

Similar a INFORME PENTAHO Big data 2_2021.pdf (20)

BUSINESS INTELIGENCE
BUSINESS INTELIGENCEBUSINESS INTELIGENCE
BUSINESS INTELIGENCE
 
BUSINESS INTELIGENCE
BUSINESS INTELIGENCEBUSINESS INTELIGENCE
BUSINESS INTELIGENCE
 
Paq estad757uptp grupop-estadistico
Paq estad757uptp grupop-estadisticoPaq estad757uptp grupop-estadistico
Paq estad757uptp grupop-estadistico
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
sistemas de informacion
sistemas de informacionsistemas de informacion
sistemas de informacion
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdf
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdf
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdf
 
Cómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdfCómo usar Excel para el marketing basado en datos.pdf
Cómo usar Excel para el marketing basado en datos.pdf
 
Triggers y Stored Procedures con MicroOLAP Database Designer
Triggers y Stored Procedures con MicroOLAP Database DesignerTriggers y Stored Procedures con MicroOLAP Database Designer
Triggers y Stored Procedures con MicroOLAP Database Designer
 
Exposicion Business Intelligence
Exposicion Business IntelligenceExposicion Business Intelligence
Exposicion Business Intelligence
 
Sin título.pdf
Sin título.pdfSin título.pdf
Sin título.pdf
 
Diagrama de Pareto.pdf
Diagrama de Pareto.pdfDiagrama de Pareto.pdf
Diagrama de Pareto.pdf
 
Diagrama de Pareto.pdf
Diagrama de Pareto.pdfDiagrama de Pareto.pdf
Diagrama de Pareto.pdf
 
Manual acceso a datos vb.net
Manual acceso a datos vb.netManual acceso a datos vb.net
Manual acceso a datos vb.net
 
18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi
 
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
 
STATA_-_tema_1[1].pptx
STATA_-_tema_1[1].pptxSTATA_-_tema_1[1].pptx
STATA_-_tema_1[1].pptx
 
Trabajo de tecnología
Trabajo de tecnología Trabajo de tecnología
Trabajo de tecnología
 
Diagrama de pareto
Diagrama de paretoDiagrama de pareto
Diagrama de pareto
 

Último

TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdfTECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdfUPSE
 
El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)Samuel Solís Fuentes
 
contabilidad para la inflacion, contabilidad superior
contabilidad para la inflacion, contabilidad superiorcontabilidad para la inflacion, contabilidad superior
contabilidad para la inflacion, contabilidad superiorDalia Rodriguez
 
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptxTECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptxUPSE
 
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptxCiberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptxcorreafrancoci00
 
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...juanforero141
 
Tipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdfTipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdfCarlosSanchez452245
 
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptxCIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptxalzabenjaminci00
 
Especificación casos de uso del negocio
Especificación  casos de uso del negocioEspecificación  casos de uso del negocio
Especificación casos de uso del negocioMagemyl Egana
 
Modelado de Casos de uso del negocio
Modelado de  Casos  de  uso  del negocioModelado de  Casos  de  uso  del negocio
Modelado de Casos de uso del negocioMagemyl Egana
 

Último (10)

TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdfTECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
 
El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)
 
contabilidad para la inflacion, contabilidad superior
contabilidad para la inflacion, contabilidad superiorcontabilidad para la inflacion, contabilidad superior
contabilidad para la inflacion, contabilidad superior
 
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptxTECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
 
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptxCiberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
 
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
 
Tipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdfTipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdf
 
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptxCIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptx
 
Especificación casos de uso del negocio
Especificación  casos de uso del negocioEspecificación  casos de uso del negocio
Especificación casos de uso del negocio
 
Modelado de Casos de uso del negocio
Modelado de  Casos  de  uso  del negocioModelado de  Casos  de  uso  del negocio
Modelado de Casos de uso del negocio
 

INFORME PENTAHO Big data 2_2021.pdf

  • 1. UNIVERSIDAD MAYOR DE SAN SIMÓN FACULTAD DE CIENCIAS Y TECNOLOGÍA CARRERA DE INGENIERÍA DE SISTEMAS INFORME TRABAJO DE ANALISIS DE DATOS HERRAMIENTA PENTAHO INTEGRANTES: Ayub Rodríguez Eduardo (Ing. de sistemas) Granados Gutiérrez Alberto (Ing. de sistemas) Loayza Semo Miguel Jorge (Ing. de sistemas) Reque Zeballos Jenny (Ing. de sistemas) MATERIA: Bussines Intelligence - Big Data DOCENTE: Ing. Calancha Navia Boris Marcelo 2 - 2021
  • 2. I. INTRODUCCIÓN El presente desarrollo del tema está basado en la herramienta PENTAHO que permite el análisis de datos, podemos mencionar que en el marco empresarial es de vital importancia para la toma de decisiones que coadyuben de manera eficiente para que la organización se siga superando. Dentro del manejo de la herramienta Pentaho podemos mencionar algunas características importantes para el desarrollo y análisis de la información Si no se es rápido en la toma de decisiones o, peor aún, si no se toma ninguna decisión ni acción por miedo, incertidumbre o indecisión, las empresas se verán superadas y se encontrarán al borde del fracaso y la desaparición. Lo positivo es que existen softwares y herramientas que nos ayudan a tomar mejores decisiones, como es el caso de los Sistemas de Analítica Avanzada, en los cuales se emplean tecnologías como el Big Data o el Business Intelligence que permiten analizar los datos y la información existentes en una empresa. De esta manera es que vamos a desarrollar el proyecto utilizando la herramienta de análisis de datos PENTAHO el cual nos ayudará para la toma de decisiones que brinden mayor superación a la organización. II. DESARROLLO DEL TRABAJO Tomando en cuenta la base que se entrega del proyecto por parte del docente, se pasará a desarrollar diferentes etapas en las cuales se mostrará como es el manejo de la herramienta para lograr analizar los datos para nuestra toma de decisiones: Modelo de la base de datos:
  • 3. 1. En base al modelo anterior se realiza el proceso ETL con Pentaho, como se muestra a continuación: Teniendo en cuenta los puntos a desarrollar, vamos a empezar el trabajo mostrando las diferentes etapas para hacer el proceso ETL, para ello debemos tener realizado el modelo estrella donde se va a guardar nuestra información. Modelo estrella PASOS PARA REALIZAR EL PROCESO ETL CON PENTAHO
  • 4. Paso 1: Iniciar los módulos Apache y MySQL Aquí lo que vamos hacer es presionar sobre el botón admin para abrir en el navegador Paso 2: Abrir el host local en el navegador
  • 5. Paso 3: subir el modelo Estrella a la base de datos MARKET_DW Una vez concluido todo este proceso lo que vamos hacer utilizar la herramienta pentaho para realizar el ETL. Abrir la herramienta de análisis de datos PENTAHO
  • 6. vamos agregar los datos de entradas y salidas TRABAJANDO CON LOS DATOS DE ENTRADA Agregamos el archivo de entrada de datos de Access y la agregamos. Obtenemos las tablas con el siguiente botón Seleccionamos las tablas a utilizar de la lista que se despliega. Luego presionamos OK
  • 7. Por ejemplo, seleccionamos la tabla ventas, y luego presionamos sobre el botón Get tables Mostramos los campos de la tabla ventas Mostramos el contenido de la tabla ventas
  • 8. Para terminar, presionamos sobre el botón OK Concluido la entrada de datos y seleccionada las tablas a utilizar se tiene lista la entrada de datos para el desarrollo y posterior proceso y salida de la información. COMENZAMOS EL PROCESO DE TRANSFORMACION. Aquí podemos observar el mapping del proceso para la transformación
  • 9. Antes que todo vamos la conexión con la base de datos para ver que realmente funciona Llenamos los datos para nuestra conexión, y presionamos sobre el botón test para la verificación de nuestra conexión. Podemos verificar que nuestra conexión está bien, presionamos sobre el botón OK, y de la ventana principal también Ok para terminar nuestra conexión
  • 10. SALIDA DE LOS DATOS Una vez finalizada la configuración de salida ejecutamos para validar nuestra transformación Observamos que todo está bien, con eso concluye la transformación ETL 2. Primero, completar la tabla Ventas con el campo totalVenta que incluye el cálculo de Kilos vendidos por el Precio de los Productos (Ventas.Kilos*Productos.Precio) para todos los datos asociados en Ventas. En esta etapa vamos a realizar el modelo estrella, completando los campos que se nos pide en el trabajo, en este caso de la tabla ventas debemos tener el campo TotalVenta,
  • 11. Base de datos original. Modelo estrella con el campo TotalVenta y los campos que se necesitan para la solución. 3. Realizar el proceso ETL usando la herramienta spoon de Pentaho, para obtener el Data Warehouse o Datamart) SupermercadoDW en MySQL Verificamos nuestro gestor para ver que se han creado que nuestras tablas donde se va almacenar nuestro Data Warehouse
  • 12. 4. Para obtener el DW MARKET_DW se debe modelar el modelo estrella que involucre las dimensiones y hechos necesarios para responder las consultas: Mostramos nuestro modelo estrella con los cuales resolveremos puntos que a continuación se detallan para su análisis.
  • 13. • Productos vendidos considerando las cantidades (kilos) y los montos totales (totalVenta), asociando a las Fechas y los Vendedores.
  • 14. • Se lo considera y se mejorar el grado de granularidad de la consulta incluyendo a los Grupos de Productos. El proceso anterior se muestra en el esquema siguiente encerrado en azul.
  • 15. III. CONCLUSIONES En conclusión, como se puede observar a lo largo del proyecto utilizando la herramienta PENTAHO la cual manejamos para realizar el proceso ETL, decimos que es una muy buena herramienta que ayuda en la obtención de diferentes data werehouse. Es en este sentido que la gran cantidad de datos que podemos tener la podemos utilizar de buena manera haciendo una refinación de esta información obteniendo los datos que realmente necesitamos, de esta manera podemos trabajar en ellos, analizarlos y posteriormente tomar decisiones que nos ayude a seguir sobresaliendo en el ámbito de trabajo empresarial. Hacer el estudio de los diferentes datos de la información no pareciera importante, pero es ahí donde muchos están equivocados, puesto que este es el punto mas sobresaliente en la toma de decisiones que nos enfocará en mejoramiento de nuestra empresa u organización. Como hemos visto para ello es necesariamente importante conocer la base de datos y crear un modelo estrella que nos permita tener las referencias necesarias y correctas para la información que vamos a utilizar, es por ello que el modelo estrella de nuestro proyecto involucra tablas y dimensiones muy importantes que nos servirá para realizar el proceso de transformación obteniendo netamente lo que vamos a utilizar. Para el proyecto trabajamos con diferentes datos como son: los datos del vendedor, su población, la cantidad de kilos que ha vendido, si es guapo o no lo es, el producto que ha vendido, y todo esto lo hemos obtenido primero realizando nuestro modelo estrella, y como observamos hemos logrado tener datos muy importantes en nuestras tablas de salida como mostramos anteriormente.
  • 16. Con esto PENTAHO es una muy potente herramienta para la creación de DATA WEREHOUSE y creación de los procesos ETL que lo involucran en la obtención de la información y refinamiento de las mismas.