1. UNIVERSIDAD MAYOR DE SAN SIMÓN
FACULTAD DE CIENCIAS Y TECNOLOGÍA
CARRERA DE INGENIERÍA DE SISTEMAS
INFORME
TRABAJO DE ANALISIS
DE DATOS HERRAMIENTA PENTAHO
INTEGRANTES:
Ayub Rodríguez Eduardo (Ing. de sistemas)
Granados Gutiérrez Alberto (Ing. de sistemas)
Loayza Semo Miguel Jorge (Ing. de sistemas)
Reque Zeballos Jenny (Ing. de sistemas)
MATERIA:
Bussines Intelligence - Big Data
DOCENTE:
Ing. Calancha Navia Boris Marcelo
2 - 2021
2. I. INTRODUCCIÓN
El presente desarrollo del tema está basado en la herramienta PENTAHO que permite
el análisis de datos, podemos mencionar que en el marco empresarial es de vital
importancia para la toma de decisiones que coadyuben de manera eficiente para que
la organización se siga superando.
Dentro del manejo de la herramienta Pentaho podemos mencionar algunas
características importantes para el desarrollo y análisis de la información
Si no se es rápido en la toma de decisiones o, peor aún, si no se toma ninguna decisión
ni acción por miedo, incertidumbre o indecisión, las empresas se verán superadas y se
encontrarán al borde del fracaso y la desaparición.
Lo positivo es que existen softwares y herramientas que nos ayudan a tomar mejores
decisiones, como es el caso de los Sistemas de Analítica Avanzada, en los cuales se
emplean tecnologías como el Big Data o el Business Intelligence que permiten analizar
los datos y la información existentes en una empresa.
De esta manera es que vamos a desarrollar el proyecto utilizando la herramienta de
análisis de datos PENTAHO el cual nos ayudará para la toma de decisiones que brinden
mayor superación a la organización.
II. DESARROLLO DEL TRABAJO
Tomando en cuenta la base que se entrega del proyecto por parte del docente, se
pasará a desarrollar diferentes etapas en las cuales se mostrará como es el manejo de
la herramienta para lograr analizar los datos para nuestra toma de decisiones:
Modelo de la base de datos:
3. 1. En base al modelo anterior se realiza el proceso ETL con Pentaho, como se
muestra a continuación:
Teniendo en cuenta los puntos a desarrollar, vamos a empezar el trabajo
mostrando las diferentes etapas para hacer el proceso ETL, para ello debemos
tener realizado el modelo estrella donde se va a guardar nuestra información.
Modelo estrella
PASOS PARA REALIZAR EL PROCESO ETL CON PENTAHO
4. Paso 1: Iniciar los módulos Apache y MySQL
Aquí lo que vamos hacer es presionar sobre el botón admin para abrir en el navegador
Paso 2: Abrir el host local en el navegador
5. Paso 3: subir el modelo Estrella a la base de datos MARKET_DW
Una vez concluido todo este proceso lo que vamos hacer utilizar la herramienta pentaho
para realizar el ETL.
Abrir la herramienta de análisis de datos PENTAHO
6. vamos agregar los datos de entradas y salidas
TRABAJANDO CON LOS DATOS DE ENTRADA
Agregamos el archivo de entrada de datos de Access y la agregamos.
Obtenemos las tablas con el siguiente botón
Seleccionamos las tablas a utilizar de la lista que se despliega. Luego presionamos OK
7. Por ejemplo, seleccionamos la tabla ventas, y luego presionamos sobre el botón Get
tables
Mostramos los campos de la tabla ventas
Mostramos el contenido de la tabla ventas
8. Para terminar, presionamos sobre el botón OK
Concluido la entrada de datos y seleccionada las tablas a utilizar se tiene lista la entrada
de datos para el desarrollo y posterior proceso y salida de la información.
COMENZAMOS EL PROCESO DE TRANSFORMACION.
Aquí podemos observar el mapping del proceso para la transformación
9. Antes que todo vamos la conexión con la base de datos para ver que realmente funciona
Llenamos los datos para nuestra conexión, y presionamos sobre el botón test para la
verificación de nuestra conexión.
Podemos verificar que nuestra conexión está bien, presionamos sobre el botón OK, y de
la ventana principal también Ok para terminar nuestra conexión
10. SALIDA DE LOS DATOS
Una vez finalizada la configuración de salida ejecutamos para validar nuestra
transformación
Observamos que todo está bien, con eso concluye la transformación ETL
2. Primero, completar la tabla Ventas con el campo totalVenta que incluye el
cálculo de Kilos vendidos por el Precio de los Productos
(Ventas.Kilos*Productos.Precio) para todos los datos asociados en Ventas.
En esta etapa vamos a realizar el modelo estrella, completando los campos que
se nos pide en el trabajo, en este caso de la tabla ventas debemos tener el campo
TotalVenta,
11. Base de datos original.
Modelo estrella con el campo TotalVenta y los campos que se necesitan para la
solución.
3. Realizar el proceso ETL usando la herramienta spoon de Pentaho, para obtener
el Data Warehouse o Datamart) SupermercadoDW en MySQL
Verificamos nuestro gestor para ver que se han creado que nuestras tablas donde
se va almacenar nuestro Data Warehouse
12. 4. Para obtener el DW MARKET_DW se debe modelar el modelo estrella que
involucre las dimensiones y hechos necesarios para responder las consultas:
Mostramos nuestro modelo estrella con los cuales resolveremos puntos que a
continuación se detallan para su análisis.
13. • Productos vendidos considerando las cantidades (kilos) y los
montos totales (totalVenta), asociando a las Fechas y los
Vendedores.
14. • Se lo considera y se mejorar el grado de granularidad de la
consulta incluyendo a los Grupos de Productos.
El proceso anterior se muestra en el esquema siguiente
encerrado en azul.
15. III. CONCLUSIONES
En conclusión, como se puede observar a lo largo del proyecto utilizando la
herramienta PENTAHO la cual manejamos para realizar el proceso ETL, decimos que
es una muy buena herramienta que ayuda en la obtención de diferentes data
werehouse.
Es en este sentido que la gran cantidad de datos que podemos tener la podemos
utilizar de buena manera haciendo una refinación de esta información obteniendo
los datos que realmente necesitamos, de esta manera podemos trabajar en ellos,
analizarlos y posteriormente tomar decisiones que nos ayude a seguir sobresaliendo
en el ámbito de trabajo empresarial.
Hacer el estudio de los diferentes datos de la información no pareciera importante,
pero es ahí donde muchos están equivocados, puesto que este es el punto mas
sobresaliente en la toma de decisiones que nos enfocará en mejoramiento de
nuestra empresa u organización.
Como hemos visto para ello es necesariamente importante conocer la base de datos
y crear un modelo estrella que nos permita tener las referencias necesarias y
correctas para la información que vamos a utilizar, es por ello que el modelo estrella
de nuestro proyecto involucra tablas y dimensiones muy importantes que nos
servirá para realizar el proceso de transformación obteniendo netamente lo que
vamos a utilizar.
Para el proyecto trabajamos con diferentes datos como son: los datos del vendedor,
su población, la cantidad de kilos que ha vendido, si es guapo o no lo es, el producto
que ha vendido, y todo esto lo hemos obtenido primero realizando nuestro modelo
estrella, y como observamos hemos logrado tener datos muy importantes en
nuestras tablas de salida como mostramos anteriormente.
16. Con esto PENTAHO es una muy potente herramienta para la creación de DATA
WEREHOUSE y creación de los procesos ETL que lo involucran en la obtención de la
información y refinamiento de las mismas.