SlideShare una empresa de Scribd logo
Ingeniería en Informática
Tesis de Grado
Prototipo de Sistema de Inteligencia de Negocios
utilizando
Minería de Datos sobre Software Libre
Nicolás Chávez
Christian Bavera
Tutor: Lic. Denise Riveros
Asunción – Paraguay
2.013
RESUMEN
El propósito de este proyecto fue demostrar la factibilidad de la realización de un
prototipo de solución de Inteligencia de Negocios basado en software libre y
minería de datos, enfocado a dar soporte a la toma de decisiones estratégicas del
Grupo Flayp, ya que sus empresas almacenan sus datos en fuentes y formatos
diferentes. Para ello se relevaron los sistemas actuales,procesos, requerimientos y
tecnologías vigentes. Logrando la concreción del prototipo, utilizando para ello
las herramientas disponibles bajo licencia de software libre. Evidenciando que
estas herramientas, son una alternativa válida para soluciones de este tipo, sin la
necesidad de incurrir en gastos por el pago de licencias de software propietario.
Palabras Claves: inteligencia de negocios, software libre, minería de datos.
DEDICATORIA
Dedico este esfuerzo personal y este logro académico y profesional:
A mis padres Nicolás y María del Carmen, quienes con su ejemplo me
enseñaron que todo es posible si uno se propone, sin ellos, jamás hubiese podido
conseguir este objetivo
A mis hermanos, compañeros de clases y amigos, porque de ellos también
he aprendido.
Nicolás Chavez Espínola
A mis padres, porque siempre creyeron en mí y porque me sacaron
adelante, dándome ejemplos dignos de superación y entrega, porque en gran parte
gracias a ustedes, hoy puedo ver alcanzada mí meta.
A mi familia, por ser soporte fundamental en las etapas complicadas, que
fueron muchas.
A mi novia, por comprenderme y apoyarme siempre y en todo momento.
A mis compañeros de la facultad, que compartieron esta carrera que por
momentos parecía infinita.
A todos, espero no defraudarlos y contar siempre con su valioso apoyo,
sincero e incondicional.
Todo este trabajo ha sido posible gracias a ellos.
Christian Bavera
AGRADECIMIENTOS
Primero antes que nada, damos gracias a Dios, por estar con nosotros en
cada paso que dimos, por fortalecer nuestros corazones e iluminar nuestras mentes
y haber puesto en nuestro camino a aquellas personas que han sido soporte y
compañía durante todo el periodo de estudio.
A nuestros profesores quienes nos han enseñado a ser mejores en la vida y
a realizarnos profesionalmente.
Un agradecimiento especial a nuestra asesora la Lic. Denise Riveros por
hacer posible esta tesis.
A los compañeros de clases quienes nos acompañaron en esta trayectoria
de aprendizaje y conocimientos.
Al Grupo Flayp, por permitirnos realizar este proyecto, poniéndose a
nuestra disposición y brindándonos todas las facilidades desde el primer al último
día en que así lo requerimos
En general quisiéramos agradecer a todas y cada una de las personas que
han vivido con nosotros la realización de esta tesis.
ÍNDICE
CAPITULO 1 - INTRODUCCIÓN ..................................................................... 13
1.1. Planteamiento del Problema ................................................................... 13
1.2. Necesidad de estudiar el problema. ........................................................ 14
1.3. Significación del problema ..................................................................... 14
1.4. Delimitación del problema...................................................................... 14
1.5. Objetivos de la Tesis: .............................................................................. 15
1.5.1. Objetivo General............................................................................. 15
1.5.2. Objetivos Específicos...................................................................... 15
1.6. Definición de términos............................................................................ 16
1.7. Presentación del esquema ....................................................................... 17
CAPITULO 2–MARCO TEÓRICO..................................................................... 19
2.1. El valor de la información....................................................................... 19
2.2. Necesidad de información y conocimiento en la empresa...................... 20
2.3. La información que las empresas necesitan............................................ 21
2.4. Las organizaciones y los distintos sistemas de información................... 24
2.5. Definición de Inteligencia de Negocios.................................................. 26
2.6. Los usuarios de las soluciones de Inteligencia de Negocios................... 27
2.7. Historia de la Inteligencia de Negocios .................................................. 28
2.8. Características de la Inteligencia de Negocios........................................ 30
2.9. Componentes de una solución de Inteligencias de Negocios ................. 31
2.9.1. Las fuentes de información a las que se puede acceder son: .......... 32
2.9.2. Proceso de extracción, transformación y carga............................... 33
2.9.3. Data warehouse............................................................................... 35
2.9.4. Herramientas de acceso de la Inteligencia de Negocios ................. 40
2.10. Principales herramientas de la Inteligencia de Negocios........................ 42
2.11. Minería de datos...................................................................................... 43
2.11.1. Conceptos e historia de la minería de datos ................................ 43
2.11.2. Los fundamentos de la minería de datos. .................................... 45
2.11.3. Objetivos de la minería de datos ................................................. 45
2.11.4. Entorno de la minería de datos.................................................... 46
2.11.5. El alcance de la minería de datos ................................................ 47
2.12. Reseña histórica del Grupo Flayp........................................................... 47
2.13. Reseña histórica del software libre ......................................................... 50
2.13.1. Richard Stallman y el proyecto GNU.......................................... 50
2.13.2. Software Libre ............................................................................. 52
2.13.3. Libertades básicas del software libre........................................... 54
2.13.4. Software libre y software de código abierto ................................ 55
2.13.5. Tipos de licencias de software libre............................................. 58
CAPÍTULO 3– MARCO METODOLÓGICO ..................................................... 60
3.1. Descripción de la profundidad y el diseño de la Tesis:........................... 60
3.2. Descripción de cómo se realizó la Tesis ................................................. 61
3.2.1. Relevamiento de datos .................................................................... 62
3.2.2. Análisis de datos ............................................................................. 62
3.2.3. Diseño ............................................................................................. 63
3.2.4. Desarrollo........................................................................................ 64
3.2.5. Prueba.............................................................................................. 65
3.2.6. Implementación............................................................................... 65
3.3. Descripción de los instrumentos y procedimientos utilizados para la
recolección y tratamiento de la información..................................................... 66
3.4. Descripción de la muestra....................................................................... 66
3.5. Relevamiento .......................................................................................... 67
3.5.1. Relevamiento de procesos............................................................... 67
3.5.2. Relevamiento de Estructura de Datos ............................................. 71
3.5.3. Relevamiento de Necesidades......................................................... 71
3.5.4. Relevamiento tecnología actual del Grupo Flayp ........................... 72
3.5.5. Relevamiento Sistemas gestores de Bases de Datos....................... 72
3.5.6. Relevamiento algoritmo de minería de datos.................................. 75
3.5.7. Relevamiento de sistemas operativos ............................................. 78
3.5.8. Relevamiento de herramientas de Inteligencia de Negocios........... 79
3.6. Análisis ................................................................................................... 81
3.6.1. Análisis de requerimientos.............................................................. 81
3.6.2. Análisis de procesos........................................................................ 83
3.6.3. Análisis de estructura de datos........................................................ 84
3.6.4. Análisis de herramientas de Inteligencia de Negocios.................... 85
3.6.5. Análisis de sistemas gestores de bases de datos.............................. 86
3.6.6. Análisis de tecnología actual del Grupo Flayp ............................... 87
3.6.7. Análisis de algoritmo de minería de datos ...................................... 87
3.6.8. Análisis de sistemas operativos....................................................... 88
3.6.9. Análisis de factibilidad económica ................................................. 90
3.7. Diseño ..................................................................................................... 91
3.7.1. Diseño del data warehouse ............................................................. 91
3.7.2. Diseño del proceso ETL.................................................................. 93
3.7.3. Diseño de reportes........................................................................... 98
3.7.4. Diseño de cubos multidimensionales............................................ 101
3.7.5. Diseño de cuadros de mandos....................................................... 105
3.7.6. Diagramas casos de uso ................................................................ 107
3.7.7. Diagrama de actividades ................................................................110
3.7.8. Diagramas de secuencia .................................................................112
3.7.9. Diagrama de arquitectura de Pentaho Open BI Suite.....................114
3.7.10. Arquitectura del prototipo de solución de Inteligencia de
Negocios. 116
3.8. Desarrollo del prototipo.........................................................................117
3.8.1. Desarrollo del data warehouse.......................................................117
3.8.2. Desarrollo de proceso ETL ............................................................118
3.8.3. Desarrollo de minería de datos...................................................... 125
3.8.4. Desarrollo de reportes ................................................................... 127
3.8.5. Desarrollo de cubos multidimensionales ...................................... 130
3.8.6. Desarrollo de cuadros de mandos ................................................. 133
3.9. Prueba de prototipo............................................................................... 136
3.10. Implementación del Prototipo............................................................... 143
3.10.1. Implementación de ETL y Data warehouse.............................. 143
3.10.2. Implementación de Pentaho Open BI Server ............................ 144
3.10.3. Implementación de consola de administración de usuarios Pentaho
148
3.10.4. Implementación de reportes ...................................................... 150
3.10.5. Implementación de los cubos multidimensionales.................... 152
3.10.6. Implementación de cuadros de mandos..................................... 153
CAPÍTULO 4– RESULTADOS.......................................................................... 154
CAPÍTULO 5 - CONCLUSIONES ................................................................... 155
CAPÍTULO 6- RECOMENDACIONES........................................................... 156
BIBLIOGRAFÍA ................................................................................................ 157
ANEXOS ............................................................................................................ 159
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
8
LISTA DE TABLAS
Tabla 1: Diferencias entre sistemas OLTP y OLAP. ............................................. 39
Tabla 2: Infraestructura actual de las empresas..................................................... 72
Tabla 3: Datos de ejemplo..................................................................................... 77
Tabla 4: Descripción del algoritmo backpropagation........................................... 77
Tabla 5: Comparativa herramientas de Inteligencia de Negocios......................... 85
Tabla 6: Comparativa de SGBD............................................................................ 86
Tabla 7: Comparativa de algoritmos de minería de datos..................................... 88
Tabla 8: Comparativa de sistemas operativos ....................................................... 89
Tabla 9: Cuadro de costos ..................................................................................... 90
Tabla 10: Mapeo de tabla inter_articulos_viru...................................................... 94
Tabla 11: Mapeo de tabla dw_articulos................................................................. 94
Tabla 12: Mapeo de tabla dw_clientes.................................................................. 94
Tabla 13: Mapeo de tabla dw_campañas_actuales................................................ 94
Tabla 14: Mapeo de tabla clonado_dbf_viru......................................................... 95
Tabla 15: Mapeo de tabla inter_pedido_avon ....................................................... 96
Tabla 16: Mapeo de tabla inter_pedido_viru ........................................................ 96
Tabla 17: Mapeo de tabla inter_ventas_avon........................................................ 96
Tabla 18: Mapeo de tabla inter_ventas_viru ......................................................... 97
Tabla 19: Mapeo de tabla dw_hechosventas......................................................... 97
Tabla 20: Mapeo de tabla dw_hechospedidos....................................................... 98
Tabla 21: Análisis cubo ventas por campaña, división, categoría y empresa. .... 104
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
9
LISTA DE FIGURAS
Figura 1: Pirámide de usuarios de un sistema de Inteligencia de Negocios ......... 28
Figura 2: Componentes de Inteligencia de Negocios............................................ 31
Figura 3: Fuentes de información. ........................................................................ 33
Figura 4: Data warehouse..................................................................................... 36
Figura 5: Data marts............................................................................................. 38
Figura 6: Herramientas de acceso. ........................................................................ 40
Figura 7: DER Hechos Pedidos............................................................................. 92
Figura 8: DER Hechos Ventas............................................................................... 93
Figura 9: DER Proyección .................................................................................... 93
Figura 10: Ventas por campañas por zonas........................................................... 99
Figura 11: Reporte proyección de ventas............................................................ 100
Figura 12: Dimensión artículos........................................................................... 101
Figura 13: Dimensión campaña .......................................................................... 102
Figura 14: Dimensión clientes ............................................................................ 102
Figura 15: Dimensión campaña .......................................................................... 103
Figura 16: Hechos pedidos.................................................................................. 103
Figura 17: Hechos Ventas.................................................................................... 103
Figura 18: Estructura del cuadro de mando ........................................................ 105
Figura 19: Arquitectura lógica del cuadro de mando.......................................... 106
Figura 20: Caso de uso usuario........................................................................... 107
Figura 21: Caso de uso administrador-consola ................................................... 108
Figura 22: Caso de uso administrador – servidor ............................................... 108
Figura 23: Caso de uso administrador – informes .............................................. 109
Figura 24: Diagrama de Actividades usuario.......................................................110
Figura 25: Diagrama de actividades administrador - usuarios.............................111
Figura 26: Diagrama de actividades administrador - servidor.............................111
Figura 27: Diagrama de actividades administrador – informes ...........................112
Figura 28: Diagrama de secuencia – consulta de reporte y cubo.........................113
Figura 29: Diagrama de secuencia crear usuario .................................................113
Figura 30: Diagrama de secuencia administrar prototipo ....................................114
Figura 31: Arquitectura Pentaho Open BI Suite ..................................................115
Figura 32: Arquitectura de Inteligencia de Negocios...........................................117
Figura 33: Data warehouse en PhpMyAdmin .....................................................118
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
10
Figura 34: Transformación selección de campaña a cargar .................................119
Figura 35: Transformación inter_ventas_viru..................................................... 120
Figura 36: Transformación limpieza de clonado_dbf_viru................................. 120
Figura 37: Transformación borrado hechos_ventas viru..................................... 121
Figura 38: Transformación cargado de tabla hechos_ventas_viru...................... 121
Figura 39: Trabajo general de cargado dw_hechosventas fuente Viru................ 122
Figura 40: Transformación cargado de tabla inter_ventas_avon ........................ 123
Figura 41: Transformación borrado dw_hechosventas ....................................... 123
Figura 42: Transformación cargado dw_hechosventas....................................... 124
Figura 43: Trabajo general de cargado hechos_ventas Fuente Flayp ................. 125
Figura 44: Desarrollo reporte ventas por campañas por zonas ........................... 129
Figura 45: Reporte de proyección de ventas....................................................... 130
Figura 46: Estructura de los cubos...................................................................... 131
Figura 47: Capas de CDE.................................................................................... 134
Figura 48: Definición de estructura..................................................................... 134
Figura 49: Estructura de CDM............................................................................ 135
Figura 50: Origen de datos.................................................................................. 135
Figura 51: Selección de archivos dbf Virú.......................................................... 137
Figura 52: Cargado de tabla intermedia inter_ventas_viru................................. 138
Figura 53: Borrado de dw_hechosventas ............................................................ 138
Figura 54: Cargado de dw_hechosventas............................................................ 139
Figura 55: Trabajo hechos ventas fuente dbf ...................................................... 140
Figura 56: Cargado de la tabla inter_ventas_avon.............................................. 141
Figura 57: Borrado hechos ventas Flayp S.R.L. ................................................. 141
Figura 58: Hechos ventas fuente MySQL........................................................... 142
Figura 59: Trabajo hechos ventas fuente MySQL............................................... 143
Figura 60: Descarga de Bussines Intelligence Server ......................................... 145
Figura 61: Inicio del servicio Apache. ................................................................ 146
Figura 62: Instalación de Pentaho Bussines Intelligence Server......................... 146
Figura 63: Pantalla de inicio de sesión en la consola de usuario de Pentaho...... 147
Figura 64: Consola de usuario Pentaho............................................................... 147
Figura 65: Consola de administración de usuarios ............................................. 149
Figura 66: Administración de fuentes de datos................................................... 150
Figura 67: Publicación del reporte ventas por campaña por zonas..................... 151
Figura 68: Publicación reporte de ventas por zonas............................................ 151
Figura 69: Cubo de ventas .................................................................................. 152
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
11
Figura 70: Participación en facturación por empresas ........................................ 153
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
12
LISTA DE SÍMBOLOS O ABREVIATURAS
OLTP:Online Transaction Processing
OLAP:On-Line Analytical Processing
ETL:Estract, Transform and Load
ERP:Enterprise Resource Planning
CRM:Customer Relationship Management
KDD:Knowledge Discovery in Databases
VPN:Virtual Private Network
GNU:GNU is Not Unix
FSF:Free Software Foundation
GPL:General Public Licence
OSI:Open Source Initiative
PDI: Pentaho Data Integration
SGBD: Sistema Gestor de Base de Datos
TI: Tecnología de Información
DDL:Data Definition Language
DML: Data Manipulation Language
TCT/IP: Transmission Control Protocol Internet Protocol
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
13
CAPITULO 1 - INTRODUCCIÓN
1.1. Planteamiento del Problema
El Grupo Flayp está compuesto por varias empresas, cada una de
ellas cuenta con diferentes sistemas de información para realizar sus
procesos de negocio, las mismas generan y almacenaninformaciónen
distintos formatos y en gran volumen.
Con toda esta acumulación de información diversificada,resulta
dificultoso para los gerentes tener una imagen precisa de la información
más importante para las empresas del Grupo y más aún para el directorio,
quien tiene a su cargo la dirección general Grupo.
A esto debemos sumarle, que ninguna de las empresas cuenta con
un sistema generador automático de informes, y que los mismos son
preparados sobre pedido, con todo lo que esto implica.
El reto de este proyecto consiste en brindar un prototipo de
solución de Inteligencia de Negocios capaz de transformar los datos en
información útil, de manera que los gerentes y directores puedan utilizar
dicha información para incrementar la rentabilidad de las empresas.
Brindándoles un soporte en el cual respaldar la toma de decisiones
estratégicas.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
14
1.2. Necesidad de estudiar el problema.
El hecho de tener una gran cantidad de datos acumulados, no
representa necesariamente tener una gran cantidad de información, y que
dicha información sea o no relevante para la empresa, depende en gran
medida de la forma y calidad en la que esta llegue a los tomadores de
decisiones, la Inteligencia de Negocios tiene como uno de sus ejes
principales lograr esto, ayudar a comprender mejor el comportamiento de
la empresa, esto da pie para para realizar un estudio e implementar
soluciones, haciendo uso de herramientas tecnológicas actuales, siguiendo
tendencias y estándares en las áreas de la informática.
1.3. Significación del problema
La importancia de este proyecto radica en lograr la implementación
de un prototipo de solución de Inteligencia de Negocios que sea capaz de
unificar los datos que se encuentran en distintos formatos, provenientes de
las dos empresas Flayp S.R.L. y Virú S.R.L., pertenecientes al Grupo
Flayp y lograr entre otras cosas, brindar información cohesionada, fiable y
útil.
1.4. Delimitación del problema
La presente tesis se limita al desarrollo de un prototipo de solución
de Inteligencia de Negocios para los departamentos de Ventas y Marketing
de las empresas Flayp S.R.L. y Virú S.R.L., integrantes del Grupo Flayp,
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
15
en función a los requerimientos de información solicitadas por dichas áreas
para los procesos de ventas y pedidos.
En cuanto a los datos si bien en un principio se pretendía acceder a
toda la información del Grupo Flayp, las personas a cargo accedieron a
prestar los datos de forma parcial, haciendo énfasis en la importancia de
mantener la confidencialidad de los mismos y que fueran utilizados
exclusivamente para fines académicos.
1.5. Objetivos de la Tesis:
1.5.1. Objetivo General
Implementar un prototipo de Sistema de Inteligencia de
Negocios usando Minería de Datos sobre Software Libre.
1.5.2. Objetivos Específicos
a) Relevar todos los procesos administrativos y de negocio
de las empresas.
b) Relevar software, hardware y tipos de informes.
c) Analizar software, hardware y tipos de informes.
d) Definir los tipos de informes de acuerdo al perfil y las
necesidades de cada usuario.
e) Diseñar, desarrollar, probar e implementar prototipo de
solución de Inteligencia de Negocios.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
16
f) Documentar ciclo de vida del prototipo de solución de
Inteligencia de Negocios.
g) Realizar la demostración del funcionamiento del prototipo.
1.6. Definición de términos
Servidor:Máquina conectada a Internet que entre otros servicios ofrece
alojamiento para páginas web haciendo que estén accesibles desde
cualquier punto de Internet.
Data Warehouse: Colección de datos orientado a un ámbito determinado
(empresa, organización, etc.) sus características son no volátil, integrado y
variable en el tiempo.
Data Marts: Es una versión especial de data warehouse, son subconjuntos
de datos con la finalidad de ayudar a la toma de decisiones dentro de un
área específica en la organización.
Minería de Datos:La integración de un conjunto de áreas que tienen como
propósito la identificación de un conocimiento obtenido a partir de las
bases de datos que aporten una guía para la toma de decisiones.
Inteligencia de Negocios:Es unconjunto de tecnologías que tienen un fin
común con el principal objetivo que es la de servir como soporte para la
toma de decisiones.
Cuadros de Mando:Es una herramienta de gestión que facilita la toma de
decisiones, recoge un conjunto coherente de indicadores que proporciona a
los niveles gerenciales una visión comprensible del negocio de manera
gráfica.
Software Libre: se refiere al tipo de licencias de software que garantiza la
libertad de los usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y
mejorar el software.
Open Source: Es el termino con el que se conoce al software distribuido y
desarrollado libremente.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
17
Consultas Adhoc:Se refiere a las consultas elaboradas específicamente
para un fin preciso y por lo tantono generalizable ni utilizable para otros
propósitos.
Copyleft: Es un método general para hacer un programa o software libre,
exigiendo que todas las versiones modificadas y extendidas del mismo
sean también libres.
1.7. Presentación del esquema
En el Capítulo I – Introducción:se presenta el contenido de la tesis, la
definición del problema de la investigación, la justificación de la necesidad
del estudio y los objetivos.
En el Capítulo II - Marco Teórico: en este capítulo se realiza una
descripción de la importancia y el valor de la información en las empresas,
y el concepto de la Inteligencia de Negocios, donde se mencionan sus
principales componentes como lo son el data warehouse,On-Line
Analytical Processing (en adelante OLAP), Extract, Transform and Load
(en adelante ETL) y minería de datos, además se muestran los principios
claves de estas tecnologías, también se hace referencia al concepto de
software libre y por último se presenta al Grupo Flayp, ya que es este el
lugar elegidopara llevar adelante este trabajo de grado, todas estas
secciones son para una mejor comprensión de lo que se pretende lograr
con este proyecto.
En el Capítulo III - Marco Metodológico:se trata sobre la metodología
utilizada en este trabajo, tipo de investigación y los detalles de la
realización. El mismo se encuentra dividido en 6 partes. En la primera se
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
18
describen los métodos utilizados para el relevamiento de los
requerimientos, datos, procesos, tecnología y herramientas. En la segunda
parte se analizan los datos relevados seleccionando los inherentes al
proyecto, también se analiza el modelo de datos de los sistemas actuales, y
se seleccionan aquellos que serán utilizados para el modelado de datos del
datawarehouse, además se realiza una comparación entre las diferentes
opciones de herramientas de inteligencia de negocios. En la tercera se
realizan los diseños deldata warehouse, los procesos de ETL, los distintos
tipos de informes y los diagramas necesarios para la realización del
proyecto. En la cuarta parte se desarrolla el prototipo. En la quinta se
realizan las pruebas del prototipo. En la sexta y última etapa se realiza la
implementación del prototipo.
En el Capítulo IV – Resultados: se describen los resultadosobtenidos,
demostrando la factibilidad de la implementación de un prototipo de
solución de Inteligencia de Negocios sin incurrir en gastos en cuanto a
licencias de software.
En el Capítulo V – Conclusiones:se presenta la síntesis de los objetivos y
la conclusión del trabajo.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
19
CAPITULO 2–MARCO TEÓRICO
2.1. El valor de la información
En la actualidad, cuya característica más importante, se basa en un
crecimiento a gran escala de las tecnologías de la información y las
telecomunicaciones, los activos más valiosos de una empresa pasan a ser
los conocimientos, habilidades, valores y actitudes de sus empleados.
Partiendo de la premisa de que el conocimiento sobre un tema
determinado y su optima utilización, se convierte en un factor
determinante para el éxito en el mundo empresarial. El capital intelectual
ha desplazado a los factores tradicionales, como ser la producción, el
capital, la tierra oel trabajo, como principal elemento a la hora de generar
valor económico para la empresa, tal como se desprende del planteamiento
de Cohen y Asín (2.000).
Todas las compañías de alguna manera han adoptado un modelo del
mundo de negocios sustentado en la información, como por ejemplo: ¿qué
factores influyen en la compra y la demanda?, ¿cómo hallar las
oportunidades de negocio?, ¿existe directa relación entre la calidad del
producto y la demanda de los clientes? A medida que la exactitud de esta
información crece, la capacidad de la empresa por competir se incrementa
en forma proporcional.
La información puede transformarse en conocimiento tácito o
explícito. Se entiende por conocimiento tácito aquel que poseen las
personas producto de la experiencia adquirida, los estudios y la educación;
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
20
mientras que los conocimientos explícitos son aquellos almacenados en
bases de datos. Un ejemplo claro es aquel que se produce cuando una
persona cambia de empleo, esta se está llevando consigo información,
conocimientos y está ofertando su capacidad intelectual por un mayor
precio; en el ámbito laboral, la experiencia y la educación son factores
claves para aumentar el costo de la fuerza del trabajo intelectual. Así
mismo, el hecho de que un sistema que maneja información,
eventualmente falle, indefectiblemente generará pérdidas a la empresa.
Es una clara tendencia que las empresas están apostando
fuertemente por la tecnología y las personas, para que en conjunto tengan
un conocimiento suficiente que logre acercar la visión interna de ambos a
la realidad exterior, en la misma medida que la brecha entre la visión
interna y la realidad exterior disminuye, se consigue tomar decisiones más
acertadas y en menos tiempo. Lo que busca esta tendencia es acercar lo
máximo posible el mundo real a la visión interna para generar mayores
ganancias, convirtiendo la información en utilidad y darle un valor a la
información.
2.2. Necesidad de información y conocimiento en la empresa
Desde el mismo instante en que las empresas iniciaron el proceso
de acumular los datos de sus operaciones en medios de almacenamiento
físico, y de esa forma conseguir una mejor administración y control de
dicha información, ha surgido la necesidad de utilizarla para entender las
necesidades particulares del negocio. En un mercado altamente
competitivo, donde muchas marcas ofrecen productos similares, los
clientes tienen una amplia gama de posibilidades para la elección del
producto. Para obtener una porción del mercado, es indispensable para las
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
21
empresas, tener la suficiente capacidad de transformar la información
acumulada en conocimiento.
La necesidad de información en las empresas no surge de un día
para el otro, el propósito de almacenar los datos radica en su utilización en
algún momento, cuando así se requiera, caso contrario, cualquier dato de
control sería desechado instantáneamente. Lo que si surge súbitamente, es
la imperiosa necesidad de dar respuesta rápida a los requerimientos de
información para la toma de decisiones y ayudar a mejorar de alguna
manera los procesos internos de negocio.
2.3. La información que las empresas necesitan
En la actualidad las organizaciones demandan información en los
niveles donde anteriormente la administración se basaba meramente en la
intuición y el sentido común para la toma de decisiones. Los mercados
dinámicos obligan a las empresas a que la información estratégica esté
disponible en las computadoras de los directivos y/o gerentes, esta práctica
se ha generalizado principalmente motivada por la mayor utilidad que se
obtiene de la información compartida.
Hoy en día la información está presente en todos los niveles de la
organización con propósitos diferentes (comunicación, control,
administración, evaluación, etc.) ayudando a la correcta y oportuna toma
de decisiones desde el nivel gerencial, hasta el nivel operativo de la
organización. Las empresas han entendido que a pesar de que los niveles
directivos tienen una gran responsabilidad al tomar decisiones, por el peso
que conllevan las mismas, existen también personas que toman decisiones
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
22
y a pesar de que éstas no tienen un impacto global, deben ser de igual
manera correctas y oportunas.
Directores, gerentes, jefes y todos aquellos que toman decisiones
deben contar con la suficiente información para respaldar su trabajo
cotidiano, la posición que ocupen en la pirámide organizacional se torna
secundaria cuando la mirada es hacia la gestión de los procesos y como así
también los puestos que tienen cierta relación y dependencia entre sí.
De modo general en una pirámide organizacional, los
requerimientos informativos se dividen en tres niveles:
 Información Estratégica
 Información Táctica
 Información Técnico Operacional.
Información Estratégica: está pensada principalmente para ayudar a la
toma de decisiones de las áreas gerenciales para alcanzar la misión
empresarial. Se caracteriza porque son sistemas con poca carga diaria de
trabajo y sin una gran cantidad de datos, sin embargo, la información que
guarda está relacionada a un contexto cualitativo más que cuantitativo, que
puede indicar cómo evolucionará en el futuro, el criterio es distinto, pero
sobre todo es distinta su delimitación. Se asocia esta información a los
niveles ejecutivos de las empresas. Es importante señalar que la
información estratégica se nutre de grandes cantidades de datos de áreas
relacionadas y no se enfoca puntualmente en una sola dirección, de ahí que
las decisiones que puedan ser tomadas tienen un impacto directo en toda la
organización.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
23
Información Táctica: este tipo de información es la que soporta la
coordinación de actividades y el nivel operativo de la estrategia, es decir,
se analizan opciones y se trazan rutas posibles para alcanzar la estrategia
definida por la dirección de la empresa. Se facilita la gestión independiente
de la información por parte de los niveles intermedios de la organización.
Este tipo de información es extraída puntualmente de un área o sección de
la organización, por lo que su alcance es local y se asocia habitualmente a
las gerencias.
Información Técnico Operacional: hace referencia a las operaciones
diarias que son efectuadas de modo rutinario en las corporaciones
mediante la transacción masiva de datos y sistemas transaccionales. Las
cargas son cotidianas y soportan la actividad de la empresa día tras día
(contabilidad, facturación, almacén, presupuesto, etc.). Generalmente se
asocia esta información con los jefes de área o las coordinaciones
operativas, también llamadas de tercer nivel.
Podemos considerar entonces factores internos y externos de una
empresa y así concluir que los requerimientos en la actualidad se orientan
a descubrir y mejorar los beneficios de toda la cadena corporativa. Dichos
requerimientos se ven reflejados en el interés por tener a mano los
indicadores que arrojen información concreta y clave para determinada
área de la empresa, y en el menor tiempo posible. La clara tendencia es
que las áreas gerenciales necesitan en su mesa de trabajo, la información
clave de su empresa; en todos los niveles el requerimiento es parecido,
aunque es evidente que tendrá objetivos diferentes.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
24
2.4. Las organizaciones y los distintos sistemas de información
Para que una empresa esté completamente automatizada es
necesario contar con una gran infraestructura en tecnologías para que
soporte todos los sistemas de información. El crecimiento en tecnología
puede tener distintos orígenes partiendo desde la implementación,
crecimiento, ampliación, mantenimiento, etc. Las necesidades actuales de
las empresas han provocado contar con tecnología de la informaciones más
sofisticados para responder a cada una de sus peticiones de información,
esto impulsó a que las compañías adquieran distintos tipos de sistemas de
informaciones, entre estos sistemas podemos mencionar a los OnLine
Transaction Processing(en adelante OLTP), Planificación de Recursos
Empresariales(en adelante ERP), Sistemas de Soporte para la toma de
decisiones (en adelante DSS), Administración de la Relación con Clientes
(en adelante CRM), etc.
Estos sistemas siempre están utilizando bases de datos para
almacenar la información generada, las mismas se utilizan como soporte
para la toma de decisiones en las empresas.
Existen empresas que precisan información de una actividad
específica, un ejemplo seria los Sistemas ERP (Planificación de Recursos
Empresariales) son sistemas muy complejos y grandes donde un alto
porcentaje de su contenido dedica a los procesos de producción, si una
empresa se dedica a las bienes raíces, sería ilógico adquirir un sistema de
alta complejidad y costoso como las ERP que no va a dar una solución a
las necesidades de la empresa. Para empresas como estas, existen
desarrollos de soluciones en el mercado comercializado como productos
que pueden ser configurados en una organización en particular de acuerdo
a sus necesidades, que dan soluciones a requerimientos específicos para
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
25
cada industria. Hay en el mercado, software para distintos tipos de
empresas como automotriz, hotelería, comercios, educativos entre otros.
Son distintas las herramientas utilizadas debido a que las
actividades de misión crítica que soportan cada una de las organizaciones
son diferentes, y por ende también son distintos los tipos de información
que puede solicitar un directivo en cada una de las organizaciones, lo cual
justifica que existan muchos productos de software dedicados a explotar la
información de las bases de datos que no tienen características estándares,
sino más bien son adaptables según las exigencias. Considerando las
necesidades que se presentan en cada actividad.
La información que se genera en una empresa u organización está
destinada a responder a diversos tipos de preguntas de los usuarios, de ahí
nace la necesidad que existan sistemas de información para requerimientos
muy específicos que permitan la recolección y el manejo de los datos. La
estructura organizacional de una empresa es un factor importante para
determinar la información que comúnmente es requerida por los
funcionarios.
Los sistemas de procesamiento de datos (OLTP) utilizan medios de
almacenamiento y técnicas para el cargado. Un alto porcentaje de las
empresas recurren a los OLTP para guardar grandes cantidades de datos
con un tiempo de respuesta corto en los miles de transacciones realizadas
cotidianamente, sin embargo, su eficiencia no son las consultas masivas de
grandes cantidades de información y mucho menos el análisis de la misma.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
26
La tecnología tuvo que adaptar los medios necesarios para que sean
eficientes en el ámbito específico de aplicación, así como para el diseño de
estructuras de datos que ordenen la información como se desea, como en
las herramientas o software que dan soluciones oportunas a los usuarios.
Todos los sistemas de información tienen un fin muy particular, y se
complementan para mantener de la manera más eficiente una organización;
sin embargo, no todos pueden dar solución a las distintas demandas de los
usuarios, ya que son diseñados para alguna área específica.
El motivo por el cual existen diferentes sistemas de información es
porque las preguntas de los usuarios son muy específicas que no cualquier
sistema puede resolver. De hecho la base de datos operacional, que es
imprescindible en cualquier organización pero no está organizada para dar
respuestas a preguntas globales sino más bien a pequeños grupos de datos.
Preguntas que impliquen consultas complejas podrían resolverse en un
lapso muy extenso, donde la posibilidad de que la vigencia desaparezca
aumenta considerablemente. Es importante recalcar que una base de datos
o sistema de información no está diseñada para resolver las necesidades
informativas de la organización a nivel macro.
2.5. Definición de Inteligencia de Negocios
La Inteligencia de Negocios cuenta con una diversidad de
interpretaciones como muchos otros términos o conceptos. Su uso es
justificado a todo lo que sea considerado como tecnología de información,
pero no hay un consenso en lo respecta a su definición.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
27
“[…] es el conjunto de tecnologías que permiten a las empresas
utilizar la información disponible en cualquier parte de la organización
para hacer mejores análisis, descubrir nuevas oportunidades y tomar
decisiones más informadas”(HOWARD DRESNER, H 1.989).
Examinando las distintas definiciones queda claro que la
Inteligencia de Negocios no consiste en una metodología, sistema,
software o herramienta en particular, si no es un conjunto de tecnologías
que tienen un fin común con el principal objetivo que es la de servir como
soporte para la toma de decisiones.
2.6. Los usuarios de las soluciones de Inteligencia de Negocios
A continuación se describen los diferentes tipos de usuarios que
intervienen en una solución de inteligencia de negocios.
Productores de información:“[..]Habitualmente son el 20% de
los usuarios, que crean informes o modelos utilizando herramientas de
escritorio. Donde predominan estadísticos que se valen de herramientas
para minería de datos o son creadores de informes que utilizan
herramientas para el diseño y/o programación de informes específicos.
Regularmente son profesionales del área de sistema de información o
usuarios muy avanzados con capacidades de comprender la información
y la informática”(CANO, J 2.007).
Los consumidores de información: “[…] Son usuarios no
habituales que regularmente consultan informes para la toma de
decisiones, pero no acceden a los números o hacen análisis detallados
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
28
diariamente. Los usuarios no habituales son directivos, gestores,
responsables, colaboradores y usuarios externos. Este numeroso grupo
está bien servido con cuadros de mando con análisis guiados, informes
interactivos (por ejemplo: OLAP, informes parametrizados,
vinculados,…) e informes de gestión estandarizados. La mayoría de estas
herramientas proveen ahora acceso vía web para promover el acceso
desde cualquier lugar y facilitar el uso y minimizar los costes de
administración y mantenimiento”(CANO, J 2.007).
En la Figura 1 se puede apreciar a través de una pirámide los
distintos niveles de usuarios en una solución de inteligencias de negocios.
Figura 1: Pirámide de usuarios de un sistema de Inteligencia de
Negocios
2.7. Historia de la Inteligencia de Negocios
En octubre de 1.958 H.P. Luhn de IBM, escribió un artículo
llamado Business Intelligence System donde describe las características
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
29
que debe tener un sistema de este tipo, en muchos aspectos de lo que
escribió Luhn tiempo atrás, si se realiza un paralelismo de lo que se
entiende hoy en día por inteligencia de negocios no varió mucho.
Edgar Frank Codd presenta el concepto de las bases de datos en el
año 1.969, un año más tarde se desarrollaron las primeras base de datos
con sus interfaz empresariales, estas aplicaciones, facilitan la entrada de
datos en los sistemas, haciendo que aumente la información disponible,
pero como el acceso a la información era de alta complejidad y difícil de
acceder a las mismas no fue una solución completa. Otro de los avances
llegaron en el año 1.980 con la creación del concepto del data warehouse
por Ralph Kimball y Bill Inmon, con ellas aparecieron los primeros
sistemas de reportes, con todo esto la solución seguía siendo compleja y
funcionalmente pobre, se contaba con potentes sistemas de bases de datos
pero no existían aplicaciones que facilitaran su explotación.
En 1.989 Howard Dresner difundió el término de Business
Intelligence escrito por H.P. Luhn en el año 1.958, en la década de los 90
llegaba la Business Intelligence1.0 y con ello la multiplicación de
aplicaciones de Inteligencia de Negocios, logrando facilitar el acceso a la
información considerablemente pero empeoraron el problema que se
quería resolver ya que seguían apareciendo múltiples soluciones sin poder
consolidarse. Con la llegada de Business Intelligence 2.0 en el año 2.000
se logró consolidar las aplicaciones en una pocas plataformas a partir de
ahí las herramientas empezaron a dar soluciones reales a las empresas u
organizaciones.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
30
2.8. Características de la Inteligencia de Negocios
Información: el propósito de la Inteligencia de Negocios es
proveer de información al usuario final para dar soporte a la toma
decisiones, por ende la información es la esencia de la Inteligencia de
Negocios, estas pueden originarse desde las bases de datos operacionales,
como también de arquitecturas data mart y data warehouse diseñadas
específicamente para el análisis.
El usuario requiere de información para apoyarse en el momento de
tomar decisiones, pasando en segundo plano de dónde provenga esta,
pudiendo ser de una fuente primitiva o derivada, para lo cual la
inteligencia de negocios utiliza o crea fuentes de datos interna o externa
con el fin de utilizarla como materia prima para lograr su objetivo.
Apoyo a la toma de decisiones: básicamente consiste en organizar
y presentar los datos relevantes para que sirvan como soporte a la hora de
tomar decisiones. Esto implica la utilización de tecnologías, técnicas de
análisis y todo lo que sea necesario con el fin de obtener solamente aquella
información relevante y útil.
Orientación al usuario final:un factor fundamentalque tuvo su
incidencia en la tecnología de la Inteligencia de Negocios para explotar
información, fue que el usuario final no contaba con conocimientos y
técnicas que le permita acceder de una manera sencilla y directa a los datos
almacenados en los sistemas operacionales, ya que casi siempre necesitaba
de ayuda de informáticos para acceder a la información, con la Inteligencia
de Negocios, se elimina la dependencia de terceras personas para el acceso
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
31
a los datos e información, siendo esta una herramienta sencilla y preparada
para que interactúe directamente con el usuario final sin intermediarios.
2.9. Componentes de una solución de Inteligencias de Negocios
Teniendo en cuenta el esquema mencionado por Cano (2.007) la
solución de Inteligencia de Negocios está compuesta por las fuentes de
información, proceso de ETL (extracción, transformación y limpieza de
datos) datawarehouse y motor OLAP como se puede apreciar en la figura
2.
Figura 2: Componentes de Inteligencia de Negocios
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
32
Los componentes son:
 Fuentes de información: generalmente son los datos generados por
sistemas operacionales, los cuales se utilizan para alimentar de
información el data warehouse.
 Proceso ETL: de extracción, transformación y carga de los datos en
el datawarehouse. Los datos antes de almacenarse en un data
warehouse,pasan por procesos de filtrado, limpieza, trasformación
y redefinición.
 El datawarehouse: en él se almacenan los datos de una manera que
optimice su flexibilidad, facilidad de acceso y administración, en
donde los datos están estructurados para generar informes que
ayuden a la toma decisiones.
 El motor OLAP: es el que proporciona la capacidad de realizar
cálculos, análisis, pronósticos, consultas en grandes volúmenes de
datos.
2.9.1. Las fuentes de información a las que se puede acceder son:
a) Los sistemas operacionales, que contienen las aplicaciones
desarrolladas a medida.
b) Sistemas de información por sector: presupuestos, hojas
de cálculo, etcétera o fuentes de información externa,
compradas a terceros como por ejemplo el estudio del
mercado.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
33
En la figura 3 se aprecian las distintas fuentes de
información en un sistema de Inteligencia de Negocios.
Figura 3: Fuentes de información.
2.9.2. Proceso de extracción, transformación y carga
El proceso de extracción, transformación y carga, también
denominado simplemente ETL, es el proceso que permite realizar
el cargado y actualización de los datos obtenidos desde las
distintas fuentes de información en el datawarehouse,
habitualmente consume entre el 60% y el 80% de recursos en un
proyecto de Inteligencia de Negociostal como lo indica Ralf
Kimball (2.004), por lo que es un proceso clave en la vida de todo
proyecto de esta naturaleza.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
34
Esta etapa del proceso de construcción del datawarehouse,
es costosa e implica una inversión significativa de tiempo y
esfuerzo, para la concreción de la misma, por ello requiere
recursos, estrategia, habilidades especializadas y tecnologías.
La extracción, transformación y carga es necesaria para
acceder a los datos de las fuentes transaccionales de información
y volcarlas al data warehouse. El proceso ETL se divide en cinco
subprocesos:
 Extracción: en este proceso se recuperan los datos
físicamente de las distintas fuentes de información
transaccional. En este momento se dispone de los datos en
bruto.
 Limpieza: a través de este proceso se recuperan los datos
en bruto y se comprueba su calidad, aquí se eliminan los
datos duplicados y, de ser posible, se corrigen los valores
erróneos, y completa los valores vacíos, es decir se
transforman los datos, siempre que esto sea posible, para
reducir al mínimo los errores de carga. En este momento
se dispone de datos limpios y de alta calidad.
 Transformación: este proceso utiliza los datos limpios y de
alta calidad obtenidos en la etapa anterior y los estructura
en los distintos modelos de análisis. Como resultado de
este proceso se obtienen datos limpios, consistentes y
útiles.
 Integración: en este proceso se validan los datos cargados
en el data warehouse, se analiza si son congruentes con
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
35
las definiciones y formatos del data warehouse; es aquí
donde se integran en los distintos modelos, de las distintas
áreas de negocio que se han definido en el mismo. Estos
procesos pueden ser complejos.
 Actualización: este es el proceso que permite añadir los
nuevos datos al data warehouse, como así también
mantener el mismo siempre actualizado.
2.9.3. Data warehouse
Eldata warehouse o almacén de datos, es la herramienta
que surgió como respuesta a las necesidades de los usuarios de los
niveles gerenciales, que necesitan información consistente,
integrada, histórica y preparada para ser analizada y utilizada para
mejorar la toma de decisiones.
Su ubicación en el contexto de una solución de
Inteligencia de Negocios se puede apreciar en la sección resaltada
de la figura 4.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
36
Figura 4: Data warehouse
El hecho de recuperar la información desde los distintos
sistemas que posea la empresa, sean estos transaccionales o
externos, para luego almacenarlos en un entorno cohesionado de
información, como es un data warehouse, permitirá analizar la
información contextualmente y relacionada dentro de la
organización.
Las características que debe cumplir undata warehouse
son:
 Temático.
 Integrado.
 Histórico.
 No volátil.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
37
El proceso de diseño y construcción de un data warehouse
corporativo usualmente resulta costoso, además de requerir plazos
de tiempo que las empresas no están dispuestas a aceptar. Estas
situaciones, fueron las que originaron la aparición de los data
mart. Los data mart están enfocados a un grupo particular de
usuarios dentro de la organización, que bien puede estar
conformado por los miembros de un departamento, o por los
usuarios de un determinado nivel organizativo, o por un equipo de
trabajo multidisciplinario con objetivos comunes.
Los data mart, se utilizan para almacenar información de
un grupo de áreas en particular, cuyo flujo de información sea
coincidente; por ejemplo, podrían ser de marketing y ventas o de
producción. Lo usual es que éstos se definan para dar respuestas a
usos muy concretos.
Por lo general, los data mart son más pequeños que los
data warehouses. También almacenan menor cantidad de
información, menos modelos de negocio ya que son utilizados por
un menor número de usuarios.
Existen dos tipos de data mart, estos pueden ser
independientes o dependientes. Los independientes son
alimentados directamente desde las fuentes de información,
mientras que los independientes obtienen la información desde el
data warehousecorporativo. Con los data mart independientes
pueden surgir inconvenientes en su evolución, ya que pueden
llegar a generar inconsistencias con otros data mart.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
38
En la figura 5 puede apreciarse la estructura de los data
marts dentro de una solución de Inteligencia de Negocios.
Figura 5: Data marts
Existen grandes diferencias entre los sistemas
transaccionales y los data warehouses, en función a los objetivos
que persiguen cada una de ellos.
El objetivo primordial del modelo relacional en el cual se
basa el concepto OLTP es el de mantener la integridad de la
información en cuanto a las relaciones entre los datos, lo cuales
necesario para operar un negocio de la manera más eficiente. Sin
embargo, este modelo no se corresponde con la forma en la que
el usuario percibe la operación de un negocio.
Los data werehouses están basados en un procesamiento
de los datos distinto al utilizado por los sistemas operacionales, ya
que este se basa en el concepto OLAP pensado y utilizado en el
análisis de negocios y otras aplicaciones que requieren una visión
flexible del negocio.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
39
A continuación en la Tabla 1 se presentan las principales
diferencias entre los sistemas transaccionales (OLTP) y los
basados en data warehouses (OLAP).
Transaccionales Basados en Data warehouse
Admiten el acceso simultáneo de muchos usuarios
(miles) que agregan y modifican datos.
Admiten el acceso simultaneo de muchos usuarios
(cientos) que consultan y no modifican datos
Representan el estado actual de una organización,
pero no guardan su historial.
Guardan el historial de una organización.
Contienen grandes cantidades de datos, incluidos
los datos extensivos utilizados para comprobar
transacciones.
Contienen grandes cantidades de datos, sumarizados,
consolidados y transformados. También de detalle
pero solo los necesarios para el análisis.
Tienen estructuras de base de datos complejas Tienen estructuras de base de datos simples.
Se ajustan para dar respuesta a la actividad
transaccional.
Se ajustan para dar respuesta a la actividad de
consultas.
Proporcionan la infraestructura tecnológica
necesaria para admitir las operaciones diarias de la
empresa.
Pueden combinar datos de orígenes heterogéneos en
una única estructura homogénea y simple, facilitando
la creación de informes y consultas.
Las consultas analíticas que resumen grandes
volúmenes de datos afectan negativamente a la
capacidad del sistema para responder a las
transacciones en línea.
Organizan los datos en estructuras simplificadas
buscando la eficiencia de las consultas analíticas más
que del proceso de transacciones.
El rendimiento del sistema cuando está
respondiendo a consultas analíticas complejas
puede ser lento o impredecible, lo que causa un
servicio poco eficiente a los usuarios del proceso
analítico en línea.
Contienen datos transformados que son válidos,
coherentes, consolidados y con el formato adecuado
para realizar el análisis sin interferir en la operación
transaccional diaria.
Los datos que se modifican con frecuencia
interfieren en la coherencia de la información
analítica.
Proporcional datos estables que representan el
historial de la empresa. Se actualizan periódicamente
con datos adicionales, no como las transaccionales
frecuentes.
La seguridad se complica cuando se combina
análisis en líneas con el proceso de transacciones
en línea.
Simplifican los requisitos de seguridad.
Tabla 1: Diferencias entre sistemas OLTP y OLAP.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
40
2.9.4. Herramientas de acceso de la Inteligencia de Negocios
La información almacenada en un data warehouse, seria
intrascendente, si ésta no pudiera ser accedida por los usuarios,
para ello existen herramientas que permiten tratar y visualizar la
información que reside en un data warehouse.
En la sección resaltada de la figura 6 se aprecia la
ubicación de las herramientas de acceso en una solución de
Inteligencias de Negocios.
Figura 6: Herramientas de acceso.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
41
Existen diferentes tecnologías que permiten aprovechar y
analizar la información almacenada en un data warehouse, siendo
el uso de los cubos OLAP la más extendida de ellas.
Los usuarios que toman decisiones necesitan analizar
información a distintos niveles de agregación y tener una visión
sobre múltiples dimensiones, por ejemplo, las ventas de
determinados productos por zonas, por tiempo, por clientes o por
región geográfica. Estos usuarios deben poder realizar este
análisis al máximo nivel de agregación o al máximo nivel de
detalle. Los cubos OLAP permiten realizar esto de modo a poder
aprovechar al máximo las posibilidades que ofrecen los data
warehouses.
A estos tipos de análisis se los denomina
multidimensionales, ya que permiten el análisis de un hecho en
particular desde distintas dimensiones. Esta es la mejor forma de
analizar la información por parte de los tomadores de decisiones,
ya que los modelos de negocio habitualmente son
multidimensionales.
Las herramientas que se utilizan para la visualización de la
información,son totalmente independientes a la forma en la que
ésta se haya almacenado.
Las formas de acceso de las herramientas OLAP son:
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
42
 Cliente/Servidor: esto significa tener instalado en la
maquinas cliente, el aplicativo que va conectarse al
servidor donde se almacenan la información que generan
los cubos OLAP.
 Acceso web: en este tipo de acceso, el navegador es el que
se comunica con un servidor web, el cual se comunica con
el servidor OLAP donde se almacena la información que
generan los cubos.
2.10. Principales herramientas de la Inteligencia de Negocios
 Generadores de informes: estos son utilizados por desarrolladores
profesionales para crear informes estandarizados enfocados a
departamentos, grupos interdepartamentales o la organización.
 Herramientas de usuario final de consultas e informes: estas son
utilizados por los usuarios finales para crear informes para su
propio uso o para otros usuarios; no requieren programación.
 Herramientas OLAP: estas permiten a los usuarios finales
manipular la información de forma multidimensional para poder
visualizarla desde distintas perspectivas y en función a los criterios
que el usuario considere importantes.
 Herramientas de cuadros de mandos: estas permiten a los usuarios
finales visualizar información crítica para el desempeño de manera
rápida, valiéndose para ello de gráficos, ofreciendo la posibilidad
de visualizar alguna sección con más en detalle.
 Herramientas de minería de datos: estas permiten a los analistas de
negocio crear modelos estadísticos. La minería de datos es el
proceso para descubrir e interpretar patrones ocultos a simple vista
en un gran cúmulo de información. Los usos más habituales de la
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
43
minería de datos son: segmentación, clasificación, previsiones,
agrupación, etc.
2.11. Minería de datos
2.11.1. Conceptos e historia de la minería de datos
El termino minería de datos, desde el enfoque académico
es una de las etapas dentro del proceso de Knowledge Discovery
in Databases(en adelante KDD).
Básicamente la minería de datos consiste en nutrirse de las
ventajas de cada aérea como la estadística, inteligencia artificial,
computación gráfica, bases de datos y procesamiento masivo,
utilizando como materia prima las bases de datos operaciones.
Definición tradicional de minería de datos: “[..]esun
proceso no trivial de identificación válida, novedosa,
potencialmente útil y entendible de patrones comprensibles que
se encuentran ocultos en los datos” (FAYYAD,U 1.996).
Desde el punto de vista empresarial, la minería de
datos se define como: “[..]La integración de un conjunto de
áreas que tienen como propósito la identificación de un
conocimiento obtenido a partir de las bases de datos que aporten
un sesgo hacia la toma de decisión” (MOLINA, L 2.001).
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
44
La idea de la minería de datos viene desde los años 60,
cuando los estadísticos de esa época manejaban términos como
data fishing, data mining o data archeology,más tarde en los años
80, Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory
Piatetsky-Shapiro, entre otros empezaron a fortalecer los términos
de data mining y KDD.
A finales de los años 80 solo existían un par de empresas
quienes se dedicaban a esta tecnología; para el 2.002 este número
se multiplicó considerablemente, ya que existían más de 100
empresas en el mundo con un portafolio de más de 300 soluciones
que utilizaban la tecnología.
La minería de datos no es un gran software ni algo
parecido, más bien la tecnología está compuesta por etapas que
integran diferentes áreas. Tanto así que para el desarrollo de un
proyecto de minería de datos, se utilizan diferentes aplicaciones
de software para las distintas etapas.
En la actualidad podemos encontrar una variedad
importante de herramientas o aplicaciones comerciales y no
comerciales con una utilería interesante, pero casi siempre es
necesario complementar con otras herramientas para el desarrollo
de la minería de datos.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
45
2.11.2. Los fundamentos de la minería de datos.
Las técnicas de minería de datos, se considera al resultado
de un proceso de investigación y desarrollo de productos.
La evolución comenzó cuando las organizaciones
empezaron a guardar sus datos en las computadoras, esto fue
creciendo cuando se mejoraron el acceso a los datos permitiendo
al usuario navegar y explorar en tiempo real sus datos.
La minería de datos tomando este proceso de evolución
está lista para ser implementada en las organizaciones, utilizando
estas tres tecnologías que ya están muy consolidadas como pilares
de su aplicación:
 Recolección masiva de datos.
 Potentes computadoras con multiprocesadores.
 Algoritmos de minería de datos.
2.11.3. Objetivos de la minería de datos
Examinar, analizar y buscar patrones ocultos en los datos
acumulados en las profundidades de las bases de datos o en
almacenes de datos que contienen datos históricos que ha
generado una organización durante su existencia.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
46
2.11.4. Entorno de la minería de datos
La minería de datos normalmente utiliza la arquitectura
cliente-servidor.
La minería de datos a través de sus herramientas ayuda a
extraer información oculta, archivos acumulados en las bases de
datos operaciones y/o almacenes de datos de las grandes
corporaciones públicas y privadas.
Los usuarios de la minería de datos normalmente no
cuentan con ninguna habilidad de programación, por los cual se
valen de las poderosas herramientas para efectuar consultas adhoc
y obtener respuestas en tiempo real.
La minería de datos es capaz de producir seis tipos de
información:
 Asociaciones.
 Agrupamientos.
 Clasificaciones.
 Pronósticos.
 Secuencias.
 Clasificaciones.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
47
2.11.5. El alcance de la minería de datos
La minería de datos consiste en buscar valiosas
informaciones en grandes bases de datos. Este proceso requiere
explorar grandes cantidades de datos y analizarlos
minuciosamente hasta encontrar las informaciones requeridas.
En las bases de datos de gran volumen y calidad, la
minería de datos puede proporcionarnos oportunidades de
negocio con las siguientes posibilidades:
 Pronóstico de comportamiento a futuro: la minería de
datos proporciona la automatización del proceso de
obtención de información predecible en bases de datos de
gran volumen, estos pronósticos pueden ser la predicción
de las ventas, posibles problemas financieros, similitudes
de necesidades de los clientes y un sinfín de predicciones
que el negocio requiera.
 Las herramientas para visualizar, examinar y realizar el
análisis de los resultados.
2.12. Reseña histórica del Grupo Flayp
En el año 1.983 tras el cierre de las actividades en Paraguay de la
Multinacional AVON Cosmetics Inc., se crea Flayp S.R.L., con el objetivo
de convertirse en una empresa nacional para la venta y distribución de los
productos AVON, adquiriendo para esto la franquicia de dicha marca, tiene
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
48
como visión ser la empresa líder en venta directa y comercialización de
artículos de belleza, llegando a cada rincón del Paraguay, ofreciendo
calidad y excelencia a sus clientes.
En sus inicios contaba con 5 empleados y 120 revendedoras. En la
actualidad la empresa Flayp S.R.L. se transformó en el Grupo Flayp,
compuesto por las siguientes empresas: Flayp S.R.L.; Virú S.R.L.;
Flayprint S.A.; City Sport S.A.; Cima Seis S.A.; Flaypnort S.A., las cuales
si bien están nucleadas en un directorio, son totalmente independientes
administrativa, económica y operativamente entre sí.
Hoy en día el Grupo Flayp cuenta con más de 700 empleados
directos y más de 30.000 revendedoras a lo largo de todo el país. A más del
directorio, compuesto actualmente por sus 6 miembros fundadores, el
Grupo cuenta con un gerente general, y para cada una de las empresas un
gerente en cada área estratégica (Marketing, Ventas, Compras,
Administrativo, Logística, Tecnología e Información).
En cuanto a tecnología, el Grupo cuenta en la actualidad con 5
servidores, 2 de los cuales son utilizados para albergar en forma
independiente cada uno de los sistemas de procesamiento de pedidos,
facturación y cuenta corriente de cada una de las empresas, dichos
sistemas informáticos se encuentran desarrollados en distintos lenguajes de
programación y distintos orígenes de datos, además de eso, cuenta con una
conexión Virtual Private Network (en adelante VPN), con muchas de las
sucursales en el interior del país y el área metropolitana, las cuales realizan
sus transacciones directamente a las bases de datos contenidas en los
servidores, las agencias que no cuentan con acceso a internet, envían sus
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
49
pedidos utilizando los vehículos de la empresa, dichos pedidos son
procesados en un centro de procesamiento.
Actualmente el Grupo Flayp maneja un volumen de compras
cercano a los 10.000.000 u$s anuales (comprende las dos principales
empresas del Grupo; Virú S.R.L. y Flayp S.R.L.) y un volumen de ventas
que ronda los 24.000.000 u$s anuales. En cuanto a unidades vendidas, las
mismas superan los 7.000.000 anuales. Con una proyección de crecimiento
entre el 10% y el 14% anual. El Grupo Flayp cuenta con una casa central
en Asunción, además de contar con más de 45 agencias distribuidas en
todo el país, logrando así una cobertura total, posee 2 depósitos que
albergan las mercaderías, además de una flota de camiones, los cuales son
utilizados para la distribución de los productos.
El Grupo empresarial cuenta con un equipo de ventas, liderados por
su gerente de ventas, quien tiene a su cargo a 4 gerentes divisionales, los
cuales se dividen la cobertura del país en 4 grandes regiones, además
cuenta con más de 350 zonas, las cuales están distribuidas en cada una de
las 4 divisiones y que su vez se encuentran presentes en todos los
departamentos del país, cada zona es gerenciada por una promotora de
ventas y que a su vez tienen a su cargo el manejo de las 30.000
revendedoras. Por otro lado cabe mencionar que el sistema de venta directa
tiene una dinámica diferente a la venta convencional, el mismo consiste en
ofrecer sus productos a través de folletos los cuales son ofrecidos por las
revendedoras, la vigencia promedio de cada folleto es de 18 días, esto lleva
a tener 20 folletos por año, que son denominadas campañas, por lo tanto la
facturación se maneja por campañas y no así por fecha calendario. De esto
se desprende que toda la información que manejan las empresas del
grupo, corresponden a este esquema organizacional.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
50
2.13. Reseña histórica del software libre
En los primeros pasos de la informática, los programas y las
máquinas utilizadas para su ejecución estaban estrechamente ligados. No
se concebía el concepto de programa como elemento separado tal cual se
tiene hoy en día.
Tampoco existían usuarios comunes, sino que la totalidad de las
personas que ejecutaban los programas tenían grandes conocimientos de
programación y por lo general eran ingenieros y científicos, una costumbre
muy practicada entre estos usuarios, era intercambiar y mejorar los
programas, distribuyendo sus modificaciones.
No fue hasta los últimos años de la década del 70, cuando las
empresas comenzaron con la costumbre de imponer restricciones a los
usuarios, con la implementación de los acuerdos de licencia.
2.13.1. Richard Stallman y el proyecto GNU
Para empezar a entender todo lo que implica el software
libre, es imprescindible hablar de Richard Stallman. Este físico
graduado en 1.974 en la Universidad de Harvard, se encontraba
trabajando en los laboratorios de inteligencia artificial del
Instituto de Tecnología de Massachussetts(en adelante MIT)
desde el año 1.971.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
51
La impresora con la que contaban en su laboratorio tenía
algunos inconvenientes con la alimentación del papel, lo que
hacía que se atascara de forma permanente y no había forma de
descubrirlo más que acercarse hasta donde se encontraba la
misma.
Por este motivo, Stallman contacta con la empresa
fabricante de la impresora, con el propósito de modificar el
software que se encargaba de controlar a la impresora y lograr
hacer que la misma mande una señal cuando se atascaba,
consiguiendo con esto que no se perdiese tanto tiempo de trabajo.
Ante este pedido, los fabricantes se negaron a entregarle el
código fuente, los cuales son imprescindibles para poder
modificar su comportamiento. Esta situación hace que termine de
tomar forma su idea de que el código fuente de los programas
debía ser accesible para todo aquel que quisiese.
Movilizado por esta inquietud, Stallman decidió
abandonar el MIT a comienzos de 1.984, para dar inicio al
proyecto GNU, el mismo es un acrónimo recursivo que significa
GNU's Not Unix, GNU No Es Unix, haciendo referencia a que el
proyecto tenía como objetivo desarrollar un sistema operativo tipo
Unix, pero totalmente libre.
Tiempo después Stallman funda la Free Software
Foundation (en adelante FSF), entidad encargada de promocionar
el desarrollo y uso del software libre, en 1.985 Stallman creó la
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
52
licencia General Public License (en adelante GPL) como
mecanismo para proteger el software libre, sustentado sobre el
concepto de copyleft, la FSF tiene un registro de todas licencias
compatibles con la licencia GNU (la más popular de las licencias
de software libre) y aquellas que, no siendo compatibles con ella,
son consideradas licencias de software libre.
En sus comienzos, el proyecto GNU se concentra en
desarrollar las herramientas necesarias para construir un sistema
operativo, como ser editores y compiladores y en las utilidades
básicas para la gestión del sistema.
A través del concepto de copyleft, se busca una alternativa
a la idea del copyright, siendo que “todo el mundo tiene derecho a
ejecutar un programa, copiarlo, modificarlo y distribuir las
versiones modificadas, pero no tiene permiso para añadir sus
propias restricciones al mismo”. De esta forma, las libertades que
definen al software libre están garantizadas para todo el mundo
que tenga una copia, tornándose en derechos inalienables.
2.13.2. Software Libre
Lo primero que debe entenderse cuando se habla
desoftware libre, es que no se está hablando de software gratis, el
alcance de la palabra libre es mucho más abarcativa, se refiere a la
libertad de los usuarios para ejecutar, copiar, distribuir, estudiar,
cambiar y mejorar el software. De modo más preciso, se refiere a
cuatro libertades de los usuarios del software. (GNU, 2008).
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
53
Es entonces que se tiene dentro de las distintas
clasificaciones de software, una muy determinante, como lo es
clasificar al software de acuerdo a su “filosofía”.
Softwarepropietario: se entiende por esto, el software cuya
propiedad absoluta continua en poder de quien tiene sus derechos
y no del usuario, quien solo puede utilizarlo cumpliendo ciertas
condiciones. Siendo así que su uso, distribución y/o modificación
total o parcial, están prohibidos o restringidos de tal manera que
no es posible llevarlos adelante. Es decir, que el software
comercializado bajo este tipo de licencias le da al usuario
derechos limitados sobre su usufructo, el alcance de esto es
establecido por el autor o quien posea ese derecho.
Software libre: se considera así, al software que le otorga
al usuario la libertad de utilizarlo, mejorarlo, estudiarlo, adaptarlo
a sus necesidades y redistribuirlo libremente, con la única
limitación de no sumarle ningún tipo de restricción agregado al
software luego de modificado. Es importante destacar que para
considerar a un software como libre, se debe permitir el acceso al
código fuente, por cuanto esto es una condición imprescindible
para ejercer las libertades de estudiarlo, modificarlo, mejorarlo y
adaptarlo (FSF, 2009).
Cuando se habla de softwarelibre es necesario hacer
mención a las cuatro libertades básicas de su filosofía según la
Fundación de Software Libre.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
54
2.13.3. Libertades básicas del software libre
Libertad cero: “usar el programa con cualquier propósito”.
Esta libertad es la que garantiza que se puede utilizar el programa
para cualquier fin, sea este comercial, educativo, cultural, etc.
Esta libertad está en contraposición a las licencias que limitan la
utilización del software a un propósito determinado, o que
restringen su uso para ciertas actividades.
Libertad uno: “Estudiar cómo funciona el programa, y
adaptarlo a nuestras necesidades”. Esto se traduce en que se puede
estudiar el funcionamiento (para ello se debe tener acceso al
código fuente del programa) lo que permitirá, descubrir
funcionalidades ocultas, conocer de qué manera realiza
determinada tarea, averiguar que otras opciones tiene, que más se
le puede agregar, etc. El hecho de poder adecuar el programa,
implica que se pueden eliminar partes que no se necesitan,
agregarle elementos que se consideren importantes, etc.
Libertad dos: “Distribuir copias”. Esto quiere decir que se
tiene la libertad redistribuir el programa, ya sea de forma gratuita
o cobrando por el servicio, pudiendo realizar esto por e-mail, CD,
o algún medio de almacenamiento, ya sea a una persona o a
varias, etc.
Libertad tres: “Mejorar el programa, y liberar las mejoras
a todos”. Por esto se entiende que se tiene la libertad de mejorar el
programa, traduciéndose esto en menores los requerimientos de
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
55
hardware para funcionar, un software con mayores prestaciones,
que ocupe menos espacio en disco, etc.
2.13.4. Software libre y software de código abierto
Barahona, Seona y Robles (2.008) señalan que Open
Source como Free Software en realidad son movimientos sociales,
motivados por lo que se puede o se debería poder hacer
(derechos) con los programas (software). Entre estos dos
movimientos existen diferencias filosóficas pero realmente pocas
diferencias prácticas.
La primera diferencia que existe entre estos movimientos,
radica en la visión que tienen del software, Free Software tiene
una visión moral “el software debería ser libre” Open Source tiene
una visión práctica “el software es mejor si su código es abierto“.
Free Software en realidad hace referencia a software libre
(de ninguna manera a software gratis) y está sustentado en
fundamentos morales. Las libertades en las que basa su
concepción hacen referencia que puedas utilizar un programa,
pero que también puedas copiarlo, distribuirlo, estudiarlo o
modificarlo sin ningún tipo de restricción. Desde su punto de
vista, limitar cualquiera de estas libertades es inmoral.
Open Source por su parte se refiere a la limitación de
acceso al código fuente del software, el hecho distribuir el código
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
56
fuente del software alienta, según los promotores del open source,
un software de mayor calidad, más seguro y creativo, el cual
evoluciona de forma más ágil y está orientada a satisfacer las
necesidades de sus usuarios.
En algo en lo cual coinciden tanto Free Software como
Open Source es que ambos no ponen reparos en que la gente
venda software, eso sí, lo que se vende no es la licencia del
software en sí, sino que se vende el servicio de entregar el
software (muchas veces se vende empaquetado, con manuales,
instalado u otro valor agregado).
Para los dos movimientos, ante la venta de un softwarede
desarrollo propio o desarrollado por otros, no se puede restringir
al comprador, para que éste no pueda a su vez venderlo o
inclusive regalarlo y debe entregarse el código fuente y permitir
su modificación, para poder ser considerado Free Software u
Open Source.
Se entiende por licencias de software al contrato existente
entre dos personas (proveedor y usuario) en el cual se describen y
puntualizan los derechos y deberes sobre el uso que se le puede
dar al software.
Aunque ciertamente, Open Source y Software Libre tienen
prácticamente las mismas licencias, la FSF opina que el
movimiento Open Source es filosóficamente diferente del
movimiento del Software Libre. La Open Source Initiative(en
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
57
adelante OSI) surgió en el año 1.998, en ese entonces un grupo de
personas encabezados por Eric S. Raymond y Bruce Perens
buscan otorgar mayor importancia a los beneficios en que
redundaría el hecho de compartir el código fuente de los
programas, como así también lograr captar el interés de las
grandes casas de software y otras empresas de la industria de la
alta tecnología en ese rumbo.
La visión que tienen ambos movimientos, es una de las
principales diferencias, mientras que el movimiento del software
libre pone el foco en los aspectos éticos o morales del software,
dejando a un segundo plano la excelencia técnica siendo su mayor
deseo el plano ético. En tanto movimiento Open Source centraliza
más su mirada hacia la excelencia técnica como el principal
objetivo, basándose en el hecho compartir el código fuente un
medio para lograr dicho fin.
Un punto a tener en cuenta es que el software en sí mismo,
no es ni Free Software ni Open Source, solo la licencia del
software es la que puede ser reconocida por ambos movimientos
como válidas para sus fines. De hecho las mayorías de las
licencias aceptadas por uno de los movimientos son aceptadas por
el otro.
Aunque habitualmente los términos “software libre” y
“código abierto” son intercambiados fácilmente entre sí, no
significa que ambos términos sean equivalentes.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
58
2.13.5. Tipos de licencias de software libre
La licencia de software libre más utilizada es la GNU
General Public License (GPL), está presente en diversos
productos de software libre en sus versiones 2 y 3. Este tipo de
licencias a más de las cuatro libertades básicas del software libre
agrega una cláusula de “efecto viral”, gracias a la cual es posible
aunar varios productos de software exclusivamente si todos estos
utilizan la licencia GPL.
Ciertamente la licencia GPL no es la única licencia de
software libre. Existen muchas otras licencias derivadas de la
GPL como por ejemplo la Lesser General Public License(en
adelante LGPL) y la Affero GNU Public License(en
adelanteAGPL). La LGPL permite que el software bajo esta
licencia pueda utilizar librerías de licencia privativas (en esto se
diferencia de la GPL, con la cual puede utilizarse solo software
que tiene licencia GPL). Mientras que la AGPL dirigida al campo
del software ofrecido como servicio, y su principal característica
práctica está en el hecho de que, si un tercero utiliza el software
para brindar un servicio a varios usuarios y realiza modificaciones
al código original, está en la obligación de publicar dicho código
fuente.
Por el lado de las licencias de código abierto que
abiertamente no son licencias de software libre, ya que no son
compatibles con las libertades y principios básicos del software
libre de la GPL se puede mencionar a la Common Public
Attribution License Version 1.0 (en adelante CPAL). Esta licencia
admite el uso y la modificación del código fuente, siempre y
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
59
cuando se haga referencia al creador original del software, y por
tanto no podría ser utilizada por algún competidor.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
60
CAPÍTULO 3– MARCO METODOLÓGICO
3.1. Descripción de la profundidad y el diseño de la Tesis:
La investigación llevada a cabo para la realización del proyecto se
basó en un estudio descriptivo, se revisó exhaustivamente la literatura
existente relacionada, con el fin de obtener la información necesaria para
dar inicio al proyecto. Durante la investigación se recabo cuantiosa
información sobre las empresas Flayp S.R.L. y Virú S.R.L., pertenecientes
al Grupo Flayp, como así también acerca de la Inteligencia de Negocios,
software libre, open source, etc., y sobre todo las herramientas a utilizar
para el diseño y desarrollo del proyecto, las cuales sirvieron para llevar
adelante la tesis.
La presente tesis está basada en un diseño cualitativo, donde los
datos se describieron detalladamente teniendo en cuenta el objeto de
estudio. Patton (1.980), mencionado en el libro de investigación de
Hernandez Sampieri y Col (2.003).
Cabe destacar que para la realización del presente proyecto se
analizaron detalladamente todos los requerimientos y en base a los
conocimientos básicos, más las investigaciones realizadas, junto con los
relevamientos del sistema actual que se posee, además del hardware con el
que cuentan las empresas, se definió la solución que mejor se adecua al
contexto actual, para luego definir las etapas necesarias para llevar
adelante la realización de la tesis.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
61
3.2. Descripción de cómo se realizó la Tesis
Para el desarrollo de la tesis, se optó por el modelo de ciclo de vida
en cascada ya que es este, el que mejor se adapta a la realización del
proyecto de tesis.
En este sentido, “[…] el modelo en cascada, algunas veces
llamado el ciclo de vida clásico, sugiere un enfoque sistemático,
secuencial hacia el desarrollo del software, que se inicia con la
especificación de requerimientos del cliente y que continúa con la
planeación, el modelado, la construcción y el despliegue, para culminar
en el soporte del software terminado”(Pressman, R.2005:50).
El mismo consiste en el ordenamiento secuencial de las etapas del
proceso para el desarrollo del software, teniendo en cuenta que debe
aguardarse la finalización de una etapa inmediatamente anterior, antes de
poder dar inicio a una siguiente etapa, de ser necesario pueden realizarse
retroalimentaciones de etapas anteriores, a fin de minimizar impactos
negativos. Las etapas definidas para este proyecto son las siguientes:
relevamiento de datos, análisis de datos, diseño, desarrollo, prueba e
implementación.
Para el análisis de los procesos se diseñó una WBS (Work
Breakdown Structure), donde se puede apreciar la descripción jerárquica
de los trabajos a realizar para la concreción de la tesis, la misma puede
observarse en el Anexo 1.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
62
3.2.1. Relevamiento de datos
Se concretaron reuniones con los miembros del directorio
del Grupo Flayp, de igual manera se realizaron entrevistas
personalizadas a los gerentes de cada área, se relevaron los
procesos realizados diariamente en los sistemas operacionales por
medio de observaciones de los manuales de procesos; gracias a
las entrevistas realizadas a los gerentes, se definieron los criterios
que son utilizados para la toma de decisiones, de manera a poder,
a través de la concreción del proyecto, brindar un soporte para
optimizarla toma de dichas decisiones.
En cuanto a software, se observó el funcionamiento de los
sistemas actualmente utilizados, y la manera en la que estos
interactúan con todas y cada una de las áreas de las empresas, en
esta instancia se relevó con especial atención todo lo que respecta
a la estructura de datos, así también la infraestructura base en
cuanto a softwarey hardware existente.
3.2.2. Análisis de datos
Una vez finalizada la tarea de relevamiento de datos, y ya
con toda la información necesaria, se llevó a cabo un análisis
minucioso de las necesidades e inquietudes de los futuros
usuarios del sistema, esto más la información sobre la tecnología
con la que se cuenta, nos dio las bases para definir que la mejor
opción que se adecua a dichas necesidades radica en la
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
63
implementación de una solución de Inteligencia de Negocios, ya
que dicha solución brindará un soporte para la toma de decisiones
estratégicas, como así también brindar una visión macro de ambas
empresas en conjunto, que será de mucha utilidad para los altos
niveles ejecutivos, ya que los datos se encuentran dispersos en
diferentes formatos de almacenamiento, lo que dificulta la
realización de análisis, para lo cual no se trabajará de manera
directa con las bases de datos transaccionales.
La utilizaciónde un data warehousepermitirá cohesionar
los datos de las distintas fuentes, la misma se desarrollará
íntegramente sobre softwarelibre, se llegó a esta conclusión luego
de analizar detenidamente las soluciones propietarias existentes
en el mercado, los requerimientos tanto de software como de
hardware que son necesarios para la implementación de la
solución, son altamente compatibles con los que ya se cuentan, se
prevén todas las medidas de seguridad en aplicaciones web,
también se harán uso de las nuevas tecnologías existentes, con el
fin de optimizar y agilizar el acceso a los datos en considerables
niveles de tiempo.
3.2.3. Diseño
Con el afán de obtener un prototipo coherente que
satisfaga los requerimientos relevados y analizados en etapas
anteriores, se llevó a cabo el diseño conceptual, lógico y físico del
prototipo de solución de Inteligencia de Negocios, comenzando
por el data warehouse, los procesos de ETL, reportes, cubos
multidimensionales, cuadros de mandos y demás componentes,
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
64
como ser la arquitectura de la herramienta y del prototipo en el
contexto general.
3.2.4. Desarrollo
Ya con toda la documentación resultante de la etapa de
diseño, se procedió a desarrollar el proyecto, se inició con el
desarrollo el data warehouse, cuyo objetivo es unificar los datos
obtenidos de las distintas fuentes transaccionales, para ello se
eliminan las ambigüedades e inconsistencias, a través de un
proceso de extracción, transformación y cargado de los datos en
eldata warehouse. Se diseñaron y publicaron en el servidor los
cubos OLAP, los cuadros de mando, los reportes y el resultado de
la minería de datos, para lo cual se aplicó el algoritmo
seleccionado.
Se configuró e implementó el servidor, para que los
usuarios puedan acceder a los distintos módulos, ya sean estos de
reportes, análisis, etc., asítambién se otorgaron los privilegios
necesarios a los informes y a las carpetas contenedoras. Se
configuró e implementó la consola de administración, de manera
tal a poder administrar tanto los usuarios como los roles
asignados. En cada una de las etapas de configuración e
implementación del proyecto, se tomaron en cuenta todas las
políticas y estándares de seguridad en cuanto a aplicaciones
cliente-servidor se refiere, como ser, manejo de sesiones,
administración de perfiles, permisos de usuario, etc.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
65
3.2.5. Prueba
Se realizaron las pruebas correspondientes, se
corroboraron los resultados obtenidos, si cumplen con los
requerimientos y la fiabilidad de los mismos, además se
realizaron pruebas exhaustivas en cuanto a concurrencia de
acceso al sistema, conectividad, tiempo de respuesta, nivel de
seguridad, etc.
3.2.6. Implementación
Los componentes del prototipo de la solución, se
instalaron y configuraron en una máquina preparada para actuar
de servidor, el mismo está compuesto por, la consola de
administración de Pentaho, el servidor Pentaho, los componentes
de Pentaho Data Integration (en adelante PDI) y se configuró la
periodicidad de la actualización del data warehouse, y el Sistema
Gestor de Base de Datos (en adelante SGBD) MySQL, donde se
almacenará el data warehouse, así también se crearon los perfiles
de usuario, con la asignación de roles y permisos
correspondientes, se configuraron los ordenadores-cliente para
acceder al sistema.
Inteligencia de Negocios Tesis de Grado Ingeniería en Informática
Universidad del Cono Sur de las Américas
66
3.3. Descripción de los instrumentos y procedimientos utilizados para la
recolección y tratamiento de la información
Para la elaboración de este proyecto se recolectaron los datos a
través de entrevistas semi-estructuradas a directores y gerentes del Grupo
Flayp,para obtener los permisos para acceder a la información, procesos y
los reportes necesarios para la toma de decisiones.
También se realizaronobservaciones directasde los distintos
procesos y sistemas operacionales automatizadosa fin de elaborar reportes
de requerimientos.
3.4. Descripción de la muestra
Para la realización de este proyecto, luego de un análisis de la
población, se optó por llevarlo adelante en las empresas del Grupo Flayp,
concretamente Viru S.A y Flayp S.R.L., en los departamentos de Ventas y
Marketing, la selección de las empresas y los departamentos se realizó
gracias a la buena predisposición e interés de los directivos de contar con
una herramienta que ayude a la toma de decisiones.
Las entrevistas se realizaron a los gerentes de Compras, Ventas,
Marketing, Finanzas y un director de las empresas seleccionadas. También
se realizaron observaciones directas de los distintos procesos y sistemas
operacionales automatizados.
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios
Tesis Prototipo de Sistema de Inteligencia de Negocios

Más contenido relacionado

La actualidad más candente

Plan cmmi app delivery
Plan cmmi  app deliveryPlan cmmi  app delivery
Plan cmmi app delivery
Gustavo Tantani Mamani
 
Flujogramas
FlujogramasFlujogramas
Flujogramas
Percy Rodrigo
 
Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)
Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)
Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)
rubenferm
 
Priorización de procesos
Priorización de procesosPriorización de procesos
Priorización de procesosjlcadena
 
11 Herramientas y Técnicas para recopilar Requisitos
11 Herramientas y Técnicas para recopilar Requisitos11 Herramientas y Técnicas para recopilar Requisitos
11 Herramientas y Técnicas para recopilar Requisitos
Carlos Alvarez G, PMP®
 
Notación de Gestión de Procesos de Negocio
Notación de Gestión de Procesos de NegocioNotación de Gestión de Procesos de Negocio
Notación de Gestión de Procesos de Negociouni
 
Ejemplo de presentación para inversionistas
Ejemplo de presentación para inversionistasEjemplo de presentación para inversionistas
Ejemplo de presentación para inversionistas
StartupLab MX
 
Matriz de validacion
Matriz de validacionMatriz de validacion
Matriz de validacion
Katy Alvarez Zegarra
 
Periodismo digital en Bolivia 2012- Observatorio de Medios
Periodismo digital en Bolivia 2012- Observatorio de MediosPeriodismo digital en Bolivia 2012- Observatorio de Medios
Periodismo digital en Bolivia 2012- Observatorio de Medios
Marisol Murillo Velásquez
 
Taller de riesgos PMI v2 0
Taller de riesgos PMI v2 0Taller de riesgos PMI v2 0
Taller de riesgos PMI v2 0
Roberto Benítez Gutiérrez
 
Creating entreprenual change - CIM Level 07
Creating entreprenual change - CIM Level 07Creating entreprenual change - CIM Level 07
Creating entreprenual change - CIM Level 07
Dinesh Tharanga
 
Manual del usuario bizagi
Manual del usuario bizagiManual del usuario bizagi
Manual del usuario bizagi
WILBERT AYMA CCANAHUIRE
 
Plan de comunicación
Plan de comunicaciónPlan de comunicación
Plan de comunicación
Angel Camargo
 
Modelado de procesos en bizagi modeler
Modelado de procesos en bizagi modelerModelado de procesos en bizagi modeler
Modelado de procesos en bizagi modeler
Osckr Almeida
 
BPMN estandar para modelamiento de procesos
BPMN estandar para modelamiento de procesosBPMN estandar para modelamiento de procesos
BPMN estandar para modelamiento de procesos
gugarte
 
Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04
Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04
Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04Dharma Consulting
 

La actualidad más candente (19)

Plan cmmi app delivery
Plan cmmi  app deliveryPlan cmmi  app delivery
Plan cmmi app delivery
 
CINTURON DE SEGURIDAD
CINTURON DE SEGURIDADCINTURON DE SEGURIDAD
CINTURON DE SEGURIDAD
 
Flujogramas
FlujogramasFlujogramas
Flujogramas
 
Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)
Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)
Diccionario Proyecto SIRES (TP 335-2012-1) (primer momento)
 
Priorización de procesos
Priorización de procesosPriorización de procesos
Priorización de procesos
 
11 Herramientas y Técnicas para recopilar Requisitos
11 Herramientas y Técnicas para recopilar Requisitos11 Herramientas y Técnicas para recopilar Requisitos
11 Herramientas y Técnicas para recopilar Requisitos
 
Notación de Gestión de Procesos de Negocio
Notación de Gestión de Procesos de NegocioNotación de Gestión de Procesos de Negocio
Notación de Gestión de Procesos de Negocio
 
Ejemplo de presentación para inversionistas
Ejemplo de presentación para inversionistasEjemplo de presentación para inversionistas
Ejemplo de presentación para inversionistas
 
Matriz de validacion
Matriz de validacionMatriz de validacion
Matriz de validacion
 
Periodismo digital en Bolivia 2012- Observatorio de Medios
Periodismo digital en Bolivia 2012- Observatorio de MediosPeriodismo digital en Bolivia 2012- Observatorio de Medios
Periodismo digital en Bolivia 2012- Observatorio de Medios
 
Presentacion seguimiento de proyectos
Presentacion seguimiento de proyectosPresentacion seguimiento de proyectos
Presentacion seguimiento de proyectos
 
Taller de riesgos PMI v2 0
Taller de riesgos PMI v2 0Taller de riesgos PMI v2 0
Taller de riesgos PMI v2 0
 
Creating entreprenual change - CIM Level 07
Creating entreprenual change - CIM Level 07Creating entreprenual change - CIM Level 07
Creating entreprenual change - CIM Level 07
 
Manual del usuario bizagi
Manual del usuario bizagiManual del usuario bizagi
Manual del usuario bizagi
 
Plan de comunicación
Plan de comunicaciónPlan de comunicación
Plan de comunicación
 
Modelado de procesos en bizagi modeler
Modelado de procesos en bizagi modelerModelado de procesos en bizagi modeler
Modelado de procesos en bizagi modeler
 
FLUJOGRAMAS
FLUJOGRAMASFLUJOGRAMAS
FLUJOGRAMAS
 
BPMN estandar para modelamiento de procesos
BPMN estandar para modelamiento de procesosBPMN estandar para modelamiento de procesos
BPMN estandar para modelamiento de procesos
 
Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04
Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04
Taller de MS Project 2010 para la Gestión de Proyectos - Sesión 04
 

Destacado

Modelo líneas de espera con canales múltiples
Modelo líneas de espera con canales múltiplesModelo líneas de espera con canales múltiples
Modelo líneas de espera con canales múltiplesHolpar
 
Caracteristicas de un sistema de lineas de espera
Caracteristicas de un sistema de lineas de esperaCaracteristicas de un sistema de lineas de espera
Caracteristicas de un sistema de lineas de esperaAlberto Carranza Garcia
 
Teoría de colas
Teoría de colasTeoría de colas
Teoría de colas
wen71
 
Introducción a la teoría de colas
Introducción a la teoría de colasIntroducción a la teoría de colas
Introducción a la teoría de colaspattyvelez
 
Introducción a los sistemas de inteligencia de mercados
Introducción a los sistemas de inteligencia de mercadosIntroducción a los sistemas de inteligencia de mercados
Introducción a los sistemas de inteligencia de mercados
UANL
 
Teoria de colas_luis_morales
Teoria de colas_luis_moralesTeoria de colas_luis_morales
Teoria de colas_luis_morales
unilfrez
 
Colas teoría
Colas teoríaColas teoría
Colas teoría
Amelia
 

Destacado (9)

Modelo líneas de espera con canales múltiples
Modelo líneas de espera con canales múltiplesModelo líneas de espera con canales múltiples
Modelo líneas de espera con canales múltiples
 
Caracteristicas de un sistema de lineas de espera
Caracteristicas de un sistema de lineas de esperaCaracteristicas de un sistema de lineas de espera
Caracteristicas de un sistema de lineas de espera
 
Teoría de colas
Teoría de colasTeoría de colas
Teoría de colas
 
Introducción a la teoría de colas
Introducción a la teoría de colasIntroducción a la teoría de colas
Introducción a la teoría de colas
 
Introducción a los sistemas de inteligencia de mercados
Introducción a los sistemas de inteligencia de mercadosIntroducción a los sistemas de inteligencia de mercados
Introducción a los sistemas de inteligencia de mercados
 
Intro sim
Intro simIntro sim
Intro sim
 
Teoria de colas_luis_morales
Teoria de colas_luis_moralesTeoria de colas_luis_morales
Teoria de colas_luis_morales
 
Colas teoría
Colas teoríaColas teoría
Colas teoría
 
PoblacióN Y Muestra
PoblacióN Y MuestraPoblacióN Y Muestra
PoblacióN Y Muestra
 

Similar a Tesis Prototipo de Sistema de Inteligencia de Negocios

Unversidad san-pedro
Unversidad san-pedroUnversidad san-pedro
Unversidad san-pedro
A Napholeon Barreto Lavado
 
Manual de organizacion afi
Manual de organizacion afiManual de organizacion afi
Manual de organizacion afiCecy Hernandez
 
UNEG-AS 2012-Inf2: El riesgo
UNEG-AS 2012-Inf2: El riesgoUNEG-AS 2012-Inf2: El riesgo
UNEG-AS 2012-Inf2: El riesgoUNEG-AS
 
PLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdf
PLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdfPLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdf
PLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdf
Josifat
 
Sistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECHSistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECH
Julio César Álvarez Reyes
 
Deuda tecnica en Lean Startup.en.es.pdf
Deuda tecnica en Lean Startup.en.es.pdfDeuda tecnica en Lean Startup.en.es.pdf
Deuda tecnica en Lean Startup.en.es.pdf
Nicanor Sachahuaman
 
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdfComunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
ShakinCrescenzi2
 
Sistema de venta de pasajes freee
Sistema de venta de pasajes freeeSistema de venta de pasajes freee
Sistema de venta de pasajes freee
JOSE LUIS GARAGATTI QUINTO
 
20130717JavierEslavaRios
20130717JavierEslavaRios20130717JavierEslavaRios
20130717JavierEslavaRiosJavier Eslava
 
Arianna celia frenes tesis completa
Arianna celia frenes tesis completaArianna celia frenes tesis completa
Arianna celia frenes tesis completa
Ary Celia
 
Heuristic Evaluations
Heuristic EvaluationsHeuristic Evaluations
Heuristic Evaluations
lorena_moreno
 
Heuristic evaluations
Heuristic evaluationsHeuristic evaluations
Heuristic evaluations
lorena_moreno
 
Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...
Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...
Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...
wlliavi
 
Plan-auditoría-SisInf-VASP-empresa-Smsamericas.pdf
Plan-auditoría-SisInf-VASP-empresa-Smsamericas.pdfPlan-auditoría-SisInf-VASP-empresa-Smsamericas.pdf
Plan-auditoría-SisInf-VASP-empresa-Smsamericas.pdf
CayoCasapaico1
 
Gomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentesGomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentes
Victor Velasquez
 
Gomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentesGomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentes
Hector Jhunior Cuadros Rodriguez
 
Propuesta de control de gestion interna
Propuesta de control de gestion internaPropuesta de control de gestion interna
Propuesta de control de gestion interna
Gustavo Rojas
 
Plan general de practicas pre profesionales i miguel
Plan general de practicas pre profesionales i miguelPlan general de practicas pre profesionales i miguel
Plan general de practicas pre profesionales i miguel
xxAngelaxx
 

Similar a Tesis Prototipo de Sistema de Inteligencia de Negocios (20)

Unversidad san-pedro
Unversidad san-pedroUnversidad san-pedro
Unversidad san-pedro
 
Manual de organizacion afi
Manual de organizacion afiManual de organizacion afi
Manual de organizacion afi
 
UNEG-AS 2012-Inf2: El riesgo
UNEG-AS 2012-Inf2: El riesgoUNEG-AS 2012-Inf2: El riesgo
UNEG-AS 2012-Inf2: El riesgo
 
PLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdf
PLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdfPLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdf
PLAN ESTRATÉGICO DE RELACIONES PÚBLICAS.pdf
 
catalago de software
catalago de softwarecatalago de software
catalago de software
 
Sistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECHSistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECH
 
Deuda tecnica en Lean Startup.en.es.pdf
Deuda tecnica en Lean Startup.en.es.pdfDeuda tecnica en Lean Startup.en.es.pdf
Deuda tecnica en Lean Startup.en.es.pdf
 
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdfComunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
 
Sistema de venta de pasajes freee
Sistema de venta de pasajes freeeSistema de venta de pasajes freee
Sistema de venta de pasajes freee
 
20130717JavierEslavaRios
20130717JavierEslavaRios20130717JavierEslavaRios
20130717JavierEslavaRios
 
Arianna celia frenes tesis completa
Arianna celia frenes tesis completaArianna celia frenes tesis completa
Arianna celia frenes tesis completa
 
Heuristic Evaluations
Heuristic EvaluationsHeuristic Evaluations
Heuristic Evaluations
 
Heuristic evaluations
Heuristic evaluationsHeuristic evaluations
Heuristic evaluations
 
Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...
Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...
Ac fr ogbsw4omqm65azopuegm6zugpnpfchgf2ofedskxlwjrodlbrus7py_mjk61m6cjbzzeqdg...
 
Plan-auditoría-SisInf-VASP-empresa-Smsamericas.pdf
Plan-auditoría-SisInf-VASP-empresa-Smsamericas.pdfPlan-auditoría-SisInf-VASP-empresa-Smsamericas.pdf
Plan-auditoría-SisInf-VASP-empresa-Smsamericas.pdf
 
Gomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentesGomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentes
 
Gomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentesGomez alvarez jesus_gestion_incidentes
Gomez alvarez jesus_gestion_incidentes
 
Propuesta de control de gestion interna
Propuesta de control de gestion internaPropuesta de control de gestion interna
Propuesta de control de gestion interna
 
Tesis luis iribarne
Tesis luis iribarneTesis luis iribarne
Tesis luis iribarne
 
Plan general de practicas pre profesionales i miguel
Plan general de practicas pre profesionales i miguelPlan general de practicas pre profesionales i miguel
Plan general de practicas pre profesionales i miguel
 

Último

Educar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdfEducar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdf
Demetrio Ccesa Rayme
 
Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
danitarb
 
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
20minutos
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
pablomarin116
 
El fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docxEl fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docx
Alejandrino Halire Ccahuana
 
Proceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de PamplonaProceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de Pamplona
Edurne Navarro Bueno
 
Introducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BIIntroducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BI
arleyo2006
 
El Liberalismo económico en la sociedad y en el mundo
El Liberalismo económico en la sociedad y en el mundoEl Liberalismo económico en la sociedad y en el mundo
El Liberalismo económico en la sociedad y en el mundo
SandraBenitez52
 
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptxc3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
Martín Ramírez
 
Sesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdfSesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdf
https://gramadal.wordpress.com/
 
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdfTestimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Txema Gs
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
JAVIER SOLIS NOYOLA
 
Portafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPNPortafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPN
jmorales40
 
Fase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcionalFase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcional
YasneidyGonzalez
 
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
UNIDAD DE APRENDIZAJE DEL MES  Junio 2024UNIDAD DE APRENDIZAJE DEL MES  Junio 2024
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
EdwardYumbato1
 
PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.
https://gramadal.wordpress.com/
 
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de MadridHorarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
20minutos
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
GallardoJahse
 
Mapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativaMapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativa
TatianaVanessaAltami
 
Fase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometricoFase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometrico
YasneidyGonzalez
 

Último (20)

Educar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdfEducar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdf
 
Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
 
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
 
El fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docxEl fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docx
 
Proceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de PamplonaProceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de Pamplona
 
Introducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BIIntroducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BI
 
El Liberalismo económico en la sociedad y en el mundo
El Liberalismo económico en la sociedad y en el mundoEl Liberalismo económico en la sociedad y en el mundo
El Liberalismo económico en la sociedad y en el mundo
 
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptxc3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
 
Sesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdfSesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdf
 
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdfTestimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdf
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
 
Portafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPNPortafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPN
 
Fase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcionalFase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcional
 
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
UNIDAD DE APRENDIZAJE DEL MES  Junio 2024UNIDAD DE APRENDIZAJE DEL MES  Junio 2024
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
 
PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.
 
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de MadridHorarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
 
Mapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativaMapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativa
 
Fase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometricoFase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometrico
 

Tesis Prototipo de Sistema de Inteligencia de Negocios

  • 1. Ingeniería en Informática Tesis de Grado Prototipo de Sistema de Inteligencia de Negocios utilizando Minería de Datos sobre Software Libre Nicolás Chávez Christian Bavera Tutor: Lic. Denise Riveros Asunción – Paraguay 2.013
  • 2. RESUMEN El propósito de este proyecto fue demostrar la factibilidad de la realización de un prototipo de solución de Inteligencia de Negocios basado en software libre y minería de datos, enfocado a dar soporte a la toma de decisiones estratégicas del Grupo Flayp, ya que sus empresas almacenan sus datos en fuentes y formatos diferentes. Para ello se relevaron los sistemas actuales,procesos, requerimientos y tecnologías vigentes. Logrando la concreción del prototipo, utilizando para ello las herramientas disponibles bajo licencia de software libre. Evidenciando que estas herramientas, son una alternativa válida para soluciones de este tipo, sin la necesidad de incurrir en gastos por el pago de licencias de software propietario. Palabras Claves: inteligencia de negocios, software libre, minería de datos.
  • 3. DEDICATORIA Dedico este esfuerzo personal y este logro académico y profesional: A mis padres Nicolás y María del Carmen, quienes con su ejemplo me enseñaron que todo es posible si uno se propone, sin ellos, jamás hubiese podido conseguir este objetivo A mis hermanos, compañeros de clases y amigos, porque de ellos también he aprendido. Nicolás Chavez Espínola A mis padres, porque siempre creyeron en mí y porque me sacaron adelante, dándome ejemplos dignos de superación y entrega, porque en gran parte gracias a ustedes, hoy puedo ver alcanzada mí meta. A mi familia, por ser soporte fundamental en las etapas complicadas, que fueron muchas. A mi novia, por comprenderme y apoyarme siempre y en todo momento. A mis compañeros de la facultad, que compartieron esta carrera que por momentos parecía infinita. A todos, espero no defraudarlos y contar siempre con su valioso apoyo, sincero e incondicional. Todo este trabajo ha sido posible gracias a ellos. Christian Bavera
  • 4. AGRADECIMIENTOS Primero antes que nada, damos gracias a Dios, por estar con nosotros en cada paso que dimos, por fortalecer nuestros corazones e iluminar nuestras mentes y haber puesto en nuestro camino a aquellas personas que han sido soporte y compañía durante todo el periodo de estudio. A nuestros profesores quienes nos han enseñado a ser mejores en la vida y a realizarnos profesionalmente. Un agradecimiento especial a nuestra asesora la Lic. Denise Riveros por hacer posible esta tesis. A los compañeros de clases quienes nos acompañaron en esta trayectoria de aprendizaje y conocimientos. Al Grupo Flayp, por permitirnos realizar este proyecto, poniéndose a nuestra disposición y brindándonos todas las facilidades desde el primer al último día en que así lo requerimos En general quisiéramos agradecer a todas y cada una de las personas que han vivido con nosotros la realización de esta tesis.
  • 5. ÍNDICE CAPITULO 1 - INTRODUCCIÓN ..................................................................... 13 1.1. Planteamiento del Problema ................................................................... 13 1.2. Necesidad de estudiar el problema. ........................................................ 14 1.3. Significación del problema ..................................................................... 14 1.4. Delimitación del problema...................................................................... 14 1.5. Objetivos de la Tesis: .............................................................................. 15 1.5.1. Objetivo General............................................................................. 15 1.5.2. Objetivos Específicos...................................................................... 15 1.6. Definición de términos............................................................................ 16 1.7. Presentación del esquema ....................................................................... 17 CAPITULO 2–MARCO TEÓRICO..................................................................... 19 2.1. El valor de la información....................................................................... 19 2.2. Necesidad de información y conocimiento en la empresa...................... 20 2.3. La información que las empresas necesitan............................................ 21 2.4. Las organizaciones y los distintos sistemas de información................... 24 2.5. Definición de Inteligencia de Negocios.................................................. 26 2.6. Los usuarios de las soluciones de Inteligencia de Negocios................... 27 2.7. Historia de la Inteligencia de Negocios .................................................. 28 2.8. Características de la Inteligencia de Negocios........................................ 30 2.9. Componentes de una solución de Inteligencias de Negocios ................. 31 2.9.1. Las fuentes de información a las que se puede acceder son: .......... 32 2.9.2. Proceso de extracción, transformación y carga............................... 33 2.9.3. Data warehouse............................................................................... 35 2.9.4. Herramientas de acceso de la Inteligencia de Negocios ................. 40 2.10. Principales herramientas de la Inteligencia de Negocios........................ 42 2.11. Minería de datos...................................................................................... 43 2.11.1. Conceptos e historia de la minería de datos ................................ 43 2.11.2. Los fundamentos de la minería de datos. .................................... 45 2.11.3. Objetivos de la minería de datos ................................................. 45 2.11.4. Entorno de la minería de datos.................................................... 46 2.11.5. El alcance de la minería de datos ................................................ 47 2.12. Reseña histórica del Grupo Flayp........................................................... 47 2.13. Reseña histórica del software libre ......................................................... 50
  • 6. 2.13.1. Richard Stallman y el proyecto GNU.......................................... 50 2.13.2. Software Libre ............................................................................. 52 2.13.3. Libertades básicas del software libre........................................... 54 2.13.4. Software libre y software de código abierto ................................ 55 2.13.5. Tipos de licencias de software libre............................................. 58 CAPÍTULO 3– MARCO METODOLÓGICO ..................................................... 60 3.1. Descripción de la profundidad y el diseño de la Tesis:........................... 60 3.2. Descripción de cómo se realizó la Tesis ................................................. 61 3.2.1. Relevamiento de datos .................................................................... 62 3.2.2. Análisis de datos ............................................................................. 62 3.2.3. Diseño ............................................................................................. 63 3.2.4. Desarrollo........................................................................................ 64 3.2.5. Prueba.............................................................................................. 65 3.2.6. Implementación............................................................................... 65 3.3. Descripción de los instrumentos y procedimientos utilizados para la recolección y tratamiento de la información..................................................... 66 3.4. Descripción de la muestra....................................................................... 66 3.5. Relevamiento .......................................................................................... 67 3.5.1. Relevamiento de procesos............................................................... 67 3.5.2. Relevamiento de Estructura de Datos ............................................. 71 3.5.3. Relevamiento de Necesidades......................................................... 71 3.5.4. Relevamiento tecnología actual del Grupo Flayp ........................... 72 3.5.5. Relevamiento Sistemas gestores de Bases de Datos....................... 72 3.5.6. Relevamiento algoritmo de minería de datos.................................. 75 3.5.7. Relevamiento de sistemas operativos ............................................. 78 3.5.8. Relevamiento de herramientas de Inteligencia de Negocios........... 79 3.6. Análisis ................................................................................................... 81 3.6.1. Análisis de requerimientos.............................................................. 81 3.6.2. Análisis de procesos........................................................................ 83 3.6.3. Análisis de estructura de datos........................................................ 84 3.6.4. Análisis de herramientas de Inteligencia de Negocios.................... 85 3.6.5. Análisis de sistemas gestores de bases de datos.............................. 86 3.6.6. Análisis de tecnología actual del Grupo Flayp ............................... 87 3.6.7. Análisis de algoritmo de minería de datos ...................................... 87 3.6.8. Análisis de sistemas operativos....................................................... 88 3.6.9. Análisis de factibilidad económica ................................................. 90
  • 7. 3.7. Diseño ..................................................................................................... 91 3.7.1. Diseño del data warehouse ............................................................. 91 3.7.2. Diseño del proceso ETL.................................................................. 93 3.7.3. Diseño de reportes........................................................................... 98 3.7.4. Diseño de cubos multidimensionales............................................ 101 3.7.5. Diseño de cuadros de mandos....................................................... 105 3.7.6. Diagramas casos de uso ................................................................ 107 3.7.7. Diagrama de actividades ................................................................110 3.7.8. Diagramas de secuencia .................................................................112 3.7.9. Diagrama de arquitectura de Pentaho Open BI Suite.....................114 3.7.10. Arquitectura del prototipo de solución de Inteligencia de Negocios. 116 3.8. Desarrollo del prototipo.........................................................................117 3.8.1. Desarrollo del data warehouse.......................................................117 3.8.2. Desarrollo de proceso ETL ............................................................118 3.8.3. Desarrollo de minería de datos...................................................... 125 3.8.4. Desarrollo de reportes ................................................................... 127 3.8.5. Desarrollo de cubos multidimensionales ...................................... 130 3.8.6. Desarrollo de cuadros de mandos ................................................. 133 3.9. Prueba de prototipo............................................................................... 136 3.10. Implementación del Prototipo............................................................... 143 3.10.1. Implementación de ETL y Data warehouse.............................. 143 3.10.2. Implementación de Pentaho Open BI Server ............................ 144 3.10.3. Implementación de consola de administración de usuarios Pentaho 148 3.10.4. Implementación de reportes ...................................................... 150 3.10.5. Implementación de los cubos multidimensionales.................... 152 3.10.6. Implementación de cuadros de mandos..................................... 153 CAPÍTULO 4– RESULTADOS.......................................................................... 154 CAPÍTULO 5 - CONCLUSIONES ................................................................... 155 CAPÍTULO 6- RECOMENDACIONES........................................................... 156 BIBLIOGRAFÍA ................................................................................................ 157 ANEXOS ............................................................................................................ 159
  • 8. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 8 LISTA DE TABLAS Tabla 1: Diferencias entre sistemas OLTP y OLAP. ............................................. 39 Tabla 2: Infraestructura actual de las empresas..................................................... 72 Tabla 3: Datos de ejemplo..................................................................................... 77 Tabla 4: Descripción del algoritmo backpropagation........................................... 77 Tabla 5: Comparativa herramientas de Inteligencia de Negocios......................... 85 Tabla 6: Comparativa de SGBD............................................................................ 86 Tabla 7: Comparativa de algoritmos de minería de datos..................................... 88 Tabla 8: Comparativa de sistemas operativos ....................................................... 89 Tabla 9: Cuadro de costos ..................................................................................... 90 Tabla 10: Mapeo de tabla inter_articulos_viru...................................................... 94 Tabla 11: Mapeo de tabla dw_articulos................................................................. 94 Tabla 12: Mapeo de tabla dw_clientes.................................................................. 94 Tabla 13: Mapeo de tabla dw_campañas_actuales................................................ 94 Tabla 14: Mapeo de tabla clonado_dbf_viru......................................................... 95 Tabla 15: Mapeo de tabla inter_pedido_avon ....................................................... 96 Tabla 16: Mapeo de tabla inter_pedido_viru ........................................................ 96 Tabla 17: Mapeo de tabla inter_ventas_avon........................................................ 96 Tabla 18: Mapeo de tabla inter_ventas_viru ......................................................... 97 Tabla 19: Mapeo de tabla dw_hechosventas......................................................... 97 Tabla 20: Mapeo de tabla dw_hechospedidos....................................................... 98 Tabla 21: Análisis cubo ventas por campaña, división, categoría y empresa. .... 104
  • 9. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 9 LISTA DE FIGURAS Figura 1: Pirámide de usuarios de un sistema de Inteligencia de Negocios ......... 28 Figura 2: Componentes de Inteligencia de Negocios............................................ 31 Figura 3: Fuentes de información. ........................................................................ 33 Figura 4: Data warehouse..................................................................................... 36 Figura 5: Data marts............................................................................................. 38 Figura 6: Herramientas de acceso. ........................................................................ 40 Figura 7: DER Hechos Pedidos............................................................................. 92 Figura 8: DER Hechos Ventas............................................................................... 93 Figura 9: DER Proyección .................................................................................... 93 Figura 10: Ventas por campañas por zonas........................................................... 99 Figura 11: Reporte proyección de ventas............................................................ 100 Figura 12: Dimensión artículos........................................................................... 101 Figura 13: Dimensión campaña .......................................................................... 102 Figura 14: Dimensión clientes ............................................................................ 102 Figura 15: Dimensión campaña .......................................................................... 103 Figura 16: Hechos pedidos.................................................................................. 103 Figura 17: Hechos Ventas.................................................................................... 103 Figura 18: Estructura del cuadro de mando ........................................................ 105 Figura 19: Arquitectura lógica del cuadro de mando.......................................... 106 Figura 20: Caso de uso usuario........................................................................... 107 Figura 21: Caso de uso administrador-consola ................................................... 108 Figura 22: Caso de uso administrador – servidor ............................................... 108 Figura 23: Caso de uso administrador – informes .............................................. 109 Figura 24: Diagrama de Actividades usuario.......................................................110 Figura 25: Diagrama de actividades administrador - usuarios.............................111 Figura 26: Diagrama de actividades administrador - servidor.............................111 Figura 27: Diagrama de actividades administrador – informes ...........................112 Figura 28: Diagrama de secuencia – consulta de reporte y cubo.........................113 Figura 29: Diagrama de secuencia crear usuario .................................................113 Figura 30: Diagrama de secuencia administrar prototipo ....................................114 Figura 31: Arquitectura Pentaho Open BI Suite ..................................................115 Figura 32: Arquitectura de Inteligencia de Negocios...........................................117 Figura 33: Data warehouse en PhpMyAdmin .....................................................118
  • 10. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 10 Figura 34: Transformación selección de campaña a cargar .................................119 Figura 35: Transformación inter_ventas_viru..................................................... 120 Figura 36: Transformación limpieza de clonado_dbf_viru................................. 120 Figura 37: Transformación borrado hechos_ventas viru..................................... 121 Figura 38: Transformación cargado de tabla hechos_ventas_viru...................... 121 Figura 39: Trabajo general de cargado dw_hechosventas fuente Viru................ 122 Figura 40: Transformación cargado de tabla inter_ventas_avon ........................ 123 Figura 41: Transformación borrado dw_hechosventas ....................................... 123 Figura 42: Transformación cargado dw_hechosventas....................................... 124 Figura 43: Trabajo general de cargado hechos_ventas Fuente Flayp ................. 125 Figura 44: Desarrollo reporte ventas por campañas por zonas ........................... 129 Figura 45: Reporte de proyección de ventas....................................................... 130 Figura 46: Estructura de los cubos...................................................................... 131 Figura 47: Capas de CDE.................................................................................... 134 Figura 48: Definición de estructura..................................................................... 134 Figura 49: Estructura de CDM............................................................................ 135 Figura 50: Origen de datos.................................................................................. 135 Figura 51: Selección de archivos dbf Virú.......................................................... 137 Figura 52: Cargado de tabla intermedia inter_ventas_viru................................. 138 Figura 53: Borrado de dw_hechosventas ............................................................ 138 Figura 54: Cargado de dw_hechosventas............................................................ 139 Figura 55: Trabajo hechos ventas fuente dbf ...................................................... 140 Figura 56: Cargado de la tabla inter_ventas_avon.............................................. 141 Figura 57: Borrado hechos ventas Flayp S.R.L. ................................................. 141 Figura 58: Hechos ventas fuente MySQL........................................................... 142 Figura 59: Trabajo hechos ventas fuente MySQL............................................... 143 Figura 60: Descarga de Bussines Intelligence Server ......................................... 145 Figura 61: Inicio del servicio Apache. ................................................................ 146 Figura 62: Instalación de Pentaho Bussines Intelligence Server......................... 146 Figura 63: Pantalla de inicio de sesión en la consola de usuario de Pentaho...... 147 Figura 64: Consola de usuario Pentaho............................................................... 147 Figura 65: Consola de administración de usuarios ............................................. 149 Figura 66: Administración de fuentes de datos................................................... 150 Figura 67: Publicación del reporte ventas por campaña por zonas..................... 151 Figura 68: Publicación reporte de ventas por zonas............................................ 151 Figura 69: Cubo de ventas .................................................................................. 152
  • 11. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 11 Figura 70: Participación en facturación por empresas ........................................ 153
  • 12. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 12 LISTA DE SÍMBOLOS O ABREVIATURAS OLTP:Online Transaction Processing OLAP:On-Line Analytical Processing ETL:Estract, Transform and Load ERP:Enterprise Resource Planning CRM:Customer Relationship Management KDD:Knowledge Discovery in Databases VPN:Virtual Private Network GNU:GNU is Not Unix FSF:Free Software Foundation GPL:General Public Licence OSI:Open Source Initiative PDI: Pentaho Data Integration SGBD: Sistema Gestor de Base de Datos TI: Tecnología de Información DDL:Data Definition Language DML: Data Manipulation Language TCT/IP: Transmission Control Protocol Internet Protocol
  • 13. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 13 CAPITULO 1 - INTRODUCCIÓN 1.1. Planteamiento del Problema El Grupo Flayp está compuesto por varias empresas, cada una de ellas cuenta con diferentes sistemas de información para realizar sus procesos de negocio, las mismas generan y almacenaninformaciónen distintos formatos y en gran volumen. Con toda esta acumulación de información diversificada,resulta dificultoso para los gerentes tener una imagen precisa de la información más importante para las empresas del Grupo y más aún para el directorio, quien tiene a su cargo la dirección general Grupo. A esto debemos sumarle, que ninguna de las empresas cuenta con un sistema generador automático de informes, y que los mismos son preparados sobre pedido, con todo lo que esto implica. El reto de este proyecto consiste en brindar un prototipo de solución de Inteligencia de Negocios capaz de transformar los datos en información útil, de manera que los gerentes y directores puedan utilizar dicha información para incrementar la rentabilidad de las empresas. Brindándoles un soporte en el cual respaldar la toma de decisiones estratégicas.
  • 14. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 14 1.2. Necesidad de estudiar el problema. El hecho de tener una gran cantidad de datos acumulados, no representa necesariamente tener una gran cantidad de información, y que dicha información sea o no relevante para la empresa, depende en gran medida de la forma y calidad en la que esta llegue a los tomadores de decisiones, la Inteligencia de Negocios tiene como uno de sus ejes principales lograr esto, ayudar a comprender mejor el comportamiento de la empresa, esto da pie para para realizar un estudio e implementar soluciones, haciendo uso de herramientas tecnológicas actuales, siguiendo tendencias y estándares en las áreas de la informática. 1.3. Significación del problema La importancia de este proyecto radica en lograr la implementación de un prototipo de solución de Inteligencia de Negocios que sea capaz de unificar los datos que se encuentran en distintos formatos, provenientes de las dos empresas Flayp S.R.L. y Virú S.R.L., pertenecientes al Grupo Flayp y lograr entre otras cosas, brindar información cohesionada, fiable y útil. 1.4. Delimitación del problema La presente tesis se limita al desarrollo de un prototipo de solución de Inteligencia de Negocios para los departamentos de Ventas y Marketing de las empresas Flayp S.R.L. y Virú S.R.L., integrantes del Grupo Flayp,
  • 15. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 15 en función a los requerimientos de información solicitadas por dichas áreas para los procesos de ventas y pedidos. En cuanto a los datos si bien en un principio se pretendía acceder a toda la información del Grupo Flayp, las personas a cargo accedieron a prestar los datos de forma parcial, haciendo énfasis en la importancia de mantener la confidencialidad de los mismos y que fueran utilizados exclusivamente para fines académicos. 1.5. Objetivos de la Tesis: 1.5.1. Objetivo General Implementar un prototipo de Sistema de Inteligencia de Negocios usando Minería de Datos sobre Software Libre. 1.5.2. Objetivos Específicos a) Relevar todos los procesos administrativos y de negocio de las empresas. b) Relevar software, hardware y tipos de informes. c) Analizar software, hardware y tipos de informes. d) Definir los tipos de informes de acuerdo al perfil y las necesidades de cada usuario. e) Diseñar, desarrollar, probar e implementar prototipo de solución de Inteligencia de Negocios.
  • 16. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 16 f) Documentar ciclo de vida del prototipo de solución de Inteligencia de Negocios. g) Realizar la demostración del funcionamiento del prototipo. 1.6. Definición de términos Servidor:Máquina conectada a Internet que entre otros servicios ofrece alojamiento para páginas web haciendo que estén accesibles desde cualquier punto de Internet. Data Warehouse: Colección de datos orientado a un ámbito determinado (empresa, organización, etc.) sus características son no volátil, integrado y variable en el tiempo. Data Marts: Es una versión especial de data warehouse, son subconjuntos de datos con la finalidad de ayudar a la toma de decisiones dentro de un área específica en la organización. Minería de Datos:La integración de un conjunto de áreas que tienen como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten una guía para la toma de decisiones. Inteligencia de Negocios:Es unconjunto de tecnologías que tienen un fin común con el principal objetivo que es la de servir como soporte para la toma de decisiones. Cuadros de Mando:Es una herramienta de gestión que facilita la toma de decisiones, recoge un conjunto coherente de indicadores que proporciona a los niveles gerenciales una visión comprensible del negocio de manera gráfica. Software Libre: se refiere al tipo de licencias de software que garantiza la libertad de los usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y mejorar el software. Open Source: Es el termino con el que se conoce al software distribuido y desarrollado libremente.
  • 17. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 17 Consultas Adhoc:Se refiere a las consultas elaboradas específicamente para un fin preciso y por lo tantono generalizable ni utilizable para otros propósitos. Copyleft: Es un método general para hacer un programa o software libre, exigiendo que todas las versiones modificadas y extendidas del mismo sean también libres. 1.7. Presentación del esquema En el Capítulo I – Introducción:se presenta el contenido de la tesis, la definición del problema de la investigación, la justificación de la necesidad del estudio y los objetivos. En el Capítulo II - Marco Teórico: en este capítulo se realiza una descripción de la importancia y el valor de la información en las empresas, y el concepto de la Inteligencia de Negocios, donde se mencionan sus principales componentes como lo son el data warehouse,On-Line Analytical Processing (en adelante OLAP), Extract, Transform and Load (en adelante ETL) y minería de datos, además se muestran los principios claves de estas tecnologías, también se hace referencia al concepto de software libre y por último se presenta al Grupo Flayp, ya que es este el lugar elegidopara llevar adelante este trabajo de grado, todas estas secciones son para una mejor comprensión de lo que se pretende lograr con este proyecto. En el Capítulo III - Marco Metodológico:se trata sobre la metodología utilizada en este trabajo, tipo de investigación y los detalles de la realización. El mismo se encuentra dividido en 6 partes. En la primera se
  • 18. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 18 describen los métodos utilizados para el relevamiento de los requerimientos, datos, procesos, tecnología y herramientas. En la segunda parte se analizan los datos relevados seleccionando los inherentes al proyecto, también se analiza el modelo de datos de los sistemas actuales, y se seleccionan aquellos que serán utilizados para el modelado de datos del datawarehouse, además se realiza una comparación entre las diferentes opciones de herramientas de inteligencia de negocios. En la tercera se realizan los diseños deldata warehouse, los procesos de ETL, los distintos tipos de informes y los diagramas necesarios para la realización del proyecto. En la cuarta parte se desarrolla el prototipo. En la quinta se realizan las pruebas del prototipo. En la sexta y última etapa se realiza la implementación del prototipo. En el Capítulo IV – Resultados: se describen los resultadosobtenidos, demostrando la factibilidad de la implementación de un prototipo de solución de Inteligencia de Negocios sin incurrir en gastos en cuanto a licencias de software. En el Capítulo V – Conclusiones:se presenta la síntesis de los objetivos y la conclusión del trabajo.
  • 19. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 19 CAPITULO 2–MARCO TEÓRICO 2.1. El valor de la información En la actualidad, cuya característica más importante, se basa en un crecimiento a gran escala de las tecnologías de la información y las telecomunicaciones, los activos más valiosos de una empresa pasan a ser los conocimientos, habilidades, valores y actitudes de sus empleados. Partiendo de la premisa de que el conocimiento sobre un tema determinado y su optima utilización, se convierte en un factor determinante para el éxito en el mundo empresarial. El capital intelectual ha desplazado a los factores tradicionales, como ser la producción, el capital, la tierra oel trabajo, como principal elemento a la hora de generar valor económico para la empresa, tal como se desprende del planteamiento de Cohen y Asín (2.000). Todas las compañías de alguna manera han adoptado un modelo del mundo de negocios sustentado en la información, como por ejemplo: ¿qué factores influyen en la compra y la demanda?, ¿cómo hallar las oportunidades de negocio?, ¿existe directa relación entre la calidad del producto y la demanda de los clientes? A medida que la exactitud de esta información crece, la capacidad de la empresa por competir se incrementa en forma proporcional. La información puede transformarse en conocimiento tácito o explícito. Se entiende por conocimiento tácito aquel que poseen las personas producto de la experiencia adquirida, los estudios y la educación;
  • 20. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 20 mientras que los conocimientos explícitos son aquellos almacenados en bases de datos. Un ejemplo claro es aquel que se produce cuando una persona cambia de empleo, esta se está llevando consigo información, conocimientos y está ofertando su capacidad intelectual por un mayor precio; en el ámbito laboral, la experiencia y la educación son factores claves para aumentar el costo de la fuerza del trabajo intelectual. Así mismo, el hecho de que un sistema que maneja información, eventualmente falle, indefectiblemente generará pérdidas a la empresa. Es una clara tendencia que las empresas están apostando fuertemente por la tecnología y las personas, para que en conjunto tengan un conocimiento suficiente que logre acercar la visión interna de ambos a la realidad exterior, en la misma medida que la brecha entre la visión interna y la realidad exterior disminuye, se consigue tomar decisiones más acertadas y en menos tiempo. Lo que busca esta tendencia es acercar lo máximo posible el mundo real a la visión interna para generar mayores ganancias, convirtiendo la información en utilidad y darle un valor a la información. 2.2. Necesidad de información y conocimiento en la empresa Desde el mismo instante en que las empresas iniciaron el proceso de acumular los datos de sus operaciones en medios de almacenamiento físico, y de esa forma conseguir una mejor administración y control de dicha información, ha surgido la necesidad de utilizarla para entender las necesidades particulares del negocio. En un mercado altamente competitivo, donde muchas marcas ofrecen productos similares, los clientes tienen una amplia gama de posibilidades para la elección del producto. Para obtener una porción del mercado, es indispensable para las
  • 21. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 21 empresas, tener la suficiente capacidad de transformar la información acumulada en conocimiento. La necesidad de información en las empresas no surge de un día para el otro, el propósito de almacenar los datos radica en su utilización en algún momento, cuando así se requiera, caso contrario, cualquier dato de control sería desechado instantáneamente. Lo que si surge súbitamente, es la imperiosa necesidad de dar respuesta rápida a los requerimientos de información para la toma de decisiones y ayudar a mejorar de alguna manera los procesos internos de negocio. 2.3. La información que las empresas necesitan En la actualidad las organizaciones demandan información en los niveles donde anteriormente la administración se basaba meramente en la intuición y el sentido común para la toma de decisiones. Los mercados dinámicos obligan a las empresas a que la información estratégica esté disponible en las computadoras de los directivos y/o gerentes, esta práctica se ha generalizado principalmente motivada por la mayor utilidad que se obtiene de la información compartida. Hoy en día la información está presente en todos los niveles de la organización con propósitos diferentes (comunicación, control, administración, evaluación, etc.) ayudando a la correcta y oportuna toma de decisiones desde el nivel gerencial, hasta el nivel operativo de la organización. Las empresas han entendido que a pesar de que los niveles directivos tienen una gran responsabilidad al tomar decisiones, por el peso que conllevan las mismas, existen también personas que toman decisiones
  • 22. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 22 y a pesar de que éstas no tienen un impacto global, deben ser de igual manera correctas y oportunas. Directores, gerentes, jefes y todos aquellos que toman decisiones deben contar con la suficiente información para respaldar su trabajo cotidiano, la posición que ocupen en la pirámide organizacional se torna secundaria cuando la mirada es hacia la gestión de los procesos y como así también los puestos que tienen cierta relación y dependencia entre sí. De modo general en una pirámide organizacional, los requerimientos informativos se dividen en tres niveles:  Información Estratégica  Información Táctica  Información Técnico Operacional. Información Estratégica: está pensada principalmente para ayudar a la toma de decisiones de las áreas gerenciales para alcanzar la misión empresarial. Se caracteriza porque son sistemas con poca carga diaria de trabajo y sin una gran cantidad de datos, sin embargo, la información que guarda está relacionada a un contexto cualitativo más que cuantitativo, que puede indicar cómo evolucionará en el futuro, el criterio es distinto, pero sobre todo es distinta su delimitación. Se asocia esta información a los niveles ejecutivos de las empresas. Es importante señalar que la información estratégica se nutre de grandes cantidades de datos de áreas relacionadas y no se enfoca puntualmente en una sola dirección, de ahí que las decisiones que puedan ser tomadas tienen un impacto directo en toda la organización.
  • 23. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 23 Información Táctica: este tipo de información es la que soporta la coordinación de actividades y el nivel operativo de la estrategia, es decir, se analizan opciones y se trazan rutas posibles para alcanzar la estrategia definida por la dirección de la empresa. Se facilita la gestión independiente de la información por parte de los niveles intermedios de la organización. Este tipo de información es extraída puntualmente de un área o sección de la organización, por lo que su alcance es local y se asocia habitualmente a las gerencias. Información Técnico Operacional: hace referencia a las operaciones diarias que son efectuadas de modo rutinario en las corporaciones mediante la transacción masiva de datos y sistemas transaccionales. Las cargas son cotidianas y soportan la actividad de la empresa día tras día (contabilidad, facturación, almacén, presupuesto, etc.). Generalmente se asocia esta información con los jefes de área o las coordinaciones operativas, también llamadas de tercer nivel. Podemos considerar entonces factores internos y externos de una empresa y así concluir que los requerimientos en la actualidad se orientan a descubrir y mejorar los beneficios de toda la cadena corporativa. Dichos requerimientos se ven reflejados en el interés por tener a mano los indicadores que arrojen información concreta y clave para determinada área de la empresa, y en el menor tiempo posible. La clara tendencia es que las áreas gerenciales necesitan en su mesa de trabajo, la información clave de su empresa; en todos los niveles el requerimiento es parecido, aunque es evidente que tendrá objetivos diferentes.
  • 24. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 24 2.4. Las organizaciones y los distintos sistemas de información Para que una empresa esté completamente automatizada es necesario contar con una gran infraestructura en tecnologías para que soporte todos los sistemas de información. El crecimiento en tecnología puede tener distintos orígenes partiendo desde la implementación, crecimiento, ampliación, mantenimiento, etc. Las necesidades actuales de las empresas han provocado contar con tecnología de la informaciones más sofisticados para responder a cada una de sus peticiones de información, esto impulsó a que las compañías adquieran distintos tipos de sistemas de informaciones, entre estos sistemas podemos mencionar a los OnLine Transaction Processing(en adelante OLTP), Planificación de Recursos Empresariales(en adelante ERP), Sistemas de Soporte para la toma de decisiones (en adelante DSS), Administración de la Relación con Clientes (en adelante CRM), etc. Estos sistemas siempre están utilizando bases de datos para almacenar la información generada, las mismas se utilizan como soporte para la toma de decisiones en las empresas. Existen empresas que precisan información de una actividad específica, un ejemplo seria los Sistemas ERP (Planificación de Recursos Empresariales) son sistemas muy complejos y grandes donde un alto porcentaje de su contenido dedica a los procesos de producción, si una empresa se dedica a las bienes raíces, sería ilógico adquirir un sistema de alta complejidad y costoso como las ERP que no va a dar una solución a las necesidades de la empresa. Para empresas como estas, existen desarrollos de soluciones en el mercado comercializado como productos que pueden ser configurados en una organización en particular de acuerdo a sus necesidades, que dan soluciones a requerimientos específicos para
  • 25. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 25 cada industria. Hay en el mercado, software para distintos tipos de empresas como automotriz, hotelería, comercios, educativos entre otros. Son distintas las herramientas utilizadas debido a que las actividades de misión crítica que soportan cada una de las organizaciones son diferentes, y por ende también son distintos los tipos de información que puede solicitar un directivo en cada una de las organizaciones, lo cual justifica que existan muchos productos de software dedicados a explotar la información de las bases de datos que no tienen características estándares, sino más bien son adaptables según las exigencias. Considerando las necesidades que se presentan en cada actividad. La información que se genera en una empresa u organización está destinada a responder a diversos tipos de preguntas de los usuarios, de ahí nace la necesidad que existan sistemas de información para requerimientos muy específicos que permitan la recolección y el manejo de los datos. La estructura organizacional de una empresa es un factor importante para determinar la información que comúnmente es requerida por los funcionarios. Los sistemas de procesamiento de datos (OLTP) utilizan medios de almacenamiento y técnicas para el cargado. Un alto porcentaje de las empresas recurren a los OLTP para guardar grandes cantidades de datos con un tiempo de respuesta corto en los miles de transacciones realizadas cotidianamente, sin embargo, su eficiencia no son las consultas masivas de grandes cantidades de información y mucho menos el análisis de la misma.
  • 26. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 26 La tecnología tuvo que adaptar los medios necesarios para que sean eficientes en el ámbito específico de aplicación, así como para el diseño de estructuras de datos que ordenen la información como se desea, como en las herramientas o software que dan soluciones oportunas a los usuarios. Todos los sistemas de información tienen un fin muy particular, y se complementan para mantener de la manera más eficiente una organización; sin embargo, no todos pueden dar solución a las distintas demandas de los usuarios, ya que son diseñados para alguna área específica. El motivo por el cual existen diferentes sistemas de información es porque las preguntas de los usuarios son muy específicas que no cualquier sistema puede resolver. De hecho la base de datos operacional, que es imprescindible en cualquier organización pero no está organizada para dar respuestas a preguntas globales sino más bien a pequeños grupos de datos. Preguntas que impliquen consultas complejas podrían resolverse en un lapso muy extenso, donde la posibilidad de que la vigencia desaparezca aumenta considerablemente. Es importante recalcar que una base de datos o sistema de información no está diseñada para resolver las necesidades informativas de la organización a nivel macro. 2.5. Definición de Inteligencia de Negocios La Inteligencia de Negocios cuenta con una diversidad de interpretaciones como muchos otros términos o conceptos. Su uso es justificado a todo lo que sea considerado como tecnología de información, pero no hay un consenso en lo respecta a su definición.
  • 27. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 27 “[…] es el conjunto de tecnologías que permiten a las empresas utilizar la información disponible en cualquier parte de la organización para hacer mejores análisis, descubrir nuevas oportunidades y tomar decisiones más informadas”(HOWARD DRESNER, H 1.989). Examinando las distintas definiciones queda claro que la Inteligencia de Negocios no consiste en una metodología, sistema, software o herramienta en particular, si no es un conjunto de tecnologías que tienen un fin común con el principal objetivo que es la de servir como soporte para la toma de decisiones. 2.6. Los usuarios de las soluciones de Inteligencia de Negocios A continuación se describen los diferentes tipos de usuarios que intervienen en una solución de inteligencia de negocios. Productores de información:“[..]Habitualmente son el 20% de los usuarios, que crean informes o modelos utilizando herramientas de escritorio. Donde predominan estadísticos que se valen de herramientas para minería de datos o son creadores de informes que utilizan herramientas para el diseño y/o programación de informes específicos. Regularmente son profesionales del área de sistema de información o usuarios muy avanzados con capacidades de comprender la información y la informática”(CANO, J 2.007). Los consumidores de información: “[…] Son usuarios no habituales que regularmente consultan informes para la toma de decisiones, pero no acceden a los números o hacen análisis detallados
  • 28. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 28 diariamente. Los usuarios no habituales son directivos, gestores, responsables, colaboradores y usuarios externos. Este numeroso grupo está bien servido con cuadros de mando con análisis guiados, informes interactivos (por ejemplo: OLAP, informes parametrizados, vinculados,…) e informes de gestión estandarizados. La mayoría de estas herramientas proveen ahora acceso vía web para promover el acceso desde cualquier lugar y facilitar el uso y minimizar los costes de administración y mantenimiento”(CANO, J 2.007). En la Figura 1 se puede apreciar a través de una pirámide los distintos niveles de usuarios en una solución de inteligencias de negocios. Figura 1: Pirámide de usuarios de un sistema de Inteligencia de Negocios 2.7. Historia de la Inteligencia de Negocios En octubre de 1.958 H.P. Luhn de IBM, escribió un artículo llamado Business Intelligence System donde describe las características
  • 29. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 29 que debe tener un sistema de este tipo, en muchos aspectos de lo que escribió Luhn tiempo atrás, si se realiza un paralelismo de lo que se entiende hoy en día por inteligencia de negocios no varió mucho. Edgar Frank Codd presenta el concepto de las bases de datos en el año 1.969, un año más tarde se desarrollaron las primeras base de datos con sus interfaz empresariales, estas aplicaciones, facilitan la entrada de datos en los sistemas, haciendo que aumente la información disponible, pero como el acceso a la información era de alta complejidad y difícil de acceder a las mismas no fue una solución completa. Otro de los avances llegaron en el año 1.980 con la creación del concepto del data warehouse por Ralph Kimball y Bill Inmon, con ellas aparecieron los primeros sistemas de reportes, con todo esto la solución seguía siendo compleja y funcionalmente pobre, se contaba con potentes sistemas de bases de datos pero no existían aplicaciones que facilitaran su explotación. En 1.989 Howard Dresner difundió el término de Business Intelligence escrito por H.P. Luhn en el año 1.958, en la década de los 90 llegaba la Business Intelligence1.0 y con ello la multiplicación de aplicaciones de Inteligencia de Negocios, logrando facilitar el acceso a la información considerablemente pero empeoraron el problema que se quería resolver ya que seguían apareciendo múltiples soluciones sin poder consolidarse. Con la llegada de Business Intelligence 2.0 en el año 2.000 se logró consolidar las aplicaciones en una pocas plataformas a partir de ahí las herramientas empezaron a dar soluciones reales a las empresas u organizaciones.
  • 30. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 30 2.8. Características de la Inteligencia de Negocios Información: el propósito de la Inteligencia de Negocios es proveer de información al usuario final para dar soporte a la toma decisiones, por ende la información es la esencia de la Inteligencia de Negocios, estas pueden originarse desde las bases de datos operacionales, como también de arquitecturas data mart y data warehouse diseñadas específicamente para el análisis. El usuario requiere de información para apoyarse en el momento de tomar decisiones, pasando en segundo plano de dónde provenga esta, pudiendo ser de una fuente primitiva o derivada, para lo cual la inteligencia de negocios utiliza o crea fuentes de datos interna o externa con el fin de utilizarla como materia prima para lograr su objetivo. Apoyo a la toma de decisiones: básicamente consiste en organizar y presentar los datos relevantes para que sirvan como soporte a la hora de tomar decisiones. Esto implica la utilización de tecnologías, técnicas de análisis y todo lo que sea necesario con el fin de obtener solamente aquella información relevante y útil. Orientación al usuario final:un factor fundamentalque tuvo su incidencia en la tecnología de la Inteligencia de Negocios para explotar información, fue que el usuario final no contaba con conocimientos y técnicas que le permita acceder de una manera sencilla y directa a los datos almacenados en los sistemas operacionales, ya que casi siempre necesitaba de ayuda de informáticos para acceder a la información, con la Inteligencia de Negocios, se elimina la dependencia de terceras personas para el acceso
  • 31. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 31 a los datos e información, siendo esta una herramienta sencilla y preparada para que interactúe directamente con el usuario final sin intermediarios. 2.9. Componentes de una solución de Inteligencias de Negocios Teniendo en cuenta el esquema mencionado por Cano (2.007) la solución de Inteligencia de Negocios está compuesta por las fuentes de información, proceso de ETL (extracción, transformación y limpieza de datos) datawarehouse y motor OLAP como se puede apreciar en la figura 2. Figura 2: Componentes de Inteligencia de Negocios
  • 32. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 32 Los componentes son:  Fuentes de información: generalmente son los datos generados por sistemas operacionales, los cuales se utilizan para alimentar de información el data warehouse.  Proceso ETL: de extracción, transformación y carga de los datos en el datawarehouse. Los datos antes de almacenarse en un data warehouse,pasan por procesos de filtrado, limpieza, trasformación y redefinición.  El datawarehouse: en él se almacenan los datos de una manera que optimice su flexibilidad, facilidad de acceso y administración, en donde los datos están estructurados para generar informes que ayuden a la toma decisiones.  El motor OLAP: es el que proporciona la capacidad de realizar cálculos, análisis, pronósticos, consultas en grandes volúmenes de datos. 2.9.1. Las fuentes de información a las que se puede acceder son: a) Los sistemas operacionales, que contienen las aplicaciones desarrolladas a medida. b) Sistemas de información por sector: presupuestos, hojas de cálculo, etcétera o fuentes de información externa, compradas a terceros como por ejemplo el estudio del mercado.
  • 33. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 33 En la figura 3 se aprecian las distintas fuentes de información en un sistema de Inteligencia de Negocios. Figura 3: Fuentes de información. 2.9.2. Proceso de extracción, transformación y carga El proceso de extracción, transformación y carga, también denominado simplemente ETL, es el proceso que permite realizar el cargado y actualización de los datos obtenidos desde las distintas fuentes de información en el datawarehouse, habitualmente consume entre el 60% y el 80% de recursos en un proyecto de Inteligencia de Negociostal como lo indica Ralf Kimball (2.004), por lo que es un proceso clave en la vida de todo proyecto de esta naturaleza.
  • 34. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 34 Esta etapa del proceso de construcción del datawarehouse, es costosa e implica una inversión significativa de tiempo y esfuerzo, para la concreción de la misma, por ello requiere recursos, estrategia, habilidades especializadas y tecnologías. La extracción, transformación y carga es necesaria para acceder a los datos de las fuentes transaccionales de información y volcarlas al data warehouse. El proceso ETL se divide en cinco subprocesos:  Extracción: en este proceso se recuperan los datos físicamente de las distintas fuentes de información transaccional. En este momento se dispone de los datos en bruto.  Limpieza: a través de este proceso se recuperan los datos en bruto y se comprueba su calidad, aquí se eliminan los datos duplicados y, de ser posible, se corrigen los valores erróneos, y completa los valores vacíos, es decir se transforman los datos, siempre que esto sea posible, para reducir al mínimo los errores de carga. En este momento se dispone de datos limpios y de alta calidad.  Transformación: este proceso utiliza los datos limpios y de alta calidad obtenidos en la etapa anterior y los estructura en los distintos modelos de análisis. Como resultado de este proceso se obtienen datos limpios, consistentes y útiles.  Integración: en este proceso se validan los datos cargados en el data warehouse, se analiza si son congruentes con
  • 35. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 35 las definiciones y formatos del data warehouse; es aquí donde se integran en los distintos modelos, de las distintas áreas de negocio que se han definido en el mismo. Estos procesos pueden ser complejos.  Actualización: este es el proceso que permite añadir los nuevos datos al data warehouse, como así también mantener el mismo siempre actualizado. 2.9.3. Data warehouse Eldata warehouse o almacén de datos, es la herramienta que surgió como respuesta a las necesidades de los usuarios de los niveles gerenciales, que necesitan información consistente, integrada, histórica y preparada para ser analizada y utilizada para mejorar la toma de decisiones. Su ubicación en el contexto de una solución de Inteligencia de Negocios se puede apreciar en la sección resaltada de la figura 4.
  • 36. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 36 Figura 4: Data warehouse El hecho de recuperar la información desde los distintos sistemas que posea la empresa, sean estos transaccionales o externos, para luego almacenarlos en un entorno cohesionado de información, como es un data warehouse, permitirá analizar la información contextualmente y relacionada dentro de la organización. Las características que debe cumplir undata warehouse son:  Temático.  Integrado.  Histórico.  No volátil.
  • 37. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 37 El proceso de diseño y construcción de un data warehouse corporativo usualmente resulta costoso, además de requerir plazos de tiempo que las empresas no están dispuestas a aceptar. Estas situaciones, fueron las que originaron la aparición de los data mart. Los data mart están enfocados a un grupo particular de usuarios dentro de la organización, que bien puede estar conformado por los miembros de un departamento, o por los usuarios de un determinado nivel organizativo, o por un equipo de trabajo multidisciplinario con objetivos comunes. Los data mart, se utilizan para almacenar información de un grupo de áreas en particular, cuyo flujo de información sea coincidente; por ejemplo, podrían ser de marketing y ventas o de producción. Lo usual es que éstos se definan para dar respuestas a usos muy concretos. Por lo general, los data mart son más pequeños que los data warehouses. También almacenan menor cantidad de información, menos modelos de negocio ya que son utilizados por un menor número de usuarios. Existen dos tipos de data mart, estos pueden ser independientes o dependientes. Los independientes son alimentados directamente desde las fuentes de información, mientras que los independientes obtienen la información desde el data warehousecorporativo. Con los data mart independientes pueden surgir inconvenientes en su evolución, ya que pueden llegar a generar inconsistencias con otros data mart.
  • 38. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 38 En la figura 5 puede apreciarse la estructura de los data marts dentro de una solución de Inteligencia de Negocios. Figura 5: Data marts Existen grandes diferencias entre los sistemas transaccionales y los data warehouses, en función a los objetivos que persiguen cada una de ellos. El objetivo primordial del modelo relacional en el cual se basa el concepto OLTP es el de mantener la integridad de la información en cuanto a las relaciones entre los datos, lo cuales necesario para operar un negocio de la manera más eficiente. Sin embargo, este modelo no se corresponde con la forma en la que el usuario percibe la operación de un negocio. Los data werehouses están basados en un procesamiento de los datos distinto al utilizado por los sistemas operacionales, ya que este se basa en el concepto OLAP pensado y utilizado en el análisis de negocios y otras aplicaciones que requieren una visión flexible del negocio.
  • 39. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 39 A continuación en la Tabla 1 se presentan las principales diferencias entre los sistemas transaccionales (OLTP) y los basados en data warehouses (OLAP). Transaccionales Basados en Data warehouse Admiten el acceso simultáneo de muchos usuarios (miles) que agregan y modifican datos. Admiten el acceso simultaneo de muchos usuarios (cientos) que consultan y no modifican datos Representan el estado actual de una organización, pero no guardan su historial. Guardan el historial de una organización. Contienen grandes cantidades de datos, incluidos los datos extensivos utilizados para comprobar transacciones. Contienen grandes cantidades de datos, sumarizados, consolidados y transformados. También de detalle pero solo los necesarios para el análisis. Tienen estructuras de base de datos complejas Tienen estructuras de base de datos simples. Se ajustan para dar respuesta a la actividad transaccional. Se ajustan para dar respuesta a la actividad de consultas. Proporcionan la infraestructura tecnológica necesaria para admitir las operaciones diarias de la empresa. Pueden combinar datos de orígenes heterogéneos en una única estructura homogénea y simple, facilitando la creación de informes y consultas. Las consultas analíticas que resumen grandes volúmenes de datos afectan negativamente a la capacidad del sistema para responder a las transacciones en línea. Organizan los datos en estructuras simplificadas buscando la eficiencia de las consultas analíticas más que del proceso de transacciones. El rendimiento del sistema cuando está respondiendo a consultas analíticas complejas puede ser lento o impredecible, lo que causa un servicio poco eficiente a los usuarios del proceso analítico en línea. Contienen datos transformados que son válidos, coherentes, consolidados y con el formato adecuado para realizar el análisis sin interferir en la operación transaccional diaria. Los datos que se modifican con frecuencia interfieren en la coherencia de la información analítica. Proporcional datos estables que representan el historial de la empresa. Se actualizan periódicamente con datos adicionales, no como las transaccionales frecuentes. La seguridad se complica cuando se combina análisis en líneas con el proceso de transacciones en línea. Simplifican los requisitos de seguridad. Tabla 1: Diferencias entre sistemas OLTP y OLAP.
  • 40. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 40 2.9.4. Herramientas de acceso de la Inteligencia de Negocios La información almacenada en un data warehouse, seria intrascendente, si ésta no pudiera ser accedida por los usuarios, para ello existen herramientas que permiten tratar y visualizar la información que reside en un data warehouse. En la sección resaltada de la figura 6 se aprecia la ubicación de las herramientas de acceso en una solución de Inteligencias de Negocios. Figura 6: Herramientas de acceso.
  • 41. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 41 Existen diferentes tecnologías que permiten aprovechar y analizar la información almacenada en un data warehouse, siendo el uso de los cubos OLAP la más extendida de ellas. Los usuarios que toman decisiones necesitan analizar información a distintos niveles de agregación y tener una visión sobre múltiples dimensiones, por ejemplo, las ventas de determinados productos por zonas, por tiempo, por clientes o por región geográfica. Estos usuarios deben poder realizar este análisis al máximo nivel de agregación o al máximo nivel de detalle. Los cubos OLAP permiten realizar esto de modo a poder aprovechar al máximo las posibilidades que ofrecen los data warehouses. A estos tipos de análisis se los denomina multidimensionales, ya que permiten el análisis de un hecho en particular desde distintas dimensiones. Esta es la mejor forma de analizar la información por parte de los tomadores de decisiones, ya que los modelos de negocio habitualmente son multidimensionales. Las herramientas que se utilizan para la visualización de la información,son totalmente independientes a la forma en la que ésta se haya almacenado. Las formas de acceso de las herramientas OLAP son:
  • 42. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 42  Cliente/Servidor: esto significa tener instalado en la maquinas cliente, el aplicativo que va conectarse al servidor donde se almacenan la información que generan los cubos OLAP.  Acceso web: en este tipo de acceso, el navegador es el que se comunica con un servidor web, el cual se comunica con el servidor OLAP donde se almacena la información que generan los cubos. 2.10. Principales herramientas de la Inteligencia de Negocios  Generadores de informes: estos son utilizados por desarrolladores profesionales para crear informes estandarizados enfocados a departamentos, grupos interdepartamentales o la organización.  Herramientas de usuario final de consultas e informes: estas son utilizados por los usuarios finales para crear informes para su propio uso o para otros usuarios; no requieren programación.  Herramientas OLAP: estas permiten a los usuarios finales manipular la información de forma multidimensional para poder visualizarla desde distintas perspectivas y en función a los criterios que el usuario considere importantes.  Herramientas de cuadros de mandos: estas permiten a los usuarios finales visualizar información crítica para el desempeño de manera rápida, valiéndose para ello de gráficos, ofreciendo la posibilidad de visualizar alguna sección con más en detalle.  Herramientas de minería de datos: estas permiten a los analistas de negocio crear modelos estadísticos. La minería de datos es el proceso para descubrir e interpretar patrones ocultos a simple vista en un gran cúmulo de información. Los usos más habituales de la
  • 43. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 43 minería de datos son: segmentación, clasificación, previsiones, agrupación, etc. 2.11. Minería de datos 2.11.1. Conceptos e historia de la minería de datos El termino minería de datos, desde el enfoque académico es una de las etapas dentro del proceso de Knowledge Discovery in Databases(en adelante KDD). Básicamente la minería de datos consiste en nutrirse de las ventajas de cada aérea como la estadística, inteligencia artificial, computación gráfica, bases de datos y procesamiento masivo, utilizando como materia prima las bases de datos operaciones. Definición tradicional de minería de datos: “[..]esun proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos” (FAYYAD,U 1.996). Desde el punto de vista empresarial, la minería de datos se define como: “[..]La integración de un conjunto de áreas que tienen como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisión” (MOLINA, L 2.001).
  • 44. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 44 La idea de la minería de datos viene desde los años 60, cuando los estadísticos de esa época manejaban términos como data fishing, data mining o data archeology,más tarde en los años 80, Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory Piatetsky-Shapiro, entre otros empezaron a fortalecer los términos de data mining y KDD. A finales de los años 80 solo existían un par de empresas quienes se dedicaban a esta tecnología; para el 2.002 este número se multiplicó considerablemente, ya que existían más de 100 empresas en el mundo con un portafolio de más de 300 soluciones que utilizaban la tecnología. La minería de datos no es un gran software ni algo parecido, más bien la tecnología está compuesta por etapas que integran diferentes áreas. Tanto así que para el desarrollo de un proyecto de minería de datos, se utilizan diferentes aplicaciones de software para las distintas etapas. En la actualidad podemos encontrar una variedad importante de herramientas o aplicaciones comerciales y no comerciales con una utilería interesante, pero casi siempre es necesario complementar con otras herramientas para el desarrollo de la minería de datos.
  • 45. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 45 2.11.2. Los fundamentos de la minería de datos. Las técnicas de minería de datos, se considera al resultado de un proceso de investigación y desarrollo de productos. La evolución comenzó cuando las organizaciones empezaron a guardar sus datos en las computadoras, esto fue creciendo cuando se mejoraron el acceso a los datos permitiendo al usuario navegar y explorar en tiempo real sus datos. La minería de datos tomando este proceso de evolución está lista para ser implementada en las organizaciones, utilizando estas tres tecnologías que ya están muy consolidadas como pilares de su aplicación:  Recolección masiva de datos.  Potentes computadoras con multiprocesadores.  Algoritmos de minería de datos. 2.11.3. Objetivos de la minería de datos Examinar, analizar y buscar patrones ocultos en los datos acumulados en las profundidades de las bases de datos o en almacenes de datos que contienen datos históricos que ha generado una organización durante su existencia.
  • 46. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 46 2.11.4. Entorno de la minería de datos La minería de datos normalmente utiliza la arquitectura cliente-servidor. La minería de datos a través de sus herramientas ayuda a extraer información oculta, archivos acumulados en las bases de datos operaciones y/o almacenes de datos de las grandes corporaciones públicas y privadas. Los usuarios de la minería de datos normalmente no cuentan con ninguna habilidad de programación, por los cual se valen de las poderosas herramientas para efectuar consultas adhoc y obtener respuestas en tiempo real. La minería de datos es capaz de producir seis tipos de información:  Asociaciones.  Agrupamientos.  Clasificaciones.  Pronósticos.  Secuencias.  Clasificaciones.
  • 47. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 47 2.11.5. El alcance de la minería de datos La minería de datos consiste en buscar valiosas informaciones en grandes bases de datos. Este proceso requiere explorar grandes cantidades de datos y analizarlos minuciosamente hasta encontrar las informaciones requeridas. En las bases de datos de gran volumen y calidad, la minería de datos puede proporcionarnos oportunidades de negocio con las siguientes posibilidades:  Pronóstico de comportamiento a futuro: la minería de datos proporciona la automatización del proceso de obtención de información predecible en bases de datos de gran volumen, estos pronósticos pueden ser la predicción de las ventas, posibles problemas financieros, similitudes de necesidades de los clientes y un sinfín de predicciones que el negocio requiera.  Las herramientas para visualizar, examinar y realizar el análisis de los resultados. 2.12. Reseña histórica del Grupo Flayp En el año 1.983 tras el cierre de las actividades en Paraguay de la Multinacional AVON Cosmetics Inc., se crea Flayp S.R.L., con el objetivo de convertirse en una empresa nacional para la venta y distribución de los productos AVON, adquiriendo para esto la franquicia de dicha marca, tiene
  • 48. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 48 como visión ser la empresa líder en venta directa y comercialización de artículos de belleza, llegando a cada rincón del Paraguay, ofreciendo calidad y excelencia a sus clientes. En sus inicios contaba con 5 empleados y 120 revendedoras. En la actualidad la empresa Flayp S.R.L. se transformó en el Grupo Flayp, compuesto por las siguientes empresas: Flayp S.R.L.; Virú S.R.L.; Flayprint S.A.; City Sport S.A.; Cima Seis S.A.; Flaypnort S.A., las cuales si bien están nucleadas en un directorio, son totalmente independientes administrativa, económica y operativamente entre sí. Hoy en día el Grupo Flayp cuenta con más de 700 empleados directos y más de 30.000 revendedoras a lo largo de todo el país. A más del directorio, compuesto actualmente por sus 6 miembros fundadores, el Grupo cuenta con un gerente general, y para cada una de las empresas un gerente en cada área estratégica (Marketing, Ventas, Compras, Administrativo, Logística, Tecnología e Información). En cuanto a tecnología, el Grupo cuenta en la actualidad con 5 servidores, 2 de los cuales son utilizados para albergar en forma independiente cada uno de los sistemas de procesamiento de pedidos, facturación y cuenta corriente de cada una de las empresas, dichos sistemas informáticos se encuentran desarrollados en distintos lenguajes de programación y distintos orígenes de datos, además de eso, cuenta con una conexión Virtual Private Network (en adelante VPN), con muchas de las sucursales en el interior del país y el área metropolitana, las cuales realizan sus transacciones directamente a las bases de datos contenidas en los servidores, las agencias que no cuentan con acceso a internet, envían sus
  • 49. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 49 pedidos utilizando los vehículos de la empresa, dichos pedidos son procesados en un centro de procesamiento. Actualmente el Grupo Flayp maneja un volumen de compras cercano a los 10.000.000 u$s anuales (comprende las dos principales empresas del Grupo; Virú S.R.L. y Flayp S.R.L.) y un volumen de ventas que ronda los 24.000.000 u$s anuales. En cuanto a unidades vendidas, las mismas superan los 7.000.000 anuales. Con una proyección de crecimiento entre el 10% y el 14% anual. El Grupo Flayp cuenta con una casa central en Asunción, además de contar con más de 45 agencias distribuidas en todo el país, logrando así una cobertura total, posee 2 depósitos que albergan las mercaderías, además de una flota de camiones, los cuales son utilizados para la distribución de los productos. El Grupo empresarial cuenta con un equipo de ventas, liderados por su gerente de ventas, quien tiene a su cargo a 4 gerentes divisionales, los cuales se dividen la cobertura del país en 4 grandes regiones, además cuenta con más de 350 zonas, las cuales están distribuidas en cada una de las 4 divisiones y que su vez se encuentran presentes en todos los departamentos del país, cada zona es gerenciada por una promotora de ventas y que a su vez tienen a su cargo el manejo de las 30.000 revendedoras. Por otro lado cabe mencionar que el sistema de venta directa tiene una dinámica diferente a la venta convencional, el mismo consiste en ofrecer sus productos a través de folletos los cuales son ofrecidos por las revendedoras, la vigencia promedio de cada folleto es de 18 días, esto lleva a tener 20 folletos por año, que son denominadas campañas, por lo tanto la facturación se maneja por campañas y no así por fecha calendario. De esto se desprende que toda la información que manejan las empresas del grupo, corresponden a este esquema organizacional.
  • 50. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 50 2.13. Reseña histórica del software libre En los primeros pasos de la informática, los programas y las máquinas utilizadas para su ejecución estaban estrechamente ligados. No se concebía el concepto de programa como elemento separado tal cual se tiene hoy en día. Tampoco existían usuarios comunes, sino que la totalidad de las personas que ejecutaban los programas tenían grandes conocimientos de programación y por lo general eran ingenieros y científicos, una costumbre muy practicada entre estos usuarios, era intercambiar y mejorar los programas, distribuyendo sus modificaciones. No fue hasta los últimos años de la década del 70, cuando las empresas comenzaron con la costumbre de imponer restricciones a los usuarios, con la implementación de los acuerdos de licencia. 2.13.1. Richard Stallman y el proyecto GNU Para empezar a entender todo lo que implica el software libre, es imprescindible hablar de Richard Stallman. Este físico graduado en 1.974 en la Universidad de Harvard, se encontraba trabajando en los laboratorios de inteligencia artificial del Instituto de Tecnología de Massachussetts(en adelante MIT) desde el año 1.971.
  • 51. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 51 La impresora con la que contaban en su laboratorio tenía algunos inconvenientes con la alimentación del papel, lo que hacía que se atascara de forma permanente y no había forma de descubrirlo más que acercarse hasta donde se encontraba la misma. Por este motivo, Stallman contacta con la empresa fabricante de la impresora, con el propósito de modificar el software que se encargaba de controlar a la impresora y lograr hacer que la misma mande una señal cuando se atascaba, consiguiendo con esto que no se perdiese tanto tiempo de trabajo. Ante este pedido, los fabricantes se negaron a entregarle el código fuente, los cuales son imprescindibles para poder modificar su comportamiento. Esta situación hace que termine de tomar forma su idea de que el código fuente de los programas debía ser accesible para todo aquel que quisiese. Movilizado por esta inquietud, Stallman decidió abandonar el MIT a comienzos de 1.984, para dar inicio al proyecto GNU, el mismo es un acrónimo recursivo que significa GNU's Not Unix, GNU No Es Unix, haciendo referencia a que el proyecto tenía como objetivo desarrollar un sistema operativo tipo Unix, pero totalmente libre. Tiempo después Stallman funda la Free Software Foundation (en adelante FSF), entidad encargada de promocionar el desarrollo y uso del software libre, en 1.985 Stallman creó la
  • 52. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 52 licencia General Public License (en adelante GPL) como mecanismo para proteger el software libre, sustentado sobre el concepto de copyleft, la FSF tiene un registro de todas licencias compatibles con la licencia GNU (la más popular de las licencias de software libre) y aquellas que, no siendo compatibles con ella, son consideradas licencias de software libre. En sus comienzos, el proyecto GNU se concentra en desarrollar las herramientas necesarias para construir un sistema operativo, como ser editores y compiladores y en las utilidades básicas para la gestión del sistema. A través del concepto de copyleft, se busca una alternativa a la idea del copyright, siendo que “todo el mundo tiene derecho a ejecutar un programa, copiarlo, modificarlo y distribuir las versiones modificadas, pero no tiene permiso para añadir sus propias restricciones al mismo”. De esta forma, las libertades que definen al software libre están garantizadas para todo el mundo que tenga una copia, tornándose en derechos inalienables. 2.13.2. Software Libre Lo primero que debe entenderse cuando se habla desoftware libre, es que no se está hablando de software gratis, el alcance de la palabra libre es mucho más abarcativa, se refiere a la libertad de los usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y mejorar el software. De modo más preciso, se refiere a cuatro libertades de los usuarios del software. (GNU, 2008).
  • 53. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 53 Es entonces que se tiene dentro de las distintas clasificaciones de software, una muy determinante, como lo es clasificar al software de acuerdo a su “filosofía”. Softwarepropietario: se entiende por esto, el software cuya propiedad absoluta continua en poder de quien tiene sus derechos y no del usuario, quien solo puede utilizarlo cumpliendo ciertas condiciones. Siendo así que su uso, distribución y/o modificación total o parcial, están prohibidos o restringidos de tal manera que no es posible llevarlos adelante. Es decir, que el software comercializado bajo este tipo de licencias le da al usuario derechos limitados sobre su usufructo, el alcance de esto es establecido por el autor o quien posea ese derecho. Software libre: se considera así, al software que le otorga al usuario la libertad de utilizarlo, mejorarlo, estudiarlo, adaptarlo a sus necesidades y redistribuirlo libremente, con la única limitación de no sumarle ningún tipo de restricción agregado al software luego de modificado. Es importante destacar que para considerar a un software como libre, se debe permitir el acceso al código fuente, por cuanto esto es una condición imprescindible para ejercer las libertades de estudiarlo, modificarlo, mejorarlo y adaptarlo (FSF, 2009). Cuando se habla de softwarelibre es necesario hacer mención a las cuatro libertades básicas de su filosofía según la Fundación de Software Libre.
  • 54. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 54 2.13.3. Libertades básicas del software libre Libertad cero: “usar el programa con cualquier propósito”. Esta libertad es la que garantiza que se puede utilizar el programa para cualquier fin, sea este comercial, educativo, cultural, etc. Esta libertad está en contraposición a las licencias que limitan la utilización del software a un propósito determinado, o que restringen su uso para ciertas actividades. Libertad uno: “Estudiar cómo funciona el programa, y adaptarlo a nuestras necesidades”. Esto se traduce en que se puede estudiar el funcionamiento (para ello se debe tener acceso al código fuente del programa) lo que permitirá, descubrir funcionalidades ocultas, conocer de qué manera realiza determinada tarea, averiguar que otras opciones tiene, que más se le puede agregar, etc. El hecho de poder adecuar el programa, implica que se pueden eliminar partes que no se necesitan, agregarle elementos que se consideren importantes, etc. Libertad dos: “Distribuir copias”. Esto quiere decir que se tiene la libertad redistribuir el programa, ya sea de forma gratuita o cobrando por el servicio, pudiendo realizar esto por e-mail, CD, o algún medio de almacenamiento, ya sea a una persona o a varias, etc. Libertad tres: “Mejorar el programa, y liberar las mejoras a todos”. Por esto se entiende que se tiene la libertad de mejorar el programa, traduciéndose esto en menores los requerimientos de
  • 55. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 55 hardware para funcionar, un software con mayores prestaciones, que ocupe menos espacio en disco, etc. 2.13.4. Software libre y software de código abierto Barahona, Seona y Robles (2.008) señalan que Open Source como Free Software en realidad son movimientos sociales, motivados por lo que se puede o se debería poder hacer (derechos) con los programas (software). Entre estos dos movimientos existen diferencias filosóficas pero realmente pocas diferencias prácticas. La primera diferencia que existe entre estos movimientos, radica en la visión que tienen del software, Free Software tiene una visión moral “el software debería ser libre” Open Source tiene una visión práctica “el software es mejor si su código es abierto“. Free Software en realidad hace referencia a software libre (de ninguna manera a software gratis) y está sustentado en fundamentos morales. Las libertades en las que basa su concepción hacen referencia que puedas utilizar un programa, pero que también puedas copiarlo, distribuirlo, estudiarlo o modificarlo sin ningún tipo de restricción. Desde su punto de vista, limitar cualquiera de estas libertades es inmoral. Open Source por su parte se refiere a la limitación de acceso al código fuente del software, el hecho distribuir el código
  • 56. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 56 fuente del software alienta, según los promotores del open source, un software de mayor calidad, más seguro y creativo, el cual evoluciona de forma más ágil y está orientada a satisfacer las necesidades de sus usuarios. En algo en lo cual coinciden tanto Free Software como Open Source es que ambos no ponen reparos en que la gente venda software, eso sí, lo que se vende no es la licencia del software en sí, sino que se vende el servicio de entregar el software (muchas veces se vende empaquetado, con manuales, instalado u otro valor agregado). Para los dos movimientos, ante la venta de un softwarede desarrollo propio o desarrollado por otros, no se puede restringir al comprador, para que éste no pueda a su vez venderlo o inclusive regalarlo y debe entregarse el código fuente y permitir su modificación, para poder ser considerado Free Software u Open Source. Se entiende por licencias de software al contrato existente entre dos personas (proveedor y usuario) en el cual se describen y puntualizan los derechos y deberes sobre el uso que se le puede dar al software. Aunque ciertamente, Open Source y Software Libre tienen prácticamente las mismas licencias, la FSF opina que el movimiento Open Source es filosóficamente diferente del movimiento del Software Libre. La Open Source Initiative(en
  • 57. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 57 adelante OSI) surgió en el año 1.998, en ese entonces un grupo de personas encabezados por Eric S. Raymond y Bruce Perens buscan otorgar mayor importancia a los beneficios en que redundaría el hecho de compartir el código fuente de los programas, como así también lograr captar el interés de las grandes casas de software y otras empresas de la industria de la alta tecnología en ese rumbo. La visión que tienen ambos movimientos, es una de las principales diferencias, mientras que el movimiento del software libre pone el foco en los aspectos éticos o morales del software, dejando a un segundo plano la excelencia técnica siendo su mayor deseo el plano ético. En tanto movimiento Open Source centraliza más su mirada hacia la excelencia técnica como el principal objetivo, basándose en el hecho compartir el código fuente un medio para lograr dicho fin. Un punto a tener en cuenta es que el software en sí mismo, no es ni Free Software ni Open Source, solo la licencia del software es la que puede ser reconocida por ambos movimientos como válidas para sus fines. De hecho las mayorías de las licencias aceptadas por uno de los movimientos son aceptadas por el otro. Aunque habitualmente los términos “software libre” y “código abierto” son intercambiados fácilmente entre sí, no significa que ambos términos sean equivalentes.
  • 58. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 58 2.13.5. Tipos de licencias de software libre La licencia de software libre más utilizada es la GNU General Public License (GPL), está presente en diversos productos de software libre en sus versiones 2 y 3. Este tipo de licencias a más de las cuatro libertades básicas del software libre agrega una cláusula de “efecto viral”, gracias a la cual es posible aunar varios productos de software exclusivamente si todos estos utilizan la licencia GPL. Ciertamente la licencia GPL no es la única licencia de software libre. Existen muchas otras licencias derivadas de la GPL como por ejemplo la Lesser General Public License(en adelante LGPL) y la Affero GNU Public License(en adelanteAGPL). La LGPL permite que el software bajo esta licencia pueda utilizar librerías de licencia privativas (en esto se diferencia de la GPL, con la cual puede utilizarse solo software que tiene licencia GPL). Mientras que la AGPL dirigida al campo del software ofrecido como servicio, y su principal característica práctica está en el hecho de que, si un tercero utiliza el software para brindar un servicio a varios usuarios y realiza modificaciones al código original, está en la obligación de publicar dicho código fuente. Por el lado de las licencias de código abierto que abiertamente no son licencias de software libre, ya que no son compatibles con las libertades y principios básicos del software libre de la GPL se puede mencionar a la Common Public Attribution License Version 1.0 (en adelante CPAL). Esta licencia admite el uso y la modificación del código fuente, siempre y
  • 59. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 59 cuando se haga referencia al creador original del software, y por tanto no podría ser utilizada por algún competidor.
  • 60. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 60 CAPÍTULO 3– MARCO METODOLÓGICO 3.1. Descripción de la profundidad y el diseño de la Tesis: La investigación llevada a cabo para la realización del proyecto se basó en un estudio descriptivo, se revisó exhaustivamente la literatura existente relacionada, con el fin de obtener la información necesaria para dar inicio al proyecto. Durante la investigación se recabo cuantiosa información sobre las empresas Flayp S.R.L. y Virú S.R.L., pertenecientes al Grupo Flayp, como así también acerca de la Inteligencia de Negocios, software libre, open source, etc., y sobre todo las herramientas a utilizar para el diseño y desarrollo del proyecto, las cuales sirvieron para llevar adelante la tesis. La presente tesis está basada en un diseño cualitativo, donde los datos se describieron detalladamente teniendo en cuenta el objeto de estudio. Patton (1.980), mencionado en el libro de investigación de Hernandez Sampieri y Col (2.003). Cabe destacar que para la realización del presente proyecto se analizaron detalladamente todos los requerimientos y en base a los conocimientos básicos, más las investigaciones realizadas, junto con los relevamientos del sistema actual que se posee, además del hardware con el que cuentan las empresas, se definió la solución que mejor se adecua al contexto actual, para luego definir las etapas necesarias para llevar adelante la realización de la tesis.
  • 61. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 61 3.2. Descripción de cómo se realizó la Tesis Para el desarrollo de la tesis, se optó por el modelo de ciclo de vida en cascada ya que es este, el que mejor se adapta a la realización del proyecto de tesis. En este sentido, “[…] el modelo en cascada, algunas veces llamado el ciclo de vida clásico, sugiere un enfoque sistemático, secuencial hacia el desarrollo del software, que se inicia con la especificación de requerimientos del cliente y que continúa con la planeación, el modelado, la construcción y el despliegue, para culminar en el soporte del software terminado”(Pressman, R.2005:50). El mismo consiste en el ordenamiento secuencial de las etapas del proceso para el desarrollo del software, teniendo en cuenta que debe aguardarse la finalización de una etapa inmediatamente anterior, antes de poder dar inicio a una siguiente etapa, de ser necesario pueden realizarse retroalimentaciones de etapas anteriores, a fin de minimizar impactos negativos. Las etapas definidas para este proyecto son las siguientes: relevamiento de datos, análisis de datos, diseño, desarrollo, prueba e implementación. Para el análisis de los procesos se diseñó una WBS (Work Breakdown Structure), donde se puede apreciar la descripción jerárquica de los trabajos a realizar para la concreción de la tesis, la misma puede observarse en el Anexo 1.
  • 62. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 62 3.2.1. Relevamiento de datos Se concretaron reuniones con los miembros del directorio del Grupo Flayp, de igual manera se realizaron entrevistas personalizadas a los gerentes de cada área, se relevaron los procesos realizados diariamente en los sistemas operacionales por medio de observaciones de los manuales de procesos; gracias a las entrevistas realizadas a los gerentes, se definieron los criterios que son utilizados para la toma de decisiones, de manera a poder, a través de la concreción del proyecto, brindar un soporte para optimizarla toma de dichas decisiones. En cuanto a software, se observó el funcionamiento de los sistemas actualmente utilizados, y la manera en la que estos interactúan con todas y cada una de las áreas de las empresas, en esta instancia se relevó con especial atención todo lo que respecta a la estructura de datos, así también la infraestructura base en cuanto a softwarey hardware existente. 3.2.2. Análisis de datos Una vez finalizada la tarea de relevamiento de datos, y ya con toda la información necesaria, se llevó a cabo un análisis minucioso de las necesidades e inquietudes de los futuros usuarios del sistema, esto más la información sobre la tecnología con la que se cuenta, nos dio las bases para definir que la mejor opción que se adecua a dichas necesidades radica en la
  • 63. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 63 implementación de una solución de Inteligencia de Negocios, ya que dicha solución brindará un soporte para la toma de decisiones estratégicas, como así también brindar una visión macro de ambas empresas en conjunto, que será de mucha utilidad para los altos niveles ejecutivos, ya que los datos se encuentran dispersos en diferentes formatos de almacenamiento, lo que dificulta la realización de análisis, para lo cual no se trabajará de manera directa con las bases de datos transaccionales. La utilizaciónde un data warehousepermitirá cohesionar los datos de las distintas fuentes, la misma se desarrollará íntegramente sobre softwarelibre, se llegó a esta conclusión luego de analizar detenidamente las soluciones propietarias existentes en el mercado, los requerimientos tanto de software como de hardware que son necesarios para la implementación de la solución, son altamente compatibles con los que ya se cuentan, se prevén todas las medidas de seguridad en aplicaciones web, también se harán uso de las nuevas tecnologías existentes, con el fin de optimizar y agilizar el acceso a los datos en considerables niveles de tiempo. 3.2.3. Diseño Con el afán de obtener un prototipo coherente que satisfaga los requerimientos relevados y analizados en etapas anteriores, se llevó a cabo el diseño conceptual, lógico y físico del prototipo de solución de Inteligencia de Negocios, comenzando por el data warehouse, los procesos de ETL, reportes, cubos multidimensionales, cuadros de mandos y demás componentes,
  • 64. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 64 como ser la arquitectura de la herramienta y del prototipo en el contexto general. 3.2.4. Desarrollo Ya con toda la documentación resultante de la etapa de diseño, se procedió a desarrollar el proyecto, se inició con el desarrollo el data warehouse, cuyo objetivo es unificar los datos obtenidos de las distintas fuentes transaccionales, para ello se eliminan las ambigüedades e inconsistencias, a través de un proceso de extracción, transformación y cargado de los datos en eldata warehouse. Se diseñaron y publicaron en el servidor los cubos OLAP, los cuadros de mando, los reportes y el resultado de la minería de datos, para lo cual se aplicó el algoritmo seleccionado. Se configuró e implementó el servidor, para que los usuarios puedan acceder a los distintos módulos, ya sean estos de reportes, análisis, etc., asítambién se otorgaron los privilegios necesarios a los informes y a las carpetas contenedoras. Se configuró e implementó la consola de administración, de manera tal a poder administrar tanto los usuarios como los roles asignados. En cada una de las etapas de configuración e implementación del proyecto, se tomaron en cuenta todas las políticas y estándares de seguridad en cuanto a aplicaciones cliente-servidor se refiere, como ser, manejo de sesiones, administración de perfiles, permisos de usuario, etc.
  • 65. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 65 3.2.5. Prueba Se realizaron las pruebas correspondientes, se corroboraron los resultados obtenidos, si cumplen con los requerimientos y la fiabilidad de los mismos, además se realizaron pruebas exhaustivas en cuanto a concurrencia de acceso al sistema, conectividad, tiempo de respuesta, nivel de seguridad, etc. 3.2.6. Implementación Los componentes del prototipo de la solución, se instalaron y configuraron en una máquina preparada para actuar de servidor, el mismo está compuesto por, la consola de administración de Pentaho, el servidor Pentaho, los componentes de Pentaho Data Integration (en adelante PDI) y se configuró la periodicidad de la actualización del data warehouse, y el Sistema Gestor de Base de Datos (en adelante SGBD) MySQL, donde se almacenará el data warehouse, así también se crearon los perfiles de usuario, con la asignación de roles y permisos correspondientes, se configuraron los ordenadores-cliente para acceder al sistema.
  • 66. Inteligencia de Negocios Tesis de Grado Ingeniería en Informática Universidad del Cono Sur de las Américas 66 3.3. Descripción de los instrumentos y procedimientos utilizados para la recolección y tratamiento de la información Para la elaboración de este proyecto se recolectaron los datos a través de entrevistas semi-estructuradas a directores y gerentes del Grupo Flayp,para obtener los permisos para acceder a la información, procesos y los reportes necesarios para la toma de decisiones. También se realizaronobservaciones directasde los distintos procesos y sistemas operacionales automatizadosa fin de elaborar reportes de requerimientos. 3.4. Descripción de la muestra Para la realización de este proyecto, luego de un análisis de la población, se optó por llevarlo adelante en las empresas del Grupo Flayp, concretamente Viru S.A y Flayp S.R.L., en los departamentos de Ventas y Marketing, la selección de las empresas y los departamentos se realizó gracias a la buena predisposición e interés de los directivos de contar con una herramienta que ayude a la toma de decisiones. Las entrevistas se realizaron a los gerentes de Compras, Ventas, Marketing, Finanzas y un director de las empresas seleccionadas. También se realizaron observaciones directas de los distintos procesos y sistemas operacionales automatizados.