Open Source Business Intelligence 2013 (spanish)Stratebi
Presentacion sobre servicios alrededor del Business Intelligence y otras soluciones open source, incluyendo Big Data, Open Data y solucines como Pentaho, Liferay, SugarCRM
Data Integration & Data Quality Open Source (spanish)Stratebi
Introducción a Data Quality: Qué es, Por qué, Conceptos, Beneficios de Data Quality
Data Quality & Business Intelligence:
Pilares del BI
Integración de datos
Mejores prácticas
Opensource & Data Quality:
Data Quality & Pentaho (PDI)
PDI / ETLs / Integridad / Validación
Data Cleaner
Integración Data Cleaner y PDI
Esta presentacion de la Suite de Inteligencia de Negocios Pentaho muestra una vision general de la Suite BI en Software Libre mas robusta de la actualidad.
Presentación "Aplicaciones de BI con Pentaho", dada por Datalytics en la segunda edición de las Jornadas de Minería de Datos organizadas por la cátedra de Sistemas de Gestión 2 de la UTN Regional Rosario
Open Source Business Intelligence 2013 (spanish)Stratebi
Presentacion sobre servicios alrededor del Business Intelligence y otras soluciones open source, incluyendo Big Data, Open Data y solucines como Pentaho, Liferay, SugarCRM
Data Integration & Data Quality Open Source (spanish)Stratebi
Introducción a Data Quality: Qué es, Por qué, Conceptos, Beneficios de Data Quality
Data Quality & Business Intelligence:
Pilares del BI
Integración de datos
Mejores prácticas
Opensource & Data Quality:
Data Quality & Pentaho (PDI)
PDI / ETLs / Integridad / Validación
Data Cleaner
Integración Data Cleaner y PDI
Esta presentacion de la Suite de Inteligencia de Negocios Pentaho muestra una vision general de la Suite BI en Software Libre mas robusta de la actualidad.
Presentación "Aplicaciones de BI con Pentaho", dada por Datalytics en la segunda edición de las Jornadas de Minería de Datos organizadas por la cátedra de Sistemas de Gestión 2 de la UTN Regional Rosario
Presentación realizada por Datalytics con motivo del desayuno de trabajo realizado el 18 de Diciembre 2012, donse se hace un repaso de las novedades que ofreció Pentaho en el año en materia de visualización de datos.
Las herramientas de reportería y análisis de datos no son nuevas pero vemos cada día empresas que no han podido aprovechar el potencial de sus herramientas de BI. Es frecuente encontrar varias plataforma de BI en una empresa. Porque Pentaho tiende a perdurar y difundirse más que otras herramientas de BI dentro de la empresa ?
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Pentaho
This webinar is in Spanish -
El uso de análisis predictivo o minería de datos está en auge. A nivel mundial, cada vez más, las empresas contratan servicios especializados de análisis de información que ayuden a marcar una diferencia con la competencia. Por otro lado, el volumen creciente de data así como su naturaleza cambiante y compleja, hacen inmanejable el proceso de análisis de forma tradicional y está siendo necesario incorporar tecnología y consultoría de punta, basada en el uso de modelos matemáticos avanzados. Pentaho Corporation y Matrix CPM Solutions los invita a participar en el seminario en línea “Análisis Predictivo con Pentaho Data Mining”, en donde se revisarán las grandes oportunidades que existen para su uso y aplicación.
Documento que explica como realizar la integración entre SAP (BW- HANA) y PowerBI para maximizar el potencial de análisis de los datos económicos y financieros de las compañías
Como crear Plataformas Big Data y ML basadas en open source: como almacenar y gestionar grandes volúmenes de información con origenes de datos abiertos turisticos y externos de todo tipo: Redes, Telefonía, apps, vuelos, hoteles, estadisticos....
Que son las herramientas de inteligencia de negocios, sus características y algunos ejemplos de estas herramientas en software privativo y software libre.
Presentamos la solución Business Intelligence basada en Pentaho Open Source y con nuevos módulos y funcionalidades (OLAP, Reporting Adhoc, Dasboards, Scorecards, mobile support...) que le permitirán tener su solución BI más económica
Presentación de Big Data Architecture & Integration con Pentaho, realizada por Datalytics con motivo del desayuno de trabajo realizado el 18 de Diciembre 2012.
Business Intelligence (B.I.). La Plataforma PentahoT.I.C
Un resumen muy práctico para entender como funcionan las plataformas de B.I. (Business Intelligence o Negocios Inteligentes), en particular Pentaho BI Community Edition
Presentación realizada por Datalytics con motivo del desayuno de trabajo realizado el 18 de Diciembre 2012, donse se hace un repaso de las novedades que ofreció Pentaho en el año en materia de visualización de datos.
Las herramientas de reportería y análisis de datos no son nuevas pero vemos cada día empresas que no han podido aprovechar el potencial de sus herramientas de BI. Es frecuente encontrar varias plataforma de BI en una empresa. Porque Pentaho tiende a perdurar y difundirse más que otras herramientas de BI dentro de la empresa ?
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Pentaho
This webinar is in Spanish -
El uso de análisis predictivo o minería de datos está en auge. A nivel mundial, cada vez más, las empresas contratan servicios especializados de análisis de información que ayuden a marcar una diferencia con la competencia. Por otro lado, el volumen creciente de data así como su naturaleza cambiante y compleja, hacen inmanejable el proceso de análisis de forma tradicional y está siendo necesario incorporar tecnología y consultoría de punta, basada en el uso de modelos matemáticos avanzados. Pentaho Corporation y Matrix CPM Solutions los invita a participar en el seminario en línea “Análisis Predictivo con Pentaho Data Mining”, en donde se revisarán las grandes oportunidades que existen para su uso y aplicación.
Documento que explica como realizar la integración entre SAP (BW- HANA) y PowerBI para maximizar el potencial de análisis de los datos económicos y financieros de las compañías
Como crear Plataformas Big Data y ML basadas en open source: como almacenar y gestionar grandes volúmenes de información con origenes de datos abiertos turisticos y externos de todo tipo: Redes, Telefonía, apps, vuelos, hoteles, estadisticos....
Que son las herramientas de inteligencia de negocios, sus características y algunos ejemplos de estas herramientas en software privativo y software libre.
Presentamos la solución Business Intelligence basada en Pentaho Open Source y con nuevos módulos y funcionalidades (OLAP, Reporting Adhoc, Dasboards, Scorecards, mobile support...) que le permitirán tener su solución BI más económica
Presentación de Big Data Architecture & Integration con Pentaho, realizada por Datalytics con motivo del desayuno de trabajo realizado el 18 de Diciembre 2012.
Business Intelligence (B.I.). La Plataforma PentahoT.I.C
Un resumen muy práctico para entender como funcionan las plataformas de B.I. (Business Intelligence o Negocios Inteligentes), en particular Pentaho BI Community Edition
Integración de Datos sin límites con PentahoDatalytics
Presentación de Pentaho Data Integration dada durante el foro "Las Dimensiones del BI" en Medellín (COL), donde se presentó la problemática de la integración de datos en la actualidad (cada vez más información, fuentes más diversas, datos no estructurados, etc.), como muchas empresas aún hoy intentan resolver este problema con programación SQL o similar y como Pentaho Data Integration puede no solo resolver este problema de una manera muy ágil, si no también como puede utilizarse para comenzar a analizar la información y realizar tareas de Data Discovery y Data Visualization antes de la generación de cubos, reportes, etc.
http://www.sqlserversi.com - Visión general de los proyectos de Business Intelligence, basados en Microsoft SQL Server 2000, DTS y Analysis Services 2000.
http://www.sqlserversi.com - Visión general de los proyectos de Business Intelligence, basados en Microsoft SQL Server 2000, DTS y Analysis Services 2000.
Introducción a Microsoft Business Intelligence, mostrando toda la plataforma que nos ofrece basada en SQL Server (Integration Services, Analysis Services, Reporting Services)
Introductory Slides About Business Intelligence concepts. It was made in 2012 for a 2 hour introduction of Business Intelligence, for a private seminar.
---------------------------------------------
Diapositivas introductorias sobre conceptos de inteligencia de negocios. Elaboradas en 2012 para una introducción sobre BI en un seminario privado.
Big Data - Desarrollando soluciones efectivasJoseph Lopez
Como continuación a la presentación titulada "Introducción al mundo de las Bodegas de datos", esta presentación le explicará qué es Big Data y sus beneficios, incluyendo casos de uso. Así mismo, discutiremos cómo Hadoop, la nube y procesamiento masivamente paralelo (MPP) está cambiando la forma en los almacenes de datos se están construyendo. Hablaremos de arquitecturas híbridas que combinan datos in situ con datos en la nube, así como datos relacionales y no relacionales de datos (no estructurados). Veremos también los beneficios del MPP en SMP y cómo integrar datos desde dispositivos en la Internet (IoT). Aprenderemos también lo que debería verse como un almacén de datos moderno y cómo cuadra su papel de un mar de datos y Hadoop. Al finalizar esta exposición, tendremos una orientación sobre la mejor solución para el almacén de datos en el futuro.
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxWalterOrdoez22
Es un conjunto de diapositivas creadas para la información sobre la importancia que tienen la interpol en honduras y los tratados entre ambas instituciones
Ipsos, empresa de investigación de mercados y opinión pública, divulgó su informe N°29 “Claves Ipsos” correspondiente al mes de abril, que encuestó a 800 personas con el fin de identificar las principales opiniones y comportamientos de las y los ciudadanos respecto de temas de interés para el país. En esta edición se abordó la a Carabineros de Chile, su evaluación, legitimidad en su actuar y el asesinato de tres funcionarios en Cañete. Además, se consultó sobre el Ejército y la opinión respecto de la marcha en Putre.
11. Análisis eficiente de datos
Data Warehouse – Almacén de datos
Repositorio centralizado de datos. Permite correlacionar indicadores y
velocidad en consultas
13. Análisis eficiente de datos
Transaccional DW
Orientados a software Orientados a temas
Utilizados para el funcionamiento del negocio Utilizados para analizar negocio
Usados por empleados comunes Usados por ejecutivos y analistas
Contiene datos detallados Contiene datos resumidos y refinados
Contiene datos aislados Contiene datos integrados
Acceso repetitivo y transac. pequeñas Acceso a medida con consultas complejas
No hay redundancia (3FN) Se prima la rapidez al tamaño en disco
17. Análisis eficiente de datos
HECHOS
• Responden a la pregunta ¿Qué queremos medir?
• Euros gastados, ventas, edad, unidades, coste, litros, kilos….
• Se agrupan en una tabla: La tabla de hechos o Fact Table:
• Tabla central en un modelo multidimensional.
• Almacena datos numéricos e indicadores clave (PKIs)
• Están almacenados a un determinado nivel de detalle.
• La mayoría de las veces, contiene hechos aditivos.
• Las tablas de hechos tienden a crecen a “lo alto”
Clave del
Producto
Clave de la
tienda
Clave del
Tiempo
Euros Unidades
1 2 12 300 5
1 7 3 1000 7
2 9 5 227 2
18. Análisis eficiente de datos
DIMENSIONES
• Responden a la pregunta ¿Desde que puntos de vista quieres analizar los hechos?
Por Mes o Año, Ciudad, Sede, Partida, Tipo de cliente …
• Contienen los descriptores textuales de los hechos.
• Están contenidas en tablas, cada dimensión en una tabla
• Las tablas de dimensión tienden a crecen a “lo ancho”
Clave_mes Mes
1 Enero
2 Febrero
Producto Clave_producto
1 Libros
2 DVD
Tienda Clave_tienda
7 Sevilla
2 Córdoba
38. PENTAHO DATA INTEGRATION
¿Qué es Pentaho Data Integration?
• PDI es un set de herramientas, que permite diseñar ETLs, mediante transformaciones y trabajos que pueden ser
ejecutadas por las herramientas de Spoon, Pan y Kitchen. Antes se le conocía con el nombre de Kettle.
•Spoon interfaz gráfica para diseño de trasformaciones y trabajos ETL.
•Pan es un motor capaz de ejecutar múltiples transformaciones de datos como leer, manipular y escribir
desde y en distintos orígenes de datos.
•Kitchen es un programa que ejecuta los trabajos diseñados por Spoon. Normalmente estos trabajos son
planificados en modo batch para ejecutar automáticamente a periodos regulares (crontab -e).
39. PENTAHO DATA INTEGRATION
Características y beneficios
• Permite trabajar con un repositorio en Base de Datos o en Ficheros.
• Su interfaz gráfica te permitirá crear de transformaciones y trabajos de manera intuitiva mediante pasos
modulares ya creados, conexiones con múltiples fuentes, etc...
• Distribución y combinación de diferentes fuentes, en diferentes hosts.
• Interfaz SQL y generador de código automático.
• Crear cálculos de una manera muy sencilla.
• Define qué quieres hacer, no como quieres hacerlo.
• Genera código XML y Java.
• Instalación sencilla – sólo extraer los ficheros, aplicación Java. (ojo con la versión java -version)
• Fácil de mantener, con alto rendimiento y escalabilidad.
• Es posible parametrizar bastantes configuraciones (directorios, conexiones, mail).
• Posee una arquitectura de Plug-in que te permitirá expandir sus funcionalidades.
40. PENTAHO DATA INTEGRATION
Spoon
• Menú principal (rojo)
• Pestaña vista (verde)
• Pestaña design (azul)
• Menú iconos (amarillo)
• Zona de Trabajo
41. PENTAHO DATA INTEGRATION
Pestañas
• Pestaña Vista (View):
• Orígenes de Datos.
• Pasos
• Saltos
• Esquemas
• Servidores Esclavos
• Esquemas en Cluster.
• Pestaña Diseño (Design):
• Entrada
• Salida
• Búsqueda
• Transformar
• Uniones
• Scripting
• Data Warehouse
• Mapeado
• Trabajo
• Embebido
• Experimental
42. PENTAHO DATA INTEGRATION
Menú de Iconos
Icono Descripción
Crear un nuevo trabajo o transformación o CNTRL - N
Abrir un trabajo/transformación de un fichero o del repositorio si estas conectado a él.
Guardar el trabajo/transformación a un fichero o al repositorio
Guardar el trabajo/transformación con un nombre distinto.
Abrir la ventana de impresora.
Ejecutar el trabajo/transformación: ejecuta la transformación actual desde el fichero XML o el repositorio.
Previsualizar la transformación: ejecuta la transformación actual desde memoria. Puedes previsualizar las filas producidas
por el paso seleccionado
Ejecutar la transformación en modo de pruebas permitiéndote la solución de errores de ejecución.
Repetir el proceso de una transformación para una cierta fecha y hora. Esto causará que ciertos pasos (TextFile Input
y Excel Input) sólo procesarán las filas que fallaron para ser interpretadas correctamente a esa fecha y hora particular.
Ejecutar un análisis de impacto: que impacto tiene la transformación en la base de datos usada.
Generar el SQL que es necesario para ejecutar la transformación.
Lanza el explorador de la base de datos permitiéndote previsualizar los datos, ejecutar consultas SQL, generar DDL y más.
43. PENTAHO DATA INTEGRATION
Componentes de PDI (I)
• Los procesos ETL se dividen en dos componentes principales:
• Transformaciones (.ktr): es el conjunto de pasos básicos que componen el nivel
más bajo de una ETL.
• Trabajos (.kjb): es un conjunto de pasos, trabajos y transformaciones.
44. PENTAHO DATA INTEGRATION
Componentes de PDI (II)
• Transformaciones:
• Paso: son los elementos atómicos de PDI y cada uno realiza una transformación en
el flujo de datos. (Leer datos, escribir en BBDD, crear cálculos, añadir constantes, ....)
• Salto: es la representación gráfica del flujo de datos entre 2 pasos.
45. PENTAHO DATA INTEGRATION
Componentes de PDI (III)
• Trabajos:
• Paso: son los elementos atómicos de PDI y cada uno realiza una trabajo. (No
modifican el flujo de datos)
• Salto: representa el orden de ejecución de transformaciones y trabajos.
• Trabajo y Transformación: dentro de un trabajo podemos incluir llamadas a otras
transformaciones y/o trabajos para que sean ejecutadas.
• Un trabajo procesa todos los registros antes de continuar, en cambio, una
transformación es un flujo de datos continuo de manera que los registros avanzan
por los pasos según llegan.