SlideShare una empresa de Scribd logo
1 de 40
Descargar para leer sin conexión
DB OPEN SOURCE Y PENTAHO
Rolando Herrera Matos
rolando.herrera@apesol.org.pe
@rollyherrera
QUE ES UN SGDB ?
Un Sistema de Gestión de Bases de Datos (SGBD) es un conjunto de
programas que permiten el almacenamiento, modificación y extracción de
la información en una base de datos, además de proporcionar
herramientas para añadir, borrar, modificar y analizar los datos.
Componentes SGDB
¿LIBRE O PRIVATIVO?
LIBRE
PRINCIPALES BASE DE DATOS LIBRES
MYSQL: (GPL)
http://www.mysql.com/
PRINCIPALES BASE DE DATOS LIBRES
POSTREGRESQL: (BSD)
http://www.postgresql.org/
MongoDB : Es una base de datos Open Source de gran rendimiento,
escalable, schema-free (NOSQL) y orientada a documentos (esquemas de
datos tipo JSON). Hay drivers preparados para usar esta base de datos desde
lenguajes como PHP, Python, Perl, Ruby, JavaScript, C++ y muchos más.
http://www.mongodb.org/
HyperTable (GPL) : Es un sistema de almacenamiento distribuido de
datos de alto rendimiento diseñado para soportar aplicaciones que requieran
máximo rendimiento, escalabilidad y eficiencia. Se ha diseñado y modelado a
partir del proyecto BigTable de Google y se enfoca sobre todo a conjuntos de
datos de gran escala.
http://hypertable.org/
APACHE COUCH DB (Apache License, Version 2.0) : Este
proyecto está destinado a ofrecer una base de datos orientada a documentos
que se pueden consultar o indexar en modo MapReduce usando JavaScript.
CouchDB ofrece una API JSON RESTful a la que se puede acceder desde
cualquier entorno que soporte peticiones HTTP.
http://couchdb.apache.org/
NEO4J (GPL) : Es un motor de persistencia completamente transaccional
en Java que almacena los datos mediante grafos, y no mediante tablas. Neo4j
ofrece una escalabilidad masiva. Puede manejar grafos de varios miles de
millones de nodos/relaciones/propiedades en una única máquina, y se puede
escalar a lo largo de múltiples máquinas.
http://www.neo4j.org/
RIAK (Apache License, Version 2.0) : Riak es una base de
datos ideal para aplicaciones web y combina:
Un manejo de key descentralizado
Un motor map/reduce flexible
Una interfaz de consultas HTTP/JSON amigable.
http://docs.basho.com/riak/latest//
ORACLE BERKELY DB (Open Source OSI) :Bases de
datos embebidas que proporciona a los desarrolladores
persistencia local, rápida y eficiente con una administración
nula. Oracle Berkeley DB se enlaza a nuestras aplicaciones
y permite realizar llamadas simples a funciones en lugar de
enviar mensajes a un servidor remoto para mejorar el
rendimiento..
http://www.oracle.com/technetwork/products/berkeleydb/overview/index.html/
Apache CASSANDRA (Apache License, Version 2.0)
:Cassandra es probablemente uno de los proyectos NoSQL
más concoidos del mercado. Se trata de una base de datos
distribuida de segunda generación con alta escalabilidad
que está siendo usada por gigantes como Facebook (que
es quien la ha desarrollado), Digg, Twitter, Cisco y más
empresas.
http://cassandra.apache.org/
MenCached (GPL) :es un almacen del tipo in-memory
key-value para pequeñas cadenas de datos arbitrarios
(textos, objetos) de resultados de llamadas a base de
datos, llamadas a API, o renderizado de páginas. Está
orientado a acelerar aplicaciones web dinámicas al aliviar la
carga de la base de datos.
http://memcached.org/
FIREBIRD (MPL) :Firebird es una base de datos relacional
que puede ser utilizada en Linux, Windows y varias
plataformas UNIX, y ofrece un alto rendimiento y potente
soporte de lenguajes para procedimientos almacenados y
triggers.
http://www.firebirdsql.org/
MariaDB (GPL) MariaDB es una rama compatible hacia
atrás de MySQL® Database Server. Incluye soporte para la
mayoría de los motores de almacenamiento Open Source,
y además para el propio motor de almacenamiento Maria.
https://mariadb.com/
Drizzle (BSD-GPL): Es un fork de MySQL que se centra en
ser una base de datos eficiente y estable, sobre todo
optimizada para aplicaciones de Internet y que siguen la
filosofía Cloud Computing.
https://launchpad.net/drizzle
hyperSql (BSD): Es un motor de bases de datos
relacionales SQL escrito en Java. HyperSQL ofrece un
pequeño pero veloz motor de bases de datos que dispone
de tablas in-memory y basadas en disco, y que soporta los
modos embebido y servidor. Además, dispone de
herramientas como una consola de comandos SQL y una
interfaz gráfica para las consultas.
http://hsqldb.org/
MonetDB (BSD): MonetDB es un sistema de bases de
datos para aplicaciones de alto rendimiento dirigidas a la
minería de datos, OAP, GIS, búsquedas XML, y recolección
de información a partir de ficheros de texto y multimedia.
http://www.monetdb.org/Legal/MonetDBLicense
BUSSINES INTELLIGENCE CON PENTAHO
BUSSINES INTELLIGENCE
Conjunto de estrategias y herramientas enfocadas a la
administración y creación de conocimiento mediante el
análisis de datos existentes en una organización o
empresa.
PROCESOS BUSSINES INTELLIGENCE
PENTAHO
• Es la unión de varios proyectos libres relacionados con BI
• Reportes, dashboards, procesos ETL, cubos, data mining
• Proporciona una plataforma Web
• Basado en Java J2EE
• Servidor Web Jboss o Tomcat
• Sorporta MS-SQL, Oracle, PostqreSQL, MySQL
• Windows XP, Windows 2003, Linux
• Versión libre y versión Enterprise
PROCESOS BUSSINES INTELLIGENCE
PENTAHO
Es la unión de varios proyectos libres relacionados con BI
Reportes, dashboards, procesos ETL, cubos, data mining
Proporciona una plataforma Web
Basado en Java J2EE
Servidor Web Jboss o Tomcat
Sorporta MS-SQL, Oracle, PostqreSQL, MySQL
Windows XP, Windows 2003, Linux
Versión libre y versión Enterprise
PENTAHO
Pentaho cuenta con:
Jfree Report: Motor para reportes
Mondrian: Motor para cubos
Weka: Motor para minería de datos
Plataforma Web para publicar y visualizar la información
Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes
funciones:
Para generar reportes: Report Designer
Para generar cubos: Cube designer, WorkBench.
Para minería de datos: Weka
Para generar procesos ETL: Kettle (Spoon/Pan)
PENTAHO
KETTLE
(SPOON)
JFREE
REPORT
MONDRIAN
WEKA
PLATAFORMA
WEB
SISTEMAS
OLAP
MS-SQL
ORACLE
MYSQL
EXCEL
PENTAHO
Pentaho cuenta con:
Jfree Report: Motor para reportes
Mondrian: Motor para cubos
Weka: Motor para minería de datos
Plataforma Web para publicar y visualizar la información
Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes
funciones:
Para generar reportes: Report Designer
Para generar cubos: Cube designer, WorkBench.
Para minería de datos: Weka
Para generar procesos ETL: Kettle (Spoon/Pan)
PENTAHO
PENTAHO
PENTAHO
PENTAHO
PENTAHO
PENTAHO
PENTAHO
FUENTES:
http://www.webresourcesdepot.com/25-alternative-open-so
urce-databases-engines
http://www.pentaho.com
http://reporting.pentaho.org
http://mondrian.pentaho.org
http://kettle.pentaho.org
http://wiki.pentaho.com
¿PREGUNTAS ?
GRACIAS
rolando.herrera@apesol.org.pe
rherrera@bladecode.com
@rollyherrera

Más contenido relacionado

La actualidad más candente (20)

Base de Datos
Base de DatosBase de Datos
Base de Datos
 
Gestores
GestoresGestores
Gestores
 
Sistemas gestores de base de datos
Sistemas gestores de base de datosSistemas gestores de base de datos
Sistemas gestores de base de datos
 
Ventajas y desventajas mysql
Ventajas y desventajas mysqlVentajas y desventajas mysql
Ventajas y desventajas mysql
 
Principales bases de datos existentes
Principales bases de datos existentesPrincipales bases de datos existentes
Principales bases de datos existentes
 
My SQL. Para qué se utiliza?
My SQL. Para qué se utiliza?My SQL. Para qué se utiliza?
My SQL. Para qué se utiliza?
 
Explorando html5 - Inicio
Explorando html5 - InicioExplorando html5 - Inicio
Explorando html5 - Inicio
 
Principales bases de datos
Principales bases de datosPrincipales bases de datos
Principales bases de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Presentación taller aplicaciones
Presentación  taller aplicacionesPresentación  taller aplicaciones
Presentación taller aplicaciones
 
Apache marmotta
Apache marmottaApache marmotta
Apache marmotta
 
Presentación1
Presentación1Presentación1
Presentación1
 
Bases de datos
Bases de datos Bases de datos
Bases de datos
 
Base de datos existentes
Base de datos existentesBase de datos existentes
Base de datos existentes
 
Open office base
Open office baseOpen office base
Open office base
 
Preact4.claudio.
Preact4.claudio.Preact4.claudio.
Preact4.claudio.
 
Base de datos
Base de datos Base de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Basede datos salas ubaldo
Basede datos salas ubaldoBasede datos salas ubaldo
Basede datos salas ubaldo
 
Bases de Datos - Act4_Gonzalez_Desirena_JuanCarlos
Bases de Datos - Act4_Gonzalez_Desirena_JuanCarlosBases de Datos - Act4_Gonzalez_Desirena_JuanCarlos
Bases de Datos - Act4_Gonzalez_Desirena_JuanCarlos
 

Similar a Sfd 2013 pentaho

Motores de bases de datos
Motores de bases de datosMotores de bases de datos
Motores de bases de datosstill01
 
Sgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualotoSgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualotoKenny24
 
Gestores de Base de Datos
Gestores de Base de DatosGestores de Base de Datos
Gestores de Base de DatosRedrobanA
 
base de datos con codigos abiertos.pptx
base de datos con codigos abiertos.pptxbase de datos con codigos abiertos.pptx
base de datos con codigos abiertos.pptxJuniorMiraval
 
Los sistemas gestores de bases de datos actuales
Los sistemas gestores de bases de datos actualesLos sistemas gestores de bases de datos actuales
Los sistemas gestores de bases de datos actualesFrancisco Gómez Pino
 
C. comparativo servidores & servicios
C. comparativo servidores & serviciosC. comparativo servidores & servicios
C. comparativo servidores & serviciosKozmo Hernan
 
Bd eq. #3 actividad extra comparacion oracle y mysql
Bd eq. #3 actividad extra comparacion oracle y mysqlBd eq. #3 actividad extra comparacion oracle y mysql
Bd eq. #3 actividad extra comparacion oracle y mysqlKARY
 
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysqlBd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysqlKARY
 
Sistema gestor de base de datos
Sistema gestor de base de datosSistema gestor de base de datos
Sistema gestor de base de datoskarlaaponte
 
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysqlBd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysqlKARY
 
Bd eq. #3 actividad 2 unidad 2 oracle y mysql
Bd eq. #3 actividad 2 unidad 2 oracle y mysqlBd eq. #3 actividad 2 unidad 2 oracle y mysql
Bd eq. #3 actividad 2 unidad 2 oracle y mysqlKARY
 

Similar a Sfd 2013 pentaho (20)

Motores de bases de datos
Motores de bases de datosMotores de bases de datos
Motores de bases de datos
 
Sgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualotoSgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualoto
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Servidor HTTP
Servidor HTTPServidor HTTP
Servidor HTTP
 
Gbd2
Gbd2Gbd2
Gbd2
 
Gestores de Base de Datos
Gestores de Base de DatosGestores de Base de Datos
Gestores de Base de Datos
 
Servidor MySQL
Servidor MySQLServidor MySQL
Servidor MySQL
 
base de datos con codigos abiertos.pptx
base de datos con codigos abiertos.pptxbase de datos con codigos abiertos.pptx
base de datos con codigos abiertos.pptx
 
Mysql
MysqlMysql
Mysql
 
Los sistemas gestores de bases de datos actuales
Los sistemas gestores de bases de datos actualesLos sistemas gestores de bases de datos actuales
Los sistemas gestores de bases de datos actuales
 
C. comparativo servidores & servicios
C. comparativo servidores & serviciosC. comparativo servidores & servicios
C. comparativo servidores & servicios
 
Bd eq. #3 actividad extra comparacion oracle y mysql
Bd eq. #3 actividad extra comparacion oracle y mysqlBd eq. #3 actividad extra comparacion oracle y mysql
Bd eq. #3 actividad extra comparacion oracle y mysql
 
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysqlBd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
 
Sistema gestor de base de datos
Sistema gestor de base de datosSistema gestor de base de datos
Sistema gestor de base de datos
 
SGBD Y TECNOLOGIAS
SGBD Y TECNOLOGIASSGBD Y TECNOLOGIAS
SGBD Y TECNOLOGIAS
 
Sgbd y tecnologias
Sgbd  y  tecnologiasSgbd  y  tecnologias
Sgbd y tecnologias
 
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysqlBd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
Bd eq. #3 actividad 2 unidad 2 comparacion oracle y mysql
 
Bd eq. #3 actividad 2 unidad 2 oracle y mysql
Bd eq. #3 actividad 2 unidad 2 oracle y mysqlBd eq. #3 actividad 2 unidad 2 oracle y mysql
Bd eq. #3 actividad 2 unidad 2 oracle y mysql
 
Servidor mysql
Servidor mysqlServidor mysql
Servidor mysql
 

Más de Finger Cash

Tarjeta embarque
Tarjeta embarqueTarjeta embarque
Tarjeta embarqueFinger Cash
 
Diapositivas Tesis USS
Diapositivas Tesis USSDiapositivas Tesis USS
Diapositivas Tesis USSFinger Cash
 
Mordelo de Desercion de estudiantes.
Mordelo de Desercion de estudiantes.Mordelo de Desercion de estudiantes.
Mordelo de Desercion de estudiantes.Finger Cash
 
Proyecto finger cash
Proyecto finger cashProyecto finger cash
Proyecto finger cashFinger Cash
 

Más de Finger Cash (6)

Tarjeta embarque
Tarjeta embarqueTarjeta embarque
Tarjeta embarque
 
Diapositivas Tesis USS
Diapositivas Tesis USSDiapositivas Tesis USS
Diapositivas Tesis USS
 
Mordelo de Desercion de estudiantes.
Mordelo de Desercion de estudiantes.Mordelo de Desercion de estudiantes.
Mordelo de Desercion de estudiantes.
 
Proyecto finger cash
Proyecto finger cashProyecto finger cash
Proyecto finger cash
 
Finger
FingerFinger
Finger
 
Cisluss
CislussCisluss
Cisluss
 

Sfd 2013 pentaho

  • 1. DB OPEN SOURCE Y PENTAHO Rolando Herrera Matos rolando.herrera@apesol.org.pe @rollyherrera
  • 2. QUE ES UN SGDB ?
  • 3. Un Sistema de Gestión de Bases de Datos (SGBD) es un conjunto de programas que permiten el almacenamiento, modificación y extracción de la información en una base de datos, además de proporcionar herramientas para añadir, borrar, modificar y analizar los datos.
  • 7.
  • 8. PRINCIPALES BASE DE DATOS LIBRES MYSQL: (GPL) http://www.mysql.com/
  • 9. PRINCIPALES BASE DE DATOS LIBRES POSTREGRESQL: (BSD) http://www.postgresql.org/
  • 10. MongoDB : Es una base de datos Open Source de gran rendimiento, escalable, schema-free (NOSQL) y orientada a documentos (esquemas de datos tipo JSON). Hay drivers preparados para usar esta base de datos desde lenguajes como PHP, Python, Perl, Ruby, JavaScript, C++ y muchos más. http://www.mongodb.org/
  • 11. HyperTable (GPL) : Es un sistema de almacenamiento distribuido de datos de alto rendimiento diseñado para soportar aplicaciones que requieran máximo rendimiento, escalabilidad y eficiencia. Se ha diseñado y modelado a partir del proyecto BigTable de Google y se enfoca sobre todo a conjuntos de datos de gran escala. http://hypertable.org/
  • 12. APACHE COUCH DB (Apache License, Version 2.0) : Este proyecto está destinado a ofrecer una base de datos orientada a documentos que se pueden consultar o indexar en modo MapReduce usando JavaScript. CouchDB ofrece una API JSON RESTful a la que se puede acceder desde cualquier entorno que soporte peticiones HTTP. http://couchdb.apache.org/
  • 13. NEO4J (GPL) : Es un motor de persistencia completamente transaccional en Java que almacena los datos mediante grafos, y no mediante tablas. Neo4j ofrece una escalabilidad masiva. Puede manejar grafos de varios miles de millones de nodos/relaciones/propiedades en una única máquina, y se puede escalar a lo largo de múltiples máquinas. http://www.neo4j.org/
  • 14. RIAK (Apache License, Version 2.0) : Riak es una base de datos ideal para aplicaciones web y combina: Un manejo de key descentralizado Un motor map/reduce flexible Una interfaz de consultas HTTP/JSON amigable. http://docs.basho.com/riak/latest//
  • 15. ORACLE BERKELY DB (Open Source OSI) :Bases de datos embebidas que proporciona a los desarrolladores persistencia local, rápida y eficiente con una administración nula. Oracle Berkeley DB se enlaza a nuestras aplicaciones y permite realizar llamadas simples a funciones en lugar de enviar mensajes a un servidor remoto para mejorar el rendimiento.. http://www.oracle.com/technetwork/products/berkeleydb/overview/index.html/
  • 16. Apache CASSANDRA (Apache License, Version 2.0) :Cassandra es probablemente uno de los proyectos NoSQL más concoidos del mercado. Se trata de una base de datos distribuida de segunda generación con alta escalabilidad que está siendo usada por gigantes como Facebook (que es quien la ha desarrollado), Digg, Twitter, Cisco y más empresas. http://cassandra.apache.org/
  • 17. MenCached (GPL) :es un almacen del tipo in-memory key-value para pequeñas cadenas de datos arbitrarios (textos, objetos) de resultados de llamadas a base de datos, llamadas a API, o renderizado de páginas. Está orientado a acelerar aplicaciones web dinámicas al aliviar la carga de la base de datos. http://memcached.org/
  • 18. FIREBIRD (MPL) :Firebird es una base de datos relacional que puede ser utilizada en Linux, Windows y varias plataformas UNIX, y ofrece un alto rendimiento y potente soporte de lenguajes para procedimientos almacenados y triggers. http://www.firebirdsql.org/
  • 19. MariaDB (GPL) MariaDB es una rama compatible hacia atrás de MySQL® Database Server. Incluye soporte para la mayoría de los motores de almacenamiento Open Source, y además para el propio motor de almacenamiento Maria. https://mariadb.com/
  • 20. Drizzle (BSD-GPL): Es un fork de MySQL que se centra en ser una base de datos eficiente y estable, sobre todo optimizada para aplicaciones de Internet y que siguen la filosofía Cloud Computing. https://launchpad.net/drizzle
  • 21. hyperSql (BSD): Es un motor de bases de datos relacionales SQL escrito en Java. HyperSQL ofrece un pequeño pero veloz motor de bases de datos que dispone de tablas in-memory y basadas en disco, y que soporta los modos embebido y servidor. Además, dispone de herramientas como una consola de comandos SQL y una interfaz gráfica para las consultas. http://hsqldb.org/
  • 22. MonetDB (BSD): MonetDB es un sistema de bases de datos para aplicaciones de alto rendimiento dirigidas a la minería de datos, OAP, GIS, búsquedas XML, y recolección de información a partir de ficheros de texto y multimedia. http://www.monetdb.org/Legal/MonetDBLicense
  • 24. BUSSINES INTELLIGENCE Conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
  • 26. PENTAHO • Es la unión de varios proyectos libres relacionados con BI • Reportes, dashboards, procesos ETL, cubos, data mining • Proporciona una plataforma Web • Basado en Java J2EE • Servidor Web Jboss o Tomcat • Sorporta MS-SQL, Oracle, PostqreSQL, MySQL • Windows XP, Windows 2003, Linux • Versión libre y versión Enterprise
  • 28. PENTAHO Es la unión de varios proyectos libres relacionados con BI Reportes, dashboards, procesos ETL, cubos, data mining Proporciona una plataforma Web Basado en Java J2EE Servidor Web Jboss o Tomcat Sorporta MS-SQL, Oracle, PostqreSQL, MySQL Windows XP, Windows 2003, Linux Versión libre y versión Enterprise
  • 29. PENTAHO Pentaho cuenta con: Jfree Report: Motor para reportes Mondrian: Motor para cubos Weka: Motor para minería de datos Plataforma Web para publicar y visualizar la información Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes funciones: Para generar reportes: Report Designer Para generar cubos: Cube designer, WorkBench. Para minería de datos: Weka Para generar procesos ETL: Kettle (Spoon/Pan)
  • 31. PENTAHO Pentaho cuenta con: Jfree Report: Motor para reportes Mondrian: Motor para cubos Weka: Motor para minería de datos Plataforma Web para publicar y visualizar la información Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes funciones: Para generar reportes: Report Designer Para generar cubos: Cube designer, WorkBench. Para minería de datos: Weka Para generar procesos ETL: Kettle (Spoon/Pan)