SlideShare una empresa de Scribd logo
1 de 4
Comparativa herramientas ETL
1. 1. Comparativa Herramientas ETL JORGE BUSTILLOS 2014
2. 2. Tabla contenidos  Introducción  ¿Para que se utilizan herramientas ETL? 
¿Por qué utilizar herramientas ETL?  Herramientas ETL  Pentaho Kettle 
Talend  Informatica PowerCenter  Inabplex Inaport  IBM Cognos Data
Manager  Oracle Warehouse Builder  Microsoft Integration Services 
Comparación  Tabla comparativa  Costo total de dominio  Riesgos 
Facilidad de Uso  Soporte  Implementación  Velocidad  Calidad de la data
 Monitoreo  Conectividad
3. 3. Introducción ¿Para que se utilizan herramientas ETL? ¿Por qué utilizar
herramientas ETL?
4. 4. ¿Para que se utilizan herramientas ETL?  Extraer data de varias fuentes de
información (Legacy DB).  Enviar data a:  Un sistema optimizado de manejo
de transacciones (nuevo gestor BD).  Un sistema optimizado de reporte.  Un
sistema de análisis.  Sincronizar información de distintas bases de datos. 
Depurado de información para remover errores  Cargar información a un Data
Warehouse
5. 5. ¿Por qué utilizar herramientas ETL?  Las herramientas ETL ahorran tiempo
y dinero cuando se tiene que desarrollar un Data Warehouse al reducir la
cantidad de Sistemas de Conversión personalizados a desarrollar para migrar o
concentrar al información.  Ahorra la dificultad para el DBA de conectar entre
distintas marcas y tecnologías de Bases de Datos entre si. “Permite a las
organizaciones mover datos desde múltiples fuentes, reformatearlos y
limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para
analizar, o en otro sistema operacional para apoyar un proceso de negocio.”
6. 6. Herramientas ETL • Pentaho Kettle • Talend • Informatica PowerCenter •
Inabplex Inaport • IBM Cognos Data Manager • Oracle Warehouse Builder •
Microsoft Integration Services
7. 7. Pentaho Kettle  Se utiliza a través de un acercamiento basado en meta datos,
y tiene posee una GUI para acelerar los procesos.  La compañía Pentaho
empezó operaciones en el año 2001.  Tiene una comunidad activa de usuarios
grande, alrededor de 13,500 usuarios.  Funciona utilizando Java, presentando
como ventaja el ser una solución multiplataforma.
8. 8. Talend  Talend es una herramienta OpenSource para la integración de
información.  Usa un enfoque hacia la generación de código para la
manipulación de información y posee una GUI implementada en Eclipse RC. 
Lanzó su primera versión en el año 2006.  Genera código en Java o Scripts en
Pearl que pueden ser implementados en servidores que lo soporten.  Cuenta
con una gran variedad de testimonios por parte de compañías importantes.
9. 9. Informatica PowerCenter  Informatica tiene una muy buena suite
empresarial de integración de datos.  Fue fundada en el año de 1993.  Líder
actual del sector Data Integration (Gartner Dataquest).  Tiene alrededor de
2600 clientes, entre los cuales figuran Bancos como Grupo BBVA,
organizaciones Gubernamentales, etc.  La compañía se enfoca meramente en
soluciones para la integración de datos.
10. 10. Inaplex Inaport  Fundado en Reino Unido desde el año 2004 para satisfacer
la migración de información hacia distintas soluciones CRM y software contable
como Sage y Goldmine.  Microsoft Dynamics CRM  Sage CRM Solutions
Family  SalesLogix  SageCRM  ACT! by Sage  GoldMine from
FrontRange  GoldMine Corporate and Premium
11. 11. IBM Cognos Data Manager  IBM® Cognos Data Manager proporciona
funciones dimensionales de extracción, transformación y carga (ETL) para
conseguir una inteligencia empresarial de alto rendimiento.  Se puede integrar
con la GUI de IBM Data Manager Designer para diseñar y crear prototipos  Se
pueden ejecutar compilaciones y secuencias de trabajos en sistemas remotos
desde un sistema de entorno de diseño de Data Manager.  Data Manager
Engine se tiene que instalar en un sistema UNIX o Linux.
12. 12. ORACLE DATABASE 11G ORACLE WAREHOUSE BUILDER
ENTERPRISE ETL OPTION  La opción empresarial ETL (Enterprise ETL
Option) para Warehouse Builder es una opción que puede ser adquirida con
Oracle Warehouse Builder como parte de la edición empresarial del motor de
base de datos.  Permite ejecutar cargas de datos usando métodos rápidos y
eficientes tales como el Oracle Data Pump y transportable tablespaces. 
Permite prever el efecto que puedan tener los cambios que se hagan en cualquier
lugar de los metadatos del sistema ETL  Es posible generar un modelo para
configurar los ambientes de desarrollo, pruebas y producción a niveles separados
13. 13. Microsoft SQL Server Integration Services  Puede extraer y transformar
datos de diversos orígenes como archivos de datos XML, archivos planos y
orígenes de datos relacionales y, después, cargar los datos en uno o varios
destinos.  Se pueden realizar tareas de migración fácilmente usando tareas
visuales.  Si se desea crear nueva funcionalidad, se pueden crear scripts en c# o
VB  Puede conseguir conectividad mediante CLI vía DLLs tipo ensamblador.
14. 14. Comparación • Tabla comparativa • Costo total de dominio • Riesgos •
Facilidad de Uso • Soporte • Implementación • Velocidad • Calidad de la data •
Monitoreo • Conectividad
15. 15. Tabla comparativa TALEND KETTLE POWERCENTER INAPORT
DATA MANAGER ORACLE WAREHOUSE SERVER INTEGRATION
COSTO RIESGO FACILIDAD SOPORTE IMPLEMENTACIÓN
VELOCIDAD CALIDAD DATA MONITOREO CONECTIVIDAD
16. 16. Costo total de dominio  Significa el costo promedio de cierto producto.
Desde costo de orden, licencia, servicio, soporte, entrenamiento, consultoría y
cualquier otro pago adicional, que se tenga que realizar para el uso total.  Las
herramientas OpenSource son naturalmente gratis de utilizar, pero el soporte,
entrenamiento y consultoría son los costos a considerar. OpenSource Propietario
Código Propio
17. 17. Riesgos  Siempre hay un riesgo cuando se habla de la manipulación de
información almacenada.  Sin embargo también se tienen que considerar los
siguientes riesgos:  Exceder presupuestos.  Comprar licencias que no reditúen
su valor.  Exceder tiempos.  Falta capacitación para uso de herramientas. 
No cumplir con requerimientos o expectativas.
18. 18. Facilidad de uso  Talend: Tiene una GUI pero se basa en un add-on para
Eclipse RC.  Kettle: Tiene la GUI más fácil de utilizar dentro de las
alternativas OpenSource.  PowerCenter: Tiene una GUI fácil de utilizar, pero
requeriere entrenamiento para aprovecharla.  Inaport: Se conecta directamente
al CRM de importación.  IBM: Se puede integrar con la GUI de IBM Data
Manager Designer pero este es un módulo aparte.  Oracle: Fácil cuando se trata
de información almacenada en bases de datos Oracle, debido a las herramientas
Data Pump y transportable tablespaces, pero no ofrece mucha compatibilidad a
otras BD.  Microsoft: Se pueden realizar tareas de migración fácilmente usando
tareas visuales.
19. 19. Soporte  Talend: Soporte de paga en estados unidos.  Kettle: Soporte en
EEUU, Reino Unido y consultorías asociadas.  PowerCenter: Soporte mundial
vía web y consultoría.  Inaport: Soporte mundial vía web y consultoría.  IBM:
Soporte mundial contratando en paquete.  Oracle: Vía soporte local Oracle
Latinoamérica.  Microsoft: Soporte vía plataforma TechNet.
20. 20. Implementación TALEND KETTLE POWERCENTER INAPORT DATA
MANAGER ORACLE WAREHOUSE SERVER INTEGRATION
PLATAFORMA Cualquier compatible con Java o Perl Cualquiera compatible
con Java. SERVIDOR WINDOWS, HP-UX, IBM- UX, REDHAT, SOLARIS
WINDOWS WINDOWS SERVER, SOLARIS, HP-UX, IBM- UX, REDHAT
ORACLE LINUX, REDHAT, SUSE ENTERPRISE WINDOWS SERVER
RAM 512 MB 512 MB 1GB 50MB 1GB 2GB 2GB CPU 1 GHZ 1 GHZ 4 +
CORES 2GHZ 1GHZ 2GHZ x 2 cores Varía 2.2GHZ 2 CORES EXTRA Se
puede conectar a Schedulers para automatizar cargas Puede utilizar Slave
Servers REQUIERE .NET Parte de Cognos Business Intelligence Más
información
21. 21. Velocidad  Talend: Más lento que Pentaho Kettle y requiere configuración
específica y manual, con conocimiento previo de la data a utilizar.  Kettle: Más
rápido que Talend, sin embargo al requerir de Java Database Connector
disminuye la velocidad de transacciones.  PowerCenter: Herramienta más
rápida gracias a PushDown, sin embargo los cambios son en momento y no
permite hacer Rollback a un estado anterior.  Inaport: Utiliza una conexión
directamente proporcional a la velocidad del CRM.  IBM: Muy rápido cuando
se trabaja con DB2 sin embargo la capa de compatibilidad disminuye la
velocidad de conexión con distintos manejadores de base de datos.  Oracle: La
velocidad es proporcional al servicio Oracle en el cual este trabajando. 
Microsoft: La velocidad es proporcional al servicio MSSQL en el cual este
trabajando.
22. 22. Calidad de Data  Talend: Ofrece herramientas para DQ dentro de la GUI,
sentencias SQL personalizables utilizando Java.  Kettle: Ofrece herramientas
para SQ dentro de su GUI, sentencias SQL personalizadas así como
herramientas JavaScript y REGEX para la depuración de información. 
PowerCenter: Ofrece DQ a través de otro producto llamado Informatica Data
Quality.  Inaport: Debido a la restricción del origen de información se pude
realizar tareas de DQ dentro de la misma.  IBM: Mediante Cognos Data
Manager Packages se pueden incorporar herramientas para DQ.  Oracle:
Permite DQ mediante el uso de Oracle Warehouse Builder Data Profiling
Features.  Microsoft: Requiere del software SQL Server Data Quality Services
para ofrecer herramientas DQ.
23. 23. Monitoreo  Talend: Tiene herramientas practicas de monitoreo y registro
histórico.  Kettle: Tiene herramientas practicas de monitoreo y registro
histórico.  PowerCenter: Tiene herramientas practicas y extensivas de
monitoreo y registro histórico.  Inaport: Tiene herramientas practicas de
monitoreo y registro histórico.  IBM: Maneja registro de históricos.  Oracle:
Tiene herramientas practicas y extensivas de monitoreo y registro histórico. 
Microsoft: Tiene herramientas practicas y extensivas de monitoreo y registro
histórico.
24. 24. Conectividad  Talend: Varias bases de datos, archivos planos, xml, Excel,
servicios web, necesita JDBC para conexión.  Kettle: Varias bases de datos,
archivos planos, xml, Excel, servicios web.  PowerCenter: Varias bases de
datos, archivos planos, xml, Excel, servicios web puede exportar como servicio
web.  Inaport: Cualquier conexión ODBC, MSSQL, OUTLOOK, ACT,
EXCEL.  IBM: Cualquier conexión ODBC, DB2, para importación a DB2,
cubos de información T1MAP.  Oracle: Solamente compatible con bases de
datos Oracle mismas que la instalada en el DataWarehouse  Microsoft: Bases
de datos SQL SERVER, ACCESS, ADO.NET
http://es.slideshare.net/JorgeCarlos3/comparativa-herramientas-etl

Más contenido relacionado

La actualidad más candente

Presentación Webinar Oracle APEX
Presentación Webinar Oracle APEXPresentación Webinar Oracle APEX
Presentación Webinar Oracle APEXjftorres92
 
Microsoft sql server 2008 - ETL
Microsoft sql server 2008 - ETL Microsoft sql server 2008 - ETL
Microsoft sql server 2008 - ETL Fanny Pita
 
Consiga Alta Disponibilidad con Oracle Database 11g R2
Consiga Alta Disponibilidad con Oracle Database 11g R2Consiga Alta Disponibilidad con Oracle Database 11g R2
Consiga Alta Disponibilidad con Oracle Database 11g R2Valentin Leonard Tabacaru
 
Primeros pasos con Talent Open Studio TOS : Importando datos
Primeros pasos con Talent Open Studio TOS : Importando datosPrimeros pasos con Talent Open Studio TOS : Importando datos
Primeros pasos con Talent Open Studio TOS : Importando datosHeliberto Arias
 
De Forms a Oracle Fusion Middleware
De Forms a Oracle Fusion MiddlewareDe Forms a Oracle Fusion Middleware
De Forms a Oracle Fusion MiddlewareJC_Diaz_Belmonte
 
Business Intelligence sin ETL: Querona
Business Intelligence sin ETL: QueronaBusiness Intelligence sin ETL: Querona
Business Intelligence sin ETL: QueronaSynergo!
 
Taller de integración de Datos con SQL Server 2014 Integration Services SSIS
Taller de integración de Datos con SQL Server 2014 Integration Services SSISTaller de integración de Datos con SQL Server 2014 Integration Services SSIS
Taller de integración de Datos con SQL Server 2014 Integration Services SSISLPI ONG
 
avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...
avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...
avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...avanttic Consultoría Tecnológica
 
Características SQL 2005 y SQL 2008
Características SQL 2005 y SQL 2008Características SQL 2005 y SQL 2008
Características SQL 2005 y SQL 2008Luis Vázquez
 
Evolución a oracle weblogic server 11g
Evolución a oracle weblogic server 11g Evolución a oracle weblogic server 11g
Evolución a oracle weblogic server 11g OracleIberia
 
Weblogic arquitectura-orientada-soa-427129-esa(1)
Weblogic arquitectura-orientada-soa-427129-esa(1)Weblogic arquitectura-orientada-soa-427129-esa(1)
Weblogic arquitectura-orientada-soa-427129-esa(1)Ellizz Lsc
 

La actualidad más candente (20)

Webinar: Oracle Data Integrator 12c (25-02-2015)
Webinar: Oracle Data Integrator 12c (25-02-2015)Webinar: Oracle Data Integrator 12c (25-02-2015)
Webinar: Oracle Data Integrator 12c (25-02-2015)
 
Webinar evolución a WebLogic
Webinar evolución a WebLogicWebinar evolución a WebLogic
Webinar evolución a WebLogic
 
Presentación Webinar Oracle APEX
Presentación Webinar Oracle APEXPresentación Webinar Oracle APEX
Presentación Webinar Oracle APEX
 
Microsoft sql server 2008 - ETL
Microsoft sql server 2008 - ETL Microsoft sql server 2008 - ETL
Microsoft sql server 2008 - ETL
 
Oracle APEX
Oracle APEXOracle APEX
Oracle APEX
 
Weblogic server 12c agosto 2012
Weblogic server 12c agosto 2012Weblogic server 12c agosto 2012
Weblogic server 12c agosto 2012
 
Oracle Enterprise Manager 12c & Management Packs
Oracle Enterprise Manager 12c & Management PacksOracle Enterprise Manager 12c & Management Packs
Oracle Enterprise Manager 12c & Management Packs
 
Consiga Alta Disponibilidad con Oracle Database 11g R2
Consiga Alta Disponibilidad con Oracle Database 11g R2Consiga Alta Disponibilidad con Oracle Database 11g R2
Consiga Alta Disponibilidad con Oracle Database 11g R2
 
Primeros pasos con Talent Open Studio TOS : Importando datos
Primeros pasos con Talent Open Studio TOS : Importando datosPrimeros pasos con Talent Open Studio TOS : Importando datos
Primeros pasos con Talent Open Studio TOS : Importando datos
 
De Forms a Oracle Fusion Middleware
De Forms a Oracle Fusion MiddlewareDe Forms a Oracle Fusion Middleware
De Forms a Oracle Fusion Middleware
 
Business Intelligence sin ETL: Querona
Business Intelligence sin ETL: QueronaBusiness Intelligence sin ETL: Querona
Business Intelligence sin ETL: Querona
 
Tarea2 pabloaguilar
Tarea2 pabloaguilarTarea2 pabloaguilar
Tarea2 pabloaguilar
 
Taller de integración de Datos con SQL Server 2014 Integration Services SSIS
Taller de integración de Datos con SQL Server 2014 Integration Services SSISTaller de integración de Datos con SQL Server 2014 Integration Services SSIS
Taller de integración de Datos con SQL Server 2014 Integration Services SSIS
 
Sistemas gestoresdebasededatos
Sistemas gestoresdebasededatosSistemas gestoresdebasededatos
Sistemas gestoresdebasededatos
 
avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...
avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...
avanttic Tech Dates - Facilidad contratación Oracle a través de acuerdos marc...
 
Características SQL 2005 y SQL 2008
Características SQL 2005 y SQL 2008Características SQL 2005 y SQL 2008
Características SQL 2005 y SQL 2008
 
Enterprise DB por Eptisa TI
Enterprise DB por Eptisa TI Enterprise DB por Eptisa TI
Enterprise DB por Eptisa TI
 
Tarea 1 bd
Tarea 1 bdTarea 1 bd
Tarea 1 bd
 
Evolución a oracle weblogic server 11g
Evolución a oracle weblogic server 11g Evolución a oracle weblogic server 11g
Evolución a oracle weblogic server 11g
 
Weblogic arquitectura-orientada-soa-427129-esa(1)
Weblogic arquitectura-orientada-soa-427129-esa(1)Weblogic arquitectura-orientada-soa-427129-esa(1)
Weblogic arquitectura-orientada-soa-427129-esa(1)
 

Destacado

Guía para elaboración de reglamento interno
Guía para elaboración de reglamento internoGuía para elaboración de reglamento interno
Guía para elaboración de reglamento internojuan barco
 
AbhinavAggarwal_06_30_2016
AbhinavAggarwal_06_30_2016AbhinavAggarwal_06_30_2016
AbhinavAggarwal_06_30_2016Abhinav Aggarwal
 
revanth_talend_resume
revanth_talend_resumerevanth_talend_resume
revanth_talend_resumerevanth raja
 
Jayaram_Parida- Big Data Architect and Technical Scrum Master
Jayaram_Parida- Big Data Architect and Technical Scrum MasterJayaram_Parida- Big Data Architect and Technical Scrum Master
Jayaram_Parida- Big Data Architect and Technical Scrum MasterJayaram Parida
 
Reglamento interno de trabajo
Reglamento interno de trabajoReglamento interno de trabajo
Reglamento interno de trabajoJuan Avila
 
Resume_David_Colbourn September 2016
Resume_David_Colbourn September 2016Resume_David_Colbourn September 2016
Resume_David_Colbourn September 2016David Colbourn
 

Destacado (9)

Abhinav aggarwal 03-29-16
Abhinav aggarwal 03-29-16Abhinav aggarwal 03-29-16
Abhinav aggarwal 03-29-16
 
Resume_gmail
Resume_gmailResume_gmail
Resume_gmail
 
Guía para elaboración de reglamento interno
Guía para elaboración de reglamento internoGuía para elaboración de reglamento interno
Guía para elaboración de reglamento interno
 
Resume
ResumeResume
Resume
 
AbhinavAggarwal_06_30_2016
AbhinavAggarwal_06_30_2016AbhinavAggarwal_06_30_2016
AbhinavAggarwal_06_30_2016
 
revanth_talend_resume
revanth_talend_resumerevanth_talend_resume
revanth_talend_resume
 
Jayaram_Parida- Big Data Architect and Technical Scrum Master
Jayaram_Parida- Big Data Architect and Technical Scrum MasterJayaram_Parida- Big Data Architect and Technical Scrum Master
Jayaram_Parida- Big Data Architect and Technical Scrum Master
 
Reglamento interno de trabajo
Reglamento interno de trabajoReglamento interno de trabajo
Reglamento interno de trabajo
 
Resume_David_Colbourn September 2016
Resume_David_Colbourn September 2016Resume_David_Colbourn September 2016
Resume_David_Colbourn September 2016
 

Similar a Comparativa herramientas ETL para extracción, transformación y carga de datos

Similar a Comparativa herramientas ETL para extracción, transformación y carga de datos (20)

Oracle, Informix
Oracle, InformixOracle, Informix
Oracle, Informix
 
Presentación sgbd
Presentación sgbdPresentación sgbd
Presentación sgbd
 
Tarea 1 bd
Tarea 1 bdTarea 1 bd
Tarea 1 bd
 
Taller 2
Taller 2Taller 2
Taller 2
 
Sistema gestor de base de datos jaime valdez
Sistema gestor de base de datos jaime valdezSistema gestor de base de datos jaime valdez
Sistema gestor de base de datos jaime valdez
 
Exposicion oracle
Exposicion oracleExposicion oracle
Exposicion oracle
 
Base de Dato Oracle
Base de Dato OracleBase de Dato Oracle
Base de Dato Oracle
 
Sqlserver
SqlserverSqlserver
Sqlserver
 
Eduardo hiram godínez aguirre inv dbms
Eduardo hiram godínez aguirre   inv dbmsEduardo hiram godínez aguirre   inv dbms
Eduardo hiram godínez aguirre inv dbms
 
Gestores de base de datos
Gestores de base de datosGestores de base de datos
Gestores de base de datos
 
Sistema.inventario@hotmail.com
Sistema.inventario@hotmail.comSistema.inventario@hotmail.com
Sistema.inventario@hotmail.com
 
Oracle vs. sql server terminado
Oracle vs. sql server   terminadoOracle vs. sql server   terminado
Oracle vs. sql server terminado
 
Oracle vs. sql server terminado
Oracle vs. sql server   terminadoOracle vs. sql server   terminado
Oracle vs. sql server terminado
 
Sql server 2008
Sql server 2008Sql server 2008
Sql server 2008
 
Oracle
OracleOracle
Oracle
 
Sgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualotoSgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualoto
 
Oracle
OracleOracle
Oracle
 
ORACLE DATABASE
ORACLE DATABASE ORACLE DATABASE
ORACLE DATABASE
 
TEMAS RELACIONADOS WEB2
TEMAS RELACIONADOS WEB2TEMAS RELACIONADOS WEB2
TEMAS RELACIONADOS WEB2
 
Data warehouseing e inteligencia de negocios
Data warehouseing e inteligencia de negociosData warehouseing e inteligencia de negocios
Data warehouseing e inteligencia de negocios
 

Último

CENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdf
CENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdfCENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdf
CENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdfpaola110264
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciazacariasd49
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPJosLuisFrancoCaldern
 
Tiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IITiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IILauraFernandaValdovi
 
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUSesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUMarcosAlvarezSalinas
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaSHERELYNSAMANTHAPALO1
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCANDECE
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxEduardoSnchezHernnde5
 
Conservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaConservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaANDECE
 
Fisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfFisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfJessLeonelVargasJimn
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfAdelaHerrera9
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdfEdwinAlexanderSnchez2
 
PPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdf
PPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdfPPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdf
PPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdfZamiertCruzSuyo
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilDissneredwinPaivahua
 
Fe_C_Tratamientos termicos_uap _3_.ppt
Fe_C_Tratamientos termicos_uap   _3_.pptFe_C_Tratamientos termicos_uap   _3_.ppt
Fe_C_Tratamientos termicos_uap _3_.pptVitobailon
 
Exposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporaciónExposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporaciónjas021085
 
Fisiología del Potasio en Plantas p .pdf
Fisiología del Potasio en Plantas p .pdfFisiología del Potasio en Plantas p .pdf
Fisiología del Potasio en Plantas p .pdfJessLeonelVargasJimn
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxLuisvila35
 
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfPresentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfMirthaFernandez12
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfErikNivor
 

Último (20)

CENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdf
CENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdfCENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdf
CENTROIDES Y MOMENTOS DE INERCIA DE AREAS PLANAS.pdf
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potencia
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
 
Tiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IITiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo II
 
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUSesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresa
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRC
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptx
 
Conservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaConservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de Almería
 
Fisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfFisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdf
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf
 
PPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdf
PPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdfPPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdf
PPT ASISTENCIA TECNICA PRESENTACIÓN FT- ET.pdf
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civil
 
Fe_C_Tratamientos termicos_uap _3_.ppt
Fe_C_Tratamientos termicos_uap   _3_.pptFe_C_Tratamientos termicos_uap   _3_.ppt
Fe_C_Tratamientos termicos_uap _3_.ppt
 
Exposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporaciónExposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporación
 
Fisiología del Potasio en Plantas p .pdf
Fisiología del Potasio en Plantas p .pdfFisiología del Potasio en Plantas p .pdf
Fisiología del Potasio en Plantas p .pdf
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
 
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfPresentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
 

Comparativa herramientas ETL para extracción, transformación y carga de datos

  • 1. Comparativa herramientas ETL 1. 1. Comparativa Herramientas ETL JORGE BUSTILLOS 2014 2. 2. Tabla contenidos  Introducción  ¿Para que se utilizan herramientas ETL?  ¿Por qué utilizar herramientas ETL?  Herramientas ETL  Pentaho Kettle  Talend  Informatica PowerCenter  Inabplex Inaport  IBM Cognos Data Manager  Oracle Warehouse Builder  Microsoft Integration Services  Comparación  Tabla comparativa  Costo total de dominio  Riesgos  Facilidad de Uso  Soporte  Implementación  Velocidad  Calidad de la data  Monitoreo  Conectividad 3. 3. Introducción ¿Para que se utilizan herramientas ETL? ¿Por qué utilizar herramientas ETL? 4. 4. ¿Para que se utilizan herramientas ETL?  Extraer data de varias fuentes de información (Legacy DB).  Enviar data a:  Un sistema optimizado de manejo de transacciones (nuevo gestor BD).  Un sistema optimizado de reporte.  Un sistema de análisis.  Sincronizar información de distintas bases de datos.  Depurado de información para remover errores  Cargar información a un Data Warehouse 5. 5. ¿Por qué utilizar herramientas ETL?  Las herramientas ETL ahorran tiempo y dinero cuando se tiene que desarrollar un Data Warehouse al reducir la cantidad de Sistemas de Conversión personalizados a desarrollar para migrar o concentrar al información.  Ahorra la dificultad para el DBA de conectar entre distintas marcas y tecnologías de Bases de Datos entre si. “Permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.” 6. 6. Herramientas ETL • Pentaho Kettle • Talend • Informatica PowerCenter • Inabplex Inaport • IBM Cognos Data Manager • Oracle Warehouse Builder • Microsoft Integration Services 7. 7. Pentaho Kettle  Se utiliza a través de un acercamiento basado en meta datos, y tiene posee una GUI para acelerar los procesos.  La compañía Pentaho empezó operaciones en el año 2001.  Tiene una comunidad activa de usuarios grande, alrededor de 13,500 usuarios.  Funciona utilizando Java, presentando como ventaja el ser una solución multiplataforma. 8. 8. Talend  Talend es una herramienta OpenSource para la integración de información.  Usa un enfoque hacia la generación de código para la manipulación de información y posee una GUI implementada en Eclipse RC.  Lanzó su primera versión en el año 2006.  Genera código en Java o Scripts en Pearl que pueden ser implementados en servidores que lo soporten.  Cuenta con una gran variedad de testimonios por parte de compañías importantes. 9. 9. Informatica PowerCenter  Informatica tiene una muy buena suite empresarial de integración de datos.  Fue fundada en el año de 1993.  Líder actual del sector Data Integration (Gartner Dataquest).  Tiene alrededor de 2600 clientes, entre los cuales figuran Bancos como Grupo BBVA, organizaciones Gubernamentales, etc.  La compañía se enfoca meramente en soluciones para la integración de datos. 10. 10. Inaplex Inaport  Fundado en Reino Unido desde el año 2004 para satisfacer la migración de información hacia distintas soluciones CRM y software contable
  • 2. como Sage y Goldmine.  Microsoft Dynamics CRM  Sage CRM Solutions Family  SalesLogix  SageCRM  ACT! by Sage  GoldMine from FrontRange  GoldMine Corporate and Premium 11. 11. IBM Cognos Data Manager  IBM® Cognos Data Manager proporciona funciones dimensionales de extracción, transformación y carga (ETL) para conseguir una inteligencia empresarial de alto rendimiento.  Se puede integrar con la GUI de IBM Data Manager Designer para diseñar y crear prototipos  Se pueden ejecutar compilaciones y secuencias de trabajos en sistemas remotos desde un sistema de entorno de diseño de Data Manager.  Data Manager Engine se tiene que instalar en un sistema UNIX o Linux. 12. 12. ORACLE DATABASE 11G ORACLE WAREHOUSE BUILDER ENTERPRISE ETL OPTION  La opción empresarial ETL (Enterprise ETL Option) para Warehouse Builder es una opción que puede ser adquirida con Oracle Warehouse Builder como parte de la edición empresarial del motor de base de datos.  Permite ejecutar cargas de datos usando métodos rápidos y eficientes tales como el Oracle Data Pump y transportable tablespaces.  Permite prever el efecto que puedan tener los cambios que se hagan en cualquier lugar de los metadatos del sistema ETL  Es posible generar un modelo para configurar los ambientes de desarrollo, pruebas y producción a niveles separados 13. 13. Microsoft SQL Server Integration Services  Puede extraer y transformar datos de diversos orígenes como archivos de datos XML, archivos planos y orígenes de datos relacionales y, después, cargar los datos en uno o varios destinos.  Se pueden realizar tareas de migración fácilmente usando tareas visuales.  Si se desea crear nueva funcionalidad, se pueden crear scripts en c# o VB  Puede conseguir conectividad mediante CLI vía DLLs tipo ensamblador. 14. 14. Comparación • Tabla comparativa • Costo total de dominio • Riesgos • Facilidad de Uso • Soporte • Implementación • Velocidad • Calidad de la data • Monitoreo • Conectividad 15. 15. Tabla comparativa TALEND KETTLE POWERCENTER INAPORT DATA MANAGER ORACLE WAREHOUSE SERVER INTEGRATION COSTO RIESGO FACILIDAD SOPORTE IMPLEMENTACIÓN VELOCIDAD CALIDAD DATA MONITOREO CONECTIVIDAD 16. 16. Costo total de dominio  Significa el costo promedio de cierto producto. Desde costo de orden, licencia, servicio, soporte, entrenamiento, consultoría y cualquier otro pago adicional, que se tenga que realizar para el uso total.  Las herramientas OpenSource son naturalmente gratis de utilizar, pero el soporte, entrenamiento y consultoría son los costos a considerar. OpenSource Propietario Código Propio 17. 17. Riesgos  Siempre hay un riesgo cuando se habla de la manipulación de información almacenada.  Sin embargo también se tienen que considerar los siguientes riesgos:  Exceder presupuestos.  Comprar licencias que no reditúen su valor.  Exceder tiempos.  Falta capacitación para uso de herramientas.  No cumplir con requerimientos o expectativas. 18. 18. Facilidad de uso  Talend: Tiene una GUI pero se basa en un add-on para Eclipse RC.  Kettle: Tiene la GUI más fácil de utilizar dentro de las alternativas OpenSource.  PowerCenter: Tiene una GUI fácil de utilizar, pero requeriere entrenamiento para aprovecharla.  Inaport: Se conecta directamente al CRM de importación.  IBM: Se puede integrar con la GUI de IBM Data
  • 3. Manager Designer pero este es un módulo aparte.  Oracle: Fácil cuando se trata de información almacenada en bases de datos Oracle, debido a las herramientas Data Pump y transportable tablespaces, pero no ofrece mucha compatibilidad a otras BD.  Microsoft: Se pueden realizar tareas de migración fácilmente usando tareas visuales. 19. 19. Soporte  Talend: Soporte de paga en estados unidos.  Kettle: Soporte en EEUU, Reino Unido y consultorías asociadas.  PowerCenter: Soporte mundial vía web y consultoría.  Inaport: Soporte mundial vía web y consultoría.  IBM: Soporte mundial contratando en paquete.  Oracle: Vía soporte local Oracle Latinoamérica.  Microsoft: Soporte vía plataforma TechNet. 20. 20. Implementación TALEND KETTLE POWERCENTER INAPORT DATA MANAGER ORACLE WAREHOUSE SERVER INTEGRATION PLATAFORMA Cualquier compatible con Java o Perl Cualquiera compatible con Java. SERVIDOR WINDOWS, HP-UX, IBM- UX, REDHAT, SOLARIS WINDOWS WINDOWS SERVER, SOLARIS, HP-UX, IBM- UX, REDHAT ORACLE LINUX, REDHAT, SUSE ENTERPRISE WINDOWS SERVER RAM 512 MB 512 MB 1GB 50MB 1GB 2GB 2GB CPU 1 GHZ 1 GHZ 4 + CORES 2GHZ 1GHZ 2GHZ x 2 cores Varía 2.2GHZ 2 CORES EXTRA Se puede conectar a Schedulers para automatizar cargas Puede utilizar Slave Servers REQUIERE .NET Parte de Cognos Business Intelligence Más información 21. 21. Velocidad  Talend: Más lento que Pentaho Kettle y requiere configuración específica y manual, con conocimiento previo de la data a utilizar.  Kettle: Más rápido que Talend, sin embargo al requerir de Java Database Connector disminuye la velocidad de transacciones.  PowerCenter: Herramienta más rápida gracias a PushDown, sin embargo los cambios son en momento y no permite hacer Rollback a un estado anterior.  Inaport: Utiliza una conexión directamente proporcional a la velocidad del CRM.  IBM: Muy rápido cuando se trabaja con DB2 sin embargo la capa de compatibilidad disminuye la velocidad de conexión con distintos manejadores de base de datos.  Oracle: La velocidad es proporcional al servicio Oracle en el cual este trabajando.  Microsoft: La velocidad es proporcional al servicio MSSQL en el cual este trabajando. 22. 22. Calidad de Data  Talend: Ofrece herramientas para DQ dentro de la GUI, sentencias SQL personalizables utilizando Java.  Kettle: Ofrece herramientas para SQ dentro de su GUI, sentencias SQL personalizadas así como herramientas JavaScript y REGEX para la depuración de información.  PowerCenter: Ofrece DQ a través de otro producto llamado Informatica Data Quality.  Inaport: Debido a la restricción del origen de información se pude realizar tareas de DQ dentro de la misma.  IBM: Mediante Cognos Data Manager Packages se pueden incorporar herramientas para DQ.  Oracle: Permite DQ mediante el uso de Oracle Warehouse Builder Data Profiling Features.  Microsoft: Requiere del software SQL Server Data Quality Services para ofrecer herramientas DQ. 23. 23. Monitoreo  Talend: Tiene herramientas practicas de monitoreo y registro histórico.  Kettle: Tiene herramientas practicas de monitoreo y registro histórico.  PowerCenter: Tiene herramientas practicas y extensivas de monitoreo y registro histórico.  Inaport: Tiene herramientas practicas de monitoreo y registro histórico.  IBM: Maneja registro de históricos.  Oracle:
  • 4. Tiene herramientas practicas y extensivas de monitoreo y registro histórico.  Microsoft: Tiene herramientas practicas y extensivas de monitoreo y registro histórico. 24. 24. Conectividad  Talend: Varias bases de datos, archivos planos, xml, Excel, servicios web, necesita JDBC para conexión.  Kettle: Varias bases de datos, archivos planos, xml, Excel, servicios web.  PowerCenter: Varias bases de datos, archivos planos, xml, Excel, servicios web puede exportar como servicio web.  Inaport: Cualquier conexión ODBC, MSSQL, OUTLOOK, ACT, EXCEL.  IBM: Cualquier conexión ODBC, DB2, para importación a DB2, cubos de información T1MAP.  Oracle: Solamente compatible con bases de datos Oracle mismas que la instalada en el DataWarehouse  Microsoft: Bases de datos SQL SERVER, ACCESS, ADO.NET http://es.slideshare.net/JorgeCarlos3/comparativa-herramientas-etl