SlideShare una empresa de Scribd logo
1 de 24
INGENIERÍA DE SISTEMAS Y TELEMÁTICA
Tema : ETL - EXTRAER, TRANSFORMAR Y CARGAR
Curso : Base de Datos II
Docente :Ing. Marco Aurelio Porro Chulli
Integrantes :
 Ana Leydi Linares Serrano.
 Patricia Reyna Reynaga
 Delsi Yakelin Huamán Villanueva
INTRODUCCIÓN
* ETL, esencialmente, es el proceso que permite a las empresas manejar y
movilizar datos desde distintos tipos de fuentes, para transformarlos,
limpiarlos y cargarlos en otra base de datos.
El principal propósito de ETL es transportar la información de la empresa
desde las aplicaciones de producción a los sistemas de Inteligencia de Negocio
(BI), este proceso consta de tres etapas:
*Extracción de datos
*Transformación de datos
*Carga de datos
FASES DE ETL
*FASE DE EXTRACCIÓN
La primera parte del proceso ETL consiste en extraer los datos desde el
sistema de origen.
Esta fase consta de tres pasos:
*
* se evalúan las necesidades
concretas de la organización.
*
* Antes de extraer los datos, se
identifica de qué tipo son y en qué
formato se encuentran los sistemas
fuente.
*
* En función de las necesidades
detectadas, se procede a la extracción
en sí de dichos datos.
*exigir siempre que esta tarea cause un
impacto mínimo en el sistema de
origen
*MODOS DE EXTRACCIÓN
Básicamente, existen tres modos distintos de extracción:
Full Extract o extracción
total
• Esta modalidad
consiste en extraer la
totalidad de datos.
Incremental Extract o
extracción incremental
• Se va procesando por
lotes únicamente lo
que fue modificado o
agregado.
Update Notification o
notificación de
actualizaciones
• En este caso, solo se
van extrayendo los
datos a medida que se
produce una
actualización (por
ejemplo, un inserto).
*
*Cualquier organización, empresa o
compañía debe exigir que el proceso de
extracción de datos desde su fuente o
fuentes de origen cause el menor
impacto posible. Es decir, que no
suponga ningún problema a los
empleados que, diariamente, trabajan
con los datos y registros.
*LIMPIEZA
*Asegura la calidad de los datos que vamos a procesar.
*Evita la información no veraz o errónea.
*Ahorra costes de espacio en disco al eliminarse la información duplicada.
*Agiliza las consultas por la ausencia de datos repetidos o inservibles.
*Ayuda a tomar decisiones estratégicas correctas.
La limpieza de datos se divide en distintas etapas, que vamos a describir a continuación:
Depurar los valores
Nombre
Ana Leydi Linares Serrano
Nombres Apellido Paterno Apellido Materno
Ana Leydi Linares Serrano
Por ejemplo: comprueba una dirección y el código postal correspondiente.
Corregir
formatos definidos. Por ejemplo: trato de Sr., Sra.
Estandarizar
eliminar duplicados. Por ejemplo: identificando nombres y direcciones similares.
Relacionar
analiza e identifica relaciones entre registros relacionados y los junta en una sola
representación.
Consolidar
FASE DE TRANSFORMACIÓN
Aplica una serie de reglas de negocio o funciones sobre los datos extraídos para
convertirlos en datos que serán cargados.
Algunas transformaciones:
 Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las columnas
con valores nulos no se carguen).
 Traducir códigos (Por ejemplo, si la fuente de origen almacena una “H” para
hombres y una “M” para mujeres, dar las instrucciones necesarias para que en
destino se guarde un “ 1” para hombres y un” 2” para mujeres).
 Calcular totales de múltiples filas de datos (por ejemplo, ventas totales de cada
región).
 Dividir una columna en varias (por ejemplo, la columna “Nombre: García, Miguel”;
pasar a dos columnas “Nombre: Miguel” y “Apellido: García”)
Esta función corresponde al desarrollador o analista
del proceso ETL en cuestión. La definición de las
transformaciones a realizar se realiza en función de un
análisis previo y de la fase de limpieza.
¿Quién se encarga de realizar estas transformaciones?
FASE DE CARGA
En esta fase, los datos procedentes de la fase anterior(fase de
transformación) son dragados en el sistema e destino. Dependiendo de los
requerimientos de la organización, pueden ser de dos tipos:
 Acumulación simple
 Rolling
Acumulación simple
Consiste en realizar un resumen de todas las
transacciones comprendidas en el período de tiempo
seleccionado y transportar el resultado como una única
transacción hacia el data warehouse, almacenando un
valor calculado que consistirá típicamente en un
sumatorio o un promedio de la magnitud considerada.
Rolling
Este proceso sería el más recomendable en los casos
en que se busque mantener varios niveles de
granularidad. Para ello se almacena información
resumida a distintos niveles, correspondientes a
distintas agrupaciones de la unidad de tiempo o
diferentes niveles jerárquicos.
 Capacidad de entrega de datos.
 Capacidad de transformación de datos.
 Capacidad de Metadatos y Modelado de Datos.
 Adaptación a las diferentes plataformas hardware y sistema
operativos existentes.
 Emplearlas para la integración con sistemas heredados.
CARACTERISTICAS Y VENTAJAS
EJEMPLO
*
Gracias a los procesos ETL es posible que cualquier organización:
• Mueva datos desde una o múltiples fuentes.
• Reformatee esos datos y los limpie, cuando sea necesario.
• Los cargue en otro lugar como una base de datos, un data mart o un data warehouse.
• Una vez alojados en destino, esos datos se analicen.
• O, cuando ya están cargados en su ubicación definitiva, se empleen en otro sistema
operacional, para apoyar un proceso de negocio.
Las herramientas ETL pueden ser útiles para multitud de propósitos, como por ejemplo:
*Tareas de Bases de datos: que también se utilizan para consolidar, migrar y sincronizar
bases de datos operativas.
*Migración de datos entre diferentes aplicaciones por cambios de versión o cambio de
aplicativos.
*Sincronización entre diferentes sistemas operacionales (por ejemplo, entre nuestro
entorno ERP y la web de ventas).
*Consolidación de datos: sistemas con grandes volúmenes de datos que son consolidados
en sistemas paralelos, ya sea para mantener históricos o para llevar a cabo procesos de
borrado en los sistemas originales.
*Interfaces de datos con sistemas externos: como el envío de información a clientes o
proveedores. También servirían para la recepción, proceso e integración de la
información recibida.
*Interfaces con sistemas Frontoffice: serían interfaces de subida/bajada con sistemas de
venta.
*Otros cometidos: como la actualización de usuarios a sistemas paralelos o la
preparación de procesos masivos (tipo mailings o newsletter).
*
Los procesos ETL pueden incluir:
*Sistemas legacy. Es decir, legados, heredados o antiguos.
*Sistemas nuevos. Basados en Windows, Linux y también en las redes sociales
modernas: Facebook, Twitter, Linkedin, etc.
*
A cualquier empresa u organización le beneficia poner en marcha un proceso ETL
para mover y transformar los datos que maneja por los siguientes motivos:
*Poder crear una Master Data Management
*Posibilita a los directivos tomar decisiones estratégicas
*Sirve para integrar sistemas.
*Poder tener una visión global de todos los datos consolidados en una data
warehouse.
*
La implantación de un sistema ETL bien definido supone todo un reto puesto que,
para que sea realmente efectivo, debe permitir integrar los sistemas legacy
(algunos ya muy obsoletos) con los más modernos. Además, el acceso a todos
estos sistemas se debe producir no solo en modo de lectura, sino también como
escritura.
*
Como conclusión podemos decir que los ETL son proceso que organizan los flujos
datos entre distintos sistemas en una organización y aporta los métodos y
herramientas necesarias para movilizar los datos desde múltiples fuentes a un
almacén de datos, para transformarlos, limpiarlos y cargarlos en otra base de
datos.
ETL es parte de la Inteligencia de Negocios, también llamado “Gestión de los
Datos” (Data Management).
ETL

Más contenido relacionado

La actualidad más candente

Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datosJorge Garcia
 
diagrama de casos de uso del negocio y del sistema
diagrama de casos de uso del negocio y del sistemadiagrama de casos de uso del negocio y del sistema
diagrama de casos de uso del negocio y del sistemaUniversidad Tecnológica
 
Unidad 3 Modelo De Negocio
Unidad 3 Modelo De NegocioUnidad 3 Modelo De Negocio
Unidad 3 Modelo De NegocioSergio Sanchez
 
2. Casos de uso y diagramas de casos de uso
2. Casos de uso y diagramas de casos de uso2. Casos de uso y diagramas de casos de uso
2. Casos de uso y diagramas de casos de usoSaul Mamani
 
Base de datos para la farmacia "José"
Base de datos para la farmacia "José"Base de datos para la farmacia "José"
Base de datos para la farmacia "José"BrandonDanielUgazSal1
 
Clasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datosClasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datosManuel Gutiérrez
 
Cuadro comparativo de enfoque estructurado y enfoque orientado
Cuadro comparativo de enfoque estructurado y enfoque orientadoCuadro comparativo de enfoque estructurado y enfoque orientado
Cuadro comparativo de enfoque estructurado y enfoque orientadoFreddySantiago32
 
PRACTICA 2: SISTEMA DE INFORMACION
 PRACTICA 2: SISTEMA DE INFORMACION PRACTICA 2: SISTEMA DE INFORMACION
PRACTICA 2: SISTEMA DE INFORMACIONmilagros
 
5. Ejercicios normalización
5. Ejercicios normalización5. Ejercicios normalización
5. Ejercicios normalizaciónMarcelo Herrera
 
Diseño de entraday_salida
Diseño de entraday_salidaDiseño de entraday_salida
Diseño de entraday_salidaJorge Garcia
 
Enfoque estructurado y Enfoque OO - Ingenieria de software
Enfoque estructurado y Enfoque OO  - Ingenieria de softwareEnfoque estructurado y Enfoque OO  - Ingenieria de software
Enfoque estructurado y Enfoque OO - Ingenieria de softwareKola Real
 
Diagramas de Flujos de Datos
Diagramas de Flujos de DatosDiagramas de Flujos de Datos
Diagramas de Flujos de DatosRenny Batista
 
Bitácora de base de datos
Bitácora de base de datosBitácora de base de datos
Bitácora de base de datosLalo Osorio
 

La actualidad más candente (20)

Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datos
 
diagrama de casos de uso del negocio y del sistema
diagrama de casos de uso del negocio y del sistemadiagrama de casos de uso del negocio y del sistema
diagrama de casos de uso del negocio y del sistema
 
Unidad 3 Modelo De Negocio
Unidad 3 Modelo De NegocioUnidad 3 Modelo De Negocio
Unidad 3 Modelo De Negocio
 
Sistemas de almacenamiento RAID
Sistemas de almacenamiento RAIDSistemas de almacenamiento RAID
Sistemas de almacenamiento RAID
 
2. Casos de uso y diagramas de casos de uso
2. Casos de uso y diagramas de casos de uso2. Casos de uso y diagramas de casos de uso
2. Casos de uso y diagramas de casos de uso
 
Base de datos para la farmacia "José"
Base de datos para la farmacia "José"Base de datos para la farmacia "José"
Base de datos para la farmacia "José"
 
Metodologia de wilson
Metodologia de wilsonMetodologia de wilson
Metodologia de wilson
 
Clasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datosClasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datos
 
Cuadro comparativo de enfoque estructurado y enfoque orientado
Cuadro comparativo de enfoque estructurado y enfoque orientadoCuadro comparativo de enfoque estructurado y enfoque orientado
Cuadro comparativo de enfoque estructurado y enfoque orientado
 
Modelo relacional
Modelo relacionalModelo relacional
Modelo relacional
 
PRACTICA 2: SISTEMA DE INFORMACION
 PRACTICA 2: SISTEMA DE INFORMACION PRACTICA 2: SISTEMA DE INFORMACION
PRACTICA 2: SISTEMA DE INFORMACION
 
Diagramas uml
Diagramas umlDiagramas uml
Diagramas uml
 
5. Ejercicios normalización
5. Ejercicios normalización5. Ejercicios normalización
5. Ejercicios normalización
 
Diseño de entraday_salida
Diseño de entraday_salidaDiseño de entraday_salida
Diseño de entraday_salida
 
Diagrama de casos de usos
Diagrama de casos de usosDiagrama de casos de usos
Diagrama de casos de usos
 
Enfoque estructurado y Enfoque OO - Ingenieria de software
Enfoque estructurado y Enfoque OO  - Ingenieria de softwareEnfoque estructurado y Enfoque OO  - Ingenieria de software
Enfoque estructurado y Enfoque OO - Ingenieria de software
 
Fundamentos de las bases de datos
Fundamentos de las bases de datosFundamentos de las bases de datos
Fundamentos de las bases de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Diagramas de Flujos de Datos
Diagramas de Flujos de DatosDiagramas de Flujos de Datos
Diagramas de Flujos de Datos
 
Bitácora de base de datos
Bitácora de base de datosBitácora de base de datos
Bitácora de base de datos
 

Similar a ETL

Etl extracción transformación y carga de datos
Etl extracción transformación y carga de datosEtl extracción transformación y carga de datos
Etl extracción transformación y carga de datosLeonel Ibarra
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informeCarlosTenelema1
 
Data warehouse
Data warehouseData warehouse
Data warehouseMarian C.
 
Business inteligence
Business inteligenceBusiness inteligence
Business inteligenceKeopx
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfexpertoleonelmartine
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y AnalíticaWebinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y AnalíticaIT-NOVA
 
Trabajo de sistemas tarea 4[1]
Trabajo de sistemas tarea 4[1]Trabajo de sistemas tarea 4[1]
Trabajo de sistemas tarea 4[1]karla
 

Similar a ETL (20)

Proceso ETL 1.pptx
Proceso ETL 1.pptxProceso ETL 1.pptx
Proceso ETL 1.pptx
 
Etl extracción transformación y carga de datos
Etl extracción transformación y carga de datosEtl extracción transformación y carga de datos
Etl extracción transformación y carga de datos
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Business inteligence
Business inteligenceBusiness inteligence
Business inteligence
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
 
Negocios inteligentes
Negocios inteligentesNegocios inteligentes
Negocios inteligentes
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
R105044
R105044R105044
R105044
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
 
Dfd
DfdDfd
Dfd
 
Datewarehouse.ppt
Datewarehouse.pptDatewarehouse.ppt
Datewarehouse.ppt
 
Base de datos
Base de datosBase de datos
Base de datos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
tarea 4 ayudantia
tarea 4 ayudantiatarea 4 ayudantia
tarea 4 ayudantia
 
tarea 3 ayudantia
tarea 3 ayudantiatarea 3 ayudantia
tarea 3 ayudantia
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y AnalíticaWebinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
 
Trabajo de sistemas tarea 4[1]
Trabajo de sistemas tarea 4[1]Trabajo de sistemas tarea 4[1]
Trabajo de sistemas tarea 4[1]
 

Más de ana leydi linares serrano (17)

Los valores
Los valoresLos valores
Los valores
 
Prevención del Abuso sexual
Prevención del Abuso sexualPrevención del Abuso sexual
Prevención del Abuso sexual
 
Administracion de la seguridad de sql server
Administracion de la seguridad de sql serverAdministracion de la seguridad de sql server
Administracion de la seguridad de sql server
 
Vistas
VistasVistas
Vistas
 
LENGUAJE TRANSACT SQL
LENGUAJE TRANSACT SQLLENGUAJE TRANSACT SQL
LENGUAJE TRANSACT SQL
 
Reportes en Java
Reportes en JavaReportes en Java
Reportes en Java
 
Sqlcommand
SqlcommandSqlcommand
Sqlcommand
 
System.data.sqlclient
System.data.sqlclientSystem.data.sqlclient
System.data.sqlclient
 
Gestor de base de datos
Gestor de base de datosGestor de base de datos
Gestor de base de datos
 
Prepared statement
Prepared statementPrepared statement
Prepared statement
 
Jtable
JtableJtable
Jtable
 
ResultSet
ResultSetResultSet
ResultSet
 
Statement
StatementStatement
Statement
 
Connection
ConnectionConnection
Connection
 
Java con base de datos
Java con base de datosJava con base de datos
Java con base de datos
 
Jdbc
JdbcJdbc
Jdbc
 
Java
JavaJava
Java
 

Último

2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdfAnthonyTiclia
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaXimenaFallaLecca1
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTFundación YOD YOD
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdfFernandaGarca788912
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMarceloQuisbert6
 
Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxEverardoRuiz8
 
Seleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSeleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSaulSantiago25
 
MANIOBRA Y CONTROL INNOVATIVO LOGO PLC SIEMENS
MANIOBRA Y CONTROL INNOVATIVO LOGO PLC  SIEMENSMANIOBRA Y CONTROL INNOVATIVO LOGO PLC  SIEMENS
MANIOBRA Y CONTROL INNOVATIVO LOGO PLC SIEMENSLuisLobatoingaruca
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7luisanthonycarrascos
 
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfPresentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfMIGUELANGELCONDORIMA4
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaSHERELYNSAMANTHAPALO1
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfrolandolazartep
 
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfPresentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfMirthaFernandez12
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfKEVINYOICIAQUINOSORI
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALKATHIAMILAGRITOSSANC
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxClaudiaPerez86192
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAJAMESDIAZ55
 
Tiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IITiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IILauraFernandaValdovi
 
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxPPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxSergioGJimenezMorean
 

Último (20)

2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NIST
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdf
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principios
 
Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptx
 
Seleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSeleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusibles
 
MANIOBRA Y CONTROL INNOVATIVO LOGO PLC SIEMENS
MANIOBRA Y CONTROL INNOVATIVO LOGO PLC  SIEMENSMANIOBRA Y CONTROL INNOVATIVO LOGO PLC  SIEMENS
MANIOBRA Y CONTROL INNOVATIVO LOGO PLC SIEMENS
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7
 
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdfPresentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
Presentación N° 1 INTRODUCCIÓN Y CONCEPTOS DE GESTIÓN AMBIENTAL.pdf
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresa
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdf
 
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfPresentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdf
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptx
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
 
Tiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo IITiempos Predeterminados MOST para Estudio del Trabajo II
Tiempos Predeterminados MOST para Estudio del Trabajo II
 
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdfVALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
 
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxPPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
 

ETL

  • 1. INGENIERÍA DE SISTEMAS Y TELEMÁTICA Tema : ETL - EXTRAER, TRANSFORMAR Y CARGAR Curso : Base de Datos II Docente :Ing. Marco Aurelio Porro Chulli Integrantes :  Ana Leydi Linares Serrano.  Patricia Reyna Reynaga  Delsi Yakelin Huamán Villanueva
  • 2. INTRODUCCIÓN * ETL, esencialmente, es el proceso que permite a las empresas manejar y movilizar datos desde distintos tipos de fuentes, para transformarlos, limpiarlos y cargarlos en otra base de datos. El principal propósito de ETL es transportar la información de la empresa desde las aplicaciones de producción a los sistemas de Inteligencia de Negocio (BI), este proceso consta de tres etapas: *Extracción de datos *Transformación de datos *Carga de datos
  • 4. *FASE DE EXTRACCIÓN La primera parte del proceso ETL consiste en extraer los datos desde el sistema de origen. Esta fase consta de tres pasos:
  • 5. * * se evalúan las necesidades concretas de la organización.
  • 6. * * Antes de extraer los datos, se identifica de qué tipo son y en qué formato se encuentran los sistemas fuente.
  • 7. * * En función de las necesidades detectadas, se procede a la extracción en sí de dichos datos. *exigir siempre que esta tarea cause un impacto mínimo en el sistema de origen
  • 8. *MODOS DE EXTRACCIÓN Básicamente, existen tres modos distintos de extracción: Full Extract o extracción total • Esta modalidad consiste en extraer la totalidad de datos. Incremental Extract o extracción incremental • Se va procesando por lotes únicamente lo que fue modificado o agregado. Update Notification o notificación de actualizaciones • En este caso, solo se van extrayendo los datos a medida que se produce una actualización (por ejemplo, un inserto).
  • 9. * *Cualquier organización, empresa o compañía debe exigir que el proceso de extracción de datos desde su fuente o fuentes de origen cause el menor impacto posible. Es decir, que no suponga ningún problema a los empleados que, diariamente, trabajan con los datos y registros.
  • 10. *LIMPIEZA *Asegura la calidad de los datos que vamos a procesar. *Evita la información no veraz o errónea. *Ahorra costes de espacio en disco al eliminarse la información duplicada. *Agiliza las consultas por la ausencia de datos repetidos o inservibles. *Ayuda a tomar decisiones estratégicas correctas. La limpieza de datos se divide en distintas etapas, que vamos a describir a continuación:
  • 11. Depurar los valores Nombre Ana Leydi Linares Serrano Nombres Apellido Paterno Apellido Materno Ana Leydi Linares Serrano Por ejemplo: comprueba una dirección y el código postal correspondiente. Corregir formatos definidos. Por ejemplo: trato de Sr., Sra. Estandarizar eliminar duplicados. Por ejemplo: identificando nombres y direcciones similares. Relacionar analiza e identifica relaciones entre registros relacionados y los junta en una sola representación. Consolidar
  • 12. FASE DE TRANSFORMACIÓN Aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Algunas transformaciones:  Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las columnas con valores nulos no se carguen).  Traducir códigos (Por ejemplo, si la fuente de origen almacena una “H” para hombres y una “M” para mujeres, dar las instrucciones necesarias para que en destino se guarde un “ 1” para hombres y un” 2” para mujeres).  Calcular totales de múltiples filas de datos (por ejemplo, ventas totales de cada región).  Dividir una columna en varias (por ejemplo, la columna “Nombre: García, Miguel”; pasar a dos columnas “Nombre: Miguel” y “Apellido: García”)
  • 13. Esta función corresponde al desarrollador o analista del proceso ETL en cuestión. La definición de las transformaciones a realizar se realiza en función de un análisis previo y de la fase de limpieza. ¿Quién se encarga de realizar estas transformaciones?
  • 14. FASE DE CARGA En esta fase, los datos procedentes de la fase anterior(fase de transformación) son dragados en el sistema e destino. Dependiendo de los requerimientos de la organización, pueden ser de dos tipos:  Acumulación simple  Rolling
  • 15. Acumulación simple Consiste en realizar un resumen de todas las transacciones comprendidas en el período de tiempo seleccionado y transportar el resultado como una única transacción hacia el data warehouse, almacenando un valor calculado que consistirá típicamente en un sumatorio o un promedio de la magnitud considerada. Rolling Este proceso sería el más recomendable en los casos en que se busque mantener varios niveles de granularidad. Para ello se almacena información resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo o diferentes niveles jerárquicos.
  • 16.  Capacidad de entrega de datos.  Capacidad de transformación de datos.  Capacidad de Metadatos y Modelado de Datos.  Adaptación a las diferentes plataformas hardware y sistema operativos existentes.  Emplearlas para la integración con sistemas heredados. CARACTERISTICAS Y VENTAJAS
  • 18. * Gracias a los procesos ETL es posible que cualquier organización: • Mueva datos desde una o múltiples fuentes. • Reformatee esos datos y los limpie, cuando sea necesario. • Los cargue en otro lugar como una base de datos, un data mart o un data warehouse. • Una vez alojados en destino, esos datos se analicen. • O, cuando ya están cargados en su ubicación definitiva, se empleen en otro sistema operacional, para apoyar un proceso de negocio.
  • 19. Las herramientas ETL pueden ser útiles para multitud de propósitos, como por ejemplo: *Tareas de Bases de datos: que también se utilizan para consolidar, migrar y sincronizar bases de datos operativas. *Migración de datos entre diferentes aplicaciones por cambios de versión o cambio de aplicativos. *Sincronización entre diferentes sistemas operacionales (por ejemplo, entre nuestro entorno ERP y la web de ventas). *Consolidación de datos: sistemas con grandes volúmenes de datos que son consolidados en sistemas paralelos, ya sea para mantener históricos o para llevar a cabo procesos de borrado en los sistemas originales. *Interfaces de datos con sistemas externos: como el envío de información a clientes o proveedores. También servirían para la recepción, proceso e integración de la información recibida. *Interfaces con sistemas Frontoffice: serían interfaces de subida/bajada con sistemas de venta. *Otros cometidos: como la actualización de usuarios a sistemas paralelos o la preparación de procesos masivos (tipo mailings o newsletter).
  • 20. * Los procesos ETL pueden incluir: *Sistemas legacy. Es decir, legados, heredados o antiguos. *Sistemas nuevos. Basados en Windows, Linux y también en las redes sociales modernas: Facebook, Twitter, Linkedin, etc.
  • 21. * A cualquier empresa u organización le beneficia poner en marcha un proceso ETL para mover y transformar los datos que maneja por los siguientes motivos: *Poder crear una Master Data Management *Posibilita a los directivos tomar decisiones estratégicas *Sirve para integrar sistemas. *Poder tener una visión global de todos los datos consolidados en una data warehouse.
  • 22. * La implantación de un sistema ETL bien definido supone todo un reto puesto que, para que sea realmente efectivo, debe permitir integrar los sistemas legacy (algunos ya muy obsoletos) con los más modernos. Además, el acceso a todos estos sistemas se debe producir no solo en modo de lectura, sino también como escritura.
  • 23. * Como conclusión podemos decir que los ETL son proceso que organizan los flujos datos entre distintos sistemas en una organización y aporta los métodos y herramientas necesarias para movilizar los datos desde múltiples fuentes a un almacén de datos, para transformarlos, limpiarlos y cargarlos en otra base de datos. ETL es parte de la Inteligencia de Negocios, también llamado “Gestión de los Datos” (Data Management).