SlideShare una empresa de Scribd logo
1 de 18
Data Pipeline
Enero 2020
Elena López
ELENA LÓPEZ
• ING. DE SISTEMAS DESDE MUCHO ANTES DE WINDOWS 7
• DATOS, DATOS Y MÁS DATOS
• CURIOSA, EMPRENDEDORA, AUTODIDACTA
• DATA PLATFORM MICROSOFT MVP
• HUMOR, CERVEZA, NATURALEZA
Aprendiendo BD
con
SQL Server
La nueva economía prospera
gracias al aprovechamiento
de los datos
EVOLUCIÓN
RETOS
Nosotros Los Datos
RETOSRELACIONADOS A LOS DATOS
• Valores nulos
• Valores vacíos
• Valores por defecto
Completit
ud
• Estandarizados
• Legibles
Conformidad
• No se contradicenConsistencia
• Veracidad de los datosPrecisión
• Redundancia
• Valor que representa un mismo
dato en diferente formato
Duplicidad
• ¿Podemos usar y confiar en los
datos que tenemos?Integridad
70-80% del tiempo se invierte en la limpieza y recolección de los datos.
TEAM DATA SCIENCE PROCESSMetodología de trabajo desarrollada y recomendada por Microsoft
Entendimiento del negocio
Se identifican junto al cliente las
preguntas que se buscan resolver con el
proyecto
Levantamiento de riesgos, supuestos,
beneficios
Objetivos del proyecto
Formación del equipo
Definición de métricas de éxito
(específicas, medibles, alcanzables,
relevantes y con límite de tiempo
Se identifican
las fuentes de
datos
Adquisición y entendimiento
de los datos
Selección de conjuntos de datos
Exploración de los datos, uso de
estadística descriptiva para evaluar
calidad de los datos
Análisis de correlación para identificar
variables
Limpieza y calidad de datos en caso de
requerirse (datos duplicados, presencia
de valores nulos, valores atípicos)
Modelamiento y Desarrollo
Ingeniería de atributos
Desarrollo de Extracción,
Transformación y Carga de los datos
(ETL).
Diseño lógico/conceptual del almacén
de datos o data warehouse (topología
de esquema estrella)
Diseño de estructuras
multidimensionales o cubos
Diseño de Reportes, dashboards, KPIs y
alertas
Calidad
Despliegue
Visualizadores Web
Hojas de cálculos
Notificaciones vía correo electrónico
Herramientas comerciales de
autoservicio de datos (Power BI por
ejemplo)
Data Pipeline
Enero 2020
Actividades ordenadas lógicamente para
realizar una tarea en torno a los datos
Data Pipeline
Enero 2020
Data sets
Activities
Pipeline
Activities
Data Movement
Data Transformation
Control
¿Qué
perseguimos?
Autoservicio
Única fuente de la verdad
Eliminar la dependencia de TIC
Modern Data Warehouse
Advanced Analytics on Big Data
Real Time Analytics
Los sistemas deben seguir los lineamientos de los procesos empresariales y garantizar la calidad
de los datos.
Data Pipeline Enero 2020

Más contenido relacionado

La actualidad más candente

Mi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning StudioMi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning StudioJOSE AHIAS LOPEZ PORTILLO
 
Solid Day - IoT en México
Solid Day - IoT en MéxicoSolid Day - IoT en México
Solid Day - IoT en MéxicoSoftware Guru
 
Excel power pivot ssas tabular
Excel power pivot ssas tabularExcel power pivot ssas tabular
Excel power pivot ssas tabularSalvador Ramos
 
Marcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo
 
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadasParadigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadasBig-Data-Summit
 
066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatina066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatinaGeneXus
 
Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
datatons en Women Techmakers
datatons en Women Techmakersdatatons en Women Techmakers
datatons en Women TechmakersDatatons
 
Data Science - Analítica Predictiva y Evolución de BI
Data Science - Analítica Predictiva y Evolución de BIData Science - Analítica Predictiva y Evolución de BI
Data Science - Analítica Predictiva y Evolución de BIPatricio Del Boca
 
Diseñando equipos de ciencia de datos: aciertos y desastres,
Diseñando equipos de ciencia de datos: aciertos y desastres,Diseñando equipos de ciencia de datos: aciertos y desastres,
Diseñando equipos de ciencia de datos: aciertos y desastres,Software Guru
 
Que función cumple excel para las empresas
Que función cumple excel para las empresasQue función cumple excel para las empresas
Que función cumple excel para las empresasleidyyaira
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data miningrenfer64
 
Paso de TI, tengo Power BI
Paso de TI, tengo Power BIPaso de TI, tengo Power BI
Paso de TI, tengo Power BISalvador Ramos
 

La actualidad más candente (19)

Big data presentación
Big data presentaciónBig data presentación
Big data presentación
 
Claves para entender el actual big data
Claves para entender el actual big dataClaves para entender el actual big data
Claves para entender el actual big data
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 
Mi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning StudioMi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning Studio
 
Solid Day - IoT en México
Solid Day - IoT en MéxicoSolid Day - IoT en México
Solid Day - IoT en México
 
Excel power pivot ssas tabular
Excel power pivot ssas tabularExcel power pivot ssas tabular
Excel power pivot ssas tabular
 
Marcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de Datos
 
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadasParadigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
 
066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatina066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatina
 
Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
datatons en Women Techmakers
datatons en Women Techmakersdatatons en Women Techmakers
datatons en Women Techmakers
 
Data Science - Analítica Predictiva y Evolución de BI
Data Science - Analítica Predictiva y Evolución de BIData Science - Analítica Predictiva y Evolución de BI
Data Science - Analítica Predictiva y Evolución de BI
 
Big data y hadoop
Big data y hadoopBig data y hadoop
Big data y hadoop
 
Diseñando equipos de ciencia de datos: aciertos y desastres,
Diseñando equipos de ciencia de datos: aciertos y desastres,Diseñando equipos de ciencia de datos: aciertos y desastres,
Diseñando equipos de ciencia de datos: aciertos y desastres,
 
Big data
Big dataBig data
Big data
 
Que función cumple excel para las empresas
Que función cumple excel para las empresasQue función cumple excel para las empresas
Que función cumple excel para las empresas
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Paso de TI, tengo Power BI
Paso de TI, tengo Power BIPaso de TI, tengo Power BI
Paso de TI, tengo Power BI
 

Similar a Data Pipeline Enero 2020

Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoDatalytics
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8John Bulla
 
Dts y analysis services 2000
Dts y analysis services 2000Dts y analysis services 2000
Dts y analysis services 2000Salvador Ramos
 
Herramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de DatosHerramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de DatosEduardo Castro
 
Microsoft Business Analytics 2013
Microsoft Business Analytics 2013Microsoft Business Analytics 2013
Microsoft Business Analytics 2013Joseph Lopez
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business IntelligenceCarlos Escobar
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Data integration
Data integrationData integration
Data integrationPowerData
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Analytics10
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Denodo
 
Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!Joseph Lopez
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Pedro Contreras Flores
 
Bilatam - BI for Beginners
Bilatam - BI for BeginnersBilatam - BI for Beginners
Bilatam - BI for BeginnersBILATAM
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouseshady85
 

Similar a Data Pipeline Enero 2020 (20)

Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con Pentaho
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1
 
Dts y analysis services 2000
Dts y analysis services 2000Dts y analysis services 2000
Dts y analysis services 2000
 
Herramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de DatosHerramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de Datos
 
Microsoft Business Analytics 2013
Microsoft Business Analytics 2013Microsoft Business Analytics 2013
Microsoft Business Analytics 2013
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Data integration
Data integrationData integration
Data integration
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0
 
Bilatam - BI for Beginners
Bilatam - BI for BeginnersBilatam - BI for Beginners
Bilatam - BI for Beginners
 
capacitación Data science.pptx
capacitación Data science.pptxcapacitación Data science.pptx
capacitación Data science.pptx
 
Fundamentos dw
Fundamentos dwFundamentos dw
Fundamentos dw
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
 
Hablemos de Big Data
Hablemos de Big DataHablemos de Big Data
Hablemos de Big Data
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 

Más de Elena Lopez

Data driven decision making
Data driven decision makingData driven decision making
Data driven decision makingElena Lopez
 
Modern data warehouse
Modern data warehouseModern data warehouse
Modern data warehouseElena Lopez
 
Arquitectura de Datos en Azure
Arquitectura de Datos en AzureArquitectura de Datos en Azure
Arquitectura de Datos en AzureElena Lopez
 
Data analytics on Azure
Data analytics on AzureData analytics on Azure
Data analytics on AzureElena Lopez
 
El valor de los datos 3.0
El valor de los datos 3.0El valor de los datos 3.0
El valor de los datos 3.0Elena Lopez
 
Gestión de Proyectos de Ciencia de Datos
Gestión de Proyectos de Ciencia de DatosGestión de Proyectos de Ciencia de Datos
Gestión de Proyectos de Ciencia de DatosElena Lopez
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzadaElena Lopez
 
Inteligencia de negocios - tercera parte
Inteligencia de negocios  - tercera parteInteligencia de negocios  - tercera parte
Inteligencia de negocios - tercera parteElena Lopez
 
Consideraciones para un buen diseño lógico de base de datos
Consideraciones para un buen diseño lógico de base de datosConsideraciones para un buen diseño lógico de base de datos
Consideraciones para un buen diseño lógico de base de datosElena Lopez
 
El valor de los datos
El valor de los datosEl valor de los datos
El valor de los datosElena Lopez
 
1. introduccion las Bases de Datos
1. introduccion las Bases de Datos1. introduccion las Bases de Datos
1. introduccion las Bases de DatosElena Lopez
 
1. introduccion a las Bases de datos
1. introduccion a las Bases de datos1. introduccion a las Bases de datos
1. introduccion a las Bases de datosElena Lopez
 

Más de Elena Lopez (12)

Data driven decision making
Data driven decision makingData driven decision making
Data driven decision making
 
Modern data warehouse
Modern data warehouseModern data warehouse
Modern data warehouse
 
Arquitectura de Datos en Azure
Arquitectura de Datos en AzureArquitectura de Datos en Azure
Arquitectura de Datos en Azure
 
Data analytics on Azure
Data analytics on AzureData analytics on Azure
Data analytics on Azure
 
El valor de los datos 3.0
El valor de los datos 3.0El valor de los datos 3.0
El valor de los datos 3.0
 
Gestión de Proyectos de Ciencia de Datos
Gestión de Proyectos de Ciencia de DatosGestión de Proyectos de Ciencia de Datos
Gestión de Proyectos de Ciencia de Datos
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzada
 
Inteligencia de negocios - tercera parte
Inteligencia de negocios  - tercera parteInteligencia de negocios  - tercera parte
Inteligencia de negocios - tercera parte
 
Consideraciones para un buen diseño lógico de base de datos
Consideraciones para un buen diseño lógico de base de datosConsideraciones para un buen diseño lógico de base de datos
Consideraciones para un buen diseño lógico de base de datos
 
El valor de los datos
El valor de los datosEl valor de los datos
El valor de los datos
 
1. introduccion las Bases de Datos
1. introduccion las Bases de Datos1. introduccion las Bases de Datos
1. introduccion las Bases de Datos
 
1. introduccion a las Bases de datos
1. introduccion a las Bases de datos1. introduccion a las Bases de datos
1. introduccion a las Bases de datos
 

Último

Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfdanaeamadot
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 

Último (20)

Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdf
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 

Data Pipeline Enero 2020

  • 2. ELENA LÓPEZ • ING. DE SISTEMAS DESDE MUCHO ANTES DE WINDOWS 7 • DATOS, DATOS Y MÁS DATOS • CURIOSA, EMPRENDEDORA, AUTODIDACTA • DATA PLATFORM MICROSOFT MVP • HUMOR, CERVEZA, NATURALEZA
  • 4. La nueva economía prospera gracias al aprovechamiento de los datos
  • 6.
  • 8. RETOSRELACIONADOS A LOS DATOS • Valores nulos • Valores vacíos • Valores por defecto Completit ud • Estandarizados • Legibles Conformidad • No se contradicenConsistencia • Veracidad de los datosPrecisión • Redundancia • Valor que representa un mismo dato en diferente formato Duplicidad • ¿Podemos usar y confiar en los datos que tenemos?Integridad 70-80% del tiempo se invierte en la limpieza y recolección de los datos.
  • 9. TEAM DATA SCIENCE PROCESSMetodología de trabajo desarrollada y recomendada por Microsoft Entendimiento del negocio Se identifican junto al cliente las preguntas que se buscan resolver con el proyecto Levantamiento de riesgos, supuestos, beneficios Objetivos del proyecto Formación del equipo Definición de métricas de éxito (específicas, medibles, alcanzables, relevantes y con límite de tiempo Se identifican las fuentes de datos Adquisición y entendimiento de los datos Selección de conjuntos de datos Exploración de los datos, uso de estadística descriptiva para evaluar calidad de los datos Análisis de correlación para identificar variables Limpieza y calidad de datos en caso de requerirse (datos duplicados, presencia de valores nulos, valores atípicos) Modelamiento y Desarrollo Ingeniería de atributos Desarrollo de Extracción, Transformación y Carga de los datos (ETL). Diseño lógico/conceptual del almacén de datos o data warehouse (topología de esquema estrella) Diseño de estructuras multidimensionales o cubos Diseño de Reportes, dashboards, KPIs y alertas Calidad Despliegue Visualizadores Web Hojas de cálculos Notificaciones vía correo electrónico Herramientas comerciales de autoservicio de datos (Power BI por ejemplo)
  • 10. Data Pipeline Enero 2020 Actividades ordenadas lógicamente para realizar una tarea en torno a los datos
  • 11. Data Pipeline Enero 2020 Data sets Activities Pipeline
  • 13. ¿Qué perseguimos? Autoservicio Única fuente de la verdad Eliminar la dependencia de TIC
  • 17. Los sistemas deben seguir los lineamientos de los procesos empresariales y garantizar la calidad de los datos.

Notas del editor

  1. La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.