SlideShare una empresa de Scribd logo
1 de 67
DIPLOMADO
Big Data, Analytics y Business
Intelligence
MODULO II
DATA ANALYTICS
DATA
ANALYTICS
• MSc. Ing. Vanessa Adriana Gironda Aquize
---------------------------------------
UPE - Maestría en Enghenaria de Sistemas – Mención en
Inteligencia Artificial y Machine Learning
UPE - Especialización en Ciencia de los Datos
---------------------------------------
ANH - Sistema de Rastreo Satelital
- Sistema de Viodeovigilancia en Red
- B-SISA
NEAN – Emprendimiento de servicios de soporte de red
EMI - Investigación y Docencia
SIN - DBA
- Investigación sistemas de detección de anomalías
- Procesamiento de Datos
- Implementación de Big Data ( infraestructura –lógica)
- Implementación de K8S para despliegue de microservicios
Ustedes ?
Contenido
UNIDAD TEMÁTICA DETALLE
CICLO DEL PROCESO DE ANÁLISIS
DE DATOS.
Metodologías de análisis de datos
Metodología de implementación y análisis de casos
Definición tecnológica de la arquitectura, modelamiento dimensional y procesos ETL
DIFERENTES TIPOS DE DATOS. Gobierno de datos
Tipos de datos por categoría (Datos estructurados, no estructurados, Lenguaje Natural, Datos Generados por
maquinas, Datos gráficos, Audio, Video e imagen)
Tipos de datos por origen
Tipos de datos en BIGDATA
PREPARACIÓN DE DATOS Procesamiento de datos: Preparación de datos
Procesamiento de datos: Reducción de datos
TIPS SOBRE EL TRATAMIENTO DE
DATOS.
Aplicaciones de business analytics con herramientas informáticas
GARBACE IN GARBACE OUT Definición
Como preparar la data para evitar GIGO
CALIDAD EN LOS DATOS. Definición
Dificultades para controlar la calidad de datos
Dimensión de la calidad de datos
Base de datos y calidad de datos
PARADIGMAS DE PROCESAMIENTO Arquitecturas y tecnologías aplicadas
Cronograma
Evaluación del modulo
Aprender haciendo!!!!
Contenido 28/08/2021
Presentación -
Introducción
BDA-BI-DA
Proceso de
análisis de
datos
Data Analytics
en Python
(introducción )
50 min
5 min
5 min
50 min
5 min
5 min
50 min
5 min
5 min
SECCION I
DIPLOMADO
Big Data, Analytics y Business
Intelligence
Piensa que crees que aprenderás en el diplomado. (3 minutos)
Expectativas.
Toda empresa
que genera
datos debe medir
el valor del
negocio
Como se mide el
valor del negocio?
BIG DATA ANALYTICS – BUSINESS
INTELLIGENCE
Otris (2019)
Big Data Analytics BI?
Tecnologías
Tipo de datos
Data NO estructurada
Diferentes tipo de
fuentes
Extensos data sets
Dinámico
Modelamiento de
Optimización y
predicción
Análisis
prescriptivos
predictivo
Preguntas Que pasa si?
Que pasara después?
Que tendencias puede
predecirse?
Cuál será el escenario
empresarial óptimo?
TECNNOLOGIAS BIG DATA ANALYTICS – BUSINESS
INTELLIGENCE
3ra dimensión!!
Cantidad y/o tamaño de data
BIG DATA ANALYTICS – BUSINESS
INTELLIGENCE
Nace la necesidad de contemplar tecnologías para
procesar grandes cantidades de datos (5 V)
Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
DIFERENCIAS DE ELEMENTOS DEL CONJUNTO DE
CONCEPTOS DEL ANALISIS DE DATOS MASIVOS
Definición tecnológica de la arquitectura,
modelamiento dimensional y procesos ETL
Sistema de Data Warehousing / Business
Intelligence (DW / BI)
común -> permiten el análisis de
datos con el objetivo de extraer la
mayor información posible
común ->Principio de aprovechar
de la mejor manera la información
para poder tomar mejores
decisiones
Ciencia de los Datos Análisis de Datos
• Preparación, limpieza y análisis
• Datos estructurados y no
• Combina matemáticas, estadísticas,
combinación de varias técnicas
que se utilizan al intentar obtener
información y conocimientos de
los datos
• Aplicación de procesos algorítmicos
o mecánicos para obtener
conocimientos
• Debe tomar mejores decisiones y
verificar y refutar modelos y teorías
existentes.
• Se centra principalmente en la
inferencia
CASOS DE ESTUDIO 1 ANH
CASOS DE ESTUDIO 1 ANH
CASOS DE ESTUDIO 2 BASES DATOS
ORACLE
La información del rendimiento del sistema propio a la base de
datos es un recurso importante que todo DBA debe considerar al
momento de monitorear la BD.
Estas diferentes métricas reflejan el rendimiento del servidor a través de:
• deltas (diferencia de valores de métricas en dos diferentes tiempos)
• tasas (deltas / tiempo transcurrido)
En Oracle 10g se introdujo tablas métricas que calculaban estas deltas y tasas estadísticas, lo que
simplifica enormemente el análisis del rendimiento de la base.
 V$SYSMETRIC – últimos 15 y 60 segundos
 V$SYSMETRIC_SUMMARY – valores de la última hora (última instantánea) como avg, max,
 DBA_HIST_SYSMETRIC_SUMMARY – resúmenes de horas de la semana pasada del grupo
System Metrics Long Duraction .
CASOS DE ESTUDIO 2 BASES DATOS
ORACLE
Métodos de predicción, clasificación y agrupamiento
CASOS DE ESTUDIO 2 BASES DATOS
ORACLE
CASOS DE ESTUDIO 3 REGISTROS DE
COMPRAS Y VENTAS DE CONTRIBUYENTES
Métodos de predicción, clasificación y agrupamiento
Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: ANH - BSISA
Sistema de Monitoreo de
Anomalias en el cosumo de
combustible
Tecnologías
Tipo de datos
Data NO estructurada Estructurada
Diferentes tipo de
fuentes
Fuentes tradicionales
Extensos data sets Dataset limitado
Dinámico estática
Modelamiento de
Optimización y
predicción
reportes
Análisis
prescriptivos
predictivo
Análisis descriptivo
Preguntas Que anomalías se
registraron en el
ultimo año
Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: ANH - BSISA
SISTEMA DE PREDICCION DE
COMPORTAMIENTO DE
CONSUMO DE COMBIUSTIBLE
EN BOLIVIA
+ GPS + HISTORICO DE
VEHICULO
+ textos planos
Tecnologías
Tipo de
datos
Data NO estructurada Estructurada
Diferentes tipo de
fuentes
Fuentes tradicionales
Extensos data sets Dataset limitado
Dinámico estática
Modelamiento de
Optimización y
predicción
reportes
Análisis
prescriptivos predictivo
Análisis descriptivo
Preguntas Que pasara con el
consumo de
combustibles de
vehículos anómalos
BI ANH
Tecnologías
Tipo de datos
Data estructurada
SISTEMA DE
MOMINTOREO DE
CONSUMO DE
COMBUSTIBLE
Fuentes de datos
estructurados
Extensos data sets
No dinámico
Modelamiento
clasificación
Análisis descriptivo
Preguntas Cuantos vehículos
anómalos existen?
Cuantos anomalías por
año?
Big Data Analytics ANH
Tecnologías
Tipo de datos
Data NO estructurada
SISTEMA DE
PREDICCION DE
COMPORTAMIENTO DE
CONSUMO DE
COMBIUSTIBLE EN
BOLIVIA
+ GPS + HISTORICO DE
VEHICULO
+ textos planos
Diferentes tipo de
fuentes
Extensos data sets
Dinámico
Modelamiento de
Optimización y
predicción
Análisis prescriptivos
predictivo
Preguntas Que pasa si?
Que pasara después?
Que tendencias puede
predecirse?
Cuál será el escenario
empresarial óptimo?
Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
Varias soluciones BUSINESS INTELLIGENCE
SISTEMA DE DETECCION
DE ANOMLIAS
MODELAMIENTO DE
COMPORTAMIENTO DE
CONSUMO DE
COMBUSTIBLE
Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
Varias soluciones BIG DATA ANALYTICS
Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: DB - ORACLE
Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: DECLARACION DE
FACTURAS -
1 Identificar una necesidad de
exploración de datos
2 Evaluar y/o determinar variables de
análisis de datos masivos
3 Definición de propuesta de solución
Como saber que tipo de solución es la que requiere mi empresa?
SECCION II
Contenido 28/08/2021
Presentación -
Introducción
BDA-BI-DA
Proceso de
análisis de
datos
Data Analytics
en Python
(introducción )
50 min
5 min
5 min
50 min
5 min
5 min
50 min
5 min
5 min
CICLO DE PROCESO DEL ANALISIS DE
DATOS
as
• Metodología de implementación y análisis de casos
Analítica
avanzada
requiere
Toma de
decisiones
Selección de
fuentes de
datos
Metodologías
de análisis
Interpretación y
comunicación de
resultados
en todo momento
2
CICLO DE PROCESO DEL ANALISIS DE
DATOS
• Como se procesa y analiza el big data ?
B. Schmarzo, Big Data: Understanding How Data Powers Big Business. Wiley, 2013.
No es lineal
Reformular
Proceso
iterativo
METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos Analítica de datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
A. Gandomi and M. Haider, “Beyond the hype: Big Data concepts, methods, and analytics,
Int. J. Inf. Manag., vol. 35, no. 2, pp. 137–144, Abril 2015.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
Regresiones espaciales
Simulaciones.
consumo vs. distancia a
centros comerciales
desempeño de
una cadena de distribución con
bodegas en distintos lugares
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Identificación de líderes de opinión para focalizar campañas de
marketing.
• Identificar cuellos de botella en flujos de información de una
empresa.
• Modelamiento de redes de transporte y predicción del tiempo de
desplazamiento de un punto a otro.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Predicción de fenómenos como crimen, deserción escolar y universitaria, esperanza de
vida post-operatoria, ventas. Sugerencias y recomendaciones de productos en función
de historial pasado
• Procesamiento de lenguaje natural: reconocimiento de voz y lenguaje para interacción
humano computador (ej: Siri, Cortana, Alexa), y análisis de sentimientos en textos y
redes sociales.
• Reconocimiento de patrones: texto manuscrito, procesamiento de imágenes y
reconocimiento de caras para buscar sospechosos de crímenes.
• Detección de anomalías: detección de fraudes bancarios en base a actividad inusual en
compras usando tarjeta decrédito.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Indicadores espaciales de nivel de servicios públicos y privados.
• Análisis de brechas y crecimiento espacial de la oferta y la demanda de
servicios.
• Accesibilidad urbana y rural, caracterización de los territorios en diferentes
dimensiones geográficas, sociodemográficas, económicas y desarrollo
humano.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimización
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Localización óptima de
recursos en hospitales,
escuelas, centros productivos,
bodegas.
• Producción: programación de
maquinarias para la
fabricación, manejo de
inventarios.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimización Simulación
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
Pronóstico de los
resultados
financieros de una
empresa
dado circunstancias de
incertidumbre.
• Pronóstico del clima.
METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimización Simulación
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
Análisis visual interactivo de
componentes principales
Infografías.
Tableros de mando
(Dashboards), para
seguimiento
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
•Análisis en tiempo real
•Resultados instantáneos de
analizados
•Operaciones repetitivas
•Algoritmos de aprendizaje
automático
•Analizar datos archivados
•Operaciones de hardware
básico
•Sin análisis de datos
apresurados
•Procesamiento de datos
lineal
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
vega
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
Puntos críticos de analítica de datos
• Seleccionar :
– Problema correcto
– Datos correctos
– Fuentes de datos correctas
– Muestras correctas
– Modelo correcto
– Variable correcta
– Validación y ajustes correctos
– Visualización correcta
1
CICLO DE PROCESO DEL ANALISIS DE
DATOS
• Metodologías de análisis de datos
La metodología de analítica permite:
• Establecer una forma probada para llevar un problema a una solución de
analítica
• Alinear la analítica con la intención estratégica de la organización
• Lograr eficiencia en algún aspecto del negocio
CRISP-DM
Cross Industry Standard Process for Data
Mining es un modelo estándar abierto
propuesto en 1999 por IBM para proyectos
relacionados con minería de datos.
Entendimiento de negocio, entendimiento de datos,
preparación de datos, modelamiento, evaluación y
publicación.
1
CICLO DE PROCESO DEL ANALISIS DE
DATOS
• Metodologías de análisis de datos
ASUM-DM
2015 IBM propuso una versión extendida de CRISP-DM
denominada ASUM-DM (Analytics Solutions Unified
Method) la cual contiene los mismos pasos de CRISP-DM
bajo el nombre de “Ciclo de Elaboración” e introduce un
nuevo ciclo denominado “Operacional”
nuevas prácticas en la ciencia de datos como el uso de
volúmenes de datos muy grandes, la incorporación de
análisis de texto, en el modelado predictivo y la
automatización de algunos procesos
guía paso a paso para efectuar una implementación completa del
ciclo de vida de las soluciones de analítica de datos.
Contiene pasos estructurados, actividades de desarrollo, roles y responsabilidades, plantillas y
directrices
IMPORTANCIA DE UTILIZAR METODOLOGIAS
 Definir una metodología para hacer ejercicios asociados con la analítica de
datos (soluciones de analítica) aporta significativamente al éxito de un
proyecto, debido a que los elementos involucrados en el ciclo de vida de los
ejercicios de analítica mantienen unas directrices, reglas y lineamientos
establecidos para cumplir con un propósito en particular, la metodología de
analítica permite establecer un plan de trabajo adecuado.
•
 La metodología de ASUM DM es la evolución de CRISP DM, y surge como
resultado de la compilación y estructuración de una serie de aplicaciones de
analítica de negocios e inteligencia de negocios, lo cual, implica una
organización/estructuración adecuada de sus fases y sus elementos
involucrados.
SECCION III
Contenido 05/02/2020
Presentación -
Introducción
BDA-BI-DA
Proceso de
análisis de
datos
Data Analytics
en Python
(introducción )
50 min
5 min
5 min
50 min
5 min
5 min
50 min
5 min
5 min
Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins estadísticos
Sistema de información geográfica
Servicios en la nube (Cloud
Computing)
Jupyter Notebooks
Clase 1 - CicloProcesoAnálisisDatos.pptx

Más contenido relacionado

Similar a Clase 1 - CicloProcesoAnálisisDatos.pptx

Almacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datosAlmacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datosliras loca
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datosSergio Salimbeni
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Marcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...CICE
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptxJuanCarlosRomanPerez1
 
Fundamentos de datawarehouse
Fundamentos de datawarehouseFundamentos de datawarehouse
Fundamentos de datawarehouseFernacontre
 
06 mapa conceptual 2 no. 6
06   mapa conceptual 2                           no. 606   mapa conceptual 2                           no. 6
06 mapa conceptual 2 no. 6Gustavo Cuxum
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesDeysi Hdz
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosjo_unwell
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosjo_unwell
 

Similar a Clase 1 - CicloProcesoAnálisisDatos.pptx (20)

Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Almacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datosAlmacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datos
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
bi-180616123404 (1).pptx
bi-180616123404 (1).pptxbi-180616123404 (1).pptx
bi-180616123404 (1).pptx
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Marcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de Datos
 
Inteligencia negocios 2014
Inteligencia negocios 2014Inteligencia negocios 2014
Inteligencia negocios 2014
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
PlataformasIA
PlataformasIAPlataformasIA
PlataformasIA
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Fundamentos de datawarehouse
Fundamentos de datawarehouseFundamentos de datawarehouse
Fundamentos de datawarehouse
 
El MOOC de Business Intelligence de la UOC en MiriadaX
El MOOC de Business Intelligence de la UOC en MiriadaXEl MOOC de Business Intelligence de la UOC en MiriadaX
El MOOC de Business Intelligence de la UOC en MiriadaX
 
06 mapa conceptual 2 no. 6
06   mapa conceptual 2                           no. 606   mapa conceptual 2                           no. 6
06 mapa conceptual 2 no. 6
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 

Último

actividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsx
actividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsxactividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsx
actividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsx241532171
 
Historia de la Medicina y bases para desarrollo de ella
Historia de la Medicina y bases para desarrollo de ellaHistoria de la Medicina y bases para desarrollo de ella
Historia de la Medicina y bases para desarrollo de ellajuancamilo3111391
 
PRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptx
PRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptxPRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptx
PRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptxRodriguezLucero
 
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdfNUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdfisrael garcia
 
2º SOY LECTOR PART 2- MD EDUCATIVO (6).pdf
2º SOY LECTOR PART 2- MD  EDUCATIVO (6).pdf2º SOY LECTOR PART 2- MD  EDUCATIVO (6).pdf
2º SOY LECTOR PART 2- MD EDUCATIVO (6).pdfFernandaHernandez312615
 
MODELO CARACTERIZACION DE PROCESOS SENA.
MODELO CARACTERIZACION DE PROCESOS SENA.MODELO CARACTERIZACION DE PROCESOS SENA.
MODELO CARACTERIZACION DE PROCESOS SENA.imejia2411
 
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENAINSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENAdanielaerazok
 
libro de Ciencias Sociales_6to grado.pdf
libro de Ciencias Sociales_6to grado.pdflibro de Ciencias Sociales_6to grado.pdf
libro de Ciencias Sociales_6to grado.pdfFAUSTODANILOCRUZCAST
 
rodriguez_DelAngel_MariaGPE_M1S3AL6.pptx
rodriguez_DelAngel_MariaGPE_M1S3AL6.pptxrodriguez_DelAngel_MariaGPE_M1S3AL6.pptx
rodriguez_DelAngel_MariaGPE_M1S3AL6.pptxssuser61dda7
 
Buscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la webBuscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la webDecaunlz
 
institucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalenainstitucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalenajuniorcuellargomez
 
Institucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalenaInstitucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalenadanielaerazok
 
COMPETENCIAS CIUDADANASadadadadadadada .pdf
COMPETENCIAS CIUDADANASadadadadadadada .pdfCOMPETENCIAS CIUDADANASadadadadadadada .pdf
COMPETENCIAS CIUDADANASadadadadadadada .pdfOscarBlas6
 

Último (13)

actividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsx
actividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsxactividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsx
actividad.06_crea_un_recurso_multimedia_M01_S03_M01.ppsx
 
Historia de la Medicina y bases para desarrollo de ella
Historia de la Medicina y bases para desarrollo de ellaHistoria de la Medicina y bases para desarrollo de ella
Historia de la Medicina y bases para desarrollo de ella
 
PRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptx
PRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptxPRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptx
PRIMARIA 1. RESUELVE PROBLEMAS DE FORMA MOVIMIENTO Y LOCALIZACIÓN 2 (2).pptx
 
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdfNUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
 
2º SOY LECTOR PART 2- MD EDUCATIVO (6).pdf
2º SOY LECTOR PART 2- MD  EDUCATIVO (6).pdf2º SOY LECTOR PART 2- MD  EDUCATIVO (6).pdf
2º SOY LECTOR PART 2- MD EDUCATIVO (6).pdf
 
MODELO CARACTERIZACION DE PROCESOS SENA.
MODELO CARACTERIZACION DE PROCESOS SENA.MODELO CARACTERIZACION DE PROCESOS SENA.
MODELO CARACTERIZACION DE PROCESOS SENA.
 
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENAINSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
 
libro de Ciencias Sociales_6to grado.pdf
libro de Ciencias Sociales_6to grado.pdflibro de Ciencias Sociales_6to grado.pdf
libro de Ciencias Sociales_6to grado.pdf
 
rodriguez_DelAngel_MariaGPE_M1S3AL6.pptx
rodriguez_DelAngel_MariaGPE_M1S3AL6.pptxrodriguez_DelAngel_MariaGPE_M1S3AL6.pptx
rodriguez_DelAngel_MariaGPE_M1S3AL6.pptx
 
Buscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la webBuscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la web
 
institucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalenainstitucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalena
 
Institucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalenaInstitucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalena
 
COMPETENCIAS CIUDADANASadadadadadadada .pdf
COMPETENCIAS CIUDADANASadadadadadadada .pdfCOMPETENCIAS CIUDADANASadadadadadadada .pdf
COMPETENCIAS CIUDADANASadadadadadadada .pdf
 

Clase 1 - CicloProcesoAnálisisDatos.pptx

  • 1. DIPLOMADO Big Data, Analytics y Business Intelligence
  • 3. • MSc. Ing. Vanessa Adriana Gironda Aquize --------------------------------------- UPE - Maestría en Enghenaria de Sistemas – Mención en Inteligencia Artificial y Machine Learning UPE - Especialización en Ciencia de los Datos --------------------------------------- ANH - Sistema de Rastreo Satelital - Sistema de Viodeovigilancia en Red - B-SISA NEAN – Emprendimiento de servicios de soporte de red EMI - Investigación y Docencia SIN - DBA - Investigación sistemas de detección de anomalías - Procesamiento de Datos - Implementación de Big Data ( infraestructura –lógica) - Implementación de K8S para despliegue de microservicios
  • 5. Contenido UNIDAD TEMÁTICA DETALLE CICLO DEL PROCESO DE ANÁLISIS DE DATOS. Metodologías de análisis de datos Metodología de implementación y análisis de casos Definición tecnológica de la arquitectura, modelamiento dimensional y procesos ETL DIFERENTES TIPOS DE DATOS. Gobierno de datos Tipos de datos por categoría (Datos estructurados, no estructurados, Lenguaje Natural, Datos Generados por maquinas, Datos gráficos, Audio, Video e imagen) Tipos de datos por origen Tipos de datos en BIGDATA PREPARACIÓN DE DATOS Procesamiento de datos: Preparación de datos Procesamiento de datos: Reducción de datos TIPS SOBRE EL TRATAMIENTO DE DATOS. Aplicaciones de business analytics con herramientas informáticas GARBACE IN GARBACE OUT Definición Como preparar la data para evitar GIGO CALIDAD EN LOS DATOS. Definición Dificultades para controlar la calidad de datos Dimensión de la calidad de datos Base de datos y calidad de datos PARADIGMAS DE PROCESAMIENTO Arquitecturas y tecnologías aplicadas
  • 8. Contenido 28/08/2021 Presentación - Introducción BDA-BI-DA Proceso de análisis de datos Data Analytics en Python (introducción ) 50 min 5 min 5 min 50 min 5 min 5 min 50 min 5 min 5 min
  • 10. DIPLOMADO Big Data, Analytics y Business Intelligence Piensa que crees que aprenderás en el diplomado. (3 minutos) Expectativas.
  • 11. Toda empresa que genera datos debe medir el valor del negocio Como se mide el valor del negocio? BIG DATA ANALYTICS – BUSINESS INTELLIGENCE Otris (2019)
  • 12. Big Data Analytics BI? Tecnologías Tipo de datos Data NO estructurada Diferentes tipo de fuentes Extensos data sets Dinámico Modelamiento de Optimización y predicción Análisis prescriptivos predictivo Preguntas Que pasa si? Que pasara después? Que tendencias puede predecirse? Cuál será el escenario empresarial óptimo? TECNNOLOGIAS BIG DATA ANALYTICS – BUSINESS INTELLIGENCE
  • 13. 3ra dimensión!! Cantidad y/o tamaño de data BIG DATA ANALYTICS – BUSINESS INTELLIGENCE Nace la necesidad de contemplar tecnologías para procesar grandes cantidades de datos (5 V)
  • 14. Knowledge Discovery Data Analytics Big Data Analytics Big Data Datos no estructurados Datos Semiestructurados Business Intelligence Datos estructurados Data Warehouse Data Marts DIFERENCIAS DE ELEMENTOS DEL CONJUNTO DE CONCEPTOS DEL ANALISIS DE DATOS MASIVOS
  • 15. Definición tecnológica de la arquitectura, modelamiento dimensional y procesos ETL Sistema de Data Warehousing / Business Intelligence (DW / BI)
  • 16. común -> permiten el análisis de datos con el objetivo de extraer la mayor información posible común ->Principio de aprovechar de la mejor manera la información para poder tomar mejores decisiones
  • 17. Ciencia de los Datos Análisis de Datos • Preparación, limpieza y análisis • Datos estructurados y no • Combina matemáticas, estadísticas, combinación de varias técnicas que se utilizan al intentar obtener información y conocimientos de los datos • Aplicación de procesos algorítmicos o mecánicos para obtener conocimientos • Debe tomar mejores decisiones y verificar y refutar modelos y teorías existentes. • Se centra principalmente en la inferencia
  • 20. CASOS DE ESTUDIO 2 BASES DATOS ORACLE La información del rendimiento del sistema propio a la base de datos es un recurso importante que todo DBA debe considerar al momento de monitorear la BD.
  • 21. Estas diferentes métricas reflejan el rendimiento del servidor a través de: • deltas (diferencia de valores de métricas en dos diferentes tiempos) • tasas (deltas / tiempo transcurrido) En Oracle 10g se introdujo tablas métricas que calculaban estas deltas y tasas estadísticas, lo que simplifica enormemente el análisis del rendimiento de la base.  V$SYSMETRIC – últimos 15 y 60 segundos  V$SYSMETRIC_SUMMARY – valores de la última hora (última instantánea) como avg, max,  DBA_HIST_SYSMETRIC_SUMMARY – resúmenes de horas de la semana pasada del grupo System Metrics Long Duraction . CASOS DE ESTUDIO 2 BASES DATOS ORACLE
  • 22. Métodos de predicción, clasificación y agrupamiento CASOS DE ESTUDIO 2 BASES DATOS ORACLE
  • 23. CASOS DE ESTUDIO 3 REGISTROS DE COMPRAS Y VENTAS DE CONTRIBUYENTES Métodos de predicción, clasificación y agrupamiento
  • 24. Knowledge Discovery Data Analytics Big Data Analytics Big Data Datos no estructurados Datos Semiestructurados Business Intelligence Datos estructurados Data Warehouse Data Marts CASOS DE ESTUDIO: ANH - BSISA Sistema de Monitoreo de Anomalias en el cosumo de combustible Tecnologías Tipo de datos Data NO estructurada Estructurada Diferentes tipo de fuentes Fuentes tradicionales Extensos data sets Dataset limitado Dinámico estática Modelamiento de Optimización y predicción reportes Análisis prescriptivos predictivo Análisis descriptivo Preguntas Que anomalías se registraron en el ultimo año
  • 25. Knowledge Discovery Data Analytics Big Data Analytics Big Data Datos no estructurados Datos Semiestructurados Business Intelligence Datos estructurados Data Warehouse Data Marts CASOS DE ESTUDIO: ANH - BSISA SISTEMA DE PREDICCION DE COMPORTAMIENTO DE CONSUMO DE COMBIUSTIBLE EN BOLIVIA + GPS + HISTORICO DE VEHICULO + textos planos Tecnologías Tipo de datos Data NO estructurada Estructurada Diferentes tipo de fuentes Fuentes tradicionales Extensos data sets Dataset limitado Dinámico estática Modelamiento de Optimización y predicción reportes Análisis prescriptivos predictivo Análisis descriptivo Preguntas Que pasara con el consumo de combustibles de vehículos anómalos
  • 26. BI ANH Tecnologías Tipo de datos Data estructurada SISTEMA DE MOMINTOREO DE CONSUMO DE COMBUSTIBLE Fuentes de datos estructurados Extensos data sets No dinámico Modelamiento clasificación Análisis descriptivo Preguntas Cuantos vehículos anómalos existen? Cuantos anomalías por año?
  • 27. Big Data Analytics ANH Tecnologías Tipo de datos Data NO estructurada SISTEMA DE PREDICCION DE COMPORTAMIENTO DE CONSUMO DE COMBIUSTIBLE EN BOLIVIA + GPS + HISTORICO DE VEHICULO + textos planos Diferentes tipo de fuentes Extensos data sets Dinámico Modelamiento de Optimización y predicción Análisis prescriptivos predictivo Preguntas Que pasa si? Que pasara después? Que tendencias puede predecirse? Cuál será el escenario empresarial óptimo?
  • 28. Knowledge Discovery Data Analytics Big Data Analytics Big Data Datos no estructurados Datos Semiestructurados Business Intelligence Datos estructurados Data Warehouse Data Marts Varias soluciones BUSINESS INTELLIGENCE SISTEMA DE DETECCION DE ANOMLIAS MODELAMIENTO DE COMPORTAMIENTO DE CONSUMO DE COMBUSTIBLE
  • 29. Knowledge Discovery Data Analytics Big Data Analytics Big Data Datos no estructurados Datos Semiestructurados Business Intelligence Datos estructurados Data Warehouse Data Marts Varias soluciones BIG DATA ANALYTICS
  • 30. Knowledge Discovery Data Analytics Big Data Analytics Big Data Datos no estructurados Datos Semiestructurados Business Intelligence Datos estructurados Data Warehouse Data Marts CASOS DE ESTUDIO: DB - ORACLE
  • 31. Knowledge Discovery Data Analytics Big Data Analytics Big Data Datos no estructurados Datos Semiestructurados Business Intelligence Datos estructurados Data Warehouse Data Marts CASOS DE ESTUDIO: DECLARACION DE FACTURAS -
  • 32. 1 Identificar una necesidad de exploración de datos 2 Evaluar y/o determinar variables de análisis de datos masivos 3 Definición de propuesta de solución Como saber que tipo de solución es la que requiere mi empresa?
  • 34. Contenido 28/08/2021 Presentación - Introducción BDA-BI-DA Proceso de análisis de datos Data Analytics en Python (introducción ) 50 min 5 min 5 min 50 min 5 min 5 min 50 min 5 min 5 min
  • 35. CICLO DE PROCESO DEL ANALISIS DE DATOS as • Metodología de implementación y análisis de casos Analítica avanzada requiere Toma de decisiones Selección de fuentes de datos Metodologías de análisis Interpretación y comunicación de resultados en todo momento
  • 36. 2 CICLO DE PROCESO DEL ANALISIS DE DATOS • Como se procesa y analiza el big data ? B. Schmarzo, Big Data: Understanding How Data Powers Big Business. Wiley, 2013. No es lineal Reformular Proceso iterativo
  • 37.
  • 38. METODOLOGÍAS Ciclo de vida del análisis de datos Gestión de Datos Analítica de datos Texto Audio Video Redes Sociales Extracción de información Resumen de texto Respuesta a la pregunta Análisis de sentimiento Enfoque basado en transcripción Arquitectura basada en el servidor Analítica basada en contenido Enfoque basado en fonetca Arquitectura basada en el borde Analítica basada en la estructura Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimizacin Simulación Pruebas A/B Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. A. Gandomi and M. Haider, “Beyond the hype: Big Data concepts, methods, and analytics, Int. J. Inf. Manag., vol. 35, no. 2, pp. 137–144, Abril 2015.
  • 39. METODOLOGÍAS Ciclo de vida del análisis de datos Gestión de Datos Texto Audio Video Redes Sociales Extracción de información Resumen de texto Respuesta a la pregunta Análisis de sentimiento Enfoque basado en transcripción Arquitectura basada en el servidor Analítica basada en contenido Enfoque basado en fonetca Arquitectura basada en el borde Analítica basada en la estructura (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis.
  • 40. METODOLOGÍAS Ciclo de vida del análisis de datos Gestión de Datos Texto Audio Video Redes Sociales Extracción de información Resumen de texto Respuesta a la pregunta Análisis de sentimiento Enfoque basado en transcripción Arquitectura basada en el servidor Analítica basada en contenido Enfoque basado en fonetca Arquitectura basada en el borde Analítica basada en la estructura (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis.
  • 41. METODOLOGÍAS Ciclo de vida del análisis de datos Gestión de Datos Texto Audio Video Redes Sociales Extracción de información Resumen de texto Respuesta a la pregunta Análisis de sentimiento Enfoque basado en transcripción Arquitectura basada en el servidor Analítica basada en contenido Enfoque basado en fonetca Arquitectura basada en el borde Analítica basada en la estructura (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis.
  • 42. METODOLOGÍAS Ciclo de vida del análisis de datos Gestión de Datos Texto Audio Video Redes Sociales Extracción de información Resumen de texto Respuesta a la pregunta Análisis de sentimiento Enfoque basado en transcripción Arquitectura basada en el servidor Analítica basada en contenido Enfoque basado en fonetca Arquitectura basada en el borde Analítica basada en la estructura (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis.
  • 43. METODOLOGÍAS Ciclo de vida del análisis de datos Gestión de Datos Texto Audio Video Redes Sociales Extracción de información Resumen de texto Respuesta a la pregunta Análisis de sentimiento Enfoque basado en transcripción Arquitectura basada en el servidor Analítica basada en contenido Enfoque basado en fonetca Arquitectura basada en el borde Analítica basada en la estructura (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis.
  • 44. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimizacin Simulación Pruebas A/B Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. Regresiones espaciales Simulaciones. consumo vs. distancia a centros comerciales desempeño de una cadena de distribución con bodegas en distintos lugares
  • 45. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimizacin Simulación Pruebas A/B Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. • Identificación de líderes de opinión para focalizar campañas de marketing. • Identificar cuellos de botella en flujos de información de una empresa. • Modelamiento de redes de transporte y predicción del tiempo de desplazamiento de un punto a otro.
  • 46. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimizacin Simulación Pruebas A/B Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis.
  • 47. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimizacin Simulación Pruebas A/B Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. • Predicción de fenómenos como crimen, deserción escolar y universitaria, esperanza de vida post-operatoria, ventas. Sugerencias y recomendaciones de productos en función de historial pasado • Procesamiento de lenguaje natural: reconocimiento de voz y lenguaje para interacción humano computador (ej: Siri, Cortana, Alexa), y análisis de sentimientos en textos y redes sociales. • Reconocimiento de patrones: texto manuscrito, procesamiento de imágenes y reconocimiento de caras para buscar sospechosos de crímenes. • Detección de anomalías: detección de fraudes bancarios en base a actividad inusual en compras usando tarjeta decrédito.
  • 48. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimizacin Simulación Pruebas A/B Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. • Indicadores espaciales de nivel de servicios públicos y privados. • Análisis de brechas y crecimiento espacial de la oferta y la demanda de servicios. • Accesibilidad urbana y rural, caracterización de los territorios en diferentes dimensiones geográficas, sociodemográficas, económicas y desarrollo humano.
  • 49. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimización Simulación Pruebas A/B Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. • Localización óptima de recursos en hospitales, escuelas, centros productivos, bodegas. • Producción: programación de maquinarias para la fabricación, manejo de inventarios.
  • 50. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimización Simulación Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. Pronóstico de los resultados financieros de una empresa dado circunstancias de incertidumbre. • Pronóstico del clima.
  • 51. METODOLOGÍAS Ciclo de vida del análisis de datos Analítica de datos Análisis espacial Análisis de redes Machine Learning Inteligencia Territorial Optimización Simulación Visualización analítica de datos (1) adquisición y almacenamiento de los datos (2) limpieza y depuración de los datos (3) la preparación para su análisis. Análisis visual interactivo de componentes principales Infografías. Tableros de mando (Dashboards), para seguimiento
  • 52. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing) •Análisis en tiempo real •Resultados instantáneos de analizados •Operaciones repetitivas •Algoritmos de aprendizaje automático •Analizar datos archivados •Operaciones de hardware básico •Sin análisis de datos apresurados •Procesamiento de datos lineal
  • 53. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing)
  • 54. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing)
  • 55. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing) vega
  • 56. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing)
  • 57. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing)
  • 58. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing)
  • 59. Puntos críticos de analítica de datos • Seleccionar : – Problema correcto – Datos correctos – Fuentes de datos correctas – Muestras correctas – Modelo correcto – Variable correcta – Validación y ajustes correctos – Visualización correcta
  • 60. 1 CICLO DE PROCESO DEL ANALISIS DE DATOS • Metodologías de análisis de datos La metodología de analítica permite: • Establecer una forma probada para llevar un problema a una solución de analítica • Alinear la analítica con la intención estratégica de la organización • Lograr eficiencia en algún aspecto del negocio CRISP-DM Cross Industry Standard Process for Data Mining es un modelo estándar abierto propuesto en 1999 por IBM para proyectos relacionados con minería de datos. Entendimiento de negocio, entendimiento de datos, preparación de datos, modelamiento, evaluación y publicación.
  • 61. 1 CICLO DE PROCESO DEL ANALISIS DE DATOS • Metodologías de análisis de datos ASUM-DM 2015 IBM propuso una versión extendida de CRISP-DM denominada ASUM-DM (Analytics Solutions Unified Method) la cual contiene los mismos pasos de CRISP-DM bajo el nombre de “Ciclo de Elaboración” e introduce un nuevo ciclo denominado “Operacional” nuevas prácticas en la ciencia de datos como el uso de volúmenes de datos muy grandes, la incorporación de análisis de texto, en el modelado predictivo y la automatización de algunos procesos guía paso a paso para efectuar una implementación completa del ciclo de vida de las soluciones de analítica de datos. Contiene pasos estructurados, actividades de desarrollo, roles y responsabilidades, plantillas y directrices
  • 62. IMPORTANCIA DE UTILIZAR METODOLOGIAS  Definir una metodología para hacer ejercicios asociados con la analítica de datos (soluciones de analítica) aporta significativamente al éxito de un proyecto, debido a que los elementos involucrados en el ciclo de vida de los ejercicios de analítica mantienen unas directrices, reglas y lineamientos establecidos para cumplir con un propósito en particular, la metodología de analítica permite establecer un plan de trabajo adecuado. •  La metodología de ASUM DM es la evolución de CRISP DM, y surge como resultado de la compilación y estructuración de una serie de aplicaciones de analítica de negocios e inteligencia de negocios, lo cual, implica una organización/estructuración adecuada de sus fases y sus elementos involucrados.
  • 64. Contenido 05/02/2020 Presentación - Introducción BDA-BI-DA Proceso de análisis de datos Data Analytics en Python (introducción ) 50 min 5 min 5 min 50 min 5 min 5 min 50 min 5 min 5 min
  • 65. Servicios tecnológicos Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten gestionar y analizar los datos Servicio Nuevos frameworks analíticos Almacén de datos y Lagos de datos (Data warehouse & Data lakes) Base de datos relacional y no Visualización de datos Herramientas/Plugins estadísticos Sistema de información geográfica Servicios en la nube (Cloud Computing)

Notas del editor

  1. Empresa -> genera datos Análisis Descriptivo: describe lo que ha pasado con estadísticas, gráficos, tablas e informes. Análisis Predictivo: realiza predicciones que van a ser útiles en el futuro. La calidad de la predicción es lo más importante Análisis Prescriptivo: ayuda a entender qué tenemos que hacer para obtener los resultados que queramos en el futuro Datos estructurados tienen bien definido su longitud y su formato, tablas hojas de calculo Datos no estructurados datos tal cual fueron recolesctados, carecen de un formato especifico > no se pueden almacenas dentro de una tabla > pdf, email, docs, Datos semiestructurados no se limitan a campos determinados, pero contienen marcadores para separar diferentes elementos. HTML, XML
  2. Emmpresa -> genera datos Un CRM (Customer Relationship Manager) es un sistema que permite gestionar clientes (INGRESOS) mientras que un ERP gestiona procesos(COSTOS). Un CRM es por lo tanto una herramienta imprescindible para la venta, el marketing y la atención al cliente mientras que un ERP (Enterprise Resource Planning) lo es para la producción.
  3. Empresa -> genera datos 4V VALOR estadístico- eventos – correlaciones - hipoteticos VARIEDAD estructurados- no estructurados – probabilístico VERACIDAD autenticado – origen – disponibilidad - verdadero VELOCIDAD procesos en batch – real time – streaming VOLUMEN terabytes – registros/ archivos – transaccions – tables archivos
  4. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  5. Big Data: Se sabe que los macrodatos son los volúmenes masivos de datos que no se pueden procesar correctamente con las técnicas tradicionales. El procesamiento de Big Data comienza con datos brutos no agregados y realmente no es posible almacenarlo en la memoria de una sola computadora. Diariamente, Big Data inunda las empresas utilizando una palabra de moda para describir grandes volúmenes de datos estructurados y no estructurados. Es algo que se utiliza para analizar conocimientos que ayudan a mejorar la toma de decisiones y los movimientos comerciales que se planifican estratégicamente. Ciencia de los datos: Este es un campo que comprende todo lo que tiene que ver con la preparación, limpieza y análisis, que trata tanto con datos estructurados como no estructurados. La ciencia de datos combina matemáticas, estadísticas, captura de datos de manera inteligente, programación, resolución de problemas, limpieza de datos, saber cómo mirar las cosas desde una vista diferente, preparar y alinear los datos. Análisis de datos: Esto implica la aplicación de procesos algorítmicos o mecánicos para obtener conocimientos. Por ejemplo, buscar correlaciones razonables entre conjuntos de datos ejecutando un cierto número de ellos. Varias industrias utilizan el análisis de datos para permitirles tomar mejores decisiones y verificar y refutar modelos y teorías existentes. El análisis de datos se centra principalmente en la inferencia, que es el acto de deducir conclusiones que dependen principalmente del conocimiento del investigador.
  6. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  7. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  8. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  9. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  10. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  11. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  12. Emmpresa -> genera datos
  13. Emmpresa -> genera datos
  14. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  15. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  16. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  17. -Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos. -Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.  -Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery. -Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos. -Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence. El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel. También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.  Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.  En los informes basados ​​en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos. 
  18. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  19. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  20. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  21. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  22. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  23. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  24. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  25. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  26. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  27. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  28. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  29. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  30. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  31. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  32. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  33. Apache Spark es un marco que le permitirá analizar datos de inmediato y principalmente realiza cálculos en memoria. RDD elementos que es tolerante a fallos y que es capaz de operar en paralelo. 
  34. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  35. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  36. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  37. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  38. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  39. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  40. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  41. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
  42. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa