3. • MSc. Ing. Vanessa Adriana Gironda Aquize
---------------------------------------
UPE - Maestría en Enghenaria de Sistemas – Mención en
Inteligencia Artificial y Machine Learning
UPE - Especialización en Ciencia de los Datos
---------------------------------------
ANH - Sistema de Rastreo Satelital
- Sistema de Viodeovigilancia en Red
- B-SISA
NEAN – Emprendimiento de servicios de soporte de red
EMI - Investigación y Docencia
SIN - DBA
- Investigación sistemas de detección de anomalías
- Procesamiento de Datos
- Implementación de Big Data ( infraestructura –lógica)
- Implementación de K8S para despliegue de microservicios
5. Contenido
UNIDAD TEMÁTICA DETALLE
CICLO DEL PROCESO DE ANÁLISIS
DE DATOS.
Metodologías de análisis de datos
Metodología de implementación y análisis de casos
Definición tecnológica de la arquitectura, modelamiento dimensional y procesos ETL
DIFERENTES TIPOS DE DATOS. Gobierno de datos
Tipos de datos por categoría (Datos estructurados, no estructurados, Lenguaje Natural, Datos Generados por
maquinas, Datos gráficos, Audio, Video e imagen)
Tipos de datos por origen
Tipos de datos en BIGDATA
PREPARACIÓN DE DATOS Procesamiento de datos: Preparación de datos
Procesamiento de datos: Reducción de datos
TIPS SOBRE EL TRATAMIENTO DE
DATOS.
Aplicaciones de business analytics con herramientas informáticas
GARBACE IN GARBACE OUT Definición
Como preparar la data para evitar GIGO
CALIDAD EN LOS DATOS. Definición
Dificultades para controlar la calidad de datos
Dimensión de la calidad de datos
Base de datos y calidad de datos
PARADIGMAS DE PROCESAMIENTO Arquitecturas y tecnologías aplicadas
10. DIPLOMADO
Big Data, Analytics y Business
Intelligence
Piensa que crees que aprenderás en el diplomado. (3 minutos)
Expectativas.
11. Toda empresa
que genera
datos debe medir
el valor del
negocio
Como se mide el
valor del negocio?
BIG DATA ANALYTICS – BUSINESS
INTELLIGENCE
Otris (2019)
12. Big Data Analytics BI?
Tecnologías
Tipo de datos
Data NO estructurada
Diferentes tipo de
fuentes
Extensos data sets
Dinámico
Modelamiento de
Optimización y
predicción
Análisis
prescriptivos
predictivo
Preguntas Que pasa si?
Que pasara después?
Que tendencias puede
predecirse?
Cuál será el escenario
empresarial óptimo?
TECNNOLOGIAS BIG DATA ANALYTICS – BUSINESS
INTELLIGENCE
13. 3ra dimensión!!
Cantidad y/o tamaño de data
BIG DATA ANALYTICS – BUSINESS
INTELLIGENCE
Nace la necesidad de contemplar tecnologías para
procesar grandes cantidades de datos (5 V)
14. Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
DIFERENCIAS DE ELEMENTOS DEL CONJUNTO DE
CONCEPTOS DEL ANALISIS DE DATOS MASIVOS
15. Definición tecnológica de la arquitectura,
modelamiento dimensional y procesos ETL
Sistema de Data Warehousing / Business
Intelligence (DW / BI)
16. común -> permiten el análisis de
datos con el objetivo de extraer la
mayor información posible
común ->Principio de aprovechar
de la mejor manera la información
para poder tomar mejores
decisiones
17. Ciencia de los Datos Análisis de Datos
• Preparación, limpieza y análisis
• Datos estructurados y no
• Combina matemáticas, estadísticas,
combinación de varias técnicas
que se utilizan al intentar obtener
información y conocimientos de
los datos
• Aplicación de procesos algorítmicos
o mecánicos para obtener
conocimientos
• Debe tomar mejores decisiones y
verificar y refutar modelos y teorías
existentes.
• Se centra principalmente en la
inferencia
20. CASOS DE ESTUDIO 2 BASES DATOS
ORACLE
La información del rendimiento del sistema propio a la base de
datos es un recurso importante que todo DBA debe considerar al
momento de monitorear la BD.
21. Estas diferentes métricas reflejan el rendimiento del servidor a través de:
• deltas (diferencia de valores de métricas en dos diferentes tiempos)
• tasas (deltas / tiempo transcurrido)
En Oracle 10g se introdujo tablas métricas que calculaban estas deltas y tasas estadísticas, lo que
simplifica enormemente el análisis del rendimiento de la base.
V$SYSMETRIC – últimos 15 y 60 segundos
V$SYSMETRIC_SUMMARY – valores de la última hora (última instantánea) como avg, max,
DBA_HIST_SYSMETRIC_SUMMARY – resúmenes de horas de la semana pasada del grupo
System Metrics Long Duraction .
CASOS DE ESTUDIO 2 BASES DATOS
ORACLE
22. Métodos de predicción, clasificación y agrupamiento
CASOS DE ESTUDIO 2 BASES DATOS
ORACLE
23. CASOS DE ESTUDIO 3 REGISTROS DE
COMPRAS Y VENTAS DE CONTRIBUYENTES
Métodos de predicción, clasificación y agrupamiento
24. Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: ANH - BSISA
Sistema de Monitoreo de
Anomalias en el cosumo de
combustible
Tecnologías
Tipo de datos
Data NO estructurada Estructurada
Diferentes tipo de
fuentes
Fuentes tradicionales
Extensos data sets Dataset limitado
Dinámico estática
Modelamiento de
Optimización y
predicción
reportes
Análisis
prescriptivos
predictivo
Análisis descriptivo
Preguntas Que anomalías se
registraron en el
ultimo año
25. Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: ANH - BSISA
SISTEMA DE PREDICCION DE
COMPORTAMIENTO DE
CONSUMO DE COMBIUSTIBLE
EN BOLIVIA
+ GPS + HISTORICO DE
VEHICULO
+ textos planos
Tecnologías
Tipo de
datos
Data NO estructurada Estructurada
Diferentes tipo de
fuentes
Fuentes tradicionales
Extensos data sets Dataset limitado
Dinámico estática
Modelamiento de
Optimización y
predicción
reportes
Análisis
prescriptivos predictivo
Análisis descriptivo
Preguntas Que pasara con el
consumo de
combustibles de
vehículos anómalos
26. BI ANH
Tecnologías
Tipo de datos
Data estructurada
SISTEMA DE
MOMINTOREO DE
CONSUMO DE
COMBUSTIBLE
Fuentes de datos
estructurados
Extensos data sets
No dinámico
Modelamiento
clasificación
Análisis descriptivo
Preguntas Cuantos vehículos
anómalos existen?
Cuantos anomalías por
año?
27. Big Data Analytics ANH
Tecnologías
Tipo de datos
Data NO estructurada
SISTEMA DE
PREDICCION DE
COMPORTAMIENTO DE
CONSUMO DE
COMBIUSTIBLE EN
BOLIVIA
+ GPS + HISTORICO DE
VEHICULO
+ textos planos
Diferentes tipo de
fuentes
Extensos data sets
Dinámico
Modelamiento de
Optimización y
predicción
Análisis prescriptivos
predictivo
Preguntas Que pasa si?
Que pasara después?
Que tendencias puede
predecirse?
Cuál será el escenario
empresarial óptimo?
28. Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
Varias soluciones BUSINESS INTELLIGENCE
SISTEMA DE DETECCION
DE ANOMLIAS
MODELAMIENTO DE
COMPORTAMIENTO DE
CONSUMO DE
COMBUSTIBLE
29. Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
Varias soluciones BIG DATA ANALYTICS
30. Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: DB - ORACLE
31. Knowledge Discovery
Data Analytics
Big Data Analytics
Big Data
Datos no estructurados
Datos Semiestructurados
Business Intelligence
Datos estructurados
Data Warehouse
Data Marts
CASOS DE ESTUDIO: DECLARACION DE
FACTURAS -
32. 1 Identificar una necesidad de
exploración de datos
2 Evaluar y/o determinar variables de
análisis de datos masivos
3 Definición de propuesta de solución
Como saber que tipo de solución es la que requiere mi empresa?
35. CICLO DE PROCESO DEL ANALISIS DE
DATOS
as
• Metodología de implementación y análisis de casos
Analítica
avanzada
requiere
Toma de
decisiones
Selección de
fuentes de
datos
Metodologías
de análisis
Interpretación y
comunicación de
resultados
en todo momento
36. 2
CICLO DE PROCESO DEL ANALISIS DE
DATOS
• Como se procesa y analiza el big data ?
B. Schmarzo, Big Data: Understanding How Data Powers Big Business. Wiley, 2013.
No es lineal
Reformular
Proceso
iterativo
37.
38. METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos Analítica de datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
A. Gandomi and M. Haider, “Beyond the hype: Big Data concepts, methods, and analytics,
Int. J. Inf. Manag., vol. 35, no. 2, pp. 137–144, Abril 2015.
39. METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
40. METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
41. METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
42. METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
43. METODOLOGÍAS
Ciclo de vida del análisis de datos
Gestión de Datos
Texto Audio
Video Redes Sociales
Extracción de información
Resumen de texto
Respuesta a la pregunta
Análisis de sentimiento
Enfoque basado en
transcripción
Arquitectura basada en el
servidor
Analítica basada en
contenido
Enfoque basado en
fonetca
Arquitectura basada en el
borde
Analítica basada en la
estructura
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
44. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
Regresiones espaciales
Simulaciones.
consumo vs. distancia a
centros comerciales
desempeño de
una cadena de distribución con
bodegas en distintos lugares
45. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Identificación de líderes de opinión para focalizar campañas de
marketing.
• Identificar cuellos de botella en flujos de información de una
empresa.
• Modelamiento de redes de transporte y predicción del tiempo de
desplazamiento de un punto a otro.
46. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
47. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Predicción de fenómenos como crimen, deserción escolar y universitaria, esperanza de
vida post-operatoria, ventas. Sugerencias y recomendaciones de productos en función
de historial pasado
• Procesamiento de lenguaje natural: reconocimiento de voz y lenguaje para interacción
humano computador (ej: Siri, Cortana, Alexa), y análisis de sentimientos en textos y
redes sociales.
• Reconocimiento de patrones: texto manuscrito, procesamiento de imágenes y
reconocimiento de caras para buscar sospechosos de crímenes.
• Detección de anomalías: detección de fraudes bancarios en base a actividad inusual en
compras usando tarjeta decrédito.
48. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimizacin
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Indicadores espaciales de nivel de servicios públicos y privados.
• Análisis de brechas y crecimiento espacial de la oferta y la demanda de
servicios.
• Accesibilidad urbana y rural, caracterización de los territorios en diferentes
dimensiones geográficas, sociodemográficas, económicas y desarrollo
humano.
49. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimización
Simulación
Pruebas A/B
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
• Localización óptima de
recursos en hospitales,
escuelas, centros productivos,
bodegas.
• Producción: programación de
maquinarias para la
fabricación, manejo de
inventarios.
50. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimización Simulación
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
Pronóstico de los
resultados
financieros de una
empresa
dado circunstancias de
incertidumbre.
• Pronóstico del clima.
51. METODOLOGÍAS
Ciclo de vida del análisis de datos
Analítica de datos
Análisis
espacial
Análisis de
redes
Machine
Learning
Inteligencia
Territorial
Optimización Simulación
Visualización
analítica de
datos
(1) adquisición y almacenamiento de los datos
(2) limpieza y depuración de los datos
(3) la preparación para su análisis.
Análisis visual interactivo de
componentes principales
Infografías.
Tableros de mando
(Dashboards), para
seguimiento
52. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
•Análisis en tiempo real
•Resultados instantáneos de
analizados
•Operaciones repetitivas
•Algoritmos de aprendizaje
automático
•Analizar datos archivados
•Operaciones de hardware
básico
•Sin análisis de datos
apresurados
•Procesamiento de datos
lineal
53. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
54. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
55. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
vega
56. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
57. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
58. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de
datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins
estadísticos
Sistema de información
geográfica
Servicios en la nube (Cloud
Computing)
59. Puntos críticos de analítica de datos
• Seleccionar :
– Problema correcto
– Datos correctos
– Fuentes de datos correctas
– Muestras correctas
– Modelo correcto
– Variable correcta
– Validación y ajustes correctos
– Visualización correcta
60. 1
CICLO DE PROCESO DEL ANALISIS DE
DATOS
• Metodologías de análisis de datos
La metodología de analítica permite:
• Establecer una forma probada para llevar un problema a una solución de
analítica
• Alinear la analítica con la intención estratégica de la organización
• Lograr eficiencia en algún aspecto del negocio
CRISP-DM
Cross Industry Standard Process for Data
Mining es un modelo estándar abierto
propuesto en 1999 por IBM para proyectos
relacionados con minería de datos.
Entendimiento de negocio, entendimiento de datos,
preparación de datos, modelamiento, evaluación y
publicación.
61. 1
CICLO DE PROCESO DEL ANALISIS DE
DATOS
• Metodologías de análisis de datos
ASUM-DM
2015 IBM propuso una versión extendida de CRISP-DM
denominada ASUM-DM (Analytics Solutions Unified
Method) la cual contiene los mismos pasos de CRISP-DM
bajo el nombre de “Ciclo de Elaboración” e introduce un
nuevo ciclo denominado “Operacional”
nuevas prácticas en la ciencia de datos como el uso de
volúmenes de datos muy grandes, la incorporación de
análisis de texto, en el modelado predictivo y la
automatización de algunos procesos
guía paso a paso para efectuar una implementación completa del
ciclo de vida de las soluciones de analítica de datos.
Contiene pasos estructurados, actividades de desarrollo, roles y responsabilidades, plantillas y
directrices
62. IMPORTANCIA DE UTILIZAR METODOLOGIAS
Definir una metodología para hacer ejercicios asociados con la analítica de
datos (soluciones de analítica) aporta significativamente al éxito de un
proyecto, debido a que los elementos involucrados en el ciclo de vida de los
ejercicios de analítica mantienen unas directrices, reglas y lineamientos
establecidos para cumplir con un propósito en particular, la metodología de
analítica permite establecer un plan de trabajo adecuado.
•
La metodología de ASUM DM es la evolución de CRISP DM, y surge como
resultado de la compilación y estructuración de una serie de aplicaciones de
analítica de negocios e inteligencia de negocios, lo cual, implica una
organización/estructuración adecuada de sus fases y sus elementos
involucrados.
65. Servicios tecnológicos
Finalmente hay productos y servicios tecnológicos (y muchas veces, software) que permiten
gestionar y analizar los datos
Servicio
Nuevos frameworks analíticos
Almacén de datos y Lagos de datos
(Data warehouse & Data lakes)
Base de datos relacional y no
Visualización de datos
Herramientas/Plugins estadísticos
Sistema de información geográfica
Servicios en la nube (Cloud
Computing)
Empresa -> genera datos
Análisis Descriptivo: describe lo que ha pasado con estadísticas, gráficos, tablas e informes.
Análisis Predictivo: realiza predicciones que van a ser útiles en el futuro. La calidad de la predicción es lo más importante
Análisis Prescriptivo: ayuda a entender qué tenemos que hacer para obtener los resultados que queramos en el futuro
Datos estructurados tienen bien definido su longitud y su formato, tablas hojas de calculo
Datos no estructurados datos tal cual fueron recolesctados, carecen de un formato especifico > no se pueden almacenas dentro de una tabla > pdf, email, docs,
Datos semiestructurados no se limitan a campos determinados, pero contienen marcadores para separar diferentes elementos. HTML, XML
Emmpresa -> genera datos
Un CRM (Customer Relationship Manager) es un sistema que permite gestionar clientes (INGRESOS) mientras que un ERP gestiona procesos(COSTOS). Un CRM es por lo tanto una herramienta imprescindible para la venta, el marketing y la atención al cliente mientras que un ERP (Enterprise Resource Planning) lo es para la producción.
Empresa -> genera datos
4V
VALOR estadístico- eventos – correlaciones - hipoteticos
VARIEDAD estructurados- no estructurados – probabilístico
VERACIDAD autenticado – origen – disponibilidad - verdadero
VELOCIDAD procesos en batch – real time – streaming
VOLUMEN terabytes – registros/ archivos – transaccions – tables archivos
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
Big Data:
Se sabe que los macrodatos son los volúmenes masivos de datos que no se pueden procesar correctamente con las técnicas tradicionales. El procesamiento de Big Data comienza con datos brutos no agregados y realmente no es posible almacenarlo en la memoria de una sola computadora. Diariamente, Big Data inunda las empresas utilizando una palabra de moda para describir grandes volúmenes de datos estructurados y no estructurados. Es algo que se utiliza para analizar conocimientos que ayudan a mejorar la toma de decisiones y los movimientos comerciales que se planifican estratégicamente.
Ciencia de los datos:
Este es un campo que comprende todo lo que tiene que ver con la preparación, limpieza y análisis, que trata tanto con datos estructurados como no estructurados. La ciencia de datos combina matemáticas, estadísticas, captura de datos de manera inteligente, programación, resolución de problemas, limpieza de datos, saber cómo mirar las cosas desde una vista diferente, preparar y alinear los datos.
Análisis de datos:
Esto implica la aplicación de procesos algorítmicos o mecánicos para obtener conocimientos. Por ejemplo, buscar correlaciones razonables entre conjuntos de datos ejecutando un cierto número de ellos. Varias industrias utilizan el análisis de datos para permitirles tomar mejores decisiones y verificar y refutar modelos y teorías existentes.
El análisis de datos se centra principalmente en la inferencia, que es el acto de deducir conclusiones que dependen principalmente del conocimiento del investigador.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
Emmpresa -> genera datos
Emmpresa -> genera datos
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
-Filosofías nuevas y emergentes en el campo de los sistemas de información, dan a relucir diferentes conceptos.
-Basándonos en la revisión de la literatura, se presenta la figura presente para diferenciar elementos del conjunto de conceptos vagos relacionados con el análisis de datos masivos.
-Los conceptos enfocados en este marco son: Business Intelligence, Big Data, Data Analytics y Knowledge Discovery.
-Vemos el Descubrimiento del Conocimiento como el concepto más alto, que además de otros métodos incluye el Análisis de Datos para descubrir o producir nuevos conocimientos.
-Más adelante, vemos el análisis de datos como una entidad más grande que abarca varias disciplinas, incluidas Big Data Analytics y Business Intelligence.
El concepto de Big Data generalmente se considera parte de Big Data Analytics. Teniendo en cuenta la intención, el propósito y las filosofías comerciales subyacentes, vemos Big Data Analytics y Business Intelligence al mismo nivel.
También vemos un enfoque de datos como la principal diferencia entre BI y Big Data.
Big Data abarca datos no estructurados, semiestructurados y estructurados, sin embargo, el enfoque principal está en los datos no estructurados, mientras que el enfoque de BI está en los datos estructurados.
En los informes basados en el sistema de BI, existe el requisito de tener datos maestros y transaccionales estructurados. Por ejemplo, para usar o analizar los datos de transacciones de ventas de manera significativa y comprensible, debemos tener datos maestros que describan las propiedades de las ventas (como la tienda, la ubicación o las descripciones de los productos). El concepto de Big Data no está sujeto a esos requisitos.
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
Apache Spark es un marco que le permitirá analizar datos de inmediato y principalmente realiza cálculos en memoria.
RDD elementos que es tolerante a fallos y que es capaz de operar en paralelo.
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa
El uso de datos masivos y sus técnicas analíticas para el diseño e implementación requieren de un a metodología para conseguir resultados favorables a fin de velar por mejorar la competitividad de la empresa