SlideShare una empresa de Scribd logo
ACTIVIDAD #4
1. https://www.youtube.com/watch?v=WgAakVRAAwM
¿Qué es big data?
R/es la gran cantidad de datos a gran escala almacenados para encontrar
patrones repetitivos.
2. ¿Big data y minería de datos son los mismo?
R/ no son lo mismo debido a que big data es la cultivación de datos esto
quiere decir que en vez de acabaros se van agrandando su volumen;
minería de datos se refiere a la extracción de datos.
3. ¿en qué consiste las 4 dimensiones del big data o las 4v?
R/ las cuatro dimensiones del big data fueron formuladas por Máquense en
el año 2006 y lego reformadas por IBM en el 2012:
V= volumen (grandes cantidades de datos)
V= velocidad (lo rápido con que aparecen nuevos datos)
V= variedad (los múltiples formatos de donde salen los datos)
V= veracidad (este término se refiere que uno debe desconfiar a veces de
los datos que obtiene solo se creerá si tiene algo comprobado o viene de
una fuente confiable)
4. Malte Spitz, que detecto cuando solicito información de su empresa
telefónica.
R/ el descubrió que en un periodo de 5 meses habían rastreados todas sus
coordenadas geográficas; 35000 veces, en estas coordenadas se pudo dar
cuenta que registraban a la hora que salía de casa, de donde a donde se
movilizaba, cuanto tiempo duraba en un lugar, a quien llamaba y que
cantidad de datos gastaba.
5. ¿considera que la iniciativa Open Data puede ayudar al desarrollo de
Colombia?
R/ si puede ayudar ya que si los desarrolladores y empresarios pueden
tener acceso a los datos que el gobierno tiene tendrán la capacidad de
ayudar a otras personas; y puede ayudar al progreso tanto económico
como personal y social.
6. ¿hay oportunidad de ejercer, al especializarse en gestión de la información?
R/ si ya que como hemos visto los datos van creciendo día a día con mayor
rigurosidad va naciendo la necesidad de sabes gestionar y darle función a
aquellos datos de la información
7. ¿Consulte y describa cada paso del ciclo de la vida de un sistema de
inteligencia de negocios?
R/ ciclo de la vida
1. Requisitos de negocios: se debe especificar de forma clara y precisa las
funciones que se esperan de la bodega de datos; teniendo en cuenta las
expectativas de los usuarios, tanto a nivel operativo como gerencial y del
mismo administrador de base de datos, identificar las temáticas, objetivos
de área, dimensiones, etc.
2. Modelado dimensional: en esta etapa hay que pasar de un modelado
relacional de datos a un modelado dimensional. Para determinar los
campos se deben considerar los siguientes ítems:
 Tabla de dimensiones
o Debe contener una clave simple no relacionada con la llave del
negocio, normalmente se refiere a llaves auto numéricas. o Sus
campos deben ser descriptores que complementen la
información y representan los niveles de agregación. o Debe
incluir las claves del negocio. o Siempre debe existir una
dimensión temporal.
o Deben ser claras y explicitas ya que representan la interfaz que
tendrán los usuarios para navegar por la información.
o No se debe escatimar en cuanto al número de atributos para la
tabla de dimensiones, ya que el número de registros que
contendrá es mínimo respecto al de la tabla de hechos.
o Las dimensiones de fechas pueden tener diversas formas de
representarse.
o El número de dimensiones depende del modelo dimensional
adoptado, pero si se encuentra un número muy elevado puede
ser que algunas no son independientes y deberían agruparse.
o En algunos casos se requiere normalizar las dimensiones,
generándose un modelo copo de nieve.
o Deberían ayudar a responder las siguientes preguntas: ¿qué?,
¿quién?, ¿por qué?, ¿dónde? y ¿cuándo?
 Tabla de Hechos
o Debe contener una clave propia, independiente de las claves
de negocio.
o Los campos representan las métricas, por lo tanto son
numéricos y aditivos (no se almacenan valores individuales,
solo totales y subtotales)
o Contiene los campos de referencia hacia las tablas de
dimensiones.
o Cada fila corresponde a una medida
o Si se requiere calcular porcentajes y proporciones deben
almacenarse el numerador y el denominador.
o No tienen valores nulos.
o Existen algunas tablas sin hechos (FactLess) que se utilizan
para relacionar las dimensiones y deben contener un campo de
hecho ficticio con valor por defecto igual a uno (1).
3. Diseño y desarrollo de procesos ETL
E (EXTRACTION) T(TRANSFORMATION) L (LOAD)
Extracción Limpieza Integración
Transformación Actualización
Como se observa en la gráfica el proceso ETL recoge información de
diferentes fuentes, transforma los datos convirtiendo en datos de calidad y
veracidad por ultimo carga, actualiza en la DW. El proceso extracción,
transformación y carga está compuesto por las siguientes etapas:
a) Extracción: Este proceso obtiene los datos físicamente de las
distintas fuentes de información utilizando técnicas y herramientas
ETL, para la selección del método es necesario tener en cuenta
algunas problemáticas de la extracción de datos como lo son el tipo
de plataforma, protocolos, juego de caracteres, tipos de datos, etc.
b) Limpieza: Al recuperar los datos en bruto, se requiere comprobar la
calidad de los mismos y corregir errores relacionados con campos
nulos, duplicados, inconsistencias en los datos, etc.
 Etapas de la limpieza de datos:
 Depurar los valores: Se pueden separar los datos de acuerdo
con la estructura de destino de los datos o la regla definida
para esto.
 .Corregir: A partir de fuentes de datos externas se puede
verificar la información existente.
 Estandarizar: A partir de formatos definidos por las reglas de
negocio, se sustituyen valores en los campos de datos.
 Relacionar: Verifica en otras fuentes la existencia de datos
relacionados, para evitar duplicados.
 Consolidar: A partir de la identificación de relaciones entre
registros, se llevan a una sola representación.
a) Transformación: Una vez que los datos se encuentran “limpios”, se
transforman de acuerdo con las reglas de negocio y las características de
las herramientas a utilizar.
b) Integración: En este proceso se realiza la carga de los datos y debe
validarse que los datos cargados en la bodega de datos son consistentes
con los que se encontraban en el medio transaccional.
c) Actualización: Este proceso es en el cual se determina la periodicidad con
la cual se van a añadir y sincronizar los nuevos datos a la Bodega de Datos
4. Diseño y construcción de cubos: Un cubo representa un subconjunto de
datos de la bodega almacenado en una estructura multidimensional. Para
proceder a la implementación de los cubos es necesario determinar el tipo
de cubo y la herramienta que se utilizará para ello. La construcción física de
las tablas de dimensiones y las tablas de hechos se realizan de acuerdo
con el modelo dimensional definido y la herramienta a utilizar, se ejecutan
los procesos ETL para poblar las tablas y se genera el cubo para obtener
las respuestas a los requerimientos definidos. Posteriormente se procede a
visualizar la información del cubo.
Opciones de almacenamiento:
Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional On-
Line Analytical Processing) almacenando en una base de datos
multidimensional tanto los datos como las agregaciones.
Capacidad:
ROLAP: los datos de los hipercubos así como las agregaciones se
encuentran dentro de una base de datos relacional
HOLAP: los datos se encuentran en una estructura relacional y los
agregados en una estructura multidimensional.
DOLAP: Los datos se encuentran en una base de datos multidimensional
almacenada en un equipo Cliente.
Detalles
5. Implementación de la Interfaz de usuario: Una vez que han sido construidos
los cubos se deben establecer las herramientas que permitirán la
visualización de la información, para lo cual se cuenta con diversidad de
posibilidades tales como:
Herramientas para la realización de informes, en las cuales participan
desarrolladores, quienes construyen de acuerdo con requerimientos
cambiantes de los usuarios, los informes que van siendo solicitados.
Herramientas OLAP, que proporcionan a partir de los SMBD aplicaciones
que permiten visualizar los datos desde diferentes contextos: informes,
graficas, estadísticas etc.
Vistas
de
Usuario
Aplicaciones de DashBoard, permitiendo la visualización sincrónica de
indicadores, referidos a objetivos o metas procedimentales.
Sistemas DSS, donde se permite utilizar diferentes niveles de análisis a la
información a partir de aplicaciones definidas para ello.
6. Plan de mantenimiento: Debido a la naturaleza dinámica de algunos datos,
es necesario establecer un plan de acción para considerar los ajustes o
reconstrucción de algunos de los objetos de la Bodega de datos. La
siguiente lista proporciona algunos de los elementos a considerar en el plan
de mantenimiento.
Modificación de datos de origen de las dimensiones. En este caso debe
analizarse si el cambio se asume para toda la historia del dato (p.e. cambia
la fecha de nacimiento del cliente) o si debe generarse un nuevo ciclo a
partir de la modificación del mismo (p.e. una sucursal cambia de
responsable).
Rendimiento. Se debe considerar el espacio ocupado en la bodega de
datos, por esto es posible que se haga necesario modificar las estructuras
de las tablas para aliviar el tamaño de los objetos en la bodega.
Subutilización de Tablas Agregadas. Aun cuando estas tablas
proporcionan una mejora en el rendimiento de las consultas es necesario
asegurarse que la herramienta BI que se está utilizando sea capaz de
aprovecharlas, de lo contrario los costes de mantenimiento y actualización
permanente de estas tablas solo harían más complejo el sistema.
7. Pruebas e implementación: En esta etapa se evalúa el modelo, partiendo
de los criterios de éxito que se establecieron en la primera etapa. El
proceso debe ser revisado a partir de los resultados obtenidos para
determinar si es necesario repetir alguna de las etapas anteriores.
Se evalúa el modelo respecto a los objetivos planteados y si no existen
restricciones de tiempo se prueba con un problema real, también debe
evaluarse respecto a objetivos diferentes a los inicialmente planteados.

Más contenido relacionado

La actualidad más candente

Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3
CarlosTenelema1
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
CarlosTenelema1
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
CarlosTenelema1
 
Creacion de data mart
Creacion de data martCreacion de data mart
Creacion de data mart
Julio Miron Carrillo
 
U3 foro semana 14
U3 foro   semana 14U3 foro   semana 14
U3 foro semana 14
Jhime Robin Anton Solano
 
Arquitectura de datos empresariales informe power bi sql
Arquitectura de datos empresariales   informe power bi sqlArquitectura de datos empresariales   informe power bi sql
Arquitectura de datos empresariales informe power bi sql
CarlosTenelema1
 
38481889 lab-dwh-sql2005
38481889 lab-dwh-sql200538481889 lab-dwh-sql2005
38481889 lab-dwh-sql2005
cristhian
 
Diapositivas bd
Diapositivas bdDiapositivas bd
Diapositivas bd
decimogrado12
 
Fer 2 foro
Fer 2 foroFer 2 foro
Fer 2 foro
fernandalopez1989
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
thuspes10
 
Arquitectura de datos empresariales análisis de una base de datos
Arquitectura de datos empresariales   análisis de una base de datosArquitectura de datos empresariales   análisis de una base de datos
Arquitectura de datos empresariales análisis de una base de datos
CarlosTenelema1
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
thuspes10
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
mf_0529
 
01 introduccion (1)my sql
01 introduccion (1)my sql01 introduccion (1)my sql
01 introduccion (1)my sql
Marina de Pendragón
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Titiushko Jazz
 

La actualidad más candente (15)

Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
 
Creacion de data mart
Creacion de data martCreacion de data mart
Creacion de data mart
 
U3 foro semana 14
U3 foro   semana 14U3 foro   semana 14
U3 foro semana 14
 
Arquitectura de datos empresariales informe power bi sql
Arquitectura de datos empresariales   informe power bi sqlArquitectura de datos empresariales   informe power bi sql
Arquitectura de datos empresariales informe power bi sql
 
38481889 lab-dwh-sql2005
38481889 lab-dwh-sql200538481889 lab-dwh-sql2005
38481889 lab-dwh-sql2005
 
Diapositivas bd
Diapositivas bdDiapositivas bd
Diapositivas bd
 
Fer 2 foro
Fer 2 foroFer 2 foro
Fer 2 foro
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
 
Arquitectura de datos empresariales análisis de una base de datos
Arquitectura de datos empresariales   análisis de una base de datosArquitectura de datos empresariales   análisis de una base de datos
Arquitectura de datos empresariales análisis de una base de datos
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
 
01 introduccion (1)my sql
01 introduccion (1)my sql01 introduccion (1)my sql
01 introduccion (1)my sql
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 

Destacado

Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologia
luisa ortiz
 
Jose barrera actividad1_2mapac
Jose barrera actividad1_2mapacJose barrera actividad1_2mapac
Jose barrera actividad1_2mapac
josealejobar
 
Thalaathatul Usool
Thalaathatul UsoolThalaathatul Usool
Thalaathatul Usool
robbinshare
 
Animals in quran
Animals in quranAnimals in quran
Animals in quran
robbinshare
 
Elementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de AprendizajeElementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de Aprendizaje
Greici Jiménez Bravo
 
Dog poop bags
Dog poop bagsDog poop bags
Dog poop bags
chasqui usa
 
Actividad 2
Actividad 2Actividad 2
Actividad 2
MARBELLA201613
 
Digital Storytelling
Digital StorytellingDigital Storytelling
Digital Storytelling
Taylor Schneider
 
Presentation 1 (1)
Presentation 1 (1)Presentation 1 (1)
Presentation 1 (1)
Ankit kumar
 
ENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donationENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donation
Muyeed Morshed
 
Экономический анализ
Экономический анализЭкономический анализ
Экономический анализ
Liza Yakubenko
 
Diabetes Breakthrough
Diabetes BreakthroughDiabetes Breakthrough
Diabetes Breakthrough
Nelsonsmile
 
Startup india (1)
Startup india (1)Startup india (1)
Startup india (1)
Ankit kumar
 

Destacado (13)

Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologia
 
Jose barrera actividad1_2mapac
Jose barrera actividad1_2mapacJose barrera actividad1_2mapac
Jose barrera actividad1_2mapac
 
Thalaathatul Usool
Thalaathatul UsoolThalaathatul Usool
Thalaathatul Usool
 
Animals in quran
Animals in quranAnimals in quran
Animals in quran
 
Elementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de AprendizajeElementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de Aprendizaje
 
Dog poop bags
Dog poop bagsDog poop bags
Dog poop bags
 
Actividad 2
Actividad 2Actividad 2
Actividad 2
 
Digital Storytelling
Digital StorytellingDigital Storytelling
Digital Storytelling
 
Presentation 1 (1)
Presentation 1 (1)Presentation 1 (1)
Presentation 1 (1)
 
ENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donationENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donation
 
Экономический анализ
Экономический анализЭкономический анализ
Экономический анализ
 
Diabetes Breakthrough
Diabetes BreakthroughDiabetes Breakthrough
Diabetes Breakthrough
 
Startup india (1)
Startup india (1)Startup india (1)
Startup india (1)
 

Similar a Actividad 4

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
edwin
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Titiushko Jazz
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
Reyes Azael Sarabia Reyes
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
Reyes Azael Sarabia Reyes
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
Reyes Azael Sarabia Reyes
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
Fernando Navarro
 
Ciclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negociosCiclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negocios
Erick Paul Lozada Peñarreta
 
Trabajo ayudantia
Trabajo ayudantiaTrabajo ayudantia
Trabajo ayudantia
Camila Soto Neira
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Titiushko Jazz
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
aldair441257
 
Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
JOSE AHIAS LOPEZ PORTILLO
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
Climanfef
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
expertoleonelmartine
 
Olap vs oltp bases datos 2
Olap vs oltp bases datos 2Olap vs oltp bases datos 2
Olap vs oltp bases datos 2
Velmuz Buzz
 
Analisis services
Analisis servicesAnalisis services
Analisis services
Irene Lorza
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Titiushko Jazz
 
Tema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicosTema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicos
Eric Úsgame González
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
guest10616d
 

Similar a Actividad 4 (20)

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
Ciclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negociosCiclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negocios
 
Trabajo ayudantia
Trabajo ayudantiaTrabajo ayudantia
Trabajo ayudantia
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
 
Olap vs oltp bases datos 2
Olap vs oltp bases datos 2Olap vs oltp bases datos 2
Olap vs oltp bases datos 2
 
Analisis services
Analisis servicesAnalisis services
Analisis services
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Tema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicosTema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicos
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 

Último

SLIDEHARE.docx..........................
SLIDEHARE.docx..........................SLIDEHARE.docx..........................
SLIDEHARE.docx..........................
azulsarase
 
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOSSISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
micoltadaniel2024
 
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdfPRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
fabian28735081
 
Clase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifh
Clase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifhClase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifh
Clase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifh
FrancisJhonatanEnriq1
 
Unidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdfUnidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdf
oagalarraga
 
26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...
26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...
26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...
FlavioMedina10
 
Presentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calorPresentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calor
GerardoBracho3
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
FernandoRodrigoEscal
 
SESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtual
SESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtualSESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtual
SESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtual
JuanGavidia2
 
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptxCARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
0602021003
 
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptxJuzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Folke Claudio Tantahuillca Landeo
 
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdfS01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
Alex809116
 
S09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptx
S09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptxS09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptx
S09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptx
yamilbailonw
 
diagrama de flujo. en el área de ingeniería
diagrama de flujo. en el área de ingenieríadiagrama de flujo. en el área de ingeniería
diagrama de flujo. en el área de ingeniería
karenperalta62
 
Estructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegaciónEstructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegación
AlvaroEduardoConsola1
 
Sistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motorSistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motor
mauriciok961
 
Klohn Crippen Berger _ Brochure LAM .pdf
Klohn Crippen Berger _ Brochure LAM .pdfKlohn Crippen Berger _ Brochure LAM .pdf
Klohn Crippen Berger _ Brochure LAM .pdf
ciniguez1
 
Norma API 1104 Calificación de Procedimiento.ppt
Norma API 1104 Calificación de Procedimiento.pptNorma API 1104 Calificación de Procedimiento.ppt
Norma API 1104 Calificación de Procedimiento.ppt
linapaolac5
 
CURSO FINAL CONMINUCION-CHANCADO Y MOLIENDA
CURSO FINAL CONMINUCION-CHANCADO Y MOLIENDACURSO FINAL CONMINUCION-CHANCADO Y MOLIENDA
CURSO FINAL CONMINUCION-CHANCADO Y MOLIENDA
KruggerCossio1
 
balanceo de linea para los procesos de Producción
balanceo de linea  para los procesos  de Producciónbalanceo de linea  para los procesos  de Producción
balanceo de linea para los procesos de Producción
Victor Manuel Rivera Guevara
 

Último (20)

SLIDEHARE.docx..........................
SLIDEHARE.docx..........................SLIDEHARE.docx..........................
SLIDEHARE.docx..........................
 
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOSSISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
 
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdfPRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
 
Clase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifh
Clase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifhClase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifh
Clase Gas Natural , en piura kdhifheugfjiebfijhebvcihebvifh
 
Unidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdfUnidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdf
 
26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...
26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...
26.-MARZO-SECTOR-MINERO-IDENTIFICACIÓN-DE-PELIGROS-Y-RIESGOS-CON-ENFOQUE-A-P...
 
Presentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calorPresentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calor
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
 
SESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtual
SESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtualSESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtual
SESIÓN 3 ÓXIDOS-HIDRÓXIDOS trabajo virtual
 
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptxCARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
 
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptxJuzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
 
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdfS01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
 
S09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptx
S09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptxS09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptx
S09 PBM-HEMORRAGIAS 2021-I Grabada 1.pptx
 
diagrama de flujo. en el área de ingeniería
diagrama de flujo. en el área de ingenieríadiagrama de flujo. en el área de ingeniería
diagrama de flujo. en el área de ingeniería
 
Estructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegaciónEstructura de un buque, tema de estudios generales de navegación
Estructura de un buque, tema de estudios generales de navegación
 
Sistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motorSistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motor
 
Klohn Crippen Berger _ Brochure LAM .pdf
Klohn Crippen Berger _ Brochure LAM .pdfKlohn Crippen Berger _ Brochure LAM .pdf
Klohn Crippen Berger _ Brochure LAM .pdf
 
Norma API 1104 Calificación de Procedimiento.ppt
Norma API 1104 Calificación de Procedimiento.pptNorma API 1104 Calificación de Procedimiento.ppt
Norma API 1104 Calificación de Procedimiento.ppt
 
CURSO FINAL CONMINUCION-CHANCADO Y MOLIENDA
CURSO FINAL CONMINUCION-CHANCADO Y MOLIENDACURSO FINAL CONMINUCION-CHANCADO Y MOLIENDA
CURSO FINAL CONMINUCION-CHANCADO Y MOLIENDA
 
balanceo de linea para los procesos de Producción
balanceo de linea  para los procesos  de Producciónbalanceo de linea  para los procesos  de Producción
balanceo de linea para los procesos de Producción
 

Actividad 4

  • 1. ACTIVIDAD #4 1. https://www.youtube.com/watch?v=WgAakVRAAwM ¿Qué es big data? R/es la gran cantidad de datos a gran escala almacenados para encontrar patrones repetitivos. 2. ¿Big data y minería de datos son los mismo? R/ no son lo mismo debido a que big data es la cultivación de datos esto quiere decir que en vez de acabaros se van agrandando su volumen; minería de datos se refiere a la extracción de datos. 3. ¿en qué consiste las 4 dimensiones del big data o las 4v? R/ las cuatro dimensiones del big data fueron formuladas por Máquense en el año 2006 y lego reformadas por IBM en el 2012: V= volumen (grandes cantidades de datos) V= velocidad (lo rápido con que aparecen nuevos datos) V= variedad (los múltiples formatos de donde salen los datos) V= veracidad (este término se refiere que uno debe desconfiar a veces de los datos que obtiene solo se creerá si tiene algo comprobado o viene de una fuente confiable) 4. Malte Spitz, que detecto cuando solicito información de su empresa telefónica. R/ el descubrió que en un periodo de 5 meses habían rastreados todas sus coordenadas geográficas; 35000 veces, en estas coordenadas se pudo dar cuenta que registraban a la hora que salía de casa, de donde a donde se movilizaba, cuanto tiempo duraba en un lugar, a quien llamaba y que cantidad de datos gastaba. 5. ¿considera que la iniciativa Open Data puede ayudar al desarrollo de Colombia? R/ si puede ayudar ya que si los desarrolladores y empresarios pueden tener acceso a los datos que el gobierno tiene tendrán la capacidad de ayudar a otras personas; y puede ayudar al progreso tanto económico como personal y social. 6. ¿hay oportunidad de ejercer, al especializarse en gestión de la información? R/ si ya que como hemos visto los datos van creciendo día a día con mayor rigurosidad va naciendo la necesidad de sabes gestionar y darle función a aquellos datos de la información
  • 2. 7. ¿Consulte y describa cada paso del ciclo de la vida de un sistema de inteligencia de negocios? R/ ciclo de la vida 1. Requisitos de negocios: se debe especificar de forma clara y precisa las funciones que se esperan de la bodega de datos; teniendo en cuenta las expectativas de los usuarios, tanto a nivel operativo como gerencial y del mismo administrador de base de datos, identificar las temáticas, objetivos de área, dimensiones, etc. 2. Modelado dimensional: en esta etapa hay que pasar de un modelado relacional de datos a un modelado dimensional. Para determinar los campos se deben considerar los siguientes ítems:  Tabla de dimensiones o Debe contener una clave simple no relacionada con la llave del negocio, normalmente se refiere a llaves auto numéricas. o Sus campos deben ser descriptores que complementen la información y representan los niveles de agregación. o Debe incluir las claves del negocio. o Siempre debe existir una dimensión temporal. o Deben ser claras y explicitas ya que representan la interfaz que tendrán los usuarios para navegar por la información.
  • 3. o No se debe escatimar en cuanto al número de atributos para la tabla de dimensiones, ya que el número de registros que contendrá es mínimo respecto al de la tabla de hechos. o Las dimensiones de fechas pueden tener diversas formas de representarse. o El número de dimensiones depende del modelo dimensional adoptado, pero si se encuentra un número muy elevado puede ser que algunas no son independientes y deberían agruparse. o En algunos casos se requiere normalizar las dimensiones, generándose un modelo copo de nieve. o Deberían ayudar a responder las siguientes preguntas: ¿qué?, ¿quién?, ¿por qué?, ¿dónde? y ¿cuándo?  Tabla de Hechos o Debe contener una clave propia, independiente de las claves de negocio. o Los campos representan las métricas, por lo tanto son numéricos y aditivos (no se almacenan valores individuales, solo totales y subtotales) o Contiene los campos de referencia hacia las tablas de dimensiones. o Cada fila corresponde a una medida o Si se requiere calcular porcentajes y proporciones deben almacenarse el numerador y el denominador. o No tienen valores nulos. o Existen algunas tablas sin hechos (FactLess) que se utilizan para relacionar las dimensiones y deben contener un campo de hecho ficticio con valor por defecto igual a uno (1). 3. Diseño y desarrollo de procesos ETL E (EXTRACTION) T(TRANSFORMATION) L (LOAD) Extracción Limpieza Integración Transformación Actualización Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiendo en datos de calidad y veracidad por ultimo carga, actualiza en la DW. El proceso extracción, transformación y carga está compuesto por las siguientes etapas: a) Extracción: Este proceso obtiene los datos físicamente de las distintas fuentes de información utilizando técnicas y herramientas ETL, para la selección del método es necesario tener en cuenta algunas problemáticas de la extracción de datos como lo son el tipo de plataforma, protocolos, juego de caracteres, tipos de datos, etc.
  • 4. b) Limpieza: Al recuperar los datos en bruto, se requiere comprobar la calidad de los mismos y corregir errores relacionados con campos nulos, duplicados, inconsistencias en los datos, etc.  Etapas de la limpieza de datos:  Depurar los valores: Se pueden separar los datos de acuerdo con la estructura de destino de los datos o la regla definida para esto.  .Corregir: A partir de fuentes de datos externas se puede verificar la información existente.  Estandarizar: A partir de formatos definidos por las reglas de negocio, se sustituyen valores en los campos de datos.  Relacionar: Verifica en otras fuentes la existencia de datos relacionados, para evitar duplicados.  Consolidar: A partir de la identificación de relaciones entre registros, se llevan a una sola representación. a) Transformación: Una vez que los datos se encuentran “limpios”, se transforman de acuerdo con las reglas de negocio y las características de las herramientas a utilizar. b) Integración: En este proceso se realiza la carga de los datos y debe validarse que los datos cargados en la bodega de datos son consistentes con los que se encontraban en el medio transaccional. c) Actualización: Este proceso es en el cual se determina la periodicidad con la cual se van a añadir y sincronizar los nuevos datos a la Bodega de Datos 4. Diseño y construcción de cubos: Un cubo representa un subconjunto de datos de la bodega almacenado en una estructura multidimensional. Para proceder a la implementación de los cubos es necesario determinar el tipo de cubo y la herramienta que se utilizará para ello. La construcción física de las tablas de dimensiones y las tablas de hechos se realizan de acuerdo con el modelo dimensional definido y la herramienta a utilizar, se ejecutan los procesos ETL para poblar las tablas y se genera el cubo para obtener las respuestas a los requerimientos definidos. Posteriormente se procede a visualizar la información del cubo. Opciones de almacenamiento: Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional On- Line Analytical Processing) almacenando en una base de datos multidimensional tanto los datos como las agregaciones.
  • 5. Capacidad: ROLAP: los datos de los hipercubos así como las agregaciones se encuentran dentro de una base de datos relacional HOLAP: los datos se encuentran en una estructura relacional y los agregados en una estructura multidimensional. DOLAP: Los datos se encuentran en una base de datos multidimensional almacenada en un equipo Cliente. Detalles 5. Implementación de la Interfaz de usuario: Una vez que han sido construidos los cubos se deben establecer las herramientas que permitirán la visualización de la información, para lo cual se cuenta con diversidad de posibilidades tales como: Herramientas para la realización de informes, en las cuales participan desarrolladores, quienes construyen de acuerdo con requerimientos cambiantes de los usuarios, los informes que van siendo solicitados. Herramientas OLAP, que proporcionan a partir de los SMBD aplicaciones que permiten visualizar los datos desde diferentes contextos: informes, graficas, estadísticas etc. Vistas de Usuario
  • 6. Aplicaciones de DashBoard, permitiendo la visualización sincrónica de indicadores, referidos a objetivos o metas procedimentales. Sistemas DSS, donde se permite utilizar diferentes niveles de análisis a la información a partir de aplicaciones definidas para ello. 6. Plan de mantenimiento: Debido a la naturaleza dinámica de algunos datos, es necesario establecer un plan de acción para considerar los ajustes o reconstrucción de algunos de los objetos de la Bodega de datos. La siguiente lista proporciona algunos de los elementos a considerar en el plan de mantenimiento. Modificación de datos de origen de las dimensiones. En este caso debe analizarse si el cambio se asume para toda la historia del dato (p.e. cambia la fecha de nacimiento del cliente) o si debe generarse un nuevo ciclo a partir de la modificación del mismo (p.e. una sucursal cambia de responsable). Rendimiento. Se debe considerar el espacio ocupado en la bodega de datos, por esto es posible que se haga necesario modificar las estructuras de las tablas para aliviar el tamaño de los objetos en la bodega. Subutilización de Tablas Agregadas. Aun cuando estas tablas proporcionan una mejora en el rendimiento de las consultas es necesario asegurarse que la herramienta BI que se está utilizando sea capaz de aprovecharlas, de lo contrario los costes de mantenimiento y actualización permanente de estas tablas solo harían más complejo el sistema. 7. Pruebas e implementación: En esta etapa se evalúa el modelo, partiendo de los criterios de éxito que se establecieron en la primera etapa. El proceso debe ser revisado a partir de los resultados obtenidos para determinar si es necesario repetir alguna de las etapas anteriores.
  • 7. Se evalúa el modelo respecto a los objetivos planteados y si no existen restricciones de tiempo se prueba con un problema real, también debe evaluarse respecto a objetivos diferentes a los inicialmente planteados.