SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
ACTIVIDAD #4
1. https://www.youtube.com/watch?v=WgAakVRAAwM
¿Qué es big data?
R/es la gran cantidad de datos a gran escala almacenados para encontrar
patrones repetitivos.
2. ¿Big data y minería de datos son los mismo?
R/ no son lo mismo debido a que big data es la cultivación de datos esto
quiere decir que en vez de acabaros se van agrandando su volumen;
minería de datos se refiere a la extracción de datos.
3. ¿en qué consiste las 4 dimensiones del big data o las 4v?
R/ las cuatro dimensiones del big data fueron formuladas por Máquense en
el año 2006 y lego reformadas por IBM en el 2012:
V= volumen (grandes cantidades de datos)
V= velocidad (lo rápido con que aparecen nuevos datos)
V= variedad (los múltiples formatos de donde salen los datos)
V= veracidad (este término se refiere que uno debe desconfiar a veces de
los datos que obtiene solo se creerá si tiene algo comprobado o viene de
una fuente confiable)
4. Malte Spitz, que detecto cuando solicito información de su empresa
telefónica.
R/ el descubrió que en un periodo de 5 meses habían rastreados todas sus
coordenadas geográficas; 35000 veces, en estas coordenadas se pudo dar
cuenta que registraban a la hora que salía de casa, de donde a donde se
movilizaba, cuanto tiempo duraba en un lugar, a quien llamaba y que
cantidad de datos gastaba.
5. ¿considera que la iniciativa Open Data puede ayudar al desarrollo de
Colombia?
R/ si puede ayudar ya que si los desarrolladores y empresarios pueden
tener acceso a los datos que el gobierno tiene tendrán la capacidad de
ayudar a otras personas; y puede ayudar al progreso tanto económico
como personal y social.
6. ¿hay oportunidad de ejercer, al especializarse en gestión de la información?
R/ si ya que como hemos visto los datos van creciendo día a día con mayor
rigurosidad va naciendo la necesidad de sabes gestionar y darle función a
aquellos datos de la información
7. ¿Consulte y describa cada paso del ciclo de la vida de un sistema de
inteligencia de negocios?
R/ ciclo de la vida
1. Requisitos de negocios: se debe especificar de forma clara y precisa las
funciones que se esperan de la bodega de datos; teniendo en cuenta las
expectativas de los usuarios, tanto a nivel operativo como gerencial y del
mismo administrador de base de datos, identificar las temáticas, objetivos
de área, dimensiones, etc.
2. Modelado dimensional: en esta etapa hay que pasar de un modelado
relacional de datos a un modelado dimensional. Para determinar los
campos se deben considerar los siguientes ítems:
 Tabla de dimensiones
o Debe contener una clave simple no relacionada con la llave del
negocio, normalmente se refiere a llaves auto numéricas. o Sus
campos deben ser descriptores que complementen la
información y representan los niveles de agregación. o Debe
incluir las claves del negocio. o Siempre debe existir una
dimensión temporal.
o Deben ser claras y explicitas ya que representan la interfaz que
tendrán los usuarios para navegar por la información.
o No se debe escatimar en cuanto al número de atributos para la
tabla de dimensiones, ya que el número de registros que
contendrá es mínimo respecto al de la tabla de hechos.
o Las dimensiones de fechas pueden tener diversas formas de
representarse.
o El número de dimensiones depende del modelo dimensional
adoptado, pero si se encuentra un número muy elevado puede
ser que algunas no son independientes y deberían agruparse.
o En algunos casos se requiere normalizar las dimensiones,
generándose un modelo copo de nieve.
o Deberían ayudar a responder las siguientes preguntas: ¿qué?,
¿quién?, ¿por qué?, ¿dónde? y ¿cuándo?
 Tabla de Hechos
o Debe contener una clave propia, independiente de las claves
de negocio.
o Los campos representan las métricas, por lo tanto son
numéricos y aditivos (no se almacenan valores individuales,
solo totales y subtotales)
o Contiene los campos de referencia hacia las tablas de
dimensiones.
o Cada fila corresponde a una medida
o Si se requiere calcular porcentajes y proporciones deben
almacenarse el numerador y el denominador.
o No tienen valores nulos.
o Existen algunas tablas sin hechos (FactLess) que se utilizan
para relacionar las dimensiones y deben contener un campo de
hecho ficticio con valor por defecto igual a uno (1).
3. Diseño y desarrollo de procesos ETL
E (EXTRACTION) T(TRANSFORMATION) L (LOAD)
Extracción Limpieza Integración
Transformación Actualización
Como se observa en la gráfica el proceso ETL recoge información de
diferentes fuentes, transforma los datos convirtiendo en datos de calidad y
veracidad por ultimo carga, actualiza en la DW. El proceso extracción,
transformación y carga está compuesto por las siguientes etapas:
a) Extracción: Este proceso obtiene los datos físicamente de las
distintas fuentes de información utilizando técnicas y herramientas
ETL, para la selección del método es necesario tener en cuenta
algunas problemáticas de la extracción de datos como lo son el tipo
de plataforma, protocolos, juego de caracteres, tipos de datos, etc.
b) Limpieza: Al recuperar los datos en bruto, se requiere comprobar la
calidad de los mismos y corregir errores relacionados con campos
nulos, duplicados, inconsistencias en los datos, etc.
 Etapas de la limpieza de datos:
 Depurar los valores: Se pueden separar los datos de acuerdo
con la estructura de destino de los datos o la regla definida
para esto.
 .Corregir: A partir de fuentes de datos externas se puede
verificar la información existente.
 Estandarizar: A partir de formatos definidos por las reglas de
negocio, se sustituyen valores en los campos de datos.
 Relacionar: Verifica en otras fuentes la existencia de datos
relacionados, para evitar duplicados.
 Consolidar: A partir de la identificación de relaciones entre
registros, se llevan a una sola representación.
a) Transformación: Una vez que los datos se encuentran “limpios”, se
transforman de acuerdo con las reglas de negocio y las características de
las herramientas a utilizar.
b) Integración: En este proceso se realiza la carga de los datos y debe
validarse que los datos cargados en la bodega de datos son consistentes
con los que se encontraban en el medio transaccional.
c) Actualización: Este proceso es en el cual se determina la periodicidad con
la cual se van a añadir y sincronizar los nuevos datos a la Bodega de Datos
4. Diseño y construcción de cubos: Un cubo representa un subconjunto de
datos de la bodega almacenado en una estructura multidimensional. Para
proceder a la implementación de los cubos es necesario determinar el tipo
de cubo y la herramienta que se utilizará para ello. La construcción física de
las tablas de dimensiones y las tablas de hechos se realizan de acuerdo
con el modelo dimensional definido y la herramienta a utilizar, se ejecutan
los procesos ETL para poblar las tablas y se genera el cubo para obtener
las respuestas a los requerimientos definidos. Posteriormente se procede a
visualizar la información del cubo.
Opciones de almacenamiento:
Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional On-
Line Analytical Processing) almacenando en una base de datos
multidimensional tanto los datos como las agregaciones.
Capacidad:
ROLAP: los datos de los hipercubos así como las agregaciones se
encuentran dentro de una base de datos relacional
HOLAP: los datos se encuentran en una estructura relacional y los
agregados en una estructura multidimensional.
DOLAP: Los datos se encuentran en una base de datos multidimensional
almacenada en un equipo Cliente.
Detalles
5. Implementación de la Interfaz de usuario: Una vez que han sido construidos
los cubos se deben establecer las herramientas que permitirán la
visualización de la información, para lo cual se cuenta con diversidad de
posibilidades tales como:
Herramientas para la realización de informes, en las cuales participan
desarrolladores, quienes construyen de acuerdo con requerimientos
cambiantes de los usuarios, los informes que van siendo solicitados.
Herramientas OLAP, que proporcionan a partir de los SMBD aplicaciones
que permiten visualizar los datos desde diferentes contextos: informes,
graficas, estadísticas etc.
Vistas
de
Usuario
Aplicaciones de DashBoard, permitiendo la visualización sincrónica de
indicadores, referidos a objetivos o metas procedimentales.
Sistemas DSS, donde se permite utilizar diferentes niveles de análisis a la
información a partir de aplicaciones definidas para ello.
6. Plan de mantenimiento: Debido a la naturaleza dinámica de algunos datos,
es necesario establecer un plan de acción para considerar los ajustes o
reconstrucción de algunos de los objetos de la Bodega de datos. La
siguiente lista proporciona algunos de los elementos a considerar en el plan
de mantenimiento.
Modificación de datos de origen de las dimensiones. En este caso debe
analizarse si el cambio se asume para toda la historia del dato (p.e. cambia
la fecha de nacimiento del cliente) o si debe generarse un nuevo ciclo a
partir de la modificación del mismo (p.e. una sucursal cambia de
responsable).
Rendimiento. Se debe considerar el espacio ocupado en la bodega de
datos, por esto es posible que se haga necesario modificar las estructuras
de las tablas para aliviar el tamaño de los objetos en la bodega.
Subutilización de Tablas Agregadas. Aun cuando estas tablas
proporcionan una mejora en el rendimiento de las consultas es necesario
asegurarse que la herramienta BI que se está utilizando sea capaz de
aprovecharlas, de lo contrario los costes de mantenimiento y actualización
permanente de estas tablas solo harían más complejo el sistema.
7. Pruebas e implementación: En esta etapa se evalúa el modelo, partiendo
de los criterios de éxito que se establecieron en la primera etapa. El
proceso debe ser revisado a partir de los resultados obtenidos para
determinar si es necesario repetir alguna de las etapas anteriores.
Se evalúa el modelo respecto a los objetivos planteados y si no existen
restricciones de tiempo se prueba con un problema real, también debe
evaluarse respecto a objetivos diferentes a los inicialmente planteados.

Más contenido relacionado

La actualidad más candente

Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3CarlosTenelema1
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informeCarlosTenelema1
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2CarlosTenelema1
 
Arquitectura de datos empresariales informe power bi sql
Arquitectura de datos empresariales   informe power bi sqlArquitectura de datos empresariales   informe power bi sql
Arquitectura de datos empresariales informe power bi sqlCarlosTenelema1
 
38481889 lab-dwh-sql2005
38481889 lab-dwh-sql200538481889 lab-dwh-sql2005
38481889 lab-dwh-sql2005cristhian
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4thuspes10
 
Arquitectura de datos empresariales análisis de una base de datos
Arquitectura de datos empresariales   análisis de una base de datosArquitectura de datos empresariales   análisis de una base de datos
Arquitectura de datos empresariales análisis de una base de datosCarlosTenelema1
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4thuspes10
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4mf_0529
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 

La actualidad más candente (15)

Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
 
Creacion de data mart
Creacion de data martCreacion de data mart
Creacion de data mart
 
U3 foro semana 14
U3 foro   semana 14U3 foro   semana 14
U3 foro semana 14
 
Arquitectura de datos empresariales informe power bi sql
Arquitectura de datos empresariales   informe power bi sqlArquitectura de datos empresariales   informe power bi sql
Arquitectura de datos empresariales informe power bi sql
 
38481889 lab-dwh-sql2005
38481889 lab-dwh-sql200538481889 lab-dwh-sql2005
38481889 lab-dwh-sql2005
 
Diapositivas bd
Diapositivas bdDiapositivas bd
Diapositivas bd
 
Fer 2 foro
Fer 2 foroFer 2 foro
Fer 2 foro
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
 
Arquitectura de datos empresariales análisis de una base de datos
Arquitectura de datos empresariales   análisis de una base de datosArquitectura de datos empresariales   análisis de una base de datos
Arquitectura de datos empresariales análisis de una base de datos
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
 
Bases de datos relacionales 4
Bases de datos relacionales 4Bases de datos relacionales 4
Bases de datos relacionales 4
 
01 introduccion (1)my sql
01 introduccion (1)my sql01 introduccion (1)my sql
01 introduccion (1)my sql
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 

Destacado

Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologialuisa ortiz
 
Jose barrera actividad1_2mapac
Jose barrera actividad1_2mapacJose barrera actividad1_2mapac
Jose barrera actividad1_2mapacjosealejobar
 
Thalaathatul Usool
Thalaathatul UsoolThalaathatul Usool
Thalaathatul Usoolrobbinshare
 
Animals in quran
Animals in quranAnimals in quran
Animals in quranrobbinshare
 
Elementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de AprendizajeElementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de AprendizajeGreici Jiménez Bravo
 
Presentation 1 (1)
Presentation 1 (1)Presentation 1 (1)
Presentation 1 (1)Ankit kumar
 
ENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donationENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donationMuyeed Morshed
 
Экономический анализ
Экономический анализЭкономический анализ
Экономический анализLiza Yakubenko
 
Diabetes Breakthrough
Diabetes BreakthroughDiabetes Breakthrough
Diabetes BreakthroughNelsonsmile
 
Startup india (1)
Startup india (1)Startup india (1)
Startup india (1)Ankit kumar
 

Destacado (13)

Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologia
 
Jose barrera actividad1_2mapac
Jose barrera actividad1_2mapacJose barrera actividad1_2mapac
Jose barrera actividad1_2mapac
 
Thalaathatul Usool
Thalaathatul UsoolThalaathatul Usool
Thalaathatul Usool
 
Animals in quran
Animals in quranAnimals in quran
Animals in quran
 
Elementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de AprendizajeElementos de un Aula Virtual de Aprendizaje
Elementos de un Aula Virtual de Aprendizaje
 
Dog poop bags
Dog poop bagsDog poop bags
Dog poop bags
 
Actividad 2
Actividad 2Actividad 2
Actividad 2
 
Digital Storytelling
Digital StorytellingDigital Storytelling
Digital Storytelling
 
Presentation 1 (1)
Presentation 1 (1)Presentation 1 (1)
Presentation 1 (1)
 
ENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donationENG091 persuassive presentation on Blood donation
ENG091 persuassive presentation on Blood donation
 
Экономический анализ
Экономический анализЭкономический анализ
Экономический анализ
 
Diabetes Breakthrough
Diabetes BreakthroughDiabetes Breakthrough
Diabetes Breakthrough
 
Startup india (1)
Startup india (1)Startup india (1)
Startup india (1)
 

Similar a Actividad 4

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datosedwin
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingTitiushko Jazz
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.docaldair441257
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Climanfef
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfexpertoleonelmartine
 
Olap vs oltp bases datos 2
Olap vs oltp bases datos 2Olap vs oltp bases datos 2
Olap vs oltp bases datos 2Velmuz Buzz
 
Analisis services
Analisis servicesAnalisis services
Analisis servicesIrene Lorza
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 

Similar a Actividad 4 (20)

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
 
Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
Ciclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negociosCiclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negocios
 
Trabajo ayudantia
Trabajo ayudantiaTrabajo ayudantia
Trabajo ayudantia
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
 
Olap vs oltp bases datos 2
Olap vs oltp bases datos 2Olap vs oltp bases datos 2
Olap vs oltp bases datos 2
 
Analisis services
Analisis servicesAnalisis services
Analisis services
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Tema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicosTema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicos
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 

Último

CFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCarlos Delgado
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPJosLuisFrancoCaldern
 
Peligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacionPeligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacionOsdelTacusiPancorbo
 
594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...
594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...
594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...humberto espejo
 
Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)mendezruben1901
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxLuisvila35
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfAdelaHerrera9
 
trabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidastrabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidasNelsonQuispeQuispitu
 
Tarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieriaTarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieriaSebastianQP1
 
SOLIDOS DE REVOLUCION, aplicaciones de integrales definidas
SOLIDOS DE REVOLUCION, aplicaciones de integrales definidasSOLIDOS DE REVOLUCION, aplicaciones de integrales definidas
SOLIDOS DE REVOLUCION, aplicaciones de integrales definidasLeonardoMendozaDvila
 
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdfS454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdffredyflores58
 
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...Arquitecto Alejandro Gomez cornejo muñoz
 
Edificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes GranadaEdificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes GranadaANDECE
 
Espontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneosEspontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneosOscarGonzalez231938
 
Trabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruanaTrabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruana5extraviado
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)ssuser6958b11
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.ALEJANDROLEONGALICIA
 
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinaciónEstacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinaciónAlexisHernandez885688
 
Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)dianamateo1513
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para PlataformasSegundo Silva Maguiña
 

Último (20)

CFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric Project
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
 
Peligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacionPeligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacion
 
594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...
594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...
594305198-OPCIONES-TARIFARIAS-Y-CONDICIONES-DE-APLICACION-DE-TARIFAS-A-USUARI...
 
Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
 
trabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidastrabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidas
 
Tarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieriaTarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieria
 
SOLIDOS DE REVOLUCION, aplicaciones de integrales definidas
SOLIDOS DE REVOLUCION, aplicaciones de integrales definidasSOLIDOS DE REVOLUCION, aplicaciones de integrales definidas
SOLIDOS DE REVOLUCION, aplicaciones de integrales definidas
 
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdfS454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
 
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
 
Edificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes GranadaEdificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes Granada
 
Espontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneosEspontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneos
 
Trabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruanaTrabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruana
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.
 
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinaciónEstacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
 
Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para Plataformas
 

Actividad 4

  • 1. ACTIVIDAD #4 1. https://www.youtube.com/watch?v=WgAakVRAAwM ¿Qué es big data? R/es la gran cantidad de datos a gran escala almacenados para encontrar patrones repetitivos. 2. ¿Big data y minería de datos son los mismo? R/ no son lo mismo debido a que big data es la cultivación de datos esto quiere decir que en vez de acabaros se van agrandando su volumen; minería de datos se refiere a la extracción de datos. 3. ¿en qué consiste las 4 dimensiones del big data o las 4v? R/ las cuatro dimensiones del big data fueron formuladas por Máquense en el año 2006 y lego reformadas por IBM en el 2012: V= volumen (grandes cantidades de datos) V= velocidad (lo rápido con que aparecen nuevos datos) V= variedad (los múltiples formatos de donde salen los datos) V= veracidad (este término se refiere que uno debe desconfiar a veces de los datos que obtiene solo se creerá si tiene algo comprobado o viene de una fuente confiable) 4. Malte Spitz, que detecto cuando solicito información de su empresa telefónica. R/ el descubrió que en un periodo de 5 meses habían rastreados todas sus coordenadas geográficas; 35000 veces, en estas coordenadas se pudo dar cuenta que registraban a la hora que salía de casa, de donde a donde se movilizaba, cuanto tiempo duraba en un lugar, a quien llamaba y que cantidad de datos gastaba. 5. ¿considera que la iniciativa Open Data puede ayudar al desarrollo de Colombia? R/ si puede ayudar ya que si los desarrolladores y empresarios pueden tener acceso a los datos que el gobierno tiene tendrán la capacidad de ayudar a otras personas; y puede ayudar al progreso tanto económico como personal y social. 6. ¿hay oportunidad de ejercer, al especializarse en gestión de la información? R/ si ya que como hemos visto los datos van creciendo día a día con mayor rigurosidad va naciendo la necesidad de sabes gestionar y darle función a aquellos datos de la información
  • 2. 7. ¿Consulte y describa cada paso del ciclo de la vida de un sistema de inteligencia de negocios? R/ ciclo de la vida 1. Requisitos de negocios: se debe especificar de forma clara y precisa las funciones que se esperan de la bodega de datos; teniendo en cuenta las expectativas de los usuarios, tanto a nivel operativo como gerencial y del mismo administrador de base de datos, identificar las temáticas, objetivos de área, dimensiones, etc. 2. Modelado dimensional: en esta etapa hay que pasar de un modelado relacional de datos a un modelado dimensional. Para determinar los campos se deben considerar los siguientes ítems:  Tabla de dimensiones o Debe contener una clave simple no relacionada con la llave del negocio, normalmente se refiere a llaves auto numéricas. o Sus campos deben ser descriptores que complementen la información y representan los niveles de agregación. o Debe incluir las claves del negocio. o Siempre debe existir una dimensión temporal. o Deben ser claras y explicitas ya que representan la interfaz que tendrán los usuarios para navegar por la información.
  • 3. o No se debe escatimar en cuanto al número de atributos para la tabla de dimensiones, ya que el número de registros que contendrá es mínimo respecto al de la tabla de hechos. o Las dimensiones de fechas pueden tener diversas formas de representarse. o El número de dimensiones depende del modelo dimensional adoptado, pero si se encuentra un número muy elevado puede ser que algunas no son independientes y deberían agruparse. o En algunos casos se requiere normalizar las dimensiones, generándose un modelo copo de nieve. o Deberían ayudar a responder las siguientes preguntas: ¿qué?, ¿quién?, ¿por qué?, ¿dónde? y ¿cuándo?  Tabla de Hechos o Debe contener una clave propia, independiente de las claves de negocio. o Los campos representan las métricas, por lo tanto son numéricos y aditivos (no se almacenan valores individuales, solo totales y subtotales) o Contiene los campos de referencia hacia las tablas de dimensiones. o Cada fila corresponde a una medida o Si se requiere calcular porcentajes y proporciones deben almacenarse el numerador y el denominador. o No tienen valores nulos. o Existen algunas tablas sin hechos (FactLess) que se utilizan para relacionar las dimensiones y deben contener un campo de hecho ficticio con valor por defecto igual a uno (1). 3. Diseño y desarrollo de procesos ETL E (EXTRACTION) T(TRANSFORMATION) L (LOAD) Extracción Limpieza Integración Transformación Actualización Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiendo en datos de calidad y veracidad por ultimo carga, actualiza en la DW. El proceso extracción, transformación y carga está compuesto por las siguientes etapas: a) Extracción: Este proceso obtiene los datos físicamente de las distintas fuentes de información utilizando técnicas y herramientas ETL, para la selección del método es necesario tener en cuenta algunas problemáticas de la extracción de datos como lo son el tipo de plataforma, protocolos, juego de caracteres, tipos de datos, etc.
  • 4. b) Limpieza: Al recuperar los datos en bruto, se requiere comprobar la calidad de los mismos y corregir errores relacionados con campos nulos, duplicados, inconsistencias en los datos, etc.  Etapas de la limpieza de datos:  Depurar los valores: Se pueden separar los datos de acuerdo con la estructura de destino de los datos o la regla definida para esto.  .Corregir: A partir de fuentes de datos externas se puede verificar la información existente.  Estandarizar: A partir de formatos definidos por las reglas de negocio, se sustituyen valores en los campos de datos.  Relacionar: Verifica en otras fuentes la existencia de datos relacionados, para evitar duplicados.  Consolidar: A partir de la identificación de relaciones entre registros, se llevan a una sola representación. a) Transformación: Una vez que los datos se encuentran “limpios”, se transforman de acuerdo con las reglas de negocio y las características de las herramientas a utilizar. b) Integración: En este proceso se realiza la carga de los datos y debe validarse que los datos cargados en la bodega de datos son consistentes con los que se encontraban en el medio transaccional. c) Actualización: Este proceso es en el cual se determina la periodicidad con la cual se van a añadir y sincronizar los nuevos datos a la Bodega de Datos 4. Diseño y construcción de cubos: Un cubo representa un subconjunto de datos de la bodega almacenado en una estructura multidimensional. Para proceder a la implementación de los cubos es necesario determinar el tipo de cubo y la herramienta que se utilizará para ello. La construcción física de las tablas de dimensiones y las tablas de hechos se realizan de acuerdo con el modelo dimensional definido y la herramienta a utilizar, se ejecutan los procesos ETL para poblar las tablas y se genera el cubo para obtener las respuestas a los requerimientos definidos. Posteriormente se procede a visualizar la información del cubo. Opciones de almacenamiento: Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional On- Line Analytical Processing) almacenando en una base de datos multidimensional tanto los datos como las agregaciones.
  • 5. Capacidad: ROLAP: los datos de los hipercubos así como las agregaciones se encuentran dentro de una base de datos relacional HOLAP: los datos se encuentran en una estructura relacional y los agregados en una estructura multidimensional. DOLAP: Los datos se encuentran en una base de datos multidimensional almacenada en un equipo Cliente. Detalles 5. Implementación de la Interfaz de usuario: Una vez que han sido construidos los cubos se deben establecer las herramientas que permitirán la visualización de la información, para lo cual se cuenta con diversidad de posibilidades tales como: Herramientas para la realización de informes, en las cuales participan desarrolladores, quienes construyen de acuerdo con requerimientos cambiantes de los usuarios, los informes que van siendo solicitados. Herramientas OLAP, que proporcionan a partir de los SMBD aplicaciones que permiten visualizar los datos desde diferentes contextos: informes, graficas, estadísticas etc. Vistas de Usuario
  • 6. Aplicaciones de DashBoard, permitiendo la visualización sincrónica de indicadores, referidos a objetivos o metas procedimentales. Sistemas DSS, donde se permite utilizar diferentes niveles de análisis a la información a partir de aplicaciones definidas para ello. 6. Plan de mantenimiento: Debido a la naturaleza dinámica de algunos datos, es necesario establecer un plan de acción para considerar los ajustes o reconstrucción de algunos de los objetos de la Bodega de datos. La siguiente lista proporciona algunos de los elementos a considerar en el plan de mantenimiento. Modificación de datos de origen de las dimensiones. En este caso debe analizarse si el cambio se asume para toda la historia del dato (p.e. cambia la fecha de nacimiento del cliente) o si debe generarse un nuevo ciclo a partir de la modificación del mismo (p.e. una sucursal cambia de responsable). Rendimiento. Se debe considerar el espacio ocupado en la bodega de datos, por esto es posible que se haga necesario modificar las estructuras de las tablas para aliviar el tamaño de los objetos en la bodega. Subutilización de Tablas Agregadas. Aun cuando estas tablas proporcionan una mejora en el rendimiento de las consultas es necesario asegurarse que la herramienta BI que se está utilizando sea capaz de aprovecharlas, de lo contrario los costes de mantenimiento y actualización permanente de estas tablas solo harían más complejo el sistema. 7. Pruebas e implementación: En esta etapa se evalúa el modelo, partiendo de los criterios de éxito que se establecieron en la primera etapa. El proceso debe ser revisado a partir de los resultados obtenidos para determinar si es necesario repetir alguna de las etapas anteriores.
  • 7. Se evalúa el modelo respecto a los objetivos planteados y si no existen restricciones de tiempo se prueba con un problema real, también debe evaluarse respecto a objetivos diferentes a los inicialmente planteados.