Almacén de Datos:
Diseño, Arquitectura y
Más
En esta presentación exploraremos el diseño de almacenes de datos,
tipos de arquitectura, requerimientos de hardware, modelos y
consideraciones importantes para su implementación.
¿Qué es un almacén de datos?
Múltiples fuentes de
datos
Los almacenes de datos se
crean para procesar y
almacenar una gran
cantidad de datos de
múltiples sistemas
informáticos.
Análisis de datos
Permite a las empresas y
organizaciones analizar y
entender mejor la
información que tienen a
su disposición.
Más que una base de
datos
Un almacén de datos no es
sólo una base de datos
gigante, sino una
herramienta poderosa para
el análisis y toma de
decisiones empresariales.
Pero... Qué es?
Un almacén de datos es un tipo de sistema de gestión de datos diseñado para habilitar y dar soporte a las
tareas de inteligencia empresarial (BI), especialmente las analíticas. Los data warehouses solo se han diseñado
para realizar consultas y tareas de análisis, y suelen contener grandes cantidades de datos históricos. A
menudo, la información dentro de un data warehouse proviene de una amplia gama de fuentes, como los
archivos de registro de aplicaciones o las aplicaciones de transacción. Centraliza y fusiona grandes cantidades
de datos de múltiples fuentes. Gracias a sus capacidades analíticas, las organizaciones pueden obtener
información empresarial valiosa a partir de los datos y mejorar las decisiones. Con el tiempo, se construye un
registro histórico de gran valor para los expertos en datos y los analistas de negocio. Gracias a estas funciones,
un almacén de datos puede considerarse la "fuente única de datos" de una organización.
BASE DE DATOS RELACIONAL
Tipo de base de datos que almacena y
proporciona acceso a puntos de datos
relacionados entre sí.
ETL, que significa extraer, transformar y cargar,
es un proceso de integración de datos que
combina datos de múltiples fuentes de datos en
un único almacén de datos consistente que se
carga en un almacén de datos u otro sistema de
destino.
Análisis estadísticos, informes y funciones de
extracción de datos.
Herramientas de análisis de clientes para
visualizar y presentar datos a usuarios de
negocio
Otras aplicaciones analíticas más sofisticadas
generan información procesable mediante la
aplicación de algoritmos de ciencia de datos e
inteligencia artificial (IA), o gráficos y funciones
espaciales que habilitan más tipos de análisis de
datos a escala
A
L
M
A
C
É
N
D
E
D
A
T
O
S
T
Í
P
I
C
O
Arquitectura de almacenes de datos
La arquitectura de un data warehouse
depende de las necesidades específicas de la
organización. Algunas de las arquitecturas
más comunes son:
Sencilla.
•Todos los data warehouses comparten un
diseño básico en el que los metadatos, los
datos de resumen y los datos sin procesar se
almacenan en el repositorio central del
almacén. En uno de los lados, el repositorio
se alimenta de fuentes de datos y, en el otro,
los usuarios finales acceden para las tareas
de análisis, elaboración de informes y
Es necesario limpiar y procesar los datos operativos antes de colocarlos en el almacén. Aunque esto se
puede hacer mediante programación, muchos data warehouses añaden una zona de preparación de datos
antes de introducirlos en el almacén, a fin de simplificar la preparación.
Sencilla con zona de preparación.
Al añadir data marts entre el repositorio central y los usuarios finales, las organizaciones pueden personalizar su data
warehouse para atender a varias áreas de negocio. Cuando los datos ya están listos para el uso, se mueven al data
mart correspondiente.
Radial.
Los entornos de pruebas (sandbox) son zonas seguras, privadas y protegidas donde las empresas pueden explorar de
forma rápida e informal nuevos conjuntos de datos o nuevas maneras de analizarlos sin tener que cumplir con las
reglas y los protocolos formales del data warehouse.
Entorno de pruebas.
1
Servidor de
base de datos
Este es el
componente principal
del almacén de datos
y debe tener
suficiente capacidad
de almacenamiento y
procesamiento para
manejar grandes
cantidades de datos.
2
Procesador
Un procesador potente
es esencial para
realizar operaciones
complejas en los
datos..
Los requerimientos de hardware para un almacén de datos tradicional dependen de varios factores, como el tamaño y la
complejidad de los datos, el número de usuarios y la frecuencia de uso. Sin embargo, algunos aspectos generales a
considerar son:
3
Una cantidad adecuada
de memoria RAM es
necesaria para
garantizar un
rendimiento óptimo del
almacén de datos.
Memoria RAM Almacenamiento
4
El almacenamiento
debe ser suficiente
para almacenar todos
los datos y permitir su
crecimiento futuro.
Red
5
El almacenamiento
debe ser suficiente
para almacenar todos
los datos y permitir su
crecimiento futuro.
Requerimientos de hardware para
almacenes de datos
Modelos de almacén de datos
Jerárquico
Datos organizados en una
estructura de árbol.
Red
Los datos se organizan en
una malla de relaciones.
Modelo en Forma de
Cubo
Los datos se organizan en
cubos multidimensionales.
Consideraciones al implementar un
almacén de datos
1 Calidad de datos
Los datos deben ser limpios y
precisos para obtener resultados
útiles.
2 Objetivos claros
Se debe tener un objetivo comercial
claro para el proyecto del almacén
de datos.
3 Personal capacitado
Se necesitará personal capacitado
en la implementación y
mantenimiento del almacén de
datos.
4 Seguridad
Es importante garantizar la
seguridad y privacidad de los datos
almacenados.
Beneficios de contar con un almacén
de datos
1 Menor costo de
almacenamiento
El almacenamiento de datos en
un solo lugar reduce costos en
comparación a múltiples bases
de datos.
2
Análisis de datos más
rápido
Los almacenes de datos ayudan
a los análisis más rápido y
efectivos de grandes cantidades
de información. 3 Mejores decisiones
empresariales
Los almacenes de datos
proporcionan información útil
para desarrollar estrategias
empresariales efectivas.
Tipos de arquitectura de almacén de
datos
Ventajas
• Permite una rápida
implementación.
• Bajo costo de
implementación.
• No requiere una
gran cantidad de
hardware
especializado.
Desventajas
• Problemas de
escalabilidad.
• No es tan eficiente
para grandes
conjuntos de
datos.
• La estructura es
rígida y no permite
futuras
expansiones.
Arquitectura
Monolítica
La arquitectura monolítica
es el modelo de almacén
de datos más simple.
Arquitectura de almacenamiento de datos tradicional
Los siguientes conceptos destacan algunas de las ideas establecidas y los principios de diseño
utilizados para construir almacenes de datos tradicionales.
Arquitectura de tres niveles
La arquitectura de almacenamiento de datos tradicional emplea una estructura de tres niveles
compuesta por los siguientes niveles.
•Nivel inferior: este nivel contiene el servidor de bases de datos utilizado para extraer datos de
muchos orígenes diferentes, como de bases de datos transaccionales utilizadas para aplicaciones
front-end.
•Nivel intermedio: el nivel intermedio alberga un servidor OLAP, que transforma los datos en una
estructura más adecuada para el análisis y las consultas complejas. El servidor OLAP puede funcionar
de dos maneras: como un sistema de administración de bases de datos relacionales extendido que
asigna las operaciones en datos multidimensionales a operaciones relacionales estándar (OLAP
relacional) o utilizando un modelo OLAP multidimensional que implementa directamente los datos y
operaciones multidimensionales.
•Nivel superior: El nivel superior es la capa de cliente. Este nivel contiene las herramientas utilizadas
para el análisis de datos de alto nivel, la generación de informes de consultas y la minería de datos.
AL TERMINAR
CLICK AQUÍ:
GRACIAS
• ¿Qué es un almacén de datos? | IBM. (s. f.). https://www.ibm.com/es-es/topics/data-
warehouse
• Fatima, N. (2023). Arquitectura de almacén de datos: tipos, componentes y conceptos.
Astera. https://www.astera.com/es/centro-de-Conocimiento/arquitectura-del-
almac%C3%A9n-de-datos/
• ¿Qué es un almacén de datos? (s. f.). https://www.oracle.com/mx/database/what-is-a-
datawarehouse/#:~:text=Un%20almac%C3%A9n%20de%20datos%20t%C3%ADpico%
20suele%20incluir%20los,presentar%20datos%20a%20usuarios%20de%20negocio.%20
M%C3%A1s%20elementos
• Robotham, S. R. (n.d.). Adiós Datamart. Bienvenidos SandBox ;-). www.linkedin.com.
https://www.linkedin.com/pulse/adi%C3%B3s-datamart-bienvenidos-sandbox-sebastian-
rodriguez-robotham/?originalSubdomain=es
• Spiegato. (2021, July 25). ¿Cuáles son los diferentes requisitos de almacenamiento de
datos? - Spiegato. Spiegato. https://spiegato.com/es/cuales-son-los-diferentes-requisitos-
de-almacenamiento-de-
datos#:~:text=Aunque%20todos%20los%20almacenes%20de%20datos%20son%20liger
amente,gesti%C3%B3n%20de%20datos%2C%20estructura%20y%20plataforma%20de
%20software.
• Ryan, J. (2019). Top 20 requirements of a data warehouse. dzone.com.
https://dzone.com/articles/top-20-requirements-of-a-data-warehouse
• Data Warehouse Architecture: Traditional vs. Cloud Models. (n.d.). Panoply.
https://panoply.io/data-warehouse-guide/data-warehouse-architecture-traditional-
vs-cloud/

ALMACEN DE DATOS.pptx

  • 1.
    Almacén de Datos: Diseño,Arquitectura y Más En esta presentación exploraremos el diseño de almacenes de datos, tipos de arquitectura, requerimientos de hardware, modelos y consideraciones importantes para su implementación.
  • 2.
    ¿Qué es unalmacén de datos? Múltiples fuentes de datos Los almacenes de datos se crean para procesar y almacenar una gran cantidad de datos de múltiples sistemas informáticos. Análisis de datos Permite a las empresas y organizaciones analizar y entender mejor la información que tienen a su disposición. Más que una base de datos Un almacén de datos no es sólo una base de datos gigante, sino una herramienta poderosa para el análisis y toma de decisiones empresariales.
  • 3.
    Pero... Qué es? Unalmacén de datos es un tipo de sistema de gestión de datos diseñado para habilitar y dar soporte a las tareas de inteligencia empresarial (BI), especialmente las analíticas. Los data warehouses solo se han diseñado para realizar consultas y tareas de análisis, y suelen contener grandes cantidades de datos históricos. A menudo, la información dentro de un data warehouse proviene de una amplia gama de fuentes, como los archivos de registro de aplicaciones o las aplicaciones de transacción. Centraliza y fusiona grandes cantidades de datos de múltiples fuentes. Gracias a sus capacidades analíticas, las organizaciones pueden obtener información empresarial valiosa a partir de los datos y mejorar las decisiones. Con el tiempo, se construye un registro histórico de gran valor para los expertos en datos y los analistas de negocio. Gracias a estas funciones, un almacén de datos puede considerarse la "fuente única de datos" de una organización.
  • 4.
    BASE DE DATOSRELACIONAL Tipo de base de datos que almacena y proporciona acceso a puntos de datos relacionados entre sí. ETL, que significa extraer, transformar y cargar, es un proceso de integración de datos que combina datos de múltiples fuentes de datos en un único almacén de datos consistente que se carga en un almacén de datos u otro sistema de destino. Análisis estadísticos, informes y funciones de extracción de datos. Herramientas de análisis de clientes para visualizar y presentar datos a usuarios de negocio Otras aplicaciones analíticas más sofisticadas generan información procesable mediante la aplicación de algoritmos de ciencia de datos e inteligencia artificial (IA), o gráficos y funciones espaciales que habilitan más tipos de análisis de datos a escala A L M A C É N D E D A T O S T Í P I C O
  • 5.
    Arquitectura de almacenesde datos La arquitectura de un data warehouse depende de las necesidades específicas de la organización. Algunas de las arquitecturas más comunes son: Sencilla. •Todos los data warehouses comparten un diseño básico en el que los metadatos, los datos de resumen y los datos sin procesar se almacenan en el repositorio central del almacén. En uno de los lados, el repositorio se alimenta de fuentes de datos y, en el otro, los usuarios finales acceden para las tareas de análisis, elaboración de informes y
  • 6.
    Es necesario limpiary procesar los datos operativos antes de colocarlos en el almacén. Aunque esto se puede hacer mediante programación, muchos data warehouses añaden una zona de preparación de datos antes de introducirlos en el almacén, a fin de simplificar la preparación. Sencilla con zona de preparación.
  • 7.
    Al añadir datamarts entre el repositorio central y los usuarios finales, las organizaciones pueden personalizar su data warehouse para atender a varias áreas de negocio. Cuando los datos ya están listos para el uso, se mueven al data mart correspondiente. Radial.
  • 8.
    Los entornos depruebas (sandbox) son zonas seguras, privadas y protegidas donde las empresas pueden explorar de forma rápida e informal nuevos conjuntos de datos o nuevas maneras de analizarlos sin tener que cumplir con las reglas y los protocolos formales del data warehouse. Entorno de pruebas.
  • 9.
    1 Servidor de base dedatos Este es el componente principal del almacén de datos y debe tener suficiente capacidad de almacenamiento y procesamiento para manejar grandes cantidades de datos. 2 Procesador Un procesador potente es esencial para realizar operaciones complejas en los datos.. Los requerimientos de hardware para un almacén de datos tradicional dependen de varios factores, como el tamaño y la complejidad de los datos, el número de usuarios y la frecuencia de uso. Sin embargo, algunos aspectos generales a considerar son: 3 Una cantidad adecuada de memoria RAM es necesaria para garantizar un rendimiento óptimo del almacén de datos. Memoria RAM Almacenamiento 4 El almacenamiento debe ser suficiente para almacenar todos los datos y permitir su crecimiento futuro. Red 5 El almacenamiento debe ser suficiente para almacenar todos los datos y permitir su crecimiento futuro. Requerimientos de hardware para almacenes de datos
  • 10.
    Modelos de almacénde datos Jerárquico Datos organizados en una estructura de árbol. Red Los datos se organizan en una malla de relaciones. Modelo en Forma de Cubo Los datos se organizan en cubos multidimensionales.
  • 11.
    Consideraciones al implementarun almacén de datos 1 Calidad de datos Los datos deben ser limpios y precisos para obtener resultados útiles. 2 Objetivos claros Se debe tener un objetivo comercial claro para el proyecto del almacén de datos. 3 Personal capacitado Se necesitará personal capacitado en la implementación y mantenimiento del almacén de datos. 4 Seguridad Es importante garantizar la seguridad y privacidad de los datos almacenados.
  • 12.
    Beneficios de contarcon un almacén de datos 1 Menor costo de almacenamiento El almacenamiento de datos en un solo lugar reduce costos en comparación a múltiples bases de datos. 2 Análisis de datos más rápido Los almacenes de datos ayudan a los análisis más rápido y efectivos de grandes cantidades de información. 3 Mejores decisiones empresariales Los almacenes de datos proporcionan información útil para desarrollar estrategias empresariales efectivas.
  • 13.
    Tipos de arquitecturade almacén de datos Ventajas • Permite una rápida implementación. • Bajo costo de implementación. • No requiere una gran cantidad de hardware especializado. Desventajas • Problemas de escalabilidad. • No es tan eficiente para grandes conjuntos de datos. • La estructura es rígida y no permite futuras expansiones. Arquitectura Monolítica La arquitectura monolítica es el modelo de almacén de datos más simple.
  • 14.
    Arquitectura de almacenamientode datos tradicional Los siguientes conceptos destacan algunas de las ideas establecidas y los principios de diseño utilizados para construir almacenes de datos tradicionales. Arquitectura de tres niveles La arquitectura de almacenamiento de datos tradicional emplea una estructura de tres niveles compuesta por los siguientes niveles. •Nivel inferior: este nivel contiene el servidor de bases de datos utilizado para extraer datos de muchos orígenes diferentes, como de bases de datos transaccionales utilizadas para aplicaciones front-end. •Nivel intermedio: el nivel intermedio alberga un servidor OLAP, que transforma los datos en una estructura más adecuada para el análisis y las consultas complejas. El servidor OLAP puede funcionar de dos maneras: como un sistema de administración de bases de datos relacionales extendido que asigna las operaciones en datos multidimensionales a operaciones relacionales estándar (OLAP relacional) o utilizando un modelo OLAP multidimensional que implementa directamente los datos y operaciones multidimensionales. •Nivel superior: El nivel superior es la capa de cliente. Este nivel contiene las herramientas utilizadas para el análisis de datos de alto nivel, la generación de informes de consultas y la minería de datos. AL TERMINAR CLICK AQUÍ:
  • 15.
  • 16.
    • ¿Qué esun almacén de datos? | IBM. (s. f.). https://www.ibm.com/es-es/topics/data- warehouse • Fatima, N. (2023). Arquitectura de almacén de datos: tipos, componentes y conceptos. Astera. https://www.astera.com/es/centro-de-Conocimiento/arquitectura-del- almac%C3%A9n-de-datos/ • ¿Qué es un almacén de datos? (s. f.). https://www.oracle.com/mx/database/what-is-a- datawarehouse/#:~:text=Un%20almac%C3%A9n%20de%20datos%20t%C3%ADpico% 20suele%20incluir%20los,presentar%20datos%20a%20usuarios%20de%20negocio.%20 M%C3%A1s%20elementos • Robotham, S. R. (n.d.). Adiós Datamart. Bienvenidos SandBox ;-). www.linkedin.com. https://www.linkedin.com/pulse/adi%C3%B3s-datamart-bienvenidos-sandbox-sebastian- rodriguez-robotham/?originalSubdomain=es • Spiegato. (2021, July 25). ¿Cuáles son los diferentes requisitos de almacenamiento de datos? - Spiegato. Spiegato. https://spiegato.com/es/cuales-son-los-diferentes-requisitos- de-almacenamiento-de- datos#:~:text=Aunque%20todos%20los%20almacenes%20de%20datos%20son%20liger amente,gesti%C3%B3n%20de%20datos%2C%20estructura%20y%20plataforma%20de %20software.
  • 17.
    • Ryan, J.(2019). Top 20 requirements of a data warehouse. dzone.com. https://dzone.com/articles/top-20-requirements-of-a-data-warehouse • Data Warehouse Architecture: Traditional vs. Cloud Models. (n.d.). Panoply. https://panoply.io/data-warehouse-guide/data-warehouse-architecture-traditional- vs-cloud/