El documento describe varias innovaciones en los sistemas de base de datos que se han estado desarrollando en los últimos años, incluyendo bases de datos en memoria, almacenamiento columnar y no relacional, almacenamiento en la nube, appliances para grandes volúmenes de datos, y sistemas para procesar datos de sensores y tiempo real.
Cuando se manejan gigantescas cantidades de datos, como las nóminas de las instituciones públicas y las grandes empresas privadas, se requieren dispositivos de almacenamiento de datos enormes.
En este caso el almacenamiento en cinta es seguro, escalable, duradero, de gran eficiencia energética y con un costo significativamente más reducido que otros medios.
www.incosa.com.uy
Modernizando el rol de un Data Lake en una arquitectura Data FabricDenodo
Watch full webinar here: https://bit.ly/43fFcsT
Los data lakes siempre han dado mucho que hablar. Muchos expertos del dato los aplauden, pero muchos otros los ven problemáticos. Aunque pueden ser increíblemente útiles para una organización, también pueden ser fuente de grandes dolores de cabeza.
Su facilidad para escalar el almacenamiento con un coste mínimo ha abierto la puerta a muchas soluciones nuevas, pero también ha favorecido los llamados “data swamps”: datos no estructurados, sin gobierno y sin control.
Con la incorporación de un motor MPP, basado en Presto, a la capa lógica gestionada por Denodo, queremos reconsiderar el papel del Data Lake en tu estrategia global de datos.
Asiste a este webinar para aprender:
- Las nuevas capacidades de MPP que incluye Denodo
- Cómo utilizarlas para mejorar la seguridad y la gobernanza de tu Data Lake
- Nuevos escenarios y soluciones en los que puede evolucionar tu estrategia de Data Fabric
Cuando se manejan gigantescas cantidades de datos, como las nóminas de las instituciones públicas y las grandes empresas privadas, se requieren dispositivos de almacenamiento de datos enormes.
En este caso el almacenamiento en cinta es seguro, escalable, duradero, de gran eficiencia energética y con un costo significativamente más reducido que otros medios.
www.incosa.com.uy
Modernizando el rol de un Data Lake en una arquitectura Data FabricDenodo
Watch full webinar here: https://bit.ly/43fFcsT
Los data lakes siempre han dado mucho que hablar. Muchos expertos del dato los aplauden, pero muchos otros los ven problemáticos. Aunque pueden ser increíblemente útiles para una organización, también pueden ser fuente de grandes dolores de cabeza.
Su facilidad para escalar el almacenamiento con un coste mínimo ha abierto la puerta a muchas soluciones nuevas, pero también ha favorecido los llamados “data swamps”: datos no estructurados, sin gobierno y sin control.
Con la incorporación de un motor MPP, basado en Presto, a la capa lógica gestionada por Denodo, queremos reconsiderar el papel del Data Lake en tu estrategia global de datos.
Asiste a este webinar para aprender:
- Las nuevas capacidades de MPP que incluye Denodo
- Cómo utilizarlas para mejorar la seguridad y la gobernanza de tu Data Lake
- Nuevos escenarios y soluciones en los que puede evolucionar tu estrategia de Data Fabric
Big Data - Desarrollando soluciones efectivasJoseph Lopez
Como continuación a la presentación titulada "Introducción al mundo de las Bodegas de datos", esta presentación le explicará qué es Big Data y sus beneficios, incluyendo casos de uso. Así mismo, discutiremos cómo Hadoop, la nube y procesamiento masivamente paralelo (MPP) está cambiando la forma en los almacenes de datos se están construyendo. Hablaremos de arquitecturas híbridas que combinan datos in situ con datos en la nube, así como datos relacionales y no relacionales de datos (no estructurados). Veremos también los beneficios del MPP en SMP y cómo integrar datos desde dispositivos en la Internet (IoT). Aprenderemos también lo que debería verse como un almacén de datos moderno y cómo cuadra su papel de un mar de datos y Hadoop. Al finalizar esta exposición, tendremos una orientación sobre la mejor solución para el almacén de datos en el futuro.
1. En los últimos años se han estado gestando innovaciones que poco a
poco han ido permeando a los sistemas de base de datos. Aquí
algunos de los más significativos:
• Base de datos en memoria. La forma en que los datos están organizados y se
manejan es totalmente diferente. Se usan estructuras de datos simples, se
eliminan problemas de transferencia de información. Una operación se
puede ejecutar de 20 a 200 veces más rápido que en sistemas
convencionales. El acceso óptimo es en forma de interfaz de programación
(APIs). Sybase, Oracle, Four Js y otros ofrecen algunas de estas capacidades.
• Almacenamiento columnar. Para análisis estadístico, como almacenes de
datos, es posible almacenar columnas en lugar de renglones, reduciendo la
entrada y salida en forma significativa.
2. • Almacenamiento no relacional. Para agregar grandes cantidades de datos y realizar operaciones de
búsqueda ha aparecido éste modelo. BigTable de Google, SimpleDB de Amazon y Azure Storage de
Microsoft son ejemplos. Algunos proveen funcionalidad para administrar documentos XML, como Tierlogic,
Tamino, XMS. Los sistemas tradicionales incluyendo a Oracle, IBM y Microsoft han extendido sus productos
a tipos de datos geográficos y no-estructurados.
• La nube. Ofrece por primera vez la verdadera posibilidad de almacenamiento ilimitado. Bases de datos en
data centers internos pueden “extenderse” a operar en centros de datos públicos. Microsoft SQL Azure es
el mejor ejemplo.
• Appliances. Para bases de datos de múltiples Terabytes, la “escalabilidad de un solo sistema” continuará
siendo más económica que la nube. Las aplicaciones de misión crítica requieren cada vez más empaquetar
hardware, software y una arquitectura preconfigurada a una carga específica de trabajo. Desde sistemas de
8 procesadores hasta contenedores con miles de servidores preconfigurados a la medida.
• Sensores y tiempo real. En el mundo de los sistemas embebidos que manejan tecnologías como RFID y
eventos en Internet, se hace necesario analizar la información y tomar acción en memoria y antes de
almacenar datos. StreamInsight es una nueva característica en la reciente liberación de Microsoft SQL
Server 2008 “R2”.