14. ¿Qué es un data lake?
Un data lake es un repositorio centralizado diseñado para almacenar, procesar y proteger grandes cantidades
de datos estructurados, semiestructurados o sin estructurar. Puede almacenar datos en su formato nativo y
procesar cualquier variedad de datos, ignorando los límites de tamaño.
15. Un data lake proporciona una plataforma escalable y segura que permite a las empresas realizar las siguientes
tareas: transferir cualquier dato desde cualquier sistema y a cualquier velocidad (incluso si los datos provienen
de sistemas que son locales, de la nube o de procesamiento perimetral); almacenar cualquier tipo o volumen de
datos con fidelidad absoluta; procesar datos en tiempo real o en modo por lotes; y analizar datos mediante SQL,
Python, R o cualquier otro lenguaje, datos de terceros o aplicaciones de estadísticas.
Descripción general de los data lakes
16. Los data lakes se diseñaron con el objetivo principal de controlar grandes volúmenes de macrodatos, por lo que
las empresas pueden mover datos sin procesar por medio de lotes o transmisiones a un data lake sin tener que
transformarlos. Las empresas confían en los data lakes en situaciones clave para lograr los siguientes
objetivos:
Disminuir el costo total de propiedad
Simplificar la administración de datos
Prepararse para incorporar inteligencia artificial y aprendizaje automático
Acelerar la generación de estadísticas
Mejorar la seguridad y el control
¿Necesitas un data lake?