El documento define Big Data como conjuntos de datos de gran volumen, velocidad y variedad procedentes de nuevas fuentes. Explica que Big Data requiere nuevas tecnologías para su procesamiento debido a su tamaño masivo. También describe las tres etapas clave para trabajar con Big Data: integración de datos de múltiples fuentes, gestión del almacenamiento en la nube u on-premises, y análisis de los datos para obtener nuevos conocimientos.
1. Big Data
Que es el Big data:La definición de Big data sondatos que contienen
una mayor variedad y que se presentan en volúmenes crecientes y a mayor
velocidad. Esto se conocetambién como "las tres V".
Dicho de otro modo, el Big data está formado por conjuntos de datos de
mayor tamaño y más complejos, especialmente procedentes de nuevas fuentes
de datos. Estos conjuntos de datos sontan voluminosos que el software de
procesamiento de datos convencional sencillamente no puede gestionarlos. Sin
embargo, estos volúmenes masivos de datos pueden utilizarse para abordar
problemas empresariales que antes no hubiera sido posible solucionar.
Las "tres V" de Big data:
Volumen: La cantidad de datos importa. Con Big data, tendrá que
procesargrandes volúmenes de datos no estructurados de baja densidad.
Puede tratarse de datos de valor desconocido, como feeds de datos de
Twitter, secuencias de clics en una página web o aplicación móvil, o
equipos consensores. Para algunas organizaciones, esto puede suponer
decenas de terabytes de datos. Para otras, incluso cientos de petabytes.
Velocidad: La velocidad es el ritmo al que se reciben los datos y
(posiblemente) al que se aplica alguna acción. La mayor velocidad de
los datos normalmente se transmite directamente a la memoria, en vez
de escribirse en un disco. Algunos productos inteligentes habilitados
para Internet funcionan en tiempo real o prácticamente en tiempo real y
requieren una evaluación y actuación en tiempo real.
Variedad: La variedad hace referencia a los diversos tipos de datos
disponibles. Los tipos de datos convencionales eran estructurados y
podíanorganizarse perfectamente en una basede datos relacional. Con
el auge del Big data, los datos se presentan en nuevos tipos de datos no
estructurados. Los tipos de datos no estructurados y semiestructurados,
como el texto, audio o vídeo, requieren un preprocesamiento adicional
para poderentender su significado y admitir metadatos.
2. El valor y la realidadde Big data:
En los últimos años, han surgido otras "dos V": valor y veracidad. Los datos
poseen un valor intrínseco. Sin embargo, no tienen ninguna utilidad hasta que
dicho valor se descubre. Resulta igualmente importante: ¿cuál es la veracidad
de sus datos y cuánto puede confiar en ellos?
Hoy en día, el big data se ha convertido en un activo crucial. Piense en
algunas de las mayores empresas tecnológicas del mundo. Gran parte del valor
que ofrecen procedede sus datos, que analizan constantemente para generar
una mayor eficiencia y desarrollar nuevos productos.
Avances tecnológicos recientes han reducido exponencialmente el costedel
almacenamiento y la computación de datos, haciendo que almacenar datos
resulte más fácil y barato que nunca. Actualmente, conun mayor volumen de
Big data más barato y accesible, puede tomar decisiones empresariales más
acertadas y precisas.
Identificar el valor del Big data no pasa solo poranalizarlo (que es ya una
ventaja en sí misma). Se trata de todo un proceso dedescubrimiento que
requiere que los analistas, usuarios empresariales y ejecutivos se planteen las
preguntas correctas, identifiquen patrones, formulen hipótesis informadas y
predigan comportamientos.
Historiade Big data:
Si bien el concepto "Big data" en sí mismo es relativamente nuevo, los
orígenes de los grandes conjuntos de datos se remontan a las décadas de 1960
y 1970, cuando el mundo de los datos acababa de empezar conlos primeros
centros de datos y el desarrollo de las bases de datos relacionales.
Alrededor de 2005, la gente empezó a darse cuenta de la cantidad de datos que
generaban los usuarios a través de Facebook, YouTubey otros servicios
online. Ese mismo año, se desarrollaría Hadoop, un marco de código abierto
creado específicamente para almacenar y analizar grandes conjuntos de datos.
En esta época, también empezaría a adquirir popularidad NoSQL.
El desarrollo de marcos de código abierto tales como Hadoop (y, más
recientemente, Spark) seríaesencial para el crecimiento del Big data, pues
3. estos hacían que el Big data resultase más fácil de usar y más barato de
almacenar. En los años siguientes, el volumen de Big data se ha disparado.
Los usuarios continúan generando enormes cantidades de datos, pero ahora los
humanos no son los únicos que lo hacen.
Con la llegada de Internet of Things (IoT), hay un mayor número de objetos y
dispositivos conectados a Internet que generan datos sobrepatrones de uso de
los clientes y el rendimiento de los productos.La aparición del machine
learning ha producido aún más datos.
Aunque el Big data ha llegado lejos, su utilidad no ha hecho más que empezar.
El Cloud Computing ha ampliado aún más las posibilidades del Big data. La
nube ofrece una escalabilidad realmente flexible, dondelos desarrolladores
pueden simplemente incorporar clústeres ad hoc para probarun subconjunto
de datos. Además, las bases de datos orientadas a grafos son cada vez más
importantes, gracias a su capacidad para mostrar enormes cantidades de datos
de forma que la analítica sea rápida y completa.
Ventajas de Big data:
El Big data le permite obtener respuestas más completas, ya que dispone de
mayor cantidad de información.
La disponibilidad de respuestas más completas significa una mayor
fiabilidad de los datos, lo que implica un enfoque completamente distinto a
la hora de abordar problemas.
Casos de uso de Big data:
El Big data puede ayudarle a abordar una serie de actividades empresariales,
desdela experiencia del cliente hasta la analítica. A continuación, recopilamos
algunas de ellas.
Cómo funciona Big data:
El Big data le aporta nuevas perspectivas que abren paso a nuevas
oportunidades y modelos de negocio. Iniciarse en ello requiere de tres
acciones clave:
1. Integre
El Big data concentra datos de numerosas fuentes y aplicaciones distintas. Los
mecanismos de integración de datos convencionales, como extracción,
4. transformación y carga (ETL), generalmente no están a la altura de dicha
tarea. Analizar conjuntos de Big data de uno o más terabytes, o incluso
petabytes, de tamaño requiere de nuevas estrategias y tecnologías.
Durante la integración, es necesario incorporar los datos, procesarlos y
asegurarse de que estén formateados y disponibles de tal forma que los
analistas empresariales puedan empezar a utilizarlos.
2. Gestione
El Big data requiere almacenamiento. Su solución de almacenamiento puede
residir en la nube, on premises o en ambos. Puede almacenar sus datos de
cualquier forma que desee e incorporar los requisitos de procesamiento de su
preferencia y los motores de procesamiento necesarios a dichos conjuntos de
datos on-demand. Muchas personas eligen su solución de almacenamiento en
función de dónderesidan sus datos en cada momento. La nube está
aumentando progresivamente su popularidad porque es compatible consus
requisitos tecnológicos actuales y porque le permite incorporar recursos a
medida que los necesita.
3. Analice
La inversión en Big data se rentabiliza en cuanto se analizan y utilizan los
datos. Adquiera una nueva claridad conun análisis visual de sus diversos
conjuntos de datos. Continúe explorando los datos para realizar nuevos
descubrimientos. Comparta sus hallazgos conotras personas. Construya
modelos de datos con aprendizaje automático e inteligencia artificial. Ponga
sus datos a trabajar.