El documento describe el concepto de Big Data y cómo se refiere a la capacidad de recopilar y procesar grandes cantidades de datos de múltiples fuentes como actividades en línea, uso de dispositivos móviles, redes sociales y más, para generar perfiles detallados de usuarios. El Big Data involucra tres características clave: el volumen masivo de datos, la velocidad en que se generan y procesan los datos, y la variedad de tipos de datos.
2. El término refiere a la capacidad de recopilar y
procesar grandes lotes de datos en mínimos períodos
de tiempo. Pero es una tecnología que va más allá de
la simple obtención y manipulación de datos, sino de
cómo se procesan los datos para generar perfiles de
usuarios, y conocernos en profundidad.
Big Data
3. Big data es una tecnología mucho más abarcadora
sobre la obtención y manipulación de datos que
incluye varias acciones sobre esos datos.
Big Data
4. Esos datos pueden proceder tanto de la actividad de una empresa
como de los propios clientes, de los ciudadanos en su relación con
la administración pública, de la actividad en redes sociales o de la
mera actividad de cada uno de los poseedores de un Smartphone.
Datos
5. Distintas aplicaciones recopilan nuestra actividad digital y esos
datos son procesados por centrales que los comercializan a
empresas de marketing o publicidad.
6. Las redes sociales son básicamente plataformas de marketing, que a diferencia
de otras plataformas estas plantean interacción. Permiten una extrema
segmentación de los perfiles de los usuarios, mucho más allá de cuestiones
demográficas sino por intereses, costumbres, usos, perfiles, etc.
7. Nuestros celulares smartphone dejan todo el tiempo
nuestra huella digital, todo el registro de lo que hacemos
durante cada día: cuánto tiempo pasamos con el celular,
donde comemos y qué, por dónde andamos, etc.
8. Características de los Datos
Las antiguas bases de datos no pueden procesar la cantidad de datos
que circulan a enorme velocidad y provienen de una innumerable
cantidad de fuentes. Justamente, las características principales que
definen este tipo de datos procesados por el Big Data se conocen como
las 3V:
VOLUMEN VELOCIDAD VARIEDAD
DE DATOS
9. Generamos datos constantemente, mientras caminamos alguna app está
reportando nuestra ubicación, un Smartwatch está monitoreando nuestro
pulso cardíaco, un podómetro cuenta nuestros pasos y, si entramos a una
ubicación comercial previamente relevada por Google o alguna aplicación,
nuestro Smartphone tomará el tiempo que dure mi visita. Todo eso con el
celular en el bolsillo. Ni hablar si me pongo a interactuar con el aparato. Toda
la interacción con el Smartphone genera una enorme cantidad de datos.
VOLUMEN
10. VELOCIDAD
En este punto tenemos que diferenciar dos conceptos conocidos como
“tiempo real“ (Real Time) y “alta frecuencia” (Fast Data).
Son dos conceptos muy cercanos, casi correlativos, pero distintos. Con
tiempo real nos referimos a que los datos se recopilan en el mismo
momento en que se generan. Con alta frecuencia estamos mencionando la
regularidad en que esto sucede. Con Fast Data y Real Time también hacemos
mención a la velocidad de procesamiento y toma de decisiones que entran a
jugar en el proceso.
11. La variedad hace referencia a lo
que se conoce como NoSQL, es
decir que se trata de datos que no
requieren estructuras fijas tales
como tablas sino que se basan en
otros sistemas de clasificación y
extracción como claves de valor o
mapeos de grafos, de columnas,
de frecuencias, de píxeles, y cada
día se suman nuevos criterios, es
decir, que se trata de sistemas
escalables, capaces de adaptarse
a nuevas formas de clasificación u
ordenamiento.
VARIEDAD
13. Nuestros nombres, datos, ubicaciones,
hábitos, gustos, números de tarjetas de
crédito, estados de ánimo, compras, son
analizados y clasificados en algoritmos
para conocernos como consumidores,
diseñar un perfil específico para
agencias de publicidad o segmentar
posibles votantes. La información
personal se ha transformado en un
producto más de compra y venta por
parte de corporaciones comerciales a
escala mundial.