El objetivo de este módulo es proporcionar una visión general sobre lo que entendemos por Big Data.
Una vez completado este módulo, podrá:
- Comprender el papel emergente del Big Data
- Entender los términos clave del Big Data y Smart Data
- Saber cómo Big Data puede convertirse en Smart Data
- Ser capaz de aplicar los términos clave en relación con el Big Data
1. Este programa ha sido financiado con
el apoyo de la Comisión Europea.
Módulo 1:
Introducción
al Big Data
2. DATA SET SKILLS FOR BUSINESS
Módulo 1:
Introducción
al
Big Data
El objetivo de este módulo es proporcionar una visión general
sobre lo que entendemos por Big Data.
Una vez completado este módulo, podrá:
- Comprender el papel emergente del Big Data
- Entender los términos clave del Big Data y Smart Data
- Saber cómo Big Data puede convertirse en Smart Data
- Ser capaz de aplicar los términos clave en relación con el Big Data
Duración del módulo: aproximadamente entre 1 y 2 horas.
3. DATA SET SKILLS FOR BUSINESS
2) Las 5 V‘s del Big
Data
4) Caso de estudio
3) ¿Cómo
convertir Big Data
en Smart Data?
• ¿Qué es Big Data?
• Clasificación de los
datos
• Fuentes de datos
• La importancia del
Big Data
1) El papel emergente de
los datos en la formación
continua y la empresa
• Convirtiendo Big Data en valor
• Aplicaciones Smart Data
• ¿Cómo comenzar con Smart
Data?
• Desafíos del Big Data
• Cómo
American Golf
usó el poder
del Big Data
• Volumen
• Velocidad
• Variedad
• Veracidad
• Valor
4. DATA SET SKILLS FOR BUSINESS
El papel emergente de los datos en
la formación continua y la empresa
1. ¿Qué es el Big Data?
2. Clasificación de los datos
3. Fuentes de datos
4. La importancia del Big Data
5. “Big Data es la base de todas las
megatendencias que están sucediendo
hoy en día, desde las redes sociales
hasta los dispositivos móviles, desde
la nube hasta los juegos.”
Chris Lynch
6. DATA SET SKILLS FOR BUSINESS
¿QUÉ ES EL BIG DATA?
Hay algunas cosas que son tan grandes, que tienen implicaciones para
todos, lo queramos o no. Big Data es una de esas cosas, y está
transformando por completo la forma en que hacemos negocios, y está
impactando en muchos aspectos de nuestra vida.
La idea básica detrás del término "Big Data" es que todo lo que hacemos
deja, cada vez más, un rastro digital, que podemos utilizar y analizar.
Por lo tanto, Big Data se refiere a nuestra capacidad de hacer uso de los
volúmenes, cada vez mayores, de datos.
"Datos de un tamaño
muy grande,
normalmente hasta el
punto de que su
manipulación y gestión
presentan importantes
desafíos.“
Diccionario de inglés Oxford,
2013
7. DATA SET SKILLS FOR BUSINESS
CLASIFICACIÓN DE LOS DATOS
Los “datos“ se definen como ‘las cantidades, caracteres o símbolos con los que un
ordenador realiza operaciones, que pueden almacenarse y transmitirse en forma de
señales eléctricas y grabarse en soportes de grabación magnéticos, ópticos o
mecánicos, tal y como muestra Google tras una búsqueda rápida.
“Big Data” se refiere a grandes cantidades de datos que:
₋ Son demasiado grandes para ser procesadas
₋ Son demasiado grandes para ser analizadas por las herramientas tradicionales
₋ No se almacenan o gestionan de forma eficiente
Sin embargo, también hay un enorme potencial en el análisis de grandes volúmenes
de datos. La gestión y el estudio adecuados de los datos pueden ayudar a las empresas
a tomar mejores decisiones basadas en las estadísticas de uso y los intereses de los
usuarios, ayudando así a su crecimiento.
Algunas empresas incluso han desarrollado nuevos productos y servicios, en base a la
información recibida sobre oportunidades detectadas tras analizar grandes volúmenes
de datos.
8. DATA SET SKILLS FOR BUSINESS
DATOS
ESTRUCTURADOS
DATOS NO
ESTRUCTURADOS
DATOS SEMI-
ESTRUCTURADOS
1 2 3
CLASIFICACIÓN DE LOS DATOS
La clasificación es esencial para el estudio de cualquier materia.
En Big Data, los datos se clasifican en tres categorías, que son:
9. DATA SET SKILLS FOR BUSINESS
DATOS
ESTRUCTURADOS
1
Los datos estructurados son aquellos que están almacenados
en bases de datos, de forma ordenada. Representan alrededor
del 20% del total de los datos existentes.
Hay dos fuentes de datos estructurados: las máquinas y los
seres humanos.
Todos los datos recibidos de sensores, registros web y sistemas
financieros se clasifican en datos generados por la máquina.
Como por ejemplo, dispositivos médicos, datos de un GPS,
datos de estadísticas de uso obtenidos a través de servidores o
aplicaciones, y la enorme cantidad de datos que se generan en
las plataformas de intercambio de activos financieros.
Los datos estructurados generados por el ser humano
incluyen principalmente todos los datos que el ser
humano introduce en un ordenador, como su nombre y
otros datos personales. Cuando una persona hace clic en
un enlace en Internet, o incluso hace un movimiento en
un juego, se crean datos.
10. DATA SET SKILLS FOR BUSINESS
DATOS
ESTRUCTURADOS
Empleado_ID Empleado_Nombre Género Departamento Sueldo_en_Euros
2365 Rajesh Kulkarni Hombre Finanzas 65000
3398 Pratibha Joshi Mujer Admin 65000
7465 Shushil Roy Hombre Admin 50000
7500 Shubhojit Das Hombre Finanzas 50000
7699 Priya Sane Mujer Finanzas 55000
Una tabla “Empleados” en una base
de datos es un ejemplo de Datos
Estructurados.
Ejemplo de Datos
Estructurados
1
11. DATA SET SKILLS FOR BUSINESS
DATOS NO
ESTRUCTURADOS
2
Los datos no estructurados son lo opuesto a
los datos estructurados: no tienen un
formato claro de almacenamiento.
Alrededor del 80% del total de los datos son no
estructurados. La mayoría de los datos que una
persona encuentra pertenecen a esta categoría y
hasta hace poco, no había mucho que hacer con
ellos excepto almacenarlos o analizarlos
manualmente.
Los datos no estructurados también se
clasifican según su origen, en datos generados
por la máquina o por el ser humano. Ejemplos
de datos generados por máquinas pueden ser
las imágenes de un satélite, datos científicos de
diferentes experimentos, o los datos
capturados por un radar.
12. DATA SET SKILLS FOR BUSINESS
DATOS NO
ESTRUCTURADOS
2 Los datos no estructurados generados por el ser humano se
encuentran en abundancia en Internet, ya que incluyen datos de
medios sociales, datos de móviles y contenido de sitios web. Esto
significa que las fotos que subimos a nuestro Facebook o
Instagram, los videos que vemos en YouTube e incluso los
mensajes de texto que enviamos contribuyen al enorme volumen
de datos no estructurados.
Ejemplo de Datos No
Estructurados
Resultados obtenidos tras una
búsqueda en Google.
13. DATA SET SKILLS FOR BUSINESS
DATOS SEMI-
ESTRUCTURADOS
3
Los datos semiestructurados a
simple vista parecen no estar
estructurados, por lo que pueden
ser difíciles de analizar.
La información que no está en formato de base
de datos tradicional como datos estructurados,
sino que contiene algunas propiedades
organizativas que facilitan el procesamiento, se
consideran datos semiestructurados.
Por ejemplo, los documentos NoSQL
se consideran semiestructurados, ya
que contienen palabras clave que
pueden utilizarse para procesar el
documento fácilmente.
14. DATA SET SKILLS FOR BUSINESS
DATOS SEMI-
ESTRUCTURADOS
Un mensaje de correo electrónico es un ejemplo de datos semi-
estructurados. Incluye campos de datos bien definidos en el encabezado,
como el remitente, etc., mientras que el cuerpo del mensaje no está
estructurado.
Si desea saber quién está enviando correos electrónicos, a quién y cuándo
(información contenida en el encabezado), una base de datos relacional
podría ser una buena opción. Pero si está más interesado en el contenido del
mensaje, herramientas vinculadas a Big Data, como el procesamiento del
lenguaje natural, serán mejores opciones.
Ejemplo de Datos Semi-
Estructurados
Datos personales almacenados
en un fichero XML.
3
15. DATA SET SKILLS FOR BUSINESS
Los datos de los medios sociales están proporcionando a las empresas
información notable sobre el comportamiento y el sentimiento de los
consumidores, que pueden integrar con los datos de sus CRM para su análisis.
Hablamos de casi 400 millones de tweets publicados en Twitter cada día, 3.540
millones de Likes y comentarios añadidos en Facebook cada día, y 72 horas de
vídeo subido a YouTube cada minuto (esto es lo que se entiende por velocidad
de datos).
Los datos de las máquinas consisten en información generada por equipos
industriales, datos en tiempo real de sensores que rastrean piezas y monitorizan
maquinaria (a menudo también se referencia como Internet de las Cosas) e
incluso registros web que registran el comportamiento del usuario en línea. En el
CERN, el mayor centro de investigación en física de partículas del mundo, el Gran
Colisionador de Hadrones (LHC) genera 40 terabytes de datos cada segundo
durante los experimentos.
Con respecto a los datos transaccionales, los grandes minoristas e incluso las
empresas B2B pueden generar una gran cantidad de datos de forma regular
considerando que sus transacciones consisten en uno o varios artículos,
identificadores de productos, precios, información de pago, datos de fabricantes
y distribuidores, y mucho más.
Fuentes
de
datos
16. Los usuarios de
WhatsApp
comparten
347.222
fotos
Cada
minuto
de cada
día
Los usuarios de
correo electrónico
envían
204
millones
de mensajes
Los usuarios de
YouTube suben
4.320
minutos de
nuevos vídeos
Google recibe más de
4.000.000
de consultas de
búsqueda
Los usuarios de
Facebook
comparten
2.460.000
piezas de contenido
Los usuarios de
Twitter tuitean
277.000
veces
Amazon vende
83.000
dólares
Los usuarios de
Instagram
publican
216.000
nuevas fotos
Ejemplos de datos de medios sociales
DATA SET SKILLS FOR BUSINESS
17. Datos generados por las máquinas
Los datos de las máquinas están en todas partes. Desde aviones y ascensores, hasta
semáforos y dispositivos de control de la aptitud física.
Recientemente, los datos de las máquinas han cobrado mayor atención a medida que ha
crecido el uso del Internet de las Cosas, Hadoop y otras tecnologías relacionadas con la
gestión de grandes volúmenes de datos.
Los registros de aplicaciones, servidores y procesos de negocio, registros detallados de
llamadas y datos de sensores son los principales ejemplos de datos generados por las
máquinas. También lo son los datos de flujo de clics en Internet y los registros de actividad de
un sitio web.
DATA SET SKILLS FOR BUSINESS
Se espera que la combinación de datos de máquinas con otros tipos de datos
empresariales para el análisis proporcione nuevas perspectivas y conocimientos
sobre las actividades y operaciones de negocio. Los datos generados por las
máquinas son el alma del Internet de las cosas (IoT).
18. DATA SET SKILLS FOR BUSINESS
En pocas palabras, el Internet de las Cosas es el
concepto de conectar básicamente cualquier
dispositivo con un interruptor de encendido y
apagado a Internet (y/o entre sí). Esto incluye
todo, desde teléfonos móviles, cafeteras,
lavadoras, auriculares, lámparas, dispositivos
que se pueden llevar puestos y casi cualquier
otra cosa que se te ocurra. Esto también se
aplica a los componentes de las máquinas, por
ejemplo, el motor a reacción de un avión o el
taladro de una plataforma petrolífera.
Internet de las Cosas (IoT)
Datos generados por las máquinas
19. Datos Transaccionales
Los datos transaccionales son información derivada directamente como
resultado de transacciones. A diferencia de otros tipos de datos, los
datos transaccionales contienen una dimensión temporal que significa
que son oportunos y que, con el tiempo, se vuelven menos relevantes.
En lugar de ser el objeto de las transacciones como el producto que se
compra, o la identidad del cliente, son más bien datos de referencia que
describen el tiempo, el lugar, los precios, los métodos de pago, el
descuento aplicado y las cantidades relacionadas con esa transacción
concreta, normalmente en el punto de venta.
DATA SET SKILLS FOR BUSINESS
20. Datos Transaccionales
Compras Devoluciones Facturas Pagos Créditos
Donaciones Clientes Dividendos Contratos Intereses
Nóminas Préstamos Reservas Altas Subscripciones
Ejemplos de datos transaccionales:
DATA SET SKILLS FOR BUSINESS
21. LA IMPORTANCIA DEL BIG DATA
DATA SET SKILLS FOR BUSINESS
La importancia del Big Data no gira
en torno a la cantidad de datos de
que dispone una empresa, sino
cómo utiliza los datos recopilados.
Cada empresa utiliza los datos a su
manera; cuanto más eficiente es
una empresa utilizando sus datos,
más potencial tiene para crecer. La
empresa puede obtener datos de
cualquier fuente y analizarlos para
encontrar respuestas que le
permitan:
22. LA IMPORTANCIA DEL BIG DATA
•Algunas herramientas Big Data pueden aportar ventajas de costes a las empresas
cuando se almacenan grandes volúmenes de datos. Estas herramientas también ayudan
a identificar formas más eficientes de hacer negocios.
Ahorrar Costes
•La alta velocidad de las herramientas y los análisis en memoria pueden identificar
fácilmente nuevas fuentes de datos, lo que ayuda a las empresas a analizar los datos
inmediatamente y a tomar decisiones rápidas basadas en los descubrimientos.
Reducir Tiempos
•Al conocer las tendencias de las necesidades y la satisfacción de los clientes a través de
la analítica, se pueden crear productos de acuerdo con las necesidades de los clientes.
Desarrollar Nuevos Productos
•Analizando grandes volúmenes de datos se puede obtener una mejor comprensión de
las condiciones actuales del mercado. Por ejemplo, analizando el comportamiento de
compra de los clientes, una empresa puede identificar los productos que más se venden
y fabricar productos de acuerdo con esta tendencia.
Comprender las Circunstancias de Mercado
•Las herramientas Big Data permiten realizar un análisis de sentimiento. Por lo tanto, se
puede obtener feedback sobre quién está diciendo qué sobre su empresa. Si se desea
supervisar y mejorar la presencia en línea del negocio, entonces, las herramientas Big
Data pueden ayudar en este sentido.
Controlar la Reputación Online
DATA SET SKILLS FOR BUSINESS
23. DATA SET SKILLS FOR BUSINESS
¿Por qué no hace un DESCANSO y
VISUALIZA el Vídeo 1 que puede
encontrar en la sección Recursos?
What is Big Data and why does it matter?
Donna Green (Ted X Talk)
25. LAS 5 V‘s DEL BIG DATA
Volumen
Velocidad
Variedad
Veracidad
Valor
El 90% de los datos del
mundo de hoy se han
creado en los 2 últimos años
¡Literalmente a la velocidad
de la luz! Los datos se
duplican cada 40 meses
Datos estructurados,
semiestructurados y no
estructurados
Debido al anonimato de Internet,
o a la posibilidad de crear
identidades falsas, a menudo se
cuestiona la fiabilidad de los datos
Tener acceso a grandes
volúmenes de datos no es útil
a menos que podamos
convertirlo en valor
La magnitud de
los datos que se
generan.
La velocidad a la
que se generan y
agregan los datos.
Los diferentes
tipos de datos.
La confianza que se
establece sobre los
datos a utilizar.
El valor económico
de los datos.
Big Data hace un buen trabajo al decirnos qué sucedió, pero no por qué pasó o qué hacer
al respecto. Las 5 V's representan características y propiedades específicas que pueden
ayudarnos a comprender tanto los desafíos como las ventajas de las iniciativas de Big Data.
DATA SET SKILLS FOR BUSINESS
26. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VOLUMEN
El volumen se refiere a la gran cantidad de datos que se generan cada
segundo.
Piense en todos los correos electrónicos, mensajes de Twitter, fotos,
clips de vídeo, datos de sensores, etc. que producimos y compartimos
cada segundo.
Sólo en Facebook enviamos 10 mil millones de mensajes al día,
hacemos clic en el botón "Me gusta" 4,5 mil millones de veces y
cargamos 350 millones de fotos nuevas cada día.
Esto hace que cada vez más los conjuntos de datos sean demasiado
grandes para almacenarlos y analizarlos utilizando la tecnología
tradicional de bases de datos. Con la tecnología Big Data ahora
podemos almacenar y utilizar estos conjuntos de datos con la ayuda
de sistemas distribuidos, en los que partes de los datos se almacenan
en diferentes lugares y se agrupan mediante software.
DATA SET SKILLS FOR BUSINESS
27. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VELOCIDAD
La velocidad se refiere a la velocidad a la que se generan los
nuevos datos y a la velocidad a la que se mueven los datos.
Piense en los mensajes de los medios sociales que se
hacen virales en segundos, en la velocidad con la que se
comprueban las transacciones de las tarjetas de crédito
en busca de actividades fraudulentas o en los
milisegundos que tardan los sistemas de comercio en
analizar las redes de medios sociales para captar las
señales que desencadenan las decisiones de compra o
venta de acciones.
La tecnología Big Data ahora nos permite analizar los datos
mientras se están generando, sin necesidad de introducirlos
en bases de datos.
28. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VARIEDAD
La variedad se refiere a los diferentes tipos de datos que
se pueden utilizar ahora. En el pasado nos centramos en
datos estructurados que encajan perfectamente en tablas
o bases de datos relacionales.
Piense en fotos, secuencias de vídeo o
actualizaciones de medios sociales.
Con la tecnología Big Data ahora podemos explotar
diferentes tipos de datos, incluyendo mensajes,
conversaciones de medios sociales, fotos, datos de
sensores, vídeo o grabaciones de voz y reunirlos con
datos tradicionales y estructurados.
DATA SET SKILLS FOR BUSINESS
29. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VERACIDAD
La veracidad se refiere a la confiabilidad de los datos.
Con muchas fuentes Big Data, la calidad y la precisión son
menos controlables.
Piense en las publicaciones de Twitter con etiquetas
hash, abreviaturas, errores tipográficos y expresiones
coloquiales, así como en la credibilidad y exactitud
del contenido.
Big Data y la tecnología de análisis permiten trabajar
ahora con este tipo de datos. Los volúmenes a menudo
compensan la falta de calidad o precisión.
30. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VALOR
Valor: está muy bien tener acceso a grandes
volúmenes de datos, pero a menos que
podamos convertirlos en valor es algo inútil.
Por lo tanto, se puede argumentar con
seguridad que el ‘Valor' es la V más
importante del Big Data. Es importante que
los negocios realicen un caso de negocio para
cualquier intento de recolectar y aprovechar
los grandes volúmenes de datos. Es muy fácil
caer en la trampa de los rumores y
embarcarse en grandes iniciativas de datos
sin una clara comprensión de los costes y
beneficios.
Big Data puede aportar valor en casi cualquier área de la empresa
o la sociedad:
Ayuda a las empresas a comprender y servir mejor a los clientes: algunos
ejemplos son las recomendaciones hechas por Amazon o Netflix.
Permite a las empresas optimizar sus procesos: Uber es capaz de
predecir la demanda, fijar dinámicamente el precio de los viajes y enviar
al conductor más cercano a los clientes.
Mejora nuestro cuidado de la salud: las agencias gubernamentales ahora
pueden predecir los brotes de gripe y hacer un seguimiento de los
mismos en tiempo real, y las compañías farmacéuticas pueden utilizar Big
Data para acelerar el desarrollo de medicamentos.
Ayuda a mejorar la seguridad: el gobierno y las fuerzas de seguridad
utilizan Big Data para frustrar los ataques terroristas y detectar
ciberdelitos.
Permite a las estrellas del deporte mejorar su rendimiento: los sensores
en los balones, las cámaras en el campo y los localizadores GPS en su
ropa permiten a los atletas analizar y mejorar lo que hacen.
DATA SET SKILLS FOR BUSINESS
31. CÓMO CONVERTIR BIG DATA
EN SMART DATA
1. Convirtiendo Big Data en Valor
2. Aplicaciones del Smart Data
3. ¿Cómo comenzar con Smart Data?
4. Desafíos del Big Data
DATA SET SKILLS FOR BUSINESS
32. APLICACIONES DEL SMART DATA
DATA SET SKILLS FOR BUSINESS
Todos los negocios del mundo
necesitan datos para prosperar.
Los datos son los que le dicen
quiénes son sus clientes y cómo
actúan, y son los que pueden
guiarle hacia nuevos
conocimientos y nuevas
innovaciones, pero primero es
necesario encontrar el área de
interés adecuada.
33. APLICACIONES DEL SMART DATA
• Detección y
prevención del
fraude
• Análisis del sentimiento
de la marca
• Precios en tiempo real
• Colocación de
productos
• Publicidad
microdirigida
• Monitorizar las visitas
de los pacientes
• Cuidado y seguridad
del paciente
• Reducir las tasas de
readmisión
• Smart meter-stream
analysis
• Proactive equipment
repair
• Power and
consuption matching
• Diagnóstico de
torres
repetidoras
• Atribución de
ancho de banda
• Mantenimiento
preventivo
• Disminución del tiempo
de lanzamiento
• Planificación del
suministro
• Aumentar la calidad del
producto
• Detección y
prevención de
intrusiones en la red
• Detección de brotes
de enfermedades
• Detección y
monitorización de
conducción insegura
• Planificación de rutas
y tiempos para el
transporte público
SERVICIOS FINANCIEROS VENTA AL POR MENOR TELECOMUNICACIONES FABRICACIÓN
SALUD
SERVICIOS PÚBLICOS,
PETROLEO Y GAS
SECTOR PÚBLICO TRANSPORTE
DATA SET SKILLS FOR BUSINESS
34. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
¿CÓMO COMENZAR CON SMART DATA?
A pesar de que las herramientas de análisis y visualización de datos han recorrido un
largo camino en la última década, el análisis Big Data sigue dependiendo de la
intervención y coordinación humana para tener éxito. Es necesario saber cómo
hacer las preguntas correctas, cómo eliminar su propio sesgo y cómo formar ideas
viables en lugar de conclusiones básicas.
1. Revise los
datos.
•¿Qué datos tiene?
•¿Cómo se usan?
•¿Tiene experiencia
gestionando sus
datos?
2. Haga las
preguntas
correctas.
• ¿Qué datos
tiene y que uso
se hace de
ellos?
• ¿Está siendo lo
suficiente
concreto?
3. Obtenga
conclusiones.
•¿Podría un experto
ayudar a
comprobar sus
resultados?
•¿Puede validar sus
hipótesis?
•¿Qué otros datos
necesita?
DATA SET SKILLS FOR BUSINESS
35. DESAFÍOS DEL BIG DATA
FALTA DE TALENTO
Para implementar con éxito un
proyecto Big Data se requiere
un equipo sofisticado de
desarrolladores, científicos de
datos y analistas que también
tengan un suficiente
conocimiento del dominio para
identificar ideas valiosas para
el negocio
Es fácil quedar atrapado por el entusiasmo y las oportunidades del Big Data. Sin
embargo, una de las razones por las que el Big Data está tan infrautilizado es porque el
Big Data y las tecnologías asociadas presentan también muchos desafíos.
Un estudio reveló que el 55% de los proyectos Big Data nunca se terminan. Entonces,
¿cuál es el problema con el Big Data?
ESCALABILIDAD
Muchas organizaciones
no tienen en cuenta la
rapidez con la que un
proyecto Big Data puede
crecer y evolucionar. Las
cargas de trabajo en Big
Data tienden a ser a
intervalos, lo que dificulta
la asignación de
capacidad para los
recursos
PROYECTOS
VIABLES
Un desafío clave para
los equipos de ciencia
de datos es identificar
un objetivo de negocio
claro, y las fuentes de
datos apropiadas para
recopilar y analizar,
para alcanzar ese
objetivo
SEGURIDAD
Entre los desafíos específicos se
incluyen los siguientes:
- Autenticación para cada miembro
del equipo que acceda a los datos
- Restricción del acceso en función
de las necesidades de cada usuario
- Registro de los accesos a los datos
y cumplimiento de normativa
- Uso adecuado del cifrado en datos
en tránsito y en reposo
GESTIÓN DE
COSTES
Las empresas que
realizan proyectos Big
Data deben recordar el
coste de la formación, el
mantenimiento y la
expansión
DATA SET SKILLS FOR BUSINESS
CALIDAD DEL
DATO
Las causas más habituales
de disponer “datos sucios”
son las siguientes: errores
de entrada del usuario,
datos duplicados y
vinculación de datos
errónea
36. DATA SET SKILLS FOR BUSINESS
¿Por qué no haces un DESCANSO y
LEES el Artículo 1 que podrás
encontrar en la sección Recursos? :
The emerging role of Big Data in key
development issues: Opportunities,
challenges, and concerns
Nir Kshetr
37. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
CASO DE ESTUDIO:
Cómo AG utilizó el poder del Big Data
ANTECEDENTES
Cada vez que realizas una compra, compartes con los
vendedores detalles personales sobre tus patrones de
consumo. Muchos de ellos estudian esos detalles para
determinar lo que te gusta, lo que necesitas y qué
promociones tienen más probabilidades de convencerte para
volver a comprar. American Golf, el mayor vendedor minorista
de artículos de golf de Europa, por ejemplo, ha descubierto
cómo analizar y encontrar valor entre los datos de sus
clientes.
DATA SET SKILLS FOR BUSINESS
38. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
CASO DE ESTUDIO:
Cómo AG utilizó el poder del Big Data
LAS FUENTES DE DATOS DE AG
AG asigna a cada cliente un número de identificación de
Invitado, vinculado a su tarjeta de crédito, nombre o dirección
de correo electrónico, que se convierte en un cubo que
almacena un historial de todo lo que ha comprado y cualquier
información demográfica que AG haya recopilado de ellos o que
haya comprado de otras fuentes. Utilizando eso, su analista
analizó los datos históricos de compra de todos los clientes que
se habían dado de alta.
DATA SET SKILLS FOR BUSINESS
39. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
CASO DE ESTUDIO:
Cómo AG utilizó el poder del Big Data
CONCLUSIÓN
El analista realizó una prueba tras otra, analizando los datos,
y en poco tiempo surgieron algunos patrones útiles. Los
guantes, por ejemplo. Muchos clientes compran guantes de
golf, pero uno de los colegas de Pole advirtió que estaban
comprando artículos de golf más pequeños, especialmente
guantes en los seis meses anteriores a su retiro. Otro analista
observó que en esta ventana de 6 meses la frecuencia de
visitas a las tiendas aumentó.
DATA SET SKILLS FOR BUSINESS
40. DATA SET SKILLS FOR BUSINESS
Concluya leyendo el Artículo 2
que podrá encontrar en la
sección Recursos:
Big Data:
The Management Revolution
Andrew McAfee y Erik Brynjolfsson