SlideShare una empresa de Scribd logo
1 de 41
Este programa ha sido financiado con
el apoyo de la Comisión Europea.
Módulo 1:
Introducción
al Big Data
DATA SET SKILLS FOR BUSINESS
Módulo 1:
Introducción
al
Big Data
El objetivo de este módulo es proporcionar una visión general
sobre lo que entendemos por Big Data.
Una vez completado este módulo, podrá:
- Comprender el papel emergente del Big Data
- Entender los términos clave del Big Data y Smart Data
- Saber cómo Big Data puede convertirse en Smart Data
- Ser capaz de aplicar los términos clave en relación con el Big Data
Duración del módulo: aproximadamente entre 1 y 2 horas.
DATA SET SKILLS FOR BUSINESS
2) Las 5 V‘s del Big
Data
4) Caso de estudio
3) ¿Cómo
convertir Big Data
en Smart Data?
• ¿Qué es Big Data?
• Clasificación de los
datos
• Fuentes de datos
• La importancia del
Big Data
1) El papel emergente de
los datos en la formación
continua y la empresa
• Convirtiendo Big Data en valor
• Aplicaciones Smart Data
• ¿Cómo comenzar con Smart
Data?
• Desafíos del Big Data
• Cómo
American Golf
usó el poder
del Big Data
• Volumen
• Velocidad
• Variedad
• Veracidad
• Valor
DATA SET SKILLS FOR BUSINESS
El papel emergente de los datos en
la formación continua y la empresa
1. ¿Qué es el Big Data?
2. Clasificación de los datos
3. Fuentes de datos
4. La importancia del Big Data
“Big Data es la base de todas las
megatendencias que están sucediendo
hoy en día, desde las redes sociales
hasta los dispositivos móviles, desde
la nube hasta los juegos.”
Chris Lynch
DATA SET SKILLS FOR BUSINESS
¿QUÉ ES EL BIG DATA?
Hay algunas cosas que son tan grandes, que tienen implicaciones para
todos, lo queramos o no. Big Data es una de esas cosas, y está
transformando por completo la forma en que hacemos negocios, y está
impactando en muchos aspectos de nuestra vida.
La idea básica detrás del término "Big Data" es que todo lo que hacemos
deja, cada vez más, un rastro digital, que podemos utilizar y analizar.
Por lo tanto, Big Data se refiere a nuestra capacidad de hacer uso de los
volúmenes, cada vez mayores, de datos.
"Datos de un tamaño
muy grande,
normalmente hasta el
punto de que su
manipulación y gestión
presentan importantes
desafíos.“
Diccionario de inglés Oxford,
2013
DATA SET SKILLS FOR BUSINESS
CLASIFICACIÓN DE LOS DATOS
Los “datos“ se definen como ‘las cantidades, caracteres o símbolos con los que un
ordenador realiza operaciones, que pueden almacenarse y transmitirse en forma de
señales eléctricas y grabarse en soportes de grabación magnéticos, ópticos o
mecánicos, tal y como muestra Google tras una búsqueda rápida.
“Big Data” se refiere a grandes cantidades de datos que:
₋ Son demasiado grandes para ser procesadas
₋ Son demasiado grandes para ser analizadas por las herramientas tradicionales
₋ No se almacenan o gestionan de forma eficiente
Sin embargo, también hay un enorme potencial en el análisis de grandes volúmenes
de datos. La gestión y el estudio adecuados de los datos pueden ayudar a las empresas
a tomar mejores decisiones basadas en las estadísticas de uso y los intereses de los
usuarios, ayudando así a su crecimiento.
Algunas empresas incluso han desarrollado nuevos productos y servicios, en base a la
información recibida sobre oportunidades detectadas tras analizar grandes volúmenes
de datos.
DATA SET SKILLS FOR BUSINESS
DATOS
ESTRUCTURADOS
DATOS NO
ESTRUCTURADOS
DATOS SEMI-
ESTRUCTURADOS
1 2 3
CLASIFICACIÓN DE LOS DATOS
La clasificación es esencial para el estudio de cualquier materia.
En Big Data, los datos se clasifican en tres categorías, que son:
DATA SET SKILLS FOR BUSINESS
DATOS
ESTRUCTURADOS
1
Los datos estructurados son aquellos que están almacenados
en bases de datos, de forma ordenada. Representan alrededor
del 20% del total de los datos existentes.
Hay dos fuentes de datos estructurados: las máquinas y los
seres humanos.
Todos los datos recibidos de sensores, registros web y sistemas
financieros se clasifican en datos generados por la máquina.
Como por ejemplo, dispositivos médicos, datos de un GPS,
datos de estadísticas de uso obtenidos a través de servidores o
aplicaciones, y la enorme cantidad de datos que se generan en
las plataformas de intercambio de activos financieros.
Los datos estructurados generados por el ser humano
incluyen principalmente todos los datos que el ser
humano introduce en un ordenador, como su nombre y
otros datos personales. Cuando una persona hace clic en
un enlace en Internet, o incluso hace un movimiento en
un juego, se crean datos.
DATA SET SKILLS FOR BUSINESS
DATOS
ESTRUCTURADOS
Empleado_ID Empleado_Nombre Género Departamento Sueldo_en_Euros
2365 Rajesh Kulkarni Hombre Finanzas 65000
3398 Pratibha Joshi Mujer Admin 65000
7465 Shushil Roy Hombre Admin 50000
7500 Shubhojit Das Hombre Finanzas 50000
7699 Priya Sane Mujer Finanzas 55000
Una tabla “Empleados” en una base
de datos es un ejemplo de Datos
Estructurados.
Ejemplo de Datos
Estructurados
1
DATA SET SKILLS FOR BUSINESS
DATOS NO
ESTRUCTURADOS
2
Los datos no estructurados son lo opuesto a
los datos estructurados: no tienen un
formato claro de almacenamiento.
Alrededor del 80% del total de los datos son no
estructurados. La mayoría de los datos que una
persona encuentra pertenecen a esta categoría y
hasta hace poco, no había mucho que hacer con
ellos excepto almacenarlos o analizarlos
manualmente.
Los datos no estructurados también se
clasifican según su origen, en datos generados
por la máquina o por el ser humano. Ejemplos
de datos generados por máquinas pueden ser
las imágenes de un satélite, datos científicos de
diferentes experimentos, o los datos
capturados por un radar.
DATA SET SKILLS FOR BUSINESS
DATOS NO
ESTRUCTURADOS
2 Los datos no estructurados generados por el ser humano se
encuentran en abundancia en Internet, ya que incluyen datos de
medios sociales, datos de móviles y contenido de sitios web. Esto
significa que las fotos que subimos a nuestro Facebook o
Instagram, los videos que vemos en YouTube e incluso los
mensajes de texto que enviamos contribuyen al enorme volumen
de datos no estructurados.
Ejemplo de Datos No
Estructurados
Resultados obtenidos tras una
búsqueda en Google.
DATA SET SKILLS FOR BUSINESS
DATOS SEMI-
ESTRUCTURADOS
3
Los datos semiestructurados a
simple vista parecen no estar
estructurados, por lo que pueden
ser difíciles de analizar.
La información que no está en formato de base
de datos tradicional como datos estructurados,
sino que contiene algunas propiedades
organizativas que facilitan el procesamiento, se
consideran datos semiestructurados.
Por ejemplo, los documentos NoSQL
se consideran semiestructurados, ya
que contienen palabras clave que
pueden utilizarse para procesar el
documento fácilmente.
DATA SET SKILLS FOR BUSINESS
DATOS SEMI-
ESTRUCTURADOS
Un mensaje de correo electrónico es un ejemplo de datos semi-
estructurados. Incluye campos de datos bien definidos en el encabezado,
como el remitente, etc., mientras que el cuerpo del mensaje no está
estructurado.
Si desea saber quién está enviando correos electrónicos, a quién y cuándo
(información contenida en el encabezado), una base de datos relacional
podría ser una buena opción. Pero si está más interesado en el contenido del
mensaje, herramientas vinculadas a Big Data, como el procesamiento del
lenguaje natural, serán mejores opciones.
Ejemplo de Datos Semi-
Estructurados
Datos personales almacenados
en un fichero XML.
3
DATA SET SKILLS FOR BUSINESS
Los datos de los medios sociales están proporcionando a las empresas
información notable sobre el comportamiento y el sentimiento de los
consumidores, que pueden integrar con los datos de sus CRM para su análisis.
Hablamos de casi 400 millones de tweets publicados en Twitter cada día, 3.540
millones de Likes y comentarios añadidos en Facebook cada día, y 72 horas de
vídeo subido a YouTube cada minuto (esto es lo que se entiende por velocidad
de datos).
Los datos de las máquinas consisten en información generada por equipos
industriales, datos en tiempo real de sensores que rastrean piezas y monitorizan
maquinaria (a menudo también se referencia como Internet de las Cosas) e
incluso registros web que registran el comportamiento del usuario en línea. En el
CERN, el mayor centro de investigación en física de partículas del mundo, el Gran
Colisionador de Hadrones (LHC) genera 40 terabytes de datos cada segundo
durante los experimentos.
Con respecto a los datos transaccionales, los grandes minoristas e incluso las
empresas B2B pueden generar una gran cantidad de datos de forma regular
considerando que sus transacciones consisten en uno o varios artículos,
identificadores de productos, precios, información de pago, datos de fabricantes
y distribuidores, y mucho más.
Fuentes
de
datos
Los usuarios de
WhatsApp
comparten
347.222
fotos
Cada
minuto
de cada
día
Los usuarios de
correo electrónico
envían
204
millones
de mensajes
Los usuarios de
YouTube suben
4.320
minutos de
nuevos vídeos
Google recibe más de
4.000.000
de consultas de
búsqueda
Los usuarios de
Facebook
comparten
2.460.000
piezas de contenido
Los usuarios de
Twitter tuitean
277.000
veces
Amazon vende
83.000
dólares
Los usuarios de
Instagram
publican
216.000
nuevas fotos
Ejemplos de datos de medios sociales
DATA SET SKILLS FOR BUSINESS
Datos generados por las máquinas
Los datos de las máquinas están en todas partes. Desde aviones y ascensores, hasta
semáforos y dispositivos de control de la aptitud física.
Recientemente, los datos de las máquinas han cobrado mayor atención a medida que ha
crecido el uso del Internet de las Cosas, Hadoop y otras tecnologías relacionadas con la
gestión de grandes volúmenes de datos.
Los registros de aplicaciones, servidores y procesos de negocio, registros detallados de
llamadas y datos de sensores son los principales ejemplos de datos generados por las
máquinas. También lo son los datos de flujo de clics en Internet y los registros de actividad de
un sitio web.
DATA SET SKILLS FOR BUSINESS
Se espera que la combinación de datos de máquinas con otros tipos de datos
empresariales para el análisis proporcione nuevas perspectivas y conocimientos
sobre las actividades y operaciones de negocio. Los datos generados por las
máquinas son el alma del Internet de las cosas (IoT).
DATA SET SKILLS FOR BUSINESS
En pocas palabras, el Internet de las Cosas es el
concepto de conectar básicamente cualquier
dispositivo con un interruptor de encendido y
apagado a Internet (y/o entre sí). Esto incluye
todo, desde teléfonos móviles, cafeteras,
lavadoras, auriculares, lámparas, dispositivos
que se pueden llevar puestos y casi cualquier
otra cosa que se te ocurra. Esto también se
aplica a los componentes de las máquinas, por
ejemplo, el motor a reacción de un avión o el
taladro de una plataforma petrolífera.
Internet de las Cosas (IoT)
Datos generados por las máquinas
Datos Transaccionales
Los datos transaccionales son información derivada directamente como
resultado de transacciones. A diferencia de otros tipos de datos, los
datos transaccionales contienen una dimensión temporal que significa
que son oportunos y que, con el tiempo, se vuelven menos relevantes.
En lugar de ser el objeto de las transacciones como el producto que se
compra, o la identidad del cliente, son más bien datos de referencia que
describen el tiempo, el lugar, los precios, los métodos de pago, el
descuento aplicado y las cantidades relacionadas con esa transacción
concreta, normalmente en el punto de venta.
DATA SET SKILLS FOR BUSINESS
Datos Transaccionales
Compras Devoluciones Facturas Pagos Créditos
Donaciones Clientes Dividendos Contratos Intereses
Nóminas Préstamos Reservas Altas Subscripciones
Ejemplos de datos transaccionales:
DATA SET SKILLS FOR BUSINESS
LA IMPORTANCIA DEL BIG DATA
DATA SET SKILLS FOR BUSINESS
La importancia del Big Data no gira
en torno a la cantidad de datos de
que dispone una empresa, sino
cómo utiliza los datos recopilados.
Cada empresa utiliza los datos a su
manera; cuanto más eficiente es
una empresa utilizando sus datos,
más potencial tiene para crecer. La
empresa puede obtener datos de
cualquier fuente y analizarlos para
encontrar respuestas que le
permitan:
LA IMPORTANCIA DEL BIG DATA
•Algunas herramientas Big Data pueden aportar ventajas de costes a las empresas
cuando se almacenan grandes volúmenes de datos. Estas herramientas también ayudan
a identificar formas más eficientes de hacer negocios.
Ahorrar Costes
•La alta velocidad de las herramientas y los análisis en memoria pueden identificar
fácilmente nuevas fuentes de datos, lo que ayuda a las empresas a analizar los datos
inmediatamente y a tomar decisiones rápidas basadas en los descubrimientos.
Reducir Tiempos
•Al conocer las tendencias de las necesidades y la satisfacción de los clientes a través de
la analítica, se pueden crear productos de acuerdo con las necesidades de los clientes.
Desarrollar Nuevos Productos
•Analizando grandes volúmenes de datos se puede obtener una mejor comprensión de
las condiciones actuales del mercado. Por ejemplo, analizando el comportamiento de
compra de los clientes, una empresa puede identificar los productos que más se venden
y fabricar productos de acuerdo con esta tendencia.
Comprender las Circunstancias de Mercado
•Las herramientas Big Data permiten realizar un análisis de sentimiento. Por lo tanto, se
puede obtener feedback sobre quién está diciendo qué sobre su empresa. Si se desea
supervisar y mejorar la presencia en línea del negocio, entonces, las herramientas Big
Data pueden ayudar en este sentido.
Controlar la Reputación Online
DATA SET SKILLS FOR BUSINESS
DATA SET SKILLS FOR BUSINESS
¿Por qué no hace un DESCANSO y
VISUALIZA el Vídeo 1 que puede
encontrar en la sección Recursos?
What is Big Data and why does it matter?
Donna Green (Ted X Talk)
LAS
5 V‘s
DEL BIG
DATA
DATA SET SKILLS FOR BUSINESS
LAS 5 V‘s DEL BIG DATA
Volumen
Velocidad
Variedad
Veracidad
Valor
El 90% de los datos del
mundo de hoy se han
creado en los 2 últimos años
¡Literalmente a la velocidad
de la luz! Los datos se
duplican cada 40 meses
Datos estructurados,
semiestructurados y no
estructurados
Debido al anonimato de Internet,
o a la posibilidad de crear
identidades falsas, a menudo se
cuestiona la fiabilidad de los datos
Tener acceso a grandes
volúmenes de datos no es útil
a menos que podamos
convertirlo en valor
La magnitud de
los datos que se
generan.
La velocidad a la
que se generan y
agregan los datos.
Los diferentes
tipos de datos.
La confianza que se
establece sobre los
datos a utilizar.
El valor económico
de los datos.
Big Data hace un buen trabajo al decirnos qué sucedió, pero no por qué pasó o qué hacer
al respecto. Las 5 V's representan características y propiedades específicas que pueden
ayudarnos a comprender tanto los desafíos como las ventajas de las iniciativas de Big Data.
DATA SET SKILLS FOR BUSINESS
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VOLUMEN
El volumen se refiere a la gran cantidad de datos que se generan cada
segundo.
Piense en todos los correos electrónicos, mensajes de Twitter, fotos,
clips de vídeo, datos de sensores, etc. que producimos y compartimos
cada segundo.
Sólo en Facebook enviamos 10 mil millones de mensajes al día,
hacemos clic en el botón "Me gusta" 4,5 mil millones de veces y
cargamos 350 millones de fotos nuevas cada día.
Esto hace que cada vez más los conjuntos de datos sean demasiado
grandes para almacenarlos y analizarlos utilizando la tecnología
tradicional de bases de datos. Con la tecnología Big Data ahora
podemos almacenar y utilizar estos conjuntos de datos con la ayuda
de sistemas distribuidos, en los que partes de los datos se almacenan
en diferentes lugares y se agrupan mediante software.
DATA SET SKILLS FOR BUSINESS
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VELOCIDAD
La velocidad se refiere a la velocidad a la que se generan los
nuevos datos y a la velocidad a la que se mueven los datos.
Piense en los mensajes de los medios sociales que se
hacen virales en segundos, en la velocidad con la que se
comprueban las transacciones de las tarjetas de crédito
en busca de actividades fraudulentas o en los
milisegundos que tardan los sistemas de comercio en
analizar las redes de medios sociales para captar las
señales que desencadenan las decisiones de compra o
venta de acciones.
La tecnología Big Data ahora nos permite analizar los datos
mientras se están generando, sin necesidad de introducirlos
en bases de datos.
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VARIEDAD
La variedad se refiere a los diferentes tipos de datos que
se pueden utilizar ahora. En el pasado nos centramos en
datos estructurados que encajan perfectamente en tablas
o bases de datos relacionales.
Piense en fotos, secuencias de vídeo o
actualizaciones de medios sociales.
Con la tecnología Big Data ahora podemos explotar
diferentes tipos de datos, incluyendo mensajes,
conversaciones de medios sociales, fotos, datos de
sensores, vídeo o grabaciones de voz y reunirlos con
datos tradicionales y estructurados.
DATA SET SKILLS FOR BUSINESS
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VERACIDAD
La veracidad se refiere a la confiabilidad de los datos.
Con muchas fuentes Big Data, la calidad y la precisión son
menos controlables.
Piense en las publicaciones de Twitter con etiquetas
hash, abreviaturas, errores tipográficos y expresiones
coloquiales, así como en la credibilidad y exactitud
del contenido.
Big Data y la tecnología de análisis permiten trabajar
ahora con este tipo de datos. Los volúmenes a menudo
compensan la falta de calidad o precisión.
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
VALOR
Valor: está muy bien tener acceso a grandes
volúmenes de datos, pero a menos que
podamos convertirlos en valor es algo inútil.
Por lo tanto, se puede argumentar con
seguridad que el ‘Valor' es la V más
importante del Big Data. Es importante que
los negocios realicen un caso de negocio para
cualquier intento de recolectar y aprovechar
los grandes volúmenes de datos. Es muy fácil
caer en la trampa de los rumores y
embarcarse en grandes iniciativas de datos
sin una clara comprensión de los costes y
beneficios.
Big Data puede aportar valor en casi cualquier área de la empresa
o la sociedad:
 Ayuda a las empresas a comprender y servir mejor a los clientes: algunos
ejemplos son las recomendaciones hechas por Amazon o Netflix.
 Permite a las empresas optimizar sus procesos: Uber es capaz de
predecir la demanda, fijar dinámicamente el precio de los viajes y enviar
al conductor más cercano a los clientes.
 Mejora nuestro cuidado de la salud: las agencias gubernamentales ahora
pueden predecir los brotes de gripe y hacer un seguimiento de los
mismos en tiempo real, y las compañías farmacéuticas pueden utilizar Big
Data para acelerar el desarrollo de medicamentos.
 Ayuda a mejorar la seguridad: el gobierno y las fuerzas de seguridad
utilizan Big Data para frustrar los ataques terroristas y detectar
ciberdelitos.
 Permite a las estrellas del deporte mejorar su rendimiento: los sensores
en los balones, las cámaras en el campo y los localizadores GPS en su
ropa permiten a los atletas analizar y mejorar lo que hacen.
DATA SET SKILLS FOR BUSINESS
CÓMO CONVERTIR BIG DATA
EN SMART DATA
1. Convirtiendo Big Data en Valor
2. Aplicaciones del Smart Data
3. ¿Cómo comenzar con Smart Data?
4. Desafíos del Big Data
DATA SET SKILLS FOR BUSINESS
APLICACIONES DEL SMART DATA
DATA SET SKILLS FOR BUSINESS
Todos los negocios del mundo
necesitan datos para prosperar.
Los datos son los que le dicen
quiénes son sus clientes y cómo
actúan, y son los que pueden
guiarle hacia nuevos
conocimientos y nuevas
innovaciones, pero primero es
necesario encontrar el área de
interés adecuada.
APLICACIONES DEL SMART DATA
• Detección y
prevención del
fraude
• Análisis del sentimiento
de la marca
• Precios en tiempo real
• Colocación de
productos
• Publicidad
microdirigida
• Monitorizar las visitas
de los pacientes
• Cuidado y seguridad
del paciente
• Reducir las tasas de
readmisión
• Smart meter-stream
analysis
• Proactive equipment
repair
• Power and
consuption matching
• Diagnóstico de
torres
repetidoras
• Atribución de
ancho de banda
• Mantenimiento
preventivo
• Disminución del tiempo
de lanzamiento
• Planificación del
suministro
• Aumentar la calidad del
producto
• Detección y
prevención de
intrusiones en la red
• Detección de brotes
de enfermedades
• Detección y
monitorización de
conducción insegura
• Planificación de rutas
y tiempos para el
transporte público
SERVICIOS FINANCIEROS VENTA AL POR MENOR TELECOMUNICACIONES FABRICACIÓN
SALUD
SERVICIOS PÚBLICOS,
PETROLEO Y GAS
SECTOR PÚBLICO TRANSPORTE
DATA SET SKILLS FOR BUSINESS
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
¿CÓMO COMENZAR CON SMART DATA?
A pesar de que las herramientas de análisis y visualización de datos han recorrido un
largo camino en la última década, el análisis Big Data sigue dependiendo de la
intervención y coordinación humana para tener éxito. Es necesario saber cómo
hacer las preguntas correctas, cómo eliminar su propio sesgo y cómo formar ideas
viables en lugar de conclusiones básicas.
1. Revise los
datos.
•¿Qué datos tiene?
•¿Cómo se usan?
•¿Tiene experiencia
gestionando sus
datos?
2. Haga las
preguntas
correctas.
• ¿Qué datos
tiene y que uso
se hace de
ellos?
• ¿Está siendo lo
suficiente
concreto?
3. Obtenga
conclusiones.
•¿Podría un experto
ayudar a
comprobar sus
resultados?
•¿Puede validar sus
hipótesis?
•¿Qué otros datos
necesita?
DATA SET SKILLS FOR BUSINESS
DESAFÍOS DEL BIG DATA
FALTA DE TALENTO
Para implementar con éxito un
proyecto Big Data se requiere
un equipo sofisticado de
desarrolladores, científicos de
datos y analistas que también
tengan un suficiente
conocimiento del dominio para
identificar ideas valiosas para
el negocio
Es fácil quedar atrapado por el entusiasmo y las oportunidades del Big Data. Sin
embargo, una de las razones por las que el Big Data está tan infrautilizado es porque el
Big Data y las tecnologías asociadas presentan también muchos desafíos.
Un estudio reveló que el 55% de los proyectos Big Data nunca se terminan. Entonces,
¿cuál es el problema con el Big Data?
ESCALABILIDAD
Muchas organizaciones
no tienen en cuenta la
rapidez con la que un
proyecto Big Data puede
crecer y evolucionar. Las
cargas de trabajo en Big
Data tienden a ser a
intervalos, lo que dificulta
la asignación de
capacidad para los
recursos
PROYECTOS
VIABLES
Un desafío clave para
los equipos de ciencia
de datos es identificar
un objetivo de negocio
claro, y las fuentes de
datos apropiadas para
recopilar y analizar,
para alcanzar ese
objetivo
SEGURIDAD
Entre los desafíos específicos se
incluyen los siguientes:
- Autenticación para cada miembro
del equipo que acceda a los datos
- Restricción del acceso en función
de las necesidades de cada usuario
- Registro de los accesos a los datos
y cumplimiento de normativa
- Uso adecuado del cifrado en datos
en tránsito y en reposo
GESTIÓN DE
COSTES
Las empresas que
realizan proyectos Big
Data deben recordar el
coste de la formación, el
mantenimiento y la
expansión
DATA SET SKILLS FOR BUSINESS
CALIDAD DEL
DATO
Las causas más habituales
de disponer “datos sucios”
son las siguientes: errores
de entrada del usuario,
datos duplicados y
vinculación de datos
errónea
DATA SET SKILLS FOR BUSINESS
¿Por qué no haces un DESCANSO y
LEES el Artículo 1 que podrás
encontrar en la sección Recursos? :
The emerging role of Big Data in key
development issues: Opportunities,
challenges, and concerns
Nir Kshetr
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
CASO DE ESTUDIO:
Cómo AG utilizó el poder del Big Data
ANTECEDENTES
Cada vez que realizas una compra, compartes con los
vendedores detalles personales sobre tus patrones de
consumo. Muchos de ellos estudian esos detalles para
determinar lo que te gusta, lo que necesitas y qué
promociones tienen más probabilidades de convencerte para
volver a comprar. American Golf, el mayor vendedor minorista
de artículos de golf de Europa, por ejemplo, ha descubierto
cómo analizar y encontrar valor entre los datos de sus
clientes.
DATA SET SKILLS FOR BUSINESS
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
CASO DE ESTUDIO:
Cómo AG utilizó el poder del Big Data
LAS FUENTES DE DATOS DE AG
AG asigna a cada cliente un número de identificación de
Invitado, vinculado a su tarjeta de crédito, nombre o dirección
de correo electrónico, que se convierte en un cubo que
almacena un historial de todo lo que ha comprado y cualquier
información demográfica que AG haya recopilado de ellos o que
haya comprado de otras fuentes. Utilizando eso, su analista
analizó los datos históricos de compra de todos los clientes que
se habían dado de alta.
DATA SET SKILLS FOR BUSINESS
AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES
CASO DE ESTUDIO:
Cómo AG utilizó el poder del Big Data
CONCLUSIÓN
El analista realizó una prueba tras otra, analizando los datos,
y en poco tiempo surgieron algunos patrones útiles. Los
guantes, por ejemplo. Muchos clientes compran guantes de
golf, pero uno de los colegas de Pole advirtió que estaban
comprando artículos de golf más pequeños, especialmente
guantes en los seis meses anteriores a su retiro. Otro analista
observó que en esta ventana de 6 meses la frecuencia de
visitas a las tiendas aumentó.
DATA SET SKILLS FOR BUSINESS
DATA SET SKILLS FOR BUSINESS
Concluya leyendo el Artículo 2
que podrá encontrar en la
sección Recursos:
Big Data:
The Management Revolution
Andrew McAfee y Erik Brynjolfsson
¡Gracias!
https://www.data-set.eu/
¿Preguntas?
DATA SET SKILLS FOR BUSINESS

Más contenido relacionado

La actualidad más candente

La actualidad más candente (19)

Presentacion big data
Presentacion big dataPresentacion big data
Presentacion big data
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Informe OBS Business School: Big Data 2017-2018 y el salto del Big Data al Hu...
Informe OBS Business School: Big Data 2017-2018 y el salto del Big Data al Hu...Informe OBS Business School: Big Data 2017-2018 y el salto del Big Data al Hu...
Informe OBS Business School: Big Data 2017-2018 y el salto del Big Data al Hu...
 
Informe obs business school big data y huge data los dos grandes actores
Informe obs business school big data y huge data los dos grandes actoresInforme obs business school big data y huge data los dos grandes actores
Informe obs business school big data y huge data los dos grandes actores
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Big data
Big dataBig data
Big data
 
Wp 2015-07
Wp 2015-07Wp 2015-07
Wp 2015-07
 
Big Data, Big Picture
Big Data, Big PictureBig Data, Big Picture
Big Data, Big Picture
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Big Data el dorado del CRM de Proximity
Big Data el dorado del CRM de ProximityBig Data el dorado del CRM de Proximity
Big Data el dorado del CRM de Proximity
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014
 
Rolando Archila
Rolando ArchilaRolando Archila
Rolando Archila
 
Big data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaBig data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontología
 
Profesión: Big Data
Profesión: Big DataProfesión: Big Data
Profesión: Big Data
 
Data masking
Data maskingData masking
Data masking
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Big data
Big dataBig data
Big data
 
3 mitos del Big Data derribados
3 mitos del Big Data derribados3 mitos del Big Data derribados
3 mitos del Big Data derribados
 

Similar a Data set module 1 - spanish

HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
Eduardo Castro
 

Similar a Data set module 1 - spanish (20)

Afc module 1 translated
Afc module 1 translatedAfc module 1 translated
Afc module 1 translated
 
BIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdfBIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdf
 
Big data
Big dataBig data
Big data
 
¿Qué es el Big Data?
¿Qué es el Big Data?¿Qué es el Big Data?
¿Qué es el Big Data?
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stack
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Fundamentos.pptx
Fundamentos.pptxFundamentos.pptx
Fundamentos.pptx
 
Big data
Big dataBig data
Big data
 
Big data bbva
Big data bbvaBig data bbva
Big data bbva
 
Lab #8
Lab #8   Lab #8
Lab #8
 
Big data
Big dataBig data
Big data
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
big data
big  databig  data
big data
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
BIG DATA GRUPO #7
BIG DATA GRUPO #7 BIG DATA GRUPO #7
BIG DATA GRUPO #7
 

Más de Data-Set

Más de Data-Set (16)

Data set module 4 - spanish
Data set   module 4 - spanishData set   module 4 - spanish
Data set module 4 - spanish
 
Data set module 3 - spanish
Data set   module 3 - spanishData set   module 3 - spanish
Data set module 3 - spanish
 
Data set module 2 - spanish
Data set   module 2 - spanishData set   module 2 - spanish
Data set module 2 - spanish
 
Dwe m4 cyber bullying and conflict resolution
Dwe m4   cyber bullying and conflict resolutionDwe m4   cyber bullying and conflict resolution
Dwe m4 cyber bullying and conflict resolution
 
Dwe m3 digital footprint netiquette and reputation
Dwe m3   digital footprint  netiquette and reputation Dwe m3   digital footprint  netiquette and reputation
Dwe m3 digital footprint netiquette and reputation
 
Dwe m2 self-image online offline identities
Dwe m2   self-image   online offline identities Dwe m2   self-image   online offline identities
Dwe m2 self-image online offline identities
 
Dwe m1 digital wellbeing - introduction
Dwe m1   digital wellbeing - introduction  Dwe m1   digital wellbeing - introduction
Dwe m1 digital wellbeing - introduction
 
Data set module 1
Data set   module 1Data set   module 1
Data set module 1
 
Data set module 2
Data set   module 2Data set   module 2
Data set module 2
 
Data set module 4
Data set   module 4Data set   module 4
Data set module 4
 
Data set Legislation
Data set LegislationData set Legislation
Data set Legislation
 
Data set The Future of Big Data
Data set The Future of Big DataData set The Future of Big Data
Data set The Future of Big Data
 
Data set Legislation
Data set LegislationData set Legislation
Data set Legislation
 
Data set Legislation
Data set   Legislation Data set   Legislation
Data set Legislation
 
Data set Improve your business with your own business data
Data set   Improve your business with your own business dataData set   Improve your business with your own business data
Data set Improve your business with your own business data
 
Data set Introduction to Big Data
Data set   Introduction to Big DataData set   Introduction to Big Data
Data set Introduction to Big Data
 

Último

Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 

Último (20)

MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 

Data set module 1 - spanish

  • 1. Este programa ha sido financiado con el apoyo de la Comisión Europea. Módulo 1: Introducción al Big Data
  • 2. DATA SET SKILLS FOR BUSINESS Módulo 1: Introducción al Big Data El objetivo de este módulo es proporcionar una visión general sobre lo que entendemos por Big Data. Una vez completado este módulo, podrá: - Comprender el papel emergente del Big Data - Entender los términos clave del Big Data y Smart Data - Saber cómo Big Data puede convertirse en Smart Data - Ser capaz de aplicar los términos clave en relación con el Big Data Duración del módulo: aproximadamente entre 1 y 2 horas.
  • 3. DATA SET SKILLS FOR BUSINESS 2) Las 5 V‘s del Big Data 4) Caso de estudio 3) ¿Cómo convertir Big Data en Smart Data? • ¿Qué es Big Data? • Clasificación de los datos • Fuentes de datos • La importancia del Big Data 1) El papel emergente de los datos en la formación continua y la empresa • Convirtiendo Big Data en valor • Aplicaciones Smart Data • ¿Cómo comenzar con Smart Data? • Desafíos del Big Data • Cómo American Golf usó el poder del Big Data • Volumen • Velocidad • Variedad • Veracidad • Valor
  • 4. DATA SET SKILLS FOR BUSINESS El papel emergente de los datos en la formación continua y la empresa 1. ¿Qué es el Big Data? 2. Clasificación de los datos 3. Fuentes de datos 4. La importancia del Big Data
  • 5. “Big Data es la base de todas las megatendencias que están sucediendo hoy en día, desde las redes sociales hasta los dispositivos móviles, desde la nube hasta los juegos.” Chris Lynch
  • 6. DATA SET SKILLS FOR BUSINESS ¿QUÉ ES EL BIG DATA? Hay algunas cosas que son tan grandes, que tienen implicaciones para todos, lo queramos o no. Big Data es una de esas cosas, y está transformando por completo la forma en que hacemos negocios, y está impactando en muchos aspectos de nuestra vida. La idea básica detrás del término "Big Data" es que todo lo que hacemos deja, cada vez más, un rastro digital, que podemos utilizar y analizar. Por lo tanto, Big Data se refiere a nuestra capacidad de hacer uso de los volúmenes, cada vez mayores, de datos. "Datos de un tamaño muy grande, normalmente hasta el punto de que su manipulación y gestión presentan importantes desafíos.“ Diccionario de inglés Oxford, 2013
  • 7. DATA SET SKILLS FOR BUSINESS CLASIFICACIÓN DE LOS DATOS Los “datos“ se definen como ‘las cantidades, caracteres o símbolos con los que un ordenador realiza operaciones, que pueden almacenarse y transmitirse en forma de señales eléctricas y grabarse en soportes de grabación magnéticos, ópticos o mecánicos, tal y como muestra Google tras una búsqueda rápida. “Big Data” se refiere a grandes cantidades de datos que: ₋ Son demasiado grandes para ser procesadas ₋ Son demasiado grandes para ser analizadas por las herramientas tradicionales ₋ No se almacenan o gestionan de forma eficiente Sin embargo, también hay un enorme potencial en el análisis de grandes volúmenes de datos. La gestión y el estudio adecuados de los datos pueden ayudar a las empresas a tomar mejores decisiones basadas en las estadísticas de uso y los intereses de los usuarios, ayudando así a su crecimiento. Algunas empresas incluso han desarrollado nuevos productos y servicios, en base a la información recibida sobre oportunidades detectadas tras analizar grandes volúmenes de datos.
  • 8. DATA SET SKILLS FOR BUSINESS DATOS ESTRUCTURADOS DATOS NO ESTRUCTURADOS DATOS SEMI- ESTRUCTURADOS 1 2 3 CLASIFICACIÓN DE LOS DATOS La clasificación es esencial para el estudio de cualquier materia. En Big Data, los datos se clasifican en tres categorías, que son:
  • 9. DATA SET SKILLS FOR BUSINESS DATOS ESTRUCTURADOS 1 Los datos estructurados son aquellos que están almacenados en bases de datos, de forma ordenada. Representan alrededor del 20% del total de los datos existentes. Hay dos fuentes de datos estructurados: las máquinas y los seres humanos. Todos los datos recibidos de sensores, registros web y sistemas financieros se clasifican en datos generados por la máquina. Como por ejemplo, dispositivos médicos, datos de un GPS, datos de estadísticas de uso obtenidos a través de servidores o aplicaciones, y la enorme cantidad de datos que se generan en las plataformas de intercambio de activos financieros. Los datos estructurados generados por el ser humano incluyen principalmente todos los datos que el ser humano introduce en un ordenador, como su nombre y otros datos personales. Cuando una persona hace clic en un enlace en Internet, o incluso hace un movimiento en un juego, se crean datos.
  • 10. DATA SET SKILLS FOR BUSINESS DATOS ESTRUCTURADOS Empleado_ID Empleado_Nombre Género Departamento Sueldo_en_Euros 2365 Rajesh Kulkarni Hombre Finanzas 65000 3398 Pratibha Joshi Mujer Admin 65000 7465 Shushil Roy Hombre Admin 50000 7500 Shubhojit Das Hombre Finanzas 50000 7699 Priya Sane Mujer Finanzas 55000 Una tabla “Empleados” en una base de datos es un ejemplo de Datos Estructurados. Ejemplo de Datos Estructurados 1
  • 11. DATA SET SKILLS FOR BUSINESS DATOS NO ESTRUCTURADOS 2 Los datos no estructurados son lo opuesto a los datos estructurados: no tienen un formato claro de almacenamiento. Alrededor del 80% del total de los datos son no estructurados. La mayoría de los datos que una persona encuentra pertenecen a esta categoría y hasta hace poco, no había mucho que hacer con ellos excepto almacenarlos o analizarlos manualmente. Los datos no estructurados también se clasifican según su origen, en datos generados por la máquina o por el ser humano. Ejemplos de datos generados por máquinas pueden ser las imágenes de un satélite, datos científicos de diferentes experimentos, o los datos capturados por un radar.
  • 12. DATA SET SKILLS FOR BUSINESS DATOS NO ESTRUCTURADOS 2 Los datos no estructurados generados por el ser humano se encuentran en abundancia en Internet, ya que incluyen datos de medios sociales, datos de móviles y contenido de sitios web. Esto significa que las fotos que subimos a nuestro Facebook o Instagram, los videos que vemos en YouTube e incluso los mensajes de texto que enviamos contribuyen al enorme volumen de datos no estructurados. Ejemplo de Datos No Estructurados Resultados obtenidos tras una búsqueda en Google.
  • 13. DATA SET SKILLS FOR BUSINESS DATOS SEMI- ESTRUCTURADOS 3 Los datos semiestructurados a simple vista parecen no estar estructurados, por lo que pueden ser difíciles de analizar. La información que no está en formato de base de datos tradicional como datos estructurados, sino que contiene algunas propiedades organizativas que facilitan el procesamiento, se consideran datos semiestructurados. Por ejemplo, los documentos NoSQL se consideran semiestructurados, ya que contienen palabras clave que pueden utilizarse para procesar el documento fácilmente.
  • 14. DATA SET SKILLS FOR BUSINESS DATOS SEMI- ESTRUCTURADOS Un mensaje de correo electrónico es un ejemplo de datos semi- estructurados. Incluye campos de datos bien definidos en el encabezado, como el remitente, etc., mientras que el cuerpo del mensaje no está estructurado. Si desea saber quién está enviando correos electrónicos, a quién y cuándo (información contenida en el encabezado), una base de datos relacional podría ser una buena opción. Pero si está más interesado en el contenido del mensaje, herramientas vinculadas a Big Data, como el procesamiento del lenguaje natural, serán mejores opciones. Ejemplo de Datos Semi- Estructurados Datos personales almacenados en un fichero XML. 3
  • 15. DATA SET SKILLS FOR BUSINESS Los datos de los medios sociales están proporcionando a las empresas información notable sobre el comportamiento y el sentimiento de los consumidores, que pueden integrar con los datos de sus CRM para su análisis. Hablamos de casi 400 millones de tweets publicados en Twitter cada día, 3.540 millones de Likes y comentarios añadidos en Facebook cada día, y 72 horas de vídeo subido a YouTube cada minuto (esto es lo que se entiende por velocidad de datos). Los datos de las máquinas consisten en información generada por equipos industriales, datos en tiempo real de sensores que rastrean piezas y monitorizan maquinaria (a menudo también se referencia como Internet de las Cosas) e incluso registros web que registran el comportamiento del usuario en línea. En el CERN, el mayor centro de investigación en física de partículas del mundo, el Gran Colisionador de Hadrones (LHC) genera 40 terabytes de datos cada segundo durante los experimentos. Con respecto a los datos transaccionales, los grandes minoristas e incluso las empresas B2B pueden generar una gran cantidad de datos de forma regular considerando que sus transacciones consisten en uno o varios artículos, identificadores de productos, precios, información de pago, datos de fabricantes y distribuidores, y mucho más. Fuentes de datos
  • 16. Los usuarios de WhatsApp comparten 347.222 fotos Cada minuto de cada día Los usuarios de correo electrónico envían 204 millones de mensajes Los usuarios de YouTube suben 4.320 minutos de nuevos vídeos Google recibe más de 4.000.000 de consultas de búsqueda Los usuarios de Facebook comparten 2.460.000 piezas de contenido Los usuarios de Twitter tuitean 277.000 veces Amazon vende 83.000 dólares Los usuarios de Instagram publican 216.000 nuevas fotos Ejemplos de datos de medios sociales DATA SET SKILLS FOR BUSINESS
  • 17. Datos generados por las máquinas Los datos de las máquinas están en todas partes. Desde aviones y ascensores, hasta semáforos y dispositivos de control de la aptitud física. Recientemente, los datos de las máquinas han cobrado mayor atención a medida que ha crecido el uso del Internet de las Cosas, Hadoop y otras tecnologías relacionadas con la gestión de grandes volúmenes de datos. Los registros de aplicaciones, servidores y procesos de negocio, registros detallados de llamadas y datos de sensores son los principales ejemplos de datos generados por las máquinas. También lo son los datos de flujo de clics en Internet y los registros de actividad de un sitio web. DATA SET SKILLS FOR BUSINESS Se espera que la combinación de datos de máquinas con otros tipos de datos empresariales para el análisis proporcione nuevas perspectivas y conocimientos sobre las actividades y operaciones de negocio. Los datos generados por las máquinas son el alma del Internet de las cosas (IoT).
  • 18. DATA SET SKILLS FOR BUSINESS En pocas palabras, el Internet de las Cosas es el concepto de conectar básicamente cualquier dispositivo con un interruptor de encendido y apagado a Internet (y/o entre sí). Esto incluye todo, desde teléfonos móviles, cafeteras, lavadoras, auriculares, lámparas, dispositivos que se pueden llevar puestos y casi cualquier otra cosa que se te ocurra. Esto también se aplica a los componentes de las máquinas, por ejemplo, el motor a reacción de un avión o el taladro de una plataforma petrolífera. Internet de las Cosas (IoT) Datos generados por las máquinas
  • 19. Datos Transaccionales Los datos transaccionales son información derivada directamente como resultado de transacciones. A diferencia de otros tipos de datos, los datos transaccionales contienen una dimensión temporal que significa que son oportunos y que, con el tiempo, se vuelven menos relevantes. En lugar de ser el objeto de las transacciones como el producto que se compra, o la identidad del cliente, son más bien datos de referencia que describen el tiempo, el lugar, los precios, los métodos de pago, el descuento aplicado y las cantidades relacionadas con esa transacción concreta, normalmente en el punto de venta. DATA SET SKILLS FOR BUSINESS
  • 20. Datos Transaccionales Compras Devoluciones Facturas Pagos Créditos Donaciones Clientes Dividendos Contratos Intereses Nóminas Préstamos Reservas Altas Subscripciones Ejemplos de datos transaccionales: DATA SET SKILLS FOR BUSINESS
  • 21. LA IMPORTANCIA DEL BIG DATA DATA SET SKILLS FOR BUSINESS La importancia del Big Data no gira en torno a la cantidad de datos de que dispone una empresa, sino cómo utiliza los datos recopilados. Cada empresa utiliza los datos a su manera; cuanto más eficiente es una empresa utilizando sus datos, más potencial tiene para crecer. La empresa puede obtener datos de cualquier fuente y analizarlos para encontrar respuestas que le permitan:
  • 22. LA IMPORTANCIA DEL BIG DATA •Algunas herramientas Big Data pueden aportar ventajas de costes a las empresas cuando se almacenan grandes volúmenes de datos. Estas herramientas también ayudan a identificar formas más eficientes de hacer negocios. Ahorrar Costes •La alta velocidad de las herramientas y los análisis en memoria pueden identificar fácilmente nuevas fuentes de datos, lo que ayuda a las empresas a analizar los datos inmediatamente y a tomar decisiones rápidas basadas en los descubrimientos. Reducir Tiempos •Al conocer las tendencias de las necesidades y la satisfacción de los clientes a través de la analítica, se pueden crear productos de acuerdo con las necesidades de los clientes. Desarrollar Nuevos Productos •Analizando grandes volúmenes de datos se puede obtener una mejor comprensión de las condiciones actuales del mercado. Por ejemplo, analizando el comportamiento de compra de los clientes, una empresa puede identificar los productos que más se venden y fabricar productos de acuerdo con esta tendencia. Comprender las Circunstancias de Mercado •Las herramientas Big Data permiten realizar un análisis de sentimiento. Por lo tanto, se puede obtener feedback sobre quién está diciendo qué sobre su empresa. Si se desea supervisar y mejorar la presencia en línea del negocio, entonces, las herramientas Big Data pueden ayudar en este sentido. Controlar la Reputación Online DATA SET SKILLS FOR BUSINESS
  • 23. DATA SET SKILLS FOR BUSINESS ¿Por qué no hace un DESCANSO y VISUALIZA el Vídeo 1 que puede encontrar en la sección Recursos? What is Big Data and why does it matter? Donna Green (Ted X Talk)
  • 24. LAS 5 V‘s DEL BIG DATA DATA SET SKILLS FOR BUSINESS
  • 25. LAS 5 V‘s DEL BIG DATA Volumen Velocidad Variedad Veracidad Valor El 90% de los datos del mundo de hoy se han creado en los 2 últimos años ¡Literalmente a la velocidad de la luz! Los datos se duplican cada 40 meses Datos estructurados, semiestructurados y no estructurados Debido al anonimato de Internet, o a la posibilidad de crear identidades falsas, a menudo se cuestiona la fiabilidad de los datos Tener acceso a grandes volúmenes de datos no es útil a menos que podamos convertirlo en valor La magnitud de los datos que se generan. La velocidad a la que se generan y agregan los datos. Los diferentes tipos de datos. La confianza que se establece sobre los datos a utilizar. El valor económico de los datos. Big Data hace un buen trabajo al decirnos qué sucedió, pero no por qué pasó o qué hacer al respecto. Las 5 V's representan características y propiedades específicas que pueden ayudarnos a comprender tanto los desafíos como las ventajas de las iniciativas de Big Data. DATA SET SKILLS FOR BUSINESS
  • 26. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES VOLUMEN El volumen se refiere a la gran cantidad de datos que se generan cada segundo. Piense en todos los correos electrónicos, mensajes de Twitter, fotos, clips de vídeo, datos de sensores, etc. que producimos y compartimos cada segundo. Sólo en Facebook enviamos 10 mil millones de mensajes al día, hacemos clic en el botón "Me gusta" 4,5 mil millones de veces y cargamos 350 millones de fotos nuevas cada día. Esto hace que cada vez más los conjuntos de datos sean demasiado grandes para almacenarlos y analizarlos utilizando la tecnología tradicional de bases de datos. Con la tecnología Big Data ahora podemos almacenar y utilizar estos conjuntos de datos con la ayuda de sistemas distribuidos, en los que partes de los datos se almacenan en diferentes lugares y se agrupan mediante software. DATA SET SKILLS FOR BUSINESS
  • 27. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES VELOCIDAD La velocidad se refiere a la velocidad a la que se generan los nuevos datos y a la velocidad a la que se mueven los datos. Piense en los mensajes de los medios sociales que se hacen virales en segundos, en la velocidad con la que se comprueban las transacciones de las tarjetas de crédito en busca de actividades fraudulentas o en los milisegundos que tardan los sistemas de comercio en analizar las redes de medios sociales para captar las señales que desencadenan las decisiones de compra o venta de acciones. La tecnología Big Data ahora nos permite analizar los datos mientras se están generando, sin necesidad de introducirlos en bases de datos.
  • 28. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES VARIEDAD La variedad se refiere a los diferentes tipos de datos que se pueden utilizar ahora. En el pasado nos centramos en datos estructurados que encajan perfectamente en tablas o bases de datos relacionales. Piense en fotos, secuencias de vídeo o actualizaciones de medios sociales. Con la tecnología Big Data ahora podemos explotar diferentes tipos de datos, incluyendo mensajes, conversaciones de medios sociales, fotos, datos de sensores, vídeo o grabaciones de voz y reunirlos con datos tradicionales y estructurados. DATA SET SKILLS FOR BUSINESS
  • 29. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES VERACIDAD La veracidad se refiere a la confiabilidad de los datos. Con muchas fuentes Big Data, la calidad y la precisión son menos controlables. Piense en las publicaciones de Twitter con etiquetas hash, abreviaturas, errores tipográficos y expresiones coloquiales, así como en la credibilidad y exactitud del contenido. Big Data y la tecnología de análisis permiten trabajar ahora con este tipo de datos. Los volúmenes a menudo compensan la falta de calidad o precisión.
  • 30. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES VALOR Valor: está muy bien tener acceso a grandes volúmenes de datos, pero a menos que podamos convertirlos en valor es algo inútil. Por lo tanto, se puede argumentar con seguridad que el ‘Valor' es la V más importante del Big Data. Es importante que los negocios realicen un caso de negocio para cualquier intento de recolectar y aprovechar los grandes volúmenes de datos. Es muy fácil caer en la trampa de los rumores y embarcarse en grandes iniciativas de datos sin una clara comprensión de los costes y beneficios. Big Data puede aportar valor en casi cualquier área de la empresa o la sociedad:  Ayuda a las empresas a comprender y servir mejor a los clientes: algunos ejemplos son las recomendaciones hechas por Amazon o Netflix.  Permite a las empresas optimizar sus procesos: Uber es capaz de predecir la demanda, fijar dinámicamente el precio de los viajes y enviar al conductor más cercano a los clientes.  Mejora nuestro cuidado de la salud: las agencias gubernamentales ahora pueden predecir los brotes de gripe y hacer un seguimiento de los mismos en tiempo real, y las compañías farmacéuticas pueden utilizar Big Data para acelerar el desarrollo de medicamentos.  Ayuda a mejorar la seguridad: el gobierno y las fuerzas de seguridad utilizan Big Data para frustrar los ataques terroristas y detectar ciberdelitos.  Permite a las estrellas del deporte mejorar su rendimiento: los sensores en los balones, las cámaras en el campo y los localizadores GPS en su ropa permiten a los atletas analizar y mejorar lo que hacen. DATA SET SKILLS FOR BUSINESS
  • 31. CÓMO CONVERTIR BIG DATA EN SMART DATA 1. Convirtiendo Big Data en Valor 2. Aplicaciones del Smart Data 3. ¿Cómo comenzar con Smart Data? 4. Desafíos del Big Data DATA SET SKILLS FOR BUSINESS
  • 32. APLICACIONES DEL SMART DATA DATA SET SKILLS FOR BUSINESS Todos los negocios del mundo necesitan datos para prosperar. Los datos son los que le dicen quiénes son sus clientes y cómo actúan, y son los que pueden guiarle hacia nuevos conocimientos y nuevas innovaciones, pero primero es necesario encontrar el área de interés adecuada.
  • 33. APLICACIONES DEL SMART DATA • Detección y prevención del fraude • Análisis del sentimiento de la marca • Precios en tiempo real • Colocación de productos • Publicidad microdirigida • Monitorizar las visitas de los pacientes • Cuidado y seguridad del paciente • Reducir las tasas de readmisión • Smart meter-stream analysis • Proactive equipment repair • Power and consuption matching • Diagnóstico de torres repetidoras • Atribución de ancho de banda • Mantenimiento preventivo • Disminución del tiempo de lanzamiento • Planificación del suministro • Aumentar la calidad del producto • Detección y prevención de intrusiones en la red • Detección de brotes de enfermedades • Detección y monitorización de conducción insegura • Planificación de rutas y tiempos para el transporte público SERVICIOS FINANCIEROS VENTA AL POR MENOR TELECOMUNICACIONES FABRICACIÓN SALUD SERVICIOS PÚBLICOS, PETROLEO Y GAS SECTOR PÚBLICO TRANSPORTE DATA SET SKILLS FOR BUSINESS
  • 34. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES ¿CÓMO COMENZAR CON SMART DATA? A pesar de que las herramientas de análisis y visualización de datos han recorrido un largo camino en la última década, el análisis Big Data sigue dependiendo de la intervención y coordinación humana para tener éxito. Es necesario saber cómo hacer las preguntas correctas, cómo eliminar su propio sesgo y cómo formar ideas viables en lugar de conclusiones básicas. 1. Revise los datos. •¿Qué datos tiene? •¿Cómo se usan? •¿Tiene experiencia gestionando sus datos? 2. Haga las preguntas correctas. • ¿Qué datos tiene y que uso se hace de ellos? • ¿Está siendo lo suficiente concreto? 3. Obtenga conclusiones. •¿Podría un experto ayudar a comprobar sus resultados? •¿Puede validar sus hipótesis? •¿Qué otros datos necesita? DATA SET SKILLS FOR BUSINESS
  • 35. DESAFÍOS DEL BIG DATA FALTA DE TALENTO Para implementar con éxito un proyecto Big Data se requiere un equipo sofisticado de desarrolladores, científicos de datos y analistas que también tengan un suficiente conocimiento del dominio para identificar ideas valiosas para el negocio Es fácil quedar atrapado por el entusiasmo y las oportunidades del Big Data. Sin embargo, una de las razones por las que el Big Data está tan infrautilizado es porque el Big Data y las tecnologías asociadas presentan también muchos desafíos. Un estudio reveló que el 55% de los proyectos Big Data nunca se terminan. Entonces, ¿cuál es el problema con el Big Data? ESCALABILIDAD Muchas organizaciones no tienen en cuenta la rapidez con la que un proyecto Big Data puede crecer y evolucionar. Las cargas de trabajo en Big Data tienden a ser a intervalos, lo que dificulta la asignación de capacidad para los recursos PROYECTOS VIABLES Un desafío clave para los equipos de ciencia de datos es identificar un objetivo de negocio claro, y las fuentes de datos apropiadas para recopilar y analizar, para alcanzar ese objetivo SEGURIDAD Entre los desafíos específicos se incluyen los siguientes: - Autenticación para cada miembro del equipo que acceda a los datos - Restricción del acceso en función de las necesidades de cada usuario - Registro de los accesos a los datos y cumplimiento de normativa - Uso adecuado del cifrado en datos en tránsito y en reposo GESTIÓN DE COSTES Las empresas que realizan proyectos Big Data deben recordar el coste de la formación, el mantenimiento y la expansión DATA SET SKILLS FOR BUSINESS CALIDAD DEL DATO Las causas más habituales de disponer “datos sucios” son las siguientes: errores de entrada del usuario, datos duplicados y vinculación de datos errónea
  • 36. DATA SET SKILLS FOR BUSINESS ¿Por qué no haces un DESCANSO y LEES el Artículo 1 que podrás encontrar en la sección Recursos? : The emerging role of Big Data in key development issues: Opportunities, challenges, and concerns Nir Kshetr
  • 37. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES CASO DE ESTUDIO: Cómo AG utilizó el poder del Big Data ANTECEDENTES Cada vez que realizas una compra, compartes con los vendedores detalles personales sobre tus patrones de consumo. Muchos de ellos estudian esos detalles para determinar lo que te gusta, lo que necesitas y qué promociones tienen más probabilidades de convencerte para volver a comprar. American Golf, el mayor vendedor minorista de artículos de golf de Europa, por ejemplo, ha descubierto cómo analizar y encontrar valor entre los datos de sus clientes. DATA SET SKILLS FOR BUSINESS
  • 38. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES CASO DE ESTUDIO: Cómo AG utilizó el poder del Big Data LAS FUENTES DE DATOS DE AG AG asigna a cada cliente un número de identificación de Invitado, vinculado a su tarjeta de crédito, nombre o dirección de correo electrónico, que se convierte en un cubo que almacena un historial de todo lo que ha comprado y cualquier información demográfica que AG haya recopilado de ellos o que haya comprado de otras fuentes. Utilizando eso, su analista analizó los datos históricos de compra de todos los clientes que se habían dado de alta. DATA SET SKILLS FOR BUSINESS
  • 39. AGE FRIENDLY ECONOMY | FUTURE OPPORTUNITIES FOR SMES CASO DE ESTUDIO: Cómo AG utilizó el poder del Big Data CONCLUSIÓN El analista realizó una prueba tras otra, analizando los datos, y en poco tiempo surgieron algunos patrones útiles. Los guantes, por ejemplo. Muchos clientes compran guantes de golf, pero uno de los colegas de Pole advirtió que estaban comprando artículos de golf más pequeños, especialmente guantes en los seis meses anteriores a su retiro. Otro analista observó que en esta ventana de 6 meses la frecuencia de visitas a las tiendas aumentó. DATA SET SKILLS FOR BUSINESS
  • 40. DATA SET SKILLS FOR BUSINESS Concluya leyendo el Artículo 2 que podrá encontrar en la sección Recursos: Big Data: The Management Revolution Andrew McAfee y Erik Brynjolfsson