SlideShare una empresa de Scribd logo
1 de 29
INTRODUCCIÓN A LA
ANALÍTICA DE DATOS
INTRODUCCIÓN A LAANALÍTICA DE DATOS
•Conceptos Básicos.
•Big Data y Smart Data.
•Web Scraping.
•Metodología para Proyectos de Analítica.
CONTENIDO
•Fundamentos Generales del Big Data/ Las 3 V’s y 7 Vs.
• Fases de un proyecto de Big Data y Recomendaciones.
•Smart Data
•Web Scraping
• Ecosistema y Frameworks
•Aplicaciones y casos reales.
• Ejemplos de empresas que aplicaron Big Data.
• Conclusiones.
“Big data es una colección de grandes volúmenes de datos, complejos y muy difíciles de procesar, a través de herramientas
de gestión y procesamiento de datos tradicionales”.
FUNDAMENTOS GENERALES
• Volumen: Referido a la masividad de los datos
generados.
• Variedad: Diversidad en las estructuras de los datos a
integrar.
• Velocidad: Asociado con el tiempo de procesamiento
de los datos.
LAS 3 V DEL BIG DATA
VOLUMEN:
“En el año 2000, se almacenaron en el mundo 800.000 petabytes. Se espera que en el año 2022, se alcancen los 45
zettabytes (ZB). Sólo Twitter genera más de 9 terabytes (TB) de datos cada día, Facebook 10 TB y algunas empresas ya
generan terabytes de datos cada hora de cada día del año”.
LAS 3 V DEL BIG DATA
VARIEDAD:
Datos Estructurados:
La gran mayoría de las fuentes de datos tradicionales son
originadas por datos del tipo estructurados, datos con formato
o esquema fijo, que poseen campos fijos y bien definidos.
LAS 3 V DEL BIG DATA
VARIEDAD:
Datos no Estructurados:
Son las estructuras de datos más difíciles de manejar,
podemos encontrar entre los datos no estructurados más
conocidos:
● Documentos PDF o Word.
● Audios y videos.
● Correos electrónicos.
● Ficheros multimedia de imagen.
● Artículos y textos, entre otros.
LAS 3 V DEL BIG DATA
VARIEDAD:
Datos Semi - Estructurados:
Son un híbrido entre los datos estructurados y los datos no
estructurados, podríamos decir entonces de manera sencilla,
que no presentan una estructura perfectamente definida como
los datos estructurados, pero sí presentan una organización
definida en sus metadatos donde describen los objetos y sus
relaciones.
LAS 3 V DEL BIG DATA
“Si analizamos la acción de poner un simple “me gusta” en una foto, estamos entonces creando nuevos datos, cuando
empleamos el GPS también, cuando compramos un boleto de avión, hasta cuando pedimos un turno al médico”.
VELOCIDAD:
LAS 3 V DEL BIG DATA
Se agregan a las anteriores Vs las siguientes
características:
• Veracidad.
• Viabilidad.
• Visualización.
• Valor.
LAS 7 V DEL BIG DATA
FASES DE UN PROYECTO DE BIG DATA
“La implementación de una solución de Big Data, consiste en la ejecución del ciclo de vida estándar asociado a todo proyecto
de Big Data”.
Las principales etapas que componen este ciclo son:
FASES DE UN PROYECTO DE BIG DATA
Tenemos que:
1. Crear una estrategia: Debemos tener muy claro para qué fines queremos implantar Big Data en la empresa. Además, también es
importante conocer los recursos con los que contamos y los que necesitaremos.
2. Escoger las fuentes de datos: Se están creando datos sin parar y debemos seleccionar bien las que generen datos valiosos para
la empresa. Entre ellas, tenemos: información proveniente de sensores y dispositivos IoT, datos abiertos, información de webs y redes
sociales, data lakes, etc.
¿COMO FUNCIONA BIG DATA ?
3. Almacenamiento y gestión de los datos: Aquí se encuentran acciones como el acceso fiable, los métodos de integración, el
aseguramiento de la calidad de los datos, su control, almacenamiento y preparación para análisis.
4. Análisis de la información: Obtenemos valor de los datos, identificando patrones, correlaciones y otras conclusiones útiles y
alineadas con nuestra estrategia.
5. Toma de Decisiones: Por último, con todas estas conclusiones, los gestores y responsables toman decisiones acertadas de
gestión.
¿COMO FUNCIONA BIG DATA ?
WEB SCRAPING
WEB SCRAPING
S
M
A
R
T
D
A
T
A
ECOSISTEMAS Y FRAMEWORKS
“La biblioteca Hadoop, utiliza modelos de programación simples para el almacenamiento y procesamiento distribuido, de
grandes conjuntos de datos en clusters, otorgando redundancia para no perder información y al mismo tiempo,
aprovechando muchos procesos a la vez”.
“Dentro de las bases de datos NoSQL, probablemente una de las más famosas sea MongoDB, como característica
distintiva es una base de datos orientada a documentos, es decir guarda los datos en documentos y no en registros
como las típicas bases de datos”.
ECOSISTEMAS Y FRAMEWORKS
“Se pueden programar aplicaciones usando diferentes lenguajes como Java, Python pudiendo ser, según el
programa hasta 100 veces más rápido en memoria o 10 veces más en disco que Apache Hadoop”.
ECOSISTEMAS Y FRAMEWORKS
RECOMENDACIONES DE APLICACIÓN
1. Se debe dedicar un esfuerzo importante en conseguir resultados centrados en el cliente.
2. Desarrollar proyectos Big Data para toda la empresa.
3. La forma más correcta de iniciar un proyecto Big Data, consiste en plantearse objetivos a corto plazo.
4. Desarrollar funcionalidades analíticas sobre las necesidades y prioridades de negocio.
5. Optimizar los sistemas de información del negocio.
6. Crear un equipo especialista de data scientists.
APLICACIONES Y CASOS REALES
Entre las ventajas más importantes a mencionar, se encuentran:
• Mejora el proceso de toma de decisión.
• Seguridad en los datos.
• Obtener ventajas competitivas.
• Mejora de la accesibilidad de la información dentro de la empresa.
• Nuevas fuentes de ingresos.
A la hora de implementar un proyecto de Big Data tenemos que tener en cuenta ciertas consideraciones asociadas con:
• La ciberseguridad y la seguridad informática.
• Políticas de protección de datos personales.
• Gestión y almacenamiento de grandes volúmenes de datos.
CONSIDERACIONES
EJEMPLOS
• Big Data en marketing y ventas:
• Big Data en telecomunicaciones
• Big Data en la logística y transporte
• Big Data en los procesos de producción
Amazon es el rey del eCommerce porque supo adoptar la tecnología de vanguardia
para recolectar, analizar y utilizar la cantidad masiva de datos a la que tienen acceso
a partir del historial de búsqueda y de compra de una persona.
Con toda esta información, la compañía logró optimizar su cadena de suministro,
mejorar sus sistemas de recomendación y en consecuencia perfeccionar su política
de precios.
CASOS DE ÉXITO
“Sin dudas, Netflix también es una de las empresas que mejor ha sabido utilizar a su
favor todas las potencialidades que el Big Data ofrece en su masividad de datos.
Entre las acciones que realiza, rastrea las calificaciones, el tiempo dedicado y las
tendencias de cada uno de sus usuarios para brindar una lista o sugerencia
personalizada. Además, en base a esos insight obtenidos planifica incluso su propia
producción de contenido audiovisual.”
CASOS DE ÉXITO
“Creo que todos, alguna vez nos hemos preguntado cómo Starbucks puede abrir 5
tiendas en un radio de 3 kilómetros y aun así siempre estar llenos? La realidad es que
esta compañía cafetera, utiliza el Big Data para determinar el éxito potencial de cada
tienda nueva que piensan abrir. Recogen información sobre la ubicación, tráfico, área
demográfica y comportamientos del consumidor. Realizar este tipo de evaluación antes
de abrir una tienda, le permite a Starbucks hacer una estimación bastante precisa de
cuál será la tasa de éxito y elegir la ubicación más adecuada y efectiva.”
CASOS DE ÉXITO
• La gran mayoría de casos involucra siempre, la aplicación de diversas tecnologías como ser: Inteligencia de Negocios,
Ciencia de Datos, Machine Learning, Inteligencia Artificial, etc.
• Una solución de Big Data siempre estará asociada a las famosas 3 “V” del Big Data (Volumen, Velocidad y Variedad).
“Alto volumen de datos, que crecen a una velocidad exponencial y que presentan una variedad o estructura particularmente
compleja .”
CONCLUSIONES

Más contenido relacionado

La actualidad más candente

Team 2 Big Data Presentation
Team 2 Big Data PresentationTeam 2 Big Data Presentation
Team 2 Big Data Presentation
Matthew Urdan
 

La actualidad más candente (20)

Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
 
Data, Information And Knowledge Management Framework And The Data Management ...
Data, Information And Knowledge Management Framework And The Data Management ...Data, Information And Knowledge Management Framework And The Data Management ...
Data, Information And Knowledge Management Framework And The Data Management ...
 
Is Enterprise Data Literacy Possible?
Is Enterprise Data Literacy Possible?Is Enterprise Data Literacy Possible?
Is Enterprise Data Literacy Possible?
 
Data Architecture Best Practices for Advanced Analytics
Data Architecture Best Practices for Advanced AnalyticsData Architecture Best Practices for Advanced Analytics
Data Architecture Best Practices for Advanced Analytics
 
DAS Slides: Building a Data Strategy — Practical Steps for Aligning with Busi...
DAS Slides: Building a Data Strategy — Practical Steps for Aligning with Busi...DAS Slides: Building a Data Strategy — Practical Steps for Aligning with Busi...
DAS Slides: Building a Data Strategy — Practical Steps for Aligning with Busi...
 
Big data
Big dataBig data
Big data
 
Agile & Data Modeling – How Can They Work Together?
Agile & Data Modeling – How Can They Work Together?Agile & Data Modeling – How Can They Work Together?
Agile & Data Modeling – How Can They Work Together?
 
Data Governance_Notes.pptx
Data Governance_Notes.pptxData Governance_Notes.pptx
Data Governance_Notes.pptx
 
Learn to Use Databricks for the Full ML Lifecycle
Learn to Use Databricks for the Full ML LifecycleLearn to Use Databricks for the Full ML Lifecycle
Learn to Use Databricks for the Full ML Lifecycle
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Big data
Big dataBig data
Big data
 
What is Data Science
What is Data ScienceWhat is Data Science
What is Data Science
 
Data Architecture Strategies: Data Architecture for Digital Transformation
Data Architecture Strategies: Data Architecture for Digital TransformationData Architecture Strategies: Data Architecture for Digital Transformation
Data Architecture Strategies: Data Architecture for Digital Transformation
 
Data engineering
Data engineeringData engineering
Data engineering
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data Governance Best Practices
Data Governance Best PracticesData Governance Best Practices
Data Governance Best Practices
 
Team 2 Big Data Presentation
Team 2 Big Data PresentationTeam 2 Big Data Presentation
Team 2 Big Data Presentation
 
The Evolution of Data Science
The Evolution of Data ScienceThe Evolution of Data Science
The Evolution of Data Science
 
8 Steps to Creating a Data Strategy
8 Steps to Creating a Data Strategy8 Steps to Creating a Data Strategy
8 Steps to Creating a Data Strategy
 
AI Data Acquisition and Governance: Considerations for Success
AI Data Acquisition and Governance: Considerations for SuccessAI Data Acquisition and Governance: Considerations for Success
AI Data Acquisition and Governance: Considerations for Success
 

Similar a 01. Introducción a la Analítica de Datos.pptx

Base de datos 217 1bn
Base de datos 217 1bnBase de datos 217 1bn
Base de datos 217 1bn
juanjosetn
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
laubritez2001
 

Similar a 01. Introducción a la Analítica de Datos.pptx (20)

Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
BigData.pptx
BigData.pptxBigData.pptx
BigData.pptx
 
BigData.pptx
BigData.pptxBigData.pptx
BigData.pptx
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Que es big data
Que es big dataQue es big data
Que es big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
BIG DATA GRUPO #7
BIG DATA GRUPO #7 BIG DATA GRUPO #7
BIG DATA GRUPO #7
 
Trabajo de-big-data
Trabajo de-big-dataTrabajo de-big-data
Trabajo de-big-data
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Big data
Big dataBig data
Big data
 
Big data, Big Objects
Big data, Big ObjectsBig data, Big Objects
Big data, Big Objects
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Base de datos 217 1bn
Base de datos 217 1bnBase de datos 217 1bn
Base de datos 217 1bn
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
Big data
Big dataBig data
Big data
 

Último

MODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdf
MODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdfMODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdf
MODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdf
vladimirpaucarmontes
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
bcondort
 
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
Ricardo705519
 
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNATINSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
evercoyla
 
tesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa mariatesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa maria
susafy7
 

Último (20)

27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt
 
MODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdf
MODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdfMODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdf
MODIFICADO - CAPITULO II DISEÑO SISMORRESISTENTE DE VIGAS Y COLUMNAS.pdf
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
 
Presentacion de la ganaderia en la región
Presentacion de la ganaderia en la regiónPresentacion de la ganaderia en la región
Presentacion de la ganaderia en la región
 
Clasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxClasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docx
 
JM HIDROGENO VERDE- OXI-HIDROGENO en calderas - julio 17 del 2023.pdf
JM HIDROGENO VERDE- OXI-HIDROGENO en calderas - julio 17 del 2023.pdfJM HIDROGENO VERDE- OXI-HIDROGENO en calderas - julio 17 del 2023.pdf
JM HIDROGENO VERDE- OXI-HIDROGENO en calderas - julio 17 del 2023.pdf
 
Estadística Anual y Multianual del Sector Eléctrico Ecuatoriano
Estadística Anual y Multianual del Sector Eléctrico EcuatorianoEstadística Anual y Multianual del Sector Eléctrico Ecuatoriano
Estadística Anual y Multianual del Sector Eléctrico Ecuatoriano
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
 
Ficha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelosFicha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelos
 
Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdf
 
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf  PARA TRABAJO SEGUROATS-FORMATO cara.pdf  PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
 
Lineamientos del Plan Oferta y Demanda sesión 5
Lineamientos del Plan Oferta y Demanda sesión 5Lineamientos del Plan Oferta y Demanda sesión 5
Lineamientos del Plan Oferta y Demanda sesión 5
 
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADOPERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
 
413924447-Clasificacion-de-Inventarios-ABC-ppt.ppt
413924447-Clasificacion-de-Inventarios-ABC-ppt.ppt413924447-Clasificacion-de-Inventarios-ABC-ppt.ppt
413924447-Clasificacion-de-Inventarios-ABC-ppt.ppt
 
Desigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdfDesigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdf
 
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
 
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNATINSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
 
CALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptxCALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptx
 
tesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa mariatesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa maria
 
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheAportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
 

01. Introducción a la Analítica de Datos.pptx

  • 2. INTRODUCCIÓN A LAANALÍTICA DE DATOS •Conceptos Básicos. •Big Data y Smart Data. •Web Scraping. •Metodología para Proyectos de Analítica.
  • 3. CONTENIDO •Fundamentos Generales del Big Data/ Las 3 V’s y 7 Vs. • Fases de un proyecto de Big Data y Recomendaciones. •Smart Data •Web Scraping • Ecosistema y Frameworks •Aplicaciones y casos reales. • Ejemplos de empresas que aplicaron Big Data. • Conclusiones.
  • 4. “Big data es una colección de grandes volúmenes de datos, complejos y muy difíciles de procesar, a través de herramientas de gestión y procesamiento de datos tradicionales”. FUNDAMENTOS GENERALES
  • 5. • Volumen: Referido a la masividad de los datos generados. • Variedad: Diversidad en las estructuras de los datos a integrar. • Velocidad: Asociado con el tiempo de procesamiento de los datos. LAS 3 V DEL BIG DATA
  • 6. VOLUMEN: “En el año 2000, se almacenaron en el mundo 800.000 petabytes. Se espera que en el año 2022, se alcancen los 45 zettabytes (ZB). Sólo Twitter genera más de 9 terabytes (TB) de datos cada día, Facebook 10 TB y algunas empresas ya generan terabytes de datos cada hora de cada día del año”. LAS 3 V DEL BIG DATA
  • 7. VARIEDAD: Datos Estructurados: La gran mayoría de las fuentes de datos tradicionales son originadas por datos del tipo estructurados, datos con formato o esquema fijo, que poseen campos fijos y bien definidos. LAS 3 V DEL BIG DATA
  • 8. VARIEDAD: Datos no Estructurados: Son las estructuras de datos más difíciles de manejar, podemos encontrar entre los datos no estructurados más conocidos: ● Documentos PDF o Word. ● Audios y videos. ● Correos electrónicos. ● Ficheros multimedia de imagen. ● Artículos y textos, entre otros. LAS 3 V DEL BIG DATA
  • 9. VARIEDAD: Datos Semi - Estructurados: Son un híbrido entre los datos estructurados y los datos no estructurados, podríamos decir entonces de manera sencilla, que no presentan una estructura perfectamente definida como los datos estructurados, pero sí presentan una organización definida en sus metadatos donde describen los objetos y sus relaciones. LAS 3 V DEL BIG DATA
  • 10. “Si analizamos la acción de poner un simple “me gusta” en una foto, estamos entonces creando nuevos datos, cuando empleamos el GPS también, cuando compramos un boleto de avión, hasta cuando pedimos un turno al médico”. VELOCIDAD: LAS 3 V DEL BIG DATA
  • 11. Se agregan a las anteriores Vs las siguientes características: • Veracidad. • Viabilidad. • Visualización. • Valor. LAS 7 V DEL BIG DATA
  • 12. FASES DE UN PROYECTO DE BIG DATA “La implementación de una solución de Big Data, consiste en la ejecución del ciclo de vida estándar asociado a todo proyecto de Big Data”.
  • 13. Las principales etapas que componen este ciclo son: FASES DE UN PROYECTO DE BIG DATA
  • 14. Tenemos que: 1. Crear una estrategia: Debemos tener muy claro para qué fines queremos implantar Big Data en la empresa. Además, también es importante conocer los recursos con los que contamos y los que necesitaremos. 2. Escoger las fuentes de datos: Se están creando datos sin parar y debemos seleccionar bien las que generen datos valiosos para la empresa. Entre ellas, tenemos: información proveniente de sensores y dispositivos IoT, datos abiertos, información de webs y redes sociales, data lakes, etc. ¿COMO FUNCIONA BIG DATA ?
  • 15. 3. Almacenamiento y gestión de los datos: Aquí se encuentran acciones como el acceso fiable, los métodos de integración, el aseguramiento de la calidad de los datos, su control, almacenamiento y preparación para análisis. 4. Análisis de la información: Obtenemos valor de los datos, identificando patrones, correlaciones y otras conclusiones útiles y alineadas con nuestra estrategia. 5. Toma de Decisiones: Por último, con todas estas conclusiones, los gestores y responsables toman decisiones acertadas de gestión. ¿COMO FUNCIONA BIG DATA ?
  • 19. ECOSISTEMAS Y FRAMEWORKS “La biblioteca Hadoop, utiliza modelos de programación simples para el almacenamiento y procesamiento distribuido, de grandes conjuntos de datos en clusters, otorgando redundancia para no perder información y al mismo tiempo, aprovechando muchos procesos a la vez”.
  • 20. “Dentro de las bases de datos NoSQL, probablemente una de las más famosas sea MongoDB, como característica distintiva es una base de datos orientada a documentos, es decir guarda los datos en documentos y no en registros como las típicas bases de datos”. ECOSISTEMAS Y FRAMEWORKS
  • 21. “Se pueden programar aplicaciones usando diferentes lenguajes como Java, Python pudiendo ser, según el programa hasta 100 veces más rápido en memoria o 10 veces más en disco que Apache Hadoop”. ECOSISTEMAS Y FRAMEWORKS
  • 22. RECOMENDACIONES DE APLICACIÓN 1. Se debe dedicar un esfuerzo importante en conseguir resultados centrados en el cliente. 2. Desarrollar proyectos Big Data para toda la empresa. 3. La forma más correcta de iniciar un proyecto Big Data, consiste en plantearse objetivos a corto plazo. 4. Desarrollar funcionalidades analíticas sobre las necesidades y prioridades de negocio. 5. Optimizar los sistemas de información del negocio. 6. Crear un equipo especialista de data scientists.
  • 23. APLICACIONES Y CASOS REALES Entre las ventajas más importantes a mencionar, se encuentran: • Mejora el proceso de toma de decisión. • Seguridad en los datos. • Obtener ventajas competitivas. • Mejora de la accesibilidad de la información dentro de la empresa. • Nuevas fuentes de ingresos.
  • 24. A la hora de implementar un proyecto de Big Data tenemos que tener en cuenta ciertas consideraciones asociadas con: • La ciberseguridad y la seguridad informática. • Políticas de protección de datos personales. • Gestión y almacenamiento de grandes volúmenes de datos. CONSIDERACIONES
  • 25. EJEMPLOS • Big Data en marketing y ventas: • Big Data en telecomunicaciones • Big Data en la logística y transporte • Big Data en los procesos de producción
  • 26. Amazon es el rey del eCommerce porque supo adoptar la tecnología de vanguardia para recolectar, analizar y utilizar la cantidad masiva de datos a la que tienen acceso a partir del historial de búsqueda y de compra de una persona. Con toda esta información, la compañía logró optimizar su cadena de suministro, mejorar sus sistemas de recomendación y en consecuencia perfeccionar su política de precios. CASOS DE ÉXITO
  • 27. “Sin dudas, Netflix también es una de las empresas que mejor ha sabido utilizar a su favor todas las potencialidades que el Big Data ofrece en su masividad de datos. Entre las acciones que realiza, rastrea las calificaciones, el tiempo dedicado y las tendencias de cada uno de sus usuarios para brindar una lista o sugerencia personalizada. Además, en base a esos insight obtenidos planifica incluso su propia producción de contenido audiovisual.” CASOS DE ÉXITO
  • 28. “Creo que todos, alguna vez nos hemos preguntado cómo Starbucks puede abrir 5 tiendas en un radio de 3 kilómetros y aun así siempre estar llenos? La realidad es que esta compañía cafetera, utiliza el Big Data para determinar el éxito potencial de cada tienda nueva que piensan abrir. Recogen información sobre la ubicación, tráfico, área demográfica y comportamientos del consumidor. Realizar este tipo de evaluación antes de abrir una tienda, le permite a Starbucks hacer una estimación bastante precisa de cuál será la tasa de éxito y elegir la ubicación más adecuada y efectiva.” CASOS DE ÉXITO
  • 29. • La gran mayoría de casos involucra siempre, la aplicación de diversas tecnologías como ser: Inteligencia de Negocios, Ciencia de Datos, Machine Learning, Inteligencia Artificial, etc. • Una solución de Big Data siempre estará asociada a las famosas 3 “V” del Big Data (Volumen, Velocidad y Variedad). “Alto volumen de datos, que crecen a una velocidad exponencial y que presentan una variedad o estructura particularmente compleja .” CONCLUSIONES