SlideShare una empresa de Scribd logo
INTRODUCCIÓN A LA
ANALÍTICA DE DATOS
INTRODUCCIÓN A LAANALÍTICA DE DATOS
•Conceptos Básicos.
•Big Data y Smart Data.
•Web Scraping.
•Metodología para Proyectos de Analítica.
CONTENIDO
•Fundamentos Generales del Big Data/ Las 3 V’s y 7 Vs.
• Fases de un proyecto de Big Data y Recomendaciones.
•Smart Data
•Web Scraping
• Ecosistema y Frameworks
•Aplicaciones y casos reales.
• Ejemplos de empresas que aplicaron Big Data.
• Conclusiones.
“Big data es una colección de grandes volúmenes de datos, complejos y muy difíciles de procesar, a través de herramientas
de gestión y procesamiento de datos tradicionales”.
FUNDAMENTOS GENERALES
• Volumen: Referido a la masividad de los datos
generados.
• Variedad: Diversidad en las estructuras de los datos a
integrar.
• Velocidad: Asociado con el tiempo de procesamiento
de los datos.
LAS 3 V DEL BIG DATA
VOLUMEN:
“En el año 2000, se almacenaron en el mundo 800.000 petabytes. Se espera que en el año 2022, se alcancen los 45
zettabytes (ZB). Sólo Twitter genera más de 9 terabytes (TB) de datos cada día, Facebook 10 TB y algunas empresas ya
generan terabytes de datos cada hora de cada día del año”.
LAS 3 V DEL BIG DATA
VARIEDAD:
Datos Estructurados:
La gran mayoría de las fuentes de datos tradicionales son
originadas por datos del tipo estructurados, datos con formato
o esquema fijo, que poseen campos fijos y bien definidos.
LAS 3 V DEL BIG DATA
VARIEDAD:
Datos no Estructurados:
Son las estructuras de datos más difíciles de manejar,
podemos encontrar entre los datos no estructurados más
conocidos:
● Documentos PDF o Word.
● Audios y videos.
● Correos electrónicos.
● Ficheros multimedia de imagen.
● Artículos y textos, entre otros.
LAS 3 V DEL BIG DATA
VARIEDAD:
Datos Semi - Estructurados:
Son un híbrido entre los datos estructurados y los datos no
estructurados, podríamos decir entonces de manera sencilla,
que no presentan una estructura perfectamente definida como
los datos estructurados, pero sí presentan una organización
definida en sus metadatos donde describen los objetos y sus
relaciones.
LAS 3 V DEL BIG DATA
“Si analizamos la acción de poner un simple “me gusta” en una foto, estamos entonces creando nuevos datos, cuando
empleamos el GPS también, cuando compramos un boleto de avión, hasta cuando pedimos un turno al médico”.
VELOCIDAD:
LAS 3 V DEL BIG DATA
Se agregan a las anteriores Vs las siguientes
características:
• Veracidad.
• Viabilidad.
• Visualización.
• Valor.
LAS 7 V DEL BIG DATA
FASES DE UN PROYECTO DE BIG DATA
“La implementación de una solución de Big Data, consiste en la ejecución del ciclo de vida estándar asociado a todo proyecto
de Big Data”.
Las principales etapas que componen este ciclo son:
FASES DE UN PROYECTO DE BIG DATA
Tenemos que:
1. Crear una estrategia: Debemos tener muy claro para qué fines queremos implantar Big Data en la empresa. Además, también es
importante conocer los recursos con los que contamos y los que necesitaremos.
2. Escoger las fuentes de datos: Se están creando datos sin parar y debemos seleccionar bien las que generen datos valiosos para
la empresa. Entre ellas, tenemos: información proveniente de sensores y dispositivos IoT, datos abiertos, información de webs y redes
sociales, data lakes, etc.
¿COMO FUNCIONA BIG DATA ?
3. Almacenamiento y gestión de los datos: Aquí se encuentran acciones como el acceso fiable, los métodos de integración, el
aseguramiento de la calidad de los datos, su control, almacenamiento y preparación para análisis.
4. Análisis de la información: Obtenemos valor de los datos, identificando patrones, correlaciones y otras conclusiones útiles y
alineadas con nuestra estrategia.
5. Toma de Decisiones: Por último, con todas estas conclusiones, los gestores y responsables toman decisiones acertadas de
gestión.
¿COMO FUNCIONA BIG DATA ?
WEB SCRAPING
WEB SCRAPING
S
M
A
R
T
D
A
T
A
ECOSISTEMAS Y FRAMEWORKS
“La biblioteca Hadoop, utiliza modelos de programación simples para el almacenamiento y procesamiento distribuido, de
grandes conjuntos de datos en clusters, otorgando redundancia para no perder información y al mismo tiempo,
aprovechando muchos procesos a la vez”.
“Dentro de las bases de datos NoSQL, probablemente una de las más famosas sea MongoDB, como característica
distintiva es una base de datos orientada a documentos, es decir guarda los datos en documentos y no en registros
como las típicas bases de datos”.
ECOSISTEMAS Y FRAMEWORKS
“Se pueden programar aplicaciones usando diferentes lenguajes como Java, Python pudiendo ser, según el
programa hasta 100 veces más rápido en memoria o 10 veces más en disco que Apache Hadoop”.
ECOSISTEMAS Y FRAMEWORKS
RECOMENDACIONES DE APLICACIÓN
1. Se debe dedicar un esfuerzo importante en conseguir resultados centrados en el cliente.
2. Desarrollar proyectos Big Data para toda la empresa.
3. La forma más correcta de iniciar un proyecto Big Data, consiste en plantearse objetivos a corto plazo.
4. Desarrollar funcionalidades analíticas sobre las necesidades y prioridades de negocio.
5. Optimizar los sistemas de información del negocio.
6. Crear un equipo especialista de data scientists.
APLICACIONES Y CASOS REALES
Entre las ventajas más importantes a mencionar, se encuentran:
• Mejora el proceso de toma de decisión.
• Seguridad en los datos.
• Obtener ventajas competitivas.
• Mejora de la accesibilidad de la información dentro de la empresa.
• Nuevas fuentes de ingresos.
A la hora de implementar un proyecto de Big Data tenemos que tener en cuenta ciertas consideraciones asociadas con:
• La ciberseguridad y la seguridad informática.
• Políticas de protección de datos personales.
• Gestión y almacenamiento de grandes volúmenes de datos.
CONSIDERACIONES
EJEMPLOS
• Big Data en marketing y ventas:
• Big Data en telecomunicaciones
• Big Data en la logística y transporte
• Big Data en los procesos de producción
Amazon es el rey del eCommerce porque supo adoptar la tecnología de vanguardia
para recolectar, analizar y utilizar la cantidad masiva de datos a la que tienen acceso
a partir del historial de búsqueda y de compra de una persona.
Con toda esta información, la compañía logró optimizar su cadena de suministro,
mejorar sus sistemas de recomendación y en consecuencia perfeccionar su política
de precios.
CASOS DE ÉXITO
“Sin dudas, Netflix también es una de las empresas que mejor ha sabido utilizar a su
favor todas las potencialidades que el Big Data ofrece en su masividad de datos.
Entre las acciones que realiza, rastrea las calificaciones, el tiempo dedicado y las
tendencias de cada uno de sus usuarios para brindar una lista o sugerencia
personalizada. Además, en base a esos insight obtenidos planifica incluso su propia
producción de contenido audiovisual.”
CASOS DE ÉXITO
“Creo que todos, alguna vez nos hemos preguntado cómo Starbucks puede abrir 5
tiendas en un radio de 3 kilómetros y aun así siempre estar llenos? La realidad es que
esta compañía cafetera, utiliza el Big Data para determinar el éxito potencial de cada
tienda nueva que piensan abrir. Recogen información sobre la ubicación, tráfico, área
demográfica y comportamientos del consumidor. Realizar este tipo de evaluación antes
de abrir una tienda, le permite a Starbucks hacer una estimación bastante precisa de
cuál será la tasa de éxito y elegir la ubicación más adecuada y efectiva.”
CASOS DE ÉXITO
• La gran mayoría de casos involucra siempre, la aplicación de diversas tecnologías como ser: Inteligencia de Negocios,
Ciencia de Datos, Machine Learning, Inteligencia Artificial, etc.
• Una solución de Big Data siempre estará asociada a las famosas 3 “V” del Big Data (Volumen, Velocidad y Variedad).
“Alto volumen de datos, que crecen a una velocidad exponencial y que presentan una variedad o estructura particularmente
compleja .”
CONCLUSIONES

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Machine Learning para Todos
Machine Learning para TodosMachine Learning para Todos
Machine Learning para Todos
 
Inteligencia de Negocios presentacion
Inteligencia de Negocios presentacionInteligencia de Negocios presentacion
Inteligencia de Negocios presentacion
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 
Modelado de Data Warehouse
Modelado de Data WarehouseModelado de Data Warehouse
Modelado de Data Warehouse
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
DSS
DSSDSS
DSS
 
Big data
Big dataBig data
Big data
 
El dba(administracion de base de datos)
El dba(administracion de base de datos)El dba(administracion de base de datos)
El dba(administracion de base de datos)
 
BUSSINESS INTELLIGENT
BUSSINESS INTELLIGENTBUSSINESS INTELLIGENT
BUSSINESS INTELLIGENT
 
Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datos
 
IN Unidad 1: Introducción a la inteligencia de negocios
IN Unidad 1: Introducción a la inteligencia de negociosIN Unidad 1: Introducción a la inteligencia de negocios
IN Unidad 1: Introducción a la inteligencia de negocios
 

Similar a 01. Introducción a la Analítica de Datos.pptx

Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdfleccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdfLuisManuelGranadosMa
 
BIG DATA GRUPO #7
BIG DATA GRUPO #7 BIG DATA GRUPO #7
BIG DATA GRUPO #7 Dyllan Raza
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeEduardo Castro
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdfDarnelyC
 
Big data, Big Objects
Big data, Big ObjectsBig data, Big Objects
Big data, Big ObjectsNimacloud
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Base de datos 217 1bn
Base de datos 217 1bnBase de datos 217 1bn
Base de datos 217 1bnjuanjosetn
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdflaubritez2001
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
 

Similar a 01. Introducción a la Analítica de Datos.pptx (20)

Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
BigData.pptx
BigData.pptxBigData.pptx
BigData.pptx
 
BigData.pptx
BigData.pptxBigData.pptx
BigData.pptx
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Que es big data
Que es big dataQue es big data
Que es big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdfleccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
 
BIG DATA GRUPO #7
BIG DATA GRUPO #7 BIG DATA GRUPO #7
BIG DATA GRUPO #7
 
Trabajo de-big-data
Trabajo de-big-dataTrabajo de-big-data
Trabajo de-big-data
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Big data
Big dataBig data
Big data
 
Big data, Big Objects
Big data, Big ObjectsBig data, Big Objects
Big data, Big Objects
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Base de datos 217 1bn
Base de datos 217 1bnBase de datos 217 1bn
Base de datos 217 1bn
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
Big data
Big dataBig data
Big data
 

Último

14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdfDavidHunucoAlbornoz
 
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptxTEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptxmaitecuba2006
 
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloPlan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloAlbertoRiveraPrado
 
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.HaroldKewinCanaza1
 
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDFACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDFDavidMorales257484
 
problemas consolidación Mecánica de suelos
problemas consolidación Mecánica de suelosproblemas consolidación Mecánica de suelos
problemas consolidación Mecánica de suelosTefyReyes2
 
habilidad para el manejo de estación total.pdf
habilidad para el manejo de estación total.pdfhabilidad para el manejo de estación total.pdf
habilidad para el manejo de estación total.pdfJosemanuelMayradamia
 
matematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccionmatematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccionalberto891871
 
SISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdfSISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdfIvanIsraelPiaColina
 
Deilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - ConstrucciónDeilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - ConstrucciónDeilybethAinellAlaaY
 
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuariaBOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuariamesiassalazarpresent
 
Mecanismo de cuatro barras articuladas!!
Mecanismo de cuatro barras articuladas!!Mecanismo de cuatro barras articuladas!!
Mecanismo de cuatro barras articuladas!!shotter2005
 
Mecánica de fluidos 1 universidad continental
Mecánica de fluidos 1 universidad continentalMecánica de fluidos 1 universidad continental
Mecánica de fluidos 1 universidad continentalJOSHUASILVA36
 
PresentaciónReto_Equipo6 Explicacion del reto de freno electromagnetico
PresentaciónReto_Equipo6 Explicacion del reto de freno electromagneticoPresentaciónReto_Equipo6 Explicacion del reto de freno electromagnetico
PresentaciónReto_Equipo6 Explicacion del reto de freno electromagneticoa00834109
 
Instalación de GLPI en Debian Linux paso a paso
Instalación de GLPI en Debian Linux paso a pasoInstalación de GLPI en Debian Linux paso a paso
Instalación de GLPI en Debian Linux paso a pasosanjinesfreddygonzal
 
Mapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIASMapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIASAlfonsoRosalesFonsec
 
Ergonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworking
Ergonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworkingErgonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworking
Ergonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworkingGonzalo141557
 
tema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptx
tema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptxtema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptx
tema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptxDianaSG6
 

Último (20)

14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
 
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptxTEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptx
 
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloPlan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
 
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
 
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDFACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
 
problemas consolidación Mecánica de suelos
problemas consolidación Mecánica de suelosproblemas consolidación Mecánica de suelos
problemas consolidación Mecánica de suelos
 
habilidad para el manejo de estación total.pdf
habilidad para el manejo de estación total.pdfhabilidad para el manejo de estación total.pdf
habilidad para el manejo de estación total.pdf
 
matematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccionmatematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccion
 
SISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdfSISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdf
 
Deilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - ConstrucciónDeilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - Construcción
 
DESVIACION
DESVIACION DESVIACION
DESVIACION
 
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuariaBOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
 
Mecanismo de cuatro barras articuladas!!
Mecanismo de cuatro barras articuladas!!Mecanismo de cuatro barras articuladas!!
Mecanismo de cuatro barras articuladas!!
 
Mecánica de fluidos 1 universidad continental
Mecánica de fluidos 1 universidad continentalMecánica de fluidos 1 universidad continental
Mecánica de fluidos 1 universidad continental
 
PresentaciónReto_Equipo6 Explicacion del reto de freno electromagnetico
PresentaciónReto_Equipo6 Explicacion del reto de freno electromagneticoPresentaciónReto_Equipo6 Explicacion del reto de freno electromagnetico
PresentaciónReto_Equipo6 Explicacion del reto de freno electromagnetico
 
Sistemas de posicionamiento global (G.P.S.).pdf
Sistemas de posicionamiento global (G.P.S.).pdfSistemas de posicionamiento global (G.P.S.).pdf
Sistemas de posicionamiento global (G.P.S.).pdf
 
Instalación de GLPI en Debian Linux paso a paso
Instalación de GLPI en Debian Linux paso a pasoInstalación de GLPI en Debian Linux paso a paso
Instalación de GLPI en Debian Linux paso a paso
 
Mapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIASMapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIAS
 
Ergonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworking
Ergonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworkingErgonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworking
Ergonomía_MÉTODO_ROSA. Evaluación de puesto de trabajo de oficina - coworking
 
tema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptx
tema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptxtema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptx
tema-6.4-calculo-de-la-potencia-requerida-para-transporte-de-solidos-.pptx
 

01. Introducción a la Analítica de Datos.pptx

  • 2. INTRODUCCIÓN A LAANALÍTICA DE DATOS •Conceptos Básicos. •Big Data y Smart Data. •Web Scraping. •Metodología para Proyectos de Analítica.
  • 3. CONTENIDO •Fundamentos Generales del Big Data/ Las 3 V’s y 7 Vs. • Fases de un proyecto de Big Data y Recomendaciones. •Smart Data •Web Scraping • Ecosistema y Frameworks •Aplicaciones y casos reales. • Ejemplos de empresas que aplicaron Big Data. • Conclusiones.
  • 4. “Big data es una colección de grandes volúmenes de datos, complejos y muy difíciles de procesar, a través de herramientas de gestión y procesamiento de datos tradicionales”. FUNDAMENTOS GENERALES
  • 5. • Volumen: Referido a la masividad de los datos generados. • Variedad: Diversidad en las estructuras de los datos a integrar. • Velocidad: Asociado con el tiempo de procesamiento de los datos. LAS 3 V DEL BIG DATA
  • 6. VOLUMEN: “En el año 2000, se almacenaron en el mundo 800.000 petabytes. Se espera que en el año 2022, se alcancen los 45 zettabytes (ZB). Sólo Twitter genera más de 9 terabytes (TB) de datos cada día, Facebook 10 TB y algunas empresas ya generan terabytes de datos cada hora de cada día del año”. LAS 3 V DEL BIG DATA
  • 7. VARIEDAD: Datos Estructurados: La gran mayoría de las fuentes de datos tradicionales son originadas por datos del tipo estructurados, datos con formato o esquema fijo, que poseen campos fijos y bien definidos. LAS 3 V DEL BIG DATA
  • 8. VARIEDAD: Datos no Estructurados: Son las estructuras de datos más difíciles de manejar, podemos encontrar entre los datos no estructurados más conocidos: ● Documentos PDF o Word. ● Audios y videos. ● Correos electrónicos. ● Ficheros multimedia de imagen. ● Artículos y textos, entre otros. LAS 3 V DEL BIG DATA
  • 9. VARIEDAD: Datos Semi - Estructurados: Son un híbrido entre los datos estructurados y los datos no estructurados, podríamos decir entonces de manera sencilla, que no presentan una estructura perfectamente definida como los datos estructurados, pero sí presentan una organización definida en sus metadatos donde describen los objetos y sus relaciones. LAS 3 V DEL BIG DATA
  • 10. “Si analizamos la acción de poner un simple “me gusta” en una foto, estamos entonces creando nuevos datos, cuando empleamos el GPS también, cuando compramos un boleto de avión, hasta cuando pedimos un turno al médico”. VELOCIDAD: LAS 3 V DEL BIG DATA
  • 11. Se agregan a las anteriores Vs las siguientes características: • Veracidad. • Viabilidad. • Visualización. • Valor. LAS 7 V DEL BIG DATA
  • 12. FASES DE UN PROYECTO DE BIG DATA “La implementación de una solución de Big Data, consiste en la ejecución del ciclo de vida estándar asociado a todo proyecto de Big Data”.
  • 13. Las principales etapas que componen este ciclo son: FASES DE UN PROYECTO DE BIG DATA
  • 14. Tenemos que: 1. Crear una estrategia: Debemos tener muy claro para qué fines queremos implantar Big Data en la empresa. Además, también es importante conocer los recursos con los que contamos y los que necesitaremos. 2. Escoger las fuentes de datos: Se están creando datos sin parar y debemos seleccionar bien las que generen datos valiosos para la empresa. Entre ellas, tenemos: información proveniente de sensores y dispositivos IoT, datos abiertos, información de webs y redes sociales, data lakes, etc. ¿COMO FUNCIONA BIG DATA ?
  • 15. 3. Almacenamiento y gestión de los datos: Aquí se encuentran acciones como el acceso fiable, los métodos de integración, el aseguramiento de la calidad de los datos, su control, almacenamiento y preparación para análisis. 4. Análisis de la información: Obtenemos valor de los datos, identificando patrones, correlaciones y otras conclusiones útiles y alineadas con nuestra estrategia. 5. Toma de Decisiones: Por último, con todas estas conclusiones, los gestores y responsables toman decisiones acertadas de gestión. ¿COMO FUNCIONA BIG DATA ?
  • 19. ECOSISTEMAS Y FRAMEWORKS “La biblioteca Hadoop, utiliza modelos de programación simples para el almacenamiento y procesamiento distribuido, de grandes conjuntos de datos en clusters, otorgando redundancia para no perder información y al mismo tiempo, aprovechando muchos procesos a la vez”.
  • 20. “Dentro de las bases de datos NoSQL, probablemente una de las más famosas sea MongoDB, como característica distintiva es una base de datos orientada a documentos, es decir guarda los datos en documentos y no en registros como las típicas bases de datos”. ECOSISTEMAS Y FRAMEWORKS
  • 21. “Se pueden programar aplicaciones usando diferentes lenguajes como Java, Python pudiendo ser, según el programa hasta 100 veces más rápido en memoria o 10 veces más en disco que Apache Hadoop”. ECOSISTEMAS Y FRAMEWORKS
  • 22. RECOMENDACIONES DE APLICACIÓN 1. Se debe dedicar un esfuerzo importante en conseguir resultados centrados en el cliente. 2. Desarrollar proyectos Big Data para toda la empresa. 3. La forma más correcta de iniciar un proyecto Big Data, consiste en plantearse objetivos a corto plazo. 4. Desarrollar funcionalidades analíticas sobre las necesidades y prioridades de negocio. 5. Optimizar los sistemas de información del negocio. 6. Crear un equipo especialista de data scientists.
  • 23. APLICACIONES Y CASOS REALES Entre las ventajas más importantes a mencionar, se encuentran: • Mejora el proceso de toma de decisión. • Seguridad en los datos. • Obtener ventajas competitivas. • Mejora de la accesibilidad de la información dentro de la empresa. • Nuevas fuentes de ingresos.
  • 24. A la hora de implementar un proyecto de Big Data tenemos que tener en cuenta ciertas consideraciones asociadas con: • La ciberseguridad y la seguridad informática. • Políticas de protección de datos personales. • Gestión y almacenamiento de grandes volúmenes de datos. CONSIDERACIONES
  • 25. EJEMPLOS • Big Data en marketing y ventas: • Big Data en telecomunicaciones • Big Data en la logística y transporte • Big Data en los procesos de producción
  • 26. Amazon es el rey del eCommerce porque supo adoptar la tecnología de vanguardia para recolectar, analizar y utilizar la cantidad masiva de datos a la que tienen acceso a partir del historial de búsqueda y de compra de una persona. Con toda esta información, la compañía logró optimizar su cadena de suministro, mejorar sus sistemas de recomendación y en consecuencia perfeccionar su política de precios. CASOS DE ÉXITO
  • 27. “Sin dudas, Netflix también es una de las empresas que mejor ha sabido utilizar a su favor todas las potencialidades que el Big Data ofrece en su masividad de datos. Entre las acciones que realiza, rastrea las calificaciones, el tiempo dedicado y las tendencias de cada uno de sus usuarios para brindar una lista o sugerencia personalizada. Además, en base a esos insight obtenidos planifica incluso su propia producción de contenido audiovisual.” CASOS DE ÉXITO
  • 28. “Creo que todos, alguna vez nos hemos preguntado cómo Starbucks puede abrir 5 tiendas en un radio de 3 kilómetros y aun así siempre estar llenos? La realidad es que esta compañía cafetera, utiliza el Big Data para determinar el éxito potencial de cada tienda nueva que piensan abrir. Recogen información sobre la ubicación, tráfico, área demográfica y comportamientos del consumidor. Realizar este tipo de evaluación antes de abrir una tienda, le permite a Starbucks hacer una estimación bastante precisa de cuál será la tasa de éxito y elegir la ubicación más adecuada y efectiva.” CASOS DE ÉXITO
  • 29. • La gran mayoría de casos involucra siempre, la aplicación de diversas tecnologías como ser: Inteligencia de Negocios, Ciencia de Datos, Machine Learning, Inteligencia Artificial, etc. • Una solución de Big Data siempre estará asociada a las famosas 3 “V” del Big Data (Volumen, Velocidad y Variedad). “Alto volumen de datos, que crecen a una velocidad exponencial y que presentan una variedad o estructura particularmente compleja .” CONCLUSIONES