SlideShare una empresa de Scribd logo
1 de 11
Descargar para leer sin conexión
1
27 DICIEMBRE,2019
EDX: Curso Introducción a la Ciencia de Datos y el
Big Data – Tecnológico de Monterrey
PROYECTO INDIVIDUAL EVALUADO POR PARES
Creado por: Paola Quiroz Alvarez
Guayaquil - Ecuador
Utilizando la Ciencia
de Datos en una
organización
Caso: Librería Iztaccihuatl
2
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN ................................................................................................ 1
INTRODUCCION.................................................................................................................................................................... 3
DESARROLLO....................................................................................................................................................................... 4
1. Indicadores de Desempeño............................................................................................................................. 4
2. Análisis y Justificación..................................................................................................................................... 5
3. Decisiones ....................................................................................................................................................... 6
CONCLUSIONES.................................................................................................................................................................... 8
ANEXO 1: EL PROBLEMA....................................................................................................................................................... 9
3
Introduccion
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores
de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
Aunque no se ha mencionado un objetivo principal para el análisis a realizar, contamos
con datos de los libros en varios archivos y se menciona el promedio de clasificación de
cada libro de acuerdo a las votaciones y compras del cliente. También contamos con las
votaciones que hacen los clientes dentro del sitio web de la librería y las
recomendaciones de lectura que hacen estos clientes. Basados en estos datos
obtendremos los KPI’s que nos permitan planificar estrategias para mejorar el negocio y
recomendar acciones a seguir.
.
4
Desarrollo
1. Indicadores de Desempeño
Antes de seleccionar los Kpi´s necesitamos revisar el contenido de los archivos
disponibles, de tal forma tenemos:
 El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de acuerdo
a las votaciones y compras del cliente. No contiene datos de ventas. Se asume que
si no tiene valor en el campo AverageRating el libro ni siquiera ha sido leído.
 El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general. Se ha encontrado que este es el único archivo en el que
existen datos de volumen y valor de ventas pero unicamente para los veinte libros
registrados en el archivo. Pero no tiene el campo book_id para hacer enlace con
los demás archivos.
 El archivo “raitings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
 El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
Analizando los datos obtenidos de la información presentada obtenemos los siguientes
indicadores de desempeño:
1. Porcentaje de libros recomendados con respecto al total de libros
Formula de implementación: Contar (disctinct(to_read.book_id))/ Contar (books) * 100
2. Porcentaje de libros con buena calificación con respecto al total de libros
Formula de implementación:
Contar(Books.Average_Rating=”excelente”, “Muy Bueno”,”Bueno”) / Contar (books) * 100
5
3. Porcentaje de libros con mala calificación con respecto al total de libros
Formula de implementación:
Contar(Books.Average_Rating=”Regular”, “Malo”, “Muy Malo”,”” / Contar (books) * 100
* “” Se refiere a libros que no han sido evaluados porque ni siquiera han sido leidos.
4. Proporción de Buenos / Malos
La idea es sacar el % de libros con clasificacion buena vs % de libros con mala clasificacion
Formula de implementación:
Porcentaje de libros con buena calificación con respecto al total de libros / Porcentaje de libros
con mala calificación con respecto al total de libros
5. Porcentaje de libros no leidos con respecto al total de libros
Formula de implementación:
Contar(Books.Average_Rating=”” / Contar (books) * 100
* “” Se refiere a libros que no han sido evaluados porque ni siquiera han sido leidos.
2. Análisis y Justificación
Al tener datos históricos de los libros y de las votaciones y recomendaciones que dan
los clientes sobre ellos, nos permite realizar un Análisis Descriptivo para identificar los
comportamientos y evaluar la situación de la librería y poder tomar decisiones con un
alto grado de éxito. Los KPI´s encontrados nos ayudaran a obtener una visión de lo que
ha pasado y esta pasando.
También según los resultados del primer análisis podriamos realizar un Análisis
Predictivo, determinando por ejemplo con el primer KPI, cuales libros tienen más
probabilidad de ser vendidos debido a las recomendaciones recibidas, o con el KPI
6
Proporción de Buenos / Malos, podemos determinar la tendencia a futuro de tener una
mayor o menor demanda por la experiencia anterior.
3. Decisiones
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la
información analizada? Para cada indicador de desempeño vamos a determinar al
menos una decisión que debería tomar la librería.
1. Porcentaje de libros recomendados con respecto al total de libros
Esta métrica nos permite identificar cuantos libros han agradado a los clientes al
punto de querer recomendarlos y se lo compara con el total de libros existentes
en la librería.
 Si este porcentaje va en aumento nos indica que esta mejorando la percepción
o satisfacción de los clientes con respecto a nuestros libros, también puede
indicar que están leyendo más libros.
 Si este porcentaje disminuye significa que aunque estén entrando nuevos libros
a la librería, no se esta obteniendo nuevas recomendaciones, por lo que se
necesita renovar el tipo de libros o realizar alguna estrategia de marketing que
impulse a las personas a comprar más libros.
2. Porcentaje de libros con buena calificación con respecto al total de libros
Esta métrica nos permite identificar cuantos libros han tenido buena calificación y
buen nivel de ventas, al estar basado en el Average_Rating que se base en ambos
valores.
 Si este porcentaje va en aumento nos indica que esta mejorando la percepción
o satisfaccion de los clientes con respecto a nuestros libros.
 Si este porcentaje disminuye significa que se necesita alguna estrategia que
motive el nivel de ventas, como una estrategia de marketing por ejemplo.
7
3. Porcentaje de libros con mala calificación con respecto al total de libros
Esta métrica nos permite identificar cuantos libros no han sido leidos (vendidos)
por lo que no tienen aún valor en el campos Average_rating o han tenido mala
calificación.
 Si este porcentaje va en aumento nos indica que aunque estén entrando nuevos
libros a la librería estos no se venden o están obteniendo mala calificación de
los clientes. En este caso se recomendaria se implemente alguna promoción
para los nuevos libros que ingresan.
 Si este porcentaje disminuye significa estan mejorando las ventas de los libros
y obteniendo mejores calificaciones.
4. Proporción de Buenos / Malos
La idea es sacar el % de libros con clasificación buena vs % de libros con mala
clasificación.
Esta métrica tendra un valor de 0 a 5. Cuando la proporcion se acerca a 5 significa
que estan ganando las buenas calificaciones. Si es uno, indica que se ha llegado a
un valor identico de libros con buenas y malas calificaciones. Y si esta entre 0 y 1
nos indica que existen mas calificaciones malas que buenas. En este ultimo caso se
deberia hacer enfasis en promociones que permitan aumentar la venta de libros.
5. Porcentaje de libros no leidos con respecto al total de libros
Esta métrica nos permite identificar cuantos libros tienen poca llegada a los
clientes, por lo que no han sido leidos aun.
 Si este porcentaje va en aumento nos indica que los nuevos libros que van
ingresando no están teniendo buena acogida, deberiamos implementar una
estrategia de marketing que permita hacer conocer los nuevos libros y podria
ser sesiones de lectura en la misma librería con invitación gratuita que logre
enganchar a clientes potenciales.
 Si este porcentaje disminuye significa que estan surtiendo efecto nuestras
estrategias y los clientes están leyendo los libros que permanecian sin leer.
8
Conclusiones
A pesar de la poca información que proveen los archivos se ha logrado inferir los
siguientes indicadores de desempeño:
6. Porcentaje de libros recomendados con respecto al total de libros
7. Porcentaje de libros con buena calificación con respecto al total de libros
8. Porcentaje de libros con mala calificación con respecto al total de libros
9. Proporción de buenos / malos
10.Porcentaje de libros no leidos con respecto al total de libros
Se ha propuesto realizar Analisis Descriptivo y Predictivo con la información
proporcionada, y se ha logrado recomendar varias situaciones en la que será necesario
tomar decisiones o implementar estrategias basados en los resultados obtenidos en los
indicadores propuestos.
9
Anexo 1: El problema
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar
un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez
desarrollar una mejor estrategia en la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books; top_books;
raitings; to_read.
Una vez analizada la información de la carpeta “datasets_books” deberás presentar en un documento
Word la respuesta a las siguientes preguntas:
 ¿Qué indicadores serían los más importantes a determinar de acuerdo a la información presentada?
 ¿Qué tipo de análisis sería el más adecuado y por qué?
 ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la información
analizada?
El archivo “books” contiene los siguientes datos:
 Id - Identificador del registro
 Book Id - Identificador del libro
 Number Editions - Número de ediciones
 ISBN - Clave estándar internacional del libro
 ISBN13 - Clave estándar extendida internacional del libro
 Authors - Autor del libro
 Original Publication - Fecha de publicación
 Original Title - Título original del libro
 Title - Título del libro
 Language Code - Clave de idioma del libro
 Average Rating - Promedio de la clasificación del libro
 Image - Enlace a la imagen de la portada del libro
 Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
10
El archivo “top_books” contiene los siguientes datos:
 Position - Posición del libro en la clasificación del libro
 ISBN - Clave estándar extendida internacional del libro
 Title - Título del libro
 Author - Autor del libro
 Imprint - Editorial
 Publisher Group - Grupo Editorial
 Volume - Volumen de ventas hasta el 2010
 Value - Ventas determinadas por el volumen
 RRP - Precio recomendado para minoristas
 ASP - Precio promedio para venta
 Binding - Tipo de encuadernación
 Publ Date - Fecha de publicación
 Product Class - Clasificación del libro
 Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
 Book Id - Identificador del libro
 User Id - Identificador del cliente/usuario que clasifico un libro
 Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
 User Id - Identificador del cliente/usuario que clasifico un libro
 Book Id - Identificador del libro
11
El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el
promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación
general.
El archivo “raitings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la
librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre
libros para leer.

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

“Open Data Web” – A Linked Open Data Repository Built with CKAN
“Open Data Web” – A Linked Open Data Repository Built with CKAN“Open Data Web” – A Linked Open Data Repository Built with CKAN
“Open Data Web” – A Linked Open Data Repository Built with CKAN
 
Challenges and opportunities in library discovery services gen
Challenges and opportunities in library discovery services genChallenges and opportunities in library discovery services gen
Challenges and opportunities in library discovery services gen
 
Introdução ao RDA - Módulo 1: Modelos conceituais e desenvolvimento do RDA
Introdução ao RDA - Módulo 1: Modelos conceituais e desenvolvimento do RDAIntrodução ao RDA - Módulo 1: Modelos conceituais e desenvolvimento do RDA
Introdução ao RDA - Módulo 1: Modelos conceituais e desenvolvimento do RDA
 
DIAGRAMA DE FLUJO DE BÚSQUEDA DE INFORMACIÓN EN BIBLIOTECA
DIAGRAMA DE FLUJO DE BÚSQUEDA DE INFORMACIÓN EN BIBLIOTECADIAGRAMA DE FLUJO DE BÚSQUEDA DE INFORMACIÓN EN BIBLIOTECA
DIAGRAMA DE FLUJO DE BÚSQUEDA DE INFORMACIÓN EN BIBLIOTECA
 
Introduction To RDF and RDFS
Introduction To RDF and RDFSIntroduction To RDF and RDFS
Introduction To RDF and RDFS
 
RDA Intro - AACR2 / MARC> RDA / FRBR / Semantic Web
RDA Intro - AACR2 / MARC> RDA / FRBR / Semantic WebRDA Intro - AACR2 / MARC> RDA / FRBR / Semantic Web
RDA Intro - AACR2 / MARC> RDA / FRBR / Semantic Web
 
Diagrama de cómo buscar información en una biblioteca
Diagrama de cómo buscar información en una bibliotecaDiagrama de cómo buscar información en una biblioteca
Diagrama de cómo buscar información en una biblioteca
 
Planning with Polyalgebra: Bringing Together Relational, Complex and Machine ...
Planning with Polyalgebra: Bringing Together Relational, Complex and Machine ...Planning with Polyalgebra: Bringing Together Relational, Complex and Machine ...
Planning with Polyalgebra: Bringing Together Relational, Complex and Machine ...
 
Ventajas y desventajas de los sistemas rolap y molap
Ventajas y desventajas de los sistemas rolap y molapVentajas y desventajas de los sistemas rolap y molap
Ventajas y desventajas de los sistemas rolap y molap
 
Servicios bibliotecarios : realidades y tendencias
Servicios bibliotecarios : realidades y tendenciasServicios bibliotecarios : realidades y tendencias
Servicios bibliotecarios : realidades y tendencias
 
Elasticsearch V/s Relational Database
Elasticsearch V/s Relational DatabaseElasticsearch V/s Relational Database
Elasticsearch V/s Relational Database
 
Diagrama de informacion de la biblioteca
Diagrama de  informacion de la bibliotecaDiagrama de  informacion de la biblioteca
Diagrama de informacion de la biblioteca
 
Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWS
 
Google Cloud Dataflow Two Worlds Become a Much Better One
Google Cloud Dataflow Two Worlds Become a Much Better OneGoogle Cloud Dataflow Two Worlds Become a Much Better One
Google Cloud Dataflow Two Worlds Become a Much Better One
 
Modelos conceptuales: FRBR, FRAD, FRSAD (Ricardo Santos Muñoz)
Modelos conceptuales: FRBR, FRAD, FRSAD (Ricardo Santos Muñoz)Modelos conceptuales: FRBR, FRAD, FRSAD (Ricardo Santos Muñoz)
Modelos conceptuales: FRBR, FRAD, FRSAD (Ricardo Santos Muñoz)
 
How to Analyze & Optimize Mobility with Geospatial Data (Snowflake).pdf
How to Analyze & Optimize Mobility with Geospatial Data (Snowflake).pdfHow to Analyze & Optimize Mobility with Geospatial Data (Snowflake).pdf
How to Analyze & Optimize Mobility with Geospatial Data (Snowflake).pdf
 
Aws schema conversion tool
Aws schema conversion toolAws schema conversion tool
Aws schema conversion tool
 
MLOps at OLX
MLOps at OLXMLOps at OLX
MLOps at OLX
 
Seminario 3: RDA. Nuevos estándares de descripción. Introducción e implicacio...
Seminario 3: RDA. Nuevos estándares de descripción. Introducción e implicacio...Seminario 3: RDA. Nuevos estándares de descripción. Introducción e implicacio...
Seminario 3: RDA. Nuevos estándares de descripción. Introducción e implicacio...
 
From Data to AI with the Machine Learning Canvas
From Data to AI with the Machine Learning CanvasFrom Data to AI with the Machine Learning Canvas
From Data to AI with the Machine Learning Canvas
 

Similar a Big data Caso Libreria Iztaccihuatl

Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
Sofía Ardila
 

Similar a Big data Caso Libreria Iztaccihuatl (20)

Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Edx
EdxEdx
Edx
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datos
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
rh.docx
rh.docxrh.docx
rh.docx
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 
Evaintro
EvaintroEvaintro
Evaintro
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Practica 1
Practica 1Practica 1
Practica 1
 
Proy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriProy eval de pares Jhardena Yauri
Proy eval de pares Jhardena Yauri
 
Reporte.pdf
Reporte.pdfReporte.pdf
Reporte.pdf
 
Trabajo big data
Trabajo big data Trabajo big data
Trabajo big data
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaProyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 

Último

My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
FeliGamarra1
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
matiasccoyllomarca
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
analiticaydatos
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigación
EduCE2
 

Último (20)

Guía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviGuía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico Jamovi
 
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúAnálisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
 
principios pedagógicos del modelo agazian
principios pedagógicos  del modelo agazianprincipios pedagógicos  del modelo agazian
principios pedagógicos del modelo agazian
 
Ideas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechileIdeas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechile
 
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdf
 
Posición global del PIB per cápita Israelí (1948-2024).pdf
Posición global  del PIB per cápita  Israelí  (1948-2024).pdfPosición global  del PIB per cápita  Israelí  (1948-2024).pdf
Posición global del PIB per cápita Israelí (1948-2024).pdf
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historia
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoah
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigación
 
Estudio sobre tenencia de animales domésticos en Madrid 2019-2023
Estudio sobre tenencia de animales domésticos en Madrid 2019-2023Estudio sobre tenencia de animales domésticos en Madrid 2019-2023
Estudio sobre tenencia de animales domésticos en Madrid 2019-2023
 
CARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioCARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia Patrimonio
 
Diapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especificoDiapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especifico
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de Ipsos
 
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERALCUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
 
La semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomasLa semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomas
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
 
Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdf
 

Big data Caso Libreria Iztaccihuatl

  • 1. 1 27 DICIEMBRE,2019 EDX: Curso Introducción a la Ciencia de Datos y el Big Data – Tecnológico de Monterrey PROYECTO INDIVIDUAL EVALUADO POR PARES Creado por: Paola Quiroz Alvarez Guayaquil - Ecuador Utilizando la Ciencia de Datos en una organización Caso: Librería Iztaccihuatl
  • 2. 2 UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN ................................................................................................ 1 INTRODUCCION.................................................................................................................................................................... 3 DESARROLLO....................................................................................................................................................................... 4 1. Indicadores de Desempeño............................................................................................................................. 4 2. Análisis y Justificación..................................................................................................................................... 5 3. Decisiones ....................................................................................................................................................... 6 CONCLUSIONES.................................................................................................................................................................... 8 ANEXO 1: EL PROBLEMA....................................................................................................................................................... 9
  • 3. 3 Introduccion La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. Aunque no se ha mencionado un objetivo principal para el análisis a realizar, contamos con datos de los libros en varios archivos y se menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente. También contamos con las votaciones que hacen los clientes dentro del sitio web de la librería y las recomendaciones de lectura que hacen estos clientes. Basados en estos datos obtendremos los KPI’s que nos permitan planificar estrategias para mejorar el negocio y recomendar acciones a seguir. .
  • 4. 4 Desarrollo 1. Indicadores de Desempeño Antes de seleccionar los Kpi´s necesitamos revisar el contenido de los archivos disponibles, de tal forma tenemos:  El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente. No contiene datos de ventas. Se asume que si no tiene valor en el campo AverageRating el libro ni siquiera ha sido leído.  El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación general. Se ha encontrado que este es el único archivo en el que existen datos de volumen y valor de ventas pero unicamente para los veinte libros registrados en el archivo. Pero no tiene el campo book_id para hacer enlace con los demás archivos.  El archivo “raitings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería.  El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. Analizando los datos obtenidos de la información presentada obtenemos los siguientes indicadores de desempeño: 1. Porcentaje de libros recomendados con respecto al total de libros Formula de implementación: Contar (disctinct(to_read.book_id))/ Contar (books) * 100 2. Porcentaje de libros con buena calificación con respecto al total de libros Formula de implementación: Contar(Books.Average_Rating=”excelente”, “Muy Bueno”,”Bueno”) / Contar (books) * 100
  • 5. 5 3. Porcentaje de libros con mala calificación con respecto al total de libros Formula de implementación: Contar(Books.Average_Rating=”Regular”, “Malo”, “Muy Malo”,”” / Contar (books) * 100 * “” Se refiere a libros que no han sido evaluados porque ni siquiera han sido leidos. 4. Proporción de Buenos / Malos La idea es sacar el % de libros con clasificacion buena vs % de libros con mala clasificacion Formula de implementación: Porcentaje de libros con buena calificación con respecto al total de libros / Porcentaje de libros con mala calificación con respecto al total de libros 5. Porcentaje de libros no leidos con respecto al total de libros Formula de implementación: Contar(Books.Average_Rating=”” / Contar (books) * 100 * “” Se refiere a libros que no han sido evaluados porque ni siquiera han sido leidos. 2. Análisis y Justificación Al tener datos históricos de los libros y de las votaciones y recomendaciones que dan los clientes sobre ellos, nos permite realizar un Análisis Descriptivo para identificar los comportamientos y evaluar la situación de la librería y poder tomar decisiones con un alto grado de éxito. Los KPI´s encontrados nos ayudaran a obtener una visión de lo que ha pasado y esta pasando. También según los resultados del primer análisis podriamos realizar un Análisis Predictivo, determinando por ejemplo con el primer KPI, cuales libros tienen más probabilidad de ser vendidos debido a las recomendaciones recibidas, o con el KPI
  • 6. 6 Proporción de Buenos / Malos, podemos determinar la tendencia a futuro de tener una mayor o menor demanda por la experiencia anterior. 3. Decisiones ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la información analizada? Para cada indicador de desempeño vamos a determinar al menos una decisión que debería tomar la librería. 1. Porcentaje de libros recomendados con respecto al total de libros Esta métrica nos permite identificar cuantos libros han agradado a los clientes al punto de querer recomendarlos y se lo compara con el total de libros existentes en la librería.  Si este porcentaje va en aumento nos indica que esta mejorando la percepción o satisfacción de los clientes con respecto a nuestros libros, también puede indicar que están leyendo más libros.  Si este porcentaje disminuye significa que aunque estén entrando nuevos libros a la librería, no se esta obteniendo nuevas recomendaciones, por lo que se necesita renovar el tipo de libros o realizar alguna estrategia de marketing que impulse a las personas a comprar más libros. 2. Porcentaje de libros con buena calificación con respecto al total de libros Esta métrica nos permite identificar cuantos libros han tenido buena calificación y buen nivel de ventas, al estar basado en el Average_Rating que se base en ambos valores.  Si este porcentaje va en aumento nos indica que esta mejorando la percepción o satisfaccion de los clientes con respecto a nuestros libros.  Si este porcentaje disminuye significa que se necesita alguna estrategia que motive el nivel de ventas, como una estrategia de marketing por ejemplo.
  • 7. 7 3. Porcentaje de libros con mala calificación con respecto al total de libros Esta métrica nos permite identificar cuantos libros no han sido leidos (vendidos) por lo que no tienen aún valor en el campos Average_rating o han tenido mala calificación.  Si este porcentaje va en aumento nos indica que aunque estén entrando nuevos libros a la librería estos no se venden o están obteniendo mala calificación de los clientes. En este caso se recomendaria se implemente alguna promoción para los nuevos libros que ingresan.  Si este porcentaje disminuye significa estan mejorando las ventas de los libros y obteniendo mejores calificaciones. 4. Proporción de Buenos / Malos La idea es sacar el % de libros con clasificación buena vs % de libros con mala clasificación. Esta métrica tendra un valor de 0 a 5. Cuando la proporcion se acerca a 5 significa que estan ganando las buenas calificaciones. Si es uno, indica que se ha llegado a un valor identico de libros con buenas y malas calificaciones. Y si esta entre 0 y 1 nos indica que existen mas calificaciones malas que buenas. En este ultimo caso se deberia hacer enfasis en promociones que permitan aumentar la venta de libros. 5. Porcentaje de libros no leidos con respecto al total de libros Esta métrica nos permite identificar cuantos libros tienen poca llegada a los clientes, por lo que no han sido leidos aun.  Si este porcentaje va en aumento nos indica que los nuevos libros que van ingresando no están teniendo buena acogida, deberiamos implementar una estrategia de marketing que permita hacer conocer los nuevos libros y podria ser sesiones de lectura en la misma librería con invitación gratuita que logre enganchar a clientes potenciales.  Si este porcentaje disminuye significa que estan surtiendo efecto nuestras estrategias y los clientes están leyendo los libros que permanecian sin leer.
  • 8. 8 Conclusiones A pesar de la poca información que proveen los archivos se ha logrado inferir los siguientes indicadores de desempeño: 6. Porcentaje de libros recomendados con respecto al total de libros 7. Porcentaje de libros con buena calificación con respecto al total de libros 8. Porcentaje de libros con mala calificación con respecto al total de libros 9. Proporción de buenos / malos 10.Porcentaje de libros no leidos con respecto al total de libros Se ha propuesto realizar Analisis Descriptivo y Predictivo con la información proporcionada, y se ha logrado recomendar varias situaciones en la que será necesario tomar decisiones o implementar estrategias basados en los resultados obtenidos en los indicadores propuestos.
  • 9. 9 Anexo 1: El problema La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books; top_books; raitings; to_read. Una vez analizada la información de la carpeta “datasets_books” deberás presentar en un documento Word la respuesta a las siguientes preguntas:  ¿Qué indicadores serían los más importantes a determinar de acuerdo a la información presentada?  ¿Qué tipo de análisis sería el más adecuado y por qué?  ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la información analizada? El archivo “books” contiene los siguientes datos:  Id - Identificador del registro  Book Id - Identificador del libro  Number Editions - Número de ediciones  ISBN - Clave estándar internacional del libro  ISBN13 - Clave estándar extendida internacional del libro  Authors - Autor del libro  Original Publication - Fecha de publicación  Original Title - Título original del libro  Title - Título del libro  Language Code - Clave de idioma del libro  Average Rating - Promedio de la clasificación del libro  Image - Enlace a la imagen de la portada del libro  Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
  • 10. 10 El archivo “top_books” contiene los siguientes datos:  Position - Posición del libro en la clasificación del libro  ISBN - Clave estándar extendida internacional del libro  Title - Título del libro  Author - Autor del libro  Imprint - Editorial  Publisher Group - Grupo Editorial  Volume - Volumen de ventas hasta el 2010  Value - Ventas determinadas por el volumen  RRP - Precio recomendado para minoristas  ASP - Precio promedio para venta  Binding - Tipo de encuadernación  Publ Date - Fecha de publicación  Product Class - Clasificación del libro  Classification - Clasificación General del libro El archivo “ratings” contiene los siguientes datos:  Book Id - Identificador del libro  User Id - Identificador del cliente/usuario que clasifico un libro  Rating - Nivel de clasificación del libro. El archivo “to_read” contiene los siguientes datos:  User Id - Identificador del cliente/usuario que clasifico un libro  Book Id - Identificador del libro
  • 11. 11 El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente. El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación general. El archivo “raitings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer.