EDX: Curso III Visualización de Datos y Storytelling – Tecnológico de Monterrey PROYECTO INDIVIDUAL EVALUADO POR PARES
Creado por: Paola Quiroz Alvarez Guayaquil - Ecuador
Aplicando la Ciencia de Datos en una organización Caso: Librería Iztaccihuatl
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
1. 1
Creado por: Paola Quiroz Alvarez
Guayaquil - Ecuador
30 OCTUBRE
Edx y Tecnológico de Monterrey
Curso: Visualización de Datos y Storytelling
Proyecto Individual Evaluado por Pares
Aplicando la
Ciencia de Datos
en una
organización
2020
2. 2
Contenido
Aplicando la Ciencia de Datos en una organización......................................................3
Introducción ............................................................................................................3
Análisis ....................................................................................................................3
¿Qué gráficas se pueden realizar sobre el análisis de datos de la Librería
Iztaccíhuatl?.........................................................................................................5
¿Qué comparaciones se podrían realizar sobre los datos de la Librería
Iztaccihuatl?.........................................................................................................8
¿Qué correlaciones se pueden tener de los datos de la Librería Iztaccihuatl para
poder realizar un análisis descriptivo? .................................................................9
¿Es posible realizar alguna predicción sobre los datos de la Librería Iztaccihuatl?
..........................................................................................................................10
¿Qué historia se podría contar de las visualizaciones a los datos de la Librería
Iztaccíhuatl?.......................................................................................................10
Conclusiones..........................................................................................................10
3. 3
Aplicando la Ciencia de Datos en una
organización
Introducción
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores
de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos:
books; top_books; raitings; to_read. Te recomendamos utilizar la herramienta Python
para analizar los datos que se te proporcionan.
El objetivo principal de este proyecto es identificar la respuesta a las siguientes
interrogantes:
¿Qué gráficas se pueden realizar sobre el análisis de datos de la Librería
Iztaccíhuatl?
¿Qué comparaciones se podrían realizar sobre los datos de la Librería Iztaccihuatl?
¿Qué correlaciones se pueden tener de los datos de la Librería Iztaccihuatl para
poder realizar un análisis descriptivo?
¿Es posible realizar alguna predicción sobre los datos de la Librería Iztaccihuatl?
¿Qué historia se podría contar de las visualizaciones a los datos de la Librería
Iztaccíhuatl?
Análisis
Para el análisis tenemos 4 tablas que nos provee el caso de estudio que son:
El archivo “books” contiene los datos generales de cada libro existente en la librería
y además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.
4. 4
El archivo “books” contiene los siguientes datos:
Id - Identificador del registro
Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
El archivo “top_books” contiene los siguientes datos:
Position - Posición del libro en la clasificación del libro
ISBN - Clave estándar extendida internacional del libro
Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro
5. 5
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
El archivo “ratings” contiene los siguientes datos:
Book Id - Identificador del libro
User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
El archivo “to_read” contiene los siguientes datos:
User Id - Identificador del cliente/usuario que clasifico un libro
Book Id - Identificador del libro
¿Qué gráficas se pueden realizar sobre el análisis de datos de la Librería Iztaccíhuatl?
Según el análisis se pueden realizar diversos tipos de gráficas hemos elegido en forma
de pie, de dispersión y gráfico de barras. A continuación algunos de los gráficos
resultado del análisis:
1. Autores con más libros con promedio mayor a 4.5. Hemos tomado únicamente los
nombres de autores con libros cuyo promedio de calificación sea mayor o igual
que 4.5. Tomado de la tabla books. Ver figura 1.
2. Cantidad de libros vendidos por clasificación. En este gráfico de pie podemos
visualizar la cantidad de libros vendidos por clasificación. Tomado de la tabla
top_books. Ver figura 2.
3. Valor de venta de libros vendidos por clasificación. En este gráfico de barras
podemos visualizar el valor por ventas de libros por clasificación. Tomado de la
tabla top_books. Ver figura 3.
7. 7
Ilustración 3
4. Número de libros por autor en top_books. En este gráfico de barras podemos
visualizar el número de libros que ha publicado un autor y que han llegado al
top_books por su nivel de ventas. Se han filtrado los autores que tienes más de 3
libros. Tomado de la tabla top_books. Ver figura 4.
Ilustración 4
8. 8
5. Cantidad de libros Vendidos por autor. En este gráfico de barras podemos
visualizar la cantidad total de libros que se han vendido clasificadas por autor. Se
han filtrado los autores que tienes más de 3 libros. Tomado de la tabla
top_books. Ver figura 5.
Ilustración 5
¿Qué comparaciones se podrían realizar sobre los datos de la Librería Iztaccihuatl?
Podemos realizar ciertas comparaciones que nos mostrarán cómo una serie de variables
reaccionan frente a otra variable común. Por ejemplo:
Basados en los resultados de los gráficos podemos visualizar que se vende mayor
cantidad de libros de clasificacion Pb fiction.
Bill Watterson es el autor que tiene mayor cantidad de libros con promedio alto de
calificación.
Larsson Stieg es el autor con mayor cantidad de libros vendidos.
9. 9
¿Qué correlaciones se pueden tener de los datos de la Librería Iztaccihuatl para poder
realizar un análisis descriptivo?
Sabiendo que un estudio correlacional determina si dos variables están correlacionadas
o no. Esto significa analizar si un aumento o disminución en una variable coincide con un
aumento o disminución en la otra variable. Realizamos con Phyton un analisis del
comportamiento de las variables entre ellas.
10. 10
Cuando el volumen de ventas crece, la variable posicion se acerca al primer puesto.
Volume x Position
Tambien cuando el volumen de ventas crece, aumenta el valor de ventas. Volume
x Value
Existe una tendencia a subir el volumen de ventas si el precio del libro es menor,
aunque hay casos de excepcion que tienen un gran volumen de ventas aunque
tienen un precio alto. Volume x ASP
¿Es posible realizar alguna predicción sobre los datos de la Librería Iztaccihuatl?
Es dificil, porque falta mas información. Pero podríamos indicar que si invierte en libros
de los autores Bill Watterson, Larsson Stieg u otros que se perciben que hasta ahora han
tenido mayor aceptacion del publico, se podria aumentar los niveles de ventas. Y tal vez
estimar el nivel de ventas en relación a la clasificación, precio, grupo editorial,etc.
¿Qué historia se podría contar de las visualizaciones a los datos de la Librería
Iztaccíhuatl?
Podríamos contar varias historias relacionadas a los diferentes analisis realizados a partir
de los gráficos expuestos, también una vez q se apliquen las recomendaciones podríamos
contar el impacto en el nivel de ventas una vez aplicada la ciencia de datos. Por ejemplo,
se puede percibir que hay un marcada preferencia de los clientes por los libros de ficcion,
seguido por la clasificación de libros infantiles. También como influye el precio en el
momento de la compra, aunque si el escritor es famoso y tiene varios éxitos, ese factor
queda de lado.
Conclusiones
Aunque con los datos provistos podemos hacer ciertas predicciones, tendriamos mejores
oportunidades de predicción realizando las adecuaciones propuestas a las tablas que nos
ayudaran a tener informacion importante para realizar predicciones basadas en tiempo.
11. 11
También podemos recomendar como estrategia promocionar en la página web de la
Librería los nuevos libros que pertenezcan a los autores cuyos libros estan en la lista de
más vendidos o de más recomendados.