Hoy en día más que antes, la tecnología y la información juegan un papel crucial en todos los aspectos
del negocio, la Librería Iztaccihuatl se embarca en una travesía transformadora hacia la digitalización y el
análisis de datos. Este proyecto representa un esfuerzo estratégico para integrar la ciencia de datos en las
operaciones diarias de la librería, con el objetivo de mejorar la toma de decisiones, optimizar el rendimiento
y enriquecer la experiencia del cliente.
1. Instituto Tecnológico y de Estudios Superiores de Monterrey
Aplicando la Ciencia de Datos en una organización
Librería Iztaccihuatl
Por
Juan José Triviño Zambrano
Para el curso
Visualización de Datos y Storytelling
3. 1. Introducción
Hoy en día más que antes, la tecnología y la información juegan un papel crucial en todos los aspectos
del negocio, la Librería Iztaccihuatl se embarca en una travesía transformadora hacia la digitalización y el
análisis de datos. Este proyecto representa un esfuerzo estratégico para integrar la ciencia de datos en las
operaciones diarias de la librería, con el objetivo de mejorar la toma de decisiones, optimizar el rendimiento
y enriquecer la experiencia del cliente.
A lo largo de este proyecto, hemos explorado diversas herramientas y metodologías para recopilar,
procesar y analizar los datos generados por la librería. Central a nuestro enfoque es el uso de Python, un
lenguaje de programación ampliamente reconocido por su eficacia y flexibilidad en el análisis de datos. La
elección de Python se basa en su rica biblioteca de ciencia de datos, su comunidad de apoyo global y su
capacidad para integrarse a la perfección con una variedad de plataformas y bases de datos.
Para el proyecto de aplicación de Ciencia de Datos en la Librería Iztaccihuatl, ubicada en Monterrey,
Nuevo León, México, nos proponemos explorar y analizar distintos conjuntos de datos relativos a los libros,
autores, calificaciones y preferencias de lectura. El objetivo principal es emplear técnicas de visualización
de datos, estadística descriptiva y modelado predictivo para extraer insights que permitan mejorar los
indicadores de desempeño (KPI’s) y optimizar la toma de decisiones dentro de la organización.
Utilizaremos herramientas avanzadas de Python, como Pandas para la manipulación de datos, Mat-
plotlib y Seaborn para la visualización y modelos de Machine Learning para predicciones. Al analizar los
datos sobre libros, ventas, ratings y preferencias de lectura, esperamos identificar patrones y tendencias
que ayuden a la librería a entender mejor a sus clientes, optimizar su inventario, aumentar ventas y mejorar
la experiencia general del cliente.
Este proyecto no solo buscará impactar positivamente en la operación y estrategia comercial de la
Librería Iztaccihuatl, sino también servir como un caso de estudio sobre la aplicación práctica y el impacto
de la ciencia de datos en el sector de venta al detalle de libros. Mediante un enfoque metódico y analítico,
aspiramos a que los resultados obtenidos iluminen el camino hacia una gestión más eficiente y una oferta
más atractiva para la comunidad lectora de Monterrey y sus alrededores.
2. Objetivo
Identificar, a través de una exhaustiva visualización y análisis de datos, patrones, comparaciones,
correlaciones y posibles predicciones que faciliten la toma de decisiones estratégicas para mejorar los
indicadores de desempeño (KPI’s) de la organización.
3. Análisis de datos
Basado en los datos proporcionados de la Librería Iztaccihuatl, aquí hay algunas visualizaciones gráficas
potenciales que se pueden crear:
2
4. 3.1. Distribución de calificaciones de libros
Un histograma de las calificaciones promedio de todos los libros para entender la distribución de las
calificaciones.
Figura 1: Distribución de calificaciones
3.2. Tendencias de año de publicación
Un gráfico de línea para visualizar el número de libros publicados cada año.
Figura 2: Publicaciones a lo largo del tiempo
Esta visualización proporciona una visión clara de las tendencias de publicación a lo largo de más de
dos siglos, permitiendo apreciar los períodos de mayor actividad editorial y cómo ha evolucionado esto a
lo largo del tiempo.
3.3. Distribución de precios de los libros Top
Un diagrama de caja mostrando la distribución del RRP (Precio Recomendado de Venta al Público)
o ASP (Precio Promedio de Venta) entre los libros top.
El diagrama de caja muestra la distribución del Precio Recomendado de Venta al Público (RRP) y el
3
5. Figura 3: Distribuciones de precios
Precio Promedio de Venta (ASP) entre los libros top. Se puede observar la mediana, los cuartiles y los
valores atípicos para cada tipo de precio, lo que proporciona una comprensión visual de la dispersión y la
tendencia central de los precios de los libros más populares.
4. Comparaciones
4.1. Comparación de Volumen de Ventas entre Géneros
Comparar el volumen de ventas o valor de ventas de diferentes géneros o clasificaciones de libros para
entender cuáles son los más populares o lucrativos.
Figura 4: Comparación de ventas por género
La gráfica de barras compara el volumen total de ventas entre diferentes géneros o clasificaciones
de libros. Esta visualización permite identificar cuáles géneros o clasificaciones son los más populares o
lucrativos según los datos disponibles de la Librería Iztaccihuatl. Los géneros están en el eje x, mientras
4
6. que el volumen total de ventas está en el eje y. Las barras representan el volumen total de ventas para
cada género o clasificación.
5. Correlaciones
5.1. Mapa de calor de correlaciones
Un mapa de calor que muestra la correlación entre características numéricas como número de ediciones,
calificación promedio y volumen de ventas.
Figura 5: Mapa de calor de correlaciones
Esto incluye el número de ediciones, la calificación promedio y el año de publicación original. Los
valores en el mapa de calor indican el grado de relación lineal entre las variables. Con esta información
más amplia, se puede obtener un entendimiento más profundo de las relaciones entre diferentes aspectos
de los libros en la Librería Iztaccihuatl
6. Predicción
Es posible realizar predicciones sobre los datos de la Librería Iztaccihuatl utilizando técnicas de mo-
delado predictivo y aprendizaje automático. Algunas ideas de predicciones que podrían ser útiles son:
Predicción de Calificaciones Futuras de Libros Utilizando las calificaciones históricas de libros,
podrías construir un modelo de regresión o un sistema de recomendación para predecir cómo los
usuarios podrían calificar los libros en el futuro.
Predicción de Ventas de Libros Analizando el historial de ventas, junto con características de
los libros como género, autor y número de ediciones, se podrían usar modelos de series temporales o
regresión para predecir las ventas futuras
5
7. Predicción de Tendencias de Géneros Populares Basándose en la popularidad pasada de
diferentes géneros o categorías, se pueden aplicar modelos predictivos para identificar qué géneros
podrían volverse más populares en el futuro.
Predicción de Demanda de Libros Usando datos históricos sobre la demanda de libros y tal vez
integrando información externa como tendencias del mercado o eventos culturales, se pueden crear
modelos para prever la demanda futura de ciertos títulos o categorías.
Para realizar estas predicciones, se pueden emplear diferentes técnicas y algoritmos dependiendo del
tipo específico de predicción y la naturaleza de los datos. .
7. Historia
Las visualizaciones de los datos de la Librería Iztaccihuatl pueden contar una historia multifacética
sobre el comportamiento del cliente, la popularidad de los libros, la evolución del mercado editorial y cómo
estos elementos interactúan entre sí para dar forma a la estrategia comercial de la librería, por ejemplo:
Comparación de Volumen de Ventas entre Géneros
Indica qué géneros son más populares o rentables, proporcionando insights valiosos para decisiones de
inventario y marketing. Puede reflejar las preferencias culturales o tendencias actuales del mercado.
8. Conclusiones
De los análisis realizados y las visualizaciones generadas a partir de los datos de la Librería Iztaccihuatl,
se pueden extraer varias conclusiones útiles para la organización:
Si las calificaciones están generalmente altas, esto indica una buena selección de libros. Sin embargo,
si hay una gran variabilidad, podría ser útil profundizar para entender qué factores contribuyen a
los bajos ratings y cómo mejorar la selección de libros.
Los autores con altas calificaciones promedio podrían ser promovidos más intensamente o utilizados
en eventos especiales para atraer a más clientes. Podría ser beneficioso mantener un stock saludable
de sus obras o considerar ediciones especiales para atraer a su base de fans.
Una tendencia creciente en publicaciones puede indicar una industria en crecimiento y puede ser una
oportunidad para expandir el inventario. Un análisis de los años con picos o caídas podría revelar
factores externos que afectan la publicación y venta de libros, permitiendo a la librería planificar
mejor para el futuro.
Las predicciones sobre ventas futuras pueden informar sobre la planificación del inventario y la
estrategia financiera. Si el modelo predice un aumento en la demanda de ciertos tipos de libros
o durante ciertas temporadas, la librería puede prepararse aumentando el stock adecuadamente o
diseñando campañas de marketing específicas.
6