La librería proporcionó datos sobre libros, ventas, reseñas y recomendaciones de clientes para analizar el desempeño y desarrollar estrategias. El análisis descriptivo de los datos actuales podría identificar libros populares y tendencias. Un análisis predictivo también podría generar recomendaciones de libros similares y predecir idiomas populares para tomar mejores decisiones de inventario a futuro. Sin embargo, se necesitan más datos como precios y encuestas para realizar análisis más completos.
Panorama Sociodemográfico de México 2020: GUANAJUATO
Utilizando la ciencia de datos en una organización
1. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 1
Utilizando la Ciencia de Datos en una organización
María Teresa Sánchez Sanz
Introducción a la Ciencia de Datos y el Big Data
Tecnológico de Monterrey
EdX
2. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 2
Resumen
Utilizando los datos proporcionados por la Librería Iztaccihuatl ubicada en la ciudad de
Monterrey, Nuevo León, México, analizamos las fuentes de información externas e internas
de una organización a través de herramientas computacionales para generar un modelo
basado en Ciencia de Datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez
desarrollar una mejor estrategia en la toma de decisiones.
Palabras clave: Big data, Análisis, KPI’s
3. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 3
Contenido
Resumen.........................................................................................................................2
Utilizando la Ciencia de Datos en una organización .....................................................4
Datos proporcionados ....................................................................................................4
Indicadores.................................................................................................................4
Books .....................................................................................................................4
Top books...............................................................................................................5
Ratings ...................................................................................................................5
To read ...................................................................................................................5
KPI’s ..............................................................................................................................6
Relación de libros más valorados ..............................................................................6
Relación entre recomendaciones................................................................................6
Relación de libros según géneros y lenguaje de estos ...............................................6
De los más populares .............................................................................................6
Análisis y Estrategia ......................................................................................................7
Análisis Descriptivo...................................................................................................7
Ejemplos ................................................................................................................7
Decisiones a futuro: Análisis predictivo ....................................................................7
Ejemplos ................................................................................................................7
Conclusiones..................................................................................................................8
4. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 4
Utilizando la Ciencia de Datos en una organización
La empresa en cuestión según su perfil en LinkedIn, se dedica a la venta al por menor,
en concreto a la distribución y comercialización de material bibliográfico a nivel nacional.
Esta ubicada en Monterey, y Nuevo León, y cuenta con una página web
https://www.edimsa.com.mx/. Parece ser que tiene diversas sucursales.
Datos proporcionados
Presentaremos los archivos ofrecidos por la librería, junto con una descripción de los
datos contenidos en ellos. Los archivos ofrecidos se encuentran contenidos en la carpeta
denominada “datasets_books” se encuentran los siguientes archivos: books; top_books;
raitings; to_read.
Indicadores
Books
El archivo “books” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y
compras del cliente.
Datos contenidos en Books
1. Id - Identificador del registro
2. Book Id - Identificador del libro
3. Number Editions - Número de ediciones
4. ISBN - Clave estándar internacional del libro
5. ISBN13 - Clave estándar extendida internacional del libro
6. Authors - Autor del libro
7. Original Publication - Fecha de publicación
8. Original Title - Título original del libro
9. Title - Título del libro
10. Language Code - Clave de idioma del libro
11. Average Rating - Promedio de la clasificación del libro
12. Image - Enlace a la imagen de la portada del libro
13. Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
5. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 5
Top books
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo con
una clasificación general.
Datos contenidos en Top Books
1. Position - Posición del libro en la clasificación del libro
2. ISBN - Clave estándar extendida internacional del libro
3. Title - Título del libro
4. Author - Autor del libro
5. Imprint - Editorial
6. Publisher Group - Grupo Editorial
7. Volume - Volumen de ventas hasta el 2010
8. Value - Ventas determinadas por el volumen
9. RRP - Precio recomendado para minoristas
10. ASP - Precio promedio para venta
11. Binding - Tipo de encuadernación
12. Publ Date - Fecha de publicación
13. Product Class - Clasificación del libro
14. Classification - Clasificación General del libro
Ratings
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
Datos contenidos en Ratings
1. User Id - Identificador del cliente/usuario que clasifico un libro
2. Book Id - Identificador del libro.
To read
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza
en el sitio web sobre libros para leer.
Datos contenidos en To Read
1. User Id - Identificador del cliente/usuario que clasifico un libro
2. Book Id - Identificador del libro.
6. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 6
KPI’s
KPI’s son las siglas en inglés de Key Performance Indicators, es decir indicadores
clave de desempeño. Los KPI’s utilizan diferentes métodos para reunir información del
funcionamiento de la empresa. Con esta información se facilita la toma de decisiones.
Relación de libros más valorados
Este KPI nos indicará cuan popular un libro es, no solo por las valoraciones, si no
también por el número de ellas. Así pues, dos mismas valoraciones medias no serían igual de
valiosas si no tienen el mismo numero de personas que las han valorado, las que valoren más
personas nos darán información más valiosa.
Relación entre recomendaciones
Entre las recomendaciones de los usuarios podemos sacar una relación entre libros, y
así poder hacer recomendaciones similares a personas que busquen ciertos libros basado en
las recomendaciones anteriores que han hecho anteriores usuarios. O ubicar los libros en las
mismas estanterías o cercanas para que los usuarios similares los encuentren más fácilmente.
Relación de libros según géneros y lenguaje de estos
Este KPI nos indicará que lenguajes son populares en cada género. Primero
analizaremos los lenguajes por genero de los más populares, y luego se debería de cotejar con
la información de los disponibles en tienda (Aunque carecemos de la información de los
géneros en los datos proporcionados).
De los más populares
Para ello utilizaremos El “ISBN” que se ha generado en el archivo “Top_books” de
cada top 20 de libros y con este iremos al archivo “books” y seleccionaremos estos para
obtener el “Language Code”. Con estos datos estudiamos la moda de los idiomas más
populares por género.
7. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 7
Análisis y Estrategia
Análisis Descriptivo
Con los datos proporcionados podemos hacer un análisis descriptivo de la librería,
esta aportará una mejor comprensión del presente y del pasado de esta organizando los datos,
por ejemplo, viendo que libros han sido los mejores valorados. Nos permite visualizar una
dinámica de nuestro negocio, pudiendo ayudarnos a la toma de decisiones.
Este será el más adecuado ya que la información que tenemos no es muy extensa y
aunque se puede hacer un análisis predictivo no sería tan fiable teniendo en cuenta la falta de
datos.
Ejemplos
Un ejemplo, sería utilizar la relación de los libros más valorados, ver el volumen de
ventas del top de libros vendidos, etc.
Decisiones a futuro: Análisis predictivo
Si hablamos de que decisiones se podrían tomar estamos haciendo un análisis
predictivo.
Ejemplos
Así pues, intentaríamos hacer recomendaciones en bases a otras recomendaciones
similares, lo que haría que a priori las personas encontraran más fácilmente otros libros que
podrían gustarle incrementando potencialmente las ventas, tanto físicamente si se colocan
juntos o en la página web poner una sección de libros recomendados, o a futuro podríamos
detectar cuales libros deberíamos escoger en que idiomas en base a los libros anteriormente
comprados, o los más populares de su género.
Estas recomendaciones a posteriori deberían crear nuevos datos y ver si estas
recomendaciones realmente funcionan, o si escoger de antemano el idioma de los libros
8. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 8
ayuda a que estos no queden en el almacén. Y de nuevo volver a crear unos nuevos datos,
más exhaustivos.
Conclusiones
Los datos proporcionados en este informe son valiosos, pero se necesitaría una mejora
de los datos, por ejemplo, con los precios de venta de los libros, no solo de los más vendidos,
para hacer una comparativa, por ejemplo. También hacer encuestas de satisfacción, etc.
Quien tiene la información tiene el poder, para analizar el presente y el pasado, y
poder tomar las riendas de nuestro futuro.