1. ACTIVIDAD INDIVIDUAL
2.2 METODOLOGÍAS PARA PROYECTOS DE CIENCIA DE DATOS
CAMILO ERNESTO NIÑO DIAZ
COD: 91.476.971
Informe presentado a:
ING. JESUS AGUILAR
TECNOLOGICO DE MONTEREY
2020
2. INTRODUCCIÓN
La ciencia de datos es la ciencia que permite a través de métodos analíticos, dar
soluciones a diferentes necesidades de los negocios a casos puntuales a partir de la
integración, gestión y análisis de datos.
El presente trabajo individual planteado en los momentos 2 y 3 se realiza con la finalidad
de analizar y presentar una solución para mejorar los KPI’S de La Librería Iztaccihuatl.
3. INFORMACION GENERAL
1. Nombre de la empresa
Librería Iztaccihuatl
2. Nombres y apellidos del gerente o representante Legal
Jesus Aguilar
3. Actividad económica de la empresa
Venta y alquiler de libros.
4. Narración del problema
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México
ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en
la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes
archivos: books; top_books; raitings; to_read.
El archivo “books” contiene los siguientes datos:
Id - Identificador del registro
Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene los siguientes datos:
Position - Posición del libro en la clasificación del libro
ISBN - Clave estándar extendida internacional del libro
Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
4. Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
Book Id - Identificador del libro
User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
User Id - Identificador del cliente/usuario que clasifico un libro
Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería
y además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
5. SOLUCION PROBLEMA DE IZTACCIHUATL
SE REQUIERE:
¿Qué indicadores serían los más importantes a determinar de acuerdo con la
información presentada?
¿Qué tipo de análisis sería el más adecuado y por qué?
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias
de la información analizada?
ANALISIS DE LOS KPI´S
Lo primero que debemos determinar es la cantidad de libros que tenemos en existencia
para lo que vamos a realizar un count (books.id) esto nos dará la base para poder iniciar
el análisis.
A partir de esta cantidad base podemos empezar a generar las diferentes estrategias en
el manejo de los inventarios por ejemplo supongamos el raiting esta dado en la cantidad
de estrellas del 1 al 5 entonces haríamos el siguiente algortitmo:
Count(((Select ratings.book_id Where raiting=5) Join Books.id))/ count (books.id)
%
Este indicador nos mostraría el porcentaje de libros que tenemos en el inventario y que
están rankeados como 5 estrellas
Decisión: si está por debajo del 50% debemos hacer una promoción para salir de los que
tenemos y enfocarnos en comprar los que la gente está recomendada.
Ahora supongamos que en la tabla top_books están clasificado del 1 al 20 donde el 1 es
el libro mas vendido haríamos el siguiente algoritmo:
Count(((Distinct top_books.Author) Join Books.Author))/ count (books.id) %
Este indicador nos mostraría el porcentaje de libros que tenemos en el inventario y que
cuyos autores están rankeados entre los 10 primeros puestos.
6. Decisión: Existe una buena oportunidad de depurar el inventario en función a los autores
más vendidos si este indicador esta por debajo del 70%
Count(((AVG to_read. Book Id)))/ count (books.id) %
Este indicador nos mostraría el porcentaje de libros que la gente recomienda leer.
Decisión: Existe una buena oportunidad de depurar el inventario en función a los autores
más vendidos si este indicador está por debajo del 70%
Ahora podemos llevar diferentes estrategias como buscar relaciones entre el rating de
los libros mas recomendados y buscar los libros del mismo autor, pero no que no estén
el rating para poder adelantarnos a una posible demanda.
De igual podemos tener algún tipo de combo donde obsequiemos un libro de baja rotación
y que la gente no este dentro de los más recomendados o los mas vendidos junto con
uno que si este dentro de este grupo.
CONCLUSIONES
Para este ejercicio se usó el modelo de analítica descriptiva pues se cuenta con una
información de cómo va el negocio hasta la fecha además con este estudio que tuve la
oportunidad de realizar en la librería pude comprobar la gran utilidad del uso de los KPI’s
en cualquier negocio ya que mediante estos indicadores podemos, plantear y establecer
estrategias en diferentes áreas de las empresa, para lograr que un negocio o empresa
tengan éxito total.