1. Trabajo de aplicación de datos en una organización
Objetivo:
Analizar fuentes de información externas e internas de una organización a través de
herramientas computacionales para generar un modelo basado en Ciencia de Datos como
apoyo a la toma de decisiones.
3. La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México
ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar
sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor
estrategia en la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes
archivos: books; top_books; raitings; to_read.
El archivo “books” contiene los siguientes datos:
Id - Identificador del registro
Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene los siguientes datos:
Position - Posición del libro en la clasificación del libro
ISBN - Clave estándar extendida internacional del libro
Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
4. RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
Book Id - Identificador del libro
User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
User Id - Identificador del cliente/usuario que clasifico un libro
Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de
acuerdo a las votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de
acuerdo a una clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
¿Qué indicadores serían los más importantes a determinar de acuerdo a
la información presentada?
Dentro del archivo “Ratings” el libro que más ranking posee, esto permitirá
saber cuál es el libro más popular entre los clientes de manera digital. Esto
permitiría explotar la popularidad del libro y ver cómo venderlo mejor.
Dentro del archivo “Top_books” La clasificación del libro. Con esto se puede
enfocar a un mejor conocimiento de los libros que mensualmente se leen, su
clasificación y porque son populares.
5. Porcentaje de libros con buena clasificación que con respecto al top ten de
libros más vendidos, determinar si un libro popular es muy vendido o como
afecta su popularidad en sus ventas.
¿Qué tipo de análisis sería el más adecuado y por qué?
Se verifica que los indicadores que se pueden determinar con la
información que ha sido presentada es el de análisis descriptivo, ya que nos
proporciona una mirada histórica de los datos de la organización. También se
puede visualizar la realización de un análisis predictivo dado por los patrones
de los datos con la intención de mejorar las operaciones.
Para concluir se pueden determinar acciones dentro de la organización
gracias a la implementación de un análisis prescriptivo, que van de la mano con
la dirección y que buscan seguir nutriéndose de los indicadores de desempeño.
¿Qué decisiones se podrían tomar basadas en los descubrimientos o
inferencias de la información analizada?
Se podría buscar una mejor cobertura del área digital de la empresa,
para impulsar las ventas a través de este medio. Gracias a la internet podemos
acceder a datos que nos permitan operar y tomar mejores decisiones para la
venta de nuestros productos.
Clasificar las estanterías en función de los diferentes grupos que la
compañía determine como fundamentales a la hora de vender, segmentar a las
personas que compran dentro de la librería, entender sus gustos y en base a
estas percepciones de estos nuevos datos aportados por la ciencia de datos,
mejorar el stock de la misma para proveer a los consumidores.
Conclusiones: Una vez realizado el estudio de los datos de la librería,
se concluye que la misma tiene mucho potencial por explotar, que si la misma
toma una determinación hacia el avance en la disciplina de los datos y empieza
a tomar decisiones que vayan de la mano con los resultados obtenidos, la
misma podría empezar a tener una mejora significativa en las ventas.
En sintonía con el informe que se ha presentado, y siguiendo con lo
expuesto en el mismo, se ha trabajado con los indicadores los cuales arrojan
conclusiones varias extraídas de los datos de la misma compañía. Es decir que
solo se ha prestado atención a los datos que la misma compañía expone, se
espera que en el futuro de la misma se apliquen los conocimientos de ciencias
de datos para mejorar la misma.