1. TRABAJO DE APLICACIÓN DE CIENCIA DE DATOS EN UNA ORGANIZACIÓN
Proyecto individual evaluado por pares
Jonathan Hurtado Moscoso
edX- TecdeMonterreyX
Introducción a la Ciencia de Datos y Big Data
Samborondón-Ecuador
2. Título: Utilizando la Ciencia de Datos en una organización
La ciencia de datos como disciplina científica está influenciada por la informática, las
matemáticas, la investigación de operaciones y las estadísticas, así como las ciencias
aplicadas.
Debido a la gran cantidad de datos de hoy en día, las empresas aplican cada vez más esta
disciplina dentro de las decisiones de su empresa. El volumen de datos que se puede
explorar, puede resultar una tarea tediosa para hacerlo de manera manual o a veces puede
resultar impensable. Estas tareas, debido a los motivos mencionados anteriormente, han
pasado a ser responsabilidad de las computadoras, pero estas necesitan un científico de
datos que programe e interprete los datos.
Dentro de las tareas para aprobar el curso de ciencia de datos, otorgado por el Tecnológico
de Monterrey, se ha establecido analizar la librería Iztaccíhuatl, en Monterrey. Esta
librería ha decidido implementar estrategias basadas en el análisis de datos. Este análisis
de datos tiene como objetivo mejorar sus indicadores de desempeño (KPI’s), este análisis
va a estar basado en datos previamente dados establecidos en la carpeta “datasets_books”.
Esta carpeta contiene los siguientes indicadores:
“books”: contiene los datos generales de los libros presentes en la librería, a su vez
la clasificación en base a las votaciones.
“top_books”: contiene los 20 libros más vendidos.
“ratings”: contiene los libros más votados en el sitio web de la librería.
“to_read”: contiene las recomendaciones que dan los usuarios en línea.
El objetivo dentro del presente proyecto es:
Analizar fuentes de información externas e internas de una organización a través de
herramientas computacionales para generar un modelo basado en Ciencia de Datos
como apoyo a la toma de decisiones
Los tres indicadores que resultan más relevantes para determinar una proyección serían:
3. Dentro del archivo “ratings” el libro más ranqueado. Esto permitirá saber de manera más
local cual es el libro que más votan los clientes de manera digital. Se puede hacer un
lanzamiento dentro de la página para poner estos libros de manera digital como un e-book
o determinar una estrategia comercial para que los clientes se acerquen a la librería para
adquirir. A su vez permite determinar (en cierta parte) la demanda de un libro, se podrá
hacer proyecciones en base a su nivel de rating.
Dentro del archivo “top_books” la clasificación del libro. Con este indicador se puede
enfocar de mejor manera las estanterías dentro de las librerías. Se pueden hacer estanterías
más grandes con mejor acceso, con salas de lecturas, con artefactos que inviten a los
clientes a leer sus libros favoritos. Debido al alto coste de estas adecuaciones se debe de
considerar solamente a los productos que generen altos ingresos.
Considerar el archivo “books” el promedio de clasificación de los libros. Considerar
dentro de este indicador de abajo hacia arriba, es decir, los libros menos vendidos o que
tienen mucho tiempo en stock y su rotación de inventario es nula.
¿Qué tipo de análisis sería el más adecuado y por qué?
Análisis descriptivo. Dentro de los archivos presentados vemos que se presentan
únicamente datos históricos de la librería. Este tipo de análisis permite establecer
tendencias en base a los datos previos que tenemos. En este caso todos los datos de Excel
como de los libros más vendidos, géneros más buscados y los libros con más reseñas
permiten establecer futuras tendencias del comportamiento de la demanda.
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la
información analizada?
Fortalecer la parte digital de la librería. Debido al uso del internet de hoy en día,
se puede ejercer una campaña para pasar los libros más vendidos y con más
reseñas a la parte digital, de formato de e-books. Se puede ofrecer descuentos a
los usuarios que más reseñas hagan, es decir, que más aporten con el
movimiento de la librería.
Las estanterías clasificarlas y adecuarlas en base al género de libros más
vendidos, tal como se mencionó anteriormente.
4. Tener un mejor stock de libros, los libros más vendidos tener una proyección de
demanda más alta. Los libros con menor cantidad o una nula cantidad de venta
considerar estrategias para eliminarlos de la librería y que den espacio a libros
nuevos, que puedan ser vendidos con mejor facilidad.
Conclusiones
El desarrollo de este proyecto permite a la librería analizar de manera profunda sus datos.
Con la ayuda del análisis de datos se puede mejorar los indicadores de desempeño de esta
empresa. La empresa para mejorar sus KPI’s puede tomar en cuenta muchos de los datos
presentados, todo va estar en base a los objetivos que desee lograr. Si dentro de sus
objetivos está mejorar su presencia en internet, va a tomar en cuenta los indicadores de
“ratings” o “to_read”. Si dentro de sus objetivos está ampliar la cantidad de stock de
libros, debe de tomar en cuenta el archivo “top_books”. Si la empresa va a tomar la
decisión de mejorar de manera integral su librería, va a considerar varios archivos a la vez,
todo es en base a sus objetivos.
Se recomienda la implementación del Modelo de Crisp-DM para el análisis de datos de
este proyecto. Debido a la cantidad de datos se recomienda implementar este modelo para
minar los datos menos relevantes y establecer los que tengan más relevancia dentro del
proyecto. Dentro de este modelo se va a poder establecer el modelo del negocio para esta
librería y evaluar qué tan conveniente es.