1. INTRODUCCIÓN A LA CIENCIA DE DATOS y BIGDATA
CASO
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGAMIZACIÓN
PRESENTADO POR
Hugo Rodríguez Castillo
Lima, Julio 2021
2. 2
Contenido
Introducción.......................................................................................................... 3
1. Descripción del caso......................................................................................... 4
2. Identificación de Indicadores............................................................................ 6
3. Tipo de Análisis Elaborado .............................................................................. 6
4. Propuesta........................................................................................................... 6
5. Conclusiones..................................................................................................... 7
3. 3
Introducción
El presente informe permite identificar los pasos necesarios para utilizar la
ciencia de datos como proceso de soporte de decisiones en una determinada área de
negocio, analizando fuentes de información externas e internas mediante herramientas
computacionales.
En este caso se cuenta con información histórica de la librería Iztaccihuatl
ubicada en la ciudad de Monterrey, la cual servirá como referencia para definir los
indicadores más importantes, el análisis que mejor se ajusta y los resultados que se
puedan proponer luego del análisis respectivo de los datos.
4. 4
1. Descripción del caso
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León,
México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma
de decisiones. La información disponible se encuentra en los siguientes archivos:
• El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de
acuerdo con las votaciones y compras del cliente. La estructura de este archivo
es la siguiente:
o Id - Identificador del registro
o Book Id - Identificador del libro
o Number Editions - Número de ediciones
o ISBN - Clave estándar internacional del libro
o ISBN13 - Clave estándar extendida internacional del libro
o Authors - Autor del libro
o Original Publication - Fecha de publicación
o Original Title - Título original del libro
o Title - Título del libro
o Language Code - Clave de idioma del libro
o Average Rating - Promedio de la clasificación del libro
o Image - Enlace a la imagen de la portada del libro
o Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
• El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo
con una clasificación general. La estructura de este archivo es la siguiente:
5. 5
o Position - Posición del libro en la clasificación del libro
o ISBN - Clave estándar extendida internacional del libro
o Title - Título del libro
o Author - Autor del libro
o Imprint - Editorial
o Publisher Group - Grupo Editorial
o Volume - Volumen de ventas hasta el 2010
o Value - Ventas determinadas por el volumen
o RRP - Precio recomendado para minoristas
o ASP - Precio promedio para venta
o Binding - Tipo de encuadernación
o Publ Date - Fecha de publicación
o Product Class - Clasificación del libro
o Classification - Clasificación General del libro
• El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería. La estructura de este archivo es la siguiente:
o Book Id - Identificador del libro
o User Id - Identificador del cliente/usuario que clasifico un libro
o Rating - Nivel de clasificación del libro.
• El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer. La estructura de este archivo es la
siguiente:
o User Id - Identificador del cliente/usuario que clasifico un libro
o Book Id - Identificador del libro
6. 6
2. Identificación de Indicadores
De acuerdo con la información recopilada, podemos identificar a los siguientes
indicadores como los más importantes:
• Cantidad y lista de títulos de libros más recomendados para leer por los clientes.
• Cantidad y lista de autores más recomendados para leer por los clientes.
• Los tops 10 libros más votados por los clientes dentro del sitio web de la
librería.
• Los tops 10 libros no recomendados por los clientes dentro del sitio web de la
librería.
• La cantidad de clientes únicos que visitaron el sitio web de la librería para
recomendar algún libro.
3. Tipo de Análisis Elaborado
La información obtenida muestra solo la información histórica del negocio, por
lo cual el análisis descriptivo es el que más se ajusta. Este nos permitirá responder a la
pregunta "¿Qué pasó en el pasado con el negocio?". Se requieren de mayores datos para
complementar y poder aplicar la analítica predictiva ("¿qué va a pasar probablemente en
el futuro?") y la analítica prescriptiva que intenta responder a la pregunta: "¿Y ahora
qué?" O "¿Qué se puede hacer para evitarlo?".
4. Propuesta
Fidelización de clientes: para incentivar el tráfico de la página web se propone
entregar un bono o descuento a los clientes que recomienden un título y este tenga
buena acogida en el período respectivo.
7. 7
5. Conclusiones
La ciencia de datos cada vez tiene mas relevancia en las organizaciones y nos
permite transformar los datos en información de valor con lo cual se pueden tomar
mejores decisiones en la dirección de una organización.