GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
Utilizando la Ciencia de Datos en una Organización.
1. UTILIZANDO LA CIENCIA DE DATOS EN
UNA ORGANIZACIÓN
GISELA RAMONEDA RUMÍ
12 DE ABRIL DE 2020
2.
3. Índice
Introducción.................................................................................................................................. 3
Indicadores.................................................................................................................................... 4
Puntuación media según ventas y valoraciones ....................................................................... 4
Volumen de ventas.................................................................................................................... 4
Media de las valoraciones......................................................................................................... 4
Número de recomendaciones................................................................................................... 4
Análisis........................................................................................................................................... 5
Discusión y toma de decisiones .................................................................................................... 9
Conclusiones ............................................................................................................................... 10
4. Introducción
La Ciencia de Datos es una disciplina que a través de la manipulación masiva de datos (BigData)
y el análisis de ciertas herramientas tecnológicas y modelos matemáticos podremos averiguar
lo que sucederá en un futuro, con el análisis del pasado y el presente.
En este proyecto utilizaremos la Ciencia de Datos para analizar los datos de información de la
Librería IzaccihuatI ubicada en la ciudad de monterrey, Nuevo León, México, para así generar un
modelo para tomar las decisiones más estratégicas. Por una parte, sabremos qué datos contiene
cada libro y qué votaciones y compras han tenido cada uno de ellos.
Además, sabremos que libros se han vendido más y qué libros se han votado más por los
usuarios en el sitio web, junto con las recomendaciones de cada cliente. Además, el proyecto
también se centrará en seleccionar y mejorar los indicadores de desempeño (KPI’s) de la librería
modelándolos con un tipo de análisis y escogiendo las ventajas o las interferencias de la
información que se ha analizado.
Finalmente, cuando el proyecto esté finalizado identificaremos si las posibles decisiones a tomar
en base a los datos analizados con el objetivo de mejorar la situación actual de negocio.
5. Indicadores
Los indicadores clave o de desempeño (KPI’s) son una medida de rendimiento que se obtiene de
un procedimiento o proceso. En este proyecto, una vez analizados lo datos de la Librería la
IzaccihuatI se ha llegado a una serie de conclusiones gracias a los cuatro indicadores que se han
estipulado. Los cuatro indicadores que se han definido para contrastar la información de cada
libro son:
Puntuación media según ventas y valoraciones
Este indicador, nos hace una media del número de ventas y el recuento de valoraciones que los
usuarios tienen de cada libro, por lo tanto, es un valor importante ya que engloba dos variables
independientes.
Volumen de ventas
Este indicador nos permite precisar el número de ventas que ha tenido cada libro exactamente.
Media de las valoraciones
Es un promedio dónde el máximo es 5 y el mínimo es 1, por lo tanto, es como una valoración
final del libro.
Número de recomendaciones
Este indicador nos permite saber cuántas recomendaciones ha adquirido un libro por los
diferentes usuarios, por lo tanto, este indicador nos da un valor cuantitativo también.
6. Análisis
Gracias a éstos cuatro indicadores se podrán obtener diferentes soluciones y modelar la
estrategia de toma de decisiones, ya que gracias a ellos sabremos por ejemplo qué libro se ha
vendido más, cuántas recomendaciones le han dado los usuarios, cuál es su puntuación media
de ventas y valoraciones y cuántas veces se ha vendido. Para realizar un análisis preciso de los
libros que han obtenido mejores puntuaciones, primero se ha empezado a utilizar el segundo
indicador que hace referencia a “Volumen de ventas”.
Con este procedimiento, se obtendrán los veinte libros más vendidos, es decir, los que han
tenido un número de ventas más elevado. Esta estrategia de ir analizando, cada indicador será
de gran utilidad para así obtener conclusiones detalladas de los diferentes libros.
Para saber cuáles han sido los libros más vendidos (Figura 1) por los clientes dentro del sitio web
de la Librería IzaccihuatI, se ha analizado el segundo indicador. Se ha definido una media de las
diferentes valoraciones que los usuarios/lectores nos han querido transmitir. Por lo tanto, se
obtiene un número de ventas para cada libro.
Números de ventas
Núm. Título (inglés) Autor Ventas
1 Girl with the Dragon Tattoo,The:Millennium Trilogy# Larsson, Stieg 1156530
2 Girl Who Kicked the Hornets' Nest,The:Millennium Trilogy# Larsson, Stieg 995845
3 Girl Who Played with Fire,The:Millennium Trilogy# Larsson, Stieg 957063
4 Jamie's 30-minute Meals Oliver, Jamie 874546
5 Lost Symbol,The Brown, Dan 672950
6 Eclipse# Meyer, Stephenie 511093
7 Twilight# Meyer, Stephenie 483266
8 Short Second Life of Bree Tanner,The:An Eclipse Novella Meyer, Stephenie 474796
9 New Moon# Meyer, Stephenie 471199
10 Guinness World Records 2011 421372
11 One Day Nicholls, David 419773
12 Help,The Stockett, Kathryn 414304
13 Lovely Bones,The# Sebold, Alice 339364
14 Picture Perfect Picoult, Jodi 336369
15 Breaking Dawn Meyer, Stephenie 318420
16 Eat, Pray, Love:One Woman's Search for Everything# Gilbert, Elizabeth 316083
17 Kitchen:Recipes from the Heart of the Home Lawson, Nigella 312846
18 Twenties Girl Kinsella, Sophie 308596
19 Wolf Hall Mantel, Hilary 302522
20 Girl with the Dragon Tattoo,The:Millennium Trilogy# Larsson, Stieg 1156530
Figura 1: Los veinte libros más vendidos de la Librería IzaccihuatI.
10. Discusión y toma de decisiones
Después de haber realizado el análisis coherente y detallado de las fuentes externas e internas
de la librería IzaccihuatI, gracias a herramientas computacionales, se ha podido tratar los datos
y la información y se ha creado un modelo basado en Ciencia de Datos.
Por empezar, gracias a la confrontación del segundo indicador de desempeño “Volumen de
ventas” con los diferentes libros que los usuarios han tratado, se ha obtenido un listado de los
veinte libros más vendidos. Los datos originales diferenciaban entre las diferentes clasificaciones
de género de los libros, las fechas de publicaciones, el tipo de encuadernación, el precio
recomendado para minoristas, pero para que la estrategia de implementación sea óptima se ha
interpretado el número de ventas.
Por el otro lado, se ha hecho el mismo procedimiento analizando el tercer indicador de
desempeño, la “Media de valoraciones”. Y los resultados de la segunda tabla, han sido por
estructura similares a los de la primera tabla; por cada libro se ha obtenido una media de
valoraciones, es decir, los datos de libros más votados por los clientes dentro del sitio web de la
librería. Cuando se han comparado los veinte libros más vendidos con los veinte más bien
valorados, se han obtenido resultados diferentes en las clasificaciones. Por, lo tanto, se podría
plantear que, por una parte, si hay que tomar alguna decisión pensando como una empresa, con
los tops ventas, cómo son indicadores de rentabilidad para las editoriales y son un medio de
publicidad potente para los potenciales compradores, habría que tener más ejemplares en las
editoriales e incluso subir el precio, ya que los compradores van a comprar el producto
igualmente.
Además, interpretando los datos de la segunda tabla, se ve claramente que los datos no
coinciden con los tops ventas, personalmente creo que deberían ser iguales estas dos
clasificaciones. Porque pienso que la valoración subjetiva y unipersonal hacia un libro es lo más
importante y lo que da más renombre a un autor al ser leído. Pero la decisión que se podría
tomar como empresa, es darles más publicidad para que acabasen siendo los veinte tops ventas
y darlos el nombre de best-sellers.
Para finalizar la interpretación de los datos, el ultimo step de análisis ha sido la confrontación
del promedio de clasificación de cada libro de acuerdo con las votaciones y compras del cliente
y el número de recomendaciones. Por ejemplo, el libro que tiene el average rating más elevado
(4,82) tiene 2322 recomendaciones por los lectores, y de los tops 50 que se ha analizado por
priorización de media, el que tiene más recomendaciones es el número 27. Así pues, como
empresa, exigiría que los lectores después de su recomendación me explicasen el porqué de su
valoración, para así entenderlos más y dar más importancia a las sensaciones de unos posibles
best-sellers que a unos libros de autoayuda que no dejan de ser marketing literario.
11. Conclusiones
El objetivo del presente trabajo era el de implantar una estrategia coherente y estructurada
después de analizar una serie de datos de la Librería Iztaccihuatl ubicada en la ciudad de
Monterrey, Nuevo León, México y generar un modelo basado en la Ciencia de Datos y concluir
con algunas decisiones.
El análisis que he realizado pienso que ha sido de carácter óptimo para entender toda la
información expuesta, y darnos cuenta de qué un libro que es el top ventas entre 10.000,
claramente no tiene que ser el que a la gente le haya gustado más o el que han recomendado
más. El porqué sucede este acontecimiento claramente es muy fácil de entender en esta
sociedad. Por ejemplo, una persona puede comprar un libro porqué le ha cautivado la publicidad
que le han hecho de él sin ser experto/a de literatura, y al final no lo ha acabado leyendo, por lo
tanto, ha generado una venta, pero no una valoración. Y por el otro lado, una biblioteca puede
comprar un libro y éste ser leído por miles de personas, por lo tanto, el libro más vendido no
tiene que ser el libro más leído.
Sólo decir que, por último, para que ganemos más best-sellers coherentes y excelentes, hay que
cambiar la dinámica y fomentar en un futuro más publicidad a los libros que se valoren mejor
para así no perder la calidad de la escritura.
Por último agradecer a todas las personas que han hecho posible esta presentación de ejercicio
con datos analíticos y brindarnos la oportunidad de ser mejores profesionales.