1. PRACTICA ENTRE PARES
Título: Utilizando la Ciencia de Datos en una organización
Nombre: Ariel Marcos Condo Merlo
La Paz – Bolivia
2021
2. ii
Índice de Contenido
ÍNDICE DE CONTENIDO......................................................................................................... II
1 OBJETIVO................................................................................................................ 3
2 INTRODUCCIÓN .................................................................................................... 3
3 DESARROLLO......................................................................................................... 3
3.1 ARCHIVO BOOKS.................................................................................................... 3
3.2 ARCHIVO TOP BOOKS............................................................................................ 4
3.3 ARCHIVO RATINGS ................................................................................................ 4
3.4 ARCHIVO TO_READ ............................................................................................... 5
3.5 DESCRIPCION DE LOS ARCHIVOS....................................................................... 5
4 ¿QUÉ INDICADORES SERÍAN LOS MÁS IMPORTANTES A
DETERMINAR DE ACUERDO A LA INFORMACIÓN PRESENTADA? ......................... 5
5 ¿QUÉ TIPO DE ANÁLISIS SERÍA EL MÁS ADECUADO Y POR QUÉ? ...... 6
6 ¿QUÉ DECISIONES SE PODRÍAN TOMAR BASADAS EN LOS
DESCUBRIMIENTOS O INFERENCIAS DE LA INFORMACIÓN ANALIZADA?......... 6
CONCLUSIONES......................................................................................................................... 7
3. 3
1 OBJETIVO
Analizar fuentes de información externas e internas de una organización a través de
herramientas computacionales para generar un modelo basado en Ciencia de Datos como apoyo a
la toma de decisiones.
2 INTRODUCCIÓN
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido
desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño
(KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books;
top_books; raitings; to_read.
3 DESARROLLO
3.1 ARCHIVO BOOKS
El archivo “books” contiene los siguientes datos:
• Id - Identificador del registro
• Book Id - Identificador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
4. 4
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
3.2 ARCHIVO TOP BOOKS
El archivo “top_books” contiene los siguientes datos:
• Position - Posición del libro en la clasificación del libro
• ISBN - Clave estándar extendida internacional del libro
• Title - Título del libro
• Author - Autor del libro
• Imprint - Editorial
• Publisher Group - Grupo Editorial
• Volume - Volumen de ventas hasta el 2010
• Value - Ventas determinadas por el volumen
• RRP - Precio recomendado para minoristas
• ASP - Precio promedio para venta
• Binding - Tipo de encuadernación
• Publ Date - Fecha de publicación
• Product Class - Clasificación del libro
• Classification - Clasificación General del libro
3.3 ARCHIVO RATINGS
El archivo “ratings” contiene los siguientes datos:
• Book Id - Identificador del libro
• User Id - Identificador del cliente/usuario que clasifico un libro
5. 5
• Rating - Nivel de clasificación del libro.
3.4 ARCHIVO TO_READ
El archivo “to_read” contiene los siguientes datos:
• User Id - Identificador del cliente/usuario que clasifico un libro
• Book Id - Identificador del libro
3.5 DESCRIPCION DE LOS ARCHIVOS
El archivo “books” contiene los datos generales de cada libro existente en la librería y además
menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del
cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una
clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio
web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio
web sobre libros para leer.
4 ¿Qué indicadores serían los más importantes a determinar de acuerdo a la información
presentada?
Revisando los archivos y junto con la descripción de los mismos los KPIs más adecuados que
se tiene que utilizar son los siguientes:
Los libros más vendidos de acuerdo a la clasificación general.
Los libros más votados.
Las recomendaciones que cada cliente o usuario realiza.
6. 6
Se ha seleccionado estos KPIs ya que estos nos permiten realizar las acciones y decisiones de
compras y ventas de los libros y así realizar una estrategia de marketing adecuada ya que esto nos
ayuda a realizar un enfoque del tipo de libros son más requeridos por los clientes, la estrategia de
marketing puede ir enfocada tanto en la información de la adquisición de los últimos libros así
como la forma de llegar a la gente que está interesada en los mismos.
5 ¿Qué tipo de análisis sería el más adecuado y por qué?
El análisis más adecuado sería la Analítica Predictiva. Ya que indica y hace posible la creación
de modelos que permiten vaticinar lo que va a ocurrir con antelación. En realidad, mira al futuro
y nos ayuda a entender cómo puede evolucionar nuestro entorno y hasta la propia compañía en
este caso la venta de libros. Por ejemplo: en base a los datos podemos determinar cuántas ventas
de libros se realizarán en el próximo mes. Su propósito es hacer pronósticos.
6 ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la
información analizada?
En base a los KPIs y la analítica predictiva se tomarían las siguientes decisiones:
El abastecimiento de los libros es el adecuado.
El consumo de los clientes es el habitual o ha existido algún cambio.
La preferencia de los libros a tenido algún cambio.
Se debería de publicar esta información a todos nuestros clientes a través de aplicaciones y páginas
web los cuales nos acercarían más a nuestros clientes y lograr una fidelización de los mismos.
7. 7
CONCLUSIONES
Los datos que se tiene de la libros como ser: datos generales de cada libro existente en la librería
, además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y
compras del cliente, el top 20 de los libros más vendidos de acuerdo a una clasificación general,
los datos de los libros más votados por los clientes dentro del sitio web de la librería y por ultimo
las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer, se
puede realizar el análisis predictivo el cual nos permitirá adelantar las decisiones que se van a ir
tomando dentro de la empresa, ya que estas estarán respaldas por datos y estadísticas de gustos y
preferencias de los clientes así poder tener una mejor acogida de los mismos y cumplir con el
objetivo de la venta de libros.