SlideShare una empresa de Scribd logo
UTILIZANDO CIENCIA DE
DATOS EN UNA
ORGANIZACIÓN
PROYECTO INDIVIDUAL EVALUADO POR PARES
EDX- TECNOLÓGICO DE MONTERREY: INTRODUCCIÓN A LA CIENCIA DE
DATOS Y EL BIG DATA
JOSÉ IGNACIO MAMANI MURGA
05 DE DICIEMBRE DEL 2020 LA PAZ - BOLIVIA
2
Contenido
1. INTRODUCCIÓN...................................................................................................................... 3
2. DESARROLLO......................................................................................................................... 4
2.1. Indicadores de Desempeño......................................................................................... 5
2.2. Análisis y Justificación................................................................................................. 7
2.3. Decisiones........................................................................................................................ 7
3. CONCLUSIONES..................................................................................................................... 9
3
1. INTRODUCCIÓN
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones.
Según el objetivo establecido, para el análisis a realizar, contamos con información
interna y externa con datos de los libros en varios archivos y se menciona el
promedio de clasificación de cada libro de acuerdo con las votaciones y compras
del cliente. También contamos con las votaciones que hacen los clientes dentro del
sitio web de la librería y las recomendaciones de lectura que hacen estos clientes.
Basados en estos datos obtendremos los KPI’s que nos permitan planificar
estrategias para mejorar el negocio y recomendar acciones a seguir.
4
2. DESARROLLO
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones. En la carpeta denominada “datasets_books” se encuentran los
siguientes archivos: books; top_books; raitings; to_read.
Una vez analizada la información de la carpeta “datasets_books” deberás presentar
en un documento Word la respuesta a las siguientes preguntas:
• ¿Qué indicadores serían los más importantes a determinar de acuerdo a la
información presentada?
• ¿Qué tipo de análisis sería el más adecuado y por qué?
• ¿Qué decisiones se podrían tomar basadas en los descubrimientos o
inferencias de la información analizada?
El archivo “books” contiene los siguientes datos:
• Id - Identificador del registro
• Book Id - Identificador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
El archivo “top_books” contiene los siguientes datos:
• Position - Posición del libro en la clasificación del libro
• ISBN - Clave estándar extendida internacional del libro
• Title - Título del libro
• Author - Autor del libro
• Imprint – Editorial
• Publisher Group - Grupo Editorial
• Volume - Volumen de ventas hasta el 2010
• Value - Ventas determinadas por el volumen
5
• RRP - Precio recomendado para minoristas
• ASP - Precio promedio para venta
• Binding - Tipo de encuadernación
• Publ Date - Fecha de publicación
• Product Class - Clasificación del libro
• Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
• Book Id - Identificador del libro
• User Id - Identificador del cliente/usuario que clasifico un libro
• Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
• User Id - Identificador del cliente/usuario que clasifico un libro
• Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería
y además menciona el promedio de clasificación de cada libro de acuerdo con las
votaciones y compras del cliente. El archivo “top_books” contiene el top 20 de los
libros más vendidos de acuerdo con una clasificación general. El archivo “raitings”
contiene los datos de los libros más votados por los clientes dentro del sitio web de
la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
2.1. Indicadores de Desempeño
Antes de determinar los Kpi´s necesitamos revisar el contenido de los archivos
disponibles, de tal forma tenemos:
• El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de
acuerdo con las votaciones y compras del cliente. No contiene datos de
ventas. Se asume que si no tiene valor en el campo AverageRating el libro ni
siquiera ha sido leído.
• El archivo “top_books” contiene el top 20 de los libros más vendidos de
acuerdo con una clasificación general. Se ha encontrado que este es el único
archivo en el que existen datos de volumen y valor de ventas, pero
únicamente para los veinte libros registrados en el archivo. Pero no tiene el
campo book_id para hacer enlace con los demás archivos.
6
• El archivo “raitings” contiene los datos de los libros más votados por los
clientes dentro del sitio web de la librería.
• El archivo “to_read” contiene las recomendaciones que cada cliente o
usuario realiza en el sitio web sobre libros para leer.
Analizando los datos obtenidos de la información presentada obtenemos los
siguientes indicadores de desempeño:
a) Porcentaje de libros recomendados con respecto al total de libros
Contar (disctinct(to_read.book_id))/ Contar (books) * 100
b) Porcentaje de libros con buena calificación con respecto al total de libros
Contar(Books.Average_Rating=”excelente”, “Muy Bueno”,”Bueno”) / Contar
(books) * 100
c) Porcentaje de libros con mala calificación con respecto al total de libros
Se refiere a libros que no han sido evaluados porque ni siquiera han sido
leídos.
Contar(Books.Average_Rating=”Regular”, “Malo”, “Muy Malo”,”” / Contar
(books) * 100
d) Proporción de Buenos / Malos
La idea es obtener el % de libros con clasificación buena vs % de libros con
mala clasificación
Porcentaje de libros con buena calificación con respecto al total de libros /
Porcentaje de libros con mala calificación con respecto al total de libros
e) Porcentaje de libros no leídos con respecto al total de libros
Se refiere a libros que no han sido evaluados porque ni siquiera han sido
leídos.
Contar(Books.Average_Rating=”” / Contar (books) * 100
7
2.2. Análisis y Justificación
Al tener datos históricos de los libros y de las votaciones y recomendaciones que
dan los clientes sobre ellos, nos permite realizar un Análisis Descriptivo para
identificar los comportamientos y evaluar la situación de la librería y poder tomar
decisiones con un alto grado de éxito. Los KPI´s encontrados nos ayudaran a
obtener una visión de lo que ha pasado y está pasando.
También según los resultados del primer análisis podríamos realizar un Análisis
Predictivo, determinando por ejemplo con el primer KPI, cuales libros tienen más
probabilidad de ser vendidos debido a las recomendaciones recibidas, o con el KPI
Proporción de Buenos / Malos, podemos determinar la tendencia a futuro de tener
una mayor o menor demanda por la experiencia anterior.
2.3. Decisiones
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias
de la información analizada? Para cada indicador de desempeño vamos a
determinar al menos una decisión que debería tomar la librería.
a) Porcentaje de libros recomendados con respecto al total de libros
Esta métrica nos permite identificar cuantos libros han agradado a los clientes
al punto de querer recomendarlos y se lo compara con el total de libros
existentes en la librería.
• Si este porcentaje va en aumento nos indica que está mejorando la
percepción o satisfacción de los clientes con respecto a nuestros
libros, también puede indicar que están leyendo más libros.
• Si este porcentaje disminuye significa que, aunque estén entrando
nuevos libros a la librería, no se está obteniendo nuevas
recomendaciones, por lo que se necesita renovar el tipo de libros o
realizar alguna estrategia de marketing que impulse a las personas a
comprar más libros.
b) Porcentaje de libros con buena calificación con respecto al total de libros
Esta métrica nos permite identificar cuantos libros han tenido buena
calificación y buen nivel de ventas, al estar basado en el Average_Rating que
se base en ambos valores.
8
• Si este porcentaje va en aumento nos indica que está mejorando la
percepción o satisfacción de los clientes con respecto a nuestros
libros.
• Si este porcentaje disminuye significa que se necesita alguna
estrategia que motive el nivel de ventas, como una estrategia de
marketing, por ejemplo.
c) Porcentaje de libros con mala calificación con respecto al total de libros
Esta métrica nos permite identificar cuantos libros no han sido leidos
(vendidos) por lo que no tienen aún valor en los campos Average_rating o
han tenido mala calificación.
• Si este porcentaje va en aumento nos indica que, aunque estén
entrando nuevos libros a la librería estos no se venden o están
obteniendo mala calificación de los clientes. En este caso se
recomendaría se implemente alguna promoción para los nuevos libros
que ingresan.
• Si este porcentaje disminuye significa estan mejorando las ventas de
los libros y obteniendo mejores calificaciones.
d) Proporción de Buenos / Malos
La idea es obtener el % de libros con clasificación buena vs % de libros con
mala clasificación.
Esta métrica tendrá un valor de 0 a 5. Cuando la proporción se acerca a 5
significa que están ganando las buenas calificaciones. Si es uno, indica que
se ha llegado a un valor idéntico de libros con buenas y malas calificaciones.
Y si esta entre 0 y 1 nos indica que existen más calificaciones malas que
buenas. En este último caso se debería hacer énfasis en promociones que
permitan aumentar la venta de libros.
e) Porcentaje de libros no leídos con respecto al total de libros
Esta métrica nos permite identificar cuantos libros tienen poca llegada a los
clientes, por lo que no han sido leídos aún.
• Si este porcentaje va en aumento nos indica que los nuevos libros
que van ingresando no están teniendo buena acogida, deberíamos
implementar una estrategia de marketing que permita hacer conocer
los nuevos libros y podría ser sesiones de lectura en la misma
librería con invitación gratuita que logre enganchar a clientes
potenciales.
• Si este porcentaje disminuye significa que están surtiendo efecto
nuestras estrategias y los clientes están leyendo los libros que
permanecían sin leer.
9
3. CONCLUSIONES
Se ha logrado inferir los siguientes indicadores de desempeño:
• Porcentaje de libros recomendados con respecto al total de libros.
• Porcentaje de libros con buena calificación con respecto al total de libros.
• Porcentaje de libros con mala calificación con respecto al total de libros.
• Proporción de buenos / malos.
• Porcentaje de libros no leídos con respecto al total de libros.
Se ha propuesto realizar Análisis Descriptivo y Predictivo con la información
proporcionada, y se ha logrado recomendar varias situaciones en la que será
necesario tomar decisiones o implementar estrategias basados en los resultados
obtenidos en los indicadores propuestos.

Más contenido relacionado

La actualidad más candente

Curso
CursoCurso
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
angelfeijoo
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
MariaTeresaSnchezSan
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
cnino6
 
Practica para Data Analítica Descriptiva
Practica para Data Analítica DescriptivaPractica para Data Analítica Descriptiva
Practica para Data Analítica Descriptiva
Luis Alberto Cabrera Samudio
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.
LeonardoGutierrezDal
 
Proy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriProy eval de pares Jhardena Yauri
Proy eval de pares Jhardena Yauri
JhardenaYauri
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares
RENE RGUEZ GLEZ
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
Asael Bravo
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datos
AngelGalindoQuintero
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
Fernandoss2
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
OlgaMaraGarzaSilva
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
OlgaMaraGarzaSilva
 
Trabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por paresTrabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por pares
Franco Gotuzzo Flórez
 
Practica 1
Practica 1Practica 1
Practica 1
GabrielLarsen2
 

La actualidad más candente (15)

Curso
CursoCurso
Curso
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Practica para Data Analítica Descriptiva
Practica para Data Analítica DescriptivaPractica para Data Analítica Descriptiva
Practica para Data Analítica Descriptiva
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.
 
Proy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriProy eval de pares Jhardena Yauri
Proy eval de pares Jhardena Yauri
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datos
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 
Trabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por paresTrabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por pares
 
Practica 1
Practica 1Practica 1
Practica 1
 

Similar a Proyecto individual evaluado por pares - José Ignacio Mamani Murga

Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
Diego Farfan
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
Alejandro Hinojosa Medina
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
Juan Alfonso Cruz Vázquez
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organización
sram0s
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
danielavalenciacebal
 
Trabajo introducción a la ciencia de datos
Trabajo introducción a la ciencia de datosTrabajo introducción a la ciencia de datos
Trabajo introducción a la ciencia de datos
HugoRodriguezCastill1
 
Ev pares
Ev paresEv pares
Big data ejercicio
Big data ejercicioBig data ejercicio
Big data ejercicio
Juan Enrique Garcia
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Paola Quiroz Alvarez
 
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaProyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
CamiloGonzlezBarrero
 
Edx
EdxEdx
Trabajo big data
Trabajo big data Trabajo big data
Trabajo big data
JosengelFernndezGmez
 
Project.docx
Project.docxProject.docx
Project.docx
JosLzaroViverosHernn
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
Sofía Ardila
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
HugoCastro854432
 
Ejercicio 1 Data Science
Ejercicio 1   Data ScienceEjercicio 1   Data Science
Ejercicio 1 Data Science
DiaNa López
 
rh.docx
rh.docxrh.docx
rh.docx
Renner11
 

Similar a Proyecto individual evaluado por pares - José Ignacio Mamani Murga (17)

Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organización
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
Trabajo introducción a la ciencia de datos
Trabajo introducción a la ciencia de datosTrabajo introducción a la ciencia de datos
Trabajo introducción a la ciencia de datos
 
Ev pares
Ev paresEv pares
Ev pares
 
Big data ejercicio
Big data ejercicioBig data ejercicio
Big data ejercicio
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
 
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaProyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
 
Edx
EdxEdx
Edx
 
Trabajo big data
Trabajo big data Trabajo big data
Trabajo big data
 
Project.docx
Project.docxProject.docx
Project.docx
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Ejercicio 1 Data Science
Ejercicio 1   Data ScienceEjercicio 1   Data Science
Ejercicio 1 Data Science
 
rh.docx
rh.docxrh.docx
rh.docx
 

Último

ESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdf
ESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdfESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdf
ESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdf
AlexTicona11
 
Flujo vehicular en análisis de trafico vial
Flujo vehicular en análisis de trafico vialFlujo vehicular en análisis de trafico vial
Flujo vehicular en análisis de trafico vial
SamuelMendozaS
 
EDT (Estructura de Desglose de Trabajo).pdf
EDT (Estructura de Desglose de Trabajo).pdfEDT (Estructura de Desglose de Trabajo).pdf
EDT (Estructura de Desglose de Trabajo).pdf
franco14021
 
ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........
ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........
ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........
IVANBRIANCHOQUEHUANC
 
Uso de WireShark.pdf - capturando paquetes en línea
Uso de WireShark.pdf - capturando paquetes en líneaUso de WireShark.pdf - capturando paquetes en línea
Uso de WireShark.pdf - capturando paquetes en línea
CarlosBryden1
 
Clase de termodinamica sobre cabios de fase
Clase de termodinamica sobre cabios de faseClase de termodinamica sobre cabios de fase
Clase de termodinamica sobre cabios de fase
EmilyLloydCerda
 
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptxPRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
brandonsinael
 
libro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdflibro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdf
MiriamAquino27
 
Graficas de Control, problemas resueltos, minitab
Graficas de Control, problemas resueltos, minitabGraficas de Control, problemas resueltos, minitab
Graficas de Control, problemas resueltos, minitab
XIOMARAANTONELLACAST
 
Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...
Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...
Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...
siclaro982
 
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
LuisLobatoingaruca
 
Relieve, Cuencas y curvas de nivel representación gráfica
Relieve, Cuencas y curvas de nivel representación gráficaRelieve, Cuencas y curvas de nivel representación gráfica
Relieve, Cuencas y curvas de nivel representación gráfica
paulsurvey
 
Organizacion-y-direccion-de-los-centros-de-informatica.pptx
Organizacion-y-direccion-de-los-centros-de-informatica.pptxOrganizacion-y-direccion-de-los-centros-de-informatica.pptx
Organizacion-y-direccion-de-los-centros-de-informatica.pptx
GuillerminaReyesJuar
 
Clasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de BartonClasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de Barton
edujunes132
 
Focos SSO Fin de Semana del 31 MAYO A al 02 de JUNIO de 2024.pdf
Focos SSO Fin de Semana del 31 MAYO A  al 02 de JUNIO  de 2024.pdfFocos SSO Fin de Semana del 31 MAYO A  al 02 de JUNIO  de 2024.pdf
Focos SSO Fin de Semana del 31 MAYO A al 02 de JUNIO de 2024.pdf
PatoLokooGuevara
 
Transistores, relés y optoacopladores, explicación y ejercicios
Transistores, relés y  optoacopladores, explicación y ejerciciosTransistores, relés y  optoacopladores, explicación y ejercicios
Transistores, relés y optoacopladores, explicación y ejercicios
KelinnRiveraa
 
sistemas fijos de extincion de incendio hidrantes
sistemas fijos de extincion de incendio  hidrantessistemas fijos de extincion de incendio  hidrantes
sistemas fijos de extincion de incendio hidrantes
luisalbertotorrespri1
 
Dialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdf
Dialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdfDialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdf
Dialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdf
fernanroq11702
 
Cuadro sinoptico de clasificacion de las industrias.pdf
Cuadro sinoptico de clasificacion de las industrias.pdfCuadro sinoptico de clasificacion de las industrias.pdf
Cuadro sinoptico de clasificacion de las industrias.pdf
LizetGuadalupeHernan
 
PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...
PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...
PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...
CarlitosWay20
 

Último (20)

ESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdf
ESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdfESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdf
ESTRUCTURACIÓN Y PREDIMENSIONAMIENTO, GRUPO 4.pdf
 
Flujo vehicular en análisis de trafico vial
Flujo vehicular en análisis de trafico vialFlujo vehicular en análisis de trafico vial
Flujo vehicular en análisis de trafico vial
 
EDT (Estructura de Desglose de Trabajo).pdf
EDT (Estructura de Desglose de Trabajo).pdfEDT (Estructura de Desglose de Trabajo).pdf
EDT (Estructura de Desglose de Trabajo).pdf
 
ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........
ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........
ABR-FUNDAMENTOS DEL CALCULO uc 2024 ........
 
Uso de WireShark.pdf - capturando paquetes en línea
Uso de WireShark.pdf - capturando paquetes en líneaUso de WireShark.pdf - capturando paquetes en línea
Uso de WireShark.pdf - capturando paquetes en línea
 
Clase de termodinamica sobre cabios de fase
Clase de termodinamica sobre cabios de faseClase de termodinamica sobre cabios de fase
Clase de termodinamica sobre cabios de fase
 
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptxPRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
 
libro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdflibro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdf
 
Graficas de Control, problemas resueltos, minitab
Graficas de Control, problemas resueltos, minitabGraficas de Control, problemas resueltos, minitab
Graficas de Control, problemas resueltos, minitab
 
Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...
Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...
Obras patrimoniales en Venezuela, su sistema constructivo y mantenimiento de ...
 
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
 
Relieve, Cuencas y curvas de nivel representación gráfica
Relieve, Cuencas y curvas de nivel representación gráficaRelieve, Cuencas y curvas de nivel representación gráfica
Relieve, Cuencas y curvas de nivel representación gráfica
 
Organizacion-y-direccion-de-los-centros-de-informatica.pptx
Organizacion-y-direccion-de-los-centros-de-informatica.pptxOrganizacion-y-direccion-de-los-centros-de-informatica.pptx
Organizacion-y-direccion-de-los-centros-de-informatica.pptx
 
Clasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de BartonClasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de Barton
 
Focos SSO Fin de Semana del 31 MAYO A al 02 de JUNIO de 2024.pdf
Focos SSO Fin de Semana del 31 MAYO A  al 02 de JUNIO  de 2024.pdfFocos SSO Fin de Semana del 31 MAYO A  al 02 de JUNIO  de 2024.pdf
Focos SSO Fin de Semana del 31 MAYO A al 02 de JUNIO de 2024.pdf
 
Transistores, relés y optoacopladores, explicación y ejercicios
Transistores, relés y  optoacopladores, explicación y ejerciciosTransistores, relés y  optoacopladores, explicación y ejercicios
Transistores, relés y optoacopladores, explicación y ejercicios
 
sistemas fijos de extincion de incendio hidrantes
sistemas fijos de extincion de incendio  hidrantessistemas fijos de extincion de incendio  hidrantes
sistemas fijos de extincion de incendio hidrantes
 
Dialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdf
Dialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdfDialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdf
Dialnet-EnsenanzaDeLaModelacionMedianteEcuacionesDiferenci-9304821.pdf
 
Cuadro sinoptico de clasificacion de las industrias.pdf
Cuadro sinoptico de clasificacion de las industrias.pdfCuadro sinoptico de clasificacion de las industrias.pdf
Cuadro sinoptico de clasificacion de las industrias.pdf
 
PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...
PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...
PROCEDIMIENTO Y PLAN DE RESCATE PARA TRABAJOS EN ALTURAS (Recuperado automáti...
 

Proyecto individual evaluado por pares - José Ignacio Mamani Murga

  • 1. UTILIZANDO CIENCIA DE DATOS EN UNA ORGANIZACIÓN PROYECTO INDIVIDUAL EVALUADO POR PARES EDX- TECNOLÓGICO DE MONTERREY: INTRODUCCIÓN A LA CIENCIA DE DATOS Y EL BIG DATA JOSÉ IGNACIO MAMANI MURGA 05 DE DICIEMBRE DEL 2020 LA PAZ - BOLIVIA
  • 2. 2 Contenido 1. INTRODUCCIÓN...................................................................................................................... 3 2. DESARROLLO......................................................................................................................... 4 2.1. Indicadores de Desempeño......................................................................................... 5 2.2. Análisis y Justificación................................................................................................. 7 2.3. Decisiones........................................................................................................................ 7 3. CONCLUSIONES..................................................................................................................... 9
  • 3. 3 1. INTRODUCCIÓN La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. Según el objetivo establecido, para el análisis a realizar, contamos con información interna y externa con datos de los libros en varios archivos y se menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y compras del cliente. También contamos con las votaciones que hacen los clientes dentro del sitio web de la librería y las recomendaciones de lectura que hacen estos clientes. Basados en estos datos obtendremos los KPI’s que nos permitan planificar estrategias para mejorar el negocio y recomendar acciones a seguir.
  • 4. 4 2. DESARROLLO La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books; top_books; raitings; to_read. Una vez analizada la información de la carpeta “datasets_books” deberás presentar en un documento Word la respuesta a las siguientes preguntas: • ¿Qué indicadores serían los más importantes a determinar de acuerdo a la información presentada? • ¿Qué tipo de análisis sería el más adecuado y por qué? • ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la información analizada? El archivo “books” contiene los siguientes datos: • Id - Identificador del registro • Book Id - Identificador del libro • Number Editions - Número de ediciones • ISBN - Clave estándar internacional del libro • ISBN13 - Clave estándar extendida internacional del libro • Authors - Autor del libro • Original Publication - Fecha de publicación • Original Title - Título original del libro • Title - Título del libro • Language Code - Clave de idioma del libro • Average Rating - Promedio de la clasificación del libro • Image - Enlace a la imagen de la portada del libro • Small Image - Enlace a la imagen en versión optimizada de la portada del libro. El archivo “top_books” contiene los siguientes datos: • Position - Posición del libro en la clasificación del libro • ISBN - Clave estándar extendida internacional del libro • Title - Título del libro • Author - Autor del libro • Imprint – Editorial • Publisher Group - Grupo Editorial • Volume - Volumen de ventas hasta el 2010 • Value - Ventas determinadas por el volumen
  • 5. 5 • RRP - Precio recomendado para minoristas • ASP - Precio promedio para venta • Binding - Tipo de encuadernación • Publ Date - Fecha de publicación • Product Class - Clasificación del libro • Classification - Clasificación General del libro El archivo “ratings” contiene los siguientes datos: • Book Id - Identificador del libro • User Id - Identificador del cliente/usuario que clasifico un libro • Rating - Nivel de clasificación del libro. El archivo “to_read” contiene los siguientes datos: • User Id - Identificador del cliente/usuario que clasifico un libro • Book Id - Identificador del libro El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y compras del cliente. El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo con una clasificación general. El archivo “raitings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. 2.1. Indicadores de Desempeño Antes de determinar los Kpi´s necesitamos revisar el contenido de los archivos disponibles, de tal forma tenemos: • El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y compras del cliente. No contiene datos de ventas. Se asume que si no tiene valor en el campo AverageRating el libro ni siquiera ha sido leído. • El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo con una clasificación general. Se ha encontrado que este es el único archivo en el que existen datos de volumen y valor de ventas, pero únicamente para los veinte libros registrados en el archivo. Pero no tiene el campo book_id para hacer enlace con los demás archivos.
  • 6. 6 • El archivo “raitings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. • El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. Analizando los datos obtenidos de la información presentada obtenemos los siguientes indicadores de desempeño: a) Porcentaje de libros recomendados con respecto al total de libros Contar (disctinct(to_read.book_id))/ Contar (books) * 100 b) Porcentaje de libros con buena calificación con respecto al total de libros Contar(Books.Average_Rating=”excelente”, “Muy Bueno”,”Bueno”) / Contar (books) * 100 c) Porcentaje de libros con mala calificación con respecto al total de libros Se refiere a libros que no han sido evaluados porque ni siquiera han sido leídos. Contar(Books.Average_Rating=”Regular”, “Malo”, “Muy Malo”,”” / Contar (books) * 100 d) Proporción de Buenos / Malos La idea es obtener el % de libros con clasificación buena vs % de libros con mala clasificación Porcentaje de libros con buena calificación con respecto al total de libros / Porcentaje de libros con mala calificación con respecto al total de libros e) Porcentaje de libros no leídos con respecto al total de libros Se refiere a libros que no han sido evaluados porque ni siquiera han sido leídos. Contar(Books.Average_Rating=”” / Contar (books) * 100
  • 7. 7 2.2. Análisis y Justificación Al tener datos históricos de los libros y de las votaciones y recomendaciones que dan los clientes sobre ellos, nos permite realizar un Análisis Descriptivo para identificar los comportamientos y evaluar la situación de la librería y poder tomar decisiones con un alto grado de éxito. Los KPI´s encontrados nos ayudaran a obtener una visión de lo que ha pasado y está pasando. También según los resultados del primer análisis podríamos realizar un Análisis Predictivo, determinando por ejemplo con el primer KPI, cuales libros tienen más probabilidad de ser vendidos debido a las recomendaciones recibidas, o con el KPI Proporción de Buenos / Malos, podemos determinar la tendencia a futuro de tener una mayor o menor demanda por la experiencia anterior. 2.3. Decisiones ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la información analizada? Para cada indicador de desempeño vamos a determinar al menos una decisión que debería tomar la librería. a) Porcentaje de libros recomendados con respecto al total de libros Esta métrica nos permite identificar cuantos libros han agradado a los clientes al punto de querer recomendarlos y se lo compara con el total de libros existentes en la librería. • Si este porcentaje va en aumento nos indica que está mejorando la percepción o satisfacción de los clientes con respecto a nuestros libros, también puede indicar que están leyendo más libros. • Si este porcentaje disminuye significa que, aunque estén entrando nuevos libros a la librería, no se está obteniendo nuevas recomendaciones, por lo que se necesita renovar el tipo de libros o realizar alguna estrategia de marketing que impulse a las personas a comprar más libros. b) Porcentaje de libros con buena calificación con respecto al total de libros Esta métrica nos permite identificar cuantos libros han tenido buena calificación y buen nivel de ventas, al estar basado en el Average_Rating que se base en ambos valores.
  • 8. 8 • Si este porcentaje va en aumento nos indica que está mejorando la percepción o satisfacción de los clientes con respecto a nuestros libros. • Si este porcentaje disminuye significa que se necesita alguna estrategia que motive el nivel de ventas, como una estrategia de marketing, por ejemplo. c) Porcentaje de libros con mala calificación con respecto al total de libros Esta métrica nos permite identificar cuantos libros no han sido leidos (vendidos) por lo que no tienen aún valor en los campos Average_rating o han tenido mala calificación. • Si este porcentaje va en aumento nos indica que, aunque estén entrando nuevos libros a la librería estos no se venden o están obteniendo mala calificación de los clientes. En este caso se recomendaría se implemente alguna promoción para los nuevos libros que ingresan. • Si este porcentaje disminuye significa estan mejorando las ventas de los libros y obteniendo mejores calificaciones. d) Proporción de Buenos / Malos La idea es obtener el % de libros con clasificación buena vs % de libros con mala clasificación. Esta métrica tendrá un valor de 0 a 5. Cuando la proporción se acerca a 5 significa que están ganando las buenas calificaciones. Si es uno, indica que se ha llegado a un valor idéntico de libros con buenas y malas calificaciones. Y si esta entre 0 y 1 nos indica que existen más calificaciones malas que buenas. En este último caso se debería hacer énfasis en promociones que permitan aumentar la venta de libros. e) Porcentaje de libros no leídos con respecto al total de libros Esta métrica nos permite identificar cuantos libros tienen poca llegada a los clientes, por lo que no han sido leídos aún. • Si este porcentaje va en aumento nos indica que los nuevos libros que van ingresando no están teniendo buena acogida, deberíamos implementar una estrategia de marketing que permita hacer conocer los nuevos libros y podría ser sesiones de lectura en la misma librería con invitación gratuita que logre enganchar a clientes potenciales. • Si este porcentaje disminuye significa que están surtiendo efecto nuestras estrategias y los clientes están leyendo los libros que permanecían sin leer.
  • 9. 9 3. CONCLUSIONES Se ha logrado inferir los siguientes indicadores de desempeño: • Porcentaje de libros recomendados con respecto al total de libros. • Porcentaje de libros con buena calificación con respecto al total de libros. • Porcentaje de libros con mala calificación con respecto al total de libros. • Proporción de buenos / malos. • Porcentaje de libros no leídos con respecto al total de libros. Se ha propuesto realizar Análisis Descriptivo y Predictivo con la información proporcionada, y se ha logrado recomendar varias situaciones en la que será necesario tomar decisiones o implementar estrategias basados en los resultados obtenidos en los indicadores propuestos.