SlideShare una empresa de Scribd logo
1 de 6
Descargar para leer sin conexión
ACTIVIDAD INDIVIDUAL
2.2 METODOLOGÍAS PARA PROYECTOS DE CIENCIA DE DATOS
CAMILO ERNESTO NIÑO DIAZ
COD: 91.476.971
Informe presentado a:
ING. JESUS AGUILAR
TECNOLOGICO DE MONTEREY
2020
INTRODUCCIÓN
La ciencia de datos es la ciencia que permite a través de métodos analíticos, dar
soluciones a diferentes necesidades de los negocios a casos puntuales a partir de la
integración, gestión y análisis de datos.
El presente trabajo individual planteado en los momentos 2 y 3 se realiza con la finalidad
de analizar y presentar una solución para mejorar los KPI’S de La Librería Iztaccihuatl.
INFORMACION GENERAL
1. Nombre de la empresa
Librería Iztaccihuatl
2. Nombres y apellidos del gerente o representante Legal
Jesus Aguilar
3. Actividad económica de la empresa
Venta y alquiler de libros.
4. Narración del problema
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México
ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en
la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes
archivos: books; top_books; raitings; to_read.
El archivo “books” contiene los siguientes datos:
Id - Identificador del registro
Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene los siguientes datos:
Position - Posición del libro en la clasificación del libro
ISBN - Clave estándar extendida internacional del libro
Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
Book Id - Identificador del libro
User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
User Id - Identificador del cliente/usuario que clasifico un libro
Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería
y además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
SOLUCION PROBLEMA DE IZTACCIHUATL
SE REQUIERE:
¿Qué indicadores serían los más importantes a determinar de acuerdo con la
información presentada?
¿Qué tipo de análisis sería el más adecuado y por qué?
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias
de la información analizada?
ANALISIS DE LOS KPI´S
Lo primero que debemos determinar es la cantidad de libros que tenemos en existencia
para lo que vamos a realizar un count (books.id) esto nos dará la base para poder iniciar
el análisis.
A partir de esta cantidad base podemos empezar a generar las diferentes estrategias en
el manejo de los inventarios por ejemplo supongamos el raiting esta dado en la cantidad
de estrellas del 1 al 5 entonces haríamos el siguiente algortitmo:
Count(((Select ratings.book_id Where raiting=5) Join Books.id))/ count (books.id)
%
Este indicador nos mostraría el porcentaje de libros que tenemos en el inventario y que
están rankeados como 5 estrellas
Decisión: si está por debajo del 50% debemos hacer una promoción para salir de los que
tenemos y enfocarnos en comprar los que la gente está recomendada.
Ahora supongamos que en la tabla top_books están clasificado del 1 al 20 donde el 1 es
el libro mas vendido haríamos el siguiente algoritmo:
Count(((Distinct top_books.Author) Join Books.Author))/ count (books.id) %
Este indicador nos mostraría el porcentaje de libros que tenemos en el inventario y que
cuyos autores están rankeados entre los 10 primeros puestos.
Decisión: Existe una buena oportunidad de depurar el inventario en función a los autores
más vendidos si este indicador esta por debajo del 70%
Count(((AVG to_read. Book Id)))/ count (books.id) %
Este indicador nos mostraría el porcentaje de libros que la gente recomienda leer.
Decisión: Existe una buena oportunidad de depurar el inventario en función a los autores
más vendidos si este indicador está por debajo del 70%
Ahora podemos llevar diferentes estrategias como buscar relaciones entre el rating de
los libros mas recomendados y buscar los libros del mismo autor, pero no que no estén
el rating para poder adelantarnos a una posible demanda.
De igual podemos tener algún tipo de combo donde obsequiemos un libro de baja rotación
y que la gente no este dentro de los más recomendados o los mas vendidos junto con
uno que si este dentro de este grupo.
CONCLUSIONES
Para este ejercicio se usó el modelo de analítica descriptiva pues se cuenta con una
información de cómo va el negocio hasta la fecha además con este estudio que tuve la
oportunidad de realizar en la librería pude comprobar la gran utilidad del uso de los KPI’s
en cualquier negocio ya que mediante estos indicadores podemos, plantear y establecer
estrategias en diferentes áreas de las empresa, para lograr que un negocio o empresa
tengan éxito total.

Más contenido relacionado

La actualidad más candente

Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosOlgaMaraGarzaSilva
 
Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosEsneiderOrozcoVidal
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataAlmudena Casado
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatlangelfeijoo
 
Utilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andradeUtilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andradenorbertoandrade1
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre paresSofía Ardila
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónsram0s
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.HugoCastro854432
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónKozhaya Elias Sfeir
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionAlejandro Uribe Rodriguez
 
Caso ciencia de datos libreria iztaccihuatl mauricio figueroa
Caso ciencia de datos libreria iztaccihuatl mauricio figueroaCaso ciencia de datos libreria iztaccihuatl mauricio figueroa
Caso ciencia de datos libreria iztaccihuatl mauricio figueroaMauricio Figueroa Colarte
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosAngelGalindoQuintero
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Paola Quiroz Alvarez
 

La actualidad más candente (19)

Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
 
Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datos
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datos
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big data
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
 
Utilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andradeUtilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andrade
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organización
 
Práctica big data
Práctica big dataPráctica big data
Práctica big data
 
Big data ejercicio
Big data ejercicioBig data ejercicio
Big data ejercicio
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacion
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Caso ciencia de datos libreria iztaccihuatl mauricio figueroa
Caso ciencia de datos libreria iztaccihuatl mauricio figueroaCaso ciencia de datos libreria iztaccihuatl mauricio figueroa
Caso ciencia de datos libreria iztaccihuatl mauricio figueroa
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datos
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
 
T3 s2 p1
T3 s2 p1T3 s2 p1
T3 s2 p1
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 

Similar a Actividad individual big data

Similar a Actividad individual big data (18)

Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez Rocha
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
evaluacion por pares
evaluacion por paresevaluacion por pares
evaluacion por pares
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
Evaintro
EvaintroEvaintro
Evaintro
 
rh.docx
rh.docxrh.docx
rh.docx
 
Proyecto de evaluación de pares
Proyecto de evaluación de paresProyecto de evaluación de pares
Proyecto de evaluación de pares
 
Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1
 
Practica para Data Analítica Descriptiva
Practica para Data Analítica DescriptivaPractica para Data Analítica Descriptiva
Practica para Data Analítica Descriptiva
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
 
Trabajo big data
Trabajo big data Trabajo big data
Trabajo big data
 
Ev pares
Ev paresEv pares
Ev pares
 
Tarea 1 ciencia de datos
Tarea 1    ciencia de datosTarea 1    ciencia de datos
Tarea 1 ciencia de datos
 
Practica Big Data
Practica Big DataPractica Big Data
Practica Big Data
 

Último

La semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomasLa semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomascarmenachullahuamani1
 
Posición global del PIB per cápita Israelí (1948-2024).pdf
Posición global  del PIB per cápita  Israelí  (1948-2024).pdfPosición global  del PIB per cápita  Israelí  (1948-2024).pdf
Posición global del PIB per cápita Israelí (1948-2024).pdfJC Díaz Herrera
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkJuanmanuelYapitamani
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEmisor Digital
 
principios pedagógicos del modelo agazian
principios pedagógicos  del modelo agazianprincipios pedagógicos  del modelo agazian
principios pedagógicos del modelo agazianjoseph957764
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...Daniela Márquez Sena
 
CARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioCARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioAlexander VA
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajjmatiasccoyllomarca
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónEduCE2
 
Diapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especificoDiapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especificojuancarlos63884
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdfJC Díaz Herrera
 
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERALCUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERALCarlosDelgadoMiranda
 
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúAnálisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúDiegoFranciscoLarrea
 
Ideas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechileIdeas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechilealcachofa6
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaAlexander VA
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfanaliticaydatos
 
Guía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviGuía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviHugoSSalinas
 
Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfJC Díaz Herrera
 
Análisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfAnálisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfJulioCesarRubianoArc1
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahodalisnicoles
 

Último (20)

La semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomasLa semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomas
 
Posición global del PIB per cápita Israelí (1948-2024).pdf
Posición global  del PIB per cápita  Israelí  (1948-2024).pdfPosición global  del PIB per cápita  Israelí  (1948-2024).pdf
Posición global del PIB per cápita Israelí (1948-2024).pdf
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de Ipsos
 
principios pedagógicos del modelo agazian
principios pedagógicos  del modelo agazianprincipios pedagógicos  del modelo agazian
principios pedagógicos del modelo agazian
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
 
CARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioCARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia Patrimonio
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigación
 
Diapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especificoDiapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especifico
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdf
 
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERALCUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
 
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúAnálisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
 
Ideas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechileIdeas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechile
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historia
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
 
Guía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviGuía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico Jamovi
 
Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdf
 
Análisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfAnálisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdf
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoah
 

Actividad individual big data

  • 1. ACTIVIDAD INDIVIDUAL 2.2 METODOLOGÍAS PARA PROYECTOS DE CIENCIA DE DATOS CAMILO ERNESTO NIÑO DIAZ COD: 91.476.971 Informe presentado a: ING. JESUS AGUILAR TECNOLOGICO DE MONTEREY 2020
  • 2. INTRODUCCIÓN La ciencia de datos es la ciencia que permite a través de métodos analíticos, dar soluciones a diferentes necesidades de los negocios a casos puntuales a partir de la integración, gestión y análisis de datos. El presente trabajo individual planteado en los momentos 2 y 3 se realiza con la finalidad de analizar y presentar una solución para mejorar los KPI’S de La Librería Iztaccihuatl.
  • 3. INFORMACION GENERAL 1. Nombre de la empresa Librería Iztaccihuatl 2. Nombres y apellidos del gerente o representante Legal Jesus Aguilar 3. Actividad económica de la empresa Venta y alquiler de libros. 4. Narración del problema La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books; top_books; raitings; to_read. El archivo “books” contiene los siguientes datos: Id - Identificador del registro Book Id - Identificador del libro Number Editions - Número de ediciones ISBN - Clave estándar internacional del libro ISBN13 - Clave estándar extendida internacional del libro Authors - Autor del libro Original Publication - Fecha de publicación Original Title - Título original del libro Title - Título del libro Language Code - Clave de idioma del libro Average Rating - Promedio de la clasificación del libro Image - Enlace a la imagen de la portada del libro Small Image - Enlace a la imagen en versión optimizada de la portada del libro. El archivo “top_books” contiene los siguientes datos: Position - Posición del libro en la clasificación del libro ISBN - Clave estándar extendida internacional del libro Title - Título del libro Author - Autor del libro Imprint - Editorial Publisher Group - Grupo Editorial
  • 4. Volume - Volumen de ventas hasta el 2010 Value - Ventas determinadas por el volumen RRP - Precio recomendado para minoristas ASP - Precio promedio para venta Binding - Tipo de encuadernación Publ Date - Fecha de publicación Product Class - Clasificación del libro Classification - Clasificación General del libro El archivo “ratings” contiene los siguientes datos: Book Id - Identificador del libro User Id - Identificador del cliente/usuario que clasifico un libro Rating - Nivel de clasificación del libro. El archivo “to_read” contiene los siguientes datos: User Id - Identificador del cliente/usuario que clasifico un libro Book Id - Identificador del libro El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente. El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación general. El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer.
  • 5. SOLUCION PROBLEMA DE IZTACCIHUATL SE REQUIERE: ¿Qué indicadores serían los más importantes a determinar de acuerdo con la información presentada? ¿Qué tipo de análisis sería el más adecuado y por qué? ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la información analizada? ANALISIS DE LOS KPI´S Lo primero que debemos determinar es la cantidad de libros que tenemos en existencia para lo que vamos a realizar un count (books.id) esto nos dará la base para poder iniciar el análisis. A partir de esta cantidad base podemos empezar a generar las diferentes estrategias en el manejo de los inventarios por ejemplo supongamos el raiting esta dado en la cantidad de estrellas del 1 al 5 entonces haríamos el siguiente algortitmo: Count(((Select ratings.book_id Where raiting=5) Join Books.id))/ count (books.id) % Este indicador nos mostraría el porcentaje de libros que tenemos en el inventario y que están rankeados como 5 estrellas Decisión: si está por debajo del 50% debemos hacer una promoción para salir de los que tenemos y enfocarnos en comprar los que la gente está recomendada. Ahora supongamos que en la tabla top_books están clasificado del 1 al 20 donde el 1 es el libro mas vendido haríamos el siguiente algoritmo: Count(((Distinct top_books.Author) Join Books.Author))/ count (books.id) % Este indicador nos mostraría el porcentaje de libros que tenemos en el inventario y que cuyos autores están rankeados entre los 10 primeros puestos.
  • 6. Decisión: Existe una buena oportunidad de depurar el inventario en función a los autores más vendidos si este indicador esta por debajo del 70% Count(((AVG to_read. Book Id)))/ count (books.id) % Este indicador nos mostraría el porcentaje de libros que la gente recomienda leer. Decisión: Existe una buena oportunidad de depurar el inventario en función a los autores más vendidos si este indicador está por debajo del 70% Ahora podemos llevar diferentes estrategias como buscar relaciones entre el rating de los libros mas recomendados y buscar los libros del mismo autor, pero no que no estén el rating para poder adelantarnos a una posible demanda. De igual podemos tener algún tipo de combo donde obsequiemos un libro de baja rotación y que la gente no este dentro de los más recomendados o los mas vendidos junto con uno que si este dentro de este grupo. CONCLUSIONES Para este ejercicio se usó el modelo de analítica descriptiva pues se cuenta con una información de cómo va el negocio hasta la fecha además con este estudio que tuve la oportunidad de realizar en la librería pude comprobar la gran utilidad del uso de los KPI’s en cualquier negocio ya que mediante estos indicadores podemos, plantear y establecer estrategias en diferentes áreas de las empresa, para lograr que un negocio o empresa tengan éxito total.