Guía rápida del uso del paquete estadístico Jamovi
Practica para Data Analítica Descriptiva
1. EDX TecDeMonterrey 1
Utilizando la Ciencia de Datos en una organización
Luis Cabrera
Tecnológico del Monterrey
Ciencia de Datos
Introducción a la Ciencia de Datos y Big Data
2. 2
Contenido
Objetivo.................................................................................................................... 3
Metodología aplicada............................................................................................... 4
Resultados................................................................................................................ 5
¿Qué indicadores serían los más importantes a determinar de acuerdo a la
información presentada?.................................................................................................... 5
¿Qué tipo de análisis sería el más adecuado y por qué? .......................................... 5
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de
la información analizada?.................................................................................................. 5
Desarrollo................................................................................................................. 6
Rentabilidad .......................................................................................................... 6
Rentabilidad por Group Publisher.......................................................................... 6
Rentabilidad por Titulo.......................................................................................... 6
Rentabilidad por Autor .......................................................................................... 7
Conclusión................................................................................................................ 8
DataSet..................................................................................................................... 9
Lista de cotejo para la evaluación de tu proyecto: ............................................... 11
3. 3
Objetivo
Analizar fuentes de información externas e internas de una organización a través de
herramientas computacionales para generar un modelo basado en Ciencia de Datos como apoyo
a la toma de decisiones.
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido
desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño
(KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
4. 4
Metodología aplicada
Analitica descriptiva es la que se va a usar. Se estaría aplicando para este análisis el proceso
basado en CRISP-DM Cross Industry Standard Process for Data Mining
5. 5
Resultados
¿Qué indicadores serían los más importantes a determinar de acuerdo a la información
presentada?
Desde el punto de vista de la Librería, saber cuáles son:
• La Grupo Editorial más rentable
• El Autor más rentable
• El Titulo más rentable.
¿Qué tipo de análisis sería el más adecuado y por qué?
La analítica descriptiva seria el mas indicado con los datos con que se cuenta.
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la
información analizada?
• Negociar mejores precios con el Grupo Editorial que más ganancias genera, a
fin de reducir costos.
• Dar mayor cobertura de marketing para los títulos y Autores más rentables; a
fin de aumentar las ventas.
• Dejar de vender los Autores y títulos que no generan ganancias.
6. 6
Desarrollo
Rentabilidad
A fin de hallar los libros mas rentables se aplico el siguiente calculo:
• (Volume - Volumen de ventas hasta el 2010 / Value - Ventas determinadas por el
volumen) – (ASP - Precio promedio para venta) = Rentabilidad
o Rentabilidad = Precio Promedio de Venta / Precio Promedio para Venta
Rentabilidad por Group Publisher
Rentabilidad por Titulo
Los Títulos que generan ganancias alcanzan el total de 111.475
7. 7
Rentabilidad por Autor
Los Autores que generan ganancias alcanzan el total de 94.189
Posiciones de los TOP 20 con resultados positivos y negativos
8. 8
Conclusión
Se deben enfocar a partir de los títulos que generan ganancias y pérdidas para promocionar
los títulos que generan rentabilidad y dejar de vender los títulos que no generan ganancias,
salvo caso que se usen como gancho de los libros que generan rentabilidad.
9. 9
DataSet
El archivo “books” contiene los siguientes datos:
• Id - Identicador del registro
• Book Id - Identicador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene los siguientes datos:
• Position - Posición del libro en la clasificación del libro
• ISBN - Clave estándar extendida internacional del libro
• Title - Título del libro
• Author - Autor del libro
• Imprint - Editorial
• Publisher Group - Grupo Editorial
• Volume - Volumen de ventas hasta el 2010
• Value - Ventas determinadas por el volumen
• RRP - Precio recomendado para minoristas
• ASP - Precio promedio para venta
• Binding - Tipo de encuadernación
• Publ Date - Fecha de publicación
• Product Class - Clasificación del libro
• Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
• Book Id - Identificador del libro
• User Id - Identificador del cliente/usuario que clasi_co un libro
• Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
• User Id - Identificador del cliente/usuario que clasi_co un libro
• Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y
compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una
clasificación general.
10. 10
El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del
sitio web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el
sitio web sobre libros para leer.
11. 11
Lista de cotejo para la evaluación de tu proyecto:
Lista de cotejo Sí lo
cumple
No lo
cumple
1. Contiene los datos de identificación de la empresa.
2. Se incluye la descripción detallada de la estrategia
de implementación.
3. La estrategia de implementación contempla un
proceso de evaluación.
4. Se mencionan las buenas prácticas que se deben
utilizar para lograr la estrategia descrita.
5. Se justifica la estrategia de implementación.