Bitacora de Inteligencia Artificial y Herramientas Digitales HD4 Ccesa007.pdf
Proyecto Evaluación entre Pares
1. 1
Este documento es un ejercicio escolar
PROYECTO
APLICACIÓN DE CIENCIA DE DATOS
Olga M. Garza Silva
Monterrey, NL a21 de febrero2021
2. 2
Este documento es un ejercicio escolar
Indice
Indice.........................................................................................................................2
Introducción...............................................................................................................3
Propuesta de trabajo..................................................................................................3
Próximos pasos ..........................................................................................................5
3. 3
Este documento es un ejercicio escolar
Introducción
El uso de la ciencia de datos en las empresas es cada vez mayor en diferentes industrias. El alto
volumen de información interna y externa, su carácter cambiante y diverso vuelve compleja la
gestión y la toma de decisiones basada en datos. La ciencia de datos busca responder a
preguntas clave de las empresas.
En enero 2021 la dirección de la empresa aprobó el proyecto de uso de la ciencia de datos en el
análisis de la información comercial con la finalidad de mejorar los indicadores de desempeño
y la estrategia en la toma de decisiones.
El proyecto incluye:
Definición de las herramientas a utilizar.
Analítica descriptiva y predictiva. Se realiza un diagnóstico de la información de la
empresa y se define el modelo a utilizar para predecir la información deseada.
Los objetivos del proyecto son dos: tener el pronóstico de la demanda y pronóstico de
comportamiento del cliente.
Propuesta de trabajo
HERRAMIENTAS A UTILIZAR
Se propone utilizar las siguientes herramientas para la implementación del proyecto:
Lenguaje de programación: Python por ser fácil de entender y
multiplataforma.
Sistema para análisis de datos: Jupiter Notebook ya que permite desarrollar
código en Python y por su capacidad numérica
y estadística.
Tipo de base de datos seleccionado para alojar
los análisis:
MySQL por su simplicidad y alto rendimiento.
Tipo de servicio en la nube que la empresa
contrataría para alojarla información y para el
proceso de ciencia de datos:
Github porque es un repositorio de trabajo
colaborativo que permite además llevar la
gestión del proyecto. Funciona bien con
Jupiter Notebook.
4. 4
Este documento es un ejercicio escolar
ANALÍTICA PREDICTIVA
Las predicciones que se pueden obtener son:
Pronóstico de la demanda de libros y pronóstico de ventas.
Pronóstico de los clientes que van a comprar libros.
Pronóstico de los clientes van a desertar.
El planteamiento:
Para el pronóstico de la demanda se hará un análisis de correlación entre ventas y el
rating, los “top books”, los “to read books” y el precio para determinar el impacto de
cada variable en las ventas históricas y posteriormente hacer un pronóstico mediante
una regresión.
Para el pronóstico de los clientes se usa el modelo de probabilidades BTYD (Buy until
you die model) para identificar los clientes que continuarán comprando, o dejarán de
hacerlo.
Adecuaciones a la información:
Validar la información recibida:
o El dato de rating en el archivo de books no coincide con los datos del archivo de
rating (promedio calculado por libro).
Obtener la siguiente información:
o Las ventas diarias históricas por libro (de 2 a 4 años según disponibilidad).
o Libros “top books” históricos (mismo periodo).
o Rating histórico por libro.
o Lista de clientes y ventas por cliente.
o Hay otros ratings nacionales/internacionales de libros.
5. 5
Este documento es un ejercicio escolar
Próximos pasos
Los siguientes pasos en el proyecto son:
1. Definición de
proyecto
2. Recepción y
transformación
de información
3. Creación y
validación del
modelo
4. Análisis de
resultados