SlideShare una empresa de Scribd logo
INTRODUCCIÓN A LA CIENCIA DE DATOS y BIGDATA
CASO
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGAMIZACIÓN
PRESENTADO POR
Hugo Rodríguez Castillo
Lima, Julio 2021
2
Contenido
Introducción.......................................................................................................... 3
1. Descripción del caso......................................................................................... 4
2. Identificación de Indicadores............................................................................ 6
3. Tipo de Análisis Elaborado .............................................................................. 6
4. Propuesta........................................................................................................... 6
5. Conclusiones..................................................................................................... 7
3
Introducción
El presente informe permite identificar los pasos necesarios para utilizar la
ciencia de datos como proceso de soporte de decisiones en una determinada área de
negocio, analizando fuentes de información externas e internas mediante herramientas
computacionales.
En este caso se cuenta con información histórica de la librería Iztaccihuatl
ubicada en la ciudad de Monterrey, la cual servirá como referencia para definir los
indicadores más importantes, el análisis que mejor se ajusta y los resultados que se
puedan proponer luego del análisis respectivo de los datos.
4
1. Descripción del caso
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León,
México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma
de decisiones. La información disponible se encuentra en los siguientes archivos:
• El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de
acuerdo con las votaciones y compras del cliente. La estructura de este archivo
es la siguiente:
o Id - Identificador del registro
o Book Id - Identificador del libro
o Number Editions - Número de ediciones
o ISBN - Clave estándar internacional del libro
o ISBN13 - Clave estándar extendida internacional del libro
o Authors - Autor del libro
o Original Publication - Fecha de publicación
o Original Title - Título original del libro
o Title - Título del libro
o Language Code - Clave de idioma del libro
o Average Rating - Promedio de la clasificación del libro
o Image - Enlace a la imagen de la portada del libro
o Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
• El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo
con una clasificación general. La estructura de este archivo es la siguiente:
5
o Position - Posición del libro en la clasificación del libro
o ISBN - Clave estándar extendida internacional del libro
o Title - Título del libro
o Author - Autor del libro
o Imprint - Editorial
o Publisher Group - Grupo Editorial
o Volume - Volumen de ventas hasta el 2010
o Value - Ventas determinadas por el volumen
o RRP - Precio recomendado para minoristas
o ASP - Precio promedio para venta
o Binding - Tipo de encuadernación
o Publ Date - Fecha de publicación
o Product Class - Clasificación del libro
o Classification - Clasificación General del libro
• El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería. La estructura de este archivo es la siguiente:
o Book Id - Identificador del libro
o User Id - Identificador del cliente/usuario que clasifico un libro
o Rating - Nivel de clasificación del libro.
• El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer. La estructura de este archivo es la
siguiente:
o User Id - Identificador del cliente/usuario que clasifico un libro
o Book Id - Identificador del libro
6
2. Identificación de Indicadores
De acuerdo con la información recopilada, podemos identificar a los siguientes
indicadores como los más importantes:
• Cantidad y lista de títulos de libros más recomendados para leer por los clientes.
• Cantidad y lista de autores más recomendados para leer por los clientes.
• Los tops 10 libros más votados por los clientes dentro del sitio web de la
librería.
• Los tops 10 libros no recomendados por los clientes dentro del sitio web de la
librería.
• La cantidad de clientes únicos que visitaron el sitio web de la librería para
recomendar algún libro.
3. Tipo de Análisis Elaborado
La información obtenida muestra solo la información histórica del negocio, por
lo cual el análisis descriptivo es el que más se ajusta. Este nos permitirá responder a la
pregunta "¿Qué pasó en el pasado con el negocio?". Se requieren de mayores datos para
complementar y poder aplicar la analítica predictiva ("¿qué va a pasar probablemente en
el futuro?") y la analítica prescriptiva que intenta responder a la pregunta: "¿Y ahora
qué?" O "¿Qué se puede hacer para evitarlo?".
4. Propuesta
Fidelización de clientes: para incentivar el tráfico de la página web se propone
entregar un bono o descuento a los clientes que recomienden un título y este tenga
buena acogida en el período respectivo.
7
5. Conclusiones
La ciencia de datos cada vez tiene mas relevancia en las organizaciones y nos
permite transformar los datos en información de valor con lo cual se pueden tomar
mejores decisiones en la dirección de una organización.

Más contenido relacionado

Similar a Trabajo introducción a la ciencia de datos

Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
José Ignacio Mamani Murga
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
arcon412
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
Alejandro Hinojosa Medina
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
Fernandoss2
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organización
sram0s
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Paola Quiroz Alvarez
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
Diego Farfan
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
CarlosChin
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
matiasgatica9
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
danielavalenciacebal
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares
RENE RGUEZ GLEZ
 
Ev pares
Ev paresEv pares
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
cnino6
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
MariaTeresaSnchezSan
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
OlgaMaraGarzaSilva
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
HugoCastro854432
 
Practica Big Data
Practica Big DataPractica Big Data
Practica Big Data
Ulises J. Acevedo Aguilar
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
Kozhaya Elias Sfeir
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
OlgaMaraGarzaSilva
 
Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docx
Lambofgod1993
 

Similar a Trabajo introducción a la ciencia de datos (20)

Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organización
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares
 
Ev pares
Ev paresEv pares
Ev pares
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Practica Big Data
Practica Big DataPractica Big Data
Practica Big Data
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 
Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docx
 

Último

modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
evelinglilibethpeafi
 
Presentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre bloggerPresentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre blogger
larapalaciosmonzon28
 
computacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADOcomputacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADO
YaniEscobar2
 
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaCatalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
AMADO SALVADOR
 
Computacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajasComputacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajas
sofiahuarancabellido
 
Manual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computoManual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computo
mantenimientocarbra6
 
IA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticulturaIA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticultura
Miguel Rebollo
 
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
IsabelQuintero36
 
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
alejandromanuelve
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
LilibethEstupian
 
mantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptxmantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptx
MiguelAtencio10
 
SISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsxSISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsx
tamarita881
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
ValeriaAyala48
 
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdfProjecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Festibity
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
JimmyTejadaSalizar
 
Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
NicandroMartinez2
 
Informació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdfInformació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdf
Festibity
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Festibity
 
Gabinete, puertos y dispositivos que se conectan al case
Gabinete,  puertos y  dispositivos que se conectan al caseGabinete,  puertos y  dispositivos que se conectan al case
Gabinete, puertos y dispositivos que se conectan al case
JuanaNT7
 
Manual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputoManual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputo
doctorsoluciones34
 

Último (20)

modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
 
Presentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre bloggerPresentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre blogger
 
computacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADOcomputacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADO
 
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaCatalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
 
Computacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajasComputacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajas
 
Manual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computoManual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computo
 
IA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticulturaIA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticultura
 
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
 
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
 
mantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptxmantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptx
 
SISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsxSISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsx
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
 
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdfProjecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
 
Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
 
Informació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdfInformació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdf
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
 
Gabinete, puertos y dispositivos que se conectan al case
Gabinete,  puertos y  dispositivos que se conectan al caseGabinete,  puertos y  dispositivos que se conectan al case
Gabinete, puertos y dispositivos que se conectan al case
 
Manual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputoManual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputo
 

Trabajo introducción a la ciencia de datos

  • 1. INTRODUCCIÓN A LA CIENCIA DE DATOS y BIGDATA CASO UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGAMIZACIÓN PRESENTADO POR Hugo Rodríguez Castillo Lima, Julio 2021
  • 2. 2 Contenido Introducción.......................................................................................................... 3 1. Descripción del caso......................................................................................... 4 2. Identificación de Indicadores............................................................................ 6 3. Tipo de Análisis Elaborado .............................................................................. 6 4. Propuesta........................................................................................................... 6 5. Conclusiones..................................................................................................... 7
  • 3. 3 Introducción El presente informe permite identificar los pasos necesarios para utilizar la ciencia de datos como proceso de soporte de decisiones en una determinada área de negocio, analizando fuentes de información externas e internas mediante herramientas computacionales. En este caso se cuenta con información histórica de la librería Iztaccihuatl ubicada en la ciudad de Monterrey, la cual servirá como referencia para definir los indicadores más importantes, el análisis que mejor se ajusta y los resultados que se puedan proponer luego del análisis respectivo de los datos.
  • 4. 4 1. Descripción del caso La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. La información disponible se encuentra en los siguientes archivos: • El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y compras del cliente. La estructura de este archivo es la siguiente: o Id - Identificador del registro o Book Id - Identificador del libro o Number Editions - Número de ediciones o ISBN - Clave estándar internacional del libro o ISBN13 - Clave estándar extendida internacional del libro o Authors - Autor del libro o Original Publication - Fecha de publicación o Original Title - Título original del libro o Title - Título del libro o Language Code - Clave de idioma del libro o Average Rating - Promedio de la clasificación del libro o Image - Enlace a la imagen de la portada del libro o Small Image - Enlace a la imagen en versión optimizada de la portada del libro. • El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo con una clasificación general. La estructura de este archivo es la siguiente:
  • 5. 5 o Position - Posición del libro en la clasificación del libro o ISBN - Clave estándar extendida internacional del libro o Title - Título del libro o Author - Autor del libro o Imprint - Editorial o Publisher Group - Grupo Editorial o Volume - Volumen de ventas hasta el 2010 o Value - Ventas determinadas por el volumen o RRP - Precio recomendado para minoristas o ASP - Precio promedio para venta o Binding - Tipo de encuadernación o Publ Date - Fecha de publicación o Product Class - Clasificación del libro o Classification - Clasificación General del libro • El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. La estructura de este archivo es la siguiente: o Book Id - Identificador del libro o User Id - Identificador del cliente/usuario que clasifico un libro o Rating - Nivel de clasificación del libro. • El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. La estructura de este archivo es la siguiente: o User Id - Identificador del cliente/usuario que clasifico un libro o Book Id - Identificador del libro
  • 6. 6 2. Identificación de Indicadores De acuerdo con la información recopilada, podemos identificar a los siguientes indicadores como los más importantes: • Cantidad y lista de títulos de libros más recomendados para leer por los clientes. • Cantidad y lista de autores más recomendados para leer por los clientes. • Los tops 10 libros más votados por los clientes dentro del sitio web de la librería. • Los tops 10 libros no recomendados por los clientes dentro del sitio web de la librería. • La cantidad de clientes únicos que visitaron el sitio web de la librería para recomendar algún libro. 3. Tipo de Análisis Elaborado La información obtenida muestra solo la información histórica del negocio, por lo cual el análisis descriptivo es el que más se ajusta. Este nos permitirá responder a la pregunta "¿Qué pasó en el pasado con el negocio?". Se requieren de mayores datos para complementar y poder aplicar la analítica predictiva ("¿qué va a pasar probablemente en el futuro?") y la analítica prescriptiva que intenta responder a la pregunta: "¿Y ahora qué?" O "¿Qué se puede hacer para evitarlo?". 4. Propuesta Fidelización de clientes: para incentivar el tráfico de la página web se propone entregar un bono o descuento a los clientes que recomienden un título y este tenga buena acogida en el período respectivo.
  • 7. 7 5. Conclusiones La ciencia de datos cada vez tiene mas relevancia en las organizaciones y nos permite transformar los datos en información de valor con lo cual se pueden tomar mejores decisiones en la dirección de una organización.