2. La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido
desarrollar un proyecto basada en ciencia de datos para desarrollar una mejor estrategia en la toma
de decisiones.
A pesar de que R es conocido como la lengua franca de la estadística, en esta ocasión se hará uso
de la herramienta Python, ya que cuenta con distintas y poderosas opciones para visualizar data.
Python es capaz de soportar dinstintos tipos de formatos entre los que se incluyen los archivos con
valores separados por comas (CSVs)
Una de las grandes ventajas de Python es que existe una amplia variedad de bibliotecas que ayudan
a desenterrar los secretos dentro de los datos con los que contamos. Para el caso de la librería
Iztaccihuatl se hizo uso de Pandas, Matplotlib y NumPy. Pandas es capaz de almacenar grandes
cantidades de información sin el lag de proceso que tiene Excel, por ende, se es capaz de filtrar,
ordenar y mostrar datos en cuestión de segundos. Pandas se organiza en data frames, los cuales
pueden ser definidos sin límite a través de todo el proyecto.
La IPython Notebook que viene con Anaconda cuenta con una gran variedad de ponderosas
opciones para visualizar datos. Se utilizó la librería de Matplotlib para generar los gráficos con los
datos que se encontraban en Python gracias a Pandas.
Dada la naturaleza de los datos con los que contamos, es complicado realizar un análisis predictivo
porque no se cuenta con la información necesaria para realizarlo de forma adecuada, no obstante,
contamos con datos que pueden ser de suma importancia.
Gracias al archivo “ratings”, podemos obtener y representar de manera gráfica cuáles son los libros
más votados por los clientes dentro de su sitio web y, de igual forma, con el archivo “to_read”
podemos ver cuáles son las recomendaciones de cada cliente sobre libros para leer. Se debe
considerar el alto número de recomendaciones y rating promedio de los libros para poder sugerir a
los clientes con gustos similares algún producto que pueda ser de su interés y de esta forma
aumentar el ticket promedio por cliente y de misma forma las ventas de la librería.
A continuación se muestra la calificación promedio de los libros según los clientes, se puede observar
que hay algunos libros cuya calificación es menor a los 3 puntos, se puede asumir que el libro no
haya llegado al público al que estaba dirigido y por la misma razón la venta de dichos libros sea muy
poca comparada con algún producto que tenga una calificación mayor a los 4 puntos, se sugiere
reducir el inventario de dichos libros para reducir costos dentro del almacén de la librería.
3. Rating promedio de cada libro
La venta cruzada consiste en identificar productos relacionados y crear una
oferta apropiada para cada cliente, mientras que hacerlo en persona puede requerir
un entrenamiento para un acercamiento efectivo. La meta es hacer más dinero para
la compañía al mismo tiempo que se crean clientes satisfechos.
Amazon atribuye casi el 35% de sus ventas a la venta cruzada a través de “los
compradores que compraron esto también compraron” y “generalmente se
compran juntos” en cada página de producto. Este enfoque permite al minorista
indicar al comprador a comprar un producto compatible o necesario.
Aquí se muestran los treinta libros que cuentan con la mejor calificación promedio
según los clientes. Si dentro de las bases de datos de la librería se incluyera el
identificador único de cada libro se podría saber a qué género pertenece y el autor
de dichos libros. Al saber dicha información nos ayudaría a sugerir estos productos
a otros clientes que cuenten con los mismos gustos o intereses.
** El código se encuentra anexo al final del documento
4. Número de recomendaciones por libro
Al igual que en el caso anterior, aquí se muestran los treinta libros que más se
recomiendan entre los clientes en el sitio web de la librería. Si se adopta la
estrategia sugerida se podría conseguir que el cliente compre más productos que
satisfagan sus necesidades, las ventas de la librería aumentarán y, por ende, los
ingresos.
Al vender múltiples productos a los clientes, los costos serán menores comparados
con los clientes que solamente adquieren un producto cada uno. Al mismo tiempo
se reducen los costos de captación de clientes, ya que estos conllevan un gasto
muy alto.
El cliente está confiando en la librería para obtener varios productos, lo que se
traduce en la posibilidad de que sea un cliente recurrente. Del mismo modo, al
comprar más cosas de una misma tienda, aumentará el nivel de dependencia del
cliente.
Al ofrecer recomendaciones o varias posibilidades al usuario, permite que mejore
la imagen de la marca de la librería ante sus clientes.
5. Las bases de datos de la librería carecen de información e interconexión para llevar a cabo la
estrategia que se sugiere en este documento. Se sabe cuáles son los libros que más recomiendan
los clientes, sin embargo desconocemos el género y autor de cada libro. Se sugiere adecuar la base
de datos para poder realizar ventas cruzadas y aumentar las ventas. Al mismo tiempo se sugiere
que se incluya una base de datos en la que se pueda generar un perfil de cada cliente, con la finalidad
de afinar las sugerencias para las ventas cruzadas y lograr el objetivo de aumentar las ventas por
cliente.
El perfil de cada cliente debería incluir género, edad, estado civil, intereses, profesión e incluir su
historial de compras. Realmente solo son características que puedan tener en común con otros
clientes que nos ayudarán a centrar y mejorar las opciones que se le puedan sugerir.
Con el fin de pronosticar de una mejor manera las ventas de la librería, se sugiere un modelo de
bases de datos relacional; organizaciones de cualquier rubro y tamaño utilizan el modelo para hacer
seguimiento de los inventarios, procesar transacciones de comercio electrónico, administrar grandes
cantidades de información de clientes, etc. Se puede considerar una base de datos relacional para
cualquier necesidad de información en la que los puntos de datos se relacionen entre sí y se deban
administrar de una manera segura, consistente y basada en reglas.
Los datos con los que contaría la librería no son críticos, salvo los datos de los clientes, por lo que
una nube hibrida combinaría la infraestructura y servicios de la nube pública, para aquellas
operaciones no críticas, y de la privada, para cuando requieren una mayor seguridad, asegurándose
de que todas las plataformas se integran sin problemas, ello conlleva realizar diferentes funciones
dentro de una misma organización y permite que los datos se almacenen fuera de las instalaciones
con el proveedor de nube, también permite que los datos se almacenen localmente.