SlideShare una empresa de Scribd logo
1 de 8
Descargar para leer sin conexión
Emmanuel Acosta Lechuga
PRÁCTICA CON EVALUACIÓN
ENTRE PARES #2
Herramientas para el análisis de Big Data
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido
desarrollar un proyecto basada en ciencia de datos para desarrollar una mejor estrategia en la toma
de decisiones.
A pesar de que R es conocido como la lengua franca de la estadística, en esta ocasión se hará uso
de la herramienta Python, ya que cuenta con distintas y poderosas opciones para visualizar data.
Python es capaz de soportar dinstintos tipos de formatos entre los que se incluyen los archivos con
valores separados por comas (CSVs)
Una de las grandes ventajas de Python es que existe una amplia variedad de bibliotecas que ayudan
a desenterrar los secretos dentro de los datos con los que contamos. Para el caso de la librería
Iztaccihuatl se hizo uso de Pandas, Matplotlib y NumPy. Pandas es capaz de almacenar grandes
cantidades de información sin el lag de proceso que tiene Excel, por ende, se es capaz de filtrar,
ordenar y mostrar datos en cuestión de segundos. Pandas se organiza en data frames, los cuales
pueden ser definidos sin límite a través de todo el proyecto.
La IPython Notebook que viene con Anaconda cuenta con una gran variedad de ponderosas
opciones para visualizar datos. Se utilizó la librería de Matplotlib para generar los gráficos con los
datos que se encontraban en Python gracias a Pandas.
Dada la naturaleza de los datos con los que contamos, es complicado realizar un análisis predictivo
porque no se cuenta con la información necesaria para realizarlo de forma adecuada, no obstante,
contamos con datos que pueden ser de suma importancia.
Gracias al archivo “ratings”, podemos obtener y representar de manera gráfica cuáles son los libros
más votados por los clientes dentro de su sitio web y, de igual forma, con el archivo “to_read”
podemos ver cuáles son las recomendaciones de cada cliente sobre libros para leer. Se debe
considerar el alto número de recomendaciones y rating promedio de los libros para poder sugerir a
los clientes con gustos similares algún producto que pueda ser de su interés y de esta forma
aumentar el ticket promedio por cliente y de misma forma las ventas de la librería.
A continuación se muestra la calificación promedio de los libros según los clientes, se puede observar
que hay algunos libros cuya calificación es menor a los 3 puntos, se puede asumir que el libro no
haya llegado al público al que estaba dirigido y por la misma razón la venta de dichos libros sea muy
poca comparada con algún producto que tenga una calificación mayor a los 4 puntos, se sugiere
reducir el inventario de dichos libros para reducir costos dentro del almacén de la librería.
Rating promedio de cada libro
La venta cruzada consiste en identificar productos relacionados y crear una
oferta apropiada para cada cliente, mientras que hacerlo en persona puede requerir
un entrenamiento para un acercamiento efectivo. La meta es hacer más dinero para
la compañía al mismo tiempo que se crean clientes satisfechos.
Amazon atribuye casi el 35% de sus ventas a la venta cruzada a través de “los
compradores que compraron esto también compraron” y “generalmente se
compran juntos” en cada página de producto. Este enfoque permite al minorista
indicar al comprador a comprar un producto compatible o necesario.
Aquí se muestran los treinta libros que cuentan con la mejor calificación promedio
según los clientes. Si dentro de las bases de datos de la librería se incluyera el
identificador único de cada libro se podría saber a qué género pertenece y el autor
de dichos libros. Al saber dicha información nos ayudaría a sugerir estos productos
a otros clientes que cuenten con los mismos gustos o intereses.
** El código se encuentra anexo al final del documento
Número de recomendaciones por libro
Al igual que en el caso anterior, aquí se muestran los treinta libros que más se
recomiendan entre los clientes en el sitio web de la librería. Si se adopta la
estrategia sugerida se podría conseguir que el cliente compre más productos que
satisfagan sus necesidades, las ventas de la librería aumentarán y, por ende, los
ingresos.
Al vender múltiples productos a los clientes, los costos serán menores comparados
con los clientes que solamente adquieren un producto cada uno. Al mismo tiempo
se reducen los costos de captación de clientes, ya que estos conllevan un gasto
muy alto.
El cliente está confiando en la librería para obtener varios productos, lo que se
traduce en la posibilidad de que sea un cliente recurrente. Del mismo modo, al
comprar más cosas de una misma tienda, aumentará el nivel de dependencia del
cliente.
Al ofrecer recomendaciones o varias posibilidades al usuario, permite que mejore
la imagen de la marca de la librería ante sus clientes.
Las bases de datos de la librería carecen de información e interconexión para llevar a cabo la
estrategia que se sugiere en este documento. Se sabe cuáles son los libros que más recomiendan
los clientes, sin embargo desconocemos el género y autor de cada libro. Se sugiere adecuar la base
de datos para poder realizar ventas cruzadas y aumentar las ventas. Al mismo tiempo se sugiere
que se incluya una base de datos en la que se pueda generar un perfil de cada cliente, con la finalidad
de afinar las sugerencias para las ventas cruzadas y lograr el objetivo de aumentar las ventas por
cliente.
El perfil de cada cliente debería incluir género, edad, estado civil, intereses, profesión e incluir su
historial de compras. Realmente solo son características que puedan tener en común con otros
clientes que nos ayudarán a centrar y mejorar las opciones que se le puedan sugerir.
Con el fin de pronosticar de una mejor manera las ventas de la librería, se sugiere un modelo de
bases de datos relacional; organizaciones de cualquier rubro y tamaño utilizan el modelo para hacer
seguimiento de los inventarios, procesar transacciones de comercio electrónico, administrar grandes
cantidades de información de clientes, etc. Se puede considerar una base de datos relacional para
cualquier necesidad de información en la que los puntos de datos se relacionen entre sí y se deban
administrar de una manera segura, consistente y basada en reglas.
Los datos con los que contaría la librería no son críticos, salvo los datos de los clientes, por lo que
una nube hibrida combinaría la infraestructura y servicios de la nube pública, para aquellas
operaciones no críticas, y de la privada, para cuando requieren una mayor seguridad, asegurándose
de que todas las plataformas se integran sin problemas, ello conlleva realizar diferentes funciones
dentro de una misma organización y permite que los datos se almacenen fuera de las instalaciones
con el proveedor de nube, también permite que los datos se almacenen localmente.
** .
Proyecto de evaluación de pares
Proyecto de evaluación de pares

Más contenido relacionado

Similar a Proyecto de evaluación de pares

Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónMariaTeresaSnchezSan
 
Proy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriProy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriJhardenaYauri
 
Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización JenniferTorres155
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlPaola Quiroz Alvarez
 
Utilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andradeUtilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andradenorbertoandrade1
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.HugoCastro854432
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaAxelRocha3
 
Big data Caso Libreria Iztaccihuatl
Big data Caso Libreria IztaccihuatlBig data Caso Libreria Iztaccihuatl
Big data Caso Libreria IztaccihuatlPaola Quiroz Alvarez
 
Aplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organizaciónAplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organizaciónKozhayaSfeir
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaJosé Ignacio Mamani Murga
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data arcon412
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdfJuan José Triviño
 

Similar a Proyecto de evaluación de pares (20)

evaluacion por pares
evaluacion por paresevaluacion por pares
evaluacion por pares
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datos
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Proy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriProy eval de pares Jhardena Yauri
Proy eval de pares Jhardena Yauri
 
Trabajo big data
Trabajo big data Trabajo big data
Trabajo big data
 
Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
Utilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andradeUtilizando ciencia de datos norberto andrade
Utilizando ciencia de datos norberto andrade
 
Practica mariadejoz
Practica mariadejozPractica mariadejoz
Practica mariadejoz
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez Rocha
 
Big data Caso Libreria Iztaccihuatl
Big data Caso Libreria IztaccihuatlBig data Caso Libreria Iztaccihuatl
Big data Caso Libreria Iztaccihuatl
 
Aplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organizaciónAplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organización
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
Reporte_practica_2.pdf
Reporte_practica_2.pdfReporte_practica_2.pdf
Reporte_practica_2.pdf
 
Big data ejercicio
Big data ejercicioBig data ejercicio
Big data ejercicio
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf
 
Ev pares
Ev paresEv pares
Ev pares
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 

Último

2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docxGLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docxAleParedes11
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleJonathanCovena1
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoFundación YOD YOD
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscaeliseo91
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxdanalikcruz2000
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxOscarEduardoSanchezC
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuaDANNYISAACCARVAJALGA
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfMaryRotonda1
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 

Último (20)

2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docxGLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo Sostenible
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativo
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fisca
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahua
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdf
 
Unidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDIUnidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDI
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 

Proyecto de evaluación de pares

  • 1. Emmanuel Acosta Lechuga PRÁCTICA CON EVALUACIÓN ENTRE PARES #2 Herramientas para el análisis de Big Data
  • 2. La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basada en ciencia de datos para desarrollar una mejor estrategia en la toma de decisiones. A pesar de que R es conocido como la lengua franca de la estadística, en esta ocasión se hará uso de la herramienta Python, ya que cuenta con distintas y poderosas opciones para visualizar data. Python es capaz de soportar dinstintos tipos de formatos entre los que se incluyen los archivos con valores separados por comas (CSVs) Una de las grandes ventajas de Python es que existe una amplia variedad de bibliotecas que ayudan a desenterrar los secretos dentro de los datos con los que contamos. Para el caso de la librería Iztaccihuatl se hizo uso de Pandas, Matplotlib y NumPy. Pandas es capaz de almacenar grandes cantidades de información sin el lag de proceso que tiene Excel, por ende, se es capaz de filtrar, ordenar y mostrar datos en cuestión de segundos. Pandas se organiza en data frames, los cuales pueden ser definidos sin límite a través de todo el proyecto. La IPython Notebook que viene con Anaconda cuenta con una gran variedad de ponderosas opciones para visualizar datos. Se utilizó la librería de Matplotlib para generar los gráficos con los datos que se encontraban en Python gracias a Pandas. Dada la naturaleza de los datos con los que contamos, es complicado realizar un análisis predictivo porque no se cuenta con la información necesaria para realizarlo de forma adecuada, no obstante, contamos con datos que pueden ser de suma importancia. Gracias al archivo “ratings”, podemos obtener y representar de manera gráfica cuáles son los libros más votados por los clientes dentro de su sitio web y, de igual forma, con el archivo “to_read” podemos ver cuáles son las recomendaciones de cada cliente sobre libros para leer. Se debe considerar el alto número de recomendaciones y rating promedio de los libros para poder sugerir a los clientes con gustos similares algún producto que pueda ser de su interés y de esta forma aumentar el ticket promedio por cliente y de misma forma las ventas de la librería. A continuación se muestra la calificación promedio de los libros según los clientes, se puede observar que hay algunos libros cuya calificación es menor a los 3 puntos, se puede asumir que el libro no haya llegado al público al que estaba dirigido y por la misma razón la venta de dichos libros sea muy poca comparada con algún producto que tenga una calificación mayor a los 4 puntos, se sugiere reducir el inventario de dichos libros para reducir costos dentro del almacén de la librería.
  • 3. Rating promedio de cada libro La venta cruzada consiste en identificar productos relacionados y crear una oferta apropiada para cada cliente, mientras que hacerlo en persona puede requerir un entrenamiento para un acercamiento efectivo. La meta es hacer más dinero para la compañía al mismo tiempo que se crean clientes satisfechos. Amazon atribuye casi el 35% de sus ventas a la venta cruzada a través de “los compradores que compraron esto también compraron” y “generalmente se compran juntos” en cada página de producto. Este enfoque permite al minorista indicar al comprador a comprar un producto compatible o necesario. Aquí se muestran los treinta libros que cuentan con la mejor calificación promedio según los clientes. Si dentro de las bases de datos de la librería se incluyera el identificador único de cada libro se podría saber a qué género pertenece y el autor de dichos libros. Al saber dicha información nos ayudaría a sugerir estos productos a otros clientes que cuenten con los mismos gustos o intereses. ** El código se encuentra anexo al final del documento
  • 4. Número de recomendaciones por libro Al igual que en el caso anterior, aquí se muestran los treinta libros que más se recomiendan entre los clientes en el sitio web de la librería. Si se adopta la estrategia sugerida se podría conseguir que el cliente compre más productos que satisfagan sus necesidades, las ventas de la librería aumentarán y, por ende, los ingresos. Al vender múltiples productos a los clientes, los costos serán menores comparados con los clientes que solamente adquieren un producto cada uno. Al mismo tiempo se reducen los costos de captación de clientes, ya que estos conllevan un gasto muy alto. El cliente está confiando en la librería para obtener varios productos, lo que se traduce en la posibilidad de que sea un cliente recurrente. Del mismo modo, al comprar más cosas de una misma tienda, aumentará el nivel de dependencia del cliente. Al ofrecer recomendaciones o varias posibilidades al usuario, permite que mejore la imagen de la marca de la librería ante sus clientes.
  • 5. Las bases de datos de la librería carecen de información e interconexión para llevar a cabo la estrategia que se sugiere en este documento. Se sabe cuáles son los libros que más recomiendan los clientes, sin embargo desconocemos el género y autor de cada libro. Se sugiere adecuar la base de datos para poder realizar ventas cruzadas y aumentar las ventas. Al mismo tiempo se sugiere que se incluya una base de datos en la que se pueda generar un perfil de cada cliente, con la finalidad de afinar las sugerencias para las ventas cruzadas y lograr el objetivo de aumentar las ventas por cliente. El perfil de cada cliente debería incluir género, edad, estado civil, intereses, profesión e incluir su historial de compras. Realmente solo son características que puedan tener en común con otros clientes que nos ayudarán a centrar y mejorar las opciones que se le puedan sugerir. Con el fin de pronosticar de una mejor manera las ventas de la librería, se sugiere un modelo de bases de datos relacional; organizaciones de cualquier rubro y tamaño utilizan el modelo para hacer seguimiento de los inventarios, procesar transacciones de comercio electrónico, administrar grandes cantidades de información de clientes, etc. Se puede considerar una base de datos relacional para cualquier necesidad de información en la que los puntos de datos se relacionen entre sí y se deban administrar de una manera segura, consistente y basada en reglas. Los datos con los que contaría la librería no son críticos, salvo los datos de los clientes, por lo que una nube hibrida combinaría la infraestructura y servicios de la nube pública, para aquellas operaciones no críticas, y de la privada, para cuando requieren una mayor seguridad, asegurándose de que todas las plataformas se integran sin problemas, ello conlleva realizar diferentes funciones dentro de una misma organización y permite que los datos se almacenen fuera de las instalaciones con el proveedor de nube, también permite que los datos se almacenen localmente.