SlideShare una empresa de Scribd logo
1 de 9
Descargar para leer sin conexión
1
Creado por: Paola Quiroz Alvarez
28 AGOSTO
Edx y Tecnológico de Monterrey
Curso: Herramientas para el Análisis de Big
Data
Aplicando la
Ciencia de Datos
en una
organización
2020
2
Contenido
Aplicando la Ciencia de Datos en una organización.....................................................3
Introducción ..........................................................................................................3
Análisis..................................................................................................................3
Lenguaje De Programación.................................................................................5
Base de datos.....................................................................................................5
Tipo de Servicio en la nube.................................................................................5
Predicciones y Adecuaciones..............................................................................6
Conclusiones..........................................................................................................8
3
Aplicando la Ciencia de Datos en una
organización
Introducción
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma
de decisiones.
El objetivo principal de este proyecto es identificar las herramientas necesarias para el
análisis; tipo de base de datos y servicios de la nube más adecuado para desarrollar un
modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para la librería
mencionada. También identificaremos el lenguaje de programación para ciencia de datos
más apropiado para realizar el análisis, propondremos adecuaciones a las tablas para
tener mejores predicciones e identificaremos al menos tres predicciones con el diseño
de datos actual.
Análisis
Para el análisis tenemos 4 tablas que nos provee el caso de estudio que son:
 El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de acuerdo
a las votaciones y compras del cliente.
El archivo “books” contiene los siguientes datos:
Id - Identificador del registro
Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
4
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
 El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
El archivo “top_books” contiene los siguientes datos:
Position - Posición del libro en la clasificación del libro
ISBN - Clave estándar extendida internacional del libro
Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro
 El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
El archivo “ratings” contiene los siguientes datos:
Book Id - Identificador del libro
User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.
5
 El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
El archivo “to_read” contiene los siguientes datos:
User Id - Identificador del cliente/usuario que clasifico un libro
Book Id - Identificador del libro
Lenguaje De Programación
Existen dos lenguajes principales para el análisis de datos en ciencia de datos, hemos
preferido usar Python debido a la facilidad de programación, sobre todo fácil de entender
para principiantes. Y debido a que nos provee de reglas de estilos se puede escribir
código de forma más estandarizada de tal forma que sea más legible para los
compañeros que realizarán la evaluación de pares.
Otra razón es que el código en Python es multiplataforma por lo que podemos ejecutar
en diferentes sistemas operativos, lo que ayudará en caso que se necesite ejecutar en un
sistema operativo diferente al del creador.
Base de datos
Revisando los datos se detecta que corresponden a una base de datos relacional y para
alojar los análisis de los datos de la Librería Iztaccihuatl utilizaría también una base de
datos relacional, de preferencia usaría MySQL, que la obtengo en la nube por menor
costo.
Tipo de Servicio en la nube
Para el alcance de nuestro proyecto de ciencia de datos se prefiere usar PAAS (Platform
as a Service). Ya que esta modalidad nos permitirá desarrollar aplicaciones y servicios
con las herramientas que nos provee. Así mismo este tipo de servicios nos permitirá
6
concentrarnos en nuestro proyecto de ciencia de datos, dejando al proveedor la
infraestructura física y su administración.
Predicciones y Adecuaciones
Con los datos proporcionados podemos realizar las siguiente predicciones:
 Con ayuda de las recomendaciones en el archivo to_read relacionandolos a los
mejores calificados que están en el archivo ratings, podemos sacar los nombres de
los libros con mayor probabilidad de ser solicitados.
 También esta información nos ayudaría a predecir si un nuevo libro tiene buena
probabilidad de ventas, si pertenece al mismo autor de libros que sean
recomendados y tengan mayor nivel de ventas.
 Con ayuda de la tabla top_books podemos determinar que clasificación de libros
ha tenido mayor nivel de ventas y con ello podriamos predecir que nuevos libros
tendran buena probabilidad de ventas al pertenecer a esa clasificación. Más aun si
el autor tiene libros en la table to_read.
7
Podemos recomendar también una mejora en el diseño de los archivos de datos, para
que incluyan la última fecha de ventas en el archivo books y la fecha de transacciones en
los archivos de ratings y to_read; y de esa forma poder realizar análisis periodales o
comparativos entre períodos. También incluir en la tabla principal de libros los datos
de ventas como cantidad y valor vendido, lo que nos ayudaría a tener kpi´s adicionales
para apoyar nuestros análisis y predicciones.
Las adecuaciones de las tablas que nos provee el caso de estudio serían:
 El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de acuerdo
a las votaciones y compras del cliente.
Aumentar
LastSellDate.- Ultima fecha de venta
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
 El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
Aumentar
Date.- Fecha de la votación
 El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
Aumentar
Date.- Fecha de la recomendación
8
Conclusiones
Aunque con los datos provistos podemos hacer ciertas predicciones, tendriamos mejores
oportunidades de predicción realizando las adecuaciones propuestas a las tablas que
nos ayudaran a tener informacion importante para realizar predicciones basadas en
tiempo.
También podemos recomendar como estrategia promocionar en la página web de la
Librería los nuevos libros que pertenezcan a los autores cuyos libros estan en la lista de
mas vendidos o de mas recomendados.
9

Más contenido relacionado

La actualidad más candente

Rda actualización
Rda actualizaciónRda actualización
Rda actualizaciónOmar Herdez
 
Free Cataloging Tools
Free Cataloging ToolsFree Cataloging Tools
Free Cataloging Toolsrobin fay
 
Unidad 1 descripcion bibliografica cidba - grupo 7
Unidad 1   descripcion bibliografica cidba - grupo 7Unidad 1   descripcion bibliografica cidba - grupo 7
Unidad 1 descripcion bibliografica cidba - grupo 7Carolina Guerrero
 
eprints digital library software
eprints digital library softwareeprints digital library software
eprints digital library softwaresonia naomi bandao
 
Learn how to search VHL Search Portal - advanced (tutorial)
Learn how to search VHL Search Portal - advanced (tutorial)Learn how to search VHL Search Portal - advanced (tutorial)
Learn how to search VHL Search Portal - advanced (tutorial)Universidade de São Paulo
 
International Standard Book Number
International Standard Book NumberInternational Standard Book Number
International Standard Book NumberDheeraj Negi
 
DSpace Training Presentation
DSpace Training PresentationDSpace Training Presentation
DSpace Training PresentationThomas King
 
Evolución del Libro
Evolución del LibroEvolución del Libro
Evolución del LibroHugo Carrion
 
Las nuevas competencias del profesional de la información
Las nuevas competencias del profesional de la informaciónLas nuevas competencias del profesional de la información
Las nuevas competencias del profesional de la informaciónAyda Matabajoy Alvarez
 
Aportes de las disciplinas metricas
Aportes de las disciplinas metricasAportes de las disciplinas metricas
Aportes de las disciplinas metricasNaydelsi Gil
 
Absysnet avanzado
Absysnet avanzadoAbsysnet avanzado
Absysnet avanzadoKatalogador
 
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDOmeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDJulien Sicot
 

La actualidad más candente (20)

Rda actualización
Rda actualizaciónRda actualización
Rda actualización
 
Kwoc
KwocKwoc
Kwoc
 
Library ad Information Science Education in Germany
Library ad Information Science Education in GermanyLibrary ad Information Science Education in Germany
Library ad Information Science Education in Germany
 
Publicaciones seriadas
Publicaciones seriadasPublicaciones seriadas
Publicaciones seriadas
 
Free Cataloging Tools
Free Cataloging ToolsFree Cataloging Tools
Free Cataloging Tools
 
Unidad 1 descripcion bibliografica cidba - grupo 7
Unidad 1   descripcion bibliografica cidba - grupo 7Unidad 1   descripcion bibliografica cidba - grupo 7
Unidad 1 descripcion bibliografica cidba - grupo 7
 
eprints digital library software
eprints digital library softwareeprints digital library software
eprints digital library software
 
Library induction
Library inductionLibrary induction
Library induction
 
Curso sobre bolsa y psicologia financiera
Curso sobre bolsa y psicologia financieraCurso sobre bolsa y psicologia financiera
Curso sobre bolsa y psicologia financiera
 
Learn how to search VHL Search Portal - advanced (tutorial)
Learn how to search VHL Search Portal - advanced (tutorial)Learn how to search VHL Search Portal - advanced (tutorial)
Learn how to search VHL Search Portal - advanced (tutorial)
 
International Standard Book Number
International Standard Book NumberInternational Standard Book Number
International Standard Book Number
 
DSpace Training Presentation
DSpace Training PresentationDSpace Training Presentation
DSpace Training Presentation
 
Evolución del Libro
Evolución del LibroEvolución del Libro
Evolución del Libro
 
Academic library services for the digital age
Academic library services for the digital ageAcademic library services for the digital age
Academic library services for the digital age
 
Las nuevas competencias del profesional de la información
Las nuevas competencias del profesional de la informaciónLas nuevas competencias del profesional de la información
Las nuevas competencias del profesional de la información
 
Materiales No Libro
Materiales No LibroMateriales No Libro
Materiales No Libro
 
Aportes de las disciplinas metricas
Aportes de las disciplinas metricasAportes de las disciplinas metricas
Aportes de las disciplinas metricas
 
Absysnet avanzado
Absysnet avanzadoAbsysnet avanzado
Absysnet avanzado
 
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDOmeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
 
Zotero
Zotero Zotero
Zotero
 

Similar a Bigdata Herramientas Caso Libreria Iztaccihuatl

Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxLambofgod1993
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónMariaTeresaSnchezSan
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfCarlosChin
 
Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización JenniferTorres155
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individualFernandoss2
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaJosé Ignacio Mamani Murga
 
Aplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionAplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionFernando Aguada
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónDiego Farfan
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big datacnino6
 
Trabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaTrabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaCamilo Sanhueza Nuñez
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data arcon412
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Paola Quiroz Alvarez
 

Similar a Bigdata Herramientas Caso Libreria Iztaccihuatl (20)

Big data ejercicio
Big data ejercicioBig data ejercicio
Big data ejercicio
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docx
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Reporte_practica_2.pdf
Reporte_practica_2.pdfReporte_practica_2.pdf
Reporte_practica_2.pdf
 
Proyecto Jaime Salinas
Proyecto Jaime SalinasProyecto Jaime Salinas
Proyecto Jaime Salinas
 
Practica para Data Analítica Descriptiva
Practica para Data Analítica DescriptivaPractica para Data Analítica Descriptiva
Practica para Data Analítica Descriptiva
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
Aplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionAplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una Organizacion
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Trabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaTrabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhueza
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
 

Último

Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdfBiografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdfANGELEFRENCUAUTLEOCE
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdfAnaBelindaArmellonHi
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfJC Díaz Herrera
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosMarycarmenNuez4
 

Último (20)

Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdfBiografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdf
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicos
 

Bigdata Herramientas Caso Libreria Iztaccihuatl

  • 1. 1 Creado por: Paola Quiroz Alvarez 28 AGOSTO Edx y Tecnológico de Monterrey Curso: Herramientas para el Análisis de Big Data Aplicando la Ciencia de Datos en una organización 2020
  • 2. 2 Contenido Aplicando la Ciencia de Datos en una organización.....................................................3 Introducción ..........................................................................................................3 Análisis..................................................................................................................3 Lenguaje De Programación.................................................................................5 Base de datos.....................................................................................................5 Tipo de Servicio en la nube.................................................................................5 Predicciones y Adecuaciones..............................................................................6 Conclusiones..........................................................................................................8
  • 3. 3 Aplicando la Ciencia de Datos en una organización Introducción La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. El objetivo principal de este proyecto es identificar las herramientas necesarias para el análisis; tipo de base de datos y servicios de la nube más adecuado para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para la librería mencionada. También identificaremos el lenguaje de programación para ciencia de datos más apropiado para realizar el análisis, propondremos adecuaciones a las tablas para tener mejores predicciones e identificaremos al menos tres predicciones con el diseño de datos actual. Análisis Para el análisis tenemos 4 tablas que nos provee el caso de estudio que son:  El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente. El archivo “books” contiene los siguientes datos: Id - Identificador del registro Book Id - Identificador del libro Number Editions - Número de ediciones ISBN - Clave estándar internacional del libro
  • 4. 4 ISBN13 - Clave estándar extendida internacional del libro Authors - Autor del libro Original Publication - Fecha de publicación Original Title - Título original del libro Title - Título del libro Language Code - Clave de idioma del libro Average Rating - Promedio de la clasificación del libro Image - Enlace a la imagen de la portada del libro Small Image - Enlace a la imagen en versión optimizada de la portada del libro.  El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación general. El archivo “top_books” contiene los siguientes datos: Position - Posición del libro en la clasificación del libro ISBN - Clave estándar extendida internacional del libro Title - Título del libro Author - Autor del libro Imprint - Editorial Publisher Group - Grupo Editorial Volume - Volumen de ventas hasta el 2010 Value - Ventas determinadas por el volumen RRP - Precio recomendado para minoristas ASP - Precio promedio para venta Binding - Tipo de encuadernación Publ Date - Fecha de publicación Product Class - Clasificación del libro Classification - Clasificación General del libro  El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. El archivo “ratings” contiene los siguientes datos: Book Id - Identificador del libro User Id - Identificador del cliente/usuario que clasifico un libro Rating - Nivel de clasificación del libro.
  • 5. 5  El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. El archivo “to_read” contiene los siguientes datos: User Id - Identificador del cliente/usuario que clasifico un libro Book Id - Identificador del libro Lenguaje De Programación Existen dos lenguajes principales para el análisis de datos en ciencia de datos, hemos preferido usar Python debido a la facilidad de programación, sobre todo fácil de entender para principiantes. Y debido a que nos provee de reglas de estilos se puede escribir código de forma más estandarizada de tal forma que sea más legible para los compañeros que realizarán la evaluación de pares. Otra razón es que el código en Python es multiplataforma por lo que podemos ejecutar en diferentes sistemas operativos, lo que ayudará en caso que se necesite ejecutar en un sistema operativo diferente al del creador. Base de datos Revisando los datos se detecta que corresponden a una base de datos relacional y para alojar los análisis de los datos de la Librería Iztaccihuatl utilizaría también una base de datos relacional, de preferencia usaría MySQL, que la obtengo en la nube por menor costo. Tipo de Servicio en la nube Para el alcance de nuestro proyecto de ciencia de datos se prefiere usar PAAS (Platform as a Service). Ya que esta modalidad nos permitirá desarrollar aplicaciones y servicios con las herramientas que nos provee. Así mismo este tipo de servicios nos permitirá
  • 6. 6 concentrarnos en nuestro proyecto de ciencia de datos, dejando al proveedor la infraestructura física y su administración. Predicciones y Adecuaciones Con los datos proporcionados podemos realizar las siguiente predicciones:  Con ayuda de las recomendaciones en el archivo to_read relacionandolos a los mejores calificados que están en el archivo ratings, podemos sacar los nombres de los libros con mayor probabilidad de ser solicitados.  También esta información nos ayudaría a predecir si un nuevo libro tiene buena probabilidad de ventas, si pertenece al mismo autor de libros que sean recomendados y tengan mayor nivel de ventas.  Con ayuda de la tabla top_books podemos determinar que clasificación de libros ha tenido mayor nivel de ventas y con ello podriamos predecir que nuevos libros tendran buena probabilidad de ventas al pertenecer a esa clasificación. Más aun si el autor tiene libros en la table to_read.
  • 7. 7 Podemos recomendar también una mejora en el diseño de los archivos de datos, para que incluyan la última fecha de ventas en el archivo books y la fecha de transacciones en los archivos de ratings y to_read; y de esa forma poder realizar análisis periodales o comparativos entre períodos. También incluir en la tabla principal de libros los datos de ventas como cantidad y valor vendido, lo que nos ayudaría a tener kpi´s adicionales para apoyar nuestros análisis y predicciones. Las adecuaciones de las tablas que nos provee el caso de estudio serían:  El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente. Aumentar LastSellDate.- Ultima fecha de venta Volume - Volumen de ventas hasta el 2010 Value - Ventas determinadas por el volumen  El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. Aumentar Date.- Fecha de la votación  El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. Aumentar Date.- Fecha de la recomendación
  • 8. 8 Conclusiones Aunque con los datos provistos podemos hacer ciertas predicciones, tendriamos mejores oportunidades de predicción realizando las adecuaciones propuestas a las tablas que nos ayudaran a tener informacion importante para realizar predicciones basadas en tiempo. También podemos recomendar como estrategia promocionar en la página web de la Librería los nuevos libros que pertenezcan a los autores cuyos libros estan en la lista de mas vendidos o de mas recomendados.
  • 9. 9