SlideShare una empresa de Scribd logo
1 de 8
Descargar para leer sin conexión
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 1
Utilizando la Ciencia de Datos en una organización
María Teresa Sánchez Sanz
Introducción a la Ciencia de Datos y el Big Data
Tecnológico de Monterrey
EdX
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 2
Resumen
Utilizando los datos proporcionados por la Librería Iztaccihuatl ubicada en la ciudad de
Monterrey, Nuevo León, México, analizamos las fuentes de información externas e internas
de una organización a través de herramientas computacionales para generar un modelo
basado en Ciencia de Datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez
desarrollar una mejor estrategia en la toma de decisiones.
Palabras clave: Big data, Análisis, KPI’s
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 3
Contenido
Resumen.........................................................................................................................2
Utilizando la Ciencia de Datos en una organización .....................................................4
Datos proporcionados ....................................................................................................4
Indicadores.................................................................................................................4
Books .....................................................................................................................4
Top books...............................................................................................................5
Ratings ...................................................................................................................5
To read ...................................................................................................................5
KPI’s ..............................................................................................................................6
Relación de libros más valorados ..............................................................................6
Relación entre recomendaciones................................................................................6
Relación de libros según géneros y lenguaje de estos ...............................................6
De los más populares .............................................................................................6
Análisis y Estrategia ......................................................................................................7
Análisis Descriptivo...................................................................................................7
Ejemplos ................................................................................................................7
Decisiones a futuro: Análisis predictivo ....................................................................7
Ejemplos ................................................................................................................7
Conclusiones..................................................................................................................8
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 4
Utilizando la Ciencia de Datos en una organización
La empresa en cuestión según su perfil en LinkedIn, se dedica a la venta al por menor,
en concreto a la distribución y comercialización de material bibliográfico a nivel nacional.
Esta ubicada en Monterey, y Nuevo León, y cuenta con una página web
https://www.edimsa.com.mx/. Parece ser que tiene diversas sucursales.
Datos proporcionados
Presentaremos los archivos ofrecidos por la librería, junto con una descripción de los
datos contenidos en ellos. Los archivos ofrecidos se encuentran contenidos en la carpeta
denominada “datasets_books” se encuentran los siguientes archivos: books; top_books;
raitings; to_read.
Indicadores
Books
El archivo “books” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y
compras del cliente.
Datos contenidos en Books
1. Id - Identificador del registro
2. Book Id - Identificador del libro
3. Number Editions - Número de ediciones
4. ISBN - Clave estándar internacional del libro
5. ISBN13 - Clave estándar extendida internacional del libro
6. Authors - Autor del libro
7. Original Publication - Fecha de publicación
8. Original Title - Título original del libro
9. Title - Título del libro
10. Language Code - Clave de idioma del libro
11. Average Rating - Promedio de la clasificación del libro
12. Image - Enlace a la imagen de la portada del libro
13. Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 5
Top books
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo con
una clasificación general.
Datos contenidos en Top Books
1. Position - Posición del libro en la clasificación del libro
2. ISBN - Clave estándar extendida internacional del libro
3. Title - Título del libro
4. Author - Autor del libro
5. Imprint - Editorial
6. Publisher Group - Grupo Editorial
7. Volume - Volumen de ventas hasta el 2010
8. Value - Ventas determinadas por el volumen
9. RRP - Precio recomendado para minoristas
10. ASP - Precio promedio para venta
11. Binding - Tipo de encuadernación
12. Publ Date - Fecha de publicación
13. Product Class - Clasificación del libro
14. Classification - Clasificación General del libro
Ratings
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
Datos contenidos en Ratings
1. User Id - Identificador del cliente/usuario que clasifico un libro
2. Book Id - Identificador del libro.
To read
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza
en el sitio web sobre libros para leer.
Datos contenidos en To Read
1. User Id - Identificador del cliente/usuario que clasifico un libro
2. Book Id - Identificador del libro.
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 6
KPI’s
KPI’s son las siglas en inglés de Key Performance Indicators, es decir indicadores
clave de desempeño. Los KPI’s utilizan diferentes métodos para reunir información del
funcionamiento de la empresa. Con esta información se facilita la toma de decisiones.
Relación de libros más valorados
Este KPI nos indicará cuan popular un libro es, no solo por las valoraciones, si no
también por el número de ellas. Así pues, dos mismas valoraciones medias no serían igual de
valiosas si no tienen el mismo numero de personas que las han valorado, las que valoren más
personas nos darán información más valiosa.
Relación entre recomendaciones
Entre las recomendaciones de los usuarios podemos sacar una relación entre libros, y
así poder hacer recomendaciones similares a personas que busquen ciertos libros basado en
las recomendaciones anteriores que han hecho anteriores usuarios. O ubicar los libros en las
mismas estanterías o cercanas para que los usuarios similares los encuentren más fácilmente.
Relación de libros según géneros y lenguaje de estos
Este KPI nos indicará que lenguajes son populares en cada género. Primero
analizaremos los lenguajes por genero de los más populares, y luego se debería de cotejar con
la información de los disponibles en tienda (Aunque carecemos de la información de los
géneros en los datos proporcionados).
De los más populares
Para ello utilizaremos El “ISBN” que se ha generado en el archivo “Top_books” de
cada top 20 de libros y con este iremos al archivo “books” y seleccionaremos estos para
obtener el “Language Code”. Con estos datos estudiamos la moda de los idiomas más
populares por género.
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 7
Análisis y Estrategia
Análisis Descriptivo
Con los datos proporcionados podemos hacer un análisis descriptivo de la librería,
esta aportará una mejor comprensión del presente y del pasado de esta organizando los datos,
por ejemplo, viendo que libros han sido los mejores valorados. Nos permite visualizar una
dinámica de nuestro negocio, pudiendo ayudarnos a la toma de decisiones.
Este será el más adecuado ya que la información que tenemos no es muy extensa y
aunque se puede hacer un análisis predictivo no sería tan fiable teniendo en cuenta la falta de
datos.
Ejemplos
Un ejemplo, sería utilizar la relación de los libros más valorados, ver el volumen de
ventas del top de libros vendidos, etc.
Decisiones a futuro: Análisis predictivo
Si hablamos de que decisiones se podrían tomar estamos haciendo un análisis
predictivo.
Ejemplos
Así pues, intentaríamos hacer recomendaciones en bases a otras recomendaciones
similares, lo que haría que a priori las personas encontraran más fácilmente otros libros que
podrían gustarle incrementando potencialmente las ventas, tanto físicamente si se colocan
juntos o en la página web poner una sección de libros recomendados, o a futuro podríamos
detectar cuales libros deberíamos escoger en que idiomas en base a los libros anteriormente
comprados, o los más populares de su género.
Estas recomendaciones a posteriori deberían crear nuevos datos y ver si estas
recomendaciones realmente funcionan, o si escoger de antemano el idioma de los libros
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 8
ayuda a que estos no queden en el almacén. Y de nuevo volver a crear unos nuevos datos,
más exhaustivos.
Conclusiones
Los datos proporcionados en este informe son valiosos, pero se necesitaría una mejora
de los datos, por ejemplo, con los precios de venta de los libros, no solo de los más vendidos,
para hacer una comparativa, por ejemplo. También hacer encuestas de satisfacción, etc.
Quien tiene la información tiene el poder, para analizar el presente y el pasado, y
poder tomar las riendas de nuestro futuro.

Más contenido relacionado

La actualidad más candente

Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosEsneiderOrozcoVidal
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.LeonardoGutierrezDal
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datosAsael Bravo
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatlangelfeijoo
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlPaola Quiroz Alvarez
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.HugoCastro854432
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataMarcoPoloSanchez1
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónsram0s
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionAlejandro Uribe Rodriguez
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataAlmudena Casado
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónDiego Farfan
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big datacnino6
 
Caso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatlCaso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatlFraniel Ricoveri
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónKozhaya Elias Sfeir
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresFrancoGotuzzo
 
Aplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónAplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónFernando Aguada
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosAngelGalindoQuintero
 

La actualidad más candente (19)

Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datos
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big data
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organización
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacion
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big data
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Caso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatlCaso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatl
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por pares
 
Big data ejercicio
Big data ejercicioBig data ejercicio
Big data ejercicio
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Aplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónAplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una Organización
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datos
 

Similar a Utilizando la ciencia de datos en una organización

Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaJosé Ignacio Mamani Murga
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data arcon412
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Paola Quiroz Alvarez
 
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaProyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaCamiloGonzlezBarrero
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdfJuan José Triviño
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individualFernandoss2
 
Ejercicio 1 Data Science
Ejercicio 1   Data ScienceEjercicio 1   Data Science
Ejercicio 1 Data ScienceDiaNa López
 

Similar a Utilizando la ciencia de datos en una organización (19)

Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
 
Ev pares
Ev paresEv pares
Ev pares
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
 
rh.docx
rh.docxrh.docx
rh.docx
 
Trabajo big data
Trabajo big data Trabajo big data
Trabajo big data
 
Proyecto de evaluación de pares
Proyecto de evaluación de paresProyecto de evaluación de pares
Proyecto de evaluación de pares
 
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaProyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Practica para Data Analítica Descriptiva
Practica para Data Analítica DescriptivaPractica para Data Analítica Descriptiva
Practica para Data Analítica Descriptiva
 
Ejercicio 1 Data Science
Ejercicio 1   Data ScienceEjercicio 1   Data Science
Ejercicio 1 Data Science
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 
Evaintro
EvaintroEvaintro
Evaintro
 
Project.docx
Project.docxProject.docx
Project.docx
 
Edx
EdxEdx
Edx
 

Último

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILAsofiagomez288291
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfjosellaqtas
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.pptssuserbdc329
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxHhJhv
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfJC Díaz Herrera
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 

Último (20)

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 

Utilizando la ciencia de datos en una organización

  • 1. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 1 Utilizando la Ciencia de Datos en una organización María Teresa Sánchez Sanz Introducción a la Ciencia de Datos y el Big Data Tecnológico de Monterrey EdX
  • 2. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 2 Resumen Utilizando los datos proporcionados por la Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México, analizamos las fuentes de información externas e internas de una organización a través de herramientas computacionales para generar un modelo basado en Ciencia de Datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. Palabras clave: Big data, Análisis, KPI’s
  • 3. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 3 Contenido Resumen.........................................................................................................................2 Utilizando la Ciencia de Datos en una organización .....................................................4 Datos proporcionados ....................................................................................................4 Indicadores.................................................................................................................4 Books .....................................................................................................................4 Top books...............................................................................................................5 Ratings ...................................................................................................................5 To read ...................................................................................................................5 KPI’s ..............................................................................................................................6 Relación de libros más valorados ..............................................................................6 Relación entre recomendaciones................................................................................6 Relación de libros según géneros y lenguaje de estos ...............................................6 De los más populares .............................................................................................6 Análisis y Estrategia ......................................................................................................7 Análisis Descriptivo...................................................................................................7 Ejemplos ................................................................................................................7 Decisiones a futuro: Análisis predictivo ....................................................................7 Ejemplos ................................................................................................................7 Conclusiones..................................................................................................................8
  • 4. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 4 Utilizando la Ciencia de Datos en una organización La empresa en cuestión según su perfil en LinkedIn, se dedica a la venta al por menor, en concreto a la distribución y comercialización de material bibliográfico a nivel nacional. Esta ubicada en Monterey, y Nuevo León, y cuenta con una página web https://www.edimsa.com.mx/. Parece ser que tiene diversas sucursales. Datos proporcionados Presentaremos los archivos ofrecidos por la librería, junto con una descripción de los datos contenidos en ellos. Los archivos ofrecidos se encuentran contenidos en la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books; top_books; raitings; to_read. Indicadores Books El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y compras del cliente. Datos contenidos en Books 1. Id - Identificador del registro 2. Book Id - Identificador del libro 3. Number Editions - Número de ediciones 4. ISBN - Clave estándar internacional del libro 5. ISBN13 - Clave estándar extendida internacional del libro 6. Authors - Autor del libro 7. Original Publication - Fecha de publicación 8. Original Title - Título original del libro 9. Title - Título del libro 10. Language Code - Clave de idioma del libro 11. Average Rating - Promedio de la clasificación del libro 12. Image - Enlace a la imagen de la portada del libro 13. Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
  • 5. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 5 Top books El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo con una clasificación general. Datos contenidos en Top Books 1. Position - Posición del libro en la clasificación del libro 2. ISBN - Clave estándar extendida internacional del libro 3. Title - Título del libro 4. Author - Autor del libro 5. Imprint - Editorial 6. Publisher Group - Grupo Editorial 7. Volume - Volumen de ventas hasta el 2010 8. Value - Ventas determinadas por el volumen 9. RRP - Precio recomendado para minoristas 10. ASP - Precio promedio para venta 11. Binding - Tipo de encuadernación 12. Publ Date - Fecha de publicación 13. Product Class - Clasificación del libro 14. Classification - Clasificación General del libro Ratings El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. Datos contenidos en Ratings 1. User Id - Identificador del cliente/usuario que clasifico un libro 2. Book Id - Identificador del libro. To read El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. Datos contenidos en To Read 1. User Id - Identificador del cliente/usuario que clasifico un libro 2. Book Id - Identificador del libro.
  • 6. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 6 KPI’s KPI’s son las siglas en inglés de Key Performance Indicators, es decir indicadores clave de desempeño. Los KPI’s utilizan diferentes métodos para reunir información del funcionamiento de la empresa. Con esta información se facilita la toma de decisiones. Relación de libros más valorados Este KPI nos indicará cuan popular un libro es, no solo por las valoraciones, si no también por el número de ellas. Así pues, dos mismas valoraciones medias no serían igual de valiosas si no tienen el mismo numero de personas que las han valorado, las que valoren más personas nos darán información más valiosa. Relación entre recomendaciones Entre las recomendaciones de los usuarios podemos sacar una relación entre libros, y así poder hacer recomendaciones similares a personas que busquen ciertos libros basado en las recomendaciones anteriores que han hecho anteriores usuarios. O ubicar los libros en las mismas estanterías o cercanas para que los usuarios similares los encuentren más fácilmente. Relación de libros según géneros y lenguaje de estos Este KPI nos indicará que lenguajes son populares en cada género. Primero analizaremos los lenguajes por genero de los más populares, y luego se debería de cotejar con la información de los disponibles en tienda (Aunque carecemos de la información de los géneros en los datos proporcionados). De los más populares Para ello utilizaremos El “ISBN” que se ha generado en el archivo “Top_books” de cada top 20 de libros y con este iremos al archivo “books” y seleccionaremos estos para obtener el “Language Code”. Con estos datos estudiamos la moda de los idiomas más populares por género.
  • 7. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 7 Análisis y Estrategia Análisis Descriptivo Con los datos proporcionados podemos hacer un análisis descriptivo de la librería, esta aportará una mejor comprensión del presente y del pasado de esta organizando los datos, por ejemplo, viendo que libros han sido los mejores valorados. Nos permite visualizar una dinámica de nuestro negocio, pudiendo ayudarnos a la toma de decisiones. Este será el más adecuado ya que la información que tenemos no es muy extensa y aunque se puede hacer un análisis predictivo no sería tan fiable teniendo en cuenta la falta de datos. Ejemplos Un ejemplo, sería utilizar la relación de los libros más valorados, ver el volumen de ventas del top de libros vendidos, etc. Decisiones a futuro: Análisis predictivo Si hablamos de que decisiones se podrían tomar estamos haciendo un análisis predictivo. Ejemplos Así pues, intentaríamos hacer recomendaciones en bases a otras recomendaciones similares, lo que haría que a priori las personas encontraran más fácilmente otros libros que podrían gustarle incrementando potencialmente las ventas, tanto físicamente si se colocan juntos o en la página web poner una sección de libros recomendados, o a futuro podríamos detectar cuales libros deberíamos escoger en que idiomas en base a los libros anteriormente comprados, o los más populares de su género. Estas recomendaciones a posteriori deberían crear nuevos datos y ver si estas recomendaciones realmente funcionan, o si escoger de antemano el idioma de los libros
  • 8. UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN 8 ayuda a que estos no queden en el almacén. Y de nuevo volver a crear unos nuevos datos, más exhaustivos. Conclusiones Los datos proporcionados en este informe son valiosos, pero se necesitaría una mejora de los datos, por ejemplo, con los precios de venta de los libros, no solo de los más vendidos, para hacer una comparativa, por ejemplo. También hacer encuestas de satisfacción, etc. Quien tiene la información tiene el poder, para analizar el presente y el pasado, y poder tomar las riendas de nuestro futuro.