SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
INTRODUCCIÓN A LA CIENCIA DE DATOS y BIGDATA
CASO
UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGAMIZACIÓN
PRESENTADO POR
Hugo Rodríguez Castillo
Lima, Julio 2021
2
Contenido
Introducción.......................................................................................................... 3
1. Descripción del caso......................................................................................... 4
2. Identificación de Indicadores............................................................................ 6
3. Tipo de Análisis Elaborado .............................................................................. 6
4. Propuesta........................................................................................................... 6
5. Conclusiones..................................................................................................... 7
3
Introducción
El presente informe permite identificar los pasos necesarios para utilizar la
ciencia de datos como proceso de soporte de decisiones en una determinada área de
negocio, analizando fuentes de información externas e internas mediante herramientas
computacionales.
En este caso se cuenta con información histórica de la librería Iztaccihuatl
ubicada en la ciudad de Monterrey, la cual servirá como referencia para definir los
indicadores más importantes, el análisis que mejor se ajusta y los resultados que se
puedan proponer luego del análisis respectivo de los datos.
4
1. Descripción del caso
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León,
México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma
de decisiones. La información disponible se encuentra en los siguientes archivos:
• El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de
acuerdo con las votaciones y compras del cliente. La estructura de este archivo
es la siguiente:
o Id - Identificador del registro
o Book Id - Identificador del libro
o Number Editions - Número de ediciones
o ISBN - Clave estándar internacional del libro
o ISBN13 - Clave estándar extendida internacional del libro
o Authors - Autor del libro
o Original Publication - Fecha de publicación
o Original Title - Título original del libro
o Title - Título del libro
o Language Code - Clave de idioma del libro
o Average Rating - Promedio de la clasificación del libro
o Image - Enlace a la imagen de la portada del libro
o Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
• El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo
con una clasificación general. La estructura de este archivo es la siguiente:
5
o Position - Posición del libro en la clasificación del libro
o ISBN - Clave estándar extendida internacional del libro
o Title - Título del libro
o Author - Autor del libro
o Imprint - Editorial
o Publisher Group - Grupo Editorial
o Volume - Volumen de ventas hasta el 2010
o Value - Ventas determinadas por el volumen
o RRP - Precio recomendado para minoristas
o ASP - Precio promedio para venta
o Binding - Tipo de encuadernación
o Publ Date - Fecha de publicación
o Product Class - Clasificación del libro
o Classification - Clasificación General del libro
• El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería. La estructura de este archivo es la siguiente:
o Book Id - Identificador del libro
o User Id - Identificador del cliente/usuario que clasifico un libro
o Rating - Nivel de clasificación del libro.
• El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer. La estructura de este archivo es la
siguiente:
o User Id - Identificador del cliente/usuario que clasifico un libro
o Book Id - Identificador del libro
6
2. Identificación de Indicadores
De acuerdo con la información recopilada, podemos identificar a los siguientes
indicadores como los más importantes:
• Cantidad y lista de títulos de libros más recomendados para leer por los clientes.
• Cantidad y lista de autores más recomendados para leer por los clientes.
• Los tops 10 libros más votados por los clientes dentro del sitio web de la
librería.
• Los tops 10 libros no recomendados por los clientes dentro del sitio web de la
librería.
• La cantidad de clientes únicos que visitaron el sitio web de la librería para
recomendar algún libro.
3. Tipo de Análisis Elaborado
La información obtenida muestra solo la información histórica del negocio, por
lo cual el análisis descriptivo es el que más se ajusta. Este nos permitirá responder a la
pregunta "¿Qué pasó en el pasado con el negocio?". Se requieren de mayores datos para
complementar y poder aplicar la analítica predictiva ("¿qué va a pasar probablemente en
el futuro?") y la analítica prescriptiva que intenta responder a la pregunta: "¿Y ahora
qué?" O "¿Qué se puede hacer para evitarlo?".
4. Propuesta
Fidelización de clientes: para incentivar el tráfico de la página web se propone
entregar un bono o descuento a los clientes que recomienden un título y este tenga
buena acogida en el período respectivo.
7
5. Conclusiones
La ciencia de datos cada vez tiene mas relevancia en las organizaciones y nos
permite transformar los datos en información de valor con lo cual se pueden tomar
mejores decisiones en la dirección de una organización.

Más contenido relacionado

Similar a Trabajo introducción a la ciencia de datos

Similar a Trabajo introducción a la ciencia de datos (20)

Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data Introducción a la ciencia de datos y el bg data
Introducción a la ciencia de datos y el bg data
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Utilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organizaciónUtilizando la Ciencia de Datos en una organización
Utilizando la Ciencia de Datos en una organización
 
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares
 
Ev pares
Ev paresEv pares
Ev pares
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Practica Big Data
Practica Big DataPractica Big Data
Practica Big Data
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 
Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docx
 

Último

Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación Latinoamerica
EdwinGarca59
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
Yanitza28
 
microsoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamtemicrosoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamte
2024020140
 

Último (20)

Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación Latinoamerica
 
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
 
De Olmos Santiago_Dolores _ M1S3AI6.pptx
De Olmos Santiago_Dolores _ M1S3AI6.pptxDe Olmos Santiago_Dolores _ M1S3AI6.pptx
De Olmos Santiago_Dolores _ M1S3AI6.pptx
 
Imágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la informaciónImágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la información
 
Navegadores de internet - Nuevas Tecnologías de la Información y la Comunicación
Navegadores de internet - Nuevas Tecnologías de la Información y la ComunicaciónNavegadores de internet - Nuevas Tecnologías de la Información y la Comunicación
Navegadores de internet - Nuevas Tecnologías de la Información y la Comunicación
 
presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...
 
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptxinfor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
 
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptxTarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
 
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
 
microsoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamtemicrosoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamte
 
Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024
 
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptxTipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
 
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdfpresentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
 
Editorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdfEditorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdf
 
10°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-810°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-8
 
el uso de las TIC en la vida cotidiana.pptx
el uso de las TIC en la vida cotidiana.pptxel uso de las TIC en la vida cotidiana.pptx
el uso de las TIC en la vida cotidiana.pptx
 
herramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el temaherramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el tema
 
Redes Neuronales profundas convolucionales CNN ́s-1.pdf
Redes Neuronales profundas convolucionales CNN ́s-1.pdfRedes Neuronales profundas convolucionales CNN ́s-1.pdf
Redes Neuronales profundas convolucionales CNN ́s-1.pdf
 
BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).
 

Trabajo introducción a la ciencia de datos

  • 1. INTRODUCCIÓN A LA CIENCIA DE DATOS y BIGDATA CASO UTILIZANDO LA CIENCIA DE DATOS EN UNA ORGAMIZACIÓN PRESENTADO POR Hugo Rodríguez Castillo Lima, Julio 2021
  • 2. 2 Contenido Introducción.......................................................................................................... 3 1. Descripción del caso......................................................................................... 4 2. Identificación de Indicadores............................................................................ 6 3. Tipo de Análisis Elaborado .............................................................................. 6 4. Propuesta........................................................................................................... 6 5. Conclusiones..................................................................................................... 7
  • 3. 3 Introducción El presente informe permite identificar los pasos necesarios para utilizar la ciencia de datos como proceso de soporte de decisiones en una determinada área de negocio, analizando fuentes de información externas e internas mediante herramientas computacionales. En este caso se cuenta con información histórica de la librería Iztaccihuatl ubicada en la ciudad de Monterrey, la cual servirá como referencia para definir los indicadores más importantes, el análisis que mejor se ajusta y los resultados que se puedan proponer luego del análisis respectivo de los datos.
  • 4. 4 1. Descripción del caso La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. La información disponible se encuentra en los siguientes archivos: • El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo con las votaciones y compras del cliente. La estructura de este archivo es la siguiente: o Id - Identificador del registro o Book Id - Identificador del libro o Number Editions - Número de ediciones o ISBN - Clave estándar internacional del libro o ISBN13 - Clave estándar extendida internacional del libro o Authors - Autor del libro o Original Publication - Fecha de publicación o Original Title - Título original del libro o Title - Título del libro o Language Code - Clave de idioma del libro o Average Rating - Promedio de la clasificación del libro o Image - Enlace a la imagen de la portada del libro o Small Image - Enlace a la imagen en versión optimizada de la portada del libro. • El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo con una clasificación general. La estructura de este archivo es la siguiente:
  • 5. 5 o Position - Posición del libro en la clasificación del libro o ISBN - Clave estándar extendida internacional del libro o Title - Título del libro o Author - Autor del libro o Imprint - Editorial o Publisher Group - Grupo Editorial o Volume - Volumen de ventas hasta el 2010 o Value - Ventas determinadas por el volumen o RRP - Precio recomendado para minoristas o ASP - Precio promedio para venta o Binding - Tipo de encuadernación o Publ Date - Fecha de publicación o Product Class - Clasificación del libro o Classification - Clasificación General del libro • El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. La estructura de este archivo es la siguiente: o Book Id - Identificador del libro o User Id - Identificador del cliente/usuario que clasifico un libro o Rating - Nivel de clasificación del libro. • El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. La estructura de este archivo es la siguiente: o User Id - Identificador del cliente/usuario que clasifico un libro o Book Id - Identificador del libro
  • 6. 6 2. Identificación de Indicadores De acuerdo con la información recopilada, podemos identificar a los siguientes indicadores como los más importantes: • Cantidad y lista de títulos de libros más recomendados para leer por los clientes. • Cantidad y lista de autores más recomendados para leer por los clientes. • Los tops 10 libros más votados por los clientes dentro del sitio web de la librería. • Los tops 10 libros no recomendados por los clientes dentro del sitio web de la librería. • La cantidad de clientes únicos que visitaron el sitio web de la librería para recomendar algún libro. 3. Tipo de Análisis Elaborado La información obtenida muestra solo la información histórica del negocio, por lo cual el análisis descriptivo es el que más se ajusta. Este nos permitirá responder a la pregunta "¿Qué pasó en el pasado con el negocio?". Se requieren de mayores datos para complementar y poder aplicar la analítica predictiva ("¿qué va a pasar probablemente en el futuro?") y la analítica prescriptiva que intenta responder a la pregunta: "¿Y ahora qué?" O "¿Qué se puede hacer para evitarlo?". 4. Propuesta Fidelización de clientes: para incentivar el tráfico de la página web se propone entregar un bono o descuento a los clientes que recomienden un título y este tenga buena acogida en el período respectivo.
  • 7. 7 5. Conclusiones La ciencia de datos cada vez tiene mas relevancia en las organizaciones y nos permite transformar los datos en información de valor con lo cual se pueden tomar mejores decisiones en la dirección de una organización.