SlideShare una empresa de Scribd logo
1 de 9
1
Aplicando la Ciencia
de Datos en una
organización
2021
JENNIFERMARLENE TORRES BARAJAS
1
ÍNDICE
o Objetivo e introducción …………………………...páginas 2,3 y 4
o Lenguaje de programación a utilizar………….. página 5
o Predicciones a obtener ……………………………… página 5
o Adecuaciones para realizar un análisis predictivo…. página 6
o Tipo de base de datos para alojar los análisis de los datos de
la Librería Iztaccihuatl…….. página 6
o Tipo de servicio de la nube que se puede contratar para la
información y ciencia de datos……….. página 7
o Conclusiones ……… página 8
2
OBJETIVO:
Identificar las herramientas necesarias para el análisis; estructuras de datos y
servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo
a la toma de decisiones para una organización.
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores
de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books;
top_books; raitings; to_read. Te recomendamos utilizar la herramienta Python para
analizar los datos que se te proporcionan.
Una vez analizada la información de la carpeta “datasets_books” deberás presentar en un
documento Word la respuesta a las siguientes preguntas:
 ¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis
de datos de la Librería Iztaccihuatl?
 ¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccihuatl?
 ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para poder
realizar un análisis predictivo?
 ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería
Iztaccihuatl?
 ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la
información y el proyecto de ciencia de datos?
El archivo “books” contiene los siguientes datos:
 Id - Identificador del registro
 Book Id - Identificador del libro
 Number Editions - Número de ediciones
 ISBN - Clave estándar internacional del libro
3
 ISBN13 - Clave estándar extendida internacional del libro
 Authors - Autor del libro
 Original Publication - Fecha de publicación
 Original Title - Título original del libro
 Title - Título del libro
 Language Code - Clave de idioma del libro
 Average Rating - Promedio de la clasificación del libro
 Image - Enlace a la imagen de la portada del libro
 Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene los siguientes datos:
 Position - Posición del libro en la clasificación del libro
 ISBN - Clave estándar extendida internacional del libro
 Title - Título del libro
 Author - Autor del libro
 Imprint - Editorial
 Publisher Group - Grupo Editorial
 Volume - Volumen de ventas hasta el 2010
 Value - Ventas determinadas por el volumen
 RRP - Precio recomendado para minoristas
 ASP - Precio promedio para venta
 Binding - Tipo de encuadernación
 Publ Date - Fecha de publicación
 Product Class - Clasificación del libro
 Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
4
 Book Id - Identificador del libro
 User Id - Identificador del cliente/usuario que clasifico un libro
 Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
 User Id - Identificador del cliente/usuario que clasifico un libro
 Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y
compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una
clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del
sitio web de la librería.
El archivo “to read” contiene las recomendaciones que cada cliente o usuario realiza en el
sitio web sobre libros para leer.
De acuerdo a la información con la que se cuenta, contenida en la carpeta “datasets
books”, y al contenido del curso, se buscará plantear las mejores alternativas de solución
al proyecto de ciencia de datos de la Librería Iztaccihuatl
5
Para realizar el análisis de datos de la Librería Iztaccihuati recomendaría utilizar el lenguaje
de programación Python, que funciona en cualquier tipo de sistema que integre su
interpretador, es software libre y nos ofrece código abierto, aparte de tener una
comunidad de soporte acogedora y estable. Entre las tareas en las que se puede utilizar
tenemos:
• Desarrollo Web
• Codificación
• Recolección automática de datos de sitios web
• Análisis de los datos
• Automatización
Además, ostenta una gran lista de usuarios de gran calibre como Google, YouTube o
Facebook.
Tomando en cuenta que uno de los campos de aplicación más prometedores de la
inteligencia artificial es el e-commerce, podríamos considerar las siguientes
predicciones:
• Identificar las tendencias de géneros de libros (salud, romances, informática, etc.) que
serán más rentables en el corto, mediano y largo plazo.
• Inferir que libros dejarán de ser atractivos para el
Público consumidor.
Optimización de campañas de marketing para determinar la respuesta de los clientes a
campañas de marketing o patrones de compra.
• Precios de los servicios de la librería en función de la estacionalidad lo que ayuda a
mejorar operaciones para administrar mejor el inventario y otros recursos.
 Optimización de campañas de marketing para
LENGUAJEDE PROGRAMACIóNA UTLIZAR
PREDICCIONES A OBTENER
6
Para adecuar la base de datos de la Librería Iztaccihuatl y poder realizar un análisis
predictivo se pueden utilizar técnicas analíticas, estadísticas y de aprendizaje
automático a fin de crear un modelo predictivo para predecir eventos futuros.
El término “análisis predictivo” describe la aplicación de una técnica estadística o de
aprendizaje automático para crear una predicción cuantitativa sobre el futuro. Con
frecuencia, se utilizan técnicas de aprendizaje automático supervisado para predecir un
valor futuro o para calcular una probabilidad. El proceso emplea muchas veces
conjuntos de datos heterogéneos, a menudo masivos, en modelos que pueden generar
resultados claros y permiten actuar sobre ellos con el objetivo de lograr el resultado
deseado.
El tipo de base de datos (BD) que se utilizaría para alojar los análisis de datos de la Librería
Iztaccihuati sería una base de datos NoSQL orientada a Documentos.
En este tipo de BD Se guardan documentos que soportan diferentes formatos (JSON,
XML). Se pueden cambiar esquemas sin parar las bases de datos y los
desarrolladores pueden meter documentos indexados y con acceso por el motor de
base de datos fácilmente.
Entre este tipo de BD tenemos Mongo DB, la cual es probablemente la base de
datos más popular. Tiene la posibilidad de trabajar con datos estructurados y no
estructurados. Destaca por su gran capacidad de escalado y rendimiento y suele ser la
que más perfiles experimentados tiene.
ADECUACIONESPARA REALIZAR UN ANALISIS
PREDICTIVO
TIPO DE BASE DE DATOS PARA ALOJAR LOS ANALISISDE
LOS DATOS EN LALIBRERIA IZTACCIHUALT
7
El tipo de servicio de la nube que podría contratar la Librería Iztaccihuati para alojar
información y su proyecto de ciencia de datos es la nube hibrida, la cual combina
Infraestructura local (o nubes privadas) con nubes públicas, de modo que la librería
pueda beneficiarse de las ventajas de ambas.
En una nube híbrida, los datos y las aplicaciones pueden moverse entre nubes privadas
y públicas para obtener más flexibilidad y opciones de implementación y cuenta
con la opción de "ampliación en la nube". Esto se refiere a cuando una aplicación o
recurso se ejecutan en la nube privada hasta que se produce una subida en la demanda.
En este punto, la organización puede "ampliarse" hacia la nube pública para aprovechar
más recursos informáticos.
Entre las ventajas de la nube hibrida tenemos:
• Flexibilidad: se puede aprovechar recursos adicionales de la nube pública.
• Control: se puede mantener una infraestructura privada para los recursos
confidenciales.
• Rentabilidad: gracias a la posibilidad de escalar a la nube pública, solo pagará por la
capacidad informática adicional cuando sea necesaria.
• Facilidad: se puede realizar una migración gradual; es decir, trasladando cargas de
trabajo en etapas.
TIPO DE SERVIVIO DE LA NUBE QUE SE PUEDE
CONTRATAR PARA LA INFORMORMACIONY LA
CIENCIADE DATOS
8
Los cambios tecnológicos permiten que los negocios sean más flexibles y adaptables a las
necesidades de los clientes. En el caso de la Librería Iztaccihuat su proyecto de
ciencia de datos es una oportunidad de mantenerse y crecer en el mercado de libros.
 El análisis predictivo describe la aplicación de una
El análisis predictivo describe la aplicación de una técnica estadística o de aprendizaje
automático para crear una predicción cuantitativa sobre el futuro. Con frecuencia, se
utilizan técnicas de aprendizaje automático supervisado para predecir un valor futuro
o para calcular una probabilidad, por lo que el uso de lenguajes de programación como
Python o R facilitan mucho su implementación.
 La posibilidad de trabajar con datos estructurados y no
La posibilidad de trabajar con datos estructurados, permitiría a la Liberia Iztaccihuat
aprovechar los diferentes tipos de datos relacionados al comercio de libros y optimizar
sus decisiones de negocio.
 El uso de nuevas tecnologías para el uso de BD permite
El uso de nuevas tecnologías para el uso de BD permite que se presenten nuevas
oportunidades de negocio para la librería Iztaccihuat, como la venta de libros
digitales para lo cual se debería empezar por conocer y recoger data de este tipo de
mercado, y aprovechar que se contaría con una nube hibrida para el manejo
de la data.
CONCLUSIONES:

Más contenido relacionado

La actualidad más candente

Aplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una OrganizaciónAplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una OrganizaciónCarlosMacarlup
 
Caso libreria - herramientas para el análisis de big data - edx
Caso libreria - herramientas para el análisis de big data - edxCaso libreria - herramientas para el análisis de big data - edx
Caso libreria - herramientas para el análisis de big data - edxSebastiaFerran
 
Proyecto Evaluación entre Pares
Proyecto Evaluación entre ParesProyecto Evaluación entre Pares
Proyecto Evaluación entre ParesOlgaMaraGarzaSilva
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datosAlejandro Moyano
 
Mapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataMapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataJosé Rosales
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datosAlejandro Moyano
 
Informacion en la red
Informacion en la redInformacion en la red
Informacion en la redRosangel Diaz
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datosAsael Bravo
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.LeonardoGutierrezDal
 
Actividad software vantage point (1)
Actividad software vantage point (1)Actividad software vantage point (1)
Actividad software vantage point (1)milebote
 

La actualidad más candente (18)

Aplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una OrganizaciónAplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una Organización
 
Caso libreria - herramientas para el análisis de big data - edx
Caso libreria - herramientas para el análisis de big data - edxCaso libreria - herramientas para el análisis de big data - edx
Caso libreria - herramientas para el análisis de big data - edx
 
Proyecto Evaluación entre Pares
Proyecto Evaluación entre ParesProyecto Evaluación entre Pares
Proyecto Evaluación entre Pares
 
evaluacion por pares
evaluacion por paresevaluacion por pares
evaluacion por pares
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
Proyecto de evaluación de pares
Proyecto de evaluación de paresProyecto de evaluación de pares
Proyecto de evaluación de pares
 
Curso
CursoCurso
Curso
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Biblioteca Virtual
Biblioteca VirtualBiblioteca Virtual
Biblioteca Virtual
 
Mapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataMapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigData
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
Informacion en la red
Informacion en la redInformacion en la red
Informacion en la red
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
producto integrador
producto integradorproducto integrador
producto integrador
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.
 
Actividad software vantage point (1)
Actividad software vantage point (1)Actividad software vantage point (1)
Actividad software vantage point (1)
 

Similar a Aplicando la Ciencia de Datos en una organización

Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxLambofgod1993
 
Trabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaTrabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaCamilo Sanhueza Nuñez
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlPaola Quiroz Alvarez
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfCarlosChin
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individualFernandoss2
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataMarcoPoloSanchez1
 
Trabajo de herramientas para la ciencia de datos evaluado por pares
Trabajo de herramientas para la ciencia de datos evaluado por paresTrabajo de herramientas para la ciencia de datos evaluado por pares
Trabajo de herramientas para la ciencia de datos evaluado por paresFrancoGotuzzo
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big datacnino6
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.HugoCastro854432
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata
 
Herramientas de business intelligence
Herramientas de business intelligenceHerramientas de business intelligence
Herramientas de business intelligenceLeonel Ibarra
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por paresRENE RGUEZ GLEZ
 

Similar a Aplicando la Ciencia de Datos en una organización (19)

Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docx
 
Reporte_practica_2.pdf
Reporte_practica_2.pdfReporte_practica_2.pdf
Reporte_practica_2.pdf
 
Trabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaTrabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhueza
 
Proyecto Jaime Salinas
Proyecto Jaime SalinasProyecto Jaime Salinas
Proyecto Jaime Salinas
 
edx caso.docx
edx caso.docxedx caso.docx
edx caso.docx
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
 
Trabajo curso.docx
Trabajo curso.docxTrabajo curso.docx
Trabajo curso.docx
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datos
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big data
 
Trabajo de herramientas para la ciencia de datos evaluado por pares
Trabajo de herramientas para la ciencia de datos evaluado por paresTrabajo de herramientas para la ciencia de datos evaluado por pares
Trabajo de herramientas para la ciencia de datos evaluado por pares
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Proyecto Jaime Salinas
Proyecto Jaime SalinasProyecto Jaime Salinas
Proyecto Jaime Salinas
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData Company
 
Herramientas de business intelligence
Herramientas de business intelligenceHerramientas de business intelligence
Herramientas de business intelligence
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares
 

Último

METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTOMETODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTOJoselynGoeTmara
 
Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024OBSERVATORIOREGIONAL
 
4° UNIDAD DE APRENDIZAJE 2 MAYO 2024.docx
4°  UNIDAD DE APRENDIZAJE 2 MAYO  2024.docx4°  UNIDAD DE APRENDIZAJE 2 MAYO  2024.docx
4° UNIDAD DE APRENDIZAJE 2 MAYO 2024.docxquispeloco65
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...JC Díaz Herrera
 
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
Unidad 6 estadística 2011  TABLA DE FRECUENCIAUnidad 6 estadística 2011  TABLA DE FRECUENCIA
Unidad 6 estadística 2011 TABLA DE FRECUENCIAEduardo Ferreira
 
Asignatura-Optativa-Sociologia-CS-3BGU.pdf
Asignatura-Optativa-Sociologia-CS-3BGU.pdfAsignatura-Optativa-Sociologia-CS-3BGU.pdf
Asignatura-Optativa-Sociologia-CS-3BGU.pdfEdhyLeons
 
Mapa concepto sobre la contabilidad de costos
Mapa concepto sobre la contabilidad de costosMapa concepto sobre la contabilidad de costos
Mapa concepto sobre la contabilidad de costosrojasluisana203
 
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀LALVAREZD
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfLizRamirez182254
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024IrapuatoCmovamos
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024OBSERVATORIOREGIONAL
 
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdfProyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdfnicolas24233
 
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdfantonio206446
 
presentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptx
presentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptxpresentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptx
presentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptxJacqueline575061
 
Problemas de programación lineal entera.pptx
Problemas de programación lineal entera.pptxProblemas de programación lineal entera.pptx
Problemas de programación lineal entera.pptxJuarezGarciaOsvaldoJ
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxfatimacamilainjantem
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxlm8322074
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeklebersky23
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 

Último (20)

METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTOMETODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
 
Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024
 
4° UNIDAD DE APRENDIZAJE 2 MAYO 2024.docx
4°  UNIDAD DE APRENDIZAJE 2 MAYO  2024.docx4°  UNIDAD DE APRENDIZAJE 2 MAYO  2024.docx
4° UNIDAD DE APRENDIZAJE 2 MAYO 2024.docx
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
Unidad 6 estadística 2011  TABLA DE FRECUENCIAUnidad 6 estadística 2011  TABLA DE FRECUENCIA
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
 
Asignatura-Optativa-Sociologia-CS-3BGU.pdf
Asignatura-Optativa-Sociologia-CS-3BGU.pdfAsignatura-Optativa-Sociologia-CS-3BGU.pdf
Asignatura-Optativa-Sociologia-CS-3BGU.pdf
 
Mapa concepto sobre la contabilidad de costos
Mapa concepto sobre la contabilidad de costosMapa concepto sobre la contabilidad de costos
Mapa concepto sobre la contabilidad de costos
 
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024
 
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdfProyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
 
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
 
presentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptx
presentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptxpresentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptx
presentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptx
 
Problemas de programación lineal entera.pptx
Problemas de programación lineal entera.pptxProblemas de programación lineal entera.pptx
Problemas de programación lineal entera.pptx
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclaje
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 

Aplicando la Ciencia de Datos en una organización

  • 1. 1 Aplicando la Ciencia de Datos en una organización 2021 JENNIFERMARLENE TORRES BARAJAS
  • 2. 1 ÍNDICE o Objetivo e introducción …………………………...páginas 2,3 y 4 o Lenguaje de programación a utilizar………….. página 5 o Predicciones a obtener ……………………………… página 5 o Adecuaciones para realizar un análisis predictivo…. página 6 o Tipo de base de datos para alojar los análisis de los datos de la Librería Iztaccihuatl…….. página 6 o Tipo de servicio de la nube que se puede contratar para la información y ciencia de datos……….. página 7 o Conclusiones ……… página 8
  • 3. 2 OBJETIVO: Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización. La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books; top_books; raitings; to_read. Te recomendamos utilizar la herramienta Python para analizar los datos que se te proporcionan. Una vez analizada la información de la carpeta “datasets_books” deberás presentar en un documento Word la respuesta a las siguientes preguntas:  ¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis de datos de la Librería Iztaccihuatl?  ¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccihuatl?  ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para poder realizar un análisis predictivo?  ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería Iztaccihuatl?  ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la información y el proyecto de ciencia de datos? El archivo “books” contiene los siguientes datos:  Id - Identificador del registro  Book Id - Identificador del libro  Number Editions - Número de ediciones  ISBN - Clave estándar internacional del libro
  • 4. 3  ISBN13 - Clave estándar extendida internacional del libro  Authors - Autor del libro  Original Publication - Fecha de publicación  Original Title - Título original del libro  Title - Título del libro  Language Code - Clave de idioma del libro  Average Rating - Promedio de la clasificación del libro  Image - Enlace a la imagen de la portada del libro  Small Image - Enlace a la imagen en versión optimizada de la portada del libro. El archivo “top_books” contiene los siguientes datos:  Position - Posición del libro en la clasificación del libro  ISBN - Clave estándar extendida internacional del libro  Title - Título del libro  Author - Autor del libro  Imprint - Editorial  Publisher Group - Grupo Editorial  Volume - Volumen de ventas hasta el 2010  Value - Ventas determinadas por el volumen  RRP - Precio recomendado para minoristas  ASP - Precio promedio para venta  Binding - Tipo de encuadernación  Publ Date - Fecha de publicación  Product Class - Clasificación del libro  Classification - Clasificación General del libro El archivo “ratings” contiene los siguientes datos:
  • 5. 4  Book Id - Identificador del libro  User Id - Identificador del cliente/usuario que clasifico un libro  Rating - Nivel de clasificación del libro. El archivo “to_read” contiene los siguientes datos:  User Id - Identificador del cliente/usuario que clasifico un libro  Book Id - Identificador del libro El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente. El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación general. El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería. El archivo “to read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. De acuerdo a la información con la que se cuenta, contenida en la carpeta “datasets books”, y al contenido del curso, se buscará plantear las mejores alternativas de solución al proyecto de ciencia de datos de la Librería Iztaccihuatl
  • 6. 5 Para realizar el análisis de datos de la Librería Iztaccihuati recomendaría utilizar el lenguaje de programación Python, que funciona en cualquier tipo de sistema que integre su interpretador, es software libre y nos ofrece código abierto, aparte de tener una comunidad de soporte acogedora y estable. Entre las tareas en las que se puede utilizar tenemos: • Desarrollo Web • Codificación • Recolección automática de datos de sitios web • Análisis de los datos • Automatización Además, ostenta una gran lista de usuarios de gran calibre como Google, YouTube o Facebook. Tomando en cuenta que uno de los campos de aplicación más prometedores de la inteligencia artificial es el e-commerce, podríamos considerar las siguientes predicciones: • Identificar las tendencias de géneros de libros (salud, romances, informática, etc.) que serán más rentables en el corto, mediano y largo plazo. • Inferir que libros dejarán de ser atractivos para el Público consumidor. Optimización de campañas de marketing para determinar la respuesta de los clientes a campañas de marketing o patrones de compra. • Precios de los servicios de la librería en función de la estacionalidad lo que ayuda a mejorar operaciones para administrar mejor el inventario y otros recursos.  Optimización de campañas de marketing para LENGUAJEDE PROGRAMACIóNA UTLIZAR PREDICCIONES A OBTENER
  • 7. 6 Para adecuar la base de datos de la Librería Iztaccihuatl y poder realizar un análisis predictivo se pueden utilizar técnicas analíticas, estadísticas y de aprendizaje automático a fin de crear un modelo predictivo para predecir eventos futuros. El término “análisis predictivo” describe la aplicación de una técnica estadística o de aprendizaje automático para crear una predicción cuantitativa sobre el futuro. Con frecuencia, se utilizan técnicas de aprendizaje automático supervisado para predecir un valor futuro o para calcular una probabilidad. El proceso emplea muchas veces conjuntos de datos heterogéneos, a menudo masivos, en modelos que pueden generar resultados claros y permiten actuar sobre ellos con el objetivo de lograr el resultado deseado. El tipo de base de datos (BD) que se utilizaría para alojar los análisis de datos de la Librería Iztaccihuati sería una base de datos NoSQL orientada a Documentos. En este tipo de BD Se guardan documentos que soportan diferentes formatos (JSON, XML). Se pueden cambiar esquemas sin parar las bases de datos y los desarrolladores pueden meter documentos indexados y con acceso por el motor de base de datos fácilmente. Entre este tipo de BD tenemos Mongo DB, la cual es probablemente la base de datos más popular. Tiene la posibilidad de trabajar con datos estructurados y no estructurados. Destaca por su gran capacidad de escalado y rendimiento y suele ser la que más perfiles experimentados tiene. ADECUACIONESPARA REALIZAR UN ANALISIS PREDICTIVO TIPO DE BASE DE DATOS PARA ALOJAR LOS ANALISISDE LOS DATOS EN LALIBRERIA IZTACCIHUALT
  • 8. 7 El tipo de servicio de la nube que podría contratar la Librería Iztaccihuati para alojar información y su proyecto de ciencia de datos es la nube hibrida, la cual combina Infraestructura local (o nubes privadas) con nubes públicas, de modo que la librería pueda beneficiarse de las ventajas de ambas. En una nube híbrida, los datos y las aplicaciones pueden moverse entre nubes privadas y públicas para obtener más flexibilidad y opciones de implementación y cuenta con la opción de "ampliación en la nube". Esto se refiere a cuando una aplicación o recurso se ejecutan en la nube privada hasta que se produce una subida en la demanda. En este punto, la organización puede "ampliarse" hacia la nube pública para aprovechar más recursos informáticos. Entre las ventajas de la nube hibrida tenemos: • Flexibilidad: se puede aprovechar recursos adicionales de la nube pública. • Control: se puede mantener una infraestructura privada para los recursos confidenciales. • Rentabilidad: gracias a la posibilidad de escalar a la nube pública, solo pagará por la capacidad informática adicional cuando sea necesaria. • Facilidad: se puede realizar una migración gradual; es decir, trasladando cargas de trabajo en etapas. TIPO DE SERVIVIO DE LA NUBE QUE SE PUEDE CONTRATAR PARA LA INFORMORMACIONY LA CIENCIADE DATOS
  • 9. 8 Los cambios tecnológicos permiten que los negocios sean más flexibles y adaptables a las necesidades de los clientes. En el caso de la Librería Iztaccihuat su proyecto de ciencia de datos es una oportunidad de mantenerse y crecer en el mercado de libros.  El análisis predictivo describe la aplicación de una El análisis predictivo describe la aplicación de una técnica estadística o de aprendizaje automático para crear una predicción cuantitativa sobre el futuro. Con frecuencia, se utilizan técnicas de aprendizaje automático supervisado para predecir un valor futuro o para calcular una probabilidad, por lo que el uso de lenguajes de programación como Python o R facilitan mucho su implementación.  La posibilidad de trabajar con datos estructurados y no La posibilidad de trabajar con datos estructurados, permitiría a la Liberia Iztaccihuat aprovechar los diferentes tipos de datos relacionados al comercio de libros y optimizar sus decisiones de negocio.  El uso de nuevas tecnologías para el uso de BD permite El uso de nuevas tecnologías para el uso de BD permite que se presenten nuevas oportunidades de negocio para la librería Iztaccihuat, como la venta de libros digitales para lo cual se debería empezar por conocer y recoger data de este tipo de mercado, y aprovechar que se contaría con una nube hibrida para el manejo de la data. CONCLUSIONES: