l presente documento busca identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización.
Este proyecto trae consigo el poder analizar y saber donde se llega a aplicar las Ciencia de Datos ,es muy interesante , lo publico aquí ya que estoy en un curso en el cual me pide desenglosar todo lo aprendió y esta es una manera de poder plasmar.
Este documento describe los datos disponibles sobre libros y clientes de la librería Iztaccihuatl. Los archivos contienen información sobre libros individuales, los más vendidos, calificaciones de clientes y recomendaciones. Se plantean preguntas sobre qué lenguaje de programación, predicciones y mejoras de datos se podrían utilizar para realizar análisis predictivos. Se concluye que se necesita un lenguaje como Python o R, limpiar y normalizar los datos, usar una base de datos flexible en la nube y comparar servicios en la nube.
Este documento describe el enfoque para adoptar la ciencia de datos en la Librería Iztaccihuatl. Se procesarán datos de ventas, calificaciones y preferencias de lectura usando Python para generar recomendaciones personalizadas y predecir tendencias. Los datos se almacenarán en una base de datos PostgreSQL en la nube de Azure. Esto permitirá optimizar el inventario, diseñar programas de fidelización y realizar campañas de marketing dirigidas.
La Librería Iztaccihuatl en Monterrey, México desea desarrollar un proyecto de ciencia de datos para mejorar sus KPIs y la toma de decisiones. Se proporcionan cuatro archivos de datos sobre libros, los más vendidos, calificaciones y recomendaciones de lectura para su análisis con Python. El objetivo es predecir las preferencias de los clientes y mejorar el catálogo mediante el análisis de estos datos.
Este documento describe los datos disponibles de la Librería Iztaccihuatl y propone respuestas a preguntas sobre el análisis de datos y ciencia de datos de la librería. Se recomienda utilizar Python para el análisis, predecir ventas futuras mediante regresión lineal e identificar segmentos de clientes mediante agrupamiento. También se sugiere transformar los datos de ventas a transaccionales y utilizar una base de datos SQL y el servicio GitHub para el proyecto de ciencia de datos.
EDX: Curso Herramientas para el Análisis de Big Data – Tecnológico de Monterrey PROYECTO INDIVIDUAL EVALUADO POR PARES Caso libreria iztaccihuatl Creado por: Paola Quiroz Alvarez Guayaquil - Ecuador
Aplicando Ciencia de Datos en una OrganizaciónCarlosMacarlup
Este documento describe cómo la Librería Iztaccihuatl podría implementar un proyecto de ciencia de datos para mejorar sus indicadores de desempeño. Se recomienda contratar un servicio de nube pública para alojar la información y el proyecto, utilizar una base de datos relacional inicialmente y considerar una base de datos NoSQL en el futuro. Para realizar el análisis de datos se sugiere utilizar Python debido a su popularidad para ciencia de datos y facilidad de uso.
Este proyecto trae consigo el poder analizar y saber donde se llega a aplicar las Ciencia de Datos ,es muy interesante , lo publico aquí ya que estoy en un curso en el cual me pide desenglosar todo lo aprendió y esta es una manera de poder plasmar.
Este documento describe los datos disponibles sobre libros y clientes de la librería Iztaccihuatl. Los archivos contienen información sobre libros individuales, los más vendidos, calificaciones de clientes y recomendaciones. Se plantean preguntas sobre qué lenguaje de programación, predicciones y mejoras de datos se podrían utilizar para realizar análisis predictivos. Se concluye que se necesita un lenguaje como Python o R, limpiar y normalizar los datos, usar una base de datos flexible en la nube y comparar servicios en la nube.
Este documento describe el enfoque para adoptar la ciencia de datos en la Librería Iztaccihuatl. Se procesarán datos de ventas, calificaciones y preferencias de lectura usando Python para generar recomendaciones personalizadas y predecir tendencias. Los datos se almacenarán en una base de datos PostgreSQL en la nube de Azure. Esto permitirá optimizar el inventario, diseñar programas de fidelización y realizar campañas de marketing dirigidas.
La Librería Iztaccihuatl en Monterrey, México desea desarrollar un proyecto de ciencia de datos para mejorar sus KPIs y la toma de decisiones. Se proporcionan cuatro archivos de datos sobre libros, los más vendidos, calificaciones y recomendaciones de lectura para su análisis con Python. El objetivo es predecir las preferencias de los clientes y mejorar el catálogo mediante el análisis de estos datos.
Este documento describe los datos disponibles de la Librería Iztaccihuatl y propone respuestas a preguntas sobre el análisis de datos y ciencia de datos de la librería. Se recomienda utilizar Python para el análisis, predecir ventas futuras mediante regresión lineal e identificar segmentos de clientes mediante agrupamiento. También se sugiere transformar los datos de ventas a transaccionales y utilizar una base de datos SQL y el servicio GitHub para el proyecto de ciencia de datos.
EDX: Curso Herramientas para el Análisis de Big Data – Tecnológico de Monterrey PROYECTO INDIVIDUAL EVALUADO POR PARES Caso libreria iztaccihuatl Creado por: Paola Quiroz Alvarez Guayaquil - Ecuador
Aplicando Ciencia de Datos en una OrganizaciónCarlosMacarlup
Este documento describe cómo la Librería Iztaccihuatl podría implementar un proyecto de ciencia de datos para mejorar sus indicadores de desempeño. Se recomienda contratar un servicio de nube pública para alojar la información y el proyecto, utilizar una base de datos relacional inicialmente y considerar una base de datos NoSQL en el futuro. Para realizar el análisis de datos se sugiere utilizar Python debido a su popularidad para ciencia de datos y facilidad de uso.
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfCarlosChin
La propuesta incluye utilizar PostgreSQL y Python con Pandas para realizar análisis de datos, lo que permitiría predecir tendencias de libros y autores más vendidos, así como mejorar el inventario. Se recomienda adecuar los datos agregando campos e identificadores y corrigiendo errores. El alojamiento debería ser en una base de datos relacional en la nube como AWS o Google Cloud, proporcionando seguridad, escalabilidad y disponibilidad.
Aplicando la ciencia de datos en una organizaciónKozhayaSfeir
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización.
Este documento describe el uso de herramientas de análisis de datos para analizar una librería en México y mejorar sus procesos de toma de decisiones. Utilizará Python, una base de datos SQL y la nube SaaS. El análisis predice ventas de libros, ingresos y opiniones de clientes. Se recolectarán más datos de clientes para mejorar las predicciones.
1) Se analizaron los datos de ventas de una librería para identificar gráficas, comparaciones y correlaciones. 2) Se encontró que las ventas variaban por autor, editorial, clasificación de libro, tipo de libro, año y trimestre. 3) Se pueden predecir las ventas futuras y se recomienda realizar campañas de marketing enfocadas en periodos de bajas ventas.
Este documento tiene como propósito cumplir con la práctica individual correspondiente al proyecto de evaluación entre pares, dentro del curso “Herramientas para el Análisis de BigData”, en la plataforma edx.org.
Caso libreria - herramientas para el análisis de big data - edxSebastiaFerran
Este documento describe cómo el análisis de grandes cantidades de datos (Big Data) de una librería puede ayudar a mejorar el negocio. Se recomienda utilizar Python para analizar los datos debido a su flexibilidad y velocidad. Una vez analizados los datos, se pueden extraer predicciones como los libros y productos más populares para mejorar los servicios y satisfacer las necesidades de los clientes. Almacenar los datos en una base de datos SQL en la nube podría ahorrar costos e impulsar la colaboración y competitividad
Proyecto del curso de Análisis de herramientas del Big Data en el Tecnológico de Monterrey, creado por el estudiante Brian Fallas Quirós de la Universidad Nacional
Trabajo de herramientas para la ciencia de datos evaluado por paresFrancoGotuzzo
Este documento resume las recomendaciones para realizar un análisis de datos predictivo de la Librería Iztaccihuatl. Se recomienda utilizar Python para el análisis, y realizar predicciones sobre las categorías, autores y casas editoriales más vendidas. También se sugiere segmentar y almacenar los datos en archivos separados según categoría, autor, fecha y precio. Finalmente, se propone utilizar un servicio gratuito de almacenamiento en la nube como Heroku para alojar la base de datos y el proyecto de ciencia de
El documento presenta un proyecto de ciencia de datos para una librería que busca mejorar sus indicadores de desempeño y estrategias de toma de decisiones. Analiza cuatro archivos de datos sobre libros, ventas y clasificaciones de clientes para identificar patrones que ayuden a maximizar ganancias. El análisis descriptivo de variables como volumen de ventas, precios y clasificaciones podría revelar formas de incrementar las ventas aplicando descuentos targeted.
La librería Iztaccihuatl desea desarrollar un proyecto de ciencia de datos para mejorar sus KPI y estrategias de toma de decisiones. Se analizan 4 archivos de datos que contienen información sobre libros, ventas, clasificaciones y recomendaciones. Se proponen 3 KPI relacionados con mejorar la base de clientes, clasificar libros y analizar precios. Python sería el lenguaje ideal. Los datos se podrían usar para predecir ventas y satisfacción de clientes. Se recomienda mejorar los datos de clientes y
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
Este documento propone un análisis prescriptivo de los datos internos de una librería para mejorar sus indicadores de desempeño y desarrollar una mejor estrategia de toma de decisiones. Analiza los archivos de datos proporcionados e identifica posibles indicadores clave como el valor de venta óptimo, stock óptimo y clientes frecuentes. El análisis prescriptivo integraría resultados descriptivos y predictivos para recomendar acciones que optimicen los resultados esperados.
Este documento presenta un caso sobre la Librería Iztaccihuatl y cómo predecir las ventas y recomendaciones de libros utilizando ciencia de datos. Se recomienda utilizar Python con Spyder y Jupyter Notebook para el análisis de datos. Las predicciones incluyen ventas por género, votaciones de libros y géneros más recomendados. Los datos deben ajustarse agregando fechas de votación y combinando tablas. Una base de datos relacional alojaría el análisis. Los servicios en la nube no son a
La librería Iztaccihuatl analizará sus datos internos y externos usando herramientas de ciencia de datos para desarrollar un modelo que apoye la toma de decisiones. Se aplicará analítica descriptiva para determinar los grupos editoriales, títulos y autores más rentables. Con base en los resultados, la librería podría negociar mejores precios con los grupos más rentables y promover más los títulos y autores lucrativos.
Este documento resume los resultados del análisis de datos realizado por la Librería Iztaccihuatl para mejorar su toma de decisiones. Incluye gráficos y comparaciones de datos sobre libros disponibles por idioma e idiomas de escritores. También presenta correlaciones entre ratings y años de publicación, e incluye una predicción sobre libros en inglés a incluir en el stock para 2020. Finalmente, propone recomendaciones basadas en las visualizaciones de datos.
La librería Iztaccihuatl desea mejorar sus KPI mediante análisis de datos. El documento propone analizar datos de libros (títulos, autores, clasificaciones, ventas) para determinar los indicadores clave como el porcentaje de libros altamente clasificados y de autores populares y recomendados. Esto permitiría tomar decisiones como promocionar libros populares o eliminar libros menos vendidos para mejorar el inventario.
El documento describe la diferencia entre Data Science y Data Analytics. Data Science requiere habilidades más avanzadas como machine learning y procesamiento de grandes volúmenes de datos, mientras que Data Analytics se enfoca más en generar informes y visualizaciones para apoyar decisiones de negocio. La principal diferencia radica en el nivel de complejidad y enfoque del trabajo. El documento también menciona algunas de las herramientas clave utilizadas en ambas disciplinas como Python, SQL, Tableau y AWS.
Este documento discute cómo analizar los datos de la Librería Iztaccihuatl utilizando ciencia de datos. Se recomienda utilizar Python y Spyder para el análisis. Se podrían predecir las ventas por género, las votaciones de libros y los géneros más recomendados. Los datos se mejorarían agregando fechas de votación y combinando tablas. Se usaría una base de datos relacional para almacenar el análisis. La librería probablemente no necesitaría servicios en la nube debido a su pequeño vol
Herramientas para el Análisis de Big DataJulio Burgos
El documento resume el análisis de datos de una librería llamada Iztaccihuatl utilizando el lenguaje R. Se predice que los clientes son angloparlantes, el catálogo satisface a los clientes y tiene varias ediciones del mismo libro. Se concluye que la información ayuda a entender el negocio pero se necesitan indicadores de desempeño para identificar oportunidades.
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfCarlosChin
La propuesta incluye utilizar PostgreSQL y Python con Pandas para realizar análisis de datos, lo que permitiría predecir tendencias de libros y autores más vendidos, así como mejorar el inventario. Se recomienda adecuar los datos agregando campos e identificadores y corrigiendo errores. El alojamiento debería ser en una base de datos relacional en la nube como AWS o Google Cloud, proporcionando seguridad, escalabilidad y disponibilidad.
Aplicando la ciencia de datos en una organizaciónKozhayaSfeir
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización.
Este documento describe el uso de herramientas de análisis de datos para analizar una librería en México y mejorar sus procesos de toma de decisiones. Utilizará Python, una base de datos SQL y la nube SaaS. El análisis predice ventas de libros, ingresos y opiniones de clientes. Se recolectarán más datos de clientes para mejorar las predicciones.
1) Se analizaron los datos de ventas de una librería para identificar gráficas, comparaciones y correlaciones. 2) Se encontró que las ventas variaban por autor, editorial, clasificación de libro, tipo de libro, año y trimestre. 3) Se pueden predecir las ventas futuras y se recomienda realizar campañas de marketing enfocadas en periodos de bajas ventas.
Este documento tiene como propósito cumplir con la práctica individual correspondiente al proyecto de evaluación entre pares, dentro del curso “Herramientas para el Análisis de BigData”, en la plataforma edx.org.
Caso libreria - herramientas para el análisis de big data - edxSebastiaFerran
Este documento describe cómo el análisis de grandes cantidades de datos (Big Data) de una librería puede ayudar a mejorar el negocio. Se recomienda utilizar Python para analizar los datos debido a su flexibilidad y velocidad. Una vez analizados los datos, se pueden extraer predicciones como los libros y productos más populares para mejorar los servicios y satisfacer las necesidades de los clientes. Almacenar los datos en una base de datos SQL en la nube podría ahorrar costos e impulsar la colaboración y competitividad
Proyecto del curso de Análisis de herramientas del Big Data en el Tecnológico de Monterrey, creado por el estudiante Brian Fallas Quirós de la Universidad Nacional
Trabajo de herramientas para la ciencia de datos evaluado por paresFrancoGotuzzo
Este documento resume las recomendaciones para realizar un análisis de datos predictivo de la Librería Iztaccihuatl. Se recomienda utilizar Python para el análisis, y realizar predicciones sobre las categorías, autores y casas editoriales más vendidas. También se sugiere segmentar y almacenar los datos en archivos separados según categoría, autor, fecha y precio. Finalmente, se propone utilizar un servicio gratuito de almacenamiento en la nube como Heroku para alojar la base de datos y el proyecto de ciencia de
El documento presenta un proyecto de ciencia de datos para una librería que busca mejorar sus indicadores de desempeño y estrategias de toma de decisiones. Analiza cuatro archivos de datos sobre libros, ventas y clasificaciones de clientes para identificar patrones que ayuden a maximizar ganancias. El análisis descriptivo de variables como volumen de ventas, precios y clasificaciones podría revelar formas de incrementar las ventas aplicando descuentos targeted.
La librería Iztaccihuatl desea desarrollar un proyecto de ciencia de datos para mejorar sus KPI y estrategias de toma de decisiones. Se analizan 4 archivos de datos que contienen información sobre libros, ventas, clasificaciones y recomendaciones. Se proponen 3 KPI relacionados con mejorar la base de clientes, clasificar libros y analizar precios. Python sería el lenguaje ideal. Los datos se podrían usar para predecir ventas y satisfacción de clientes. Se recomienda mejorar los datos de clientes y
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
Este documento propone un análisis prescriptivo de los datos internos de una librería para mejorar sus indicadores de desempeño y desarrollar una mejor estrategia de toma de decisiones. Analiza los archivos de datos proporcionados e identifica posibles indicadores clave como el valor de venta óptimo, stock óptimo y clientes frecuentes. El análisis prescriptivo integraría resultados descriptivos y predictivos para recomendar acciones que optimicen los resultados esperados.
Este documento presenta un caso sobre la Librería Iztaccihuatl y cómo predecir las ventas y recomendaciones de libros utilizando ciencia de datos. Se recomienda utilizar Python con Spyder y Jupyter Notebook para el análisis de datos. Las predicciones incluyen ventas por género, votaciones de libros y géneros más recomendados. Los datos deben ajustarse agregando fechas de votación y combinando tablas. Una base de datos relacional alojaría el análisis. Los servicios en la nube no son a
La librería Iztaccihuatl analizará sus datos internos y externos usando herramientas de ciencia de datos para desarrollar un modelo que apoye la toma de decisiones. Se aplicará analítica descriptiva para determinar los grupos editoriales, títulos y autores más rentables. Con base en los resultados, la librería podría negociar mejores precios con los grupos más rentables y promover más los títulos y autores lucrativos.
Este documento resume los resultados del análisis de datos realizado por la Librería Iztaccihuatl para mejorar su toma de decisiones. Incluye gráficos y comparaciones de datos sobre libros disponibles por idioma e idiomas de escritores. También presenta correlaciones entre ratings y años de publicación, e incluye una predicción sobre libros en inglés a incluir en el stock para 2020. Finalmente, propone recomendaciones basadas en las visualizaciones de datos.
La librería Iztaccihuatl desea mejorar sus KPI mediante análisis de datos. El documento propone analizar datos de libros (títulos, autores, clasificaciones, ventas) para determinar los indicadores clave como el porcentaje de libros altamente clasificados y de autores populares y recomendados. Esto permitiría tomar decisiones como promocionar libros populares o eliminar libros menos vendidos para mejorar el inventario.
El documento describe la diferencia entre Data Science y Data Analytics. Data Science requiere habilidades más avanzadas como machine learning y procesamiento de grandes volúmenes de datos, mientras que Data Analytics se enfoca más en generar informes y visualizaciones para apoyar decisiones de negocio. La principal diferencia radica en el nivel de complejidad y enfoque del trabajo. El documento también menciona algunas de las herramientas clave utilizadas en ambas disciplinas como Python, SQL, Tableau y AWS.
Este documento discute cómo analizar los datos de la Librería Iztaccihuatl utilizando ciencia de datos. Se recomienda utilizar Python y Spyder para el análisis. Se podrían predecir las ventas por género, las votaciones de libros y los géneros más recomendados. Los datos se mejorarían agregando fechas de votación y combinando tablas. Se usaría una base de datos relacional para almacenar el análisis. La librería probablemente no necesitaría servicios en la nube debido a su pequeño vol
Herramientas para el Análisis de Big DataJulio Burgos
El documento resume el análisis de datos de una librería llamada Iztaccihuatl utilizando el lenguaje R. Se predice que los clientes son angloparlantes, el catálogo satisface a los clientes y tiene varias ediciones del mismo libro. Se concluye que la información ayuda a entender el negocio pero se necesitan indicadores de desempeño para identificar oportunidades.
Similar a Aplicando la Ciencia de Datos en una organización.docx (20)
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdfMedTechBiz
Este libro ofrece una introducción completa y accesible a los campos de la minería de datos y la inteligencia artificial. Cubre todo, desde conceptos básicos hasta estudios de casos avanzados, con énfasis en la aplicación práctica utilizando herramientas como Python y R.
También aborda cuestiones críticas de ética y responsabilidad en el uso de estas tecnologías, discutiendo temas como la privacidad, el sesgo algorítmico y transparencia.
El objetivo es permitir al lector aplicar técnicas de minería de datos e inteligencia artificial a problemas reales, contribuyendo a la innovación y el progreso en su área de especialización.
Plan Emergencia solicitado en obras de construccion
Aplicando la Ciencia de Datos en una organización.docx
1. Aplicando la Ciencia de Datos en una organización
Fabián Alberto García Gómez
Tecnológico de Monterrey
Certificación profesional en ciencia de datos
Septiembre, 2022.
2. 1. Introducción
La ciencia de datos se ha convertido en un aliado importante para el desarrollo de los
procesos productivos de las empresas. Desde la minería de datos, la gestión de la información
y el almacenamiento de datos hasta su análisis e implementación, son procedimientos que
proveen ventajas competitivas a las empresas.
El presente documento busca identificar las herramientas necesarias para el análisis;
estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de
Datos como apoyo a la toma de decisiones para una organización.
2. Caso
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido
desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de
desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books;
top_books; raitings; to_read. Te recomendamos utilizar la herramienta Python para analizar
los datos que se te proporcionan.
El archivo “books” contiene los siguientes datos:
Id - Identificador del registro
Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
3. Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene los siguientes datos:
Position - Posición del libro en la clasificación del libro
ISBN - Clave estándar extendida internacional del libro
Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
Book Id - Identificador del libro
4. User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
User Id - Identificador del cliente/usuario que clasifico un libro
Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y
compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una
clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del
sitio web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el
sitio web sobre libros para leer.
3. Objetivo general
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la
nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de
decisiones para una organización.
4. Objetivos específicos
● Establecer qué lenguaje de programación para ciencia de datos utilizará para realizar
el análisis de datos de la Librería Iztaccihuatl.
● Determinar qué predicciones se podrían obtener de los datos de la Librería
Iztaccihuatl.
● Establecer qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl
para poder realizar un análisis predictivo.
● Definir qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la
Librería Iztaccihuatl.
● Determinar qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl
para alojar la información y el proyecto de ciencia de datos.
5. 5. Desarrollo
¿Qué lenguaje de programación para ciencia de datos utilizará para realizar el análisis de
datos de la Librería Iztaccihuatl.?
Teniendo en cuenta el volumen de datos y los objetivos que se persiguen, considero que el
lenguaje apropiado para desarrollar el proyecto es Python.
¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccihuatl.?
● Cantidad de ventas
● Cantidad de clientes (nuevos clientes)
● Rotación de inventario
● Productos de interés
¿Qué adecuaciones se podrían hacer a los datos de la Librería Iztaccihuatl para poder
realizar un análisis predictivo?
Aplicaría algunas acciones de preprocesado como:
● Identificación y manejo de valores nulos.
● Identificación y manejo de outliers.
● Identificar tendencias y correlaciones.
● Eliminar columnas que no sean necesarias.
● Realizar escalado de datos de ser necesario.
¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería
Iztaccihuatl.?
Usaría una base de datos estructurada seleccionando la herramienta propia de este tipo de
bases de datos(mySQL, Postgrel, Oracle) , esto teniendo en cuenta que se manejan datos
estructurados.
¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la
información y el proyecto de ciencia de datos?
En cuanto al tipo de servicio considero que una nube privada sería lo recomendable teniendo
en cuenta el tipo de información. Respecto al servicio se podría seleccionar AWS, Google
Cloud o Microsoft Azure.
6. Conclusiones
● Si bien R es un gran lenguaje para desarrollar proyectos, Python es un lenguaje con
una sintaxis muy limpia y amigable, con una gran comunidad, y con la robustez
necesaria para resolver problemas comunes en ciencia de datos.
6. ● Muchas veces se subestima la etapa de preprocesado lo cual puede afectar el resultado
final; por eso es importante que en cualquier proyecto de ciencia de datos se sigan
todos los pasos de dicha etapa y desarrollarlos con el mayor cuidado posible para así
optimizar el desarrollo y el resultado del proyecto.
● Determinar qué servicio de alojamiento usar para el proyecto de ciencia de datos está
sujeto a la cantidad de datos y a su sensibilidad (información calificada).