La problemática se da en el ámbito de la mejora de resultados de la Librería Iztaccihuatl, ubicada en la ciudad de Monterrey, Nuevo León, México. Actualmente la librería cuenta con un alto prestigio por la calidad de material bibliográfico que ofrece a sus clientes y además un servicio de atención de alto nivel. Sin embargo, los Ejecutivos de esta organización han decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En base al contexto descrito anteriormente, el principal objetivo de este proyecto es analizar fuentes de información externas e internas de la organización a través de herramientas computacionales para generar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones.
Este documento proporciona una introducción a la auditoría informática. Explica que la auditoría informática es un proceso llevado a cabo por profesionales capacitados para evaluar si un sistema de información protege los activos de una empresa, mantiene la integridad de los datos y cumple con las leyes. También describe los diferentes tipos de auditoría informática como la de explotación, desarrollo, comunicaciones y seguridad.
Este documento trata sobre los fundamentos de la auditoría de sistemas. Explica el origen de la auditoría y sus conceptos clave. Describe las necesidades y objetivos de realizar una auditoría informática. Además, clasifica los diferentes tipos de auditoría y áreas que pueden ser auditadas en sistemas informáticos. Por último, detalla las fases para desarrollar un programa de auditoría.
Este documento describe los datos disponibles sobre libros y clientes de la librería Iztaccihuatl. Los archivos contienen información sobre libros individuales, los más vendidos, calificaciones de clientes y recomendaciones. Se plantean preguntas sobre qué lenguaje de programación, predicciones y mejoras de datos se podrían utilizar para realizar análisis predictivos. Se concluye que se necesita un lenguaje como Python o R, limpiar y normalizar los datos, usar una base de datos flexible en la nube y comparar servicios en la nube.
EDS is a pioneer in location-based mobile advertising. They process 100GB of location data per hour and analyze 26BN bid requests daily. Their proprietary technology layers locations onto user journeys across devices to target and retarget audiences. Their services include geo-fencing, historical location data, cross-device targeting, and reporting on key metrics like store visits and brand sentiment. They provide comprehensive digital marketing strategies, set up search, display, and video campaigns, and optimize campaigns on an ongoing basis through keyword, ad, and targeting adjustments with monthly reporting.
Indicadores bibliométricos: clasificaciones, características y usos en la eva...Orlando Gregorio-Chaviano
Este documento presenta una discusión sobre los indicadores bibliométricos, sus categorías, características y usos en la evaluación de la actividad científica. Se describen indicadores de producción, impacto, colaboración y altmetría. También se analizan indicadores específicos como el factor de impacto, índice h, CROWN indicator y SJR. El documento enfatiza la necesidad de contextualizar el uso de los indicadores y tener en cuenta las diferencias entre disciplinas.
PROYECTO DE AULA: IMPACTO DE LAS TIC, EN LAS BIBLIOTECAS.Javier Lara
Este documento presenta un proyecto de investigación realizado por estudiantes sobre el impacto de las tecnologías de la información y la comunicación (TIC) en las bibliotecas. El proyecto analiza cómo las bibliotecas han adoptado o no las TIC y los beneficios que podrían obtener al implementar sistemas digitales. El documento incluye la introducción, objetivos, marco teórico, metodología y cronograma del proyecto.
Beginners discussion to - Google Analytics Lee Trevena
Google Analytics is a software program that collects and reports website data. It measures how many people visit a site, how they find it, and what they do while there. Data is collected through JavaScript code on the site which tracks user behavior and sends this information back to Google Analytics. This raw data is then processed into useful metrics and reports. Businesses can use these metrics and reports to improve site performance, track marketing campaigns, and enhance the user experience. Potential future applications of analytics technology include more personalized content, tracking robot and space activities, and uses in healthcare and bio-technology.
Este documento proporciona una introducción a la auditoría informática. Explica que la auditoría informática es un proceso llevado a cabo por profesionales capacitados para evaluar si un sistema de información protege los activos de una empresa, mantiene la integridad de los datos y cumple con las leyes. También describe los diferentes tipos de auditoría informática como la de explotación, desarrollo, comunicaciones y seguridad.
Este documento trata sobre los fundamentos de la auditoría de sistemas. Explica el origen de la auditoría y sus conceptos clave. Describe las necesidades y objetivos de realizar una auditoría informática. Además, clasifica los diferentes tipos de auditoría y áreas que pueden ser auditadas en sistemas informáticos. Por último, detalla las fases para desarrollar un programa de auditoría.
Este documento describe los datos disponibles sobre libros y clientes de la librería Iztaccihuatl. Los archivos contienen información sobre libros individuales, los más vendidos, calificaciones de clientes y recomendaciones. Se plantean preguntas sobre qué lenguaje de programación, predicciones y mejoras de datos se podrían utilizar para realizar análisis predictivos. Se concluye que se necesita un lenguaje como Python o R, limpiar y normalizar los datos, usar una base de datos flexible en la nube y comparar servicios en la nube.
EDS is a pioneer in location-based mobile advertising. They process 100GB of location data per hour and analyze 26BN bid requests daily. Their proprietary technology layers locations onto user journeys across devices to target and retarget audiences. Their services include geo-fencing, historical location data, cross-device targeting, and reporting on key metrics like store visits and brand sentiment. They provide comprehensive digital marketing strategies, set up search, display, and video campaigns, and optimize campaigns on an ongoing basis through keyword, ad, and targeting adjustments with monthly reporting.
Indicadores bibliométricos: clasificaciones, características y usos en la eva...Orlando Gregorio-Chaviano
Este documento presenta una discusión sobre los indicadores bibliométricos, sus categorías, características y usos en la evaluación de la actividad científica. Se describen indicadores de producción, impacto, colaboración y altmetría. También se analizan indicadores específicos como el factor de impacto, índice h, CROWN indicator y SJR. El documento enfatiza la necesidad de contextualizar el uso de los indicadores y tener en cuenta las diferencias entre disciplinas.
PROYECTO DE AULA: IMPACTO DE LAS TIC, EN LAS BIBLIOTECAS.Javier Lara
Este documento presenta un proyecto de investigación realizado por estudiantes sobre el impacto de las tecnologías de la información y la comunicación (TIC) en las bibliotecas. El proyecto analiza cómo las bibliotecas han adoptado o no las TIC y los beneficios que podrían obtener al implementar sistemas digitales. El documento incluye la introducción, objetivos, marco teórico, metodología y cronograma del proyecto.
Beginners discussion to - Google Analytics Lee Trevena
Google Analytics is a software program that collects and reports website data. It measures how many people visit a site, how they find it, and what they do while there. Data is collected through JavaScript code on the site which tracks user behavior and sends this information back to Google Analytics. This raw data is then processed into useful metrics and reports. Businesses can use these metrics and reports to improve site performance, track marketing campaigns, and enhance the user experience. Potential future applications of analytics technology include more personalized content, tracking robot and space activities, and uses in healthcare and bio-technology.
Este documento presenta una arquitectura empresarial de referencia para una biblioteca digital, desarrollada para la biblioteca digital de la Universidad Cooperativa de Colombia. Explica brevemente los conceptos de arquitectura empresarial y modelo de biblioteca digital. Luego, describe los componentes y objetivo de la arquitectura empresarial de referencia propuesta, y provee una vista completa de esta. Finalmente, incluye una guía de aplicación con pasos para implementar la arquitectura.
Normas generales para la auditoría de sistemas de informaciónvryancceall
La Asociación de Auditoría y Control de Sistemas de Información ha desarrollado Normas Generales para la Auditoría de Sistemas de Información debido a la naturaleza especializada de esta auditoría y las habilidades requeridas. Los objetivos de estas normas son informar a los auditores sobre los estándares mínimos requeridos y comunicar las expectativas de la profesión a la gerencia. Las normas se aplican a los miembros de la asociación y auditores certificados e incluyen estándares, directrices y procedimientos.
Este documento describe técnicas de inteligencia artificial como árboles de decisión y reglas. Explica conceptos como árboles de decisión, algoritmos ID3 y C4.5 para generar árboles, y cómo mapear árboles a reglas. También cubre conceptos de reglas de clasificación y asociación, medidas como confianza y soporte, y algoritmos como Prism y Apriori.
Este documento describe los metadatos, que son datos que describen otros datos. Explica que los metadatos permiten identificar recursos, describir su contenido y localización, y gestionar derechos. También describe diferentes tipos de metadatos e iniciativas y sistemas de metadatos como Dublin Core y MARC.
proyecto de automatizacion de biblioteca de la facultad de ciencias economica...ernesto
Este documento describe un proyecto para automatizar la biblioteca de la Facultad de Ciencias Económicas Administrativas y Financieras de la Universidad Autónoma Gabriel René Moreno. Actualmente la biblioteca tiene deficiencias como un control de circulación obsoleto y falta de equipos. El proyecto busca sistematizar los subsistemas de control de circulación y referencia, implementar salones de computación y acceso a catálogos electrónicos para fortalecer los servicios y mejorar la atención a los usuarios.
Mcvs ad-05 documento de analisis y diseño de cuslnavarros
Este documento describe el análisis y diseño de casos de uso (CUS) para un sistema de gestión de ventas y almacén para una empresa. Se presentan 19 CUS agrupados en 3 paquetes: 1) Usuarios, 2) Ventas, y 3) Almacén. Los CUS cubren funciones como gestionar usuarios, clientes, ventas, proveedores, productos, pedidos de compra e ingresos a almacén. Adicionalmente, se incluyen diagramas de casos de uso, actores, clases y secuencias que definen la arquitectura
El documento describe diferentes instrumentos y técnicas utilizadas por auditores de sistemas informáticos para recopilar información e identificar fortalezas y debilidades. Entre los instrumentos se encuentran entrevistas, cuestionarios, encuestas, observación, inventarios y muestreo. Las técnicas incluyen exámenes, inspecciones, confirmaciones, comparaciones, revisiones documentales y el uso de matrices de evaluación y FODA.
This document provides an overview of Google Analytics and how to use it to measure website traffic and goals. It discusses key metrics like pageviews, visits, traffic sources and conversions. It also covers how to set up tracking of goals and campaigns using techniques like link tagging and event tracking. The goal is to help users understand their website traffic and how to define business goals to improve performance.
Este documento describe el desarrollo histórico de la auditoría a través de los siglos. Comenzó en Inglaterra en los siglos XIII-XIV para auditar operaciones privadas y fondos públicos. En el siglo XIX se estableció formalmente la profesión de auditor y se crearon las primeras asociaciones de auditores. En el siglo XX se desarrollaron normas y principios de auditoría para estandarizar los procedimientos. La auditoría ha evolucionado para incluir no solo la revisión de estados financieros, sino también la evaluación
El documento describe las cuatro fases de una auditoría de sistemas: estudio preliminar, revisión y evaluación de controles y seguridad, examen detallado de áreas críticas, y comunicación de resultados. Incluye detalles sobre la investigación preliminar, como definir el alcance, revisar la documentación, y evaluar la disponibilidad y uso de la información. También discute los participantes clave y sus responsabilidades.
- Sistema Operativo Windows 7 o superior.
- Microsoft Office (Word, Excel, Access, PowerPoint).
- Software de Contabilidad.
- Software de Inventario.
- Software de Ventas.
Para el desarrollo del Sistema de Información se utilizará:
- Visual Basic .NET como lenguaje de programación.
- SQL Server como Base de Datos.
- UML como herramienta de modelado.
Estos software permitirán desarrollar la interfaz gráfica de usuario, realizar el
modelado de la base de datos y programar la lógica del sistema.
Este documento proporciona una introducción al formato MARC (Machine Readable Cataloging) diseñado para almacenar información bibliográfica. Explica que un registro MARC contiene etiquetas, indicadores y campos de datos e incluye ejemplos de campos comunes como el número de control, fecha de publicación e información física. Además, define términos clave como etiquetas, indicadores, códigos de subcampo y los componentes principales de un registro MARC.
This document provides an overview and analysis of sales forecasting data for Walmart. It includes:
- An introduction to the business problem of forecasting sales for Walmart stores and departments on a weekly basis.
- A description and exploration of the train and features datasets, including checking statistics, plotting sales over time, and outlier treatment.
- Preliminary analysis of the train dataset to understand sales patterns and relationships with features like temperature and holidays.
- Checks of the features dataset and treatment of missing/outlier markdown data.
The document analyzes the datasets to understand the data and perform initial exploratory analysis in preparation for building a sales forecasting model.
El documento describe un proyecto para analizar datos de una librería en Monterrey utilizando herramientas de ciencia de datos con el objetivo de mejorar sus indicadores de desempeño. Se analizarán datos de libros vendidos, clasificaciones y recomendaciones para determinar las tendencias de demanda y tomar decisiones como fortalecer la presencia digital, clasificar estanterías y mejorar el stock. El análisis descriptivo más adecuado permitirá establecer tendencias a partir de datos históricos.
Este documento presenta una propuesta para utilizar la ciencia de datos para mejorar las decisiones y los indicadores de desempeño de la Librería Iztaccihuatl. Actualmente, la librería cuenta con 4 bases de datos sobre libros, calificaciones de usuarios, libros más vendidos y recomendaciones. La propuesta incluye analizar esta información, definir una estrategia de implementación con 7 acciones como vincular los datos y agregar géneros a los libros, y monitorear el éxito mediante 4 indicadores clave como las calificaciones promedio
Aplicando Ciencia de Datos en una OrganizaciónCarlosMacarlup
Este documento describe cómo la Librería Iztaccihuatl podría implementar un proyecto de ciencia de datos para mejorar sus indicadores de desempeño. Se recomienda contratar un servicio de nube pública para alojar la información y el proyecto, utilizar una base de datos relacional inicialmente y considerar una base de datos NoSQL en el futuro. Para realizar el análisis de datos se sugiere utilizar Python debido a su popularidad para ciencia de datos y facilidad de uso.
La librería Iztaccihuatl en Monterrey, México desea mejorar sus KPI y estrategias de toma de decisiones mediante un modelo de ciencia de datos. Los archivos de datos incluyen información sobre libros, ventas, clasificaciones y recomendaciones. El análisis descriptivo de estos datos podría identificar los libros más populares y clasificados, así como las relaciones entre popularidad y ventas, para tomar decisiones como mejorar la cobertura digital o segmentar la exhibición de libros.
Este documento describe cómo una librería en Monterrey, México está utilizando la ciencia de datos para mejorar su toma de decisiones. Se analizaron datos internos como calificaciones de libros, volumen de ventas y recomendaciones de clientes. Los principales indicadores identificados fueron la calificación, las ventas y las recomendaciones. Basándose en el análisis, se propusieron decisiones como potenciar la publicidad de los libros mejor calificados, invertir más en géneros populares y aumentar el stock de los libros más recom
Hacer una propuesta para un modelo basado en ciencia de datos como apoyo a la toma de decisiones a la administración y gerencia de la Liberia Iztaccíhuatl a través de herramientas computacionales como la minería de datos (DM) y el Machine Learning (ML) analizando las fuentes de información internas (bases de datos de la organización, entre otras) y externas como el sitio oficial y social media.
Este documento presenta una arquitectura empresarial de referencia para una biblioteca digital, desarrollada para la biblioteca digital de la Universidad Cooperativa de Colombia. Explica brevemente los conceptos de arquitectura empresarial y modelo de biblioteca digital. Luego, describe los componentes y objetivo de la arquitectura empresarial de referencia propuesta, y provee una vista completa de esta. Finalmente, incluye una guía de aplicación con pasos para implementar la arquitectura.
Normas generales para la auditoría de sistemas de informaciónvryancceall
La Asociación de Auditoría y Control de Sistemas de Información ha desarrollado Normas Generales para la Auditoría de Sistemas de Información debido a la naturaleza especializada de esta auditoría y las habilidades requeridas. Los objetivos de estas normas son informar a los auditores sobre los estándares mínimos requeridos y comunicar las expectativas de la profesión a la gerencia. Las normas se aplican a los miembros de la asociación y auditores certificados e incluyen estándares, directrices y procedimientos.
Este documento describe técnicas de inteligencia artificial como árboles de decisión y reglas. Explica conceptos como árboles de decisión, algoritmos ID3 y C4.5 para generar árboles, y cómo mapear árboles a reglas. También cubre conceptos de reglas de clasificación y asociación, medidas como confianza y soporte, y algoritmos como Prism y Apriori.
Este documento describe los metadatos, que son datos que describen otros datos. Explica que los metadatos permiten identificar recursos, describir su contenido y localización, y gestionar derechos. También describe diferentes tipos de metadatos e iniciativas y sistemas de metadatos como Dublin Core y MARC.
proyecto de automatizacion de biblioteca de la facultad de ciencias economica...ernesto
Este documento describe un proyecto para automatizar la biblioteca de la Facultad de Ciencias Económicas Administrativas y Financieras de la Universidad Autónoma Gabriel René Moreno. Actualmente la biblioteca tiene deficiencias como un control de circulación obsoleto y falta de equipos. El proyecto busca sistematizar los subsistemas de control de circulación y referencia, implementar salones de computación y acceso a catálogos electrónicos para fortalecer los servicios y mejorar la atención a los usuarios.
Mcvs ad-05 documento de analisis y diseño de cuslnavarros
Este documento describe el análisis y diseño de casos de uso (CUS) para un sistema de gestión de ventas y almacén para una empresa. Se presentan 19 CUS agrupados en 3 paquetes: 1) Usuarios, 2) Ventas, y 3) Almacén. Los CUS cubren funciones como gestionar usuarios, clientes, ventas, proveedores, productos, pedidos de compra e ingresos a almacén. Adicionalmente, se incluyen diagramas de casos de uso, actores, clases y secuencias que definen la arquitectura
El documento describe diferentes instrumentos y técnicas utilizadas por auditores de sistemas informáticos para recopilar información e identificar fortalezas y debilidades. Entre los instrumentos se encuentran entrevistas, cuestionarios, encuestas, observación, inventarios y muestreo. Las técnicas incluyen exámenes, inspecciones, confirmaciones, comparaciones, revisiones documentales y el uso de matrices de evaluación y FODA.
This document provides an overview of Google Analytics and how to use it to measure website traffic and goals. It discusses key metrics like pageviews, visits, traffic sources and conversions. It also covers how to set up tracking of goals and campaigns using techniques like link tagging and event tracking. The goal is to help users understand their website traffic and how to define business goals to improve performance.
Este documento describe el desarrollo histórico de la auditoría a través de los siglos. Comenzó en Inglaterra en los siglos XIII-XIV para auditar operaciones privadas y fondos públicos. En el siglo XIX se estableció formalmente la profesión de auditor y se crearon las primeras asociaciones de auditores. En el siglo XX se desarrollaron normas y principios de auditoría para estandarizar los procedimientos. La auditoría ha evolucionado para incluir no solo la revisión de estados financieros, sino también la evaluación
El documento describe las cuatro fases de una auditoría de sistemas: estudio preliminar, revisión y evaluación de controles y seguridad, examen detallado de áreas críticas, y comunicación de resultados. Incluye detalles sobre la investigación preliminar, como definir el alcance, revisar la documentación, y evaluar la disponibilidad y uso de la información. También discute los participantes clave y sus responsabilidades.
- Sistema Operativo Windows 7 o superior.
- Microsoft Office (Word, Excel, Access, PowerPoint).
- Software de Contabilidad.
- Software de Inventario.
- Software de Ventas.
Para el desarrollo del Sistema de Información se utilizará:
- Visual Basic .NET como lenguaje de programación.
- SQL Server como Base de Datos.
- UML como herramienta de modelado.
Estos software permitirán desarrollar la interfaz gráfica de usuario, realizar el
modelado de la base de datos y programar la lógica del sistema.
Este documento proporciona una introducción al formato MARC (Machine Readable Cataloging) diseñado para almacenar información bibliográfica. Explica que un registro MARC contiene etiquetas, indicadores y campos de datos e incluye ejemplos de campos comunes como el número de control, fecha de publicación e información física. Además, define términos clave como etiquetas, indicadores, códigos de subcampo y los componentes principales de un registro MARC.
This document provides an overview and analysis of sales forecasting data for Walmart. It includes:
- An introduction to the business problem of forecasting sales for Walmart stores and departments on a weekly basis.
- A description and exploration of the train and features datasets, including checking statistics, plotting sales over time, and outlier treatment.
- Preliminary analysis of the train dataset to understand sales patterns and relationships with features like temperature and holidays.
- Checks of the features dataset and treatment of missing/outlier markdown data.
The document analyzes the datasets to understand the data and perform initial exploratory analysis in preparation for building a sales forecasting model.
El documento describe un proyecto para analizar datos de una librería en Monterrey utilizando herramientas de ciencia de datos con el objetivo de mejorar sus indicadores de desempeño. Se analizarán datos de libros vendidos, clasificaciones y recomendaciones para determinar las tendencias de demanda y tomar decisiones como fortalecer la presencia digital, clasificar estanterías y mejorar el stock. El análisis descriptivo más adecuado permitirá establecer tendencias a partir de datos históricos.
Este documento presenta una propuesta para utilizar la ciencia de datos para mejorar las decisiones y los indicadores de desempeño de la Librería Iztaccihuatl. Actualmente, la librería cuenta con 4 bases de datos sobre libros, calificaciones de usuarios, libros más vendidos y recomendaciones. La propuesta incluye analizar esta información, definir una estrategia de implementación con 7 acciones como vincular los datos y agregar géneros a los libros, y monitorear el éxito mediante 4 indicadores clave como las calificaciones promedio
Aplicando Ciencia de Datos en una OrganizaciónCarlosMacarlup
Este documento describe cómo la Librería Iztaccihuatl podría implementar un proyecto de ciencia de datos para mejorar sus indicadores de desempeño. Se recomienda contratar un servicio de nube pública para alojar la información y el proyecto, utilizar una base de datos relacional inicialmente y considerar una base de datos NoSQL en el futuro. Para realizar el análisis de datos se sugiere utilizar Python debido a su popularidad para ciencia de datos y facilidad de uso.
La librería Iztaccihuatl en Monterrey, México desea mejorar sus KPI y estrategias de toma de decisiones mediante un modelo de ciencia de datos. Los archivos de datos incluyen información sobre libros, ventas, clasificaciones y recomendaciones. El análisis descriptivo de estos datos podría identificar los libros más populares y clasificados, así como las relaciones entre popularidad y ventas, para tomar decisiones como mejorar la cobertura digital o segmentar la exhibición de libros.
Este documento describe cómo una librería en Monterrey, México está utilizando la ciencia de datos para mejorar su toma de decisiones. Se analizaron datos internos como calificaciones de libros, volumen de ventas y recomendaciones de clientes. Los principales indicadores identificados fueron la calificación, las ventas y las recomendaciones. Basándose en el análisis, se propusieron decisiones como potenciar la publicidad de los libros mejor calificados, invertir más en géneros populares y aumentar el stock de los libros más recom
Hacer una propuesta para un modelo basado en ciencia de datos como apoyo a la toma de decisiones a la administración y gerencia de la Liberia Iztaccíhuatl a través de herramientas computacionales como la minería de datos (DM) y el Machine Learning (ML) analizando las fuentes de información internas (bases de datos de la organización, entre otras) y externas como el sitio oficial y social media.
La librería Iztaccíhuatl desea analizar sus datos internos y externos para tomar mejores decisiones utilizando técnicas de Ciencia de Datos. Los indicadores clave que se analizarían son el promedio de calificaciones de los libros, su posición en rankings, ventas y calificaciones de clientes. Un análisis descriptivo de estos indicadores ayudaría a determinar qué libros promover o dejar de vender. Las decisiones que se podrían tomar incluyen ajustar inventarios, precios y realizar promociones de acuerdo con el re
Este documento tiene como propósito cumplir con la práctica individual correspondiente al proyecto de evaluación entre pares, dentro del curso “Herramientas para el Análisis de BigData”, en la plataforma edx.org.
Este documento describe el uso de herramientas de análisis de datos para analizar una librería en México y mejorar sus procesos de toma de decisiones. Utilizará Python, una base de datos SQL y la nube SaaS. El análisis predice ventas de libros, ingresos y opiniones de clientes. Se recolectarán más datos de clientes para mejorar las predicciones.
1) La librería Iztaccíhuatl busca desarrollar un proyecto de ciencia de datos para mejorar sus indicadores clave de desempeño y estrategia de toma de decisiones. 2) Se identificaron tres indicadores clave: libros recomendados, porcentaje de libros con buena calificación total, y porcentaje de libros con buena calificación en los más vendidos. 3) Se propone un análisis descriptivo inicial de los datos proporcionados para comprender la información, seguido de posibles proyecciones y recomendaciones
Este documento describe el enfoque para adoptar la ciencia de datos en la Librería Iztaccihuatl. Se procesarán datos de ventas, calificaciones y preferencias de lectura usando Python para generar recomendaciones personalizadas y predecir tendencias. Los datos se almacenarán en una base de datos PostgreSQL en la nube de Azure. Esto permitirá optimizar el inventario, diseñar programas de fidelización y realizar campañas de marketing dirigidas.
Este proyecto trae consigo el poder analizar y saber donde se llega a aplicar las Ciencia de Datos ,es muy interesante , lo publico aquí ya que estoy en un curso en el cual me pide desenglosar todo lo aprendió y esta es una manera de poder plasmar.
Este documento tiene como propósito cumplir con la práctica individual correspondiente al proyecto de evaluación entre pares, dentro del curso “Introducción a la Ciencia de Datos y el Big Data”, en la plataforma edx.org.
Este documento presenta un proyecto de investigación sobre el análisis de la accesibilidad en las librerías web de México. El objetivo es analizar el nivel de accesibilidad de las páginas web de librerías en México. La metodología incluye una investigación empírica y descriptiva de varias librerías web mexicanas y españolas para comparar sus niveles de accesibilidad. El documento también incluye una introducción al tema de la accesibilidad web y marco teórico sobre diseño web, normas de
La librería Iztaccihuatl desea desarrollar un proyecto de ciencia de datos para mejorar sus KPI y estrategias de toma de decisiones. Se analizan 4 archivos de datos que contienen información sobre libros, ventas, clasificaciones y recomendaciones. Se proponen 3 KPI relacionados con mejorar la base de clientes, clasificar libros y analizar precios. Python sería el lenguaje ideal. Los datos se podrían usar para predecir ventas y satisfacción de clientes. Se recomienda mejorar los datos de clientes y
Este documento presenta un análisis de datos para una librería llamada Iztaccihuatl con el fin de mejorar sus indicadores de desempeño y estrategia de toma de decisiones. Se revisan diferentes tablas de datos sobre libros, ventas, clasificaciones y recomendaciones de clientes. Se propone realizar un análisis descriptivo de los datos para comprender la situación actual de la librería antes de tomar decisiones. Las decisiones deben basarse principalmente en las preferencias de los clientes estudiadas a través de los datos, como la adquisición
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
Este documento propone un análisis prescriptivo de los datos internos de una librería para mejorar sus indicadores de desempeño y desarrollar una mejor estrategia de toma de decisiones. Analiza los archivos de datos proporcionados e identifica posibles indicadores clave como el valor de venta óptimo, stock óptimo y clientes frecuentes. El análisis prescriptivo integraría resultados descriptivos y predictivos para recomendar acciones que optimicen los resultados esperados.
Similar a Caso ciencia de datos libreria iztaccihuatl mauricio figueroa (20)
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdfMedTechBiz
Este libro ofrece una introducción completa y accesible a los campos de la minería de datos y la inteligencia artificial. Cubre todo, desde conceptos básicos hasta estudios de casos avanzados, con énfasis en la aplicación práctica utilizando herramientas como Python y R.
También aborda cuestiones críticas de ética y responsabilidad en el uso de estas tecnologías, discutiendo temas como la privacidad, el sesgo algorítmico y transparencia.
El objetivo es permitir al lector aplicar técnicas de minería de datos e inteligencia artificial a problemas reales, contribuyendo a la innovación y el progreso en su área de especialización.
2. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
2 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
INDICE
1 INTRODUCCIÓN .....................................................................................................................................................3
2 COMPRENSIÓN DEL NEGOCIO.......................................................................................................................3
2.1 Situación Actual...................................................................................................................................................5
2.1.1 KPI Calidad de Libros Ofertados según Rating...............................................................................5
2.1.2 KPI porcentaje de libros top de mayor por clasificación............................................................6
2.1.3 KPI cantidad de votos de clientes por libro .....................................................................................6
2.2 Propuesta e hipótesis del proyecto ...........................................................................................................7
3 COMPRENSIÓN DE LOS DATOS.....................................................................................................................7
3.1 Acerca de la fuente de datos........................................................................................................................7
3.2 Relacionamiento de los datos ...................................................................................................................10
3.3 Variable Objetivo .............................................................................................................................................10
4 PREPARACIÓN DE LOS DATOS .................................................................................................................... 11
4.1 Corrección de errores en la base de datos.........................................................................................11
4.2 Selección de campos .....................................................................................................................................12
4.3 Transformación de datos .............................................................................................................................13
5 MODELADO........................................................................................................................................................... 13
6 EVALUACIÓN......................................................................................................................................................... 14
7 DESPLIEGUE ........................................................................................................................................................... 15
8 CONCLUSIÓN GENERAL .................................................................................................................................. 16
Preparado por: Mauricio Figueroa Colarte
3. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
3 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
1 INTRODUCCIÓN
La problemática se da en el ámbito de la mejora de resultados de la Librería Iztaccihuatl,
ubicada en la ciudad de Monterrey, Nuevo León, México. Actualmente la librería cuenta con un
alto prestigio por la calidad de material bibliográfico que ofrece a sus clientes y además un
servicio de atención de alto nivel. Sin embargo, los Ejecutivos de esta organización han
decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de
desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En base al contexto descrito anteriormente, el principal objetivo de este proyecto es analizar
fuentes de información externas e internas de la organización a través de herramientas
computacionales para generar un modelo basado en Ciencia de Datos como apoyo a la toma
de decisiones.
Las herramientas tecnológicas a aplicar serán capaces de procesar fuentes de información
estructuradas para realiza análisis descriptivo que permita determinar el estado actual y por otra
parte proponer un modelo predictivo implementado con Machine Learning, con apoyo en la
metodología CRISP-DM, para predecir anticipadamente si determinados libros podrían llegar a
estar dentro de los top 20, lo cual asegurará una mejor satisfacción a los clientes y más ventas.
2 COMPRENSIÓN DEL NEGOCIO
En esta sección se desarrolla la comprensión del negocio, que corresponderá a la primera etapa
de un primer ciclo de la metodología CRISP-DM (Cross Industry Standard Process for Data
Mining) para el desarrollo del proyecto de Ciencia de Datos aplicada al pronóstico de libros top
de ventas de la Librería Iztaccihuatl.
Como contexto de negocio, la librería Iztaccihuatl pertenece al conglomerado de librerías
EDIMSA con asiento principal en Monterrey, Estado Nuevo León, México. Tiene sucursales en
Nuevo León, Coahuila, Quintana Roo y Tamaulipas.
Preparado por: Mauricio Figueroa Colarte
4. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
4 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
Misión
Hoy, con de más de 57 años en el mercado literario, reafirmamos nuestro compromiso con la
comunidad de crear experiencias únicas, impulsando la lectura, la cultura y la educación a nivel
nacional.
Visión
Ser líderes en la distribución y comercialización de material bibliográfico a nivel nacional y ser
una referencia cultural y de lectura mediante la difusión y apoyos a editoriales, autores,
asociaciones y eventos; siempre pensando en nuestra responsabilidad social hacia la
comunidad.
Valores
• Integridad
• Ética
• Respeto
• Innovación
• Servicio al cliente
• Trabajo en equipo
En lo sucesivo cada sección de este documento corresponderá al desarrollo de cada una de las
etapas de la metodología (Entendimiento de los Datos, Preparación de los Datos, Modelado,
Evaluación y Despliegue).
Preparado por: Mauricio Figueroa Colarte
5. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
5 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
2.1 Situación Actual
Actualmente la Librería Iztaccihuatl cuenta con una serie de sistemas transaccionales que
permiten llevar a cabo su operación diaria, con los cuales, las diversas unidades del negocio
conviven, atienden y resuelven las peticiones que se generan de forma interna y externa.
Particularmente, existen datos que dan cuenta de los principales KPIs actuales y que requieren
ser mejorados con este proyecto
2.1.1 KPI Calidad de Libros Ofertados según Rating
Preparado por: Mauricio Figueroa Colarte
6. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
6 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
2.1.2 KPI porcentaje de libros top de mayor por clasificación
2.1.3 KPI cantidad de votos de clientes por libro
Preparado por: Mauricio Figueroa Colarte
7. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
7 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
2.2 Propuesta e hipótesis del proyecto
Dado los KPIs definidos, las estrategias a implementar para el logro de los objetivos y los datos
con los que se cuenta, se propone mejorar el desempeño de la librería con un modelo
predictivo supervisado, que permita pronosticar si un determinado libro dentro de los
prospectos a ofrecer, tiene posibilidad de estar dentro de los top 20 más vendidos con una
exactitud promedio de al menos un 90%. En sentido podremos definir una variable objetivo
dicotómica que determine “TOP 20” (clase positiva) y “No TOP 20” (clase negativa)
3 COMPRENSIÓN DE LOS DATOS
Los datos que proveen la información necesaria para efectuar este estudio, se puede clasificar
en 4 grupos:
1) Catastro de libros: Inventario de libros que se posee para la venta
2) Libros top: Libros rankeados dentro de lo top 20 más vendidos de acuerdo a una
clasificación general.
3) Votaciones de los libros: Libros más votados por los clientes dentro del sitio web de la
librería
4) Recomendaciones por cliente: Recomendaciones que cada cliente o usuario realiza en
el sitio web sobre libros para leer.
3.1 Acerca de la fuente de datos
La fuente de datos son archivos separados por comas según la siguiente descripción:
El archivo “books.csv” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y
compras del cliente. Su estructura es la siguiente:
Preparado por: Mauricio Figueroa Colarte
8. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
8 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
• Id - Identificador del registro
• Book Id - Identificador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books.csv” contiene el top 20 de los libros más vendidos de acuerdo a una
clasificación general. Su estructura es la siguiente:
• Position - Posición del libro en la clasificación del libro
• ISBN - Clave estándar extendida internacional del libro
• Title - Título del libro
• Author - Autor del libro
• Imprint - Editorial
• Publisher Group - Grupo Editorial
Preparado por: Mauricio Figueroa Colarte
9. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
9 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
• Volume - Volumen de ventas hasta el 2010
• Value - Ventas determinadas por el volumen
• RRP - Precio recomendado para minoristas
• ASP - Precio promedio para venta
• Binding - Tipo de encuadernación
• Publ Date - Fecha de publicación
• Product Class - Clasificación del libro
• Classification - Clasificación General del libro
El archivo “ratings.csv” contiene los datos de los libros más votados por los clientes dentro del
sitio web de la librería. Su estructura es la siguiente:
• Book Id - Identificador del libro
• User Id - Identificador del cliente/usuario que clasifico un libro
• Rating - Nivel de clasificación del libro.
El archivo “to_read.csv” contiene las recomendaciones que cada cliente o usuario realiza en el
sitio web sobre libros para leer. Su estructura es la siguiente:
• User Id - Identificador del cliente/usuario que clasifico un libro
• Book Id - Identificador del libro
Preparado por: Mauricio Figueroa Colarte
10. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
10 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
3.2 Relacionamiento de los datos
Los archivos entregados se relacionan de la siguiente forma para un entendimiento más integral
de la data
3.3 Variable Objetivo
La variable de supervisión o clase objetivo para este proyecto de ciencia de datos será el
campo denominado TOP 20 que se identificará en la fuente de datos con sus valores posibles
“SI TOP 20” y “NO TOP 20”.
Preparado por: Mauricio Figueroa Colarte
11. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
11 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
4 PREPARACIÓN DE LOS DATOS
Como se vio en la sección anterior, al considerarse datos integrados y que serán la clave para
obtener buenos resultados del pronóstico, se debe realizar un proceso de limpieza y
estandarización de los datos a utilizar. Durante el depurado y limpieza de la base de datos se
espera poder gestionar los valores perdidos y/o nulos y manejar las inconsistencias presentes
y/o campos incompletos que pudieran presentarse
4.1 Corrección de errores en la base de datos
La primera tarea dentro del pre-procesamiento debería ser analizar los valores perdidos o nulos.
Gracias a un análisis exploratorio preliminar realizado en Python se pueden encontrar algunos
casos que se pueden abordar.
Para el archivo books.csv
Para el archivo top_books.csv
Preparado por: Mauricio Figueroa Colarte
12. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
12 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
4.2 Selección de campos
Una vez estandarizado los campos y los datos, se debería proceder con la eliminación de
aquellas variables que se consideran como no relevantes para el modelo a desarrollar,
generalmente una primera aproximación se puede lograr a través de un análisis de correlación:
Para el archivo books.csv
Preparado por: Mauricio Figueroa Colarte
13. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
13 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
Para el archivo top_books.csv
4.3 Transformación de datos
Junto con la reclasificación de datos presentada en las secciones anteriores, es importante que
las variables categóricas sean transformadas a datos numéricos aplicando técnicas como:
1) Diseñar variables binarias o “dummies” para cada categoría de respuesta de una variable
nominal.
2) De esta manera el “0” representa la inexistencia de la variable y el “1” la existencia de la
misma, con lo que la variable toma así un sentido numérico.
3) En consecuencia, cada variable nominal estará representada en la base datos por tantas
variables (campos o columnas) como categorías tenga (bins).
5 MODELADO
En esta etapa se seleccionan se propone el uso técnicas de Machine Learning sobre los datos,
el diseño de la evaluación, la construcción y evaluación del modelo a través de experimentos.
La idea central de estos experimentos es hacer competir modelos considerados a priori como
candidatos idóneos según el tipo de problema y luego evaluarlos para determinar cuál es el
mejor para confirmar la hipótesis y solucionar la problemática de predicción de los libros top.
Preparado por: Mauricio Figueroa Colarte
14. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
14 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
Según la investigación realizada respecto de los modelos planteados en el estado del arte, la
mayoría de estos, sus variaciones aplican algoritmos supervisados sobre datos textuales y, es
por eso que para la realización de los experimentos de evaluación se utilizarán los siguientes
modelos de aprendizaje automático: KNN (K-Nearest Neighbors), Decision Tree, SVM (Support
Vector Machine), Random Forest, Neural Network (Multi-Layer Perceptron), Naive Bayes, Logistic
Regression y AdaBoost (Adaptive Boosting).
6 EVALUACIÓN
La evaluación del rendimiento del modelo predictivo seleccionado, por lo que desde el
conjunto de algoritmos del estado del arte presentados anteriormente se hará una evaluación
entre ellos y se seleccionará el de mejor precisión, y una vez seleccionado el mejor algoritmo,
se realizará la sensibilización de parámetros de éste para ajustarlo al máximo posible.
La herramienta que se utilizará para la evaluación
será la matriz de confusión como se muestra en
la tabla, de la que se pueden obtener métricas
que se utilizan comúnmente para evaluar el
rendimiento de los modelos supervisados, como
son: la exactitud predictiva (1) y el error de
clasificación (2).
Tabla 1: Matriz de confusión
Clase Real
Clase
pronosticada
Top 20 No Top 20
Top 20 VP
(Verdaderos
Positivos)
FP
(Falsos
Positivos)
No Top 20 FN
(Falsos
Negativos)
VN
(Verdaderos
Negativos)
(1) Exactitud = (2) Error =
Otras métricas que son utilizadas y que permiten medir el rendimiento sobre cada una de las
clases de manera independiente son la precisión (3) y la sensibilidad o recall (4), las cuales se
definen a partir de la matriz de confusión de la siguiente forma:
(3) Precisión = (4) Sensibilidad (recall) =
La precisión (3) es una medida de la exactitud que determina, de los ejemplos clasificados como
positivos, cuántos son clasificados correctamente. La sensibilidad o recall (4), es una medida de la
Preparado por: Mauricio Figueroa Colarte
15. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
15 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
completitud o exactitud positiva que indica cuántos ejemplos de la clase positiva fueron
clasificados correctamente.
Para complementar los indicadores anteriores, se pueden
expresar los resultados gráficamente para cada uno de los
modelos generados en el espacio ROC (Receiver Operating
Characteristic), usando la sensibilidad (Tasa de Verdaderos
Positivos) y especificidad (Tasa de Falsos Positivos) promedio
como parte de las coordenadas de cada modelo según
muestra la siguiente figura, donde a mayor área bajo la
curva mejor el modelo.
7 DESPLIEGUE
En esta etapa el modelo deberá ponerse en producción una vez que los Ejecutivos tengan la
certeza de que les agregará valor con el grado de exactitud buscado. Posteriormente, se deberá
evaluar el impacto real en las ventas y los KPIs para determinar si es necesario mejorar el
modelo o complementarlo con otro y comenzar un nuevo proyecto de ciencia de datos.
Figura 2: Curva ROC
Preparado por: Mauricio Figueroa Colarte
16. Caso Librería Iztaccihuatl
Metodologías para proyectos de
ciencias de datos
Fecha Creación
21-01-2021
Página N°:
16 de 16
Clasificación:
Práctica con evaluación entre pares
Dirigido a:
Pares
8 CONCLUSIÓN GENERAL
Según lo descrito en las secciones anterior, la librería Iztaccihuatl cuenta con datos apropiados
que servirán de insumo para lograr un modelo predictivo de libros top utilizando la
metodología CRISP-DM. Es altamente recomendable dedicar gran parte del tiempo del proyecto
a la preparación de los datos, ya que, se asegurará mejor calidad para alimentar a los modelos
matemáticos, y como consecuencia será más probable que obtengamos mejores métricas de
exactitud y precisión. Luego de seleccionar el modelo que mejores resultados nos entregue, por
ejemplo, Redes Neuronales Artificiales, antes de pasar a producción el modelo es altamente
recomendable instaurar un proceso de marcha blanca donde se hagan predicciones en
situaciones reales para validar en la realidad el modelo (scoring). En este sentido, es clave
determinar si las clases de predicción Top 20 y No Top 20 son determinadas por el modelo con
una alta precisión en forma independiente. Y finalmente, debemos recordar que el proceso de
CRISP-DM es iterativo, por lo que, toda aquella retroalimentación que tengamos en producción
deberá ser utilizada como insumo para mejorar continuamente el modelo.
Preparado por: Mauricio Figueroa Colarte