Este documento describe cómo la Librería Iztaccihuatl podría implementar un proyecto de ciencia de datos para mejorar sus indicadores de desempeño. Se recomienda contratar un servicio de nube pública para alojar la información y el proyecto, utilizar una base de datos relacional inicialmente y considerar una base de datos NoSQL en el futuro. Para realizar el análisis de datos se sugiere utilizar Python debido a su popularidad para ciencia de datos y facilidad de uso.
Este documento describe los datos disponibles sobre libros y clientes de la librería Iztaccihuatl. Los archivos contienen información sobre libros individuales, los más vendidos, calificaciones de clientes y recomendaciones. Se plantean preguntas sobre qué lenguaje de programación, predicciones y mejoras de datos se podrían utilizar para realizar análisis predictivos. Se concluye que se necesita un lenguaje como Python o R, limpiar y normalizar los datos, usar una base de datos flexible en la nube y comparar servicios en la nube.
Este proyecto trae consigo el poder analizar y saber donde se llega a aplicar las Ciencia de Datos ,es muy interesante , lo publico aquí ya que estoy en un curso en el cual me pide desenglosar todo lo aprendió y esta es una manera de poder plasmar.
El documento describe la computación en red (grid computing) y cómo los recursos de múltiples computadoras pueden usarse cooperativamente para resolver problemas grandes en áreas como la salud, astronomía e investigación. También explica que la computación en la nube ofrece recursos de cómputo y almacenamiento bajo demanda a través de Internet y cubre conceptos como SaaS, PaaS e IaaS. Finalmente, discute tipos de nubes como públicas, privadas e híbridas.
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
Este documento presenta una sesión sobre Big Data e Inteligencia de Negocios (BI) utilizando HDInsight y Excel 2013. Explica brevemente qué es Big Data, introduce HDInsight y las herramientas de BI de Excel como PowerPivot y Power View. Luego describe cómo modelar datos de Big Data en PowerPivot para crear soluciones de BI dentro de Excel que permitan análisis de grandes conjuntos de datos. Finalmente, incluye demostraciones de estas capacidades.
Este documento presenta una investigación sobre Big Data. Introduce el tema y define Big Data como conjuntos de datos de gran volumen, alta velocidad y variedad que requieren nuevas formas de procesamiento para extraer valor e información. Explica las diferentes clasificaciones de datos, incluyendo estructurados, semi-estructurados y no estructurados. También compara Business Intelligence tradicional con Big Data y describe algunas herramientas comunes para implementar soluciones de Big Data como Hadoop, MapReduce y Apache Spark.
Aplicando la ciencia de datos en una organizaciónKozhayaSfeir
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización.
Este documento presenta una guía para que los usuarios evalúen el uso de fuentes informativas impresas y digitales. Explica el proceso de búsqueda de información, incluyendo la detección de necesidades, definición de objetivos, identificación de fuentes y criterios de búsqueda. También describe diferentes tipos de fuentes como impresas, digitales, bases de datos y páginas web. Además, proporciona criterios para evaluar la calidad de la información y parámetros que debe cumplir para ser confiable. Finalmente, discute
La Librería Iztaccihuatl en Monterrey, México desea desarrollar un proyecto de ciencia de datos para mejorar sus KPIs y la toma de decisiones. Se proporcionan cuatro archivos de datos sobre libros, los más vendidos, calificaciones y recomendaciones de lectura para su análisis con Python. El objetivo es predecir las preferencias de los clientes y mejorar el catálogo mediante el análisis de estos datos.
Este documento describe los datos disponibles sobre libros y clientes de la librería Iztaccihuatl. Los archivos contienen información sobre libros individuales, los más vendidos, calificaciones de clientes y recomendaciones. Se plantean preguntas sobre qué lenguaje de programación, predicciones y mejoras de datos se podrían utilizar para realizar análisis predictivos. Se concluye que se necesita un lenguaje como Python o R, limpiar y normalizar los datos, usar una base de datos flexible en la nube y comparar servicios en la nube.
Este proyecto trae consigo el poder analizar y saber donde se llega a aplicar las Ciencia de Datos ,es muy interesante , lo publico aquí ya que estoy en un curso en el cual me pide desenglosar todo lo aprendió y esta es una manera de poder plasmar.
El documento describe la computación en red (grid computing) y cómo los recursos de múltiples computadoras pueden usarse cooperativamente para resolver problemas grandes en áreas como la salud, astronomía e investigación. También explica que la computación en la nube ofrece recursos de cómputo y almacenamiento bajo demanda a través de Internet y cubre conceptos como SaaS, PaaS e IaaS. Finalmente, discute tipos de nubes como públicas, privadas e híbridas.
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
Este documento presenta una sesión sobre Big Data e Inteligencia de Negocios (BI) utilizando HDInsight y Excel 2013. Explica brevemente qué es Big Data, introduce HDInsight y las herramientas de BI de Excel como PowerPivot y Power View. Luego describe cómo modelar datos de Big Data en PowerPivot para crear soluciones de BI dentro de Excel que permitan análisis de grandes conjuntos de datos. Finalmente, incluye demostraciones de estas capacidades.
Este documento presenta una investigación sobre Big Data. Introduce el tema y define Big Data como conjuntos de datos de gran volumen, alta velocidad y variedad que requieren nuevas formas de procesamiento para extraer valor e información. Explica las diferentes clasificaciones de datos, incluyendo estructurados, semi-estructurados y no estructurados. También compara Business Intelligence tradicional con Big Data y describe algunas herramientas comunes para implementar soluciones de Big Data como Hadoop, MapReduce y Apache Spark.
Aplicando la ciencia de datos en una organizaciónKozhayaSfeir
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización.
Este documento presenta una guía para que los usuarios evalúen el uso de fuentes informativas impresas y digitales. Explica el proceso de búsqueda de información, incluyendo la detección de necesidades, definición de objetivos, identificación de fuentes y criterios de búsqueda. También describe diferentes tipos de fuentes como impresas, digitales, bases de datos y páginas web. Además, proporciona criterios para evaluar la calidad de la información y parámetros que debe cumplir para ser confiable. Finalmente, discute
La Librería Iztaccihuatl en Monterrey, México desea desarrollar un proyecto de ciencia de datos para mejorar sus KPIs y la toma de decisiones. Se proporcionan cuatro archivos de datos sobre libros, los más vendidos, calificaciones y recomendaciones de lectura para su análisis con Python. El objetivo es predecir las preferencias de los clientes y mejorar el catálogo mediante el análisis de estos datos.
La problemática se da en el ámbito de la mejora de resultados de la Librería Iztaccihuatl, ubicada en la ciudad de Monterrey, Nuevo León, México. Actualmente la librería cuenta con un alto prestigio por la calidad de material bibliográfico que ofrece a sus clientes y además un servicio de atención de alto nivel. Sin embargo, los Ejecutivos de esta organización han decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En base al contexto descrito anteriormente, el principal objetivo de este proyecto es analizar fuentes de información externas e internas de la organización a través de herramientas computacionales para generar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones.
Unidad2 Bases De Datos Para L Toma De DesicionesDeysi Hdz
El documento describe un almacén de datos (data warehouse), que es una gran colección de datos de múltiples sistemas que se utiliza principalmente para la toma de decisiones. Un almacén de datos proporciona una interfaz consolidada para acceder a datos históricos y actuales de manera más fácil. También describe las características, arquitectura y estructura lógica y física de un almacén de datos.
Este documento describe la minería de datos, incluyendo su historia, definición, procesos y aplicaciones comunes. La minería de datos es el proceso de analizar grandes conjuntos de datos para encontrar patrones y tendencias útiles. Se usa comúnmente en negocios, marketing, fraude y más.
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
Este documento presenta una introducción a Big Data, Hadoop y HDInsight. Explica conceptos clave como el volumen, variedad y velocidad de los datos de Big Data, y componentes de Hadoop como HDFS y MapReduce. También describe características de HDInsight y PowerPivot para modelar y analizar grandes conjuntos de datos.
Este documento presenta una guía para que los usuarios evalúen el uso de fuentes informativas impresas y digitales. Explica el proceso de búsqueda de información, incluyendo la detección de necesidades de información, definición de objetivos, identificación de fuentes, y determinación de criterios de búsqueda. Describe los tipos de fuentes impresas y digitales, y ofrece herramientas y motores de búsqueda. Además, proporciona criterios para evaluar la información y parámetros que debe cumplir para ser conf
Este documento describe Big Data y sus características. Define Big Data como grandes conjuntos de datos estructurados y no estructurados que son difíciles de manejar con bases de datos convencionales. Explica que Big Data puede usarse para optimizar cadenas de suministro y que ofrece ventajas a las empresas al permitirles mejorar divisiones con malos resultados sin intervención directa.
Este documento describe diferentes tipos de bases de datos y sistemas de gestión de bases de datos. Explica las características de las bases de datos, sus ventajas y desventajas. También describe la arquitectura típica de un sistema de gestión de bases de datos, incluyendo componentes como interfaces externos, intérpretes de lenguaje, optimizadores de consultas y motores de transacciones. Finalmente, concluye resaltando la importancia del lenguaje SQL y los sistemas de gestión de bases de datos para almacenar y organizar información de
El documento trata sobre Big Data, describiendo que se refiere a grandes cantidades de datos que provienen de múltiples fuentes y son difíciles de procesar con software convencional. Explica que Big Data se caracteriza por su volumen, velocidad y variedad y cómo difiere de datos tradicionales. Además, detalla algunas aplicaciones como segmentación, predicción, recomendaciones y análisis operacional, así como los componentes tecnológicos y técnicas analíticas necesarias para su gestión.
Este documento describe el concepto de Big Data y sus aplicaciones en recursos humanos. Explica que el Big Data se basa en el procesamiento de grandes volúmenes y variedades de datos a alta velocidad para extraer valor e inteligencia. A continuación, detalla cómo el Big Data se usa en recursos humanos para mejorar la identificación de talento, la gestión del rendimiento, la retención de empleados y la compensación. Finalmente, enfatiza la importancia de considerar el impacto del Big Data en la cultura organizacional antes de su implementación.
El documento habla sobre data mining y bases de datos. Explica que el data mining puede ayudar a las empresas a concentrarse en la información más importante al predecir tendencias y comportamientos. También describe algunas fuentes de datos, consideraciones para crear bases de datos, y métodos de data mining como redes neuronales y árboles de decisión para realizar predicciones.
Este documento presenta información sobre data warehouse. Explica que un data warehouse almacena y provee información relevante y oportuna para una organización. Detalla algunas características como que es orientado a un tema, administra grandes cantidades de información de múltiples fuentes, y condensa y agrega información para análisis. También describe los elementos clave de la arquitectura de un data warehouse y los pasos para el desarrollo e implementación de uno, incluyendo factores a considerar como el alcance, redundancia de datos y tipo de usuario final
Este documento introduce el tema de las bases de datos, definiéndolas como conjuntos de datos organizados que pertenecen a un dominio y proporcionan información a los usuarios. Explica que las bases de datos son herramientas importantes que permiten almacenar datos de clientes de manera ordenada para tomar mejores decisiones. Además, enfatiza la necesidad de actualizar las bases de datos regularmente, preferiblemente de manera diaria, para mantener la información actualizada.
Este proyecto tiene como objetivo aplicar un modelo predictivo de minería de datos para la empresa "Adventure Works" con el fin de identificar qué clientes tienen mayor probabilidad de comprar un nuevo producto. Se utilizará la estructura de minería de datos y el algoritmo de clasificación de árboles de decisión en Microsoft SQL Server para generar un modelo predictivo. Las herramientas SQL Server Data Tools y SQL Server Management Studio se usarán para identificar factores clave, generar el modelo y realizar predicciones que ayudarán a enfocar la campaña de marketing.
Este documento introduce los conceptos básicos de las bases de datos. Explica que las bases de datos surgieron para integrar datos de diferentes sistemas y aplicaciones, eliminando la redundancia. Describe los tres modelos históricos de almacenamiento de datos: orientados a dispositivos, orientados a archivos y orientados a bases de datos. El modelo de base de datos centraliza los datos para su uso compartido y mantenimiento coherente.
En esta presentación se introducen los conceptos de Big Data, así como las soliciones de Horton Works sobre Windows y el Microsoft Analytics Platform System (PDW Paralled Data Warehouse)
Saludos,
Eduardo Castro, PhD
SQL Server MVP
Comunidad Windows Costa Rica
Este documento proporciona una introducción al concepto de Big Data. Explica que Big Data se refiere a grandes conjuntos de datos que son difíciles de procesar con herramientas de bases de datos convencionales. Describe las tres características clave de Big Data: volumen, velocidad y variedad. Además, introduce algunas tecnologías clave como MapReduce y bases de datos NoSQL. Finalmente, explica brevemente el procesamiento de lenguaje natural como una aplicación de Big Data.
Este documento presenta un modelo integral de biblioteca digital. Explica que la biblioteca digital es un sistema de información documental en red que ofrece contenidos y servicios digitales a través de servidores distribuidos. Analiza los elementos que componen la biblioteca digital como la tecnología, contenidos digitales, colecciones digitales distribuidas y servicios de información digital. También considera la importancia del usuario para el modelo. El objetivo es mostrar las características y relaciones entre las partes que conforman la biblioteca digital.
Aplicando la Ciencia de Datos en una organización.docxLambofgod1993
l presente documento busca identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización.
Este documento describe el uso de herramientas de análisis de datos para analizar una librería en México y mejorar sus procesos de toma de decisiones. Utilizará Python, una base de datos SQL y la nube SaaS. El análisis predice ventas de libros, ingresos y opiniones de clientes. Se recolectarán más datos de clientes para mejorar las predicciones.
La problemática se da en el ámbito de la mejora de resultados de la Librería Iztaccihuatl, ubicada en la ciudad de Monterrey, Nuevo León, México. Actualmente la librería cuenta con un alto prestigio por la calidad de material bibliográfico que ofrece a sus clientes y además un servicio de atención de alto nivel. Sin embargo, los Ejecutivos de esta organización han decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
En base al contexto descrito anteriormente, el principal objetivo de este proyecto es analizar fuentes de información externas e internas de la organización a través de herramientas computacionales para generar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones.
Unidad2 Bases De Datos Para L Toma De DesicionesDeysi Hdz
El documento describe un almacén de datos (data warehouse), que es una gran colección de datos de múltiples sistemas que se utiliza principalmente para la toma de decisiones. Un almacén de datos proporciona una interfaz consolidada para acceder a datos históricos y actuales de manera más fácil. También describe las características, arquitectura y estructura lógica y física de un almacén de datos.
Este documento describe la minería de datos, incluyendo su historia, definición, procesos y aplicaciones comunes. La minería de datos es el proceso de analizar grandes conjuntos de datos para encontrar patrones y tendencias útiles. Se usa comúnmente en negocios, marketing, fraude y más.
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
Este documento presenta una introducción a Big Data, Hadoop y HDInsight. Explica conceptos clave como el volumen, variedad y velocidad de los datos de Big Data, y componentes de Hadoop como HDFS y MapReduce. También describe características de HDInsight y PowerPivot para modelar y analizar grandes conjuntos de datos.
Este documento presenta una guía para que los usuarios evalúen el uso de fuentes informativas impresas y digitales. Explica el proceso de búsqueda de información, incluyendo la detección de necesidades de información, definición de objetivos, identificación de fuentes, y determinación de criterios de búsqueda. Describe los tipos de fuentes impresas y digitales, y ofrece herramientas y motores de búsqueda. Además, proporciona criterios para evaluar la información y parámetros que debe cumplir para ser conf
Este documento describe Big Data y sus características. Define Big Data como grandes conjuntos de datos estructurados y no estructurados que son difíciles de manejar con bases de datos convencionales. Explica que Big Data puede usarse para optimizar cadenas de suministro y que ofrece ventajas a las empresas al permitirles mejorar divisiones con malos resultados sin intervención directa.
Este documento describe diferentes tipos de bases de datos y sistemas de gestión de bases de datos. Explica las características de las bases de datos, sus ventajas y desventajas. También describe la arquitectura típica de un sistema de gestión de bases de datos, incluyendo componentes como interfaces externos, intérpretes de lenguaje, optimizadores de consultas y motores de transacciones. Finalmente, concluye resaltando la importancia del lenguaje SQL y los sistemas de gestión de bases de datos para almacenar y organizar información de
El documento trata sobre Big Data, describiendo que se refiere a grandes cantidades de datos que provienen de múltiples fuentes y son difíciles de procesar con software convencional. Explica que Big Data se caracteriza por su volumen, velocidad y variedad y cómo difiere de datos tradicionales. Además, detalla algunas aplicaciones como segmentación, predicción, recomendaciones y análisis operacional, así como los componentes tecnológicos y técnicas analíticas necesarias para su gestión.
Este documento describe el concepto de Big Data y sus aplicaciones en recursos humanos. Explica que el Big Data se basa en el procesamiento de grandes volúmenes y variedades de datos a alta velocidad para extraer valor e inteligencia. A continuación, detalla cómo el Big Data se usa en recursos humanos para mejorar la identificación de talento, la gestión del rendimiento, la retención de empleados y la compensación. Finalmente, enfatiza la importancia de considerar el impacto del Big Data en la cultura organizacional antes de su implementación.
El documento habla sobre data mining y bases de datos. Explica que el data mining puede ayudar a las empresas a concentrarse en la información más importante al predecir tendencias y comportamientos. También describe algunas fuentes de datos, consideraciones para crear bases de datos, y métodos de data mining como redes neuronales y árboles de decisión para realizar predicciones.
Este documento presenta información sobre data warehouse. Explica que un data warehouse almacena y provee información relevante y oportuna para una organización. Detalla algunas características como que es orientado a un tema, administra grandes cantidades de información de múltiples fuentes, y condensa y agrega información para análisis. También describe los elementos clave de la arquitectura de un data warehouse y los pasos para el desarrollo e implementación de uno, incluyendo factores a considerar como el alcance, redundancia de datos y tipo de usuario final
Este documento introduce el tema de las bases de datos, definiéndolas como conjuntos de datos organizados que pertenecen a un dominio y proporcionan información a los usuarios. Explica que las bases de datos son herramientas importantes que permiten almacenar datos de clientes de manera ordenada para tomar mejores decisiones. Además, enfatiza la necesidad de actualizar las bases de datos regularmente, preferiblemente de manera diaria, para mantener la información actualizada.
Este proyecto tiene como objetivo aplicar un modelo predictivo de minería de datos para la empresa "Adventure Works" con el fin de identificar qué clientes tienen mayor probabilidad de comprar un nuevo producto. Se utilizará la estructura de minería de datos y el algoritmo de clasificación de árboles de decisión en Microsoft SQL Server para generar un modelo predictivo. Las herramientas SQL Server Data Tools y SQL Server Management Studio se usarán para identificar factores clave, generar el modelo y realizar predicciones que ayudarán a enfocar la campaña de marketing.
Este documento introduce los conceptos básicos de las bases de datos. Explica que las bases de datos surgieron para integrar datos de diferentes sistemas y aplicaciones, eliminando la redundancia. Describe los tres modelos históricos de almacenamiento de datos: orientados a dispositivos, orientados a archivos y orientados a bases de datos. El modelo de base de datos centraliza los datos para su uso compartido y mantenimiento coherente.
En esta presentación se introducen los conceptos de Big Data, así como las soliciones de Horton Works sobre Windows y el Microsoft Analytics Platform System (PDW Paralled Data Warehouse)
Saludos,
Eduardo Castro, PhD
SQL Server MVP
Comunidad Windows Costa Rica
Este documento proporciona una introducción al concepto de Big Data. Explica que Big Data se refiere a grandes conjuntos de datos que son difíciles de procesar con herramientas de bases de datos convencionales. Describe las tres características clave de Big Data: volumen, velocidad y variedad. Además, introduce algunas tecnologías clave como MapReduce y bases de datos NoSQL. Finalmente, explica brevemente el procesamiento de lenguaje natural como una aplicación de Big Data.
Este documento presenta un modelo integral de biblioteca digital. Explica que la biblioteca digital es un sistema de información documental en red que ofrece contenidos y servicios digitales a través de servidores distribuidos. Analiza los elementos que componen la biblioteca digital como la tecnología, contenidos digitales, colecciones digitales distribuidas y servicios de información digital. También considera la importancia del usuario para el modelo. El objetivo es mostrar las características y relaciones entre las partes que conforman la biblioteca digital.
Aplicando la Ciencia de Datos en una organización.docxLambofgod1993
l presente documento busca identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización.
Este documento describe el uso de herramientas de análisis de datos para analizar una librería en México y mejorar sus procesos de toma de decisiones. Utilizará Python, una base de datos SQL y la nube SaaS. El análisis predice ventas de libros, ingresos y opiniones de clientes. Se recolectarán más datos de clientes para mejorar las predicciones.
Este documento presenta información sobre bases de datos. Incluye preguntas sobre la definición de una base de datos, ejemplos de su implementación, elementos que las componen, la función de un motor de base de datos, la importancia de los sistemas de base de datos, programas para crear y administrar bases de datos, y la definición de un SGBD. También incluye respuestas a las preguntas planteadas sobre estos temas.
Este documento presenta preguntas sobre bases de datos. Proporciona ejemplos de cómo se pueden implementar bases de datos en diferentes contextos como un centro de estudios, una colección de música y un hospital. También describe los elementos que componen una base de datos como tablas, consultas, formularios e informes. Explica el propósito de un motor de base de datos y algunos programas populares para crear y administrar bases de datos como SQL Server, MySQL, Access y Oracle.
El documento describe el caso de uso de la Cámara de Empresas de Software y Servicios Informáticos de Argentina (CESSI) al implementar la plataforma kbee.docs para compartir su conocimiento generado de manera segura, escalable y costo-efectiva a través de una biblioteca digital multimedia online. Kbee.docs ofrece herramientas para gestionar contenidos, clasificar documentos, realizar búsquedas, y permitir la colaboración entre usuarios de una manera sencilla.
El documento proporciona una introducción a las plataformas de datos inteligentes. Explica que una plataforma de datos inteligente integra funciones como bases de datos operativas, análisis, inteligencia artificial, gobernanza de datos y seguridad para permitir que las organizaciones aprovechen al máximo sus datos. También describe los componentes clave de una plataforma de datos inteligente, incluida la ingesta de datos, el almacenamiento analítico y la visualización de datos.
El documento discute varias decisiones relacionadas con la implementación de sistemas de tecnología de la información, incluidas las decisiones sobre hardware, software, plataformas y tipos de bases de datos. También describe los pasos para probar e implementar un nuevo sistema de manera efectiva.
El documento describe la transformación de John Deere para adoptar la agricultura de precisión mediante el uso de datos e IoT. John Deere ha avanzado hacia una etapa de madurez en la que analiza grandes cantidades de datos de sus máquinas agrícolas para ofrecer información valiosa a los agricultores. La compañía continúa optimizando sus procesos de análisis de datos y servicios para los clientes.
Este documento describe el enfoque para adoptar la ciencia de datos en la Librería Iztaccihuatl. Se procesarán datos de ventas, calificaciones y preferencias de lectura usando Python para generar recomendaciones personalizadas y predecir tendencias. Los datos se almacenarán en una base de datos PostgreSQL en la nube de Azure. Esto permitirá optimizar el inventario, diseñar programas de fidelización y realizar campañas de marketing dirigidas.
Cuando el exceso de información se convierte en un problema y la gestión adecuada del conocimiento se
transforma en un desafío, ¿cuál es la solución?
Javier Carbonell
Este documento presenta una introducción general sobre Big Data y sus aplicaciones a los negocios. Explica las 3 V del Big Data (Volumen, Variedad y Velocidad), así como las 7 V. Detalla las fases de un proyecto de Big Data y marcos como Hadoop. Incluye ejemplos de cómo empresas como Amazon, Netflix y Starbucks han aplicado con éxito Big Data. Concluye que las soluciones de Big Data involucran tecnologías como la inteligencia de negocios y el machine learning para extraer valor de grandes volúmenes y variedades de datos que cre
El documento describe los conceptos clave de la evaluación del desempeño de sistemas en la nube. Explica los tipos de nube, las ventajas de la nube, y los pasos para realizar una transición exitosa a la nube. También analiza las herramientas de monitoreo para sistemas en la nube y los criterios para evaluar estas herramientas, con el objetivo de garantizar el óptimo desempeño de los sistemas en la nube.
-Resumen del capitulo 1 de Computación en la nube_Luis Joyanes Aguilar
-Universidad Nacional Autónoma de Honduras en el Valle de Sula UNAH-VS
-Carrera: Informática Administrativa
-Presentado por: David Salomón Sandobal
-Asignatura: Perspectiva de la Tecnología Informática
-Catedrático: Guillermo Brand
-II Periodo Académico 2016
-San Pedro Sula, Cortés, Honduras C.A.
Este documento presenta una introducción a los conceptos de inteligencia de negocios y herramientas como almacenes de datos, tableros de control y aplicaciones de informes. También describe diez principales proveedores de almacenamiento en la nube, incluyendo Amazon Web Services, Google Cloud Storage, Microsoft y IBM, comparando sus fortalezas y debilidades. El objetivo es desarrollar las competencias de identificar conceptos clave de inteligencia de negocios y reconocer herramientas que soportan el análisis de información y la toma de decision
Caso libreria - herramientas para el análisis de big data - edxSebastiaFerran
Este documento describe cómo el análisis de grandes cantidades de datos (Big Data) de una librería puede ayudar a mejorar el negocio. Se recomienda utilizar Python para analizar los datos debido a su flexibilidad y velocidad. Una vez analizados los datos, se pueden extraer predicciones como los libros y productos más populares para mejorar los servicios y satisfacer las necesidades de los clientes. Almacenar los datos en una base de datos SQL en la nube podría ahorrar costos e impulsar la colaboración y competitividad
Este documento describe la evolución de las bases de datos desde los años 70 hasta la actualidad. Comienza explicando los orígenes de las bases de datos jerárquicas y de red en las décadas de 1970 y 1980. Luego, describe el surgimiento de las bases de datos relacionales en los años 1990 y su popularidad actual. Finalmente, introduce las bases de datos orientadas a objetos.
kbee.spaces es una solución de software como servicio para crear intranets corporativas con portales dinámicos, herramientas de comunicación y gestión de contenidos. Incluye tipos de contenido predefinidos, plantillas y metodologías especializadas para servicios financieros. Los usuarios pueden cargar, editar y buscar contenidos de forma colaborativa a través de la intranet implementada en la nube sin necesidad de mantenimiento interno.
Del Excel, papel y lápiz a un análisis del negocio con Business Objects. ¿Qué debemos tener en cuenta? ¿Qué elementos entran en juego? ¿Qué cambios va a sufrir la empresa?...
Instaurar un sistema de análisis de la información, o Business Intelligence, supone una gran transformación de cara a la empresa. Una transformación que puede conllevar cambios estructurales tanto psicológicos como de conocimientos por parte de los responsables del negocio, así como un cambio motivado por el responsable en todos los empleados. Sin esto, sería imposible llevar a cabo una transformación con éxito.
Este documento presenta preguntas y respuestas sobre conceptos clave relacionados con almacenes de datos. Explica términos como clasificados por temas, integrados y variables en el tiempo. También describe las diferencias entre sistemas OLTP y almacenes de datos, los beneficios y problemas de los almacenes de datos, y los componentes y funciones de un almacén de datos como el gestor de carga y herramientas de acceso para usuarios finales. Además, cubre temas como la gestión de metadatos, tareas de administración,
Similar a Aplicando Ciencia de Datos en una Organización (20)
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdfMedTechBiz
Este libro ofrece una introducción completa y accesible a los campos de la minería de datos y la inteligencia artificial. Cubre todo, desde conceptos básicos hasta estudios de casos avanzados, con énfasis en la aplicación práctica utilizando herramientas como Python y R.
También aborda cuestiones críticas de ética y responsabilidad en el uso de estas tecnologías, discutiendo temas como la privacidad, el sesgo algorítmico y transparencia.
El objetivo es permitir al lector aplicar técnicas de minería de datos e inteligencia artificial a problemas reales, contribuyendo a la innovación y el progreso en su área de especialización.
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
2. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
1
Índice
1. Introducción.....................................................................................................................2
2. Identificación de la Empresa...........................................................................................3
3. Información Proporcionada para el desarrollo del caso.................................................3
4. Desarrollo del caso:........................................................................................................5
4.1. ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para
alojar la información y el proyecto de ciencia de datos? ...................................................5
4.2. ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la
Librería Iztaccihuatl?...........................................................................................................6
4.3. ¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el
análisis de datos de la Librería Iztaccihuatl? .....................................................................8
4.4. ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para
poder realizar un análisis predictivo?.................................................................................9
4.5. ¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccihuatl? 10
5. Propuestas ................................................................ Error! Bookmark not defined.
6. Conclusiones............................................................. Error! Bookmark not defined.
3. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
2
1. Introducción
Hoy en día las empresas generan, almacenan y gestionan una gran cantidad de datos,
estos datos se convierten en información importante para la toma de decisiones que
contribuyen en el crecimiento económico y posicionamiento en el mercado de estas.
Es por ello, que el presente proyecto tiene como objetivo implementar una solución de
inteligencia empresarial, que permita analizar fuentes de información externas e
internas de una organización a través de herramientas computacionales para generar
un modelo basado en Ciencia de Datos para la toma de decisiones en la Liberia
Iztaccihuatl, esto permitirá a los gestores conocer el estado de sus ventas, el tiempo
que se ha logrado optimizar la calidad de sus procesos, las preferencias de sus
clientes, los productos más vendidos, entre otros.
4. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
3
2. Identificación de la Empresa
La Librería Iztaccihuatl se encuentra ubicada en la ciudad de Monterrey, estado de
Nuevo León, México. ha decidido desarrollar un proyecto basada en ciencia de datos
para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor
estrategia en la toma de decisiones.
Fuente 1: Google Map - Mapa de la ubicación de la Librería Iztaccíhuatl.
3. Información Proporcionada para el desarrollo del caso
La librería Iztaccihuatl proporcionó la información en la carpeta “datasets_books” para
absolver las preguntas con los siguientes archivos:
El archivo “books” contiene los siguientes datos:
Id - Identificador del registro
Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
5. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
4
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
El archivo “top_books” contiene los siguientes datos:
Position - Posición del libro en la clasificación del libro
ISBN - Clave estándar extendida internacional del libro
Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
Book Id - Identificador del libro
User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
User Id - Identificador del cliente/usuario que clasifico un libro
Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una
clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro
del sitio web de la librería.
6. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
5
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza
en el sitio web sobre libros para leer.
4. Desarrollo del caso:
Para tener un claro entendimiento del tema describiremos los conceptos de acuerdo
con su jerarquía. Para extraer, transformar y cargar todos los datos adquiridos por la
Librería Iztaccihuatl para aplicar la Ciencia de Datos es necesario contar con una
arquitectura que soporte todos los procesos, tanto a nivel de software y hardware.
4.1. ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl
para alojar la información y el proyecto de ciencia de datos?
De acuerdo con la International Business Machines Corporation - IBM (fundada en
Nueva York, 1911) que es una reconocida empresa multinacional estadounidense de
tecnología y consultoría con sede en Armonk nos dice que “la nube computacional o
Cloud Computing en sus siglas en inglés, es el nombre que se dio al concepto que
hace referencia a la entrega de recursos computacionales de software y hardware
ofrecidos de manera remota y en tiempo real, de manera que las empresas pueden
acceder a diferentes servicios tecnológicos en cualquier parte del mundo a través del
internet, sin la preocupación de realizar gastos por la adquisición y mantenimiento de
equipos físicos, sistemas operativos, antivirus o aplicaciones de seguridad, de
almacenamiento de información entre otros” (IBM, 2021).
De manera más sencilla Microsoft lo resume en que “la informática en la nube es el
aprovisionamiento de servicios informáticos (incluidos servidores, almacenamiento,
bases de datos, redes, software, análisis e inteligencia) a través de Internet a la que
se le denomina la nube, cuyo propósito es ofrecer una innovación más rápida,
recursos adaptables y economías de escala” (Microsoft, 2021)
Existen diversos tipos de nubes computacionales que pueden implementarse de la
siguiente manera: Las nubes públicas que son un entorno de nube creado para ofrecer
sus servicios a cualquier usuario que quiera tener acceso a la red de redes a partir de
recursos no vinculados directamente al usuario o cliente. Los equipos y
almacenamiento son de propiedad del proveedor del servicio y el costo va de acuerdo
con lo que el cliente consume; Las nubes privadas, se tratan de ambientes diseñados
solo para el usuario final, generalmente on-premise. Ofrecen sus servicios de manera
limitada a los usuarios a través de una red de área local implementada dentro de una
7. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
6
empresa o de un proveedor externo; La nube híbrida es la combinación de las
anteriores mencionadas, es decir almacenan datos en nubes públicas y privadas,
estas sedan en virtud de las necesidades del cliente; Multiclouds incluyen más de una
nube, pública o privada, en las que pueden desplazarse múltiples servicios e
interactúan en simultaneo.
Fuente 2: https://nubeinformaticainformacion.wordpress.com/ - Tipos de nubes computacionales.
Para la Librería Iztaccihuatl se optaría por una arquitectura interna en la cual recauden
información mediante sus sistemas transaccionales y una nube pública que brinde las
herramientas necesarias para el análisis; estructuras de datos para desarrollar un
modelo basado en Ciencia de Datos comoapoyo a la toma de decisiones. Esta opción
brindará agilidad, versatilidad, resiliencia y escalabilidad para lograr que la empresa
se adapte a la nueva normalidad y a la nube. La Infraestructura flexible y dinámica,
con una amplia diversidad de alternativas y utilitarios disponibles al alcance del cliente,
hará que se pueda experimentar y concluir sobre cuál es el óptimo soporte para el
negocio y sus necesidades.
Existen diversos proveedores de nubes computacionales cuyos servicios varían en
costos por procesos, servicios, almacenaje, etc. Dentro de las principales podemos
mencionar: Azure de Microsoft, Google Cloud Platform, AWS Cloud Hosting Service
de Amazon, Red Hat e IBM, Alibaba Cloud, entre otros.
4.2. ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos
de la Librería Iztaccihuatl?
De acuerdo con la información proporcionada por la Librería Iztaccihuatl, todos los
datos recaudados provienen de sistemas transaccionales que pueden ser puntos de
8. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
7
ventas dentro del local o mediante comercio electrónico lo cual hace suponer que la
información se almacena en una base de datos relacional. Oracle Corporation la
describe como “Un almacén de datos relacional almacena y proporciona acceso a
puntos de datos relacionados entre sí. Las bases de datos relacionales toman como
referencia el modelo relacional, una forma perspicaz y directa de representar datos en
las tablas. En una base de datos relacional, cada fila de la tabla tiene un registro con
un identificador único llamado clave. Las columnas de la tabla contienen atributos de
los datos, y cada registro tiene un valor para cada atributo, lo que posibilita el
establecimiento de las relaciones entre los puntos de datos” (Oracle, 2021).
Este tipo de base de datos también sirve para aplicar Inteligencia de Negocios y
Ciencia de Datos ya que cuenta con las herramientas necesarias.Por ejemplo, Python
ha obtenido mucho interés recientemente como el lenguaje de elección para análisis
de datos. Estelenguaje tiene el conjunto de librerías para análisis de datos y modelado
predictivo, sin mencionar una curva de aprendizaje menos pronunciada. Microsoft “ha
integrado a su motor de base de datos SQL Server el lenguaje de ciencia de datos R,
ahora provee una interfaz que puede ejecutar eficientemente modelos y generar
predicciones usando los servicios SQL R. Python construye sobre la base propuesta
por los Servicios R en SQL Server, y extiende ese mecanismo para incluir soporte
para Python para análisis en la base de datos y aprendizaje de máquina” (Microsoft,
2021).
En caso la empresa quiera dar un paso adelante en cuanto a tecnología e innovar en
la explotación de datos, podría usar como alternativa una base de datos NoSQL
también conocidas como “No sólo SQL”, para guardar grandes volúmenes de datos
que serán empleados de manera sencilla y también económicos ya que para su
implementación no necesitan de muchos recursos físicos. “Su auge actual viene sujeto
por el uso que han hecho las principales compañías de internet como Amazon,
Google, Twitter y Facebook. Estas grandes compañías tenían que enfrentarse a
nuevos retos en el tratamiento de los datos motivados por el enorme crecimiento de
la Web donde se requería dar respuesta a la necesidad de proporcionar información
procesada a partir de grandes volúmenes de datos con unas estructuras horizontales,
más o menos, similares y con aplicaciones web que debían dar respuesta a las
peticiones de un número elevado e indeterminado de usuarios en el menor tiempo
posible” (Oracle, 2021).
9. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
8
El uso de estos almacenes podría servir para alojar documentos o tiendas de
documentos, como ebooks que serían de gran beneficio a Iztaccihuatl, ya que ofrecen
mucha flexibilidad, escritura rápida, y consultas rápidas gracias a su gran capacidad
de indexación. En el mercado actual existen diversas marcas reconocidas MongoDb,
MongoDB Atlas para Azure de 10gen y CouchDB, de Apache. En miras al futuro se
optaría por una base de datos NoSQL.
4.3. ¿Qué lenguaje de programación para ciencia de datos utilizaría para
realizar el análisis de datos de la Librería Iztaccihuatl?
El lenguaje de programación debe de estar acorde a los requisitos que se hayan
seleccionado anteriormente, de igual manera existen muchos en el mercado, con
entornos de costo y otros de código abierto o sin licencia. Para un ETL (Extract,
Transform, Load), si se va a usar una base de datos NoSQL como MongoDB, podría
combinar su uso con lenguajes clásicos como: C#, Java o Python o los modernos con
gran crecimiento como NodeJS y GO. Lo recomendable es un entorno que pueda ser
de fácil manejo, escalable, comprensible, que no consuman muchos recursos.
Si la empresadecide optar por lenguajes clásicos,podría incluso hacer sus desarrollos
In-House, con C# fácilmente se crearían los procesos para transformar datos, según
el portal de Microsoft “C# (pronunciado "si sharp" en inglés) es un lenguaje de
programación moderno, basado en objetos y con seguridad de tipos que permite a los
programadores crear diversos tipos de aplicaciones robustas, seguras y sólidas que
se ejecutan en el ecosistema de .NET. C# tiene sus raíces en la familia de lenguajes
C” (Microsoft, 2021).
Asimismo, Java que es un “lenguaje de programación y una plataforma informática
creada por Sun Microsystems. Hay muchas aplicaciones y sitios web que no
funcionarán a menos que tenga Java instalado y cada día se crean más. Java es
rápido, seguro y fiable. Desde portátiles hasta centros de datos, desde consolas para
juegos hasta súper computadoras, desde teléfonos móviles hasta Internet, Java está
en todas partes” (Oracle, 2021).
Por último, Python “Python es un lenguaje de programación potente y fácil de
aprender. Tiene estructuras de datos de alto nivel eficientes y un simple pero efectivo
sistema de programación orientado a objetos. Python tiene una elegante sintaxis y su
tipado dinámico, junto a su naturaleza interpretada lo convierten en un lenguaje ideal
para scripting y desarrollo rápido de aplicaciones en muchas zonas, para la mayoría
10. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
9
de las plataformas” (Python, 2021). Python para ciencia de datos es lenguaje de
programación más usado pues, proporciona todas las herramientas necesarias para
llevar a cabo este proceso de manera efectiva con bibliotecas (estadísticas y
numéricas como Pandas, Numpy, Matplotlib, SciPy, scikit-learn, etc) dedicadas para
cada paso.
Como vemos la mejor opción para la empresa sería el uso de Python como lenguaje
de programación porque cuenta con herramientas para: Recopilación y limpieza de
datos, exploración de datos, modelado de datos y visualización e interpretación de
datos.
4.4. ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl
para poder realizar un análisis predictivo?
El análisis predictivo consiste en la extracción de información en los datos y su
utilización para predecir tendencias y patrones de comportamiento, pudiendo aplicarse
sobre cualquier evento desconocido,ya seaen el pasado, presente o futuro. El análisis
predictivo se fundamenta en la identificación de relaciones entre variables en eventos
pasados, para luego explotar dichas relaciones y predecir posibles resultados en
futuras situaciones. Ahora bien, hay que tener en cuenta que la precisión de los
resultados obtenidos depende mucho de cómo se ha realizado el análisis de los datos,
así como de la calidad de las suposiciones.
Para iniciar las adecuaciones se debe de considerar:
a) Recolectarlos datos: No es algo simple,la forma interesante de comenzaresta
etapa es indagando qué interrogantes son necesarias para obtener las
respuestas, para luego centrarse en la información necesaria que necesitas la
empresa.
b) Estructurar los datos: Es la fase de la estrategia donde se transfiere los datos
a un lugar donde se pueda facilitar la visión de la información recolectada. Por
ejemplo: Excel, ClikView, Power BI.
c) Analizar los datos: Es el momento de comprender las anomalías o tendencias,
por ejemplo, el mes en que se tiene la mayor tasa de cancelación de pedidos,
para así pensar en un plan de acción más efectivo.
d) Aplicar estadística: Aplicar la estadística descriptiva e inferencial que son parte
del análisis predictivo.
11. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
10
e) Modelaje: Se reúne técnicas matemáticas, las primeras ideas sobre los
posibles hechos en el futuro comienzan a aparecer.
f) Monitorear el modelo: Consiste en monitorear los pasos anteriores para que el
modelo continúe siendo confiable.
4.5. ¿Qué predicciones se podrían obtener de los datos de la Librería
Iztaccihuatl?
Las predicciones que podríamos obtener de los datos de la Librería Iztaccihuatl son:
a) Previsión de la demanda: Predecir la demanda futura de los clientes haciendo
estimaciones sobre la base a los datos históricos. Por ejemplo, podríamos
calcular la demanda del periodo anterior mediante la siguiente formula:
previsión de demanda = demanda media (período actual) * factor estacional
(período actual)
b) Venta cruzada: Identificar el potencial de venta cruzada mediante la
comercializaciónde productos complementarios a los que consume o pretende
consumir un cliente. Podría usarse el cross-selling ofreciendo productos
complementarios o el upselling ofreciendo otro producto que constituye una
mejora u perfeccionar de la compra principal que el cliente ha hecho, con el fin
de conocer sus necesidades.
c) Comportamiento del consumidor:Según Schiffman(2002), “el comportamiento
del consumidor se entiende como aquél que los compradores muestran al
buscar, comprar, utilizar, evaluar y desechar los productos y servicios que
consideran van a satisfacer sus necesidades”. Esta se logra prediciendo y
comprendiendo los patrones y propensión de compra y creando en tiempo real
ofertas personalizadas.
5. Conclusiones:
En función de los análisis realizados presento la propuesta sustentada en el beneficio
que conlleva su uso:
Propuesta Beneficio
Local (on-premise) - Nube Pública Ahorro en costes de infraestructura.
Base de datos NoSQL Escalabilidad
Versatilidadg
12. Tecnológico de Monterrey
Caso: Aplicando la Ciencia de Datos en una organización
11
Orientado a la Ciencia de Datos
Económico
Soporte estructuras distribuidas
Lenguaje de Programación Python Simplificado y rápido
Cuenta con muchas librerías para ser
usadas en Ciencia de Datos
Adecuar los datos
Estructurar los datos
Analizar los datos
Aplicar estadística
Modelaje
Monitorear el modelo
Permite conocer los usuarios más
interesados en tus productos o servicios
Predicciones
Previsión de la demanda
Venta cruzada
Comportamiento del
consumidor
Mejorar las ventas
Tabla 1: Elaboración propia