Este proyecto tiene como objetivo aplicar un modelo predictivo de minería de datos para la empresa "Adventure Works" con el fin de identificar qué clientes tienen mayor probabilidad de comprar un nuevo producto. Se utilizará la estructura de minería de datos y el algoritmo de clasificación de árboles de decisión en Microsoft SQL Server para generar un modelo predictivo. Las herramientas SQL Server Data Tools y SQL Server Management Studio se usarán para identificar factores clave, generar el modelo y realizar predicciones que ayudarán a enfocar la campaña de marketing.
El documento habla sobre los índices en bases de datos. Explica que los índices mejoran el rendimiento de las consultas al facilitar una respuesta rápida. Describe la estructura de los índices, los tipos de índices (agrupados y no agrupados), y cómo se usan los índices para localizar registros de manera eficiente. También cubre temas como la creación, administración y mantenimiento de índices.
¿que es gobierno de datos?, ¿que es gestión de datos?, ¿cuales son las 10 funciones del gobierno de datos?, diagrama de contexto del gobierno de datos, actividades del gobierno de datos
- Corporate data is growing rapidly at 100% every year and data generated in the past 3 years is equivalent to the previous 30 years.
- With increasing data, organizations need tools to manage data and turn it into useful information for strategic decision making.
- Business intelligence provides interactive tools for analyzing large amounts of data from different sources and transforming it into insightful reports and dashboards to help organizations make better business decisions.
Este documento presenta varias herramientas para la visualización de datos. En primer lugar, describe cinco herramientas populares: Google Fusion Tables, CartoDB, Tableau Public, iCharts y Smart Data Report. Luego, proporciona más detalles sobre cada una de estas herramientas, incluidas sus características y usos comunes. El objetivo general es ayudar a los lectores a sacar el máximo provecho de sus datos mediante la visualización eficaz de la información.
Este documento introduce los conceptos básicos de las bases de datos. Explica la diferencia entre datos, información, archivos y bases de datos, y cómo las bases de datos eliminan la redundancia al almacenar datos relacionados de forma lógica y compartida. También describe las funciones de los sistemas gestores de bases de datos, los actores clave como el administrador de la base de datos, y las ventajas de utilizar este tipo de sistemas, como la seguridad, la actualización en línea y la simplificación del trabajo.
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningDenodo
Watch full webinar here: https://bit.ly/3CIN2NT
Los proyectos de Big Data y Machine Learning en muchos casos no logran los beneficios esperados y los lagos de datos se convierten en nuevos silos de datos que aportan poco valor a negocio. Los principales desafíos que encuentran las empresas para un aprovechamiento de las iniciativas de Big Data y Machine Learning son los siguientes:
- Identificación de fuentes de datos relevantes para el análisis del caso de negocio
- Dificultad para la integración de las fuentes de datos, se invierte mucho tiempo en tareas rutinarias de limpieza y preparación
- Problemas de colaboración en el equipo de trabajo: falta de visibilidad de las transformaciones realizadas, dificultad para la compartición de conocimiento y código
- Dificultad para soportar distintos perfiles con niveles de conocimiento dispares (e.g. analistas de negocio vs científicos de datos)
- Compartir resultados con los usuarios de negocio, evitar un nuevo silo de datos en la organización
- Dificultad a la hora de operacionalizar los algoritmos, surtir de datos a los algoritmos para extraer la información
- Las arquitecturas de Data Fabric vienen a facilitar el ciclo de vida de las iniciativas de Big Data y Machine Learning:
- Exploración e identificación de datos relevantes para el análisis mediante el Catálogo de Datos
- Preparación de los datos para alimentar los algoritmos de ML (con total trazabilidad de las combinaciones y transformaciones realizadas)
- Parametrización del algoritmo, tuning y adiestramiento mediante data science notebooks conectados a la capa de virtualización
- Operacionalización del algoritmo como un servicio de datos para usuarios de negocio
- Ofrecen una capa de gobierno y seguridad sobre las fuentes de datos
Los ponentes debatirán las distintas alternativas y cómo las arquitecturas de Data Fabric se han convertido en piezas clave para soportar iniciativas de Big Data y Machine Learning.
En esta presentación se dará conocer tres puntos importantes
1. Que es un Gobierno de Datos?
2. Cuales son las funciones y actividades del Gobierno de Datos?
3. Quienes son los integrantes de un Gobierno de Datos?
El documento provee una introducción a los conceptos de Business Intelligence (BI). Explica que BI involucra recopilar la información correcta en el momento correcto para que las personas puedan tomar mejores decisiones. Describe los componentes clave de BI como el almacén de datos, minería de datos, procesamiento analítico en línea y datamarts. El objetivo final de BI es proporcionar información oportuna y relevante a los ejecutivos y gerentes para apoyar el proceso de toma de decisiones.
El documento habla sobre los índices en bases de datos. Explica que los índices mejoran el rendimiento de las consultas al facilitar una respuesta rápida. Describe la estructura de los índices, los tipos de índices (agrupados y no agrupados), y cómo se usan los índices para localizar registros de manera eficiente. También cubre temas como la creación, administración y mantenimiento de índices.
¿que es gobierno de datos?, ¿que es gestión de datos?, ¿cuales son las 10 funciones del gobierno de datos?, diagrama de contexto del gobierno de datos, actividades del gobierno de datos
- Corporate data is growing rapidly at 100% every year and data generated in the past 3 years is equivalent to the previous 30 years.
- With increasing data, organizations need tools to manage data and turn it into useful information for strategic decision making.
- Business intelligence provides interactive tools for analyzing large amounts of data from different sources and transforming it into insightful reports and dashboards to help organizations make better business decisions.
Este documento presenta varias herramientas para la visualización de datos. En primer lugar, describe cinco herramientas populares: Google Fusion Tables, CartoDB, Tableau Public, iCharts y Smart Data Report. Luego, proporciona más detalles sobre cada una de estas herramientas, incluidas sus características y usos comunes. El objetivo general es ayudar a los lectores a sacar el máximo provecho de sus datos mediante la visualización eficaz de la información.
Este documento introduce los conceptos básicos de las bases de datos. Explica la diferencia entre datos, información, archivos y bases de datos, y cómo las bases de datos eliminan la redundancia al almacenar datos relacionados de forma lógica y compartida. También describe las funciones de los sistemas gestores de bases de datos, los actores clave como el administrador de la base de datos, y las ventajas de utilizar este tipo de sistemas, como la seguridad, la actualización en línea y la simplificación del trabajo.
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningDenodo
Watch full webinar here: https://bit.ly/3CIN2NT
Los proyectos de Big Data y Machine Learning en muchos casos no logran los beneficios esperados y los lagos de datos se convierten en nuevos silos de datos que aportan poco valor a negocio. Los principales desafíos que encuentran las empresas para un aprovechamiento de las iniciativas de Big Data y Machine Learning son los siguientes:
- Identificación de fuentes de datos relevantes para el análisis del caso de negocio
- Dificultad para la integración de las fuentes de datos, se invierte mucho tiempo en tareas rutinarias de limpieza y preparación
- Problemas de colaboración en el equipo de trabajo: falta de visibilidad de las transformaciones realizadas, dificultad para la compartición de conocimiento y código
- Dificultad para soportar distintos perfiles con niveles de conocimiento dispares (e.g. analistas de negocio vs científicos de datos)
- Compartir resultados con los usuarios de negocio, evitar un nuevo silo de datos en la organización
- Dificultad a la hora de operacionalizar los algoritmos, surtir de datos a los algoritmos para extraer la información
- Las arquitecturas de Data Fabric vienen a facilitar el ciclo de vida de las iniciativas de Big Data y Machine Learning:
- Exploración e identificación de datos relevantes para el análisis mediante el Catálogo de Datos
- Preparación de los datos para alimentar los algoritmos de ML (con total trazabilidad de las combinaciones y transformaciones realizadas)
- Parametrización del algoritmo, tuning y adiestramiento mediante data science notebooks conectados a la capa de virtualización
- Operacionalización del algoritmo como un servicio de datos para usuarios de negocio
- Ofrecen una capa de gobierno y seguridad sobre las fuentes de datos
Los ponentes debatirán las distintas alternativas y cómo las arquitecturas de Data Fabric se han convertido en piezas clave para soportar iniciativas de Big Data y Machine Learning.
En esta presentación se dará conocer tres puntos importantes
1. Que es un Gobierno de Datos?
2. Cuales son las funciones y actividades del Gobierno de Datos?
3. Quienes son los integrantes de un Gobierno de Datos?
El documento provee una introducción a los conceptos de Business Intelligence (BI). Explica que BI involucra recopilar la información correcta en el momento correcto para que las personas puedan tomar mejores decisiones. Describe los componentes clave de BI como el almacén de datos, minería de datos, procesamiento analítico en línea y datamarts. El objetivo final de BI es proporcionar información oportuna y relevante a los ejecutivos y gerentes para apoyar el proceso de toma de decisiones.
Este documento describe los pasos para diseñar una base de datos, incluyendo el análisis, diseño conceptual, lógico y físico. Explica la importancia de normalizar las tablas, seleccionar los tipos de datos adecuados y almacenar solo la información necesaria para lograr una base de datos eficiente. El objetivo final es generar tablas que modelen los registros de información de una manera flexible, independiente de aplicaciones y que minimice la redundancia.
Este documento presenta una introducción al tema de la minería de datos. Explica que la minería de datos permite extraer información oculta de grandes volúmenes de datos almacenados analizando patrones y relaciones. Describe las fases del proceso de minería de datos, que incluyen filtrado, selección de variables, extracción de conocimiento e interpretación. También menciona algunas aplicaciones como marketing, predicción y control de calidad.
Este documento presenta una introducción al modelado de software orientado a objetos usando UML. Explica brevemente los conceptos clave de UML como diagramas, clases, relaciones, comportamientos y componentes. También describe el proceso de desarrollo de software basado en UML.
¿Qué es un modelo predictivo y para qué vale?Scoremind
Los modelos predictivos permiten estimar cual es el comportamiento esperado del cliente utilizando los datos de uso de los servicios.
Para el desarrollo de los modelos se utilizan técnicas analíticas (data mining).
Data Modelling 101 half day workshop presented by Chris Bradley at the Enterprise Data and Business Intelligence conference London on November 3rd 2014.
Chris Bradley is a leading independent information strategist.
Contact chris.bradley@dmadvisors.co.uk
Este documento trata sobre minería de datos. La minería de datos es el proceso de descubrir patrones en grandes volúmenes de datos. Utiliza métodos de inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. Algunas técnicas comunes de minería de datos son la clasificación, regresión, agrupamiento y reglas de asociación. La minería de datos se aplica en diversos campos como finanzas, mercadeo, salud y educación.
El documento introduce los conceptos de data warehouse, datamart y sus características. Un data warehouse es un repositorio unificado de datos de toda la empresa para fines analíticos, que puede ser físico o lógico. Los datamarts son bases de datos departamentales especializadas en un área de negocio que ofrecen ventajas como menor volumen de datos y mayor rapidez de consulta.
Talend provides data integration and management solutions. It focuses on combining data from different sources into a unified view for users. Talend offers an open source tool called Talend Open Studio that allows users to visually design procedures to extract, transform, and load data between various databases and file types. It also offers features for data quality, storage optimization, master data management, and reporting.
Este documento describe los componentes y características clave de los sistemas de gestión de bases de datos. Explica que un SGBD almacena, modifica y extrae información de una base de datos utilizando lenguajes como SQL. Luego describe los componentes de un SGBD como el procesador de consultas, el gestor de almacenamiento, el diccionario de datos y módulos de seguridad. Finalmente, menciona algunos SGBD populares como PostgreSQL, MySQL, Microsoft SQL Server e Informix.
El documento describe las etapas del proceso de diseño de una base de datos, incluyendo el análisis de requisitos, el diseño conceptual, la elección del software, el diseño lógico y físico, e implementación. Explica el modelo entidad-relación para el diseño conceptual, con entidades, relaciones y atributos representados gráficamente.
El documento introduce los conceptos de inteligencia de negocios y sistemas de soporte a la decisión. Explica que la inteligencia de negocios analiza datos de la empresa para extraer conocimiento e información que apoye la toma de decisiones. También describe los diferentes tipos de sistemas de soporte a la decisión como los sistemas de información gerencial, sistemas de información ejecutiva y sistemas expertos basados en inteligencia artificial.
Este documento presenta las tres fases principales del diseño de una base de datos: el diseño conceptual, el diseño lógico y el diseño físico. En la fase de diseño conceptual, se identifican y documentan los requisitos de datos de la organización sin considerar aspectos tecnológicos. Luego, en el diseño lógico, se transforma el esquema conceptual en un modelo específico para un sistema de gestión de bases de datos. Finalmente, el diseño físico describe la implementación física de la base de datos en la memoria secundaria
What is Big Data?
Big Data Laws
Why Big Data?
Industries using Big Data
Current process/SW in SCM
Challenges in SCM industry
How Big data can solve the problems?
Migration to Big data for an SCM industry
Las bases de datos son conjuntos de datos almacenados sistemáticamente para su posterior uso. Una base de datos ofrece varias ventajas sobre los sistemas de archivos tradicionales, incluyendo la independencia lógica y física de los datos, la redundancia mínima, el acceso concurrente y la integridad de los datos. Los sistemas gestores de bases de datos (SGBD) actúan como interfaz entre la base de datos, los usuarios y las aplicaciones, permitiendo definir, acceder y manipular los datos de forma eficiente y segura.
Building a Data Strategy – Practical Steps for Aligning with Business GoalsDATAVERSITY
Developing a Data Strategy for your organization can seem like a daunting task – but it’s worth the effort. Getting your Data Strategy right can provide significant value, as data drives many of the key initiatives in today’s marketplace – from digital transformation, to marketing, to customer centricity, to population health, and more. This webinar will help demystify Data Strategy and its relationship to Data Architecture and will provide concrete, practical ways to get started.
Este documento provee una introducción a los conceptos clave de Business Intelligence (BI). Explica los componentes principales de BI como las fuentes de información, ETL, almacenes de datos, herramientas de BI, OLAP y visualización. También incluye secciones sobre calidad de datos, procesamiento de ETL, estrategias de construcción de almacenes de datos, y usuarios de herramientas BI.
El documento describe las aplicaciones, tecnologías y mejores prácticas de Big Data. Explica que Big Data involucra grandes volúmenes de datos estructurados y no estructurados de diversas fuentes que pueden analizarse para obtener información valiosa. Describe aplicaciones de Big Data en varias industrias y tecnologías clave como Hadoop, bases de datos no relacionales y columnares. También cubre mejores prácticas como partir de hipótesis, construir infraestructura flexible y permitir que empleados de distintas á
El documento identifica y analiza los riesgos asociados con un proyecto de ingeniería de software. Explica que la gestión de riesgos implica identificar, estimar y crear un plan para abordar los riesgos. Luego identifica varias categorías de riesgos técnicos, de negocio, de proyecto y más que podrían afectar el proyecto.
El documento describe un proyecto que tiene como objetivo aplicar un modelo predictivo de minería de datos para identificar patrones de comportamiento de clientes potenciales para la empresa Adventure Works. Se utilizará la base de datos Adventure Works y el algoritmo de árboles de decisión de Microsoft. El proceso incluye la preparación de datos, generación del modelo, y evaluación de los patrones de comportamiento de compra identificados.
El documento describe un proyecto que tiene como objetivo aplicar un modelo predictivo de minería de datos para identificar patrones de comportamiento de clientes potenciales para la empresa Adventure Works. Se utilizará la base de datos Adventure Works y el algoritmo de árboles de decisión de Microsoft. El modelo analizará atributos como edad, estado civil, ingresos y número de hijos para predecir qué clientes tendrían más probabilidades de comprar una bicicleta. Esto permitirá a Adventure Works enfocar su campaña de marketing a aquellos clientes con mayor potencial de compra.
Este documento describe los pasos para diseñar una base de datos, incluyendo el análisis, diseño conceptual, lógico y físico. Explica la importancia de normalizar las tablas, seleccionar los tipos de datos adecuados y almacenar solo la información necesaria para lograr una base de datos eficiente. El objetivo final es generar tablas que modelen los registros de información de una manera flexible, independiente de aplicaciones y que minimice la redundancia.
Este documento presenta una introducción al tema de la minería de datos. Explica que la minería de datos permite extraer información oculta de grandes volúmenes de datos almacenados analizando patrones y relaciones. Describe las fases del proceso de minería de datos, que incluyen filtrado, selección de variables, extracción de conocimiento e interpretación. También menciona algunas aplicaciones como marketing, predicción y control de calidad.
Este documento presenta una introducción al modelado de software orientado a objetos usando UML. Explica brevemente los conceptos clave de UML como diagramas, clases, relaciones, comportamientos y componentes. También describe el proceso de desarrollo de software basado en UML.
¿Qué es un modelo predictivo y para qué vale?Scoremind
Los modelos predictivos permiten estimar cual es el comportamiento esperado del cliente utilizando los datos de uso de los servicios.
Para el desarrollo de los modelos se utilizan técnicas analíticas (data mining).
Data Modelling 101 half day workshop presented by Chris Bradley at the Enterprise Data and Business Intelligence conference London on November 3rd 2014.
Chris Bradley is a leading independent information strategist.
Contact chris.bradley@dmadvisors.co.uk
Este documento trata sobre minería de datos. La minería de datos es el proceso de descubrir patrones en grandes volúmenes de datos. Utiliza métodos de inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. Algunas técnicas comunes de minería de datos son la clasificación, regresión, agrupamiento y reglas de asociación. La minería de datos se aplica en diversos campos como finanzas, mercadeo, salud y educación.
El documento introduce los conceptos de data warehouse, datamart y sus características. Un data warehouse es un repositorio unificado de datos de toda la empresa para fines analíticos, que puede ser físico o lógico. Los datamarts son bases de datos departamentales especializadas en un área de negocio que ofrecen ventajas como menor volumen de datos y mayor rapidez de consulta.
Talend provides data integration and management solutions. It focuses on combining data from different sources into a unified view for users. Talend offers an open source tool called Talend Open Studio that allows users to visually design procedures to extract, transform, and load data between various databases and file types. It also offers features for data quality, storage optimization, master data management, and reporting.
Este documento describe los componentes y características clave de los sistemas de gestión de bases de datos. Explica que un SGBD almacena, modifica y extrae información de una base de datos utilizando lenguajes como SQL. Luego describe los componentes de un SGBD como el procesador de consultas, el gestor de almacenamiento, el diccionario de datos y módulos de seguridad. Finalmente, menciona algunos SGBD populares como PostgreSQL, MySQL, Microsoft SQL Server e Informix.
El documento describe las etapas del proceso de diseño de una base de datos, incluyendo el análisis de requisitos, el diseño conceptual, la elección del software, el diseño lógico y físico, e implementación. Explica el modelo entidad-relación para el diseño conceptual, con entidades, relaciones y atributos representados gráficamente.
El documento introduce los conceptos de inteligencia de negocios y sistemas de soporte a la decisión. Explica que la inteligencia de negocios analiza datos de la empresa para extraer conocimiento e información que apoye la toma de decisiones. También describe los diferentes tipos de sistemas de soporte a la decisión como los sistemas de información gerencial, sistemas de información ejecutiva y sistemas expertos basados en inteligencia artificial.
Este documento presenta las tres fases principales del diseño de una base de datos: el diseño conceptual, el diseño lógico y el diseño físico. En la fase de diseño conceptual, se identifican y documentan los requisitos de datos de la organización sin considerar aspectos tecnológicos. Luego, en el diseño lógico, se transforma el esquema conceptual en un modelo específico para un sistema de gestión de bases de datos. Finalmente, el diseño físico describe la implementación física de la base de datos en la memoria secundaria
What is Big Data?
Big Data Laws
Why Big Data?
Industries using Big Data
Current process/SW in SCM
Challenges in SCM industry
How Big data can solve the problems?
Migration to Big data for an SCM industry
Las bases de datos son conjuntos de datos almacenados sistemáticamente para su posterior uso. Una base de datos ofrece varias ventajas sobre los sistemas de archivos tradicionales, incluyendo la independencia lógica y física de los datos, la redundancia mínima, el acceso concurrente y la integridad de los datos. Los sistemas gestores de bases de datos (SGBD) actúan como interfaz entre la base de datos, los usuarios y las aplicaciones, permitiendo definir, acceder y manipular los datos de forma eficiente y segura.
Building a Data Strategy – Practical Steps for Aligning with Business GoalsDATAVERSITY
Developing a Data Strategy for your organization can seem like a daunting task – but it’s worth the effort. Getting your Data Strategy right can provide significant value, as data drives many of the key initiatives in today’s marketplace – from digital transformation, to marketing, to customer centricity, to population health, and more. This webinar will help demystify Data Strategy and its relationship to Data Architecture and will provide concrete, practical ways to get started.
Este documento provee una introducción a los conceptos clave de Business Intelligence (BI). Explica los componentes principales de BI como las fuentes de información, ETL, almacenes de datos, herramientas de BI, OLAP y visualización. También incluye secciones sobre calidad de datos, procesamiento de ETL, estrategias de construcción de almacenes de datos, y usuarios de herramientas BI.
El documento describe las aplicaciones, tecnologías y mejores prácticas de Big Data. Explica que Big Data involucra grandes volúmenes de datos estructurados y no estructurados de diversas fuentes que pueden analizarse para obtener información valiosa. Describe aplicaciones de Big Data en varias industrias y tecnologías clave como Hadoop, bases de datos no relacionales y columnares. También cubre mejores prácticas como partir de hipótesis, construir infraestructura flexible y permitir que empleados de distintas á
El documento identifica y analiza los riesgos asociados con un proyecto de ingeniería de software. Explica que la gestión de riesgos implica identificar, estimar y crear un plan para abordar los riesgos. Luego identifica varias categorías de riesgos técnicos, de negocio, de proyecto y más que podrían afectar el proyecto.
El documento describe un proyecto que tiene como objetivo aplicar un modelo predictivo de minería de datos para identificar patrones de comportamiento de clientes potenciales para la empresa Adventure Works. Se utilizará la base de datos Adventure Works y el algoritmo de árboles de decisión de Microsoft. El proceso incluye la preparación de datos, generación del modelo, y evaluación de los patrones de comportamiento de compra identificados.
El documento describe un proyecto que tiene como objetivo aplicar un modelo predictivo de minería de datos para identificar patrones de comportamiento de clientes potenciales para la empresa Adventure Works. Se utilizará la base de datos Adventure Works y el algoritmo de árboles de decisión de Microsoft. El modelo analizará atributos como edad, estado civil, ingresos y número de hijos para predecir qué clientes tendrían más probabilidades de comprar una bicicleta. Esto permitirá a Adventure Works enfocar su campaña de marketing a aquellos clientes con mayor potencial de compra.
Este eBook está dirigido a emprendedores, autónomos y pequeñas empresas que se adentran en el apasionante mundo digital y que buscan encontrar a través del uso de nuevas tecnologías oportunidades que impacten de manera positiva en la gestión de su organización.
Autor: BENITO PERAL MANZANO
Publicado originalmente por IdeasParaTuEmpresa.es
El documento presenta un manual para el diseño e implementación de bases de datos OLAP y su aplicación en inteligencia de negocios. Explica las diferencias entre bases de datos OLTP y OLAP, y cómo estas se relacionan para crear aplicaciones de BI. Luego, provee una guía paso a paso para la creación de un cubo OLAP a partir de datos transaccionales, incluyendo la definición de dimensiones, medidas y procedimientos de carga. El objetivo final es proveer una herramienta útil para el diseño e implementación de soluciones de BI.
Este trabajo se focaliza en medir el grado de adopción de las TIC en las empresas de servicios de Colombia, a partir de índices compuestos y luego investigar cuáles son los factores determinantes de la difusión de las TIC en las empresas de servicios, así como el impacto de las TIC (tanto en términos de inversión como de uso) en la productividad laboral.
El siguiente trabajo realiza un aporte a la medición del avance de las nuevas tecnologías de la información y de la comunicación (TIC) a nivel empresarial en el sector de servicios de Colombia. En primer lugar, se presenta la elaboración de un índice compuesto IUPITIC (Índice de Uso, Preparación e Impacto de las TIC) construido principalmente sobre la base de la Encuesta Anual de Servicios EAS 2008. En segundo lugar, se estima un modelo sobre los determinantes de la adopción de las TIC en servicios, hallando los signos esperados por la literatura en las variables explicativas consideradas. En tercer lugar, se analiza un modelo de productividad laboral de las empresas de servicios que incluye la incidencia de la inversión y uso de las TIC diferenciando por tamaño de empresas, donde los resultados indican que éstas producen un incremento en la productividad. Por último, se replican los modelos estimados para el caso del sector restaurante y hoteles.
Adaptación del modelo black scholes en la simulacion de un portafolio de acci...Mono Ferreira
Este documento presenta una tesis realizada en la Pontificia Universidad Católica del Perú sobre la adaptación del modelo Black-Scholes en la simulación de un portafolio de acciones. El modelo Black-Scholes estima el valor de las acciones usando un movimiento browniano geométrico. La autora simula los precios de cuatro empresas representativas del mercado peruano usando el software Scilab y luego propone mejoras al modelo Black-Scholes modificando el valor de la volatilidad para estimar mejor los precios de las acciones.
El documento presenta una guía para el uso de Microsoft Office Project Professional 2013. Explica cómo crear y administrar proyectos, incluyendo la definición de tareas, asignación de recursos, seguimiento del progreso, y generación de informes. También cubre temas como la creación de calendarios, vínculos entre tareas, análisis de ruta crítica, y presupuestos. El objetivo es orientar al usuario sobre las diversas funciones de la herramienta para la gestión efectiva de proyectos.
Ejercicio de clase: Desarrollo de Productos Audiovisuales Multimedia Interactivos...
AVISO LEGAL La presente publicación pertenece al Observatorio Regional de la Sociedad de la Información de Castilla y León (ORSI) y al Consejo Regional de Cámaras de Comercio e Industria de Castilla y León y está bajo una licencia Creative Commons Reconocimiento-NoComercial 3.0 España.
Este documento presenta el plan de marketing digital de la empresa Issa Make Up para el año 2020, el cual incluye un análisis situacional de la identidad corporativa, buyer personas, competencia y canales digitales. También describe los objetivos, estrategias, tácticas y acciones de marketing, así como los resultados obtenidos en plataformas como el sitio web, redes sociales y correo electrónico.
Las bases de datos son centros de información de grandes y pequeñas empresas. Por ello es de gran importancia una buena gestión, administración y seguridad ya que contienen información valiosa para cada entidad. Este documento presenta información básica que dará mayor conocer al investigador. Ya que contiene herramientas necesarias para la aplicación en la administración de base de datos.
Este documento proporciona instrucciones prácticas y teóricas para el uso de Microsoft Access. Incluye ejemplos de cómo crear tablas, consultas, formularios e informes, así como cómo establecer relaciones entre tablas. También incluye ejercicios prácticos para que los lectores apliquen los conceptos aprendidos.
Este documento describe los sistemas de información y su uso en las organizaciones. Explica que los sistemas de información automatizan procesos, apoyan la toma de decisiones y logran ventajas competitivas. Describe tres tipos principales de sistemas: sistemas transaccionales que automatizan procesos operativos, sistemas de apoyo a la administración que brindan información para la toma de decisiones, y sistemas estratégicos que logran ventajas competitivas a través de la tecnología de la información. También cub
Este documento presenta una guía para el uso de las herramientas de secciones, tablas de contenido, tablas de ilustraciones e índices en Microsoft Word 2010. El objetivo general es desarrollar las habilidades de los usuarios para manipular estas herramientas. Se explican los pasos para aplicar diferentes tipos de secciones, crear y personalizar tablas de contenido, generar tablas de ilustraciones e índices, y se incluyen ejemplos prácticos en los anexos.
Este documento resume una investigación sobre el programa contable de código abierto GNUCash. Explica las funcionalidades principales de GNUCash como contabilidad de cuentas, control de gastos e ingresos, y generación de informes e gráficos. También compara GNUCash con software contable comercial como Aspel COI, Pacioli y Contawin, destacando las ventajas del código abierto como ser gratuito frente a los costos de licencias propietarios. Finalmente, presenta los resultados de una encuesta a un despacho contable sobre su uso de software.
Este documento presenta información sobre el software de contabilidad libre GNUCash. Explica que GNUCash permite gestionar diferentes tipos de cuentas y controlar gastos e ingresos de manera eficiente. También describe algunas de sus funcionalidades como contabilidad de diversas cuentas, control de gastos e ingresos, e informes y gráficos. Finalmente, brinda detalles sobre cómo descargar e instalar GNUCash en diferentes sistemas operativos.
La energía radiante es una forma de energía que
se transmite en forma de ondas
electromagnéticas esta energía se propaga a
través del vacío y de ciertos medios materiales y
es fundamental en una variedad naturales y
tecnológicos
1. UNIVERSIDAD AUTÓNOMA GABRIEL RENÉ MORENO
FACULTAD DE INGENIERÍA EN CIENCIAS DE LA COMPUTACIÓN
Y TELECOMUNICACIONES
IMPLEMENTACIÓN DE MINERÍA DE DATOS PARA
PREDICIR QUE CLIENTES TIENEN MAYOR
PROBABILIDAD DE COMPRA PARA LA EMPRESA
“ADVENTURE WORKS”
TRABAJO DE INVESTIGACIÓN
CORRESPONDIENTE AL PROGRAMA “CIENCIA Y MINERÍA DE DATOS”
AUTOR:
Rojas Valdez Gustavo Rene
Dorado Medeiros Maria Nazarena
Ticona Angles Noemi
TUTOR:
Ing. David Mendoza Gutiérrez
Marzo 2021
Santa Cruz de la Sierra – Bolivia
2. Página | 1
DEDICATORIA
A:
A Dios, por tantas bendiciones para mi persona y darme las fuerzas para no desistir en los
estudios y poder así demostrar que puedo lograrlo.
A mis padres, por su incondicional apoyo en toda mi etapa académica.
A mis docentes, quienes me transmitieron sus conocimientos y ser una fuente de sabiduría digna
de admirar e imitar para mi futuro profesional.
3. Página | 2
AGRADECIMIENTOS
A:
A Dios, por la vida llena de bendiciones que me ha dado, por la salud, la familia y su infinito
amor y bondad.
A mi familia, quien ha sido mi apoyo y ganas de seguir adelante en todo momento.
A mis docentes, quienes han sido mis guías en toda mi etapa académica, transmitiendo sus
grandes conocimientos para mi formación profesional.
4. Página | 3
RESUMEN
El presente proyecto tiene como objetivo aplicar un modelo predictivo de minería de datos,
enfocado a prospectar clientes para la comercialización de un nuevo producto, para la empresa
“Adventure Works”. Esto con el propósito de poder hacer una campaña de marketing focalizada,
en primera etapa, a sólo los que realmente tendrán posibilidades de compra.
Para ello se utilizará como metodología la estructura de minería de datos y el algoritmo de
clasificación árboles de decisiones de Microsoft, para el modelado predictivo.
Las herramientas que nos ayudarán a identificar los factores claves que necesitamos conocer, son
SQL Server Data Tool y SQL Analysis Services Server mediante SQL Server Management Studio.
Aplicando en ambas sus correspondientes funciones para así generar el modelo de minería de datos
y aplicar su correspondiente predicción.
5. Página | 4
ABSTRACT
The objective of this project is to apply a predictive data mining model, focused on prospecting
customers for the commercialization of a new product for the company "Adventure Works". This
with the purpose of being able to make a marketing campaign focused, in the first stage, to only
those who will really have the possibility of buying.
For this purpose, the data mining structure and the Microsoft decision tree classification algorithm
will be used as a methodology for predictive modeling.
The tools that will help us to identify the key factors that we need to know are SQL Server Data
Tool and SQL Analysis Service Server through SQL Server Management Studio. Applying in both
their corresponding functions to generate the data mining model and apply its corresponding
prediction.
6. Página | 5
ÍNDICE DE CONTENIDO
CONTENIDO
CAPÍTULO I INTRODUCCIÓN................................................................................................ 1
1.1 ANTECEDENTES............................................................................................................... 1
PLANTEAMIENTO DEL PROBLEMA........................................................................................ 2
2.1 OBJETIVOS......................................................................................................................... 2
OBJETIVO GENERAL .................................................................................................................. 2
OBJETIVOS ESPECÍFICOS.......................................................................................................... 2
CAPÍTULO II BASE DE DATOS............................................................................................... 4
2.1 ADVENTURE WORKS...................................................................................................... 4
CAPÍTULO III LA ESTRUCTURA DE LA MINERÍA DE DATOS ..................................... 5
3.1 ÁRBOLES DE DECISIONES............................................................................................. 5
DEFINICIÓN.................................................................................................................................. 5
DESCRIPCIÓN............................................................................................................................... 5
REQUISITOS.................................................................................................................................. 5
4.1 MODELADO....................................................................................................................... 6
ORIGEN DE DATOS (DATA SOURCES) ................................................................................... 6
VISTA DE ORÍGENES DE DATOS (DATA SOURCE VIEWS) ................................................ 7
ESTRUCTURA DE MINERÍA DE DATOS (MINING STRUCTURES) .................................. 11
ESPECIFICACIÓN DE DATOS DE ENTRENAMIENTO ........................................................ 14
PREDICCIÓN:.............................................................................................................................. 19
5.1 RESULTADOS.................................................................................................................. 23
INFORME GENERADO DE PREDICCIÓN DE CLIENTES CON MAYOR PROBABILIDAD
DE COMPRA................................................................................................................................ 23
6.1 CONCLUSIONES ............................................................................................................. 25
7.1 BIBLIOGRAFÍA................................................................................................................ 26
7. Página | 6
ÍNDICE DE ILUSTRACIONES
Ilustración 1: Diagrama ADVENTURE BD WORKS. ........................................................................................................................... 4
Ilustración 2: Conexión manager de Data Sources en Data Tools. .............................................................................................. 6
Ilustración 3: Selección de Data Sources en Data Tools. .................................................................................................................. 7
Ilustración 4: Selección a data source en Data Tools. ....................................................................................................................... 8
Ilustración 5: Selección tablas y views en data tools ......................................................................................................................... 9
Ilustración 6: Data Source Views en Data Tools. ...............................................................................................................................10
Ilustración 7: Creación de la data Mining Structure en Data Tools. .........................................................................................12
Ilustración 8: Selección de Tablas en Data Tools. .............................................................................................................................13
Ilustración 9: Specifiy the Training Data en Data Tools. ...............................................................................................................14
Ilustración 10: Specifiy Columns en Data Tools. ................................................................................................................................16
Ilustración 11: Create Testing Set en Data Tools. .............................................................................................................................17
Ilustración 12: Ejecución de modelado. ................................................................................................................................................19
Ilustración 13: Selección de tabla de casos. ........................................................................................................................................20
Ilustración 14: Selección de tabla de casos. ........................................................................................................................................20
Ilustración 15: Creación de la relación con la tabla de casos. .....................................................................................................21
Ilustración 16: Ejecución de modelado. ................................................................................................................................................ 22
Ilustración 17: Resultado de predicción. ..............................................................................................................................................23
Ilustración 18: Resultado informe de probabilidad de compra generado. .............................................................................24
8. Página | 1
CAPÍTULO I
INTRODUCCIÓN
1.1 ANTECEDENTES
La empresa “Adventure Works” se dedica a la comercialización de bicicletas. La demanda interna
de bicicletas básicamente está constituida por usuarios jóvenes o niños, de arraigo cultural y
mayormente en los niveles socioeconómicos menos favorecidos.
A nivel internacional se observa una tendencia hacia un transporte más sostenibles y el uso de la
bicicleta se volvió una tendencia actual. El Worldwide Cycling Índex (Índice Ciclista Mundial)
estima desde 2014 la progresión general del tráfico de bicicletas por país y ciudad de forma anual.
Para ello sus responsables utilizan datos de más de 3.000 contadores automáticos instalados en
bicicletas en 39 países. Según su edición más reciente de 2019, el uso de la bicicleta a nivel mundial
ha aumentado en un 6%, en comparación con los datos de 2017 y 2018.
La bicicleta es un medio de transporte sostenible, sencillo, asequible, fiable, limpio y ecológico
que contribuye a la gestión ambiental y beneficia la salud. Puede servir como instrumento para el
desarrollo, no solo como medio de transporte, sino también al facilitar el acceso a la educación, la
atención de la salud y el deporte. Entonces la relación entre la bicicleta y su usuario fomenta la
creatividad y la participación social; asimismo, permite al ciclista conocer de primera mano el
entorno local. Por lo tanto, es un símbolo del transporte sostenible y transmite un mensaje positivo
para fomentar el consumo y la producción sostenibles; además, repercute beneficiosamente en el
clima.
9. Página | 2
PLANTEAMIENTO DEL PROBLEMA
La toma de decisiones en una empresa tiene como fin encontrar las mejores soluciones en cada
momento. Es un proceso que debe alinearse con los objetivos de la sociedad y las circunstancias
internas y externas.
La empresa Adventure Works pretende aumentar sus ventas de bicicletas, y se ve en la necesidad
de saber quiénes son sus clientes potenciales y las probabilidades que tiene estos de comprar y así
posteriormente poder realizar una campaña de marketing focalizada y objetiva, en base al estudio
correspondiente.
Adventure Works adquirió la compra de una base de datos con las características más relevantes
de los compradores habituales de este producto en otras latitudes, con tal de poder hacer una
campaña de marketing enfocada a los clientes que tendrían más posibilidad de compra.
Se pretende, a través de un modelo de minería de datos, identificar los clientes potenciales.
2.1 OBJETIVOS
OBJETIVO GENERAL
Generar un modelo de minería de datos para evaluar y predecir que clientes tienen mayor
probabilidad de compra de un producto, de la empresa Adventure Works.
OBJETIVOS ESPECÍFICOS
• Definir el problema
• Preparar los datos
• Explorar datos.
10. Página | 3
• Generar un modelo de minería de datos utilizando el algoritmo árboles de decisiones de
Microsoft.
• Explorar y validar el modelo de minería de datos.
• Utilizar la tabla Clientes como casos de prueba y la tabla ProspectiveBuyer, como posibles
clientes para evaluar su probabilidad de compra.
• Aplicar una predicción de datos sobre el campo ProspectiveBuyer, para así poder generar
un informe de predicción de minería de datos y obtener el listado de clientes con mayor
probabilidad de compra.
• Evaluar la probabilidad de compra con las entidades ProspectiveBuyer.
11. Página | 4
CAPÍTULO II
BASE DE DATOS
2.1 ADVENTURE WORKS
Ilustración 1: Diagrama ADVENTURE BD WORKS.
Fuente: Elaboración propia
12. Página | 5
CAPÍTULO III
LA ESTRUCTURA DE LA MINERÍA DE DATOS
3.1 ÁRBOLES DE DECISIONES
DEFINICIÓN
El algoritmo de árboles de decisión de Microsoft es un algoritmo de clasificación que funciona
bien para el modelado predictivo. El algoritmo admite la predicción de atributos tanto discretos
como continuos.
DESCRIPCIÓN
Para los atributos discretos, el algoritmo hace predicciones basándose en las relaciones entre las
columnas de entrada de un conjunto de datos. Utiliza los valores, conocidos como estados, de estas
columnas para predecir los estados de una columna que se designa como elemento de predicción.
Específicamente, el algoritmo identifica las columnas de entrada que se correlacionan con la
columna de predicción.
Por ejemplo, en un escenario para predecir que clientes podrían comprar una bicicleta y los factores
que pudieran influir como el nombre, edad, estado civil, cantidad de hijos, etc. El algoritmo infiere
que la edad es un buen elemento de predicción en la compra. El árbol de decisión realiza
predicciones basándose en la tendencia hacia un resultado concreto
REQUISITOS
Los requisitos para un modelo de árbol de decisión son los siguientes:
Una columna de una sola clave: cada modelo debe contener una columna numérica o de texto
que identifique cada registro de manera única. No están permitidas las claves compuestas.
13. Página | 6
Una columna de predicción: Se requiere al menos una columna de predicción. Puede incluir
varios atributos de predicción en un modelo y pueden ser de tipos diferentes, numérico o discreto.
Sin embargo, el incremento del número de atributos de predicción puede aumentar el tiempo de
procesamiento.
Columnas de entrada: Se requieren columnas de entrada, que pueden ser discretas o continuas.
Aumentar el número de atributos de entrada afecta al tiempo de procesamiento.
4.1 MODELADO
ORIGEN DE DATOS (DATA SOURCES)
Partiendo de la base de datos ADVENTURE WORKS agregada en SQL SERVER como
prerrequisito, realizamos la configuración de una conexión a una base de datos desde un servidor
(Data sources).
Ilustración 2: Conexión manager de Data Sources en Data Tools.
Fuente: Elaboración Propia.
14. Página | 7
Ilustración 3: Selección de Data Sources en Data Tools.
Fuente: Elaboración Propia.
VISTA DE ORÍGENES DE DATOS (DATA SOURCE VIEWS)
La vista de orígenes de datos es vistas unificadas de los metadatos, desde las tablas y vistas
seleccionadas en los orígenes de datos. Creamos un origen de datos y en este visualizamos las
tablas y vistas de la base de datos “AdventureWorks” previamente cargada. Posteriormente
procederemos a visualizar las tablas y seleccionas las tablas que requieren para esta predicción.
15. Página | 8
Ilustración 4: Selección a data source en Data Tools.
Fuente: Elaboración Propia.
16. Página | 9
Ilustración 5: Selección tablas y views en data tools.
Fuente: Elaboración propia.
Las tablas y vistas a seleccionar para esta predicción son las siguientes:
● dbo.ProspectiveBuyer (Tabla)
● dbo.vAssocSeqLineItems (Vista)
● dbo.vAssocSeqOrders (Vista)
● dbo.vTargetMail (Vista)
● dbo.vTimeSeries (Vista)
17. Página | 10
Ilustración 6: Data Source Views en Data Tools.
Fuente: Elaboración Propia.
Modificar la vista de origen datos en este paso nos permite modificar cualquier objeto qué sea más
significativo para el objetivo, sin modificar el origen de datos original, pero se puede asignar un
18. Página | 11
nombre descriptivo o una relación entre tablas o vistas. Para nuestro objetivo procederemos a crear
una relación entre las vistas dbo.vAssocSeqLineItems y dbo.vAssocSeqOrders el cual es una
relación de muchos a uno.
ESTRUCTURA DE MINERÍA DE DATOS (MINING STRUCTURES)
Habilitamos el asistente de minería de datos para crear una estructura de minería de datos y
posteriormente seleccionar el “algoritmo de árboles de decisión” como técnica de minería de datos
19. Página | 12
a utilizar. .
Ilustración 7: Creación de la data Mining Structure en Data Tools.
Fuente: Elaboración Propia.
20. Página | 13
Ilustración 8: Selección de Tablas en Data Tools.
Fuente: Elaboración Propia.
De las tablas listadas anteriormente seleccionamos el escenario en este caso vTargetMail.
21. Página | 14
Posteriormente procedemos a especificar los datos de entrenamiento en este caso nuestra variable
de predicción será BikeBuyer.
Ilustración 9: Specifiy the Training Data en Data Tools.
Fuente: Elaboración Propia.
ESPECIFICACIÓN DE DATOS DE ENTRENAMIENTO
Columna Clave Entrada Predicción
PredictionCustomer x
BikeBuyer x x
Age x
22. Página | 15
CustomerKey x
EnglishEducation x
EnglishOccupation x
FirstName x
Gender x
Geographykey x
HouseOwnerFlag x
LastName x
MaritalStatus x
NumberCarsOwned x
NumberChildrenAtH
ome
x
Region x
TotalChildren x
YearlyIncome x
23. Página | 16
A Continuación, especificamos el contenido y el tipo de datos de las columnas y detectamos los
datos continuos y discretos para cada columna.
Ilustración 10: Specifiy Columns en Data Tools.
Fuente: Elaboración Propia.
24. Página | 17
Seguidamente creamos el conjunto de datos de prueba con un porcentaje de datos de 30%.
Ilustración 11: Create Testing Set en Data Tools.
Fuente: Elaboración Propia.
25. Página | 18
Finalmente tenemos la vista de datos a procesar:
Hasta este punto tenemos creado el modelo de minería de datos para el algoritmo de árbol de
decisión y podemos crear otros modelos en este caso utilizaremos dos modelos adicionales que son
el algoritmo de Cluster y Naive Bayes.
26. Página | 19
Y procedemos a la ejecución de cada uno de estos modelos:
Ilustración 12: Ejecución de modelado.
Fuente: Elaboración Propia.
PREDICCIÓN
El generado de consultas de predicción ofrece tres operaciones de arrastras y colocar para crear las
consultas y tiene las siguientes vistas:
• DISEÑO: Del modelo de minería de datos seleccionamos la tabla de casos para realizar la
predicción en este caso la tabla es ProspectiveBuyer.
27. Página | 20
Ilustración 13: Selección de tabla de casos.
Fuente: Elaboración Propia.
Ilustración 14: Selección de tabla de casos.
Fuente: Elaboración Propia.
28. Página | 21
Después de seleccionar la tabla de entrada, el Generador de consultas de predicción crea
una asignación predeterminada entre el modelo de minería de datos y la tabla de entrada,
en función de los nombres de las columnas.
Ilustración 15: Creación de la relación con la tabla de casos.
Fuente: Elaboración Propia.
• CONSULTA DE PREDICCIÓN:
Posteriormente diseño procedemos a la agregación de un identificador único a la consulta
de predicción para que pueda identificar quién es más y menos probable que compre una
bicicleta, y quién es menos probable. En la columna Origen de la cuadrícula de la ficha
Predicción de modelo de minería de datos, haga clic en la celda de la primera fila vacía y,
a continuación, selecionas ProspectiveBuyer.
29. Página | 22
Ilustración 16: Ejecución de modelado.
Fuente: Elaboración Propia.
Para armar esta consulta al finalizar tendremos:
ORIGEN CAMPO
PerspectiveBuyer (Table) PerspectiveAlternativeKey
TM_desicion_tree (árbol de decisión) bikeBuyer
Funcion de predicción PredictProbality (Criterio de argumento
TM_desicion_tree.bikeBuyer)
30. Página | 23
• RESULTADO
Finalmente vamos a la vista de resultados para ver la probabilidad de compra que tiene un
determinado cliente.
Ilustración 17: Resultado de predicción.
Fuente: Elaboración Propia.
5.1 RESULTADOS
INFORME GENERADO DE PREDICCIÓN DE CLIENTES CON MAYOR
PROBABILIDAD DE COMPRA
Una vez elaborada y guardada la query, se genera una tabla y generamos como informe de
predicción de minería de datos, obteniendo el listado de clientes con mayor probabilidad de
compra. Lo mismo que se muestra en el resultado del modelo, manteniendo así la integridad de los
datos.
31. Página | 24
En el siguiente resultado se puede notar que el cliente con id 467 tiene un 63% de probabilidad de
compra de una bicicleta.
Ilustración 18: Resultado informe de probabilidad de compra generado.
Fuente: Elaboración Propia.
32. Página | 25
6.1 CONCLUSIONES
• Con el presente proyecto logramos encontrar posibles clientes potenciales con mayor
probabilidad de compra para poder realizar una toma de decisiones, para el marketing
focalizado que pretende realizar la empresa Adventure Works.
• El aprovechamiento de la minería de datos permite ahorrar grandes cantidades de dinero a
una empresa y abre nuevas oportunidades de negocios.
• Asimismo, podemos analizar las condiciones del mercado, la competencia y aprovechar las
oportunidades de crecimiento.
• En referencia al ámbito empresarial, podemos decir que los árboles de decisión son
diagramas de ediciones secuenciales que nos muestran sus posibles resultados. Estos
ayudan a las empresas a determinar cuáles son sus opciones al mostrarles las distintas
decisiones y sus resultados
33. Página | 26
7.1 BIBLIOGRAFÍA
1. Minería de datos. (2020). Recuperado el 25 marzo 2021, de
https://es.wikipedia.org/wiki/Minería_de_datos
2. Conceptos de minería de datos. (2019). Recuperado 25 marzo 2021, de
https://docs.microsoft.com/es-es/analysis-services/data-mining/data-mining-
concepts?view=asallproducts-allversions
3. Referencia técnica del algoritmo de árboles de decisión de Microsoft. (2018). Recuperado 25
de marzo 2021, de https://docs.microsoft.com/es-es/analysis-services/data-mining/microsoft-
decision-trees-algorithm-technical-reference?view=asallproducts-allversions
4. Microsoft Decision Trees Algorithm. (2018). Recuperado 27 marzo 2021, de
https://docs.microsoft.com/en-us/analysis-services/data-mining/microsoft-decision-trees-
algorithm?view=asallproducts-allversions
5. Ejemplos de consultas de modelos de árboles de decisión. (2018). Retrieved 25 marzo 2021,
de https://docs.microsoft.com/es-es/analysis-services/data-mining/decision-trees-model-query-
examples?view=asallproducts-allversions
6. Using Decision Trees in SQL Server – SQL Server Performance. (2012). Recuperado 27 marzo
2021, de https://www.sql-server-performance.com/decision-trees-sql-server/
7. Asanka, Dinesh. (2019). Microsoft Decision Trees in SQL Server. Recuperado 15 marzo 2021,
de https://www.sqlshack.com/microsoft-decision-trees-in-sql-server/