SlideShare una empresa de Scribd logo
UNIVERSIDAD AUTÓNOMA GABRIEL RENÉ MORENO
FACULTAD DE INGENIERÍA EN CIENCIAS DE LA COMPUTACIÓN
Y TELECOMUNICACIONES
IMPLEMENTACIÓN DE MINERÍA DE DATOS PARA
PREDICIR QUE CLIENTES TIENEN MAYOR
PROBABILIDAD DE COMPRA PARA LA EMPRESA
“ADVENTURE WORKS”
TRABAJO DE INVESTIGACIÓN
CORRESPONDIENTE AL PROGRAMA “CIENCIA Y MINERÍA DE DATOS”
AUTOR:
Rojas Valdez Gustavo Rene
Dorado Medeiros Maria Nazarena
Ticona Angles Noemi
TUTOR:
Ing. David Mendoza Gutiérrez
Marzo 2021
Santa Cruz de la Sierra – Bolivia
Página | 1
DEDICATORIA
A:
A Dios, por tantas bendiciones para mi persona y darme las fuerzas para no desistir en los
estudios y poder así demostrar que puedo lograrlo.
A mis padres, por su incondicional apoyo en toda mi etapa académica.
A mis docentes, quienes me transmitieron sus conocimientos y ser una fuente de sabiduría digna
de admirar e imitar para mi futuro profesional.
Página | 2
AGRADECIMIENTOS
A:
A Dios, por la vida llena de bendiciones que me ha dado, por la salud, la familia y su infinito
amor y bondad.
A mi familia, quien ha sido mi apoyo y ganas de seguir adelante en todo momento.
A mis docentes, quienes han sido mis guías en toda mi etapa académica, transmitiendo sus
grandes conocimientos para mi formación profesional.
Página | 3
RESUMEN
El presente proyecto tiene como objetivo aplicar un modelo predictivo de minería de datos,
enfocado a prospectar clientes para la comercialización de un nuevo producto, para la empresa
“Adventure Works”. Esto con el propósito de poder hacer una campaña de marketing focalizada,
en primera etapa, a sólo los que realmente tendrán posibilidades de compra.
Para ello se utilizará como metodología la estructura de minería de datos y el algoritmo de
clasificación árboles de decisiones de Microsoft, para el modelado predictivo.
Las herramientas que nos ayudarán a identificar los factores claves que necesitamos conocer, son
SQL Server Data Tool y SQL Analysis Services Server mediante SQL Server Management Studio.
Aplicando en ambas sus correspondientes funciones para así generar el modelo de minería de datos
y aplicar su correspondiente predicción.
Página | 4
ABSTRACT
The objective of this project is to apply a predictive data mining model, focused on prospecting
customers for the commercialization of a new product for the company "Adventure Works". This
with the purpose of being able to make a marketing campaign focused, in the first stage, to only
those who will really have the possibility of buying.
For this purpose, the data mining structure and the Microsoft decision tree classification algorithm
will be used as a methodology for predictive modeling.
The tools that will help us to identify the key factors that we need to know are SQL Server Data
Tool and SQL Analysis Service Server through SQL Server Management Studio. Applying in both
their corresponding functions to generate the data mining model and apply its corresponding
prediction.
Página | 5
ÍNDICE DE CONTENIDO
CONTENIDO
CAPÍTULO I INTRODUCCIÓN................................................................................................ 1
1.1 ANTECEDENTES............................................................................................................... 1
PLANTEAMIENTO DEL PROBLEMA........................................................................................ 2
2.1 OBJETIVOS......................................................................................................................... 2
OBJETIVO GENERAL .................................................................................................................. 2
OBJETIVOS ESPECÍFICOS.......................................................................................................... 2
CAPÍTULO II BASE DE DATOS............................................................................................... 4
2.1 ADVENTURE WORKS...................................................................................................... 4
CAPÍTULO III LA ESTRUCTURA DE LA MINERÍA DE DATOS ..................................... 5
3.1 ÁRBOLES DE DECISIONES............................................................................................. 5
DEFINICIÓN.................................................................................................................................. 5
DESCRIPCIÓN............................................................................................................................... 5
REQUISITOS.................................................................................................................................. 5
4.1 MODELADO....................................................................................................................... 6
ORIGEN DE DATOS (DATA SOURCES) ................................................................................... 6
VISTA DE ORÍGENES DE DATOS (DATA SOURCE VIEWS) ................................................ 7
ESTRUCTURA DE MINERÍA DE DATOS (MINING STRUCTURES) .................................. 11
ESPECIFICACIÓN DE DATOS DE ENTRENAMIENTO ........................................................ 14
PREDICCIÓN:.............................................................................................................................. 19
5.1 RESULTADOS.................................................................................................................. 23
INFORME GENERADO DE PREDICCIÓN DE CLIENTES CON MAYOR PROBABILIDAD
DE COMPRA................................................................................................................................ 23
6.1 CONCLUSIONES ............................................................................................................. 25
7.1 BIBLIOGRAFÍA................................................................................................................ 26
Página | 6
ÍNDICE DE ILUSTRACIONES
Ilustración 1: Diagrama ADVENTURE BD WORKS. ........................................................................................................................... 4
Ilustración 2: Conexión manager de Data Sources en Data Tools. .............................................................................................. 6
Ilustración 3: Selección de Data Sources en Data Tools. .................................................................................................................. 7
Ilustración 4: Selección a data source en Data Tools. ....................................................................................................................... 8
Ilustración 5: Selección tablas y views en data tools ......................................................................................................................... 9
Ilustración 6: Data Source Views en Data Tools. ...............................................................................................................................10
Ilustración 7: Creación de la data Mining Structure en Data Tools. .........................................................................................12
Ilustración 8: Selección de Tablas en Data Tools. .............................................................................................................................13
Ilustración 9: Specifiy the Training Data en Data Tools. ...............................................................................................................14
Ilustración 10: Specifiy Columns en Data Tools. ................................................................................................................................16
Ilustración 11: Create Testing Set en Data Tools. .............................................................................................................................17
Ilustración 12: Ejecución de modelado. ................................................................................................................................................19
Ilustración 13: Selección de tabla de casos. ........................................................................................................................................20
Ilustración 14: Selección de tabla de casos. ........................................................................................................................................20
Ilustración 15: Creación de la relación con la tabla de casos. .....................................................................................................21
Ilustración 16: Ejecución de modelado. ................................................................................................................................................ 22
Ilustración 17: Resultado de predicción. ..............................................................................................................................................23
Ilustración 18: Resultado informe de probabilidad de compra generado. .............................................................................24
Página | 1
CAPÍTULO I
INTRODUCCIÓN
1.1 ANTECEDENTES
La empresa “Adventure Works” se dedica a la comercialización de bicicletas. La demanda interna
de bicicletas básicamente está constituida por usuarios jóvenes o niños, de arraigo cultural y
mayormente en los niveles socioeconómicos menos favorecidos.
A nivel internacional se observa una tendencia hacia un transporte más sostenibles y el uso de la
bicicleta se volvió una tendencia actual. El Worldwide Cycling Índex (Índice Ciclista Mundial)
estima desde 2014 la progresión general del tráfico de bicicletas por país y ciudad de forma anual.
Para ello sus responsables utilizan datos de más de 3.000 contadores automáticos instalados en
bicicletas en 39 países. Según su edición más reciente de 2019, el uso de la bicicleta a nivel mundial
ha aumentado en un 6%, en comparación con los datos de 2017 y 2018.
La bicicleta es un medio de transporte sostenible, sencillo, asequible, fiable, limpio y ecológico
que contribuye a la gestión ambiental y beneficia la salud. Puede servir como instrumento para el
desarrollo, no solo como medio de transporte, sino también al facilitar el acceso a la educación, la
atención de la salud y el deporte. Entonces la relación entre la bicicleta y su usuario fomenta la
creatividad y la participación social; asimismo, permite al ciclista conocer de primera mano el
entorno local. Por lo tanto, es un símbolo del transporte sostenible y transmite un mensaje positivo
para fomentar el consumo y la producción sostenibles; además, repercute beneficiosamente en el
clima.
Página | 2
PLANTEAMIENTO DEL PROBLEMA
La toma de decisiones en una empresa tiene como fin encontrar las mejores soluciones en cada
momento. Es un proceso que debe alinearse con los objetivos de la sociedad y las circunstancias
internas y externas.
La empresa Adventure Works pretende aumentar sus ventas de bicicletas, y se ve en la necesidad
de saber quiénes son sus clientes potenciales y las probabilidades que tiene estos de comprar y así
posteriormente poder realizar una campaña de marketing focalizada y objetiva, en base al estudio
correspondiente.
Adventure Works adquirió la compra de una base de datos con las características más relevantes
de los compradores habituales de este producto en otras latitudes, con tal de poder hacer una
campaña de marketing enfocada a los clientes que tendrían más posibilidad de compra.
Se pretende, a través de un modelo de minería de datos, identificar los clientes potenciales.
2.1 OBJETIVOS
OBJETIVO GENERAL
Generar un modelo de minería de datos para evaluar y predecir que clientes tienen mayor
probabilidad de compra de un producto, de la empresa Adventure Works.
OBJETIVOS ESPECÍFICOS
• Definir el problema
• Preparar los datos
• Explorar datos.
Página | 3
• Generar un modelo de minería de datos utilizando el algoritmo árboles de decisiones de
Microsoft.
• Explorar y validar el modelo de minería de datos.
• Utilizar la tabla Clientes como casos de prueba y la tabla ProspectiveBuyer, como posibles
clientes para evaluar su probabilidad de compra.
• Aplicar una predicción de datos sobre el campo ProspectiveBuyer, para así poder generar
un informe de predicción de minería de datos y obtener el listado de clientes con mayor
probabilidad de compra.
• Evaluar la probabilidad de compra con las entidades ProspectiveBuyer.
Página | 4
CAPÍTULO II
BASE DE DATOS
2.1 ADVENTURE WORKS
Ilustración 1: Diagrama ADVENTURE BD WORKS.
Fuente: Elaboración propia
Página | 5
CAPÍTULO III
LA ESTRUCTURA DE LA MINERÍA DE DATOS
3.1 ÁRBOLES DE DECISIONES
DEFINICIÓN
El algoritmo de árboles de decisión de Microsoft es un algoritmo de clasificación que funciona
bien para el modelado predictivo. El algoritmo admite la predicción de atributos tanto discretos
como continuos.
DESCRIPCIÓN
Para los atributos discretos, el algoritmo hace predicciones basándose en las relaciones entre las
columnas de entrada de un conjunto de datos. Utiliza los valores, conocidos como estados, de estas
columnas para predecir los estados de una columna que se designa como elemento de predicción.
Específicamente, el algoritmo identifica las columnas de entrada que se correlacionan con la
columna de predicción.
Por ejemplo, en un escenario para predecir que clientes podrían comprar una bicicleta y los factores
que pudieran influir como el nombre, edad, estado civil, cantidad de hijos, etc. El algoritmo infiere
que la edad es un buen elemento de predicción en la compra. El árbol de decisión realiza
predicciones basándose en la tendencia hacia un resultado concreto
REQUISITOS
Los requisitos para un modelo de árbol de decisión son los siguientes:
Una columna de una sola clave: cada modelo debe contener una columna numérica o de texto
que identifique cada registro de manera única. No están permitidas las claves compuestas.
Página | 6
Una columna de predicción: Se requiere al menos una columna de predicción. Puede incluir
varios atributos de predicción en un modelo y pueden ser de tipos diferentes, numérico o discreto.
Sin embargo, el incremento del número de atributos de predicción puede aumentar el tiempo de
procesamiento.
Columnas de entrada: Se requieren columnas de entrada, que pueden ser discretas o continuas.
Aumentar el número de atributos de entrada afecta al tiempo de procesamiento.
4.1 MODELADO
ORIGEN DE DATOS (DATA SOURCES)
Partiendo de la base de datos ADVENTURE WORKS agregada en SQL SERVER como
prerrequisito, realizamos la configuración de una conexión a una base de datos desde un servidor
(Data sources).
Ilustración 2: Conexión manager de Data Sources en Data Tools.
Fuente: Elaboración Propia.
Página | 7
Ilustración 3: Selección de Data Sources en Data Tools.
Fuente: Elaboración Propia.
VISTA DE ORÍGENES DE DATOS (DATA SOURCE VIEWS)
La vista de orígenes de datos es vistas unificadas de los metadatos, desde las tablas y vistas
seleccionadas en los orígenes de datos. Creamos un origen de datos y en este visualizamos las
tablas y vistas de la base de datos “AdventureWorks” previamente cargada. Posteriormente
procederemos a visualizar las tablas y seleccionas las tablas que requieren para esta predicción.
Página | 8
Ilustración 4: Selección a data source en Data Tools.
Fuente: Elaboración Propia.
Página | 9
Ilustración 5: Selección tablas y views en data tools.
Fuente: Elaboración propia.
Las tablas y vistas a seleccionar para esta predicción son las siguientes:
● dbo.ProspectiveBuyer (Tabla)
● dbo.vAssocSeqLineItems (Vista)
● dbo.vAssocSeqOrders (Vista)
● dbo.vTargetMail (Vista)
● dbo.vTimeSeries (Vista)
Página | 10
Ilustración 6: Data Source Views en Data Tools.
Fuente: Elaboración Propia.
Modificar la vista de origen datos en este paso nos permite modificar cualquier objeto qué sea más
significativo para el objetivo, sin modificar el origen de datos original, pero se puede asignar un
Página | 11
nombre descriptivo o una relación entre tablas o vistas. Para nuestro objetivo procederemos a crear
una relación entre las vistas dbo.vAssocSeqLineItems y dbo.vAssocSeqOrders el cual es una
relación de muchos a uno.
ESTRUCTURA DE MINERÍA DE DATOS (MINING STRUCTURES)
Habilitamos el asistente de minería de datos para crear una estructura de minería de datos y
posteriormente seleccionar el “algoritmo de árboles de decisión” como técnica de minería de datos
Página | 12
a utilizar. .
Ilustración 7: Creación de la data Mining Structure en Data Tools.
Fuente: Elaboración Propia.
Página | 13
Ilustración 8: Selección de Tablas en Data Tools.
Fuente: Elaboración Propia.
De las tablas listadas anteriormente seleccionamos el escenario en este caso vTargetMail.
Página | 14
Posteriormente procedemos a especificar los datos de entrenamiento en este caso nuestra variable
de predicción será BikeBuyer.
Ilustración 9: Specifiy the Training Data en Data Tools.
Fuente: Elaboración Propia.
ESPECIFICACIÓN DE DATOS DE ENTRENAMIENTO
Columna Clave Entrada Predicción
PredictionCustomer x
BikeBuyer x x
Age x
Página | 15
CustomerKey x
EnglishEducation x
EnglishOccupation x
FirstName x
Gender x
Geographykey x
HouseOwnerFlag x
LastName x
MaritalStatus x
NumberCarsOwned x
NumberChildrenAtH
ome
x
Region x
TotalChildren x
YearlyIncome x
Página | 16
A Continuación, especificamos el contenido y el tipo de datos de las columnas y detectamos los
datos continuos y discretos para cada columna.
Ilustración 10: Specifiy Columns en Data Tools.
Fuente: Elaboración Propia.
Página | 17
Seguidamente creamos el conjunto de datos de prueba con un porcentaje de datos de 30%.
Ilustración 11: Create Testing Set en Data Tools.
Fuente: Elaboración Propia.
Página | 18
Finalmente tenemos la vista de datos a procesar:
Hasta este punto tenemos creado el modelo de minería de datos para el algoritmo de árbol de
decisión y podemos crear otros modelos en este caso utilizaremos dos modelos adicionales que son
el algoritmo de Cluster y Naive Bayes.
Página | 19
Y procedemos a la ejecución de cada uno de estos modelos:
Ilustración 12: Ejecución de modelado.
Fuente: Elaboración Propia.
PREDICCIÓN
El generado de consultas de predicción ofrece tres operaciones de arrastras y colocar para crear las
consultas y tiene las siguientes vistas:
• DISEÑO: Del modelo de minería de datos seleccionamos la tabla de casos para realizar la
predicción en este caso la tabla es ProspectiveBuyer.
Página | 20
Ilustración 13: Selección de tabla de casos.
Fuente: Elaboración Propia.
Ilustración 14: Selección de tabla de casos.
Fuente: Elaboración Propia.
Página | 21
Después de seleccionar la tabla de entrada, el Generador de consultas de predicción crea
una asignación predeterminada entre el modelo de minería de datos y la tabla de entrada,
en función de los nombres de las columnas.
Ilustración 15: Creación de la relación con la tabla de casos.
Fuente: Elaboración Propia.
• CONSULTA DE PREDICCIÓN:
Posteriormente diseño procedemos a la agregación de un identificador único a la consulta
de predicción para que pueda identificar quién es más y menos probable que compre una
bicicleta, y quién es menos probable. En la columna Origen de la cuadrícula de la ficha
Predicción de modelo de minería de datos, haga clic en la celda de la primera fila vacía y,
a continuación, selecionas ProspectiveBuyer.
Página | 22
Ilustración 16: Ejecución de modelado.
Fuente: Elaboración Propia.
Para armar esta consulta al finalizar tendremos:
ORIGEN CAMPO
PerspectiveBuyer (Table) PerspectiveAlternativeKey
TM_desicion_tree (árbol de decisión) bikeBuyer
Funcion de predicción PredictProbality (Criterio de argumento
TM_desicion_tree.bikeBuyer)
Página | 23
• RESULTADO
Finalmente vamos a la vista de resultados para ver la probabilidad de compra que tiene un
determinado cliente.
Ilustración 17: Resultado de predicción.
Fuente: Elaboración Propia.
5.1 RESULTADOS
INFORME GENERADO DE PREDICCIÓN DE CLIENTES CON MAYOR
PROBABILIDAD DE COMPRA
Una vez elaborada y guardada la query, se genera una tabla y generamos como informe de
predicción de minería de datos, obteniendo el listado de clientes con mayor probabilidad de
compra. Lo mismo que se muestra en el resultado del modelo, manteniendo así la integridad de los
datos.
Página | 24
En el siguiente resultado se puede notar que el cliente con id 467 tiene un 63% de probabilidad de
compra de una bicicleta.
Ilustración 18: Resultado informe de probabilidad de compra generado.
Fuente: Elaboración Propia.
Página | 25
6.1 CONCLUSIONES
• Con el presente proyecto logramos encontrar posibles clientes potenciales con mayor
probabilidad de compra para poder realizar una toma de decisiones, para el marketing
focalizado que pretende realizar la empresa Adventure Works.
• El aprovechamiento de la minería de datos permite ahorrar grandes cantidades de dinero a
una empresa y abre nuevas oportunidades de negocios.
• Asimismo, podemos analizar las condiciones del mercado, la competencia y aprovechar las
oportunidades de crecimiento.
• En referencia al ámbito empresarial, podemos decir que los árboles de decisión son
diagramas de ediciones secuenciales que nos muestran sus posibles resultados. Estos
ayudan a las empresas a determinar cuáles son sus opciones al mostrarles las distintas
decisiones y sus resultados
Página | 26
7.1 BIBLIOGRAFÍA
1. Minería de datos. (2020). Recuperado el 25 marzo 2021, de
https://es.wikipedia.org/wiki/Minería_de_datos
2. Conceptos de minería de datos. (2019). Recuperado 25 marzo 2021, de
https://docs.microsoft.com/es-es/analysis-services/data-mining/data-mining-
concepts?view=asallproducts-allversions
3. Referencia técnica del algoritmo de árboles de decisión de Microsoft. (2018). Recuperado 25
de marzo 2021, de https://docs.microsoft.com/es-es/analysis-services/data-mining/microsoft-
decision-trees-algorithm-technical-reference?view=asallproducts-allversions
4. Microsoft Decision Trees Algorithm. (2018). Recuperado 27 marzo 2021, de
https://docs.microsoft.com/en-us/analysis-services/data-mining/microsoft-decision-trees-
algorithm?view=asallproducts-allversions
5. Ejemplos de consultas de modelos de árboles de decisión. (2018). Retrieved 25 marzo 2021,
de https://docs.microsoft.com/es-es/analysis-services/data-mining/decision-trees-model-query-
examples?view=asallproducts-allversions
6. Using Decision Trees in SQL Server – SQL Server Performance. (2012). Recuperado 27 marzo
2021, de https://www.sql-server-performance.com/decision-trees-sql-server/
7. Asanka, Dinesh. (2019). Microsoft Decision Trees in SQL Server. Recuperado 15 marzo 2021,
de https://www.sqlshack.com/microsoft-decision-trees-in-sql-server/

Más contenido relacionado

La actualidad más candente

Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datos
Jesús Tramullas
 
DiseñO De Base De Datos
DiseñO De Base De DatosDiseñO De Base De Datos
DiseñO De Base De Datos
Christian Rodas
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Néstor González
 
Introduccion a UML
Introduccion a UMLIntroduccion a UML
Introduccion a UML
Juan Antonio
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
Scoremind
 
The Business Glossary, Data Dictionary, Data Catalog Trifecta
The Business Glossary, Data Dictionary, Data Catalog TrifectaThe Business Glossary, Data Dictionary, Data Catalog Trifecta
The Business Glossary, Data Dictionary, Data Catalog Trifecta
georgefirican
 
Data modelling 101
Data modelling 101Data modelling 101
Data modelling 101
Christopher Bradley
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
María Inés Cahuana Lázaro
 
Data-Warehouse-I.pdf
Data-Warehouse-I.pdfData-Warehouse-I.pdf
Data-Warehouse-I.pdf
Yair Ambrocio
 
Talend Open Studio Data Integration
Talend Open Studio Data IntegrationTalend Open Studio Data Integration
Talend Open Studio Data Integration
Roberto Marchetto
 
Diapositivas de sgbd
Diapositivas de sgbdDiapositivas de sgbd
Diapositivas de sgbd
TAPIA SILVA EVELINA
 
Unidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos ConceptualUnidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos Conceptual
Sergio Sanchez
 
Actividad #1 introducción a la inteligencia de negocios
Actividad #1 introducción a la inteligencia de negociosActividad #1 introducción a la inteligencia de negocios
Actividad #1 introducción a la inteligencia de negocios
Fco Dee JeSuss Contreras
 
Presentación de fase de diseño de base de datos
Presentación de fase de diseño de base de datosPresentación de fase de diseño de base de datos
Presentación de fase de diseño de base de datos
Yarquiri Claudio
 
Big data
Big dataBig data
Big data
Ami Redwan Haq
 
Fundamentos de las bases de datos
Fundamentos de las bases de datosFundamentos de las bases de datos
Fundamentos de las bases de datos
Jaime David Romero Olivo
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business Goals
DATAVERSITY
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
Carlos Escobar
 
Big Data
Big DataBig Data
Big Data
Fernando Parra
 
Gestión del riesgo de software
Gestión del riesgo de software Gestión del riesgo de software
Gestión del riesgo de software
jose_macias
 

La actualidad más candente (20)

Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datos
 
DiseñO De Base De Datos
DiseñO De Base De DatosDiseñO De Base De Datos
DiseñO De Base De Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Introduccion a UML
Introduccion a UMLIntroduccion a UML
Introduccion a UML
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
The Business Glossary, Data Dictionary, Data Catalog Trifecta
The Business Glossary, Data Dictionary, Data Catalog TrifectaThe Business Glossary, Data Dictionary, Data Catalog Trifecta
The Business Glossary, Data Dictionary, Data Catalog Trifecta
 
Data modelling 101
Data modelling 101Data modelling 101
Data modelling 101
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Data-Warehouse-I.pdf
Data-Warehouse-I.pdfData-Warehouse-I.pdf
Data-Warehouse-I.pdf
 
Talend Open Studio Data Integration
Talend Open Studio Data IntegrationTalend Open Studio Data Integration
Talend Open Studio Data Integration
 
Diapositivas de sgbd
Diapositivas de sgbdDiapositivas de sgbd
Diapositivas de sgbd
 
Unidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos ConceptualUnidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos Conceptual
 
Actividad #1 introducción a la inteligencia de negocios
Actividad #1 introducción a la inteligencia de negociosActividad #1 introducción a la inteligencia de negocios
Actividad #1 introducción a la inteligencia de negocios
 
Presentación de fase de diseño de base de datos
Presentación de fase de diseño de base de datosPresentación de fase de diseño de base de datos
Presentación de fase de diseño de base de datos
 
Big data
Big dataBig data
Big data
 
Fundamentos de las bases de datos
Fundamentos de las bases de datosFundamentos de las bases de datos
Fundamentos de las bases de datos
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business Goals
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Big Data
Big DataBig Data
Big Data
 
Gestión del riesgo de software
Gestión del riesgo de software Gestión del riesgo de software
Gestión del riesgo de software
 

Similar a Proyecto mineria de_datos_caso_2

Proyecto mineria de_datos_caso_1
Proyecto mineria de_datos_caso_1Proyecto mineria de_datos_caso_1
Proyecto mineria de_datos_caso_1
Gustavo Rene Rojas Valdez
 
Proyecto mineria de datos caso1
Proyecto mineria de datos caso1Proyecto mineria de datos caso1
Proyecto mineria de datos caso1
MARIANAZARENADORADOM
 
Analitica web para la Empresa
Analitica web para la EmpresaAnalitica web para la Empresa
Analitica web para la Empresa
Alvaro Alfonso
 
BD OLAP Y BI para desarrollo como profesional.pdf
BD OLAP Y BI para desarrollo como profesional.pdfBD OLAP Y BI para desarrollo como profesional.pdf
BD OLAP Y BI para desarrollo como profesional.pdf
expertoleonelmartine
 
El rol de las TIC en la competitividad de las PyME - Verónica Alderete
El rol de las TIC en la competitividad de las PyME - Verónica AldereteEl rol de las TIC en la competitividad de las PyME - Verónica Alderete
El rol de las TIC en la competitividad de las PyME - Verónica Alderete
Dialogo regional sobre Sociedad de la Información
 
El rol de las tic en la competitividad de las PyME - María Verónica Alderete
El rol de las tic en la competitividad de las PyME - María Verónica AldereteEl rol de las tic en la competitividad de las PyME - María Verónica Alderete
El rol de las tic en la competitividad de las PyME - María Verónica Alderete
Dialogo regional sobre Sociedad de la Información
 
Guía - Ejemplo - Modelos - Power BI Desktop.pdf
Guía - Ejemplo - Modelos - Power BI Desktop.pdfGuía - Ejemplo - Modelos - Power BI Desktop.pdf
Guía - Ejemplo - Modelos - Power BI Desktop.pdf
mayade1
 
Adaptación del modelo black scholes en la simulacion de un portafolio de acci...
Adaptación del modelo black scholes en la simulacion de un portafolio de acci...Adaptación del modelo black scholes en la simulacion de un portafolio de acci...
Adaptación del modelo black scholes en la simulacion de un portafolio de acci...
Mono Ferreira
 
Ms project
Ms projectMs project
Trabajo_colaborativo_internet
Trabajo_colaborativo_internetTrabajo_colaborativo_internet
Trabajo_colaborativo_internet
elhabaproductions.raul
 
Plan de marketing digital.pdf
Plan  de marketing digital.pdfPlan  de marketing digital.pdf
Plan de marketing digital.pdf
Lisbeth Rosero
 
Base de datos
Base  de datosBase  de datos
Base de datos
lobi7o
 
Lanzamiento de Producto
Lanzamiento de ProductoLanzamiento de Producto
Lanzamiento de Producto
Enrique Franco
 
Guia creacion paginas web
Guia creacion paginas webGuia creacion paginas web
Guia creacion paginas web
Webasesor
 
Access
AccessAccess
Access
rojas4612
 
Sistema de informacion
Sistema de informacionSistema de informacion
Sistema de informacion
soltero13
 
Trabajo de Informática
Trabajo de InformáticaTrabajo de Informática
Trabajo de Informática
Stefy Sanchez
 
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Josue Herrera
 
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Josue Herrera
 
VALOR EMPRESARIAL
VALOR EMPRESARIALVALOR EMPRESARIAL
VALOR EMPRESARIAL
Cade Soluciones
 

Similar a Proyecto mineria de_datos_caso_2 (20)

Proyecto mineria de_datos_caso_1
Proyecto mineria de_datos_caso_1Proyecto mineria de_datos_caso_1
Proyecto mineria de_datos_caso_1
 
Proyecto mineria de datos caso1
Proyecto mineria de datos caso1Proyecto mineria de datos caso1
Proyecto mineria de datos caso1
 
Analitica web para la Empresa
Analitica web para la EmpresaAnalitica web para la Empresa
Analitica web para la Empresa
 
BD OLAP Y BI para desarrollo como profesional.pdf
BD OLAP Y BI para desarrollo como profesional.pdfBD OLAP Y BI para desarrollo como profesional.pdf
BD OLAP Y BI para desarrollo como profesional.pdf
 
El rol de las TIC en la competitividad de las PyME - Verónica Alderete
El rol de las TIC en la competitividad de las PyME - Verónica AldereteEl rol de las TIC en la competitividad de las PyME - Verónica Alderete
El rol de las TIC en la competitividad de las PyME - Verónica Alderete
 
El rol de las tic en la competitividad de las PyME - María Verónica Alderete
El rol de las tic en la competitividad de las PyME - María Verónica AldereteEl rol de las tic en la competitividad de las PyME - María Verónica Alderete
El rol de las tic en la competitividad de las PyME - María Verónica Alderete
 
Guía - Ejemplo - Modelos - Power BI Desktop.pdf
Guía - Ejemplo - Modelos - Power BI Desktop.pdfGuía - Ejemplo - Modelos - Power BI Desktop.pdf
Guía - Ejemplo - Modelos - Power BI Desktop.pdf
 
Adaptación del modelo black scholes en la simulacion de un portafolio de acci...
Adaptación del modelo black scholes en la simulacion de un portafolio de acci...Adaptación del modelo black scholes en la simulacion de un portafolio de acci...
Adaptación del modelo black scholes en la simulacion de un portafolio de acci...
 
Ms project
Ms projectMs project
Ms project
 
Trabajo_colaborativo_internet
Trabajo_colaborativo_internetTrabajo_colaborativo_internet
Trabajo_colaborativo_internet
 
Plan de marketing digital.pdf
Plan  de marketing digital.pdfPlan  de marketing digital.pdf
Plan de marketing digital.pdf
 
Base de datos
Base  de datosBase  de datos
Base de datos
 
Lanzamiento de Producto
Lanzamiento de ProductoLanzamiento de Producto
Lanzamiento de Producto
 
Guia creacion paginas web
Guia creacion paginas webGuia creacion paginas web
Guia creacion paginas web
 
Access
AccessAccess
Access
 
Sistema de informacion
Sistema de informacionSistema de informacion
Sistema de informacion
 
Trabajo de Informática
Trabajo de InformáticaTrabajo de Informática
Trabajo de Informática
 
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
 
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008Reporte bv11012 ch10032_fh11012_oc11012_sd11008
Reporte bv11012 ch10032_fh11012_oc11012_sd11008
 
VALOR EMPRESARIAL
VALOR EMPRESARIALVALOR EMPRESARIAL
VALOR EMPRESARIAL
 

Último

METODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIA
METODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIAMETODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIA
METODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIA
LuisCiriacoMolina
 
Las operaciones básicas en la construcción.
Las operaciones básicas en la construcción.Las operaciones básicas en la construcción.
Las operaciones básicas en la construcción.
MaraManuelaUrribarri
 
Dosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizadaDosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizada
pipex55
 
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOSSISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
micoltadaniel2024
 
Proceso de obtenciòn de nitrogeno por el metodo Haber-Bosh
Proceso de obtenciòn de nitrogeno por el metodo Haber-BoshProceso de obtenciòn de nitrogeno por el metodo Haber-Bosh
Proceso de obtenciòn de nitrogeno por el metodo Haber-Bosh
shirllyleytonm
 
Operaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica MaizOperaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica Maiz
carolina838317
 
muros de contencion, diseño y generalidades
muros de contencion, diseño y generalidadesmuros de contencion, diseño y generalidades
muros de contencion, diseño y generalidades
AlejandroArturoGutie1
 
Infografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdfInfografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdf
Carlos Pulido
 
AE 34 Serie de sobrecargas aisladas_240429_172040.pdf
AE  34 Serie de sobrecargas aisladas_240429_172040.pdfAE  34 Serie de sobrecargas aisladas_240429_172040.pdf
AE 34 Serie de sobrecargas aisladas_240429_172040.pdf
sebastianpech108
 
chancadoras.............................
chancadoras.............................chancadoras.............................
chancadoras.............................
ssuser8827cb1
 
Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024
FantasticVideo1
 
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
DiegoAlexanderChecaG
 
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptxPRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
brandonsinael
 
Infografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdfInfografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdf
jahirrtorresa
 
DIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicosDIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicos
LuisAngelGuarnizoBet
 
exposicion sobre los tipos de cortes de rolas para la produccion de chapas
exposicion sobre los tipos de cortes de rolas para la produccion de chapasexposicion sobre los tipos de cortes de rolas para la produccion de chapas
exposicion sobre los tipos de cortes de rolas para la produccion de chapas
raul958375
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
FernandoRodrigoEscal
 
Infografia de operaciones basicas de la construccion.pdf
Infografia de operaciones basicas de la construccion.pdfInfografia de operaciones basicas de la construccion.pdf
Infografia de operaciones basicas de la construccion.pdf
DanielMelndez19
 
DIAGRAMA DE FLUJO DE ALGORITMO......
DIAGRAMA DE FLUJO   DE   ALGORITMO......DIAGRAMA DE FLUJO   DE   ALGORITMO......
DIAGRAMA DE FLUJO DE ALGORITMO......
taniarivera1015tvr
 
tipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdftipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdf
munozvanessa878
 

Último (20)

METODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIA
METODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIAMETODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIA
METODOLOGIA DE TRAZO Y REPLANTEO EN TOPOGRAFIA
 
Las operaciones básicas en la construcción.
Las operaciones básicas en la construcción.Las operaciones básicas en la construcción.
Las operaciones básicas en la construcción.
 
Dosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizadaDosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizada
 
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOSSISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
SISTEMA AUTOMATIZADO DE LIMPIEZA PARA ACUARIOS
 
Proceso de obtenciòn de nitrogeno por el metodo Haber-Bosh
Proceso de obtenciòn de nitrogeno por el metodo Haber-BoshProceso de obtenciòn de nitrogeno por el metodo Haber-Bosh
Proceso de obtenciòn de nitrogeno por el metodo Haber-Bosh
 
Operaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica MaizOperaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica Maiz
 
muros de contencion, diseño y generalidades
muros de contencion, diseño y generalidadesmuros de contencion, diseño y generalidades
muros de contencion, diseño y generalidades
 
Infografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdfInfografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdf
 
AE 34 Serie de sobrecargas aisladas_240429_172040.pdf
AE  34 Serie de sobrecargas aisladas_240429_172040.pdfAE  34 Serie de sobrecargas aisladas_240429_172040.pdf
AE 34 Serie de sobrecargas aisladas_240429_172040.pdf
 
chancadoras.............................
chancadoras.............................chancadoras.............................
chancadoras.............................
 
Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024
 
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
 
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptxPRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
PRES 3. METROLOGÍA DE GASES Y RADIACIONES IONIZANTES.pptx
 
Infografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdfInfografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdf
 
DIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicosDIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicos
 
exposicion sobre los tipos de cortes de rolas para la produccion de chapas
exposicion sobre los tipos de cortes de rolas para la produccion de chapasexposicion sobre los tipos de cortes de rolas para la produccion de chapas
exposicion sobre los tipos de cortes de rolas para la produccion de chapas
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
 
Infografia de operaciones basicas de la construccion.pdf
Infografia de operaciones basicas de la construccion.pdfInfografia de operaciones basicas de la construccion.pdf
Infografia de operaciones basicas de la construccion.pdf
 
DIAGRAMA DE FLUJO DE ALGORITMO......
DIAGRAMA DE FLUJO   DE   ALGORITMO......DIAGRAMA DE FLUJO   DE   ALGORITMO......
DIAGRAMA DE FLUJO DE ALGORITMO......
 
tipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdftipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdf
 

Proyecto mineria de_datos_caso_2

  • 1. UNIVERSIDAD AUTÓNOMA GABRIEL RENÉ MORENO FACULTAD DE INGENIERÍA EN CIENCIAS DE LA COMPUTACIÓN Y TELECOMUNICACIONES IMPLEMENTACIÓN DE MINERÍA DE DATOS PARA PREDICIR QUE CLIENTES TIENEN MAYOR PROBABILIDAD DE COMPRA PARA LA EMPRESA “ADVENTURE WORKS” TRABAJO DE INVESTIGACIÓN CORRESPONDIENTE AL PROGRAMA “CIENCIA Y MINERÍA DE DATOS” AUTOR: Rojas Valdez Gustavo Rene Dorado Medeiros Maria Nazarena Ticona Angles Noemi TUTOR: Ing. David Mendoza Gutiérrez Marzo 2021 Santa Cruz de la Sierra – Bolivia
  • 2. Página | 1 DEDICATORIA A: A Dios, por tantas bendiciones para mi persona y darme las fuerzas para no desistir en los estudios y poder así demostrar que puedo lograrlo. A mis padres, por su incondicional apoyo en toda mi etapa académica. A mis docentes, quienes me transmitieron sus conocimientos y ser una fuente de sabiduría digna de admirar e imitar para mi futuro profesional.
  • 3. Página | 2 AGRADECIMIENTOS A: A Dios, por la vida llena de bendiciones que me ha dado, por la salud, la familia y su infinito amor y bondad. A mi familia, quien ha sido mi apoyo y ganas de seguir adelante en todo momento. A mis docentes, quienes han sido mis guías en toda mi etapa académica, transmitiendo sus grandes conocimientos para mi formación profesional.
  • 4. Página | 3 RESUMEN El presente proyecto tiene como objetivo aplicar un modelo predictivo de minería de datos, enfocado a prospectar clientes para la comercialización de un nuevo producto, para la empresa “Adventure Works”. Esto con el propósito de poder hacer una campaña de marketing focalizada, en primera etapa, a sólo los que realmente tendrán posibilidades de compra. Para ello se utilizará como metodología la estructura de minería de datos y el algoritmo de clasificación árboles de decisiones de Microsoft, para el modelado predictivo. Las herramientas que nos ayudarán a identificar los factores claves que necesitamos conocer, son SQL Server Data Tool y SQL Analysis Services Server mediante SQL Server Management Studio. Aplicando en ambas sus correspondientes funciones para así generar el modelo de minería de datos y aplicar su correspondiente predicción.
  • 5. Página | 4 ABSTRACT The objective of this project is to apply a predictive data mining model, focused on prospecting customers for the commercialization of a new product for the company "Adventure Works". This with the purpose of being able to make a marketing campaign focused, in the first stage, to only those who will really have the possibility of buying. For this purpose, the data mining structure and the Microsoft decision tree classification algorithm will be used as a methodology for predictive modeling. The tools that will help us to identify the key factors that we need to know are SQL Server Data Tool and SQL Analysis Service Server through SQL Server Management Studio. Applying in both their corresponding functions to generate the data mining model and apply its corresponding prediction.
  • 6. Página | 5 ÍNDICE DE CONTENIDO CONTENIDO CAPÍTULO I INTRODUCCIÓN................................................................................................ 1 1.1 ANTECEDENTES............................................................................................................... 1 PLANTEAMIENTO DEL PROBLEMA........................................................................................ 2 2.1 OBJETIVOS......................................................................................................................... 2 OBJETIVO GENERAL .................................................................................................................. 2 OBJETIVOS ESPECÍFICOS.......................................................................................................... 2 CAPÍTULO II BASE DE DATOS............................................................................................... 4 2.1 ADVENTURE WORKS...................................................................................................... 4 CAPÍTULO III LA ESTRUCTURA DE LA MINERÍA DE DATOS ..................................... 5 3.1 ÁRBOLES DE DECISIONES............................................................................................. 5 DEFINICIÓN.................................................................................................................................. 5 DESCRIPCIÓN............................................................................................................................... 5 REQUISITOS.................................................................................................................................. 5 4.1 MODELADO....................................................................................................................... 6 ORIGEN DE DATOS (DATA SOURCES) ................................................................................... 6 VISTA DE ORÍGENES DE DATOS (DATA SOURCE VIEWS) ................................................ 7 ESTRUCTURA DE MINERÍA DE DATOS (MINING STRUCTURES) .................................. 11 ESPECIFICACIÓN DE DATOS DE ENTRENAMIENTO ........................................................ 14 PREDICCIÓN:.............................................................................................................................. 19 5.1 RESULTADOS.................................................................................................................. 23 INFORME GENERADO DE PREDICCIÓN DE CLIENTES CON MAYOR PROBABILIDAD DE COMPRA................................................................................................................................ 23 6.1 CONCLUSIONES ............................................................................................................. 25 7.1 BIBLIOGRAFÍA................................................................................................................ 26
  • 7. Página | 6 ÍNDICE DE ILUSTRACIONES Ilustración 1: Diagrama ADVENTURE BD WORKS. ........................................................................................................................... 4 Ilustración 2: Conexión manager de Data Sources en Data Tools. .............................................................................................. 6 Ilustración 3: Selección de Data Sources en Data Tools. .................................................................................................................. 7 Ilustración 4: Selección a data source en Data Tools. ....................................................................................................................... 8 Ilustración 5: Selección tablas y views en data tools ......................................................................................................................... 9 Ilustración 6: Data Source Views en Data Tools. ...............................................................................................................................10 Ilustración 7: Creación de la data Mining Structure en Data Tools. .........................................................................................12 Ilustración 8: Selección de Tablas en Data Tools. .............................................................................................................................13 Ilustración 9: Specifiy the Training Data en Data Tools. ...............................................................................................................14 Ilustración 10: Specifiy Columns en Data Tools. ................................................................................................................................16 Ilustración 11: Create Testing Set en Data Tools. .............................................................................................................................17 Ilustración 12: Ejecución de modelado. ................................................................................................................................................19 Ilustración 13: Selección de tabla de casos. ........................................................................................................................................20 Ilustración 14: Selección de tabla de casos. ........................................................................................................................................20 Ilustración 15: Creación de la relación con la tabla de casos. .....................................................................................................21 Ilustración 16: Ejecución de modelado. ................................................................................................................................................ 22 Ilustración 17: Resultado de predicción. ..............................................................................................................................................23 Ilustración 18: Resultado informe de probabilidad de compra generado. .............................................................................24
  • 8. Página | 1 CAPÍTULO I INTRODUCCIÓN 1.1 ANTECEDENTES La empresa “Adventure Works” se dedica a la comercialización de bicicletas. La demanda interna de bicicletas básicamente está constituida por usuarios jóvenes o niños, de arraigo cultural y mayormente en los niveles socioeconómicos menos favorecidos. A nivel internacional se observa una tendencia hacia un transporte más sostenibles y el uso de la bicicleta se volvió una tendencia actual. El Worldwide Cycling Índex (Índice Ciclista Mundial) estima desde 2014 la progresión general del tráfico de bicicletas por país y ciudad de forma anual. Para ello sus responsables utilizan datos de más de 3.000 contadores automáticos instalados en bicicletas en 39 países. Según su edición más reciente de 2019, el uso de la bicicleta a nivel mundial ha aumentado en un 6%, en comparación con los datos de 2017 y 2018. La bicicleta es un medio de transporte sostenible, sencillo, asequible, fiable, limpio y ecológico que contribuye a la gestión ambiental y beneficia la salud. Puede servir como instrumento para el desarrollo, no solo como medio de transporte, sino también al facilitar el acceso a la educación, la atención de la salud y el deporte. Entonces la relación entre la bicicleta y su usuario fomenta la creatividad y la participación social; asimismo, permite al ciclista conocer de primera mano el entorno local. Por lo tanto, es un símbolo del transporte sostenible y transmite un mensaje positivo para fomentar el consumo y la producción sostenibles; además, repercute beneficiosamente en el clima.
  • 9. Página | 2 PLANTEAMIENTO DEL PROBLEMA La toma de decisiones en una empresa tiene como fin encontrar las mejores soluciones en cada momento. Es un proceso que debe alinearse con los objetivos de la sociedad y las circunstancias internas y externas. La empresa Adventure Works pretende aumentar sus ventas de bicicletas, y se ve en la necesidad de saber quiénes son sus clientes potenciales y las probabilidades que tiene estos de comprar y así posteriormente poder realizar una campaña de marketing focalizada y objetiva, en base al estudio correspondiente. Adventure Works adquirió la compra de una base de datos con las características más relevantes de los compradores habituales de este producto en otras latitudes, con tal de poder hacer una campaña de marketing enfocada a los clientes que tendrían más posibilidad de compra. Se pretende, a través de un modelo de minería de datos, identificar los clientes potenciales. 2.1 OBJETIVOS OBJETIVO GENERAL Generar un modelo de minería de datos para evaluar y predecir que clientes tienen mayor probabilidad de compra de un producto, de la empresa Adventure Works. OBJETIVOS ESPECÍFICOS • Definir el problema • Preparar los datos • Explorar datos.
  • 10. Página | 3 • Generar un modelo de minería de datos utilizando el algoritmo árboles de decisiones de Microsoft. • Explorar y validar el modelo de minería de datos. • Utilizar la tabla Clientes como casos de prueba y la tabla ProspectiveBuyer, como posibles clientes para evaluar su probabilidad de compra. • Aplicar una predicción de datos sobre el campo ProspectiveBuyer, para así poder generar un informe de predicción de minería de datos y obtener el listado de clientes con mayor probabilidad de compra. • Evaluar la probabilidad de compra con las entidades ProspectiveBuyer.
  • 11. Página | 4 CAPÍTULO II BASE DE DATOS 2.1 ADVENTURE WORKS Ilustración 1: Diagrama ADVENTURE BD WORKS. Fuente: Elaboración propia
  • 12. Página | 5 CAPÍTULO III LA ESTRUCTURA DE LA MINERÍA DE DATOS 3.1 ÁRBOLES DE DECISIONES DEFINICIÓN El algoritmo de árboles de decisión de Microsoft es un algoritmo de clasificación que funciona bien para el modelado predictivo. El algoritmo admite la predicción de atributos tanto discretos como continuos. DESCRIPCIÓN Para los atributos discretos, el algoritmo hace predicciones basándose en las relaciones entre las columnas de entrada de un conjunto de datos. Utiliza los valores, conocidos como estados, de estas columnas para predecir los estados de una columna que se designa como elemento de predicción. Específicamente, el algoritmo identifica las columnas de entrada que se correlacionan con la columna de predicción. Por ejemplo, en un escenario para predecir que clientes podrían comprar una bicicleta y los factores que pudieran influir como el nombre, edad, estado civil, cantidad de hijos, etc. El algoritmo infiere que la edad es un buen elemento de predicción en la compra. El árbol de decisión realiza predicciones basándose en la tendencia hacia un resultado concreto REQUISITOS Los requisitos para un modelo de árbol de decisión son los siguientes: Una columna de una sola clave: cada modelo debe contener una columna numérica o de texto que identifique cada registro de manera única. No están permitidas las claves compuestas.
  • 13. Página | 6 Una columna de predicción: Se requiere al menos una columna de predicción. Puede incluir varios atributos de predicción en un modelo y pueden ser de tipos diferentes, numérico o discreto. Sin embargo, el incremento del número de atributos de predicción puede aumentar el tiempo de procesamiento. Columnas de entrada: Se requieren columnas de entrada, que pueden ser discretas o continuas. Aumentar el número de atributos de entrada afecta al tiempo de procesamiento. 4.1 MODELADO ORIGEN DE DATOS (DATA SOURCES) Partiendo de la base de datos ADVENTURE WORKS agregada en SQL SERVER como prerrequisito, realizamos la configuración de una conexión a una base de datos desde un servidor (Data sources). Ilustración 2: Conexión manager de Data Sources en Data Tools. Fuente: Elaboración Propia.
  • 14. Página | 7 Ilustración 3: Selección de Data Sources en Data Tools. Fuente: Elaboración Propia. VISTA DE ORÍGENES DE DATOS (DATA SOURCE VIEWS) La vista de orígenes de datos es vistas unificadas de los metadatos, desde las tablas y vistas seleccionadas en los orígenes de datos. Creamos un origen de datos y en este visualizamos las tablas y vistas de la base de datos “AdventureWorks” previamente cargada. Posteriormente procederemos a visualizar las tablas y seleccionas las tablas que requieren para esta predicción.
  • 15. Página | 8 Ilustración 4: Selección a data source en Data Tools. Fuente: Elaboración Propia.
  • 16. Página | 9 Ilustración 5: Selección tablas y views en data tools. Fuente: Elaboración propia. Las tablas y vistas a seleccionar para esta predicción son las siguientes: ● dbo.ProspectiveBuyer (Tabla) ● dbo.vAssocSeqLineItems (Vista) ● dbo.vAssocSeqOrders (Vista) ● dbo.vTargetMail (Vista) ● dbo.vTimeSeries (Vista)
  • 17. Página | 10 Ilustración 6: Data Source Views en Data Tools. Fuente: Elaboración Propia. Modificar la vista de origen datos en este paso nos permite modificar cualquier objeto qué sea más significativo para el objetivo, sin modificar el origen de datos original, pero se puede asignar un
  • 18. Página | 11 nombre descriptivo o una relación entre tablas o vistas. Para nuestro objetivo procederemos a crear una relación entre las vistas dbo.vAssocSeqLineItems y dbo.vAssocSeqOrders el cual es una relación de muchos a uno. ESTRUCTURA DE MINERÍA DE DATOS (MINING STRUCTURES) Habilitamos el asistente de minería de datos para crear una estructura de minería de datos y posteriormente seleccionar el “algoritmo de árboles de decisión” como técnica de minería de datos
  • 19. Página | 12 a utilizar. . Ilustración 7: Creación de la data Mining Structure en Data Tools. Fuente: Elaboración Propia.
  • 20. Página | 13 Ilustración 8: Selección de Tablas en Data Tools. Fuente: Elaboración Propia. De las tablas listadas anteriormente seleccionamos el escenario en este caso vTargetMail.
  • 21. Página | 14 Posteriormente procedemos a especificar los datos de entrenamiento en este caso nuestra variable de predicción será BikeBuyer. Ilustración 9: Specifiy the Training Data en Data Tools. Fuente: Elaboración Propia. ESPECIFICACIÓN DE DATOS DE ENTRENAMIENTO Columna Clave Entrada Predicción PredictionCustomer x BikeBuyer x x Age x
  • 22. Página | 15 CustomerKey x EnglishEducation x EnglishOccupation x FirstName x Gender x Geographykey x HouseOwnerFlag x LastName x MaritalStatus x NumberCarsOwned x NumberChildrenAtH ome x Region x TotalChildren x YearlyIncome x
  • 23. Página | 16 A Continuación, especificamos el contenido y el tipo de datos de las columnas y detectamos los datos continuos y discretos para cada columna. Ilustración 10: Specifiy Columns en Data Tools. Fuente: Elaboración Propia.
  • 24. Página | 17 Seguidamente creamos el conjunto de datos de prueba con un porcentaje de datos de 30%. Ilustración 11: Create Testing Set en Data Tools. Fuente: Elaboración Propia.
  • 25. Página | 18 Finalmente tenemos la vista de datos a procesar: Hasta este punto tenemos creado el modelo de minería de datos para el algoritmo de árbol de decisión y podemos crear otros modelos en este caso utilizaremos dos modelos adicionales que son el algoritmo de Cluster y Naive Bayes.
  • 26. Página | 19 Y procedemos a la ejecución de cada uno de estos modelos: Ilustración 12: Ejecución de modelado. Fuente: Elaboración Propia. PREDICCIÓN El generado de consultas de predicción ofrece tres operaciones de arrastras y colocar para crear las consultas y tiene las siguientes vistas: • DISEÑO: Del modelo de minería de datos seleccionamos la tabla de casos para realizar la predicción en este caso la tabla es ProspectiveBuyer.
  • 27. Página | 20 Ilustración 13: Selección de tabla de casos. Fuente: Elaboración Propia. Ilustración 14: Selección de tabla de casos. Fuente: Elaboración Propia.
  • 28. Página | 21 Después de seleccionar la tabla de entrada, el Generador de consultas de predicción crea una asignación predeterminada entre el modelo de minería de datos y la tabla de entrada, en función de los nombres de las columnas. Ilustración 15: Creación de la relación con la tabla de casos. Fuente: Elaboración Propia. • CONSULTA DE PREDICCIÓN: Posteriormente diseño procedemos a la agregación de un identificador único a la consulta de predicción para que pueda identificar quién es más y menos probable que compre una bicicleta, y quién es menos probable. En la columna Origen de la cuadrícula de la ficha Predicción de modelo de minería de datos, haga clic en la celda de la primera fila vacía y, a continuación, selecionas ProspectiveBuyer.
  • 29. Página | 22 Ilustración 16: Ejecución de modelado. Fuente: Elaboración Propia. Para armar esta consulta al finalizar tendremos: ORIGEN CAMPO PerspectiveBuyer (Table) PerspectiveAlternativeKey TM_desicion_tree (árbol de decisión) bikeBuyer Funcion de predicción PredictProbality (Criterio de argumento TM_desicion_tree.bikeBuyer)
  • 30. Página | 23 • RESULTADO Finalmente vamos a la vista de resultados para ver la probabilidad de compra que tiene un determinado cliente. Ilustración 17: Resultado de predicción. Fuente: Elaboración Propia. 5.1 RESULTADOS INFORME GENERADO DE PREDICCIÓN DE CLIENTES CON MAYOR PROBABILIDAD DE COMPRA Una vez elaborada y guardada la query, se genera una tabla y generamos como informe de predicción de minería de datos, obteniendo el listado de clientes con mayor probabilidad de compra. Lo mismo que se muestra en el resultado del modelo, manteniendo así la integridad de los datos.
  • 31. Página | 24 En el siguiente resultado se puede notar que el cliente con id 467 tiene un 63% de probabilidad de compra de una bicicleta. Ilustración 18: Resultado informe de probabilidad de compra generado. Fuente: Elaboración Propia.
  • 32. Página | 25 6.1 CONCLUSIONES • Con el presente proyecto logramos encontrar posibles clientes potenciales con mayor probabilidad de compra para poder realizar una toma de decisiones, para el marketing focalizado que pretende realizar la empresa Adventure Works. • El aprovechamiento de la minería de datos permite ahorrar grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. • Asimismo, podemos analizar las condiciones del mercado, la competencia y aprovechar las oportunidades de crecimiento. • En referencia al ámbito empresarial, podemos decir que los árboles de decisión son diagramas de ediciones secuenciales que nos muestran sus posibles resultados. Estos ayudan a las empresas a determinar cuáles son sus opciones al mostrarles las distintas decisiones y sus resultados
  • 33. Página | 26 7.1 BIBLIOGRAFÍA 1. Minería de datos. (2020). Recuperado el 25 marzo 2021, de https://es.wikipedia.org/wiki/Minería_de_datos 2. Conceptos de minería de datos. (2019). Recuperado 25 marzo 2021, de https://docs.microsoft.com/es-es/analysis-services/data-mining/data-mining- concepts?view=asallproducts-allversions 3. Referencia técnica del algoritmo de árboles de decisión de Microsoft. (2018). Recuperado 25 de marzo 2021, de https://docs.microsoft.com/es-es/analysis-services/data-mining/microsoft- decision-trees-algorithm-technical-reference?view=asallproducts-allversions 4. Microsoft Decision Trees Algorithm. (2018). Recuperado 27 marzo 2021, de https://docs.microsoft.com/en-us/analysis-services/data-mining/microsoft-decision-trees- algorithm?view=asallproducts-allversions 5. Ejemplos de consultas de modelos de árboles de decisión. (2018). Retrieved 25 marzo 2021, de https://docs.microsoft.com/es-es/analysis-services/data-mining/decision-trees-model-query- examples?view=asallproducts-allversions 6. Using Decision Trees in SQL Server – SQL Server Performance. (2012). Recuperado 27 marzo 2021, de https://www.sql-server-performance.com/decision-trees-sql-server/ 7. Asanka, Dinesh. (2019). Microsoft Decision Trees in SQL Server. Recuperado 15 marzo 2021, de https://www.sqlshack.com/microsoft-decision-trees-in-sql-server/