Análisis de la Predicción de ventas Aplicando un Modelo de minería de datos
INTEGRANTES:
Silvia Carvajal Méndez
Berthy Vargas Villarreal
Luis Enrique Cesary Añez
Xavier Marcelo Paniagua Alarcón
1. ANÁLISIS DE LA PREDICCIÓN DE VENTAS APLICANDO UN
MODELO DE MINERÍA DE DATOS SOBRE UN CONJUNTO DE
DATOS PARA LA IMPORTADORA DE VEHICULOS
SILVIA
CARVAJAL
MENDEZ
BERTHY VARGAS
VILLARREAL
LUIS ENRIQUE
CESARY AÑEZ
XAVIER MARCELO
PANIAGUA
ALARCÓN
MODULO :
FUNDAMENTOS DE MINERIA
Y CIENCIAS DE DATOS
INTEGRANTES
GRUPO:#2
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
2. 1. INTRODUCCIÓN
• La minería de datos (data mining), es un proceso para detectar información
de conjuntos grandes de datos, de la manera más automáticamente posible.
Su objetivo es encontrar patrones, tendencias o reglas que expliquen el
comportamiento de los datos en un contexto específico
3. 2. Identificación del problema
• La empresa dedicada a la venta de vehículos requiere que se analicen sus ventas porque
tiene problemas para conocer las preferencias de sus clientes y las tendencias de ventas.
• La empresa tiene registro de sus ventas desde el año 2,013. El canal de ventas es por
medio de internet. Los clientes acceden a una plataforma web adaptativa para
dispositivos móviles, iPad y computadoras donde encuentran información de los vehículos.
4. 3. Objetivo General
Identificar los distintos factores que influyen en un cliente a la
hora de elegir el vehículo que más se adapte a sus necesidades o a
sus gustos.
5. 3.1 Objetivo Especifico
● Identificar el modelo de negocio que se quiere analizar
● Selección de conjuntos de datos de la base de datos
● Análisis y procesamiento a la propiedad de los datos
● Transformación de los datos mediante la minería de datos utilizando algoritmo de SSDT
● Selección y aplicación de la técnica de minería de datos que permita descubrir las ventas
● Extracción y validación del conocimiento seleccionado
● Interpretación y evaluación de los datos
7. 4.2 Ventajas y desventajas del Data Mining
1. Permite descubrir información que no esperábamos obtener. Esto se
debe a su funcionamiento con algoritmos, ya que permite hacer
muchas combinaciones distintas.
2. Es capaz de analizar bases de datos con una enorme cantidad de
datos.
3. Los resultados son muy fáciles de interpretar y no es necesario tener
conocimientos en ingeniería informática.
4. Permite encontrar, atraer y retener clientes.
5. La empresa puede mejorar la atención al cliente a partir de la
información obtenida.
9. 4.4 Algoritmos de minería de datos(Analysis
Services: Minería de datos)
• Algoritmos de clasificación
• Algoritmos de regresión
• Algoritmos de segmentación
• Algoritmos de asociación
• Los algoritmos de análisis de secuencias
11. 5.1. Definición del problema
• Se requiere que se analicen sus ventas porque tiene problemas para
conocer las preferencias de sus clientes y las tendencias de ventas. La
empresa tiene registro de sus ventas desde el año 2,013. El canal de
ventas es por medio de internet. Los clientes acceden a una plataforma
web adaptativa para dispositivos móviles, iPad y computadoras donde
encuentran información de los vehículos.
12. Algoritmo aplicativo
SQL Server Analysis Services-Mineria de Datos
Algoritmo Arboles de decisión .
Algoritmo de clústeres.
Algoritmo Bayes Naive.
Algoritmo Regresión Lineal.
13. Algoritmo Arboles de decisión
El algoritmo de árboles de decisión de Microsoft es un algoritmo de
clasificación y regresión proporciona por Microsoft SQL Server
Analysis Services para el modelado de predicción de atributos
discretos y continuos.
14. Algoritmo Arboles de decisión
aplicar la siguiente vista (Vista_1), necesaria para identificar las preferencias de los clientes que se encuentran en determinado
departamento, con un cierto número de hijos, que se encuentra en un rango de edad y segmentar los códigos de clientes para
poder identificar de una manera muy eficaz las preferencias de los mismos sobre las marcas de vehículos y los modelos que se
están vendiendo en esos sectores.
15. Algoritmo Arboles de decisión
Gráfico de elevación por compras
en municipio Grafica resultante de árbol de
decisiones
16. Algoritmo Arboles de decisión -Resultado
En el siguiente cuadro, demuestra el resultado dado por la aplicación del algoritmo, el mismo demuestra las marcas y los tipos
de vehículos que se han vendido, dado el país de Guatemala, con personas que tienen 2 hijos, que están entre la edad de 43 y
49 años y que anteriormente hayan comprado 1 vehículo vendido por nuestra empresa, y nos genera un resultado de 620
clientes que cumplen con los requerimientos para identificar las preferencias
17. Algoritmo de Clústeres de Microsoft
El algoritmo de clústeres de Microsoft es un algoritmo de segmentación
suministrado por Analysis Services. El algoritmo utiliza técnicas iterativas para
agrupar los casos de un conjunto de datos dentro de clústeres que contienen
características similares. Estas agrupaciones son útiles para la exploración de
datos, la identificación de anomalías en los datos y la creación de predicciones
18. Algoritmo Clústeres de Microsoft
• Para comprender los resultados que demuestra el algoritmo de Clústeres de Microsoft, es necesario aplicar la siguiente
vista (Vista_1), necesaria para identificar las preferencias de los clientes que se encuentran en determinado departamento,
con un cierto número de hijos, que se encuentra en un rango de edad y segmentar los códigos de clientes para poder
identificar de una manera muy eficaz las preferencias de los mismos sobre las marcas de vehículos y los modelos que se
están vendiendo en esos sectores.
19. Algoritmo Clústeres de Microsoft
Grafica resultante de la aplicación de la minería de datos
20. Algoritmo Clústeres de Microsoft - Resultado
En el siguiente cuadro, demuestra el resultado dado por la aplicación del algoritmo, el mismo demuestra el promedio de las
edades que poseen las personas que compran nuestros autos, el promedio del municipio donde se han realizado las compras,
que títulos poseen las personas que nos compran en promedio, la cantidad de marcas vendidas en los distintos clústeres y el
modelo que los clientes han elegido en cada uno de ellos.
21. Algoritmo Clústeres de Microsoft - Resultado
Dado estos resultados, se pueden tomar
decisiones por ejemplo, de mandar correos
electrónicos a los códigos de nuestros clientes
que estén en los promedios anteriormente
dados; con ofertas de vehículos, promociones
con descuentos especiales gracias a sus
preferencias, poder recomendar vehículos tipo
camionetas ya que el número de hijos que ellos
tienen seria el apropiado para un vehículo de
capacidad grande.
22. Algoritmo Bayes Naive de Microsoft
El algoritmo Bayes naive es un algoritmo de clasificación basado en los teoremas
de Bayes y que Microsoft SQL SSAS proporciona para el modelado de predicción.La
palabra naïve (ingenuo en inglés) del término Bayes naive proviene del hecho que
el algoritmo utiliza técnicas Bayesianas pero no tiene en cuenta las dependencias
que puedan existir.
23. Algoritmo Bayes Naive de Microsoft
• Para comprender los resultados que demuestra el algoritmo de bayes naive, es necesario aplicar la siguiente
vista (VistaDatos), necesaria para identificar las preferencias de los clientes a la hora de elegir un vehículo,
poder encontrar de que factores depende que un cliente compre cierto vehículo y descubrir las cantidades
que se han vendido dependiendo de los tipos de automóviles que proporciona la importadora con la
siguiente vista se podrá efectuar.
24. Algoritmo Bayes Naive de Microsoft
• Grafica resultante de la aplicación de la minería de datos
25. Algoritmo Bayes Naive de Microsoft - Resultado
• El cuadro anterior demuestra las marcas que la importadora ofrece a sus clientes y están plasmadas las cantidades que se han vendido
desde los inicios de la empresa, a la derecha está la leyenda para una mejor interpretación con todas las marcas de vehículos.
• El algoritmo de Bayes adjunto el tipo de motor que trabajan los vehículos de la importadora inclusive la transmisión de cada uno y sus
diferentes porcentajes.
26. Algoritmo de Regresión lineal de Microsoft
El algoritmo de regresión lineal de Microsoft es una variación del algoritmo de
árboles de decisión de Microsoft que ayuda a calcular una relación lineal entre
una variable independiente y otra dependiente y, a continuación, utilizar esa
relación para la predicción.
27. Algoritmo de Regresión lineal de Microsoft
Para comprender los resultados que demuestra el algoritmo de regresión lineal, es necesario aplicar la siguiente vista (Vista_1),
necesaria para identificar las preferencias de los clientes que se encuentran en determinado departamento, con un cierto número
de hijos, que se encuentra en un rango de edad y segmentar los códigos de clientes para poder identificar de una manera muy
eficaz las preferencias de los mismos sobre las marcas de vehículos y los modelos que se están vendiendo en esos sectores.
28. Algoritmo de Regresión lineal de Microsoft
Grafica resultante de la
aplicación de la minería de datos
Resultado
El algoritmo de regresión lineal ayudara para realizar un
pronóstico de las ventas en los años siguientes mediante los
registros anteriores.
29. 6. Conclusión
• 1. Se determinó que la minería de datos es el conjunto de
herramientas y técnicas de análisis de datos que permiten crear
escenarios, de los cuales se puede obtener información útil para la
toma de decisiones a nivel gerencial.
• 2. Las técnicas que utiliza la minería de datos para la exploración
consisten en la identificación de patrones.
• 3. El proceso de la minería de datos genera conocimiento por medio
de la depuración, enriquecimiento y transformación de datos que
sirve para la creación de un modelo en el que se evalúa un conjunto
de casos.