Este documento describe un proyecto para crear una aplicación de minería de datos utilizando Microsoft SQL Server Analysis Services para determinar patrones del COVID-19 en los países europeos. El objetivo es analizar variables como edad, género, tasas de mortalidad, recursos médicos, y datos demográficos para diferentes países europeos. La aplicación utilizará técnicas como agrupamiento y reglas de asociación para analizar los datos sobre confirmados y decesos por COVID-19 y encontrar patrones entre las variables.
1. MINERÍA DE DATOS
CREAR UNA APLICACION DE MINERIA DE DATOS PARA DETERMINAR PATRONES
DEL COVID-19 EN LAS PERSONAS A NIVEL DE EUROPA
Suarez Gatica
Franz Carlos
Mamani Condori
Jaime
Vargas Bravo
Ivan Mijael
Gonzales Ayala
María Alejandra
Módulo: Minería y Ciencia de Datos
Docente: Ing. David E. Mendoza Gutiérrez
Integrantes:
3. SITUACIÓN PROBLEMÁTICA
En esta situación de la Pandemia a
nivel Mundial, se requiere tener
información acerca de los países de
primer mundo. Así poder hacer una
comparativa con respecto a nuesto
país y todos los paises de
latinoamerica.
4. OBJETIVO GENERAL
Crear una aplicación de minería
de datos para determinar
patrones del COVID-19 en las
personas en todos los paises
europeos.
5. ALCANCE
El proyecto consiste en la creación de una aplicación utilizando Visual
Studio Analysis Services multidimensional de acuerdo al algoritmo
aplicado.
• Se necesita de modelado para el análisis de la información a ser
procesada.
• Resultados de la aplicación del algoritmo elegido.
• Interpretación de los resultados obtenidos.
7. AGRUPAMIENTO
O CLUSTERING
Es un procedimiento de
agrupación de una serie de
vectores según criterios
habitualmente de distancia; se
tratará de disponer los vectores
de entrada de forma que estén
más cercanos aquellos que
tengan características comunes.
8. REGLAS DE ASOCIACIÓN
Se utilizan para descubrir hechos que
ocurren en común dentro de un
determinado conjunto de datos.
9. MICROSOFT SQL
SERVER ANALYSIS SERVICIES
Microsoft SQL
Server Analysis Services, SSAS, es
una herramienta de
procesamiento analítico y
minería de datos en línea en
Microsoft SQL Server
10. VARIABLES DE ESTUDIO
• Edad
• Género
• Tasa de mortalidad infantil
• Camas hospitalarias
• Enfermeras
• Médicos
• Esperanza de vida
• Diabetes prevalencia
• Prevalencia de tabaquismo
• Temperatura media
• Población masculina
• Población femenina
• Total confirmados
• Total decesos
11. FUENTE DE DATOS
La fuente de datos de
donde se partió fue
archivos de Excel en
formato .csv
12. ANÁLISIS DE DATOS
Crear un proyecto para
Analisis de datos.
Crear origen de datos con
SQL Server
Vistas
Cubos
Dimensiones
19. CONCLUSIONES
• Se seleccionó la información de origen de datos sobre el
COVID-19 en el continente europeo.
• Se realizó la limpieza de los datos.
• Se logró definir los algoritmos para análisis de los datos.
• Se escogió el software para poder realizar la minería de datos y
poder sacar información procesada para su interpretación.
20. REFERENCIAS BIBLIOGRÁFICAS
Microsoft SQL Server Analysis Services. Recuperdo de:
https://docs.microsoft.com/en-us/analysis-services/ssas-overview?view=asallproducts-
allversions [2021, 22 de Marzo]
Clustering. Recuperado de: https://towardsdatascience.com/k-means-data-clustering-
bce3335d2203 [2021, 22 de Marzo]