Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
APLICACIÓN DE MINERÍA DE DATOS PARA ANALIZAR CONTAGIOS DEL COVID EN EL MUNDO
1. APLICACIÓN DE MINERÍA DE DATOS PARA
ANALIZAR CONTAGIOS DEL COVID EN EL MUNDO
MODULO :
FUNDAMENTOS DE
MINERÍA Y CIENCIAS DE
DATOS
GRUPO : 3
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
VILLEGAS ACUÑA
CARLOS E.
LARA QUIROZ ELVIS
VARGAS TICONA ARIEL
QUISPE MAMANI
NIEVES VANESSA
INTEGRANTES
PROYECTO 2
2. Contenido
Metodologia CRISP-DM
Origen de datos
Preparación de los datos en
Visual Studio
Resultados
02
03
04
05
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
01 Predicción de contagios de
covid
3. Covic-19
El covid-19 es un nuevo coronavirus que
causa respiratorios, digestivos y sistemáticos
que afectan la salud humana. Surgió en
China y se ha expandido rápidamente a nivel
mundial, afectando prácticamente a todos los
países, y ocasionando millones de infectados
y miles de personas fallecidas.
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
4. Metodologia CRISP-DM
CRISP-DM (Cross Industry Standard Process
for Data Mining), es un modelo de proceso
de minería de datos que describe una
manera en la que los expertos en esta
materia abordan el problema.Para
implementar una tecnología en un negocio
es necesaria una metodología. Estos
métodos suelen venir de las experiencias
propias y también de los procedimientos
estándar más conocidos.
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
5. FASE 1: COMPRENSIÓN DEL NEGOCIO
FASE2: COMPRENSIÓN DE LOS DATOS
FASE3: PREPARACIÓN DE LOS DATOS
FASE4: MODELADO
FASE5: EVALUACION
FASE6: IMPLANTACION
FASES DE CRISP-DM
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
6. Objetivos del negocio
Predecir los nuevos casos de
covic y agruparlos por
continente
Predecir el total de casos de la enfermedad de
coronavirus en todo el mundo.
Predecir la probabilidad de cuántos nuevos
casos va aumentar al final de año 2021
1784 1870 1950
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
7. algoritmo de Bayes Naive
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Variables utilizadas en
el algoritmo
8. algoritmo de Bayes Naive
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Rol de dependencias
9. algoritmo de Bayes Naive
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Perfiles de nuevos casos
10. algoritmo de Bayes Naive
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Perfil de los atributos
11. RESULTADO algoritmo de Bayes Naive
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Probabilidad de que aumenten nuevos casos un 16% en Sudamérica
12. algoritmo de Series Temporales
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Variables
utilizadas para
la estructura de
minería de
datos
13. algoritmo de Series Temporales
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
origen , campos
y criterios de
aceptación
14. algoritmo de Series Temporales
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Visor de minería
de datos
15. RESULTADO de Series Temporales
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Vista de los
nuevos casos
en los próximo
5 días
16. Algoritmo de Regresión Lineal
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Variables utilizadas para la estructura de minería de datos
Clave: rowId
Entrada: anio, extreme_poverty, handwashing_facilities,
hospital_beds_per_thousand, human_development_index, idcont, idpais, mes y
positive_rate.
De predicción: totalCasos
17. Algoritmo de Regresión Lineal
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Red de dependencias
18. RESULTADO de Regresión Lineal
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
En el modelo de
árbol de
decisión se
puede observar
que se tiene
una mayor
preferencia a
los productos
que no son
exclusivos
19. Algoritmo de Clusteres
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
predicción del
promedio de
casos para le
año 2021 y
2022.
20. Algoritmo de Clusteres
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Perfil del
atributo
21. Algoritmo de Clusteres
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Característica
de los atributos
22. Algoritmo de Clusteres
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Distinción de los
atributos
23. Resultado de Clusteres
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Gráfico de
predicción
24. Resultado de Clusteres
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Tabla del promedio
de estimación del
año 2020 y 2021
25. CONCLUSIONES
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez
Como conclusión se pudo predecir los nuevos casos de covic en base a un
determinado tiempo y Tomando en cuenta la referencia de los datos de Google
sobre COVID (126M) el total de casos puede llegar a aproximarse bastante a la
predicción tomando en cuenta que tenemos el promedio en base a 215 países y
aún falta por completar el año. También realizando pruebas para el siguiente
año se puede observar que es posible que el número de casos disminuya.
26. Gracias!
Integrantes: Lara Quiroz Elvis Módulo: Fundamentos de minería y
Quispe Mamani Nieves Vanessa Ciencias de datos
Vargas Ticona Ariel
Villegas Acuña Carlos E. Docente: Ing. David E. Mendoza Gutierrez