SlideShare una empresa de Scribd logo
1 de 31
Descargar para leer sin conexión
ESTIMACIÓN DE
PRECIPITACIONES
MÁXIMAS DE LA CUENCA
DE URUBAMBA MEDIANTE
EL MÉTODO DE WARD Y
EL MÉTODO DE K-MEANS
Ing. Jimmy Mendoza Montalvo
DOCENTE
ALUMNOS
Anthony Ramos Aponte
Diego Santos Mariano
Kelmer Mayta Chiclote
Fernando Rios Ortiz
I. RESUMEN
En el presente informe se realiza el procedimiento para la estimación de precipitaciones máximas de la cuenca de
Urubamba apoyándose del análisis de cluster, el cual utiliza la información previamente obtenida de la data
PISCO. Teniendo los datos de 15 estaciones pluviométricas, cada una de ellas con registro de precipitaciones
entre 1981 y 2016 (36 años) se procede a filtrar la información de precipitaciones para solo tomar la data de
precipitaciones máximas en un rango anual de cada estación, posteriormente se toma la información de las 15
estaciones y se ordena la información de tal manera en la que se encuentren todas la estaciones con sus valores
de precipitaciones máximas en el rango de años de 1981 hasta el 2016. Luego, se hará uso del software Past 4 en
el cual haremos uso del método de Ward para la manipulación de datos y obtendremos una clasificación en base
a los datos ingresados. Finalmente, se hará uso del software RStudio en el cual ingresaremos la información
organizada y mediante un proceso iterativo se hará uso del método de K-means para obtener una clasificación en
base a los datos registrados.
II. OBJETIVOS
▪ Realizar las estimaciones máximas de la cuenca de Urubamba
▪ Realizar un agrupamiento o análisis cluster acerca de las distribuciones de probabilidad para dichas
precipitaciones máximas
OBJETIVOS GENERALES
OBJETIVOS ESPECÍFICOS
▪ Obtener la data PISCO brindada por el Servicio Nacional de Meteorología e Hidrología del Perú
(SENAMHI)
▪ Aplicar los métodos de agrupamiento correspondiente al método de Ward y el método de K-means
▪ Discutir los resultados obtenidos por el método de Ward y el método de k-means
III. METODOLOGÍA
▪ Geográfica y políticamente, la cuenca de Vilcanota-Urubamba
abarca parte del territorio de los departamentos de Cusco (11
provincias, 73 distritos) con un 73,84% lo cual corresponde a un
área total de 43,370 km2, y otra parte del departamento de
Ucayali (1 provincia, 2 distritos) con un 26,16% lo cual
corresponde a un área total de 15,365 km2, teniendo un área
total de 58,735 km2.
ÁREA DE ESTUDIO
III. METODOLOGÍA
• La data pluviométrica de 15 estaciones meteorológicas fue obtenida del Servicio Nacional de
Meteorología e Hidrología del Perú (SENAMHI). La ubicación geográfica de las estaciones climáticas
se muestra en la figura siguiente. Cabe resaltar que esta data Pisco obtenida de cada estación ha
tenido que pasar por cierto filtro en el cual solo mantendremos la información relevante como son las
precipitaciones máximas
DATA METEOROLÓGICA
G5_SANTOS MARIANO JUAN DIEGO.pdf
Acjanaco
Etiquetas de fila Máx. de P_24hr
1981 165.25
1982 100.96
1983 66.93
1984 81.26
1985 63.44
1986 71.09
1987 56.72
1988 81.70
1989 72.32
1990 46.71
1991 76.52
1992 62.07
1993 59.03
1994 70.83
1995 56.72
1996 111.35
1997 84.06
1998 73.84
1999 60.97
2000 64.02
2001 113.83
2002 73.55
2003 62.16
2004 51.94
2005 80.64
2006 75.29
2007 106.89
2008 41.51
2009 60.48
2010 115.60
2011 89.71
2012 83.29
2013 85.73
2014 87.90
2015 65.16
2016 44.08
Ccatcca Cirialo
Etiquetas de fila Máx. de P_24hr
1981 47.64
1982 45.46
1983 57.44
1984 54.39
1985 46.34
1986 53.31
1987 62.76
1988 88.19
1989 61.50
1990 47.79
1991 49.20
1992 44.10
1993 50.54
1994 47.35
1995 56.19
1996 39.77
1997 75.56
1998 101.51
1999 46.24
2000 51.10
2001 61.66
2002 67.26
2003 48.74
2004 45.03
2005 70.08
2006 47.03
2007 47.17
2008 49.65
2009 50.06
2010 61.33
2011 46.01
2012 60.04
2013 57.80
2014 56.39
2015 62.77
2016 56.06
Colquepata
Granja
Kcayra Machu Picchu
Etiquetas de fila Máx. de P_24hr
1981 32.15
1982 31.00
1983 26.31
1984 29.15
1985 32.84
1986 25.93
1987 21.79
1988 22.73
1989 26.18
1990 17.70
1991 20.34
1992 23.99
1993 25.94
1994 31.78
1995 16.45
1996 22.33
1997 23.47
1998 26.77
1999 20.37
2000 19.03
2001 21.07
2002 35.92
2003 42.92
2004 24.01
2005 25.55
2006 39.45
2007 24.84
2008 25.59
2009 30.69
2010 38.30
2011 25.11
2012 32.30
2013 31.55
2014 25.70
2015 28.95
2016 21.22
Etiquetas de fila Máx. de P_24hr
1981 27.05
1982 25.26
1983 22.75
1984 28.21
1985 27.40
1986 26.39
1987 24.50
1988 36.27
1989 37.52
1990 20.76
1991 24.61
1992 19.93
1993 30.37
1994 27.91
1995 33.45
1996 30.61
1997 27.97
1998 34.01
1999 19.66
2000 23.22
2001 31.10
2002 25.47
2003 22.68
2004 30.32
2005 24.46
2006 38.26
2007 27.55
2008 23.51
2009 28.19
2010 32.62
2011 24.99
2012 24.93
2013 27.82
2014 30.01
2015 24.48
2016 19.04
Etiquetas de fila Máx. de P_24hr
1981 69.84
1982 69.00
1983 66.06
1984 74.98
1985 158.79
1986 98.56
1987 64.69
1988 238.57
1989 167.90
1990 60.08
1991 107.21
1992 106.93
1993 71.81
1994 89.61
1995 73.07
1996 62.74
1997 136.57
1998 55.19
1999 50.82
2000 46.48
2001 58.62
2002 72.51
2003 63.63
2004 41.14
2005 65.97
2006 47.26
2007 72.42
2008 50.17
2009 52.87
2010 42.67
2011 47.68
2012 46.50
2013 41.03
2014 62.63
2015 57.52
2016 70.31
Maranura Ocobamba Pisac
Etiquetas de fila Máx. de P_24hr
1981 60.06
1982 51.67
1983 46.21
1984 40.51
1985 47.49
1986 39.29
1987 51.19
1988 119.75
1989 77.51
1990 43.33
1991 55.28
1992 44.81
1993 61.14
1994 58.75
1995 58.61
1996 28.64
1997 39.87
1998 39.14
1999 48.76
2000 42.55
2001 57.66
2002 52.24
2003 49.10
2004 51.78
2005 49.50
2006 52.12
2007 50.32
2008 53.89
2009 37.78
2010 72.73
2011 41.72
2012 40.37
2013 38.66
2014 41.93
2015 42.61
2016 39.80
Etiquetas de fila Máx. de P_24hr
1981 44.36
1982 43.35
1983 35.13
1984 39.91
1985 61.81
1986 32.53
1987 42.26
1988 64.42
1989 50.47
1990 39.32
1991 48.86
1992 42.82
1993 54.05
1994 42.63
1995 62.61
1996 34.09
1997 43.84
1998 43.74
1999 97.97
2000 34.87
2001 43.58
2002 54.26
2003 50.62
2004 33.61
2005 36.80
2006 53.66
2007 74.17
2008 28.92
2009 34.32
2010 40.70
2011 38.73
2012 40.04
2013 54.00
2014 56.48
2015 29.53
2016 21.52
Etiquetas de fila Máx. de P_24hr
1981 32.69
1982 22.10
1983 24.21
1984 23.86
1985 25.71
1986 20.14
1987 17.68
1988 30.69
1989 31.06
1990 20.13
1991 18.40
1992 20.42
1993 23.71
1994 28.43
1995 27.49
1996 18.97
1997 22.31
1998 24.66
1999 24.02
2000 16.56
2001 24.77
2002 18.64
2003 20.65
2004 25.67
2005 16.21
2006 38.40
2007 19.41
2008 15.63
2009 24.90
2010 25.25
2011 23.85
2012 20.36
2013 27.28
2014 17.13
2015 22.21
2016 21.78
Pomacachi
Quebrada
Yanatilde Sepa
Etiquetas de fila Máx. de P_24hr
1981 39.38
1982 34.72
1983 15.64
1984 30.49
1985 42.45
1986 30.50
1987 22.31
1988 27.92
1989 34.43
1990 36.03
1991 24.18
1992 23.92
1993 19.15
1994 27.51
1995 20.92
1996 24.31
1997 28.86
1998 20.24
1999 21.92
2000 22.07
2001 34.65
2002 36.95
2003 27.46
2004 27.81
2005 29.09
2006 35.38
2007 39.45
2008 27.56
2009 31.05
2010 36.80
2011 26.22
2012 34.85
2013 29.53
2014 30.55
2015 31.97
2016 29.37
Etiquetas de fila Máx. de P_24hr
1981 43.62
1982 56.32
1983 53.59
1984 43.17
1985 42.96
1986 57.58
1987 63.79
1988 49.93
1989 53.78
1990 52.67
1991 44.50
1992 48.84
1993 40.01
1994 52.75
1995 73.58
1996 61.74
1997 77.94
1998 53.73
1999 89.83
2000 33.68
2001 37.06
2002 45.52
2003 62.88
2004 53.75
2005 37.17
2006 55.43
2007 48.64
2008 45.50
2009 54.64
2010 41.46
2011 55.97
2012 36.66
2013 50.19
2014 33.73
2015 45.88
2016 63.52
Etiquetas de fila Máx. de P_24hr
1981 43.62
1982 56.32
1983 53.59
1984 43.17
1985 42.96
1986 57.58
1987 63.79
1988 49.93
1989 53.78
1990 52.67
1991 44.50
1992 48.84
1993 40.01
1994 52.75
1995 73.58
1996 61.74
1997 77.94
1998 53.73
1999 89.83
2000 33.68
2001 37.06
2002 45.52
2003 62.88
2004 53.75
2005 37.17
2006 55.43
2007 48.64
2008 45.50
2009 54.64
2010 41.46
2011 55.97
2012 36.66
2013 50.19
2014 33.73
2015 45.88
2016 63.52
Sepahua
Urubamba Zurite
Etiquetas de fila Máx. de P_24hr
1981 54.98
1982 63.43
1983 44.10
1984 57.05
1985 89.64
1986 49.80
1987 41.66
1988 48.82
1989 60.04
1990 46.50
1991 53.84
1992 72.56
1993 55.52
1994 97.54
1995 51.83
1996 48.86
1997 47.03
1998 65.63
1999 33.57
2000 73.87
2001 78.92
2002 95.81
2003 53.69
2004 41.50
2005 68.63
2006 114.34
2007 54.81
2008 47.21
2009 79.55
2010 59.31
2011 56.40
2012 117.61
2013 61.17
2014 36.11
2015 65.43
2016 61.24
Etiquetas de fila Máx. de P_24hr
1981 21.24
1982 20.02
1983 19.69
1984 17.18
1985 25.20
1986 18.55
1987 16.35
1988 16.97
1989 21.55
1990 15.15
1991 18.96
1992 18.12
1993 23.73
1994 21.11
1995 23.23
1996 21.26
1997 13.68
1998 14.57
1999 28.74
2000 25.34
2001 31.27
2002 27.57
2003 23.98
2004 16.80
2005 15.68
2006 27.87
2007 18.45
2008 17.66
2009 27.08
2010 27.23
2011 21.22
2012 24.18
2013 29.67
2014 30.24
2015 17.31
2016 20.21
Etiquetas de fila Máx. de P_24hr
1981 32.98
1982 36.82
1983 26.80
1984 29.34
1985 42.57
1986 32.68
1987 33.90
1988 44.37
1989 43.00
1990 34.56
1991 41.43
1992 26.37
1993 41.58
1994 46.74
1995 49.51
1996 45.77
1997 31.06
1998 30.08
1999 52.37
2000 24.41
2001 41.18
2002 27.36
2003 27.80
2004 26.36
2005 25.34
2006 32.69
2007 37.88
2008 30.43
2009 36.84
2010 47.64
2011 51.35
2012 26.48
2013 32.05
2014 35.96
2015 22.04
2016 40.70
Año 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Acjanaco 165.25 100.96 66.93 81.26 63.44 71.09 56.72 81.70 72.32 46.71 76.52 62.07 59.03 70.83 56.72 111.35 84.06 73.84
Ccatcca 34.70 34.04 26.96 25.23 26.97 17.36 30.01 26.76 38.66 16.01 21.85 24.22 27.01 42.51 22.36 21.69 23.71 29.74
Cirialo 47.64 45.46 57.44 54.39 46.34 53.31 62.76 88.19 61.50 47.79 49.20 44.10 50.54 47.35 56.19 39.77 75.56 101.51
Colquepata 32.15 31.00 26.31 29.15 32.84 25.93 21.79 22.73 26.18 17.70 20.34 23.99 25.94 31.78 16.45 22.33 23.47 26.77
Granja Kcayra 27.05 25.26 22.75 28.21 27.40 26.39 24.50 36.27 37.52 20.76 24.61 19.93 30.37 27.91 33.45 30.61 27.97 34.01
Machu Picchu 69.84 69.00 66.06 74.98 158.79 98.56 64.69 238.57 167.90 60.08 107.21 106.93 71.81 89.61 73.07 62.74 136.57 55.19
Maranura 60.06 51.67 46.21 40.51 47.49 39.29 51.19 119.75 77.51 43.33 55.28 44.81 61.14 58.75 58.61 28.64 39.87 39.14
Ocobamba 44.36 43.35 35.13 39.91 61.81 32.53 42.26 64.42 50.47 39.32 48.86 42.82 54.05 42.63 62.61 34.09 43.84 43.74
Pisac 32.69 22.10 24.21 23.86 25.71 20.14 17.68 30.69 31.06 20.13 18.40 20.42 23.71 28.43 27.49 18.97 22.31 24.66
Pomacanchi 39.38 34.72 15.64 30.49 42.45 30.50 22.31 27.92 34.43 36.03 24.18 23.92 19.15 27.51 20.92 24.31 28.86 20.24
Quebrada Yanatilde 43.62 56.32 53.59 43.17 42.96 57.58 63.79 49.93 53.78 52.67 44.50 48.84 40.01 52.75 73.58 61.74 77.94 53.73
Sepa 54.02 52.63 49.26 72.41 88.66 58.27 46.38 60.32 47.42 44.28 60.88 52.90 48.50 80.65 63.15 59.73 50.09 57.67
Sepahua 54.98 63.43 44.10 57.05 89.64 49.80 41.66 48.82 60.04 46.50 53.84 72.56 55.52 97.54 51.83 48.86 47.03 65.63
Urubamba 21.24 20.02 19.69 17.18 25.20 18.55 16.35 16.97 21.55 15.15 18.96 18.12 23.73 21.11 23.23 21.26 13.68 14.57
Zurite 32.98 36.82 26.80 29.34 42.57 32.68 33.90 44.37 43.00 34.56 41.43 26.37 41.58 46.74 49.51 45.77 31.06 30.08
Precipitación
Máxima cada
24 horas
Precipitación
Máxima cada
24 horas (mm)
Año 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Acjanaco 165.25 100.96 66.93 81.26 63.44 71.09 56.72 81.70 72.32 46.71 76.52 62.07 59.03 70.83 56.72 111.35 84.06 73.84
Ccatcca 34.70 34.04 26.96 25.23 26.97 17.36 30.01 26.76 38.66 16.01 21.85 24.22 27.01 42.51 22.36 21.69 23.71 29.74
Cirialo 47.64 45.46 57.44 54.39 46.34 53.31 62.76 88.19 61.50 47.79 49.20 44.10 50.54 47.35 56.19 39.77 75.56 101.51
Colquepata 32.15 31.00 26.31 29.15 32.84 25.93 21.79 22.73 26.18 17.70 20.34 23.99 25.94 31.78 16.45 22.33 23.47 26.77
Granja Kcayra 27.05 25.26 22.75 28.21 27.40 26.39 24.50 36.27 37.52 20.76 24.61 19.93 30.37 27.91 33.45 30.61 27.97 34.01
Machu Picchu 69.84 69.00 66.06 74.98 158.79 98.56 64.69 238.57 167.90 60.08 107.21 106.93 71.81 89.61 73.07 62.74 136.57 55.19
Maranura 60.06 51.67 46.21 40.51 47.49 39.29 51.19 119.75 77.51 43.33 55.28 44.81 61.14 58.75 58.61 28.64 39.87 39.14
Ocobamba 44.36 43.35 35.13 39.91 61.81 32.53 42.26 64.42 50.47 39.32 48.86 42.82 54.05 42.63 62.61 34.09 43.84 43.74
Pisac 32.69 22.10 24.21 23.86 25.71 20.14 17.68 30.69 31.06 20.13 18.40 20.42 23.71 28.43 27.49 18.97 22.31 24.66
Pomacanchi 39.38 34.72 15.64 30.49 42.45 30.50 22.31 27.92 34.43 36.03 24.18 23.92 19.15 27.51 20.92 24.31 28.86 20.24
Quebrada Yanatilde 43.62 56.32 53.59 43.17 42.96 57.58 63.79 49.93 53.78 52.67 44.50 48.84 40.01 52.75 73.58 61.74 77.94 53.73
Sepa 54.02 52.63 49.26 72.41 88.66 58.27 46.38 60.32 47.42 44.28 60.88 52.90 48.50 80.65 63.15 59.73 50.09 57.67
Sepahua 54.98 63.43 44.10 57.05 89.64 49.80 41.66 48.82 60.04 46.50 53.84 72.56 55.52 97.54 51.83 48.86 47.03 65.63
Urubamba 21.24 20.02 19.69 17.18 25.20 18.55 16.35 16.97 21.55 15.15 18.96 18.12 23.73 21.11 23.23 21.26 13.68 14.57
Zurite 32.98 36.82 26.80 29.34 42.57 32.68 33.90 44.37 43.00 34.56 41.43 26.37 41.58 46.74 49.51 45.77 31.06 30.08
Precipitación
Máxima cada
24 horas
Precipitación
Máxima cada
24 horas (mm)
III. METODOLOGÍA
• El análisis de cluster es una técnica estadística multivariante cuya idea básica es agrupar un conjunto de observaciones en un
número dado de cluster o grupos tratando de lograr la máxima homogeneidad en cada grupo y la mayor diferencia entre los
grupos. Este agrupamiento se basa en la idea de distancia o similitud entre las observaciones. Este análisis tiene dos tipos de
clasificaciones:
Métodos de Cluster Jerárquicos
• En la práctica, no se pueden examinar todas las posibilidades de agrupar los elementos, incluso con los ordenadores más rápidos.
Una solución se encuentra en los llamados métodos jerárquicos. Se tienen dos posibles formas de actuar:
Métodos jerárquicos aglomerativos
• Se comienza con los objetos o individuos de modo individual; de este modo, se tienen tantos clusters iniciales como objetos. Luego
se van agrupando de modo que los primeros en hacerlo son los más similares y al final, todos los subgrupos se unen en un único
cluster.
ANÁLISIS CLUSTER
III. METODOLOGÍA
Métodos jerárquicos divididos
• Se actúa, de manera contraria. Se parte de un único grupo con todas las observaciones y se van dividiendo según lo lejanos que se
encuentren. Las metodologías de trabajo más conocidos dentro de los métodos jerárquicos son:
Enlace Simple
Enlace completo
Método de agrupación de vinculación promedio
Método de Ward o Varianza mínima
Métodos de Cluster no Jerárquicos
• En este caso comienzan con una solución prestablecida. Este es el punto de partida para el análisis clúster. De esta forma, los
grupos están establecidos de antemano y luego se van cambiando de modo iterativo, en función de sus características. A su vez,
podemos dividirlos en otros subgrupos.
Métodos de reasignación
• Los más relevantes son los métodos de centroides, como el k-means. Los de medioides, como el PAM. O el de las nubes dinámicas.
ANÁLISIS CLUSTER
III. METODOLOGÍA
Métodos directos
• El más importante es el block clustering, muy utilizado en minería de datos.
Métodos reductivos
• Estos están basados en los análisis factoriales tipo Q.
Métodos de búsqueda de densidad
• Por un lado, estarían los de aproximaciones tipológicas, como el análisis modal. Por otro, tenemos los probabilísticos,
como el de Wolf.
ANÁLISIS CLUSTER
G5_SANTOS MARIANO JUAN DIEGO.pdf
III. METODOLOGÍA
• Este método une los casos buscando minimizar la varianza
dentro de cada grupo. Para ello se calcula, en un primer
momento, la media de todas las variables en cada
conglomerado. Seguido, se calcula la distancia entre cada
caso y la media del conglomerado, sumando después las
distancias entre todos los casos obtenidos. Posteriormente se
agrupan los conglomerados que generen menos aumentos en
la suma de las distancias dentro de cada conglomerado. Este
procedimiento crea grupos homogéneos y con tamaños
similares que se pueden apreciar de mejor manera en un
dendograma.
MÉTODO DE WARD
III. METODOLOGÍA
• Es un procediendo iterativo mediante el cual cada observación se
asigna al cluster más cercano. Inicialmente se establecen de
forma aleatoria las ubicaciones centrales de los grupos o
centroides. Se calculan las distancias de los distintos individuos a
estos centroides y se agrupa cada uno en el cluster más cercano.
Una vez las observaciones han sido clasificadas en el grupo cuyo
centroide es más cercano, se recalculan los centroides y se repite
el proceso de reagrupación. Hasta que los centroides se
estabilizan.
MÉTODO DE K-MEANS
IV. RESULTADOS
MÉTODO DE WARD
G5_SANTOS MARIANO JUAN DIEGO.pdf
G5_SANTOS MARIANO JUAN DIEGO.pdf
III. RESULTADOS
MÉTODO DE K-MEANS
G5_SANTOS MARIANO JUAN DIEGO.pdf
G5_SANTOS MARIANO JUAN DIEGO.pdf
Acjanaco 1
Ccatcca 2
Cirialo 3
Colquepata 4
Granja Kcayra 5
Machu Picchu 6
Maranura 7
Ocobamba 8
Pisac 9
Pomacanchi 10
Quebrada Yanatilde 11
Sepa 12
Sepahua 13
Urubamba 14
Zurite 15
V. DISCUCIÓN DE RESULTADOS
▪ Con respecto al método de Ward, interpretando los resultados podemos realizar una agrupación el
cual estaría dividido en dos grupos como se aprecia en la tabla siguiente.
▪ Referente al método de K-means, interpretando los resultados obtenidos podemos realizar 3 tipos
de agrupaciones, referentes al número de cluster k=2, k=3 y k=4 como se aprecia en la tabla
siguiente.
▪ Tanto el método de Ward como el método de K-means me arrojan resultados de clasificaciones
distintas; sin embargo, hay un punto de similitud con el método de K-means cuando el número de
cluster es k = 3, en este caso el Grupo 3 del método de K-means coincide con el Grupo 1 del método
de Ward.
Machu Picchu
Acjanaco
Sepahua
Sepa
Zurite
Pomacanchi
Colquepata
Pisac
Granja Kcayra
Ccatcca
Urubama
Quebrada Yanatilde
Ocobamba
Maranura
Cirialo
Grupo 1
Grupo 2
Método de Ward
Urubamba Urubamba Urubamba
Granja Kcayra Granja Kcayra Granja Kcayra
Pisac Pisac Pisac
Pomacanchi Pomacanchi Pomacanchi
Ccatcca Ccatcca Ccatcca
Colquepata Colquepata Colquepata
Ocobamba Ocobamba Ocobamba
Zurite Zurite Zurite
Quebrada Yanatilde Quebrada Yanatilde Quebrada Yanatilde
Cirialo Cirialo Cirialo
Maranura Maranura Maranura
Machu Picchu Machu Picchu Grupo 3 Machu Picchu
Acjanaco Acjanaco Acjanaco
Sepa Sepa Sepa
Sepahua Sepahua Sepahua
Grupo 3
Agrupación k=4
Grupo 1
Grupo 2
Grupo 4
Método de K-means
Agrupación k=3
Grupo 1
Grupo 2
Grupo 1
Grupo 2
Agrupación k=2
VI. CONCLUSIONES
▪ El análisis de clustering es una técnica estadística multivariante cuya finalidad es dividir un conjunto
de objetos en grupos que compartan cierto patrón.
▪ La metodología desarrollada permitió completar la correcta agrupación en base a la información
brindada por la data PISCO de 15 estaciones pluviométricas brindada por el Servicio Nacional de
Meteorología e Hidrología del Perú (SENAMHI).
▪ El método de Ward a comparación de los otros métodos mencionados tiene significativamente
menos cálculos que otros métodos, el inconveniente de esto es que generalmente da como
resultado clústeres menos que óptimos.
▪ Si bien es cierto el método de Ward es similar a método de K-means, la ventaja que tenemos con el
segundo es que podemos seleccionar el número de cluster que nosotros queramos y nos arroja su
dendograma correspondiente.
¡Gracias!

Más contenido relacionado

Similar a G5_SANTOS MARIANO JUAN DIEGO.pdf

Censos Nacionales 2017 - Primeros Resultados
Censos Nacionales 2017 - Primeros Resultados Censos Nacionales 2017 - Primeros Resultados
Censos Nacionales 2017 - Primeros Resultados Erik Gur
 
DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL ESTADO DE SONORA 2005...
DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL  ESTADO DE SONORA  2005...DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL  ESTADO DE SONORA  2005...
DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL ESTADO DE SONORA 2005...Carlos Roberto Leal Escalante MSc.
 
Informe final topografia 2
Informe final topografia 2Informe final topografia 2
Informe final topografia 2Carlos Aguilar
 
Pa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docx
Pa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docxPa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docx
Pa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docxRICARDOPATIORENDON1
 
Obras de restauración y mejoramiento de la Laguna.pptx
Obras de restauración y mejoramiento de la Laguna.pptxObras de restauración y mejoramiento de la Laguna.pptx
Obras de restauración y mejoramiento de la Laguna.pptxFranzTito1
 
informe-grupal-fase-3-grupo-212.pdf
informe-grupal-fase-3-grupo-212.pdfinforme-grupal-fase-3-grupo-212.pdf
informe-grupal-fase-3-grupo-212.pdfDavidAlejandroMarque
 
PANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUE
PANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUEPANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUE
PANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUEEnseñanza Medica
 

Similar a G5_SANTOS MARIANO JUAN DIEGO.pdf (12)

Mayo
MayoMayo
Mayo
 
Censos Nacionales 2017 - Primeros Resultados
Censos Nacionales 2017 - Primeros Resultados Censos Nacionales 2017 - Primeros Resultados
Censos Nacionales 2017 - Primeros Resultados
 
Uh aaah
Uh aaahUh aaah
Uh aaah
 
HIDROSTATICA_FLUJO DIRECTO
HIDROSTATICA_FLUJO DIRECTOHIDROSTATICA_FLUJO DIRECTO
HIDROSTATICA_FLUJO DIRECTO
 
DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL ESTADO DE SONORA 2005...
DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL  ESTADO DE SONORA  2005...DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL  ESTADO DE SONORA  2005...
DIAGNOSTICO SITUACIONAL DE RIESGOS SANITARIOS PARA EL ESTADO DE SONORA 2005...
 
Caudal ecológico 2
Caudal ecológico 2Caudal ecológico 2
Caudal ecológico 2
 
Informe final topografia 2
Informe final topografia 2Informe final topografia 2
Informe final topografia 2
 
Ranking de influyentes 2015
Ranking de influyentes 2015 Ranking de influyentes 2015
Ranking de influyentes 2015
 
Pa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docx
Pa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docxPa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docx
Pa01 _CHINI.1_MORALES.2_AYMEYDA.3_ PATIÑO.4.docx
 
Obras de restauración y mejoramiento de la Laguna.pptx
Obras de restauración y mejoramiento de la Laguna.pptxObras de restauración y mejoramiento de la Laguna.pptx
Obras de restauración y mejoramiento de la Laguna.pptx
 
informe-grupal-fase-3-grupo-212.pdf
informe-grupal-fase-3-grupo-212.pdfinforme-grupal-fase-3-grupo-212.pdf
informe-grupal-fase-3-grupo-212.pdf
 
PANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUE
PANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUEPANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUE
PANORAMA EPIDEMIOLÓGICO DE FIEBRE POR DENGUE Y FIEBRE HEMORRÁGICA POR DENGUE
 

Último

Formato de práctica reflexiva ante una problemática social.docx.pdf
Formato de práctica reflexiva ante una problemática social.docx.pdfFormato de práctica reflexiva ante una problemática social.docx.pdf
Formato de práctica reflexiva ante una problemática social.docx.pdfjuanrubenc78
 
Virus -Josue Cabascango _20240322_194349_0000.pdf
Virus -Josue Cabascango _20240322_194349_0000.pdfVirus -Josue Cabascango _20240322_194349_0000.pdf
Virus -Josue Cabascango _20240322_194349_0000.pdfMiSpotify
 
02 - RUP_Introduccion_Definicion.pdf
02 - RUP_Introduccion_Definicion.pdf02 - RUP_Introduccion_Definicion.pdf
02 - RUP_Introduccion_Definicion.pdfRodrigo Cerón
 
Simuladores de circuitos electrónicos.pdf
Simuladores de circuitos electrónicos.pdfSimuladores de circuitos electrónicos.pdf
Simuladores de circuitos electrónicos.pdfLeonardoOa4
 
03 - RUP_Elaboracion_Construccion_1_2024.pdf
03 - RUP_Elaboracion_Construccion_1_2024.pdf03 - RUP_Elaboracion_Construccion_1_2024.pdf
03 - RUP_Elaboracion_Construccion_1_2024.pdfRodrigo Cerón
 
Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...
Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...
Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...AlexaRamirez39
 
Herramientas de Mantenimiento_Soporte Técnico_David Andrade.pdf
Herramientas de Mantenimiento_Soporte Técnico_David Andrade.pdfHerramientas de Mantenimiento_Soporte Técnico_David Andrade.pdf
Herramientas de Mantenimiento_Soporte Técnico_David Andrade.pdfdaa100407
 
Algoritmos Paralelos - Actividad 14 - UNIBE.pdf
Algoritmos Paralelos - Actividad 14 - UNIBE.pdfAlgoritmos Paralelos - Actividad 14 - UNIBE.pdf
Algoritmos Paralelos - Actividad 14 - UNIBE.pdfdarosario3d
 
Los mejores simuladores electrónicos que se pueden utilizar
Los mejores simuladores electrónicos que se pueden utilizarLos mejores simuladores electrónicos que se pueden utilizar
Los mejores simuladores electrónicos que se pueden utilizarjosuesj13
 

Último (9)

Formato de práctica reflexiva ante una problemática social.docx.pdf
Formato de práctica reflexiva ante una problemática social.docx.pdfFormato de práctica reflexiva ante una problemática social.docx.pdf
Formato de práctica reflexiva ante una problemática social.docx.pdf
 
Virus -Josue Cabascango _20240322_194349_0000.pdf
Virus -Josue Cabascango _20240322_194349_0000.pdfVirus -Josue Cabascango _20240322_194349_0000.pdf
Virus -Josue Cabascango _20240322_194349_0000.pdf
 
02 - RUP_Introduccion_Definicion.pdf
02 - RUP_Introduccion_Definicion.pdf02 - RUP_Introduccion_Definicion.pdf
02 - RUP_Introduccion_Definicion.pdf
 
Simuladores de circuitos electrónicos.pdf
Simuladores de circuitos electrónicos.pdfSimuladores de circuitos electrónicos.pdf
Simuladores de circuitos electrónicos.pdf
 
03 - RUP_Elaboracion_Construccion_1_2024.pdf
03 - RUP_Elaboracion_Construccion_1_2024.pdf03 - RUP_Elaboracion_Construccion_1_2024.pdf
03 - RUP_Elaboracion_Construccion_1_2024.pdf
 
Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...
Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...
Diseño de Algoritmos Paralelos. Mejorando la eficiencia computacional aprovec...
 
Herramientas de Mantenimiento_Soporte Técnico_David Andrade.pdf
Herramientas de Mantenimiento_Soporte Técnico_David Andrade.pdfHerramientas de Mantenimiento_Soporte Técnico_David Andrade.pdf
Herramientas de Mantenimiento_Soporte Técnico_David Andrade.pdf
 
Algoritmos Paralelos - Actividad 14 - UNIBE.pdf
Algoritmos Paralelos - Actividad 14 - UNIBE.pdfAlgoritmos Paralelos - Actividad 14 - UNIBE.pdf
Algoritmos Paralelos - Actividad 14 - UNIBE.pdf
 
Los mejores simuladores electrónicos que se pueden utilizar
Los mejores simuladores electrónicos que se pueden utilizarLos mejores simuladores electrónicos que se pueden utilizar
Los mejores simuladores electrónicos que se pueden utilizar
 

G5_SANTOS MARIANO JUAN DIEGO.pdf

  • 1. ESTIMACIÓN DE PRECIPITACIONES MÁXIMAS DE LA CUENCA DE URUBAMBA MEDIANTE EL MÉTODO DE WARD Y EL MÉTODO DE K-MEANS Ing. Jimmy Mendoza Montalvo DOCENTE ALUMNOS Anthony Ramos Aponte Diego Santos Mariano Kelmer Mayta Chiclote Fernando Rios Ortiz
  • 2. I. RESUMEN En el presente informe se realiza el procedimiento para la estimación de precipitaciones máximas de la cuenca de Urubamba apoyándose del análisis de cluster, el cual utiliza la información previamente obtenida de la data PISCO. Teniendo los datos de 15 estaciones pluviométricas, cada una de ellas con registro de precipitaciones entre 1981 y 2016 (36 años) se procede a filtrar la información de precipitaciones para solo tomar la data de precipitaciones máximas en un rango anual de cada estación, posteriormente se toma la información de las 15 estaciones y se ordena la información de tal manera en la que se encuentren todas la estaciones con sus valores de precipitaciones máximas en el rango de años de 1981 hasta el 2016. Luego, se hará uso del software Past 4 en el cual haremos uso del método de Ward para la manipulación de datos y obtendremos una clasificación en base a los datos ingresados. Finalmente, se hará uso del software RStudio en el cual ingresaremos la información organizada y mediante un proceso iterativo se hará uso del método de K-means para obtener una clasificación en base a los datos registrados.
  • 3. II. OBJETIVOS ▪ Realizar las estimaciones máximas de la cuenca de Urubamba ▪ Realizar un agrupamiento o análisis cluster acerca de las distribuciones de probabilidad para dichas precipitaciones máximas OBJETIVOS GENERALES OBJETIVOS ESPECÍFICOS ▪ Obtener la data PISCO brindada por el Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI) ▪ Aplicar los métodos de agrupamiento correspondiente al método de Ward y el método de K-means ▪ Discutir los resultados obtenidos por el método de Ward y el método de k-means
  • 4. III. METODOLOGÍA ▪ Geográfica y políticamente, la cuenca de Vilcanota-Urubamba abarca parte del territorio de los departamentos de Cusco (11 provincias, 73 distritos) con un 73,84% lo cual corresponde a un área total de 43,370 km2, y otra parte del departamento de Ucayali (1 provincia, 2 distritos) con un 26,16% lo cual corresponde a un área total de 15,365 km2, teniendo un área total de 58,735 km2. ÁREA DE ESTUDIO
  • 5. III. METODOLOGÍA • La data pluviométrica de 15 estaciones meteorológicas fue obtenida del Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI). La ubicación geográfica de las estaciones climáticas se muestra en la figura siguiente. Cabe resaltar que esta data Pisco obtenida de cada estación ha tenido que pasar por cierto filtro en el cual solo mantendremos la información relevante como son las precipitaciones máximas DATA METEOROLÓGICA
  • 7. Acjanaco Etiquetas de fila Máx. de P_24hr 1981 165.25 1982 100.96 1983 66.93 1984 81.26 1985 63.44 1986 71.09 1987 56.72 1988 81.70 1989 72.32 1990 46.71 1991 76.52 1992 62.07 1993 59.03 1994 70.83 1995 56.72 1996 111.35 1997 84.06 1998 73.84 1999 60.97 2000 64.02 2001 113.83 2002 73.55 2003 62.16 2004 51.94 2005 80.64 2006 75.29 2007 106.89 2008 41.51 2009 60.48 2010 115.60 2011 89.71 2012 83.29 2013 85.73 2014 87.90 2015 65.16 2016 44.08 Ccatcca Cirialo Etiquetas de fila Máx. de P_24hr 1981 47.64 1982 45.46 1983 57.44 1984 54.39 1985 46.34 1986 53.31 1987 62.76 1988 88.19 1989 61.50 1990 47.79 1991 49.20 1992 44.10 1993 50.54 1994 47.35 1995 56.19 1996 39.77 1997 75.56 1998 101.51 1999 46.24 2000 51.10 2001 61.66 2002 67.26 2003 48.74 2004 45.03 2005 70.08 2006 47.03 2007 47.17 2008 49.65 2009 50.06 2010 61.33 2011 46.01 2012 60.04 2013 57.80 2014 56.39 2015 62.77 2016 56.06
  • 8. Colquepata Granja Kcayra Machu Picchu Etiquetas de fila Máx. de P_24hr 1981 32.15 1982 31.00 1983 26.31 1984 29.15 1985 32.84 1986 25.93 1987 21.79 1988 22.73 1989 26.18 1990 17.70 1991 20.34 1992 23.99 1993 25.94 1994 31.78 1995 16.45 1996 22.33 1997 23.47 1998 26.77 1999 20.37 2000 19.03 2001 21.07 2002 35.92 2003 42.92 2004 24.01 2005 25.55 2006 39.45 2007 24.84 2008 25.59 2009 30.69 2010 38.30 2011 25.11 2012 32.30 2013 31.55 2014 25.70 2015 28.95 2016 21.22 Etiquetas de fila Máx. de P_24hr 1981 27.05 1982 25.26 1983 22.75 1984 28.21 1985 27.40 1986 26.39 1987 24.50 1988 36.27 1989 37.52 1990 20.76 1991 24.61 1992 19.93 1993 30.37 1994 27.91 1995 33.45 1996 30.61 1997 27.97 1998 34.01 1999 19.66 2000 23.22 2001 31.10 2002 25.47 2003 22.68 2004 30.32 2005 24.46 2006 38.26 2007 27.55 2008 23.51 2009 28.19 2010 32.62 2011 24.99 2012 24.93 2013 27.82 2014 30.01 2015 24.48 2016 19.04 Etiquetas de fila Máx. de P_24hr 1981 69.84 1982 69.00 1983 66.06 1984 74.98 1985 158.79 1986 98.56 1987 64.69 1988 238.57 1989 167.90 1990 60.08 1991 107.21 1992 106.93 1993 71.81 1994 89.61 1995 73.07 1996 62.74 1997 136.57 1998 55.19 1999 50.82 2000 46.48 2001 58.62 2002 72.51 2003 63.63 2004 41.14 2005 65.97 2006 47.26 2007 72.42 2008 50.17 2009 52.87 2010 42.67 2011 47.68 2012 46.50 2013 41.03 2014 62.63 2015 57.52 2016 70.31
  • 9. Maranura Ocobamba Pisac Etiquetas de fila Máx. de P_24hr 1981 60.06 1982 51.67 1983 46.21 1984 40.51 1985 47.49 1986 39.29 1987 51.19 1988 119.75 1989 77.51 1990 43.33 1991 55.28 1992 44.81 1993 61.14 1994 58.75 1995 58.61 1996 28.64 1997 39.87 1998 39.14 1999 48.76 2000 42.55 2001 57.66 2002 52.24 2003 49.10 2004 51.78 2005 49.50 2006 52.12 2007 50.32 2008 53.89 2009 37.78 2010 72.73 2011 41.72 2012 40.37 2013 38.66 2014 41.93 2015 42.61 2016 39.80 Etiquetas de fila Máx. de P_24hr 1981 44.36 1982 43.35 1983 35.13 1984 39.91 1985 61.81 1986 32.53 1987 42.26 1988 64.42 1989 50.47 1990 39.32 1991 48.86 1992 42.82 1993 54.05 1994 42.63 1995 62.61 1996 34.09 1997 43.84 1998 43.74 1999 97.97 2000 34.87 2001 43.58 2002 54.26 2003 50.62 2004 33.61 2005 36.80 2006 53.66 2007 74.17 2008 28.92 2009 34.32 2010 40.70 2011 38.73 2012 40.04 2013 54.00 2014 56.48 2015 29.53 2016 21.52 Etiquetas de fila Máx. de P_24hr 1981 32.69 1982 22.10 1983 24.21 1984 23.86 1985 25.71 1986 20.14 1987 17.68 1988 30.69 1989 31.06 1990 20.13 1991 18.40 1992 20.42 1993 23.71 1994 28.43 1995 27.49 1996 18.97 1997 22.31 1998 24.66 1999 24.02 2000 16.56 2001 24.77 2002 18.64 2003 20.65 2004 25.67 2005 16.21 2006 38.40 2007 19.41 2008 15.63 2009 24.90 2010 25.25 2011 23.85 2012 20.36 2013 27.28 2014 17.13 2015 22.21 2016 21.78
  • 10. Pomacachi Quebrada Yanatilde Sepa Etiquetas de fila Máx. de P_24hr 1981 39.38 1982 34.72 1983 15.64 1984 30.49 1985 42.45 1986 30.50 1987 22.31 1988 27.92 1989 34.43 1990 36.03 1991 24.18 1992 23.92 1993 19.15 1994 27.51 1995 20.92 1996 24.31 1997 28.86 1998 20.24 1999 21.92 2000 22.07 2001 34.65 2002 36.95 2003 27.46 2004 27.81 2005 29.09 2006 35.38 2007 39.45 2008 27.56 2009 31.05 2010 36.80 2011 26.22 2012 34.85 2013 29.53 2014 30.55 2015 31.97 2016 29.37 Etiquetas de fila Máx. de P_24hr 1981 43.62 1982 56.32 1983 53.59 1984 43.17 1985 42.96 1986 57.58 1987 63.79 1988 49.93 1989 53.78 1990 52.67 1991 44.50 1992 48.84 1993 40.01 1994 52.75 1995 73.58 1996 61.74 1997 77.94 1998 53.73 1999 89.83 2000 33.68 2001 37.06 2002 45.52 2003 62.88 2004 53.75 2005 37.17 2006 55.43 2007 48.64 2008 45.50 2009 54.64 2010 41.46 2011 55.97 2012 36.66 2013 50.19 2014 33.73 2015 45.88 2016 63.52 Etiquetas de fila Máx. de P_24hr 1981 43.62 1982 56.32 1983 53.59 1984 43.17 1985 42.96 1986 57.58 1987 63.79 1988 49.93 1989 53.78 1990 52.67 1991 44.50 1992 48.84 1993 40.01 1994 52.75 1995 73.58 1996 61.74 1997 77.94 1998 53.73 1999 89.83 2000 33.68 2001 37.06 2002 45.52 2003 62.88 2004 53.75 2005 37.17 2006 55.43 2007 48.64 2008 45.50 2009 54.64 2010 41.46 2011 55.97 2012 36.66 2013 50.19 2014 33.73 2015 45.88 2016 63.52
  • 11. Sepahua Urubamba Zurite Etiquetas de fila Máx. de P_24hr 1981 54.98 1982 63.43 1983 44.10 1984 57.05 1985 89.64 1986 49.80 1987 41.66 1988 48.82 1989 60.04 1990 46.50 1991 53.84 1992 72.56 1993 55.52 1994 97.54 1995 51.83 1996 48.86 1997 47.03 1998 65.63 1999 33.57 2000 73.87 2001 78.92 2002 95.81 2003 53.69 2004 41.50 2005 68.63 2006 114.34 2007 54.81 2008 47.21 2009 79.55 2010 59.31 2011 56.40 2012 117.61 2013 61.17 2014 36.11 2015 65.43 2016 61.24 Etiquetas de fila Máx. de P_24hr 1981 21.24 1982 20.02 1983 19.69 1984 17.18 1985 25.20 1986 18.55 1987 16.35 1988 16.97 1989 21.55 1990 15.15 1991 18.96 1992 18.12 1993 23.73 1994 21.11 1995 23.23 1996 21.26 1997 13.68 1998 14.57 1999 28.74 2000 25.34 2001 31.27 2002 27.57 2003 23.98 2004 16.80 2005 15.68 2006 27.87 2007 18.45 2008 17.66 2009 27.08 2010 27.23 2011 21.22 2012 24.18 2013 29.67 2014 30.24 2015 17.31 2016 20.21 Etiquetas de fila Máx. de P_24hr 1981 32.98 1982 36.82 1983 26.80 1984 29.34 1985 42.57 1986 32.68 1987 33.90 1988 44.37 1989 43.00 1990 34.56 1991 41.43 1992 26.37 1993 41.58 1994 46.74 1995 49.51 1996 45.77 1997 31.06 1998 30.08 1999 52.37 2000 24.41 2001 41.18 2002 27.36 2003 27.80 2004 26.36 2005 25.34 2006 32.69 2007 37.88 2008 30.43 2009 36.84 2010 47.64 2011 51.35 2012 26.48 2013 32.05 2014 35.96 2015 22.04 2016 40.70
  • 12. Año 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 Acjanaco 165.25 100.96 66.93 81.26 63.44 71.09 56.72 81.70 72.32 46.71 76.52 62.07 59.03 70.83 56.72 111.35 84.06 73.84 Ccatcca 34.70 34.04 26.96 25.23 26.97 17.36 30.01 26.76 38.66 16.01 21.85 24.22 27.01 42.51 22.36 21.69 23.71 29.74 Cirialo 47.64 45.46 57.44 54.39 46.34 53.31 62.76 88.19 61.50 47.79 49.20 44.10 50.54 47.35 56.19 39.77 75.56 101.51 Colquepata 32.15 31.00 26.31 29.15 32.84 25.93 21.79 22.73 26.18 17.70 20.34 23.99 25.94 31.78 16.45 22.33 23.47 26.77 Granja Kcayra 27.05 25.26 22.75 28.21 27.40 26.39 24.50 36.27 37.52 20.76 24.61 19.93 30.37 27.91 33.45 30.61 27.97 34.01 Machu Picchu 69.84 69.00 66.06 74.98 158.79 98.56 64.69 238.57 167.90 60.08 107.21 106.93 71.81 89.61 73.07 62.74 136.57 55.19 Maranura 60.06 51.67 46.21 40.51 47.49 39.29 51.19 119.75 77.51 43.33 55.28 44.81 61.14 58.75 58.61 28.64 39.87 39.14 Ocobamba 44.36 43.35 35.13 39.91 61.81 32.53 42.26 64.42 50.47 39.32 48.86 42.82 54.05 42.63 62.61 34.09 43.84 43.74 Pisac 32.69 22.10 24.21 23.86 25.71 20.14 17.68 30.69 31.06 20.13 18.40 20.42 23.71 28.43 27.49 18.97 22.31 24.66 Pomacanchi 39.38 34.72 15.64 30.49 42.45 30.50 22.31 27.92 34.43 36.03 24.18 23.92 19.15 27.51 20.92 24.31 28.86 20.24 Quebrada Yanatilde 43.62 56.32 53.59 43.17 42.96 57.58 63.79 49.93 53.78 52.67 44.50 48.84 40.01 52.75 73.58 61.74 77.94 53.73 Sepa 54.02 52.63 49.26 72.41 88.66 58.27 46.38 60.32 47.42 44.28 60.88 52.90 48.50 80.65 63.15 59.73 50.09 57.67 Sepahua 54.98 63.43 44.10 57.05 89.64 49.80 41.66 48.82 60.04 46.50 53.84 72.56 55.52 97.54 51.83 48.86 47.03 65.63 Urubamba 21.24 20.02 19.69 17.18 25.20 18.55 16.35 16.97 21.55 15.15 18.96 18.12 23.73 21.11 23.23 21.26 13.68 14.57 Zurite 32.98 36.82 26.80 29.34 42.57 32.68 33.90 44.37 43.00 34.56 41.43 26.37 41.58 46.74 49.51 45.77 31.06 30.08 Precipitación Máxima cada 24 horas Precipitación Máxima cada 24 horas (mm)
  • 13. Año 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 Acjanaco 165.25 100.96 66.93 81.26 63.44 71.09 56.72 81.70 72.32 46.71 76.52 62.07 59.03 70.83 56.72 111.35 84.06 73.84 Ccatcca 34.70 34.04 26.96 25.23 26.97 17.36 30.01 26.76 38.66 16.01 21.85 24.22 27.01 42.51 22.36 21.69 23.71 29.74 Cirialo 47.64 45.46 57.44 54.39 46.34 53.31 62.76 88.19 61.50 47.79 49.20 44.10 50.54 47.35 56.19 39.77 75.56 101.51 Colquepata 32.15 31.00 26.31 29.15 32.84 25.93 21.79 22.73 26.18 17.70 20.34 23.99 25.94 31.78 16.45 22.33 23.47 26.77 Granja Kcayra 27.05 25.26 22.75 28.21 27.40 26.39 24.50 36.27 37.52 20.76 24.61 19.93 30.37 27.91 33.45 30.61 27.97 34.01 Machu Picchu 69.84 69.00 66.06 74.98 158.79 98.56 64.69 238.57 167.90 60.08 107.21 106.93 71.81 89.61 73.07 62.74 136.57 55.19 Maranura 60.06 51.67 46.21 40.51 47.49 39.29 51.19 119.75 77.51 43.33 55.28 44.81 61.14 58.75 58.61 28.64 39.87 39.14 Ocobamba 44.36 43.35 35.13 39.91 61.81 32.53 42.26 64.42 50.47 39.32 48.86 42.82 54.05 42.63 62.61 34.09 43.84 43.74 Pisac 32.69 22.10 24.21 23.86 25.71 20.14 17.68 30.69 31.06 20.13 18.40 20.42 23.71 28.43 27.49 18.97 22.31 24.66 Pomacanchi 39.38 34.72 15.64 30.49 42.45 30.50 22.31 27.92 34.43 36.03 24.18 23.92 19.15 27.51 20.92 24.31 28.86 20.24 Quebrada Yanatilde 43.62 56.32 53.59 43.17 42.96 57.58 63.79 49.93 53.78 52.67 44.50 48.84 40.01 52.75 73.58 61.74 77.94 53.73 Sepa 54.02 52.63 49.26 72.41 88.66 58.27 46.38 60.32 47.42 44.28 60.88 52.90 48.50 80.65 63.15 59.73 50.09 57.67 Sepahua 54.98 63.43 44.10 57.05 89.64 49.80 41.66 48.82 60.04 46.50 53.84 72.56 55.52 97.54 51.83 48.86 47.03 65.63 Urubamba 21.24 20.02 19.69 17.18 25.20 18.55 16.35 16.97 21.55 15.15 18.96 18.12 23.73 21.11 23.23 21.26 13.68 14.57 Zurite 32.98 36.82 26.80 29.34 42.57 32.68 33.90 44.37 43.00 34.56 41.43 26.37 41.58 46.74 49.51 45.77 31.06 30.08 Precipitación Máxima cada 24 horas Precipitación Máxima cada 24 horas (mm)
  • 14. III. METODOLOGÍA • El análisis de cluster es una técnica estadística multivariante cuya idea básica es agrupar un conjunto de observaciones en un número dado de cluster o grupos tratando de lograr la máxima homogeneidad en cada grupo y la mayor diferencia entre los grupos. Este agrupamiento se basa en la idea de distancia o similitud entre las observaciones. Este análisis tiene dos tipos de clasificaciones: Métodos de Cluster Jerárquicos • En la práctica, no se pueden examinar todas las posibilidades de agrupar los elementos, incluso con los ordenadores más rápidos. Una solución se encuentra en los llamados métodos jerárquicos. Se tienen dos posibles formas de actuar: Métodos jerárquicos aglomerativos • Se comienza con los objetos o individuos de modo individual; de este modo, se tienen tantos clusters iniciales como objetos. Luego se van agrupando de modo que los primeros en hacerlo son los más similares y al final, todos los subgrupos se unen en un único cluster. ANÁLISIS CLUSTER
  • 15. III. METODOLOGÍA Métodos jerárquicos divididos • Se actúa, de manera contraria. Se parte de un único grupo con todas las observaciones y se van dividiendo según lo lejanos que se encuentren. Las metodologías de trabajo más conocidos dentro de los métodos jerárquicos son: Enlace Simple Enlace completo Método de agrupación de vinculación promedio Método de Ward o Varianza mínima Métodos de Cluster no Jerárquicos • En este caso comienzan con una solución prestablecida. Este es el punto de partida para el análisis clúster. De esta forma, los grupos están establecidos de antemano y luego se van cambiando de modo iterativo, en función de sus características. A su vez, podemos dividirlos en otros subgrupos. Métodos de reasignación • Los más relevantes son los métodos de centroides, como el k-means. Los de medioides, como el PAM. O el de las nubes dinámicas. ANÁLISIS CLUSTER
  • 16. III. METODOLOGÍA Métodos directos • El más importante es el block clustering, muy utilizado en minería de datos. Métodos reductivos • Estos están basados en los análisis factoriales tipo Q. Métodos de búsqueda de densidad • Por un lado, estarían los de aproximaciones tipológicas, como el análisis modal. Por otro, tenemos los probabilísticos, como el de Wolf. ANÁLISIS CLUSTER
  • 18. III. METODOLOGÍA • Este método une los casos buscando minimizar la varianza dentro de cada grupo. Para ello se calcula, en un primer momento, la media de todas las variables en cada conglomerado. Seguido, se calcula la distancia entre cada caso y la media del conglomerado, sumando después las distancias entre todos los casos obtenidos. Posteriormente se agrupan los conglomerados que generen menos aumentos en la suma de las distancias dentro de cada conglomerado. Este procedimiento crea grupos homogéneos y con tamaños similares que se pueden apreciar de mejor manera en un dendograma. MÉTODO DE WARD
  • 19. III. METODOLOGÍA • Es un procediendo iterativo mediante el cual cada observación se asigna al cluster más cercano. Inicialmente se establecen de forma aleatoria las ubicaciones centrales de los grupos o centroides. Se calculan las distancias de los distintos individuos a estos centroides y se agrupa cada uno en el cluster más cercano. Una vez las observaciones han sido clasificadas en el grupo cuyo centroide es más cercano, se recalculan los centroides y se repite el proceso de reagrupación. Hasta que los centroides se estabilizan. MÉTODO DE K-MEANS
  • 26. Acjanaco 1 Ccatcca 2 Cirialo 3 Colquepata 4 Granja Kcayra 5 Machu Picchu 6 Maranura 7 Ocobamba 8 Pisac 9 Pomacanchi 10 Quebrada Yanatilde 11 Sepa 12 Sepahua 13 Urubamba 14 Zurite 15
  • 27. V. DISCUCIÓN DE RESULTADOS ▪ Con respecto al método de Ward, interpretando los resultados podemos realizar una agrupación el cual estaría dividido en dos grupos como se aprecia en la tabla siguiente. ▪ Referente al método de K-means, interpretando los resultados obtenidos podemos realizar 3 tipos de agrupaciones, referentes al número de cluster k=2, k=3 y k=4 como se aprecia en la tabla siguiente. ▪ Tanto el método de Ward como el método de K-means me arrojan resultados de clasificaciones distintas; sin embargo, hay un punto de similitud con el método de K-means cuando el número de cluster es k = 3, en este caso el Grupo 3 del método de K-means coincide con el Grupo 1 del método de Ward.
  • 29. Urubamba Urubamba Urubamba Granja Kcayra Granja Kcayra Granja Kcayra Pisac Pisac Pisac Pomacanchi Pomacanchi Pomacanchi Ccatcca Ccatcca Ccatcca Colquepata Colquepata Colquepata Ocobamba Ocobamba Ocobamba Zurite Zurite Zurite Quebrada Yanatilde Quebrada Yanatilde Quebrada Yanatilde Cirialo Cirialo Cirialo Maranura Maranura Maranura Machu Picchu Machu Picchu Grupo 3 Machu Picchu Acjanaco Acjanaco Acjanaco Sepa Sepa Sepa Sepahua Sepahua Sepahua Grupo 3 Agrupación k=4 Grupo 1 Grupo 2 Grupo 4 Método de K-means Agrupación k=3 Grupo 1 Grupo 2 Grupo 1 Grupo 2 Agrupación k=2
  • 30. VI. CONCLUSIONES ▪ El análisis de clustering es una técnica estadística multivariante cuya finalidad es dividir un conjunto de objetos en grupos que compartan cierto patrón. ▪ La metodología desarrollada permitió completar la correcta agrupación en base a la información brindada por la data PISCO de 15 estaciones pluviométricas brindada por el Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI). ▪ El método de Ward a comparación de los otros métodos mencionados tiene significativamente menos cálculos que otros métodos, el inconveniente de esto es que generalmente da como resultado clústeres menos que óptimos. ▪ Si bien es cierto el método de Ward es similar a método de K-means, la ventaja que tenemos con el segundo es que podemos seleccionar el número de cluster que nosotros queramos y nos arroja su dendograma correspondiente.