INSTITUTO NACIONAL DE
ESTADÍSTICAS Y CENSOS
CAMPUS VIRTUAL
        Instructores:            SPSS
Wendy Plata Alarcón, Ing.
                             aplicado a la
 Wendy_Plata@inec.gob.ec      Estadística
                              Descriptiva
  Kleber Villa Tello, Ing.
  Kleber_Villa@inec.gob.ec
Módulo 4
Frase del Módulo
“Somos lo que hacemos día a día. De modo
  que la excelencia no es un acto, sino un
  hábito”

 Aristóteles
Agenda
 1   Estadísticos de Posición

 2   Medidas de Tendencia Central

 3   Medidas de Dispersión

 4   Estadísticos de Forma
Clasificación de Estadísticos
 Posición
    Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
        Cuantiles, percentiles, cuartiles, deciles,...
 Centralización
    Indican valores con respecto a los que los datos parecen agruparse.
        Media, mediana y moda
 Dispersión
    Indican la mayor o menor concentración de los datos con respecto a las medidas de
     centralización.
        Desviación típica, coeficiente de variación, rango, varianza
 Forma
    Asimetría o Sesgo
    Apuntamiento o Curtosis

                                                                                            5
6
Simbología
• n: tamaño de la muestra
• Xi: i-ésima observación
• X(i) : i-ésima observación tal que
          X(1)  X(2)  X(3)  …  X(n)

• Por ejemplo si se tienen las siguientes observaciones
                   3 4 5 8 7 4 1

• X1=3 X2=4 X3=5 X4=8 X5=7 X6=4 X7=1

• X(1)=1 X(2)=3 X(3)=4 X(4)=4 X(5)=5 X(6)=7 X(7)=8

                                                          7
Estadísticos de Posición
• Se define el cuantil de orden a como un valor de la variable por debajo del
  cual se encuentra una frecuencia acumulada a.
• Casos particulares son los percentiles, cuartiles, deciles
(… viene)   Estadísticos de Posición
 Percentil de orden i = cuantil de orden i/100
    El i% de los elementos de la muestra toman valores menores o iguales a Pi, denominado
     percentil i; i=1,2, … , 99
 Cuartiles: Divide los elementos de la muestra en 4 grupos
  con frecuencias similares.
    Q1=Primer cuartil = Percentil 25 = Cuantil 0,25
    Q2=Segundo cuartil = Percentil 50 = Cuantil 0,5 = Mediana
    Q3=Tercer cuartil = Percentil 75 = cuantil 0,75
 Deciles: Divide los elementos de la muestra en 10 grupos
  con frecuencias similares.
    Di: i-ésimo decil
Medidas de Tendencia Central
• Media (‘mean’) Es la media aritmética (promedio) de los datos
  contenidos en la muestra. Se la obtiene sumando todas las
  observaciones y dividiendo para el tamaño de la muestra.
                                        n

                                   X           i
                           x          i 1

                                            n
• Mediana (‘median’) Es un valor que divide a las observaciones
  ordenadas en forma ascendente en dos grupos con el mismo número
  de individuos (percentil 50, segundo cuartil).
                                                   X    X n        n  
                     ~ X                        ~
                                                                    1 

                                                    x 
                                                           2        2  
       Si n es impar x       n 1 
                                  
                                     Si n es par
                                                               2
                             2 


• Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia
  alcanza un máximo, es decir, el valor observado que más se repite.
Medidas de Dispersión
• Amplitud o Rango (‘range’):
  Diferencia entre el valor máximo X(n) y el
  mínimo X(1).
  Rango= X(n) - X(1)


• Rango intercuartil (‘interquartile range’):
   – Es la distancia entre primer y tercer cuartil.
      • RI=Rango intercuartil = Q3 – Q1
Medidas de Dispersión
• Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al
  cuadrado) de las observaciones con respecto a la media.



                                        1
                                S2         ( xi  x )2
                                       n 1 i

• Desviación estándar (‘standard deviation’) Es la raíz cuadrada de la
  varianza.


                                S               S2
Estadísticos de Forma
• Asimetría o Sesgo
  – Si la Asimetría es positiva, decimos
    que la distribución de los datos
    está sesgada hacia la izquierda.

  – Si la Asimetría es negativa,
    decimos que la distribución de los
    datos está sesgada hacia la
    derecha.

  – Si la Asimetría es cero, decimos
    que la distribución de los datos es
    simétrica.
Estadísticos de Forma
• Apuntamiento o Curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
   distribución con respecto a la distribución normal o gaussiana. Es
   adimensional.
Platicúrtica (aplanada): curtosis < 0
Mesocúrtica (como la normal): curtosis = 0
Leptocúrtica (apuntada): curtosis > 0
Estadísticos de Forma
                                                 Apuntada como la normal




                               0.3
                               0.2
                               0.1
                                                             x   s
                                                             68 %




                               0.0
                                     -3     -2          -1       0         1        2   3

                    Aplanada                                                                 Apuntada
2.0




                                                                     0.8
1.5




                                                                     0.6
1.0




                                                                     0.4
0.5




                                                                     0.2
                        x s
                                                                                             x   s
                    57 %
0.0




                                                                                             82 %

      0.0   0.2   0.4         0.6     0.8         1.0                0.0
                                                                               -2       -1       0      1   2
Referencias Bibliográficas
• Zurita, G. (2008) Probabilidad y Estadística: Fundamentos y
  Aplicaciones; Edición Escuela Superior Politécnica del Litoral,
  Instituto de Ciencias Matemáticas, Guayaquil-Ecuador

• Barón, F., Téllez, F. (2004) Apuntes de Bioestadística;
  Universidad de Málaga
Módulo 4 estadísticas_descriptivas

Módulo 4 estadísticas_descriptivas

  • 1.
    INSTITUTO NACIONAL DE ESTADÍSTICASY CENSOS CAMPUS VIRTUAL Instructores: SPSS Wendy Plata Alarcón, Ing. aplicado a la Wendy_Plata@inec.gob.ec Estadística Descriptiva Kleber Villa Tello, Ing. Kleber_Villa@inec.gob.ec
  • 2.
  • 3.
    Frase del Módulo “Somoslo que hacemos día a día. De modo que la excelencia no es un acto, sino un hábito” Aristóteles
  • 4.
    Agenda 1 Estadísticos de Posición 2 Medidas de Tendencia Central 3 Medidas de Dispersión 4 Estadísticos de Forma
  • 5.
    Clasificación de Estadísticos Posición  Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.  Cuantiles, percentiles, cuartiles, deciles,...  Centralización  Indican valores con respecto a los que los datos parecen agruparse.  Media, mediana y moda  Dispersión  Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.  Desviación típica, coeficiente de variación, rango, varianza  Forma  Asimetría o Sesgo  Apuntamiento o Curtosis 5
  • 6.
  • 7.
    Simbología • n: tamañode la muestra • Xi: i-ésima observación • X(i) : i-ésima observación tal que X(1)  X(2)  X(3)  …  X(n) • Por ejemplo si se tienen las siguientes observaciones 3 4 5 8 7 4 1 • X1=3 X2=4 X3=5 X4=8 X5=7 X6=4 X7=1 • X(1)=1 X(2)=3 X(3)=4 X(4)=4 X(5)=5 X(6)=7 X(7)=8 7
  • 8.
    Estadísticos de Posición •Se define el cuantil de orden a como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada a. • Casos particulares son los percentiles, cuartiles, deciles
  • 9.
    (… viene) Estadísticos de Posición  Percentil de orden i = cuantil de orden i/100  El i% de los elementos de la muestra toman valores menores o iguales a Pi, denominado percentil i; i=1,2, … , 99  Cuartiles: Divide los elementos de la muestra en 4 grupos con frecuencias similares.  Q1=Primer cuartil = Percentil 25 = Cuantil 0,25  Q2=Segundo cuartil = Percentil 50 = Cuantil 0,5 = Mediana  Q3=Tercer cuartil = Percentil 75 = cuantil 0,75  Deciles: Divide los elementos de la muestra en 10 grupos con frecuencias similares.  Di: i-ésimo decil
  • 10.
    Medidas de TendenciaCentral • Media (‘mean’) Es la media aritmética (promedio) de los datos contenidos en la muestra. Se la obtiene sumando todas las observaciones y dividiendo para el tamaño de la muestra. n X i x i 1 n • Mediana (‘median’) Es un valor que divide a las observaciones ordenadas en forma ascendente en dos grupos con el mismo número de individuos (percentil 50, segundo cuartil). X X n  n  ~ X ~    1  x   2  2  Si n es impar x  n 1    Si n es par   2  2  • Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia alcanza un máximo, es decir, el valor observado que más se repite.
  • 11.
    Medidas de Dispersión •Amplitud o Rango (‘range’): Diferencia entre el valor máximo X(n) y el mínimo X(1). Rango= X(n) - X(1) • Rango intercuartil (‘interquartile range’): – Es la distancia entre primer y tercer cuartil. • RI=Rango intercuartil = Q3 – Q1
  • 12.
    Medidas de Dispersión •Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media. 1 S2   ( xi  x )2 n 1 i • Desviación estándar (‘standard deviation’) Es la raíz cuadrada de la varianza. S S2
  • 13.
    Estadísticos de Forma •Asimetría o Sesgo – Si la Asimetría es positiva, decimos que la distribución de los datos está sesgada hacia la izquierda. – Si la Asimetría es negativa, decimos que la distribución de los datos está sesgada hacia la derecha. – Si la Asimetría es cero, decimos que la distribución de los datos es simétrica.
  • 14.
    Estadísticos de Forma •Apuntamiento o Curtosis La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana. Es adimensional. Platicúrtica (aplanada): curtosis < 0 Mesocúrtica (como la normal): curtosis = 0 Leptocúrtica (apuntada): curtosis > 0
  • 15.
    Estadísticos de Forma Apuntada como la normal 0.3 0.2 0.1 x s 68 % 0.0 -3 -2 -1 0 1 2 3 Aplanada Apuntada 2.0 0.8 1.5 0.6 1.0 0.4 0.5 0.2 x s x s 57 % 0.0 82 % 0.0 0.2 0.4 0.6 0.8 1.0 0.0 -2 -1 0 1 2
  • 16.
    Referencias Bibliográficas • Zurita,G. (2008) Probabilidad y Estadística: Fundamentos y Aplicaciones; Edición Escuela Superior Politécnica del Litoral, Instituto de Ciencias Matemáticas, Guayaquil-Ecuador • Barón, F., Téllez, F. (2004) Apuntes de Bioestadística; Universidad de Málaga