Contrastes
paramétricos
Hipótesis y Contrastes de hipótesis



   Hipótesis: Conjetura sobre la población, frecuentemente sobre el
    valor de alguno de sus parámetros:
      Media
      Varianza
      Proporción/Tasa


   Contraste de hipótesis: Regla que permite tomar una decisión
    sobre la validez de la hipótesis planteada

   Los contrastes comparan el valor empírico del estadístico bajo la
    hipótesis propuesta con el valor supuesto para el parámetro. Esto
    permite tomar una decisión asumiendo cierto riesgo
Hipótesis nula e Hipótesis alternativa
   Hipótesis nula Ho                           Hipótesis Alternativa H1
      La que contrastamos                         Niega a H0
      Implica que la diferencia entre el          Implica que la diferencia entre el
       valor empírico del estadístico y el          valor empírico del estadístico y el
       valor supuesto para el parámetro             valor supuesto para el parámetro
       es estadísticamente nula, es decir,          es estadísticamente significativa,
       debida a la aleatoriedad del                 es decir, no debida a la
       muestreo                                     aleatoriedad del muestreo
      Los datos pueden refutarla                  Los datos pueden mostrar
      No debería ser rechazada sin una             evidencia a favor
       gran evidencia en contra                    No debería ser aceptada sin una
                                                    gran evidencia a favor.


      H 0 :    p = 50% = ≤ ≥
                         , ,
      
       H1 :    p ≠ 50%    ≠<>
                            , ,
Tipos de error en un contraste de hipótesis

                                Naturaleza de la hipótesis nula
        Decisión sobre H0      H0 cierta             H0 Falsa

                               Correcto           Error de tipo II
            Aceptar H0                            Probabilidad β



           Rechazar H0      Error de tipo I
                            Probabilidad α           Correcto
            Acepto H1




  - Para un tamaño de muestra dado, α y β no se pueden reducir
  simultáneamente. Varían de forma inversa.
  - Habitualmente se considera que el error tipo I es más grave, por lo cual
  se suele fijar su probabilidad α y se trata de que β sea lo menor posible.
Ejemplo: Juicio
     H0: El acusado es inocente



                                             Realidad
                                  Inocente          Culpable


                               Correcto             Error II
                    Inocente                      Menos grave
        Veredicto

                                Error I             Correcto
                    Culpable   Muy grave




 Es más grave condenar a un inocente (Error I) que absolver a un culpable
 (Error II). Hay que fijar una probabilidad α que no se desee sobrepasar.
Diferencia entre el valor del parámetro y el del estadístico bajo H0

Suponiendo que H0 es cierta (la media de la población es 40) es poco probable
obtener una media muestral de 20



                                                    Se rechaza que H0
                                                    sea cierta.




                                  µ = 40
   X = 20



   Este valor de la media muestral conduciría a no aceptar que la hipótesis
   nula es cierta (el valor empírico del estadístico bajo H0 sería
   improbable).
   Sin embargo puede ocurrir y al rechazar H0 asumimos un riesgo
Diferencia entre el valor del parámetro y el del estadístico bajo H0

  Suponiendo que H0 es cierta (la media de la población es 40) parece
  coherente obtener una media muestral de 38


                                                       No se puede
                                                       rechazar H0




                           µ = 40
                           X = 38




    Este valor de la media muestral conduciría a aceptar que la hipótesis
    nula es cierta. El valor empírico del estadístico bajo H0 no
    proporciona evidencias contra H .
Región crítica y nivel de significación
Región crítica                      Nivel de significación: α
 Valores extremos del estadístico,  Valor pequeño: 1% , 5%
  muy ‘improbables’ si H0 es cierta  Establecido a priori por el investigador

 Valores empíricos del estadístico  Es un límite para la probabilidad de
  que refutarían H0                    rechazar H0 cuando es cierta
                                     Es el tamaño de la región crítica
 Es conocida antes de realizar el
  experimento. Su tamaño es α


                                                         α=5%



          Reg. Crit.                                  Reg. Crit.



                             No rechazo H0
                               Η0: µ=40
Contrastes: unilateral y bilateral
      La posición de la región crítica depende de la hipótesis alternativa



                     Bilateral                      H1: µ≠40




Unilateral                                                               Unilateral
Cola izquierda                                                           Cola derecha




H1: µ<40                                                                     H1: µ>40
P-valor

 •Es la probabilidad de obtener una muestra como la observada o más
 extrema, cuando la hipótesis nula es cierta
 •Es la probabilidad de que por puro azar obtengamos una muestra “más
 extraña” que la obtenida cuando H0 es cierta
 •Es la probabilidad que tendría una región crítica que comenzase
 exactamente en el valor del estadístico obtenido de la muestra.
 •Es la probabilidad de tener una muestra que discrepe aún más que la
 muestra obtenida de H0.

 •p-valor es conocido después de la extracción de la muestra

 Su valor se compara con α

          Si p-valor < α   Se rechaza H0
          Si p-valor > α   No se rechaza H0
Contraste no significativo

El contraste es estadísticamente no significativo cuando p>α
Esto significa que el estadístico experimental discrepa menos de “lo
tolerado” a priori.
Por ello, se mantiene la hipótesis nula




 No se rechaza
 H0: µ= 40
                         P           α
                 X =43
Contraste significativo
El contraste es estadísticamente significativo cuando p<α
Esto significa que el estadístico experimental discrepa más de “lo
tolerado” a priori.
Por ello, no se puede mantener la hipótesis nula




                                       α           P

 Se rechaza H0: µ=40

 Se acepta H1: µ>40
                                       α          P




                                            X = 50
Algunos contrastes paramétricos
Contraste sobre una media

   Objetivo
    Probar si la muestra procede de una población cuya media es la
    especificada por la hipótesis nula

   Condiciones de aplicación
         Poblacion normal

   Hipótesis
         Ho: μ = μ0
         H1: μ ≠ μ0
   Estadístico

                  x − µ0
                         ≈ Tn−1
                    Sc
                     n
Contraste de comparación de 2 medias
Muestras independientes




   Objetivo
    Probar si las muestras proceden de poblaciones con medias iguales, d0=0,
    cuando se ha contrastado que sus varianzas son similares
   Condiciones de aplicación
          Poblaciones normales. Varianzas iguales
   Hipótesis
         Ho: μ1- μ2 = d0
         H1: μ1 - μ2 ≠ d0
   Estadísticox − x ) − d
              (1 2 0                ≈ t n1 + n2 − 2
           nS +n S
               2     2
                            1 1
            1 1    2 2
                              +
           n1 + n2 − 2      n1 n2
Contraste de comparación de 2 medias
Muestras independientes




   Objetivo
    Probar si las muestras proceden de poblaciones con medias iguales, d0=0,
    cuando se ha contrastado que sus varianzas son distintas
   Condiciones de aplicación
           Poblaciones normales. Varianzas distintas
   Hipótesis
           Ho: μ1= μ2
           H1: μ1 ≠ μ2
   Estadístico                                       2
                                         S c21 S c22 
       ( x1 − x2 ) − d 0   ≈ tm    m=
                                        
                                        n + n 
                                         1        2 
                                                      
                                               2
            S2
                S   2                  S c21   S c22 
              +
             c1     c2                  
                                      n  n          
            n1 n2                      1  + 2 
                                       n1 − 1 n2 − 1
Contraste de comparación de 2 o más varianzas
Prueba de Levene




   Objetivo
    Probar si las muestras proceden de poblaciones con varianzas iguales.
   Condiciones de aplicación
            Poblaciones normales
   Hipótesis
            Ho: Varianzas iguales
            H1: No todas las varianzas son iguales
   Estadístico
        k

        ∑ ni ( Di − DT )
                                2
                                                         Dij = xij − xi
        i =1
                                                                                      k    ni
                    k −1                                        ni
               nj
                                        ≈ Fk −1, N − k          ∑D                    ∑∑D
        ∑ ∑ (D             − Di )
        k                                                                 ij                      ij
                                    2                                                 i =1 j =1
                                                                j =1
                      ij                                 Di =                  DT =
        i =1 j =1                                                    ni                    N
                    N−k
Contraste de comparación de 2 medias
Muestras relacionadas

   Objetivo
    Probar si las muestras proceden de poblaciones con medias iguales (d0=0)
   Condiciones de aplicación
          Población normal
   Hipótesis
          Ho: μD= d0
          H1: μD ≠ d0

   Estadístico

    D=X1-X2
                         d − d0
                                 ≈ t n−1
                        Sc( D)
                               n

Contrastes de hipotesis

  • 1.
  • 2.
    Hipótesis y Contrastesde hipótesis  Hipótesis: Conjetura sobre la población, frecuentemente sobre el valor de alguno de sus parámetros:  Media  Varianza  Proporción/Tasa  Contraste de hipótesis: Regla que permite tomar una decisión sobre la validez de la hipótesis planteada  Los contrastes comparan el valor empírico del estadístico bajo la hipótesis propuesta con el valor supuesto para el parámetro. Esto permite tomar una decisión asumiendo cierto riesgo
  • 3.
    Hipótesis nula eHipótesis alternativa  Hipótesis nula Ho  Hipótesis Alternativa H1  La que contrastamos  Niega a H0  Implica que la diferencia entre el  Implica que la diferencia entre el valor empírico del estadístico y el valor empírico del estadístico y el valor supuesto para el parámetro valor supuesto para el parámetro es estadísticamente nula, es decir, es estadísticamente significativa, debida a la aleatoriedad del es decir, no debida a la muestreo aleatoriedad del muestreo  Los datos pueden refutarla  Los datos pueden mostrar  No debería ser rechazada sin una evidencia a favor gran evidencia en contra  No debería ser aceptada sin una gran evidencia a favor. H 0 : p = 50% = ≤ ≥ , ,   H1 : p ≠ 50% ≠<> , ,
  • 4.
    Tipos de erroren un contraste de hipótesis Naturaleza de la hipótesis nula Decisión sobre H0 H0 cierta H0 Falsa Correcto Error de tipo II Aceptar H0 Probabilidad β Rechazar H0 Error de tipo I Probabilidad α Correcto Acepto H1 - Para un tamaño de muestra dado, α y β no se pueden reducir simultáneamente. Varían de forma inversa. - Habitualmente se considera que el error tipo I es más grave, por lo cual se suele fijar su probabilidad α y se trata de que β sea lo menor posible.
  • 5.
    Ejemplo: Juicio H0: El acusado es inocente Realidad Inocente Culpable Correcto Error II Inocente Menos grave Veredicto Error I Correcto Culpable Muy grave Es más grave condenar a un inocente (Error I) que absolver a un culpable (Error II). Hay que fijar una probabilidad α que no se desee sobrepasar.
  • 6.
    Diferencia entre elvalor del parámetro y el del estadístico bajo H0 Suponiendo que H0 es cierta (la media de la población es 40) es poco probable obtener una media muestral de 20 Se rechaza que H0 sea cierta. µ = 40 X = 20 Este valor de la media muestral conduciría a no aceptar que la hipótesis nula es cierta (el valor empírico del estadístico bajo H0 sería improbable). Sin embargo puede ocurrir y al rechazar H0 asumimos un riesgo
  • 7.
    Diferencia entre elvalor del parámetro y el del estadístico bajo H0 Suponiendo que H0 es cierta (la media de la población es 40) parece coherente obtener una media muestral de 38 No se puede rechazar H0 µ = 40 X = 38 Este valor de la media muestral conduciría a aceptar que la hipótesis nula es cierta. El valor empírico del estadístico bajo H0 no proporciona evidencias contra H .
  • 8.
    Región crítica ynivel de significación Región crítica Nivel de significación: α  Valores extremos del estadístico,  Valor pequeño: 1% , 5% muy ‘improbables’ si H0 es cierta  Establecido a priori por el investigador  Valores empíricos del estadístico  Es un límite para la probabilidad de que refutarían H0 rechazar H0 cuando es cierta  Es el tamaño de la región crítica  Es conocida antes de realizar el experimento. Su tamaño es α α=5% Reg. Crit. Reg. Crit. No rechazo H0 Η0: µ=40
  • 9.
    Contrastes: unilateral ybilateral La posición de la región crítica depende de la hipótesis alternativa Bilateral H1: µ≠40 Unilateral Unilateral Cola izquierda Cola derecha H1: µ<40 H1: µ>40
  • 10.
    P-valor •Es laprobabilidad de obtener una muestra como la observada o más extrema, cuando la hipótesis nula es cierta •Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida cuando H0 es cierta •Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. •Es la probabilidad de tener una muestra que discrepe aún más que la muestra obtenida de H0. •p-valor es conocido después de la extracción de la muestra Su valor se compara con α Si p-valor < α Se rechaza H0 Si p-valor > α No se rechaza H0
  • 11.
    Contraste no significativo Elcontraste es estadísticamente no significativo cuando p>α Esto significa que el estadístico experimental discrepa menos de “lo tolerado” a priori. Por ello, se mantiene la hipótesis nula No se rechaza H0: µ= 40 P α X =43
  • 12.
    Contraste significativo El contrastees estadísticamente significativo cuando p<α Esto significa que el estadístico experimental discrepa más de “lo tolerado” a priori. Por ello, no se puede mantener la hipótesis nula α P Se rechaza H0: µ=40 Se acepta H1: µ>40 α P X = 50
  • 13.
    Algunos contrastes paramétricos Contrastesobre una media  Objetivo Probar si la muestra procede de una población cuya media es la especificada por la hipótesis nula  Condiciones de aplicación Poblacion normal  Hipótesis Ho: μ = μ0 H1: μ ≠ μ0  Estadístico x − µ0 ≈ Tn−1 Sc n
  • 14.
    Contraste de comparaciónde 2 medias Muestras independientes  Objetivo Probar si las muestras proceden de poblaciones con medias iguales, d0=0, cuando se ha contrastado que sus varianzas son similares  Condiciones de aplicación Poblaciones normales. Varianzas iguales  Hipótesis Ho: μ1- μ2 = d0 H1: μ1 - μ2 ≠ d0  Estadísticox − x ) − d (1 2 0 ≈ t n1 + n2 − 2 nS +n S 2 2 1 1 1 1 2 2 + n1 + n2 − 2 n1 n2
  • 15.
    Contraste de comparaciónde 2 medias Muestras independientes  Objetivo Probar si las muestras proceden de poblaciones con medias iguales, d0=0, cuando se ha contrastado que sus varianzas son distintas  Condiciones de aplicación Poblaciones normales. Varianzas distintas  Hipótesis Ho: μ1= μ2 H1: μ1 ≠ μ2  Estadístico 2  S c21 S c22  ( x1 − x2 ) − d 0 ≈ tm m=  n + n   1 2   2 S2 S 2  S c21   S c22  + c1 c2    n  n   n1 n2  1  + 2  n1 − 1 n2 − 1
  • 16.
    Contraste de comparaciónde 2 o más varianzas Prueba de Levene  Objetivo Probar si las muestras proceden de poblaciones con varianzas iguales.  Condiciones de aplicación Poblaciones normales  Hipótesis Ho: Varianzas iguales H1: No todas las varianzas son iguales  Estadístico k ∑ ni ( Di − DT ) 2 Dij = xij − xi i =1 k ni k −1 ni nj ≈ Fk −1, N − k ∑D ∑∑D ∑ ∑ (D − Di ) k ij ij 2 i =1 j =1 j =1 ij Di = DT = i =1 j =1 ni N N−k
  • 17.
    Contraste de comparaciónde 2 medias Muestras relacionadas  Objetivo Probar si las muestras proceden de poblaciones con medias iguales (d0=0)  Condiciones de aplicación Población normal  Hipótesis Ho: μD= d0 H1: μD ≠ d0  Estadístico D=X1-X2 d − d0 ≈ t n−1 Sc( D) n