Una hipótesis Estadística es un proposición
sobre los parámetros de una población o
sobre la distribución de probabilidad de
una variable aleatoria.
 ERROR   TIPO 1
 A la probabilidad de cometer un
  error de Tipo I se denota por a, y se
  le llama el nivel o tamaño de
  significancia de la prueba es decir
 a = P(error Tipo I)= P(rechazar
      H0 | H0 es verdadera)
Ejemplo: Calcular a para el ejemplo de la rapidez de
combustión para una muestra de N=10 datos, suponiendo
que la desviación estándar de la rapidez de combustión es
s=2.5 cm/seg.
Solución: en este caso a = P( x caiga en la región crítica |
m=50), es decir:
                  a = P( x < 48.5) + P( x > 51.5)
Recordando que La distribución de x es Normal con media
m=50 y desviación estándar s/ N =0.79, por lo tanto,
usando Matlab:
a = normcd(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))
          = 0.288+ 0.288 = 0.0576

 Esto significa que el 5.76% de las muestras de tamaño
  10 conducirán al rechazo de la Hipótesis H0: m=50
  cm/seg, cuando ésta es verdadera
Para evaluar un experimento de prueba de hipótesis también se
requiere calcular la probabilidad del error de Tipo II, denotada por
b, es decir
            b = P(error Tipo II) = P(aceptar H0 | H0 es falsa)
 Sin embargo, no es posible calcular b si no se tiene una hipótesis
 alternativa específica, es decir, un valor particular del parámetro
 bajo prueba en lugar de un rango de valores

 Por ejemplo, supongamos que es importante rechazar H0 si la
 rapidez promedio de combustión m es mayor que 52 cm/seg o
 menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la
 probabilidad de aceptar H0: m=50 cuando el valor verdadero es
 m=52.
En el ejemplo supongamos que si la rapidez media de
combustión es menor que 50 cm/seg se desea demostrar
esto con una conclusión fuerte. ¿cómo deben plantearse
las hipótesis?
                    H0: m=50 cm/seg
                    H1: m<50 cm/seg

Nótese que aunque H0 está planteada como una igualdad,
se sobre-entiende que incluye cualquier valor de m no
especificado por H1, es decir, la incapacidad de rechazar
H0 no significa que m=50, sino que no se tiene evidencia
fuerte que apoye a H1, es decir, pudiera ser que m=50 o
                                                            UMSNH - FIE
Si se desea probar la Hipótesis:
                         H0: m = m0
                         H 1 : m m0
Se puede usar el estadístico de prueba Z siguiente
                                  __

                             Z   X μ0
                                  σ/ N


El cual tiene una distribución Normal con media cero y
varianza 1 (si se cumplen las suposiciones del teorema del
límite central)
Entonces, para una a dada podemos establecer las
siguientes regiones de aceptación y crítica:


                     /2                                 /2


               región crítica Región de aceptación               región crítica

                          -z   /2              z   /2        Z


    Conclusiones:
           Rechazar H0 si:                   z < -za/2 o z > za/2
           No rechazar H0 si:       - za/2   z za/2
Una manera de notificar los resultados de una prueba de
hipótesis es establecer si la hipótesis nula fue o no
rechazada con un nivel especificado a de significancia
Una alternativa es especificar el nivel de significancia a
más pequeño que conduce al rechazo de la hipótesis nula.
A este se le llama el Valor P

Este valor P sólo depende de la muestra tomada, es decir, para una
muestra y un estadístico calculado se puede obtener su valor P y
comparar con un a especificado. Entonces, si P<a, H0 se rechaza.
El valor P es el más pequeño nivel de significancia para el que H0
debe rechazarse, esto es el área de la cola (de la curva de densidad
de probabilidad) que está más allá del valor del estadístico (en este
caso t). o el doble de esta área en pruebas bilaterales.




En todas las pruebas de hipótesis estadísticas se puede
calcular el tamaño de la muestra (N) adecuada en función
de la magnitud del error de tipo I que se permite. En cada
tipo de prueba se encuentran fórmulas diferentes para N.
 Se parte de una muestra aleatoria de tamaño N, proveniente de
una población cuya distribución de probabilidad es desconocida.
 Las N observaciones se acomodan en un Histograma de frecuencia
con k intervalos de clase. Sea Oi la i-ésima frecuencia de clase
 De la distribución de probabilidad propuesta se calcula la frecuencia esperada Ei
en el i-ésimo intervalo de clase
                                                  k
                                                       (Oi    Ei )2
 El   estadístico de prueba es           χ2
                                                 i 1         Ei

El cual tiene una distribución Ji2 con k-p-1 grados de libertad si la
población sigue la distribución propuesta. (donde p es el número de
parámetros de la población)
Las pruebas de hipótesis anteriores se llaman paramétricas
porque suponen conocida la distribución de la población y
la hipótesis es acerca de los parámetros de dicha
distribución.
Otra clase de hipótesis es: No se sabe cual es la distribución de la
población y se desea probar la hipótesis de que cierta distribución
en particular será un modelo satisfactorio. Por ejemplo, tal vez se
requiera probar si la distribución es Normal
Estimación puntual y por intervalo

Las medias o desviaciones estándar calculadas de una
muestra se denominan ESTADÍSTICOS, podrían ser
consideradas como un punto estimado de la media y
desviación estándar real de población o de los PARAMETROS.

¿Qué pasa si no deseamos una estimación puntual como
media basada en una muestra, qué otra cosa podríamos
obtener como margen, algún tipo de error?
                    “Un Intervalo de Confianza”
ESTIMADOR PUNTUAL: Utiliza un número único o valor para
localizar una estimación del parámetro.

ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango
dentro del cual se puede encontrar el parámetro y el nivel de
confianza que el intervalo contiene al parámetro.

LIMITES DE CONFIANZA: Son los límites del intervalo de
confianza inferior (LIC) y superior (LSC), se determinan
sumando y restando a la media de la muestra un cierto
número Z (dependiendo del nivel o coeficiente de confianza)
de errores estándar de la media .
INTERPRETACIÓN DEL INTERVALO DE CONFIANZA: Tener un 95%
de confianza en que la media poblacional real y desconocida
se encuentra
entre los valores LIC y LSC.

NIVEL DE SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA =
ERROR TIPO 1 = ALFA

¿Cómo obtenemos un intervalo de confianza?

      Estimación puntual + error de estimación
Prueba de hipotesis

Prueba de hipotesis

  • 2.
    Una hipótesis Estadísticaes un proposición sobre los parámetros de una población o sobre la distribución de probabilidad de una variable aleatoria.  ERROR TIPO 1  A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el nivel o tamaño de significancia de la prueba es decir a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera)
  • 3.
    Ejemplo: Calcular apara el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es s=2.5 cm/seg. Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir: a = P( x < 48.5) + P( x > 51.5) Recordando que La distribución de x es Normal con media m=50 y desviación estándar s/ N =0.79, por lo tanto, usando Matlab: a = normcd(48.5,50,0.79) + (1-normcdf(51.5,50,0.79)) = 0.288+ 0.288 = 0.0576  Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: m=50 cm/seg, cuando ésta es verdadera
  • 4.
    Para evaluar unexperimento de prueba de hipótesis también se requiere calcular la probabilidad del error de Tipo II, denotada por b, es decir b = P(error Tipo II) = P(aceptar H0 | H0 es falsa) Sin embargo, no es posible calcular b si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: m=50 cuando el valor verdadero es m=52.
  • 5.
    En el ejemplosupongamos que si la rapidez media de combustión es menor que 50 cm/seg se desea demostrar esto con una conclusión fuerte. ¿cómo deben plantearse las hipótesis? H0: m=50 cm/seg H1: m<50 cm/seg Nótese que aunque H0 está planteada como una igualdad, se sobre-entiende que incluye cualquier valor de m no especificado por H1, es decir, la incapacidad de rechazar H0 no significa que m=50, sino que no se tiene evidencia fuerte que apoye a H1, es decir, pudiera ser que m=50 o UMSNH - FIE
  • 6.
    Si se deseaprobar la Hipótesis: H0: m = m0 H 1 : m m0 Se puede usar el estadístico de prueba Z siguiente __ Z X μ0 σ/ N El cual tiene una distribución Normal con media cero y varianza 1 (si se cumplen las suposiciones del teorema del límite central)
  • 7.
    Entonces, para unaa dada podemos establecer las siguientes regiones de aceptación y crítica: /2 /2 región crítica Región de aceptación región crítica -z /2 z /2 Z Conclusiones: Rechazar H0 si: z < -za/2 o z > za/2 No rechazar H0 si: - za/2 z za/2
  • 8.
    Una manera denotificar los resultados de una prueba de hipótesis es establecer si la hipótesis nula fue o no rechazada con un nivel especificado a de significancia Una alternativa es especificar el nivel de significancia a más pequeño que conduce al rechazo de la hipótesis nula. A este se le llama el Valor P Este valor P sólo depende de la muestra tomada, es decir, para una muestra y un estadístico calculado se puede obtener su valor P y comparar con un a especificado. Entonces, si P<a, H0 se rechaza.
  • 9.
    El valor Pes el más pequeño nivel de significancia para el que H0 debe rechazarse, esto es el área de la cola (de la curva de densidad de probabilidad) que está más allá del valor del estadístico (en este caso t). o el doble de esta área en pruebas bilaterales. En todas las pruebas de hipótesis estadísticas se puede calcular el tamaño de la muestra (N) adecuada en función de la magnitud del error de tipo I que se permite. En cada tipo de prueba se encuentran fórmulas diferentes para N.
  • 10.
     Se partede una muestra aleatoria de tamaño N, proveniente de una población cuya distribución de probabilidad es desconocida.  Las N observaciones se acomodan en un Histograma de frecuencia con k intervalos de clase. Sea Oi la i-ésima frecuencia de clase  De la distribución de probabilidad propuesta se calcula la frecuencia esperada Ei en el i-ésimo intervalo de clase k (Oi Ei )2  El estadístico de prueba es χ2 i 1 Ei El cual tiene una distribución Ji2 con k-p-1 grados de libertad si la población sigue la distribución propuesta. (donde p es el número de parámetros de la población)
  • 11.
    Las pruebas dehipótesis anteriores se llaman paramétricas porque suponen conocida la distribución de la población y la hipótesis es acerca de los parámetros de dicha distribución. Otra clase de hipótesis es: No se sabe cual es la distribución de la población y se desea probar la hipótesis de que cierta distribución en particular será un modelo satisfactorio. Por ejemplo, tal vez se requiera probar si la distribución es Normal
  • 12.
    Estimación puntual ypor intervalo Las medias o desviaciones estándar calculadas de una muestra se denominan ESTADÍSTICOS, podrían ser consideradas como un punto estimado de la media y desviación estándar real de población o de los PARAMETROS. ¿Qué pasa si no deseamos una estimación puntual como media basada en una muestra, qué otra cosa podríamos obtener como margen, algún tipo de error? “Un Intervalo de Confianza”
  • 13.
    ESTIMADOR PUNTUAL: Utilizaun número único o valor para localizar una estimación del parámetro. ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango dentro del cual se puede encontrar el parámetro y el nivel de confianza que el intervalo contiene al parámetro. LIMITES DE CONFIANZA: Son los límites del intervalo de confianza inferior (LIC) y superior (LSC), se determinan sumando y restando a la media de la muestra un cierto número Z (dependiendo del nivel o coeficiente de confianza) de errores estándar de la media .
  • 14.
    INTERPRETACIÓN DEL INTERVALODE CONFIANZA: Tener un 95% de confianza en que la media poblacional real y desconocida se encuentra entre los valores LIC y LSC. NIVEL DE SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA = ERROR TIPO 1 = ALFA ¿Cómo obtenemos un intervalo de confianza? Estimación puntual + error de estimación