1. HIPOTESIS PARA LA PROPORCION POBLACIONAL
Una proporción poblacional es una media poblacional para una población de 0 y
1: una ecuación de Bernoulli.
¿Cómo se hace?
Ejemplo 1:
Un proveedor de placas semiconductoras afirma que todas las placas que
suministra, solo 10% son defectuosas. Se prueba una muestra de 400 placas, y
de 50 de ellas, 12.5%, presentan defectos. ¿Se puede concluir que esta
afirmación es falsa?
Para realizar la prueba de hipótesis, la muestra consiste de éxitos y fracasos,
con “éxito” se indica la placa defectuosa. Si la proporción poblacional de placas
defectuosas se denota mediante p, entonces la afirmación del proveedor es
que p≤0.1
Dado que esta hipótesis se ocupa de una proporción poblacional, es natural
basar la prueba en la proporción muestral Con base en la suposición
razonable de que las placas se muestrean de manera independiente, y al usar el
teorema de límite central, puesto que el tamaño muestral es grande, se obtiene
que:
Donde n es el tamaño de muestra es igual a 400.
Se debe definir la hipótesis nula. La pregunta es si los datos permiten concluir
que la afirmación de proveedor es falsa. Por tanto, la afirmación del
proveedor, que es p ≤ 0.1, debe ser H0. Por otra parte, sería imposible probar la
falsedad de la afirmación, sin que importara lo que los datos indicaban.
La hipótesis nula y alternativa son:
H0: p ≤ 0.1 contra H1: p
2. Para realizar la prueba de hipótesis se supone que H0 es verdadera y se toma
p= 0.1. Al sustituir p = 0.1 y n= 400 en la expresión se obtiene la distribución
nula de
N (0.1,2.25 x 10-4
)
La desviación estándar de es = = 0.015
El valor observado de es 50/400 = 0.125. El empuje z de es Z= =
1.67
La tabla z indica que la probabilidad de que una variable aleatoria normal
estándar tenga un valor mayor de 1.67 es 0.0475. El P-valor es, por tanto,
0.0475
Conclusión
¿Qué se concluye acerca de H0?
Ya sea que la afirmación del proveedor sea falsa, o que se haya observado una
muestra que sea tan extrema como las demás, que se podrían haber extraído
4.75% de las muestras. Tal muestra sería anormal, pero no muy improbable.
Hay una razón para estar particularmente escéptico con respecto a la
afirmación, pero tal vez no se debe aun condenar al proveedor. Si es posible,
sería una buena idea muestrear más placas.
Se observa que bajo la regla utilizada practica se rechazaría H0 y se
condenaría al proveedor, debido a que P es menor que 0.05. Este ejemplo
ilustra la debilidad de esta regla. Si se hacen los cálculos, se encontrará que si
solo 49 de las placas de la muestra hubieran estado defectuosas en vez de 50,
el P-valor se elevaría a 0.0668, y el proveedor estaría salvado. Por tanto, el
destino del proveedor depende del resultado de una sola placa de las 400. No
tiene sentido marcar tal línea nítida. Es mejor notificar el P-valor y esperar a
tener más evidencias antes de obtener una conclusión final.
Ejemplo 2
3. El articulo “Refinement of Gravimetric Geoid Using GPS and Leveling Data” (W.
Thurston, en Journal of Surveying Engineering, 2000:27-56) presenta un
método para medir las Alturas ortometricas arriba del nivel del mar. Para una
muestra de 1225 puntos de partida, 926 dieron resultados que están dentro
del espíritu de la clase C nivelando los límites de tolerancias. ¿Se puede llegar
a la conclusión de que este método produce resultados dentro de los limites de
tolerancia más de 75% de las veces.
Solución:
Sea p la probabilidad de que el método produzca un resultado dentro de los
límites de tolerancia.
Las hipótesis nula y alternativa son:
H0: p ≤ 0.75 contra H1: p
La proporción muestral es = 926/1 225= 0.7559. Bajo la hipótesis nula, esta
distribuido normalmente con media de 0.75 y desviación estándar
= 0.0124.
El puntaje z es:
Z= = 0.48
El p-valor es 0.3156. No se puede concluir que el método produzca buenos
resultados más de 75% de las veces.
Bibliografía:
Navidi William, “Estadística para ingenieros y científicos”, McGraw- Hill.