SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
Ensayos de hipótesis de una y dos colas con medias y proporciones
1. ESCUELA SUPERIOR DE CONTADURÍA Y
ADMINISTRACIÓN
INCORPORADA A LA UNIVERSIDAD AUTÓNOMA
DE COAHUILA
E N S AY O S D E H I P Ó T E S I S D E U N A Y D O S C O L A S
C O N M E D I A S Y P R O P O R C I O N E S
Ing. José Santos Calvillo Daniel
Nueva Rosita, Coah. Agosto 2014
2. INTRODUCCIÓN
El ensayo o prueba de hipótesis es una teoría de la decisión
estadística que permite determinar si una afirmación acerca del valor
de un parámetro poblacional debe ser o no rechazada, basada en la
estadística inferencial que estudia como sacar conclusiones para
toda una población a partir del estudio de una muestra y el grado de
fiabilidad o significación de los resultados obtenidos, por ello, la
muestra debe ser representativa; es decir, que no sea muy pequeña
y refleje lo más posible las características de la población a
estudiar.
En un ensayo de hipótesis se estudia la validez de una inferencia o
que se hace sobre algún aspecto de una distribución de
probabilidad.
Ing. José Santos Calvillo Daniel
3. PROCEDIMIENTO PARA LA REALIZACIÓN DE
ENSAYOS DE HIPÓTESIS
Al realizar ensayos de hipótesis, se parte de un valor supuesto o
parámetro poblacional hipotético. Después de recolectar una muestra
aleatoria, se compara la estadística muestral, así como la media, con
el parámetro hipotético, se compara con una supuesta media
poblacional. Después se acepta o se rechaza el valor hipotético, según
proceda la prueba realizada.
El procedimiento para la realización de este tipo de pruebas o
ensayos, puede dividirse en, por lo menos 6 etapas, que van desde la
elección del parámetro de interés y planteamiento de las hipótesis nula
y alterna, la especificación del nivel de significancia con sus criterios de
prueba para ese nivel, la elección del valor estadístico de prueba,
hasta la toma de decisión de rechazo o no rechazo de la suposición y
sus conclusiones. Dichas etapas pueden concretarse en los siguientes
pasos
Ing. José Santos Calvillo Daniel
4. PASOS PARA ELABORAR UN ENSAYO DE
HIPÓTESIS
1. Identificar el parámetro de interés y describirlo en el contexto de la
situación del problema.
2. Establecer la hipótesis nula 𝑯 𝟎 (afirmación que inicialmente se supone
cierta) y su hipótesis alterna 𝑯 𝟏 (afirmación contradictoria a 𝐻0 y que
es donde cae el peso de la prueba).
3. Establecer nivel de significancia y criterios de prueba; es decir, después
de establecer nivel de significancia, se debe precisar la región de
rechazo a ese nivel. A esta área se le llama región crítica α, por lo que
la complementaria de no rechazo será β (1 – α).
Se acostumbra determinar la región crítica examinando la gravedad del
error tipo I y simbolizarlo por α. Si es de suma gravedad o muy costoso,
el valor de α debe ser bajo, quizá de 0.01; si no es tan grave, se
acostumbra usar un α de 0.05; y este nivel de riesgo, está bajo el
control del tomador de la decisión. Aceptar 𝐻0 cuando es falsa se
considera un error tipo II.
Ing. José Santos Calvillo Daniel
5. 4. Se determina o formula el valor estadístico del ensayo.
1) 𝜎 conocido, población normal, no importa tamaño muestral (caso ideal)
Estadístico z =
𝒙 −μ 𝟎
𝝈/ 𝒏
~N(0, 1) Distribución normal μ = 0 y 𝜎= 1
2) 𝜎 conocido o no, población no importa si es o no normal, tamaño
muestral n ≥ 30 (aplica el T. C. L para las distribuciones normales).
Estadístico z =
𝒙 −μ 𝟎
𝝈/ 𝒏
~N(0, 1) ó z =
𝒙 −μ
𝒔/ 𝒏
~N(0, 1) con s ≅ 𝜎
3) 𝜎 desconocido, población normal, tamaño muestral, n <
30 (no aplica T. C. L) Estadístico T =
𝒙 −μ 𝟎
Ŝ/ 𝒏
~𝒕 𝒏 −𝟏
(Student con n-1 grados de libertad)
Ing. José Santos Calvillo Daniel
6. Otra forma de representar la llamada Distribución T de <<Student>>
es a través de la variable Ŝ que simboliza la estima muestral de
(𝜎) desconocida, que es aproximadamente igual a la desviación
estándar (s) de la muestra
Estadístico T =
𝒙−μ 𝟎
Ŝ
𝒏
~𝒕 𝒏 −𝟏 y Ŝ = s
𝒏
𝒏 −𝟏
Entonces T =
𝒙−μ 𝟎
𝒔
𝒏 −𝟏
donde (s) es la desviación estándar
* Cuando “n” aumenta hasta 30 o más, ambos métodos tienden a
coincidir; es decir, Ŝ = 𝜎 y T = Z (En este caso la variable T se convierte
en la variable tipificada Z con su valor estadístico para muestras
grandes). La distribución T se usará solamente junto con el T.C.L. en
los casos donde no se conozca 𝜎 (desviación estándar poblacional).
Ing. José Santos Calvillo Daniel
7. 4) El valor del estadístico “z”, para muestras grandes y proporción P.
Aquí S = 𝑃𝑠, la probabilidad de éxitos en una muestra; 𝜇 𝑠 = 𝜇 𝑝 = p,
donde p es la proporción de éxitos en la población y n es el tamaño de
la muestra.
𝜎𝑠 = 𝜎 𝑝= 𝑝𝑞
𝑛, donde q = 1 – p. El valor de z viene dado por:
Estadístico z =
𝑷 𝒔−𝒑
𝒑𝒒
𝒏
𝑷 𝒔 = X/n
Donde X es el número real de éxitos en una muestra, z se convierte
en:
z =
𝑿 − 𝒏𝒑
𝒏𝒑𝒒
; Es decir, 𝝁 𝒔 = 𝝁 = np; 𝝈 𝒙 = 𝝈 = 𝒏𝒑𝒒 y S = X
*Los casos 2, 3 y 4 son los más realistas en este tipo de pruebas.
Ing. José Santos Calvillo Daniel
8. 5. Se toma la decisión de rechazar o no la hipótesis nula probada.
Si el valor del estadístico queda dentro de la región crítica α, es
preciso rechazar la hipótesis nula, lo cual a su vez significa “aceptar”
la hipótesis alterna 𝛽 (1 – α); y viceversa, si no queda dentro de la
región crítica, la decisión será “no rechazar” la hipótesis nula y concluir
que tal hipótesis es cierta.
Cuando se trabaja con muestras, siempre es posible cometer
alguno de estos errores, independientemente del nivel de significación
elegido y su consecuente región crítica o de rechazo para la hipótesis
nula, lo cual se resume en la tabla adjunta siguiente (Fig. 1):
Decisión 𝑯 𝟎 es verdadera 𝑯 𝟎 es falsa
No rechazar 𝐻0 No hay error Error tipo II
Rechazar 𝐻0 Error tipo I No hay error
Fig. 1
Ing. José Santos Calvillo Daniel
9. 6. Se llega a una conclusión donde se describe verbalmente la
interpretación que se hace de la decisión tomada.
Esta etapa de la prueba de hipótesis es la más significativa, ya que
con ello es posible inferir que los resultados experimentales (de la media
muestral) observados, contradicen o no la suposición de la media
poblacional planteada.
A continuación se esbozarán las gráficas de las pruebas de cola
inferior, de cola superior y de dos colas (Ver fig. 2), y se dilucidarán los
conceptos tratados mediante algunos ejemplos con medias poblacionales
y proporciones, con su correspondiente determinación de niveles de
significación adecuados.
Ing. José Santos Calvillo Daniel
10. GRÁFICOS PRUEBAS DE UNA Y DOS
COLAS
Prueba de cola inferior Prueba de cola superior Prueba de 2 colas
Tabla 1 Valores 𝒛 𝜶 para 1 y 2 colas y niveles de significancia 0.05 y 0.01
Nivel de significación 0.05 0.01
Valores críticos de z para ensayos de una cola ± 1.645 ± 2.33
Valores críticos de z para ensayos de dos colas ± 1.96 ± 2.58
1 – 𝛼 1 – 𝛼 1 – 𝛼
−𝒛 𝜶 +𝒛 𝜶 −𝒛 𝜶/𝟐 +𝒛 𝜶/𝟐𝝁 𝟎 𝝁 𝟎 𝝁 𝟎
Ing. José Santos Calvillo Daniel
Fig. 3
11. Signo en la
hipótesis alterna < ≠ >
Tipo o región
crítica
Una región, lado
izquierdo
Dos regiones,
una a cada lado
Una región, lado
derecho
En resumen, si la hipótesis alterna contiene un signo de menor que
(<) o mayor que > ,la región crítica se sitúa, por completo, en uno de los
lados con el signo “apuntando” hacia el lado en que está la región crítica;
si la hipótesis alterna contiene los dos signos, se escribirá con un signo de
desigualdad ≠ ,y la región crítica estará dividida en dos partes iguales,
una a cada lado; aquí se tiene un ensayo o prueba de dos colas
Tabla 2: Región crítica para ensayos unilaterales o bilaterales
(una o dos colas)
Ing. José Santos Calvillo Daniel
12. Ejemplo No. 1 Se estima que el peso medio de los alumnos de la ESCA es
de 145 libras. La desviación estándar es de 12 libras. Para probar esa
hipótesis se obtuvo una muestra de 40 alumnos del total que asisten a la
Escuela, determinándose un peso promedio de 139.5 Lbs. Probar dicha
hipótesis con un nivel de significancia α = 0.05
Formulación:
Paso 1: Parámetro de interés 𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
Paso 2: Plantear la Hipótesis nula 𝐻0 y alterna 𝐻1:
𝐻0: 𝜇 = 𝜇0 = 145 (Peso medio verdadero poblacional)
𝐻1: 𝜇 ≠ 𝜇0 ≠ 145 (Peso de la prueba).
Paso 3: Establecer Nivel de significancia y criterios de prueba α = 0.05
(Los valores críticos de x pueden obtenerse de la tabla de áreas bajo la
curva normal tipificada; y en este caso, la hipótesis alterna sugiere una
región crítica de 2 colas, con α/2= 0.25 de área por cada lado. (Ver fig. 4)
EJEMPLOS DE ENSAYOS CON MEDIAS Y
PROPORCIONES
Ing. José Santos Calvillo Daniel
13. Región de
rechazo
𝜶
𝟐
=
𝟎. 𝟎𝟐𝟓
Región de
rechazo
𝜶
𝟐
=
𝟎. 𝟎𝟐𝟓
𝝁 𝟎
(1-𝛼)=
Fig. 4
Los valores críticos + 1.96 y – 1.96 se obtienen de la tabla de áreas
bajo la curva normal tipificada z, con (1 - 𝛼) = 0.95: 𝜇0 ± 𝑍 𝛼
𝜎
𝑛
= 0.475
para cada lado, y arroja el punto 1.96 a la derecha de 𝜇0; y por simetría, -
1.96 en la parte izquierda de la misma. (Ver tabla 1 fig. 3)
Ing. José Santos Calvillo Daniel
14. Paso 4. Determinar el valor estadístico de prueba. Se trata de un estadístico z
con σ desconocido , con un tamaño muestral grande decir, n ≥ 30
𝜇 𝑦 𝑠 𝑐𝑜𝑛𝑐𝑜𝑐𝑖𝑑𝑜𝑠 (aplica el T.C.L.). Caso 2b
z =
𝒙 −𝝁 𝟎
𝒔/ 𝒏
~ N(0, 1) 𝒙 = 139.5, μ = 𝝁 𝟎 = 145, 𝒔 = 12 lbs y n = 40
z =
𝟏𝟑𝟗.𝟓 −𝟏𝟒𝟓
𝟏𝟐/ 𝟒𝟎
= - 2.89 ; y por simetría, + 2.89 ; z ±𝟐. 𝟖𝟗
Paso 5. Se toma la decisión. Se rechaza 𝐻0 porque el valor crítico o 𝒁 𝜶 del
estadístico queda dentro de la región de rechazo (𝑧1 < 𝑧 𝛼 < -1.96 y 𝑧2 >
𝑧 𝛼 > +1.96).
Paso 6. Conclusión: Se rechaza la hipótesis nula porque los resultados
experimentales de la media muestral observados contradicen la suposición
de la media poblacional planteada, y no es significativa en el valor pedido
de 0.05; ni siquiera para el valor 0.01 porque sus valores críticos se
manejan entre ± 2.58 (Ver Tabla 3, Áreas bajo la curva normal tipificada
Fig. 5).
Ing. José Santos Calvillo Daniel
16. Tabla 4 Distribución T de Studdent ,una y dos colas, con su
probabilidad P
Ing.JoséSantosCalvilloDaniel
Fig. 6
17. Ejemplo No. 2 . Hallar la probabilidad de obtener entre 40 y 60 caras,
inclusive, en 100 lanzamientos de una moneda.
Formulación: (En este caso se utiliza la aproximación normal de la
distribución binomial, la cual es más exacta con muestras grandes con
n≥ 30 𝑦 𝜇 ≥ 5).
Caso 4 (Tamaño muestral grande n≥30, usando proporciones)
𝝁 = np = 100(½) = 50 y 𝝈 = 𝒏𝒑𝒒 = 100((½)(½) = 5
En una escala continua, entre 40 y 60 caras significa encontrar la
probabilidad de p(x) = p ( 𝐚 ≤ x ≥b) = p( 39.5 ≤ 𝒙 ≥60.5)
𝑥1 = 39.5 𝑍1 =
𝑥 −𝜇
𝜎
= 39.5 −50
5
= - 2.10
𝑥2 = 60.5 𝑍2 =
𝑥 −𝜇
𝜎
= 60.5 −50
5
= + 2.10
Solución: p ( - 2.10 ≤ z ≥ + 2.10) = p( 1 - 𝛼 ) = Región de
“aceptación” o de no rechazo en una prueba de 2 colas. (Ver figura 7)
Ing. José Santos Calvillo Daniel
18. 39.5 60.5
96.42%
Fig. 7
Conclusión:
La probabilidad pedida es igual al área bajo la curva normal entre los
valores z = - 2.10 y z = + 2.10 = 2 veces el área entre 𝑧0 = 0 y 𝑧1 = 2.10 =
2(0.4821) = 0.9642; es decir, p( 𝟑𝟗. 𝟓 ≤ x ≥ 𝟔𝟎. 𝟓 ) = 𝟗𝟔. 𝟒𝟐% (Ver Tabla
3, Áreas bajo la curva normal tipificada fig. 5).
Ing. José Santos Calvillo Daniel
19. Ejemplo No. 3. Un fabricante afirma que al menos el 95% de los equipos
que suministra a una factoría cumple con las especificaciones
requeridas. Un examen sobre una muestra de 200 de tales equipos
reveló que 18 eran defectuosos. Probar esa afirmación del fabricante al
nivel de significación del 0.05
Formulación:
Paso 1. Determinar parámetro de interés: p
Paso 2. Expresar la hipótesis nula y alterna en términos del parámetro de
interés: 𝐻0: 𝑝 = 𝑝0 ≥ 0.95; 𝑝0 = 0.95 calidad aceptable
𝐻1: 𝑝 = 𝑝1 < 0.95; 𝑝1 = 0.94 calidad no aceptable
Paso 3. Establecer Nivel de significancia y criterios de prueba α = 0.05
(Los valores críticos de x pueden obtenerse de la tabla de áreas bajo la
curva normal tipificada; y en este caso, el signo de la hipótesis alterna
sugiere una región crítica del lado izquierdo - 1.645 (Prueba de cola
inferior). (Ver fig. 8)
Ing. José Santos Calvillo Daniel
20. Fig. 8𝒛 𝜶= 𝟓 𝝁 𝟎
El valor crítico - 1.64, y con mayor exactitud -1.645, se obtiene de la tabla
de áreas bajo la curva normal tipificada z que va de 𝜇0 ±𝑧 𝑎
𝜎
𝑛
= 0.45 + 0.5
= 0.95, por ser ensayo unilateral o de cola inferior = (1 – α). (Ver también
Tabla 2, Región crítica para ensayos unilaterales o bilaterales)
Ing. José Santos Calvillo Daniel
21. Paso 4. Determinar el valor estadístico de prueba. Se trata de un
estadístico con P y p conocidos, con un tamaño muestral grande n ≥ 30
(Aplica el T.C.L.). Caso 4
𝑷 𝒔 = X/n = 82
200 = 0.41
Valor Estadístico z =
𝑷 𝒔−𝒑
𝒑𝒒
𝒏
=
0.41 −0.95
.95 (.05)
200
= - 2.27
Paso 5. Se toma la decisión. Se rechaza 𝐻0 para este nivel de
significancia porque 𝒁 𝜶 = 1.645 del estadístico queda dentro de la
región de rechazo en este ensayo unilateral o de cola inferior (z < 𝑧 𝛼,
- 2.27 < -1.645). (Ver Tabla 1 )
Paso 6. Conclusión: Se rechaza la hipótesis nula porque los resultados
experimentales observados contradicen la afirmación del fabricante , y
no es significativa en el valor pedido de 0.05; ni siquiera para el valor
0.01 porque sus valores críticos se manejan entre +2.33 y – 2.33 (Ver
Tabla 1 Fig. 3 Valores 𝒛 𝜶 para niveles 0.05 y 0.01, una y dos colas).
Ing. José Santos Calvillo Daniel
22. Ejemplo No. 4 La cámara de comercio de Rochester señala que, de acuerdo
a un estudio publicado por Rochester Democrat and Chronicle el 21 de
febrero de 1972, sobre la contaminación del aire en la ciudad de Chicago,
“El nivel medio de dióxido de carbono de contaminación atmosférica no
sobrepasa de 4.9”. Para probar esta hipótesis, se toman 25 lecturas
aleatorias para las cuales 𝑥 = 5.1 y s = 2.1. Se usa 𝛼 = 0.05
Formulación:
Paso 1: Determinar parámetro de interés: 𝜇
Paso 2: Determinar hipótesis nula y alterna en función del parámetro de
interés en el contexto del problema: 𝐻0: 𝜇 = 𝜇0 ≤ 4.9 y 𝐻1: 𝜇 > 𝜇0 > 4.9
Paso 3: Establecer Nivel de significancia y criterios de prueba α = 0.05 (Los
valores críticos de t pueden obtenerse de la tabla de distribución t de
Studdent; y en este caso, el signo de la hipótesis alterna sugiere una
región crítica del lado derecho con (n -1) gL (24) que de acuerdo a la Tabla
4 de Studdent, para 0.05 y 24 gl = 1.71, tal y como se muestra en el gráfico
adjunto Fig. 9. (Ver tabla 4 Fig. 6 de Studdent)
Ing. José Santos Calvillo Daniel
23. El valor crítico +1.71, se obtiene de la tabla de valores críticos de
distribución t de Studdent con (n – 1) gl; es decir (25 – 1) = 24, que se
encuentra a la derecha, de acuerdo al signo > de la hipótesis alterna (Ver
Tabla 4 de la Distribución t de Studdent con n -1 grados de libertad)
t 0
1.71
Ing. José Santos Calvillo Daniel
Fig. 9
24. Paso 4. Determinar el valor estadístico de prueba. Se trata de un
estadístico de variable t de Studdent, con n < 30 y (n – 1) grados de
libertad, de cola superior, con σ desconocido y población normal (no
aplica el T.C.L.)
T =
𝒙−μ 𝟎
𝒔/ 𝒏 −𝟏
=
5.1 −4.9
2.1/ 24
=
0.20
0.43
= 0.47
Paso 5. Se toma la decisión. No se rechaza 𝐻0 para este nivel de
significancia, porque de acuerdo al estudio experimental 𝑡 𝑎 < 𝑡 𝑐 ;
047 < 1.71; por lo tanto, se encuentra dentro de la región de
“aceptación”
Paso 6. Conclusión. No se puede concluir que el nivel medio de carbono
sea mayor que 4.9
Ing. José Santos Calvillo Daniel
25. Problemas propuestos
1. Se sabe que las calificaciones obtenidas en un cierto examen se
distribuyen normalmente, con una media aritmética de 7.57. Un profesor
afirma que si el examinador adopta una actitud agresiva ante los
alumnos, el promedio de calificaciones será diferente al establecido.
Para probar los anterior, aplicó el examen con una actitud agresiva a 40
alumnos elegidos aleatoriamente y encontró una media aritmética de 7.1
y una desviación estándar de 0.09. Vamos a probar con 𝛼 =
0.01 la hipótesis del profesor.
2. El director de una escuela informa que el promedio de minutos
empleados a estudiar por todos los alumnos, es de 50 minutos. Sin
embargo un profesor considera que el tiempo promedio dedicado a
estudiar por todos los alumnos es menor, y escoge una muestra
aleatoria de 25 alumnos obteniendo una media aritmética de 42 minutos
y una desviación estándar de 7 minutos. ¿Proporciona esta información
evidencia suficiente para la consideración del profesor? Use 𝛼 = 0.05
Ing. José Santos Calvillo Daniel
26. 3. El fabricante de una patente médica sostiene que la misma tiene un 90%
de efectividad en el alivio de una alergia, por un periodo de 8 horas. En
una muestra de 200 individuos que tenían la alergia, la medicina
suministrada alivió a 160 personas. Determinar si la aseveración del
fabricante es cierta al nivel de significación de 0.01
4. Supóngase que se desea evaluar el aserto de un fabricante que
establece que sus llantas radiales tiene un promedio de vida de, por lo
menos 40 000 millas. Para probar esta hipótesis se toma una muestra
de n = 49, con un valor medio muestral de 38000 millas. Si se sabe que
el recorrido de los neumáticos de la población tiene una desviación
estándar de 3500 millas, probar la afirmación con un 𝛼 = 0.05
5. Una muestra aleatoria de 100 muertes registradas en los EE UU durante
el año pasado mostró una vida promedio de 71.8 años. Suponiendo una
desviación estándar poblacional de 8.9 años, ¿parecería esto indicar
que la vida promedio hoy en día es mayor que 70 años?. Use 𝛼 = 0.05
Ing. José Santos Calvillo Daniel
Notas del editor
Ensayos de hipótesis de una y dos colas con medias y proporciones (Portada)
Introducción
Procedimiento para la realización de ensayos de hipótesis
Pasos 1, 2 y 3 para la elaboración de un ensayo de hipótesis
Paso 4 y Valores estadísticos z para medias poblacionales
Distribución T de Student con n – 1 grados de libertad
Estadístico z para proporciones
Tabla de decisiones para errores tipo I y II, Fig. 1
6º paso de un ensayo de hipótesis
Gráficos pruebas de una y dos colas y Tabla 1 Valores 𝑧 𝛼 para 1 y 2 colas y niveles de significancia 0.05 y 0.01. Fig. 2 y 3
Tabla 2: Región crítica para ensayos unilaterales o bilaterales (una o dos colas)
Ejemplo 1 Ensayo de hipótesis con media poblacional y desviación estándar conocidas, muestras grandes, pasos 1, 2 y 3
Gráfico de un ensayo de hipótesis de dos colas Fig. 4, ejemplo 1
Pasos 4, 5 y 6 ejemplo 1
Tabla 3 Áreas bajo la curva normal tipificada Fig. 5
Tabla 4 Distribución T de Studdent, con su probabilidad P asociada
Ejemplo 2 aproximación normal de la distribución binomial usando proporciones
Gráfico de ensayo de hipótesis de dos colas y conclusión ejemplo 2 Fig. 6
Ejemplo 3 Ensayo de Hipótesis usando proporciones
Gráfico de Ensayo de hipótesis unilateral o de cola inferior usando proporciones, ejemplo 3
Pasos 4, 5 y 6 ejemplo 3
Ejemplo 4 Distribución de Studdent, pasos 1, 2 y 3
Gráfico de la distribución t de Studdent con nivel 0.05 cola superior, ejemplo 4