INFERENCIA ESTADÍSTICA
Pruebas de Hipótesis

1
Problema de Pruebas de Hipótesis:
• Conocer si después de capacitar a un grupo de empleados
sobre el manejo de un equipo, el nivel de destreza se ha
incrementado.
• Disminuir los impuestos reduce el fraude fiscal.
• La variabilidad de los tiempos de atención es menos de una
desviación estándar.
• Una información sobre la proporción que representa el grupo
en la población
En general
• Una información sobre el valor de una característica por
ejemplo en el pasado que queremos comparar con el valor
actual

2
Hipótesis Estadística
Una Hipótesis Estadística es una afirmación que se hace acerca de un
parámetro poblacional.
Por ejemplo: el tiempo de vida promedio de un dispositivo electrónico es
mayor a 1000 horas.
Hipótesis nula: Afirmación establecida a priori como verdadera y que se
espera sea rechazada después de aplicar una prueba estadística, se
representa por Ho.
Hipótesis alterna: Afirmación que se espera sea aceptada después de
aplicar una prueba estadística, se representa por Ha o H1.
Una prueba estadística es una fórmula, basada en la distribución del
estimador del parámetro que aparece en la hipótesis y que va a permitir
tomar una decisión acerca de aceptar o rechazar una hipótesis nula.
3
Errores tipo I y tipo II
Hay dos tipos de errores que pueden ocurrir:
El error tipo I: se comete cuando se rechaza una hipótesis nula que realmente es
cierta.
El error tipo II: se comete cuando se acepta una hipótesis nula que realmente es
falsa.
El nivel de significación (α ), es la probabilidad de cometer error tipo I, y por lo
general se asume que tiene un valor de 0.05 ó 0.01. También puede ser
interpretado como el área de la región que contiene todos los valores posibles de la
prueba estadística para los cuales la hipótesis nula es rechazada.
La probabilidad de cometer error tipo II, es representado por β y al valor 1-β se le
llama la potencia de la prueba. Una buena prueba estadística es aquella que tiene
una potencia de prueba alta.

4
5
Ejemplo

6
Ejemplo

7
Ejemplo

8
Etapas de un Contraste de Hipótesis
1. Formulación de las hipótesis.
2. Se fija el nivel α de significación, o máximo error tipo I dispuestos a
admitir.
3. Estadístico de prueba. Se basa al conocimiento de la distribución
poblacional, los parámetros y el tamaño muestral.
4. Regla de decisión. Decidiremos cual es el valor crítico que limita la zona
de aceptación y de rechazo.
5. Decisión. Comparación de los datos experimentales con el valor crítico.
De llegarse a un test significativo (los que rechazan Ho), proceder a dar
un intervalo de confianza para el parámetro de estudio.

9
Dócima para una media poblacional
(σ conocida)
Caso I
Ho : μ=μ0
Ha : μ<μ0

Caso II
Ho : μ=μ0
H a : μ ≠ μ0

Caso III
Ho : μ =μ0
Ha : μ >μ0

Prueba Estadística:
Población ⇒
Normal

Si Zcal < -Zα entonces
se rechaza Ho

Z =

x − μo

σ

~ N(0, 1)

n

Decisión:
Si |Zcal |>Zα/2 entonces Si Zcal >Zα entonces
se rechaza Ho
se rechaza Ho
10
Prueba de hipótesis usando “P-values”
El “P-value” llamado el nivel de significación observado, es el valor
de α al cual se rechazaría la hipótesis nula si se usa el valor calculado
de la prueba estadística.
Fórmulas para calcular “P-value”: Depende de la forma de la
hipótesis alterna y del estadístico de prueba.
Ejemplo
Si Ha: μ >μo, entonces P-value = Prob (Z>Zcalc).
Si Ha: μ <μo, entonces P-value = Prob (Z<Zcalc).
Si Ha: μ ≠ μo, entonces P-value = 2Prob (Z>|Zcalc||).
Cuanto más pequeño sea el P-valor mayor es la evidencia en contra de
Ho.
La PROBABILIDAD permite calibrar el poder de nuestras conclusiones
11
Ejemplo
En estudios previos se ha determinado que el nivel promedio de cantidad
demandada de cierto servicio es 220 mensualmente. Un empresario piensa
que en realidad el nivel es más alto de lo que se indica y para probar su
afirmación se asume que la demanda es normal con desviación estándar de
13 (σ = 13). Para una muestra de 20 meses, ¿habrá suficiente evidencia
estadística para apoyar la afirmación del empresario?.
217
233
218

223
235
224

225
242

245
219

238
221

216
234

217
199

226
236

202
248

12
Los resultados son los siguientes:
One-Sample Z: Demanda
Test of mu = 220 vs > 220
The assumed standard deviation = 13
95%
Lower
Variable
N Mean StDev SE Mean Bound Z
P
Demanda 20 225.900 13.094 2.907 221.119 2.03 0.021
Interpretación:
El valor del “P-value” (el área a la derecha de 2.03) es .021 menor que el
nivel de significación α =0.05, por lo tanto; se rechaza la hipótesis nula y se
concluye de que sí hay evidencia estadística de que el nivel promedio de
demanda es mayor de 220. O sea los resultados apoyan lo que afirma el
empresario.
El extremo inferior del intervalo confianza de un solo lado empieza en
221.119 que es mayor que 220.
13
Dócima para una media poblacional
(varianza desconocida)
Caso I
Ho : μ =μo
Ha : μ<μ0

Caso II
Ho : μ =μo
Ha : μ ≠ μo

Caso III
Ho :μ =μo
Ha :μ >μo

Prueba Estadística:
Una muestra pequeña
(n < 30) tomada de la
población normal

t =

x − μ
s
n

o

t se distribuye como una
t-student con n-1 g.l.

Si tcal < -tα entonces

Si |tcal |>tα/2 entonces

Si tcal >tα entonces

se rechaza Ho

se rechaza Ho

se rechaza Ho

14
Ejemplo
Los tiempos de atención (en minutos) de 12 clientes para un servicio
dado son los siguientes:
3.1

0.9

2.8

4.3

0.6

1.4

5.8

9.9

6.3

10.4 5

11.5

Hallar un intervalo de confianza del 99 por ciento para el tiempo
promedio de atención y probar la hipótesis que el tiempo promedio de
atención es menor de 9 minutos.

15
One-Sample T: tiempo
Test of mu = 9 vs not = 9
Variable N Mean StDev
SE Mean
99% CI
T
P
tiempo 12 5.16667 3.75967 1.08532 (1.79586, 8.53747) -3.53 0.005
One-Sample T: tiempo
Test of mu = 9 vs < 9
99%
Upper
Variable N Mean StDev SE Mean Bound
T
P
tiempo 12 5.16667 3.75967 1.08532 8.11666 -3.53 0.002
Interpretación:
El valor del “P-value” es .002 menor que el nivel de significación α=0.01,
por lo tanto; se rechaza la hipótesis nula y se concluye de que sí hay
evidencia estadística de que el tiempo promedio de atención es menor de 9.
El extremo superior del intervalo confianza de un solo lado empieza en
8.11666 que es menor que 9.
16
Potencia de un test.
Sea el contraste Ho:θ=θo H1:θ∈Ω. El contraste se realiza eligiendo una medida de
discrepancia y un nivel de significación α, con estos elementos el problema queda
totalmente establecido. Llamaremos potencia de un contraste a la función:
Potencia (θ)=π(θ)=P(Rechazar Ho / θ).
Se dan dos situaciones:
θ=θo ⇒ π(θ)=P(Rechazar Ho / θ=θo) = α.
θ≠θo⇒ π(θ)=P(Rechazar Ho / θ≠θo) = 1- P(Aceptar Ho / θ≠θo) = 1-β(θ).
Al desconocerse el verdadero valor de θ, la potencia de un test (excepto en el caso
de que ambas hipótesis sean simples) no puede calcularse exactamente, pero si
podemos representar esta función para los distintos y posibles valores del
parámetro θ.

17
Ejemplo

18
Inferencia para Proporciones
Cuando estamos interesados en estimar la proporción P (o el porcentaje) de
ocurrencia de un evento. Se necesita definir una variable aleatoria X que
indique el número de veces que ocurre el evento en una muestra de tamaño n
y con probabilidad de éxito, π. Se puede mostrar que cuando el tamaño de
muestra es grande, tal que nπ > 5, entonces el estadístico

Z

=

P − π
π (1 − π )
n

se distribuye aproximadamente como una normal estándar. Aquí π
representa la proporción poblacional que se desea estimar, la proporción
muestral es:

P=

x
n

19
Dócima para una proporción
Caso I
Ho : π=π0
Ha : π <π0

Caso II
Ho :π=π0
Ha :π ≠π0

Caso III
Ho : π=π0
Ha : π >π0

Prueba Estadística (Aproximada)
Población ⇒
Binomial

Z=

(P − π 0 )
π 0 (1 − π 0 )
n

~ N(0, 1)

Decisión
Si Zcal <-Zα entonces Si |Zcal |>Zα / 2 entonces Si Zcal >Zα entonces
se rechaza Ho
se rechaza Ho
se rechaza Ho
20
Ejemplo
En 1995 en una zona metropolitana, se reportó que dos de cada 5 personas
reunían el perfil del consumidor de cierto bien. En una encuesta reciente
hecha en 2005 a 1225 personas se encontró que 478 de ellos coincidían con
dicho perfil. ¿Piensa usted que existe evidencia para afirmar de que el perfil
del consumidor ha cambiado con respecto a 1995? Utilice γ = 0.90

Solución:
Hay que hallar un intervalo de confianza del 90% para la proporción p,
y probar la siguiente hipótesis:
H 0 : π = 0.4 (la proporción no cambió de 1995 a 2005).
H a : π ≠ 0.4 (la proporción cambió de 1995 a 2005).

21
Test and CI for One Proportion
Test of p = 0.4 vs p not = 0.4
Sample
X
N Sample p
1
478 1225 0.390204

90% CI
Z-Value P-Value
(0.367280, 0.413128) -0.70
0.484

Interpretación: Viendo que el “P-value” es 0.484 mucho mayor que 0.10
se llega a la conclusión de que no hay suficiente evidencia de que la
proporción de personas con el perfil deseado haya cambiado de 1995 a
2005.

22
Dócima para la Varianza Poblacional
Asumiendo que la población de donde se extrae la muestra se distribuye
normalmente se pueden hacer las siguientes hipótesis acerca de la varianza
poblacional:
Caso I
Ho : σ2 = σ
Ha : σ2 < σ

Caso II
Ho : σ2 = σ
Ha : σ2 ≠ σ

2
0
2
0

Caso III
Ho : σ2 = σ
Ha : σ2 > σ

2
0
2
0

Prueba Estadística:

(n − 1) s

2
0
2
0

Ha : σ2 > σ

2
0

2

χ2 =

σ

2
0

α

con n-1 g.l.
χ2α, (n-1)

Decisión:

Si χ < χ entonces
se rechaza Ho
2
cal

2

α

Si χ < χ ó χ >
se rechaza Ho
2
cal

2

α /2

2
cal

2
χ 1−α / 2

Si χ > χ
se rechaza Ho
2
cal

2
1−α

23
Ejemplo
Los siguientes datos representan utilidades netas mensuales (miles de nuevos
soles) por exportaciones de una empresa durante 20 meses:
80
87
78

90
81
95

85
87
77

82
61
52

75
73

58
84

70
85

84
70

Probar si hay suficiente evidencia para concluir que la desviación estándar
poblacional sea mayor que 10,000 nuevos soles. Usar un nivel de significación
del 5 por ciento.

24
Solución:
Se desea probar:
Ho : σ2 = 100
Ha : σ2 > 100
El valor de la prueba estadística es:
χ2 = (19)(122.116)/100 = 23.2020
Que comparado con χ2tab = 30.1435 (con 19 g.l.) resulta ser menor.
Equivalentemente a:
p-value = P(χ2 > 23.2020) =0.228562 > 0.05
Luego, no hay evidencia suficiente para rechazar la hipótesis nula.
Al 5 % de significación, la varianza poblacional no parece ser mayor que
100.

25
Comparando la varianza de dos poblaciones
Supongamos que se tienen dos poblaciones normales con varianzas
2
desconocidas σ 2 y σ 2
1

Si de la primera población se toma una muestra de tamaño m que tiene
2
una varianza muestral s 1 y de la segunda población se toma una muestra,
independiente de la primera, de tamaño n que tiene una varianza muestral
2
s2

Se puede mostrar que la razón

s12 σ12
2
2
s2 σ 2

se distribuye como una F con m-1 grados de libertad en el numerador y
n-1 en el denominador.
26
Caso I
2
Ho : σ 12 = σ 2

Caso II

Caso III
2
2
Ho : σ 1 = σ 2
2
Ha : σ 12 > σ 2

2
2
Ho : σ1 = σ 2
2
Ha : σ 12 ≠ σ 2

Ha : σ 12 < σ 22

Prueba Estadística:

s12
F= 2
s2

Ha: σ21>σ22
α

Fm-1, n-1:α

con m-1 g.l. en el numerador y n-1 g.l en el denominador

Decisión:
Si Fcal<Fα entonces
se rechaza Ho

Si Fcal<Fα/2 o Fcal >F1-α/2
se rechaza Ho

Si Fcal>F1-α entonces
se rechaza Ho

27
28
Ejemplo
Se trata de comparar la
variabilidad de ingresos por
concepto de ventas en dos
empresas, los datos son:

item

ingresos

empresa

1

58.0

A

2

63.8

A

3

64.2

B

4

70.4

A

5

76.7

B

6

64.1

B

7

72.1

B

8

62.5

B

9

69.4

A

10

61.5

A

11

61.7

A

12

62.3

A

13

68.9

B

14

68.9

A

29
Test for Equal Variances: ingresos versus empresa
95% Bonferroni confidence intervals for standard deviations
empresa N Lower StDev Upper
A
8 2.82368 4.51347 10.3380
B
6 3.24522 5.53477 15.8347
F-Test (normal distribution)
Test statistic = 0.67, p-value = 0.601
Levene's Test (any continuous distribution)
Test statistic = 0.30, p-value = 0.594

30
Test for Equal Variances for ingresos
F-Test
Test Statistic
P-Value

empresa

A

0.67
0.601

Lev ene's Test
Test Statistic
P-Value

B

2

4

6
8
10
12
14
95% Bonferroni Confidence Intervals for StDevs

0.30
0.594

16

empresa

A

B

60

64

68
ingresos

72

76

Interpretación: El “p-value” de la prueba F es 0.601 mucho mayor que 0.05,
luego se acepta la hipótesis nula y se concluye que la variabilidad de ingresos en
las dos empresas tienen igual varianza.

31
Comparación entre dos medias poblacionales
usando muestras independientes
Supongamos que se tienen dos poblaciones distribuidas normalmente con
medias desconocidas μ1 y μ2, respectivamente. Se puede aplicar una prueba t
de Student para comparar las medias de dichas poblaciones basándonos en
dos muestras independientes tomadas de ellas.
Si m < 30 y n < 30 con varianzas desconocidas se tiene:

a) Varianzas de las poblaciones iguales: ( σ 12 = σ 22 = σ 2 )
entonces se puede mostrar que:
t=

( x − y ) − ( μ1 − μ 2 )
sp

1 1
+
m n

se distribuye como una t con m + n - 2 grados de libertad.

32
la varianza poblacional es estimada por una varianza combinada de las
varianzas de las dos muestras tomadas.
2
(m − 1) s12 + (n − 1) s 2
s2 =
p
m+n−2

33
2
b) Varianzas de las poblaciones no son iguales: ( σ 12 ≠ σ 2 )

entonces se usa una prueba aproximada de t, donde el número de grados de
libertad es calculado aproximadamente. La prueba de t aproximada está
dada por:

t=

x − y − (μ1 − μ 2 )
2
s12 s2
+
m n

donde los grados de libertad (gl) son aproximados por la siguiente fórmula:

(c1 + c 2 ) 2
gl = 2
2
c1
c2
+
m −1 n −1

Con

s12
c1 =
m

y

2
s2
c2 =
n

34
Las pruebas de hipótesis son:
Caso I
Caso II
Ho : μ1 = μ 2
Ho : μ1 = μ 2
Ha : μ1 < μ 2
Ha : μ1 ≠ μ 2

Caso III
Ho : μ1 = μ 2
Ha : μ1 > μ 2

Prueba Estadística:

x−y

t=
sp

Decisión:
Si t cal < − tα entonces
se rechaza Ho

1 1
+
m n

t=
o

x−y
2
s12 s 2
+
m n

Si t cal < tα / 2 o t cal > t1−α / 2
se rechaza Ho

Si t cal > t1−α
se rechaza Ho
35
Ejemplo
Se realizó un experimento para comparar el tiempo promedio requerido por
el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el
tiempo necesario para que cada medicamento alcance un nivel específico
en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a
doce personas para ensayar cada fármaco registrándose el tiempo en
minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con
α = 0.05 si existe diferencia entre los tiempos promedio y obtenga el valor
de P. Suponga varianzas iguales.

36
Solución
Primero se pondrá a prueba el supuesto de varianzas iguales mediante una
prueba de hipótesis con α = 0.10.

37
38
39
40
Ejemplo

41
Solución

42
43
44
45
Dócima para muestras relacionadas
Caso I
Ho : μd = 0
Ha : μd < 0

Caso II
Ho : μd = 0
Ha : μd ≠ 0

Caso III
Ho : μ d = 0
Ha : μd > 0

(Si n < 30 y desviación estándar desconocida)
Prueba Estadística:

d
t=
sd

se distribuye como una t de Student con n-1 gl.

n
Decisión:
Si t<-tα entonces
se rechaza Ho

Si | t |>tα/2 entonces
se rechaza Ho

Si tcal >tα entonces
se rechaza Ho

46
Ejemplo
Se ha evaluado el nivel de
conocimientos a un grupo de
estudiantes sobre un tema en
particular
antes
de
una
capacitación. Las puntuaciones
varían entre un mínimo de 0 y un
máximo de 15. Pasados tres
meses
después
de
la
capacitación, los mismos 10
estudiantes repiten el proceso de
evaluación. Según los resultados
obtenidos que se muestran en la
tabla, ¿hay razones para afirmar
que los estudiantes después de
estos tres meses aumentaron su
nivel de conocimientos? .

Estudiante

Test 1

Test 2

1

13.2

14

2

8.2

8.8

3

10.9

11.2

4

14.3

14.2

5

10.7

11.8

6

6.6

6.4

7

9.5

9.8

8

10.8

11.3

9

8.8

9.3

10

13.3

13.6

47
Paired T-Test and CI: Test 1, Test 2
Paired T for test 1 – test 2
N
Mean
Test 1
10 10.6300
Test 2
10 11.0400
Difference: 10 -0.410000

StDev SE Mean
2.4513 0.7752
2.5185 0.7964
0.387155 0.122429

95% upper bound for mean difference: -0.185574
T-Test of mean difference = 0 (vs < 0): T-Value = -3.35 P-Value = 0.004

Interpretación: El “p-value” de la prueba t es 0.004 menor que 0.05, luego se
rechaza la hipótesis nula y se concluye que los estudiantes han incrementado su
nivel de conocimientos.

48
Comparando dos proporciones
Algunas veces se desea comparar la proporción con que ocurre un mismo
evento en dos poblaciones distintas. Esto conlleva a hacer inferencias acerca
de la diferencia p1 - p2. Supongamos que de una de las poblaciones sacamos
una muestra de tamaño m, y que en ella ocurre el evento X1 veces, y de la
segunda población sacamos una muestra de tamaño n y que en ella ocurre el
evento X2 veces. Se puede mostrar que el siguiente estadístico:
z=

ˆ
p1 =

ˆ ˆ
( p1 − p2 ) − ( p1 − p2 )
p1q1 p2 q2
+
m
n

X
X1
ˆ
p2 = 2
n
m ,

Donde
, q1 = 1-p1 y q2 = 1-p2 se distribuye aproximadamente
ˆ
ˆ
como una normal estándar cuando n y m son grandes tal que, mp1 y np 2 son
mayores que 5.
2
Si la hipótesis nula Ho: p1 = p2 es cierta, entonces el estadístico mencionado
anteriormente se convierte en:

z=

donde, p es estimado por p =

ˆ ˆ
p1 − p2
⎛ 1 1⎞
p q⎜ + ⎟
⎝m n⎠

X1 + X 2
. Luego, las fórmulas para pruebas de
m+n

hipótesis serán como siguen:

3
Dócima para una diferencia de proporciones
Caso I
Ho : p
Ha : p

1

= p2

1

Caso II
Ho : p = p
Ha : p ≠ p

< p2

1

1

2

Caso III
Ho : p = p
Ha : p > p
1

2

2

1

2

Prueba Estadística:
Z=

)
)
p1 − p 2
⎛ 1 1⎞
p(1 − p )⎜ + ⎟
⎝m n⎠

Decisión:
Si Z cal < Z entonces
se rechaza Ho
α

Si Z < Z α / 2 o Z cal> Z1−α / 2
entonces se rechaza Ho
cal

Si Z > Z 1−α
entonces se rechaza Ho
cal

4
Ejemplo
Se desea determinar si hay razones para afirmar que la proporción de
estudiantes varones es igual según su procedencia (colegio público y privado)
versus la alternativa que son diferentes. Los datos recolectados son:
Tabulated statistics: Genero, Escuela
Rows: Genero Columns: Escuela
privada pública total
F
M
total

6
8
14

Cell Contents:

5
13
18

11
21
32
Count

Nota:
Los tamaños muestrales empleados solo tienen carácter ilustrativo (es
5
pertinente que m y n ambos sean muestras grandes)
Solución
Test and CI for Two Proportions: Genero, Escuela
Event = M
Escuela X
privada 8
pública 13

N
14
18

Sample p
0.571429
0.722222

Difference = p (privada) - p (pública)
Estimate for difference: -0.150794
95% CI for difference: (-0.482474, 0.180887)
Test for difference = 0 (vs not = 0): Z = -0.89 P-Value = 0.373

6
Tamaño de muestra para probar una media
poblacional
( zα + z β ) 2 σ 2
n=
( μ1 − μ 0 ) 2
Pruebas unilaterales

( zα / 2 + z β ) 2 σ 2
n=
( μ1 − μ 0 ) 2
Prueba bilateral

Donde:
Zα = Valor correspondiente al riesgo de una cola
Zα/2= Valor correspondiente al riesgo a dos colas
Zβ = Valor correspondiente al poder o potencia.
μo = Media poblacional bajo Ho
μ1 = Media poblacional bajo Ha
σ2 = Varianza poblacional de la variable de estudio
7
8
f ( x / H1 : μ = μ1 )

f ( x / H o : μ = μo )

-

I
I

-Zα
I

μ1

Zβ

I

Zα

μ0

Zβ

9
10
Tamaño de muestra para la Comparación de
dos medias en muestras independientes
2
( zα + z β ) 2 (σ 12 + σ 2 )
n=
( μ 2 − μ1 ) 2

Donde:
Zα = Valor correspondiente al riesgo de una cola
Zβ = Valor correspondiente al poder o potencia.
μ1 = Media de la población 1 bajo Ho
μ2 = Media de la población 2 bajo Ha
σ12 = Varianza poblacional de la variable de estudio 1
σ22 = Varianza poblacional de la variable de estudio 2

11
Tamaño de muestra para la Comparación
de dos medias en muestras independientes:

12
Ejemplo
Deseamos utilizar un nuevo tipo
de publicidad y consideramos que
seria técnicamente eficaz si
lograse un aumento de las ventas
en 150 u.m. en promedio respecto
a la antigua publicidad. Por
estudios previos sabemos que la
desviación típica de las ventas
que reciben la antigua publicidad
es de 160 u.m. Aceptamos un
riesgo de 0.05 y deseamos un
poder estadístico de 90% para
detectar diferencias si es que
existen de lo que se afirma.

Solución:
d = 150
S = 160
Zα = 1,645
Zβ = 1,282

2(1,645 + 1,282) 2 *160 2
n=
150 2
n = 20

13
Tamaño de muestra para probar una
proporción poblacional

[Z
n=

α

* po (1 − po ) + Z β * p (1 − p )
( p − po ) 2

]

2

Donde:
Zα = Valor correspondiente al riesgo en una prueba unilateral.
Zβ = Valor correspondiente al poder o potencia.
po = Proporción poblacional bajo Ho.
p = Proporción poblacional bajo Ha.

14
Tamaño de muestra para la comparación
de dos proporciones

[Z
n=

α

p (1 − p ) + p (1 − p ) ]

* 2 p(1 − p ) + Z β * 1
( p1 − p2 ) 2

2

1

2

2

Donde:
Zα = Valor correspondiente al riesgo a una prueba unilateral.
Zβ = Valor correspondiente al poder o potencia.
(es recomendable esté entre el 80 a 90%)
p1 = Proporción poblacional del grupo 1
p2 = Proporción poblacional del grupo 2
p = Promedio de las proporciones (p1+p2)/2

15
Ejemplo
Se desea evaluar si un nuevo
plan de prevención (T1) es mejor
que el habitual (T2) para
minimizar los riesgos laborales.
Para lo cual se diseña un estudio.
Sabiendo que por datos previos
la eficacia del plan habitual está
alrededor del 70% y se considera
relevante si el nuevo plan
minimiza el riesgo laboral en
90%. El nivel de significación es
0.05 y se desea un poder
estadístico de 80%.

[1.645 *
n=

Solución
p1 = 0,7
p2 = 0,9
Zα = 1,645
Zβ = 0,842
p =

p1 + p2
= 0,8
2

2 * 0.8(1 − 0.8) + 0.842 * 0.7(1 − 0.7) + 0.9(1 − 0.9)
(0.7 − 0.9) 2

]

2

n = 49
16
Zα
α
0.200 (80%)
0.150 (85%)
0.100 (90%)
0.050 (95%)
0.025 (97.5%

Test unilateral
0.842
1.036
1.282
1.645
1.960

Test Bilateral
1.282
1.440
1.645
1.960
2.240

0.010 (99%)

2.326

2.576

17
β

Potencia
1-β

Zβ

0,01
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45

0,99
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55

2,326
1,645
1,282
1,036
0,842
0,674
0,524
0,385
0,253
0,126
18
Ejercicios
Se sabe que los voltajes de una marca de pilas tamaño C se
distribuyen normalmente, se probó una muestra aleatoria de 15 y
se encontró que la media es de 1.4 volts con una desviación
estándar de 0.21 volts. En el nivel de significancia de 0.01:
a) ¿Indica esto que la media de los voltajes es menor que 1.5
volts?
b) Calcular la probabilidad de cometer el error tipo II si el voltaje
promedio real de las pilas es de 1.3 volts.
Solución

19
a)

20
b)

β = P( x > 1.05) = 0.15625
21
Ejercicio
Se tiene un ensayo de hipótesis unilateral derecho, con n = 20 y α =
0.05
Ho; σ = 0.10
H1; σ > 0.10
Se quiere calcular el error tipo II ó b si las desviaciones estándar
verdaderas fueran de 0.12 y 0.14.
Solución

22
23
Ejercicio
Las capas de óxido en las obleas semiconductoras son depositadas
en una mezcla de gases para alcanzar el espesor apropiado. La
variabilidad del espesor es una característica crítica de la oblea, y lo
deseable para los siguientes pasos de la fabricación es tener una
variabilidad baja. Para ello se estudian dos mezclas diferentes de
gases con la finalidad de determinar con cuál se obtienen mejores
resultados en cuanto a la reducción en la variabilidad del espesor del
óxido. Veintiún obleas son depositadas en cada gas. Las
desviaciones estándar de cada muestra del espesor del óxido son s1
= 1.96 angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que
indique una diferencia en las desviaciones? Utilice a=0.05.
Solución

24
25
Para el ejercicio anterior, encontrar la probabilidad de cometer error tipo
II si la verdadera relación es

26
Valores críticos

27

Prueba de hipotesis v6 ok

  • 1.
  • 2.
    Problema de Pruebasde Hipótesis: • Conocer si después de capacitar a un grupo de empleados sobre el manejo de un equipo, el nivel de destreza se ha incrementado. • Disminuir los impuestos reduce el fraude fiscal. • La variabilidad de los tiempos de atención es menos de una desviación estándar. • Una información sobre la proporción que representa el grupo en la población En general • Una información sobre el valor de una característica por ejemplo en el pasado que queremos comparar con el valor actual 2
  • 3.
    Hipótesis Estadística Una HipótesisEstadística es una afirmación que se hace acerca de un parámetro poblacional. Por ejemplo: el tiempo de vida promedio de un dispositivo electrónico es mayor a 1000 horas. Hipótesis nula: Afirmación establecida a priori como verdadera y que se espera sea rechazada después de aplicar una prueba estadística, se representa por Ho. Hipótesis alterna: Afirmación que se espera sea aceptada después de aplicar una prueba estadística, se representa por Ha o H1. Una prueba estadística es una fórmula, basada en la distribución del estimador del parámetro que aparece en la hipótesis y que va a permitir tomar una decisión acerca de aceptar o rechazar una hipótesis nula. 3
  • 4.
    Errores tipo Iy tipo II Hay dos tipos de errores que pueden ocurrir: El error tipo I: se comete cuando se rechaza una hipótesis nula que realmente es cierta. El error tipo II: se comete cuando se acepta una hipótesis nula que realmente es falsa. El nivel de significación (α ), es la probabilidad de cometer error tipo I, y por lo general se asume que tiene un valor de 0.05 ó 0.01. También puede ser interpretado como el área de la región que contiene todos los valores posibles de la prueba estadística para los cuales la hipótesis nula es rechazada. La probabilidad de cometer error tipo II, es representado por β y al valor 1-β se le llama la potencia de la prueba. Una buena prueba estadística es aquella que tiene una potencia de prueba alta. 4
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
    Etapas de unContraste de Hipótesis 1. Formulación de las hipótesis. 2. Se fija el nivel α de significación, o máximo error tipo I dispuestos a admitir. 3. Estadístico de prueba. Se basa al conocimiento de la distribución poblacional, los parámetros y el tamaño muestral. 4. Regla de decisión. Decidiremos cual es el valor crítico que limita la zona de aceptación y de rechazo. 5. Decisión. Comparación de los datos experimentales con el valor crítico. De llegarse a un test significativo (los que rechazan Ho), proceder a dar un intervalo de confianza para el parámetro de estudio. 9
  • 10.
    Dócima para unamedia poblacional (σ conocida) Caso I Ho : μ=μ0 Ha : μ<μ0 Caso II Ho : μ=μ0 H a : μ ≠ μ0 Caso III Ho : μ =μ0 Ha : μ >μ0 Prueba Estadística: Población ⇒ Normal Si Zcal < -Zα entonces se rechaza Ho Z = x − μo σ ~ N(0, 1) n Decisión: Si |Zcal |>Zα/2 entonces Si Zcal >Zα entonces se rechaza Ho se rechaza Ho 10
  • 11.
    Prueba de hipótesisusando “P-values” El “P-value” llamado el nivel de significación observado, es el valor de α al cual se rechazaría la hipótesis nula si se usa el valor calculado de la prueba estadística. Fórmulas para calcular “P-value”: Depende de la forma de la hipótesis alterna y del estadístico de prueba. Ejemplo Si Ha: μ >μo, entonces P-value = Prob (Z>Zcalc). Si Ha: μ <μo, entonces P-value = Prob (Z<Zcalc). Si Ha: μ ≠ μo, entonces P-value = 2Prob (Z>|Zcalc||). Cuanto más pequeño sea el P-valor mayor es la evidencia en contra de Ho. La PROBABILIDAD permite calibrar el poder de nuestras conclusiones 11
  • 12.
    Ejemplo En estudios previosse ha determinado que el nivel promedio de cantidad demandada de cierto servicio es 220 mensualmente. Un empresario piensa que en realidad el nivel es más alto de lo que se indica y para probar su afirmación se asume que la demanda es normal con desviación estándar de 13 (σ = 13). Para una muestra de 20 meses, ¿habrá suficiente evidencia estadística para apoyar la afirmación del empresario?. 217 233 218 223 235 224 225 242 245 219 238 221 216 234 217 199 226 236 202 248 12
  • 13.
    Los resultados sonlos siguientes: One-Sample Z: Demanda Test of mu = 220 vs > 220 The assumed standard deviation = 13 95% Lower Variable N Mean StDev SE Mean Bound Z P Demanda 20 225.900 13.094 2.907 221.119 2.03 0.021 Interpretación: El valor del “P-value” (el área a la derecha de 2.03) es .021 menor que el nivel de significación α =0.05, por lo tanto; se rechaza la hipótesis nula y se concluye de que sí hay evidencia estadística de que el nivel promedio de demanda es mayor de 220. O sea los resultados apoyan lo que afirma el empresario. El extremo inferior del intervalo confianza de un solo lado empieza en 221.119 que es mayor que 220. 13
  • 14.
    Dócima para unamedia poblacional (varianza desconocida) Caso I Ho : μ =μo Ha : μ<μ0 Caso II Ho : μ =μo Ha : μ ≠ μo Caso III Ho :μ =μo Ha :μ >μo Prueba Estadística: Una muestra pequeña (n < 30) tomada de la población normal t = x − μ s n o t se distribuye como una t-student con n-1 g.l. Si tcal < -tα entonces Si |tcal |>tα/2 entonces Si tcal >tα entonces se rechaza Ho se rechaza Ho se rechaza Ho 14
  • 15.
    Ejemplo Los tiempos deatención (en minutos) de 12 clientes para un servicio dado son los siguientes: 3.1 0.9 2.8 4.3 0.6 1.4 5.8 9.9 6.3 10.4 5 11.5 Hallar un intervalo de confianza del 99 por ciento para el tiempo promedio de atención y probar la hipótesis que el tiempo promedio de atención es menor de 9 minutos. 15
  • 16.
    One-Sample T: tiempo Testof mu = 9 vs not = 9 Variable N Mean StDev SE Mean 99% CI T P tiempo 12 5.16667 3.75967 1.08532 (1.79586, 8.53747) -3.53 0.005 One-Sample T: tiempo Test of mu = 9 vs < 9 99% Upper Variable N Mean StDev SE Mean Bound T P tiempo 12 5.16667 3.75967 1.08532 8.11666 -3.53 0.002 Interpretación: El valor del “P-value” es .002 menor que el nivel de significación α=0.01, por lo tanto; se rechaza la hipótesis nula y se concluye de que sí hay evidencia estadística de que el tiempo promedio de atención es menor de 9. El extremo superior del intervalo confianza de un solo lado empieza en 8.11666 que es menor que 9. 16
  • 17.
    Potencia de untest. Sea el contraste Ho:θ=θo H1:θ∈Ω. El contraste se realiza eligiendo una medida de discrepancia y un nivel de significación α, con estos elementos el problema queda totalmente establecido. Llamaremos potencia de un contraste a la función: Potencia (θ)=π(θ)=P(Rechazar Ho / θ). Se dan dos situaciones: θ=θo ⇒ π(θ)=P(Rechazar Ho / θ=θo) = α. θ≠θo⇒ π(θ)=P(Rechazar Ho / θ≠θo) = 1- P(Aceptar Ho / θ≠θo) = 1-β(θ). Al desconocerse el verdadero valor de θ, la potencia de un test (excepto en el caso de que ambas hipótesis sean simples) no puede calcularse exactamente, pero si podemos representar esta función para los distintos y posibles valores del parámetro θ. 17
  • 18.
  • 19.
    Inferencia para Proporciones Cuandoestamos interesados en estimar la proporción P (o el porcentaje) de ocurrencia de un evento. Se necesita definir una variable aleatoria X que indique el número de veces que ocurre el evento en una muestra de tamaño n y con probabilidad de éxito, π. Se puede mostrar que cuando el tamaño de muestra es grande, tal que nπ > 5, entonces el estadístico Z = P − π π (1 − π ) n se distribuye aproximadamente como una normal estándar. Aquí π representa la proporción poblacional que se desea estimar, la proporción muestral es: P= x n 19
  • 20.
    Dócima para unaproporción Caso I Ho : π=π0 Ha : π <π0 Caso II Ho :π=π0 Ha :π ≠π0 Caso III Ho : π=π0 Ha : π >π0 Prueba Estadística (Aproximada) Población ⇒ Binomial Z= (P − π 0 ) π 0 (1 − π 0 ) n ~ N(0, 1) Decisión Si Zcal <-Zα entonces Si |Zcal |>Zα / 2 entonces Si Zcal >Zα entonces se rechaza Ho se rechaza Ho se rechaza Ho 20
  • 21.
    Ejemplo En 1995 enuna zona metropolitana, se reportó que dos de cada 5 personas reunían el perfil del consumidor de cierto bien. En una encuesta reciente hecha en 2005 a 1225 personas se encontró que 478 de ellos coincidían con dicho perfil. ¿Piensa usted que existe evidencia para afirmar de que el perfil del consumidor ha cambiado con respecto a 1995? Utilice γ = 0.90 Solución: Hay que hallar un intervalo de confianza del 90% para la proporción p, y probar la siguiente hipótesis: H 0 : π = 0.4 (la proporción no cambió de 1995 a 2005). H a : π ≠ 0.4 (la proporción cambió de 1995 a 2005). 21
  • 22.
    Test and CIfor One Proportion Test of p = 0.4 vs p not = 0.4 Sample X N Sample p 1 478 1225 0.390204 90% CI Z-Value P-Value (0.367280, 0.413128) -0.70 0.484 Interpretación: Viendo que el “P-value” es 0.484 mucho mayor que 0.10 se llega a la conclusión de que no hay suficiente evidencia de que la proporción de personas con el perfil deseado haya cambiado de 1995 a 2005. 22
  • 23.
    Dócima para laVarianza Poblacional Asumiendo que la población de donde se extrae la muestra se distribuye normalmente se pueden hacer las siguientes hipótesis acerca de la varianza poblacional: Caso I Ho : σ2 = σ Ha : σ2 < σ Caso II Ho : σ2 = σ Ha : σ2 ≠ σ 2 0 2 0 Caso III Ho : σ2 = σ Ha : σ2 > σ 2 0 2 0 Prueba Estadística: (n − 1) s 2 0 2 0 Ha : σ2 > σ 2 0 2 χ2 = σ 2 0 α con n-1 g.l. χ2α, (n-1) Decisión: Si χ < χ entonces se rechaza Ho 2 cal 2 α Si χ < χ ó χ > se rechaza Ho 2 cal 2 α /2 2 cal 2 χ 1−α / 2 Si χ > χ se rechaza Ho 2 cal 2 1−α 23
  • 24.
    Ejemplo Los siguientes datosrepresentan utilidades netas mensuales (miles de nuevos soles) por exportaciones de una empresa durante 20 meses: 80 87 78 90 81 95 85 87 77 82 61 52 75 73 58 84 70 85 84 70 Probar si hay suficiente evidencia para concluir que la desviación estándar poblacional sea mayor que 10,000 nuevos soles. Usar un nivel de significación del 5 por ciento. 24
  • 25.
    Solución: Se desea probar: Ho: σ2 = 100 Ha : σ2 > 100 El valor de la prueba estadística es: χ2 = (19)(122.116)/100 = 23.2020 Que comparado con χ2tab = 30.1435 (con 19 g.l.) resulta ser menor. Equivalentemente a: p-value = P(χ2 > 23.2020) =0.228562 > 0.05 Luego, no hay evidencia suficiente para rechazar la hipótesis nula. Al 5 % de significación, la varianza poblacional no parece ser mayor que 100. 25
  • 26.
    Comparando la varianzade dos poblaciones Supongamos que se tienen dos poblaciones normales con varianzas 2 desconocidas σ 2 y σ 2 1 Si de la primera población se toma una muestra de tamaño m que tiene 2 una varianza muestral s 1 y de la segunda población se toma una muestra, independiente de la primera, de tamaño n que tiene una varianza muestral 2 s2 Se puede mostrar que la razón s12 σ12 2 2 s2 σ 2 se distribuye como una F con m-1 grados de libertad en el numerador y n-1 en el denominador. 26
  • 27.
    Caso I 2 Ho :σ 12 = σ 2 Caso II Caso III 2 2 Ho : σ 1 = σ 2 2 Ha : σ 12 > σ 2 2 2 Ho : σ1 = σ 2 2 Ha : σ 12 ≠ σ 2 Ha : σ 12 < σ 22 Prueba Estadística: s12 F= 2 s2 Ha: σ21>σ22 α Fm-1, n-1:α con m-1 g.l. en el numerador y n-1 g.l en el denominador Decisión: Si Fcal<Fα entonces se rechaza Ho Si Fcal<Fα/2 o Fcal >F1-α/2 se rechaza Ho Si Fcal>F1-α entonces se rechaza Ho 27
  • 28.
  • 29.
    Ejemplo Se trata decomparar la variabilidad de ingresos por concepto de ventas en dos empresas, los datos son: item ingresos empresa 1 58.0 A 2 63.8 A 3 64.2 B 4 70.4 A 5 76.7 B 6 64.1 B 7 72.1 B 8 62.5 B 9 69.4 A 10 61.5 A 11 61.7 A 12 62.3 A 13 68.9 B 14 68.9 A 29
  • 30.
    Test for EqualVariances: ingresos versus empresa 95% Bonferroni confidence intervals for standard deviations empresa N Lower StDev Upper A 8 2.82368 4.51347 10.3380 B 6 3.24522 5.53477 15.8347 F-Test (normal distribution) Test statistic = 0.67, p-value = 0.601 Levene's Test (any continuous distribution) Test statistic = 0.30, p-value = 0.594 30
  • 31.
    Test for EqualVariances for ingresos F-Test Test Statistic P-Value empresa A 0.67 0.601 Lev ene's Test Test Statistic P-Value B 2 4 6 8 10 12 14 95% Bonferroni Confidence Intervals for StDevs 0.30 0.594 16 empresa A B 60 64 68 ingresos 72 76 Interpretación: El “p-value” de la prueba F es 0.601 mucho mayor que 0.05, luego se acepta la hipótesis nula y se concluye que la variabilidad de ingresos en las dos empresas tienen igual varianza. 31
  • 32.
    Comparación entre dosmedias poblacionales usando muestras independientes Supongamos que se tienen dos poblaciones distribuidas normalmente con medias desconocidas μ1 y μ2, respectivamente. Se puede aplicar una prueba t de Student para comparar las medias de dichas poblaciones basándonos en dos muestras independientes tomadas de ellas. Si m < 30 y n < 30 con varianzas desconocidas se tiene: a) Varianzas de las poblaciones iguales: ( σ 12 = σ 22 = σ 2 ) entonces se puede mostrar que: t= ( x − y ) − ( μ1 − μ 2 ) sp 1 1 + m n se distribuye como una t con m + n - 2 grados de libertad. 32
  • 33.
    la varianza poblacionales estimada por una varianza combinada de las varianzas de las dos muestras tomadas. 2 (m − 1) s12 + (n − 1) s 2 s2 = p m+n−2 33
  • 34.
    2 b) Varianzas delas poblaciones no son iguales: ( σ 12 ≠ σ 2 ) entonces se usa una prueba aproximada de t, donde el número de grados de libertad es calculado aproximadamente. La prueba de t aproximada está dada por: t= x − y − (μ1 − μ 2 ) 2 s12 s2 + m n donde los grados de libertad (gl) son aproximados por la siguiente fórmula: (c1 + c 2 ) 2 gl = 2 2 c1 c2 + m −1 n −1 Con s12 c1 = m y 2 s2 c2 = n 34
  • 35.
    Las pruebas dehipótesis son: Caso I Caso II Ho : μ1 = μ 2 Ho : μ1 = μ 2 Ha : μ1 < μ 2 Ha : μ1 ≠ μ 2 Caso III Ho : μ1 = μ 2 Ha : μ1 > μ 2 Prueba Estadística: x−y t= sp Decisión: Si t cal < − tα entonces se rechaza Ho 1 1 + m n t= o x−y 2 s12 s 2 + m n Si t cal < tα / 2 o t cal > t1−α / 2 se rechaza Ho Si t cal > t1−α se rechaza Ho 35
  • 36.
    Ejemplo Se realizó unexperimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con α = 0.05 si existe diferencia entre los tiempos promedio y obtenga el valor de P. Suponga varianzas iguales. 36
  • 37.
    Solución Primero se pondráa prueba el supuesto de varianzas iguales mediante una prueba de hipótesis con α = 0.10. 37
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
    Dócima para muestrasrelacionadas Caso I Ho : μd = 0 Ha : μd < 0 Caso II Ho : μd = 0 Ha : μd ≠ 0 Caso III Ho : μ d = 0 Ha : μd > 0 (Si n < 30 y desviación estándar desconocida) Prueba Estadística: d t= sd se distribuye como una t de Student con n-1 gl. n Decisión: Si t<-tα entonces se rechaza Ho Si | t |>tα/2 entonces se rechaza Ho Si tcal >tα entonces se rechaza Ho 46
  • 47.
    Ejemplo Se ha evaluadoel nivel de conocimientos a un grupo de estudiantes sobre un tema en particular antes de una capacitación. Las puntuaciones varían entre un mínimo de 0 y un máximo de 15. Pasados tres meses después de la capacitación, los mismos 10 estudiantes repiten el proceso de evaluación. Según los resultados obtenidos que se muestran en la tabla, ¿hay razones para afirmar que los estudiantes después de estos tres meses aumentaron su nivel de conocimientos? . Estudiante Test 1 Test 2 1 13.2 14 2 8.2 8.8 3 10.9 11.2 4 14.3 14.2 5 10.7 11.8 6 6.6 6.4 7 9.5 9.8 8 10.8 11.3 9 8.8 9.3 10 13.3 13.6 47
  • 48.
    Paired T-Test andCI: Test 1, Test 2 Paired T for test 1 – test 2 N Mean Test 1 10 10.6300 Test 2 10 11.0400 Difference: 10 -0.410000 StDev SE Mean 2.4513 0.7752 2.5185 0.7964 0.387155 0.122429 95% upper bound for mean difference: -0.185574 T-Test of mean difference = 0 (vs < 0): T-Value = -3.35 P-Value = 0.004 Interpretación: El “p-value” de la prueba t es 0.004 menor que 0.05, luego se rechaza la hipótesis nula y se concluye que los estudiantes han incrementado su nivel de conocimientos. 48
  • 49.
    Comparando dos proporciones Algunasveces se desea comparar la proporción con que ocurre un mismo evento en dos poblaciones distintas. Esto conlleva a hacer inferencias acerca de la diferencia p1 - p2. Supongamos que de una de las poblaciones sacamos una muestra de tamaño m, y que en ella ocurre el evento X1 veces, y de la segunda población sacamos una muestra de tamaño n y que en ella ocurre el evento X2 veces. Se puede mostrar que el siguiente estadístico: z= ˆ p1 = ˆ ˆ ( p1 − p2 ) − ( p1 − p2 ) p1q1 p2 q2 + m n X X1 ˆ p2 = 2 n m , Donde , q1 = 1-p1 y q2 = 1-p2 se distribuye aproximadamente ˆ ˆ como una normal estándar cuando n y m son grandes tal que, mp1 y np 2 son mayores que 5. 2
  • 50.
    Si la hipótesisnula Ho: p1 = p2 es cierta, entonces el estadístico mencionado anteriormente se convierte en: z= donde, p es estimado por p = ˆ ˆ p1 − p2 ⎛ 1 1⎞ p q⎜ + ⎟ ⎝m n⎠ X1 + X 2 . Luego, las fórmulas para pruebas de m+n hipótesis serán como siguen: 3
  • 51.
    Dócima para unadiferencia de proporciones Caso I Ho : p Ha : p 1 = p2 1 Caso II Ho : p = p Ha : p ≠ p < p2 1 1 2 Caso III Ho : p = p Ha : p > p 1 2 2 1 2 Prueba Estadística: Z= ) ) p1 − p 2 ⎛ 1 1⎞ p(1 − p )⎜ + ⎟ ⎝m n⎠ Decisión: Si Z cal < Z entonces se rechaza Ho α Si Z < Z α / 2 o Z cal> Z1−α / 2 entonces se rechaza Ho cal Si Z > Z 1−α entonces se rechaza Ho cal 4
  • 52.
    Ejemplo Se desea determinarsi hay razones para afirmar que la proporción de estudiantes varones es igual según su procedencia (colegio público y privado) versus la alternativa que son diferentes. Los datos recolectados son: Tabulated statistics: Genero, Escuela Rows: Genero Columns: Escuela privada pública total F M total 6 8 14 Cell Contents: 5 13 18 11 21 32 Count Nota: Los tamaños muestrales empleados solo tienen carácter ilustrativo (es 5 pertinente que m y n ambos sean muestras grandes)
  • 53.
    Solución Test and CIfor Two Proportions: Genero, Escuela Event = M Escuela X privada 8 pública 13 N 14 18 Sample p 0.571429 0.722222 Difference = p (privada) - p (pública) Estimate for difference: -0.150794 95% CI for difference: (-0.482474, 0.180887) Test for difference = 0 (vs not = 0): Z = -0.89 P-Value = 0.373 6
  • 54.
    Tamaño de muestrapara probar una media poblacional ( zα + z β ) 2 σ 2 n= ( μ1 − μ 0 ) 2 Pruebas unilaterales ( zα / 2 + z β ) 2 σ 2 n= ( μ1 − μ 0 ) 2 Prueba bilateral Donde: Zα = Valor correspondiente al riesgo de una cola Zα/2= Valor correspondiente al riesgo a dos colas Zβ = Valor correspondiente al poder o potencia. μo = Media poblacional bajo Ho μ1 = Media poblacional bajo Ha σ2 = Varianza poblacional de la variable de estudio 7
  • 55.
  • 56.
    f ( x/ H1 : μ = μ1 ) f ( x / H o : μ = μo ) - I I -Zα I μ1 Zβ I Zα μ0 Zβ 9
  • 57.
  • 58.
    Tamaño de muestrapara la Comparación de dos medias en muestras independientes 2 ( zα + z β ) 2 (σ 12 + σ 2 ) n= ( μ 2 − μ1 ) 2 Donde: Zα = Valor correspondiente al riesgo de una cola Zβ = Valor correspondiente al poder o potencia. μ1 = Media de la población 1 bajo Ho μ2 = Media de la población 2 bajo Ha σ12 = Varianza poblacional de la variable de estudio 1 σ22 = Varianza poblacional de la variable de estudio 2 11
  • 59.
    Tamaño de muestrapara la Comparación de dos medias en muestras independientes: 12
  • 60.
    Ejemplo Deseamos utilizar unnuevo tipo de publicidad y consideramos que seria técnicamente eficaz si lograse un aumento de las ventas en 150 u.m. en promedio respecto a la antigua publicidad. Por estudios previos sabemos que la desviación típica de las ventas que reciben la antigua publicidad es de 160 u.m. Aceptamos un riesgo de 0.05 y deseamos un poder estadístico de 90% para detectar diferencias si es que existen de lo que se afirma. Solución: d = 150 S = 160 Zα = 1,645 Zβ = 1,282 2(1,645 + 1,282) 2 *160 2 n= 150 2 n = 20 13
  • 61.
    Tamaño de muestrapara probar una proporción poblacional [Z n= α * po (1 − po ) + Z β * p (1 − p ) ( p − po ) 2 ] 2 Donde: Zα = Valor correspondiente al riesgo en una prueba unilateral. Zβ = Valor correspondiente al poder o potencia. po = Proporción poblacional bajo Ho. p = Proporción poblacional bajo Ha. 14
  • 62.
    Tamaño de muestrapara la comparación de dos proporciones [Z n= α p (1 − p ) + p (1 − p ) ] * 2 p(1 − p ) + Z β * 1 ( p1 − p2 ) 2 2 1 2 2 Donde: Zα = Valor correspondiente al riesgo a una prueba unilateral. Zβ = Valor correspondiente al poder o potencia. (es recomendable esté entre el 80 a 90%) p1 = Proporción poblacional del grupo 1 p2 = Proporción poblacional del grupo 2 p = Promedio de las proporciones (p1+p2)/2 15
  • 63.
    Ejemplo Se desea evaluarsi un nuevo plan de prevención (T1) es mejor que el habitual (T2) para minimizar los riesgos laborales. Para lo cual se diseña un estudio. Sabiendo que por datos previos la eficacia del plan habitual está alrededor del 70% y se considera relevante si el nuevo plan minimiza el riesgo laboral en 90%. El nivel de significación es 0.05 y se desea un poder estadístico de 80%. [1.645 * n= Solución p1 = 0,7 p2 = 0,9 Zα = 1,645 Zβ = 0,842 p = p1 + p2 = 0,8 2 2 * 0.8(1 − 0.8) + 0.842 * 0.7(1 − 0.7) + 0.9(1 − 0.9) (0.7 − 0.9) 2 ] 2 n = 49 16
  • 64.
    Zα α 0.200 (80%) 0.150 (85%) 0.100(90%) 0.050 (95%) 0.025 (97.5% Test unilateral 0.842 1.036 1.282 1.645 1.960 Test Bilateral 1.282 1.440 1.645 1.960 2.240 0.010 (99%) 2.326 2.576 17
  • 65.
  • 66.
    Ejercicios Se sabe quelos voltajes de una marca de pilas tamaño C se distribuyen normalmente, se probó una muestra aleatoria de 15 y se encontró que la media es de 1.4 volts con una desviación estándar de 0.21 volts. En el nivel de significancia de 0.01: a) ¿Indica esto que la media de los voltajes es menor que 1.5 volts? b) Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de las pilas es de 1.3 volts. Solución 19
  • 67.
  • 68.
    b) β = P(x > 1.05) = 0.15625 21
  • 69.
    Ejercicio Se tiene unensayo de hipótesis unilateral derecho, con n = 20 y α = 0.05 Ho; σ = 0.10 H1; σ > 0.10 Se quiere calcular el error tipo II ó b si las desviaciones estándar verdaderas fueran de 0.12 y 0.14. Solución 22
  • 70.
  • 71.
    Ejercicio Las capas deóxido en las obleas semiconductoras son depositadas en una mezcla de gases para alcanzar el espesor apropiado. La variabilidad del espesor es una característica crítica de la oblea, y lo deseable para los siguientes pasos de la fabricación es tener una variabilidad baja. Para ello se estudian dos mezclas diferentes de gases con la finalidad de determinar con cuál se obtienen mejores resultados en cuanto a la reducción en la variabilidad del espesor del óxido. Veintiún obleas son depositadas en cada gas. Las desviaciones estándar de cada muestra del espesor del óxido son s1 = 1.96 angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que indique una diferencia en las desviaciones? Utilice a=0.05. Solución 24
  • 72.
  • 73.
    Para el ejercicioanterior, encontrar la probabilidad de cometer error tipo II si la verdadera relación es 26
  • 74.