SlideShare una empresa de Scribd logo
1 de 76
Descargar para leer sin conexión
ESTADISTICA Y PROBABILIDADES
Tema: Pruebas de hipótesis
. Pruebas de hipótesis 1
Objetivos del tema
• Conocer el proceso para contrastar hipótesis y su relación con
el método científico.
• Diferenciar entre hipótesis nula y alternativa
• Nivel de significación
• Significación
• Toma de decisiones, tipos de error y cuantificación del error.
. Pruebas de hipótesis 2
Contrastando una hipótesis
años20X
. Pruebas de hipótesis 3
Creo que la edad
media es 40 años...
Son
demasiados...
¡Gran
diferencia!
Rechazo la
hipótesis
Muestra
aleatoria
¿Qué es una hipótesis?
• Una creencia sobre la población,
principalmente sus parámetros:
– Media
– Varianza
– Proporción/Tasa
• OJO: Si queremos contrastarla,
debe establecerse antes del
análisis.
. Pruebas de hipótesis 4
Creo que el porcentaje
de enfermos será el
5%
Identificación de hipótesis
• Hipótesis nula Ho
– La que contrastamos
– Los datos pueden refutarla
– No debería ser rechazada sin una buena
razón.
• Hipótesis. Alternativa H1
– Niega a H0
– Los datos pueden mostrar evidencia a
favor
– No debería ser aceptada sin una gran
evidencia a favor.
. Pruebas de hipótesis 5



:H
:H
1
0
0.5p 
0.5p 

 ,,
a) Hipótesis
Se debe formular el supuesto valor del parámetro de la población antes de empezar el
muestreo. La suposición que se desea probar, se denomina hipótesis nula y se
representa por H0. Si se rechaza la hipótesis nula, la conclusión que debemos
aceptar se llama hipótesis alternativa y se simboliza por H1.
Supongamos que se quiere probar la hipótesis de que el promedio de calificación de los
alumnos de cierta Universidad es de 8.5, entonces:
H0 :  = 8.5 Establece que la media de la población es igual a 8.5
La hipótesis alternativa se puede interpretar de tres maneras:
H1 :   8.5 Establece que la media de la población no es igual a 8.5.
H1 :   8.5 Establece que la media de la población es mayor que 8.5.
H1 :   8.5 Establece que la media de la población es menor que 8.5.
La prueba de hipótesis tiene como finalidad emitir un juicio sobre la diferencia que
existe entre el valor calculado del estadístico muestral y el parámetro supuesto de la
población. No consiste en poner en duda el valor calculado del estadístico muestral.
Después de formular las hipótesis nula y alternativa, se debe decidir el criterio que se va
a aplicar para aceptar o rechazar la primera.
¿Quién es H0?
0.5p 
. Pruebas de hipótesis 7
• Problema: ¿La osteoporosis está relacionada con el
género?
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
0.5p 
0 : 0.5H p 
¿Quién es H0?
6
. Pruebas de hipótesis 8
• Problema: ¿El colesterol medio para la dieta
mediterránea es 6 mmol/l?
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
6
6:0 H
Razonamiento básico
40
20X
. Pruebas de hipótesis 9
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
¿qué hace un
científico cuando
su teoría no
coincide con sus
predicciones?
Razonamiento básico
40
20X
. Pruebas de hipótesis 10
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
Rechazo que H0
sea cierta.
Razonamiento básico
40
38X
. Pruebas de hipótesis 11
Si supongo que H0 es cierta...
... el resultado del experimento es coherente.
• No hay evidencia contra H0
•No se rechaza H0
•El experimento no es
concluyente
•El contraste no es significativo
¿Si una teoría
hace predicciones
con éxito, queda
probado que es
cierta?
b) Nivel de significancia
Supongamos que la media de calificaciones de un
ejemplo anterior de 8.5, se expresa con un nivel de
confianza del 95%, entonces el nivel de significancia
será de 0.05, es decir:
 = 1 – 0.95
Entonces:  = 0.05 Que representa el nivel de
significancia.
Se puede comprender mejor observando la gráfica
siguiente:
El nivel de significancia está repartido en las
zonas de rechazo, 0.025 + 0.025 = 0.05,
significa que existe una diferencia significativa
entre el estadístico de la muestra y el supuesto
parámetro de la población, es decir, que si esto
se demuestra, se rechaza la hipótesis nula H0
de que el promedio de la población sea de 8.5
y se acepta la hipótesis alternativa H1.
Entonces se concluiría que el promedio de las
calificaciones de la población, no es de 8.5,
puede ser diferente, mayor o menor de 8.5.
El nivel de significancia representa la zona de
rechazo de la hipótesis nula y el nivel de
confianza de la zona de aceptación.
c) Selección de un nivel de significancia
No hay un nivel de significancia que sea
oficial o universal con el cual probar las
hipótesis. Pero la elección del criterio
mínimo de una probabilidad aceptable,
o nivel de significancia, es asimismo el
riesgo que se corre de rechazar una
hipótesis nula aunque sea verdadera.
Cuando más alto sea el nivel de
significancia que utilizamos al probar
una hipótesis, mayores probabilidades
habrá de rechazar una hipótesis nula
que sea verdadera.
Región crítica y nivel de significación
Región crítica
• Valores ‘improbables’ si...
• Es conocida antes de realizar el
experimento: resultados
experimentales que refutarían H0
Nivel de significación: α
• Número pequeño: 1% , 5%
• Fijado de antemano por el
investigador
• Es la probabilidad de rechazar H0
cuando es cierta
. Pruebas de hipótesis 16
No rechazo H0
Reg. Crit.Reg. Crit.
α=0.05
Η0: µ=40
Contrastes: unilateral y bilateral
. Pruebas de hipótesis 17
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilater
al
Bilateral
H1: µ < 40 H1: µ
>40
H1: µ 40
Significación: p
. Pruebas de hipótesis 18
H0: µ = 40
α
Significación: p
. Pruebas de hipótesis 19
43X
No se rechaza
H0: µ = 40
H0: µ = 40
α
Significación: p
. Pruebas de hipótesis 20
43X
No se rechaza
H0: µ =40
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor
del estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la
obtenida.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p>α
P
P
α
α
Significación : p
. Pruebas de hipótesis 21
α
50X
Se rechaza H0: µ =40
Se acepta H1: µ >40
Significación : p
. Pruebas de hipótesis 22
Pα
Pα
50X
Se rechaza H0: µ =40
Se acepta H1: µ >40
El contraste es estadísticamente significativo cuando p < α
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
Resumen: α, p y criterio de rechazo
• Sobre α
– Es número pequeño,
preelegido al diseñar el
experimento
– Conocido α sabemos
todo sobre la región
crítica
• Sobre p
– Es conocido tras realizar
el experimento
– Conocido p sabemos
todo sobre el resultado
del experimento
. Pruebas de hipótesis 23
 Sobre el criterio de rechazo
 El contraste es significativo si p menor que α
Resumen: α, p y criterio de rechazo
. Pruebas de hipótesis 24
 Sobre el criterio de rechazo
 Contraste significativo = p menor que α
Estadísticos de contrastea
259753,500
462319,500
-2,317
,021
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintót. (bilateral)
Edad del
encuestado
Variable de agrupación: Sexo del encuestadoa.
Ejemplo
• Problema: ¿Está sesgada la moneda?
. Pruebas de hipótesis 25



:H
:H
1
0
prob cruz 0.5
prob cruz 0.5
Experimento: Lanzar la moneda repetidamente:
P=0.5 P=0.25 P=0.125 P=0.0625 P=0.03 P=0.015
Riesgos al tomar decisiones
• H0: Hipótesis nula
– Es inocente
• H1: Hipótesis alternativa
– Es culpable
. Pruebas de hipótesis 26
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
Los datos pueden refutarla
La que se acepta si las
pruebas no indican lo
contrario
Rechazarla por error tiene
graves consecuencias
No debería ser aceptada sin una
gran evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior
Riesgos al contrastar hipótesis
• H0: Hipótesis nula
– (Ej.1) Es inocente
– (Ej.2) El nuevo tratamiento no tiene efecto
– (Ej.3) No hay nada que destacar
• H1: Hipótesis alternativa
– (Ej.1) Es culpable
– (Ej.2) El nuevo tratamiento es útil
– (Ej. 3) Hay una situación anormal
. Pruebas de hipótesis 27
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
No especulativa
Especulativa
d) Errores de tipo I y II
Si se rechaza una hipótesis nula que sea verdadera es un error
de tipo I, y su probabilidad se representa con . Si se acepta
una hipótesis nula que sea falsa se llama error de tipo II, y
su probabilidad se representa con . La probabilidad de
cometer uno de estos errores se reduce si se aumenta la
probabilidad de incurrir en otro tipo de error. A fin de
conseguir una  baja, habremos de conformarnos con una
 alta. Para sortear esto en situaciones personales y
profesionales, los encargados de tomar decisiones eligen el
nivel apropiado de significancia examinando los costos o
castigos que conllevan a ambos tipos de error.
Por ejemplo: supóngase que el cometer un error de tipo I
implica el tiempo y el trabajo de reelaborar un lote de
sustancias químicas que debería haber sido aceptado. En
cambio, el incurrir en un error de tipo II significa correr el
riesgo de que se envenene un grupo entero de usuarios de
la sustancia. La gerencia de esta compañía preferiría el error
de tipo I al de tipo II y, en consecuencia, establecería niveles
muy elevados de significancia en sus pruebas para
conseguir  bajas.
Tipos de error al tomar una
decisión
Realidad
Inocente Culpable
veredicto Inocente
OK Error
Menos grave
Culpable
Error
Muy grave
OK
. Pruebas de hipótesis 29
Tipos de error al contrastar
hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0
Correcto
El tratamiento no
tiene efecto y así se
decide.
Error de tipo II
El tratamiento si tiene efecto
pero no lo percibimos.
Probabilidad β
Rechazo H0
Acepto H1
Error de tipo
I
El tratamiento no
tiene efecto pero se
decide que sí.
Probabilidad α
Correcto
El tratamiento tiene efecto y
el experimento lo confirma.
. Pruebas de hipótesis 30
No se puede tener todo
• Para un tamaño muestral fijo, no se pueden reducir a la vez
ambos tipos de error.
• Para reducir β, hay que aumentar el tamaño muestral.
. Pruebas de hipótesis 31
α
β
Recordad lo que
pasaba con
sensibilidad y
especificidad
e) Pasos para seleccionar la distribución
correcta
1.- Se define el nivel de significancia a usar.
2.- Determinar la distribución adecuada de
probabilidad: puede ser la distribución
normal o la distribución t. Las reglas para
elegir la distribución apropiada al efectuar
pruebas de las medias son:
a. Si la muestra tomada es mayor de 30
(muestras grandes), debe elegirse la
distribución normal (Z).
b. Si la muestra tomada es igual o menor que
30 (muestras pequeñas), debe elegirse la
distribución t.
PRUEBA DE HIPÓTESIS DE LAS MEDIAS DE
MUESTRAS GRANDES
Realizaremos algunos ejemplos,
en diferentes condiciones
cuando se conocen las
desviaciones estándar de la
población.
a) Prueba de dos extremos para las
medias
Es cuando el nivel de significancia
(zona de rechazo) abarca los dos
extremos o colas de la campana de
Gauss.
Ejemplo 1.-
El fabricante de una llanta especial para camiones
afirma que la duración media de la parte
rodante de agarre es de 60,000 mi. La
desviación estándar de los millajes es de 5,000
mi. Una empresa de transportes compró 48
llantas y halló que la duración media para sus
vehículos fue de 59,500 mi. ¿Es la experiencia
distinta de la expresada por el fabricante al
nivel de significación de 0.05?
 = 60,000 mi
 = 5,000 mi
Datos: n = 48 llantas
= 59,500 mi
 = 0.05x
Solución:
Las hipótesis se expresan de la siguiente manera:
H0 :  = 60,000 mi La duración de las llantas es de 60,000 millas
H1 :   60,000 mi La duración de las llantas es distinta a 60,000
millas
Primero, vamos a calcular el error estándar de la media y para ello
emplearemos la expresión del error estándar:
n
x

 
Sustituyendo valores en ella, se tiene:
mixxx 69.721
9282.6
000,5
48
000,5
 
En el siguiente paso vamos a obtener el valor de “Z” y para ello vamos a
apoyarnos en la gráfica siguiente:
Recurrimos a las tablas de la distribución normal y en ellas
localizamos 0.475, que se ubica en un valor de Z = 1.96
En el tercer paso, vamos a determinar los límites superior
e inferior de confianza para el intervalo de la media
poblacional ya que se trata de una prueba de dos
extremos. Para ello aplicaremos la expresión siguiente:
x
Sustituyendo valores en ella, se tiene:
Lc = 60,000  1.96 (721.69)
Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas.
Li = 60,000 – 1,414.51 Li = 58,585.49 millas
Entonces la media de la población fluctúa entre
58,585.49 y 61,414.51 millas en un nivel de
confianza del 95%.
xZLc H   0
Regresemos a la gráfica anterior para ubicar los límites de
confianza y la media muestral. Con ello analizaremos si
se acepta la hipótesis nula además de verificar si es
verdadera o falsa.
La media muestral se ubica dentro de la zona de
aceptación, por lo que podemos decir que la hipótesis
nula es verdadera, pero vamos a verificar está
aseveración por medio de la expresión siguiente:
x
x
Z



__693.0
69.721
000,60500,59
X
Z
Z



Entonces la media muestral se ubica en -0.693 y
se confirma que cae en la zona de aceptación.
Concluimos que la duración media de las
llantas es muy cercana a la que afirma el
fabricante de 60,000 millas, con un nivel de
significancia de 0.05.
x
b) Prueba de un extremo para las medias
En este caso, el nivel de significancia (zona de
rechazo) sólo abarca un extremo o cola de la
campana de Gauss.
Ejemplo 2.-
Una cadena de restaurantes afirma que el tiempo
medio de espera de clientes por atender está
distribuido normalmente con una media de 3
minutos y una desviación estándar de 1 minuto. Su
departamento de aseguramiento de la calidad halló
en una muestra de 50 clientes en un cierto
establecimiento que el tiempo medio de espera era
de 2.75 minutos. Al nivel de significación de 0.05,
¿Es dicho tiempo menor de 3 minutos?
 = 3 minutos.
 = 1minutos.
Datos: n = 50 clientes.
= 2.75 minutos.
 = 0.05x
Representemos estos datos en la campana de Gauss:
Las hipótesis son:
Ho :  = 3 El tiempo promedio de espera es de 3 minutos.
H1 :   3 El tiempo promedio de espera es menor de 3 minutos.
Primero calculemos el error estándar de la media:
Ahora determinemos el valor de Z, ya que tenemos una muestra mayor de 30:
Como  = 0.05 y es una prueba de hipótesis para un extremo, en este caso, el
extremo izquierdo, entonces, el nivel de significancia está contenido en
este extremo, por lo que el nivel de confianza es 0.5 – 0.05 = 0.45 .
Buscando en las tablas de la distribución normal 0.45, encontramos que: Z=
1.64
El límite izquierdo del intervalo de confianza será:
Li = 3 – 1.64 (0.1414)
Li = 3 – 0.2319
Li = 2.768
Gráficamente esto se representa así:
1414.0
07.7
1
50
1
 xxx 
x
La media muestral 2.75, se localiza en la zona de
rechazo, por lo que se puede establecer que se
rechaza la hipótesis nula y se acepta la alternativa.
Comprobemos con :
x
x
Z



xZZZ 77.1
1414.0
25.0
1414.0
375.2





Como podemos observar 1.77 está localizado
más hacia la izquierda del límite de
confianza 1.64.
Podemos concluir que el tiempo medio de
espera de clientes por atender en este
establecimiento es menor de 3 minutos.
Ahora realizaremos un ejemplo cuando se
desconoce la desviación estándar de la
población.
Ejemplo 3.-
Una cadena grande de tiendas de autoservicio, expide su
propia tarjeta de crédito. El gerente de crédito desea
averiguar si el saldo insoluto medio mensuales mayor
que 400 dólares. El nivel de significación se fija en
0.05. Una revisión aleatoria de 172 saldos insolutos
reveló que la media muestral 407 dólares y la
desviación estándar de la muestra es 38 dólares.
¿Debería concluir ese funcionario de la media
poblacional es mayor que 400 dólares, o es razonable
suponer que la diferencia de 7 dólares (obtenida de
407- 400 = 7) se debe al azar?
 = 400 dólares.
n = 172 saldos insolutos.
Datos: = 407 dólares.
s = = 38 dólares (desviación estándar
estimada).
 = 0.05
x
ˆ
Las hipótesis son:
Ho :  = 400 dólares.
H1 :   400 dólares.
Debido a que la hipótesis alternativa
nos indica un sentido a la derecha
de la media, debemos aplicar una
prueba de una cola. Veamos la
gráfica:
Si calculamos el error estándar estimados, tenemos que:
n
x


ˆ
ˆ 
897.2ˆ
115.13
38ˆ
172
38ˆ  xxx 
Si leemos en las tablas de la distribución
normal 0.45, encontramos que: Z = 1.64
Determinando el límite superior del intervalo
de confianza, se tiene:
Ls = 400 + 1.64 (2.897)
Ls = 404.75 dólares.
Gráficamente esto ocurre:
xˆ
Comprobando con:
x
x
Z


ˆ


xZZZ ˆ416.2
897.2
7
897.2
400407



Con esto comprobamos que el valor de la
media muestral, cae dentro de la zona de
rechazo, por lo que se rechaza la
hipótesis nula y se acepta la alternativa.
Con esto el gerente de crédito debe
concluir que el saldo insoluto medio
mensuales es mayor que 400 dólares.
PRUEBAS DE HIPOTESIS DE LAS MEDIAS
DE MUESTRAS PEQUEÑAS.
a) Prueba de dos extremos para medias
Mediante el siguiente ejemplo
explicaremos el razonamiento a
seguir para demostrar una prueba
de hipótesis de dos extremos con
una muestra menor a 30, en donde
aplicaremos la distribución t.
Ejemplo 1.-
Un especialista en personal que labora en una gran
corporación, está reclutando un vasto número de
empleados para un trabajo en el extranjero. Durante la
realización de pruebas, la gerencia pregunta cómo
marchan las cosas y el especialista contesta: “Bien, creo
que la puntuación promedio en el test de actitudes será
90”. Cuando la gerencia revisa 20 de los resultados de la
prueba, averigua que la puntuación media es 84 y la
desviación estándar de esta puntuación es 11. Si la
gerencia quiere probar la hipótesis del especialista en
personal en el nivel de significancia de 0.10, ¿cuál será el
procedimiento a que recurra?
 = 90’’
n = 20
Datos: = 84
s = = 11
 = 0.10
x
Las hipótesis son:
Ho:  = 90’’
H1 :   90’’
El error estándar estimado de la media será:
46.2ˆ
472.4
11ˆ
20
11ˆ
ˆ
ˆ  xxx
n
x 


En la tabla t de Student se localiza  = 0.10 y gl = 20 – 1, o
sea gl = 19 y se encuentra que: t = 1.729
Con estos datos ya podemos determinar los limites superior
e inferior del intervalo de confianza, mediante la
expresión:
xˆ
xtLc  ˆ
Lc = 90”  1.729 (2.46) Ls = 90” + 4.246 Ls = 94.25”
Li = 90” – 1.729 (2.46) Li = 90” – 4.246 Li = 85.75”
Gráficamente esto sucede:
Como la media muestral cae en la zona de rechazo, entonces se
rechaza la hipótesis nula y se acepta la hipótesis alternativa.
Concluimos que la gerencia tiene suficientes evidencias para
demostrar que el especialista está equivocado, que la
puntuación media no es 90.
b) Prueba de un extremo para medias
Para este caso, ya sabemos que el nivel de
significancia (zona de rechazo) sólo abarca un
extremo o cola de la campana de Gauss.
Ejemplo 2.-
Una persona tomó una muestra aleatoria de 7
casas en un suburbio muy elegante de una gran
ciudad y encontró que el valor promedio
estimado del mercado era de $560,000, con
una desviación estándar de $49,000. Pruebe la
hipótesis de que, para todas las casas del área,
el valor medio estimado es de $600,000, contra
la alternativa de que sea menor que $600,000.
Use el nivel de significancia de 0.05.
n = 7 casas
= $560,000
Datos: s = = $49,000
 = $600,000
 = 0.05
x
ˆ
Las hipótesis son:
Ho :  = $600,000
H1 :   $600,000
Calculando el error estimado de la muestra, se tiene que:
52.518,18$ˆ
646.2
000,49ˆ
7
000,49ˆ
ˆ
ˆ  xxx
n
x 


Sabemos que el nivel de significancia es de 0.05, para una
cola, por lo que se supone, que si fuera una prueba para
dos colas, cada una tendría 0.05, es decir, el nivel de
significancia  = 0.10. Por lo tanto 0.10 es el valor que
debemos localizar en la tabla correspondiente de la
distribución t de Student, con 6 grados de libertad (7 – 1).
Encontramos entonces que t = 1.943
Con estos datos, ya podemos determinar el límite inferior del
intervalo de confianza en donde se encuentra la
verdadera media de la población.
xˆ
xtLi  ˆ
Li = 600,000 – 1.943 (18,518.52) Li = $564,018.52
En la campana de Gauss:
Como la media muestral cae la zona de rechazo, entonces
se rechaza la hipótesis nula y se acepta la hipótesis
alternativa.
Comprobando lo anterior, se tiene que:
Podemos concluir que el valor medio estimado
del valor de todas las casas es menor de
$600,000.
xZZZ 16.2
52.518,18
000,40
52.518,18
000,600000,560





PRUEBA DE HIPOTESIS PARA
PROPORCIONES
a) Prueba de dos extremos para proporciones.
La prueba de hipótesis para proporciones, tiene
algunas variantes en la demostración de las
hipótesis respecto a la prueba de hipótesis de
medias, variantes que se irán explicando
conforme se vayan aplicando.
Ejemplo 1.-
Una compañía que está evaluando la promovibilidad de sus
empleados; es decir, está determinando la proporción de
aquellos cuya habilidad, preparación y experiencia en la
supervisión los clasifica para un ascenso a niveles superiores
de la jerarquía. El director de recursos humanos le dice al
presidente que el 80%,o sea el 0.8, de los empleados son
“promovibles”. El presidente crea un comité especial para
valorar la promovibilidad de todo el personal. El comité realiza
entrevistas en profundidad con 150 empleados y en su juicio
se da cuenta que sólo el 70% de la muestra llena los requisitos
de la promoción. El presidente quiere probar, en un nivel de
significancia de 0.05, la hipótesis de que 0.8 de los empleados
pueden ser promovidos.
p = 0.8
q = 0.2
Datos: n = 150
= 0.7
= 0.3
 = 0.05
p
q
Las hipótesis son:
Ho : p = 0.8 80% de los empleados son promovibles.
H1 : p  0.8 La proporción de empleados promovibles no
es 80%.
Primero calculamos el error estándar de la proporción,
mediante la siguiente expresión:
n
qp HH 00

Sustituyendo valores:
0327.00010666.0
150
)2)(.8(.
 ppp 
En este caso, la compañía quiere saber si la verdadera
proporción es mayor o menor que la supuesta
proporción. Por consiguiente, es apropiada una prueba
de dos extremos para una proporción. El nivel de
significancia corresponde a las dos regiones
sombreadas, cada una de las cuales contiene 0.025 del
área. La región de aceptación de 0.95 se ilustra como
dos áreas de 0.475 cada una. Puesto que la muestra es
mayor que 30, podemos recurrir la distribución normal.
Basándonos en la tabla de ésta distribución, podemos
calcular que el valor correspondiente de Z para 0.475
del área bajo la curva es 1.96 . Por tanto, los limites de
la región de aceptación son:
Lc = PH0  Z
Lc = 0.8  1.96(0.0327)
Ls = 0.8 + 0.06409 Ls = 0.8641
Li = 0.8 – 0.06409 Li = 0.7359
Viéndolo en la campana de Gauss:

La probabilidad de la muestra = 0.7, se
localiza en la zona de rechazo, por lo que
se rechaza la hipótesis nula y se acepta
la alternativa. Vamos a demostrarlo:
p
pZZZ 058.3
0327.0
1.0
0327.0
8.07.0





Podemos concluir que existe una
diferencia significativa entre la supuesta
proporción de empleados promovibles
comunicada por el director de recursos
humanos y la observada en la muestra,
la proporción de toda la compañía no es
del 80%.
b) Prueba de un extremo para
proporciones
Ejemplo 2.- Un artículo reciente en el periódico
Reforma reportó que un empleado está
disponible sólo para que uno de tres egresados
universitarios con grado. Las principales razones
aportadas fueron que existe una
sobreabundancia de graduados de universidad y
una economía débil. Suponga que una encuesta
con 200 graduados recientes de la institución de
usted, revela que 80 estudiantes tenían empleo.
Al nivel de significancia de 0.02, ¿se puede
concluir que una proporción mayor de
estudiantes egresados tienen trabajo?
p = 0.8
q = 0.2
Datos: n = 150
= 0.7
= 0.3
 = 0.05
p
q
Las hipótesis son:
Ho : p = 0.3333
H1 : p  0.3333
Calcularemos primero el error estándar de la proporción:
n
qp
p
HoHo

Sustituyendo valores:
0333.00011.
200
2222.0
200
)6667.0()3333.0(
 pppp 
En este caso, se quiere saber si la verdadera proporción es mayor
que la supuesta proporción. Por consiguiente, es apropiada
una prueba de un extremo para una proporción. El nivel de
significancia corresponde a la región derecha de rechazo. La
región de aceptación de 0.98 se ilustra como un área de 0.5 y
otra de 0.48 como la muestra es mayor de 30, podemos
recurrir a la distribución normal. Basándonos en la tabla de de
esta distribución el valor correspondiente de Z, para 0.48 del
área bajo la curva es 2.05, por tanto, el límite de la región de
aceptación es:
Ls = 0.3333 + 2.05 (0.0333) Ls = 0.3333 + 0.068265 Ls =
0.4016
Como = 0.4, y es menor que 0.4016, se localiza en la zona de
aceptación, entonces, se acepta la hipótesis nula.
Demostrando lo anterior se tiene:
p
p
pp
Z



pZZZ 003.2
0333.0
0667.0
0333.0
3333.04.0



En la campana de Gauss:
Concluimos que no es mayor la proporción de
estudiantes egresados que tienen trabajo.
C) Prueba de hipótesis para proporciones de muestras
pequeñas.
Si usamos la distribución t para una prueba hipótesis para proporciones en
muestras pequeñas, de dos colas, seguimos el mismo procedimiento que
se utilizó en la prueba para medias de muestras pequeñas.
Lo mismo sucede si se trata de una prueba de un extremo, recordando que,
para obtener el valor apropiado de t en un nivel de significancia de 0.05
con 10 grados de libertad, buscaremos en la tabla de la distribución t bajo
la columna 0.10, frente al renglón 10 grados de libertad. Esto es verdad
porque la columna 0.10 del área bajo la curva contenida en ambos
extremos combinados; por ello también representa 0.05 del área bajo la
curva contenida en cada uno de los extremos. Por esta razón en lugar de
buscar en la columna 0.05, se busca 0.10.
Conclusiones
• Las hipótesis no se plantean después de observar los datos.
• En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:
– H0 : Hipótesis científicamente más simple.
– H1 : El peso de la prueba recae en ella.
• α debe ser pequeño
• Rechazar una hipótesis consiste en observar si p < α
• Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I
• No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II
• Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos.
. Pruebas de hipótesis 75
¿Qué hemos visto?
• Hipótesis
– Nula
– Alternativa
• Nivel de significación
– α
– Probabilidad de error de tipo I
• Significación, p.
– Criterio de aceptación / rechazo.
• Tipos de error
– Tipo I
– Tipo II
. Pruebas de hipótesis 76

Más contenido relacionado

La actualidad más candente

Tamaño de muestra para diferencia de dos medias y dos proporciones
Tamaño de muestra para diferencia de dos medias  y dos proporcionesTamaño de muestra para diferencia de dos medias  y dos proporciones
Tamaño de muestra para diferencia de dos medias y dos proporcionesDomingo de la Cerda
 
Pruebas de hipótesis
Pruebas de hipótesisPruebas de hipótesis
Pruebas de hipótesismariauparela
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisCarol Ramos
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesiseraperez
 
Estimacion de parametros
Estimacion de parametrosEstimacion de parametros
Estimacion de parametrosUFRO
 
Ejemplos resueltos de funciones especiales
Ejemplos resueltos de funciones especialesEjemplos resueltos de funciones especiales
Ejemplos resueltos de funciones especialesOrbelith Murillo
 
Ejercicios hipótesis
Ejercicios hipótesisEjercicios hipótesis
Ejercicios hipótesisDany Aguilera
 
Diagrama de cajas y datos atípicos
Diagrama de cajas y datos atípicosDiagrama de cajas y datos atípicos
Diagrama de cajas y datos atípicosnchacinp
 
Distribucion de poisson
Distribucion de poissonDistribucion de poisson
Distribucion de poissoncathycontreras
 
Pruebas de unilaterales y bilaterales
Pruebas de unilaterales y bilateralesPruebas de unilaterales y bilaterales
Pruebas de unilaterales y bilateralessandraaldazca
 
Metodos de correlacion de spearman y pearson
Metodos de correlacion de spearman y pearsonMetodos de correlacion de spearman y pearson
Metodos de correlacion de spearman y pearsonmichacy
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisElisa Mendoza
 
REGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEALREGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEALJesús Paredes
 

La actualidad más candente (20)

Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Tamaño de muestra para diferencia de dos medias y dos proporciones
Tamaño de muestra para diferencia de dos medias  y dos proporcionesTamaño de muestra para diferencia de dos medias  y dos proporciones
Tamaño de muestra para diferencia de dos medias y dos proporciones
 
Pruebas de hipótesis
Pruebas de hipótesisPruebas de hipótesis
Pruebas de hipótesis
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Inferencia Estadística
Inferencia EstadísticaInferencia Estadística
Inferencia Estadística
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesis
 
Lista 2
Lista 2Lista 2
Lista 2
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
EstimacióN Y Prueba De HipóTesis
EstimacióN Y Prueba De HipóTesisEstimacióN Y Prueba De HipóTesis
EstimacióN Y Prueba De HipóTesis
 
Estimacion de parametros
Estimacion de parametrosEstimacion de parametros
Estimacion de parametros
 
Ejemplos resueltos de funciones especiales
Ejemplos resueltos de funciones especialesEjemplos resueltos de funciones especiales
Ejemplos resueltos de funciones especiales
 
Teorema de bayes
Teorema de bayesTeorema de bayes
Teorema de bayes
 
Ejercicios hipótesis
Ejercicios hipótesisEjercicios hipótesis
Ejercicios hipótesis
 
Diagrama de cajas y datos atípicos
Diagrama de cajas y datos atípicosDiagrama de cajas y datos atípicos
Diagrama de cajas y datos atípicos
 
Prueba de hipotesis unidad3
Prueba de hipotesis unidad3Prueba de hipotesis unidad3
Prueba de hipotesis unidad3
 
Distribucion de poisson
Distribucion de poissonDistribucion de poisson
Distribucion de poisson
 
Pruebas de unilaterales y bilaterales
Pruebas de unilaterales y bilateralesPruebas de unilaterales y bilaterales
Pruebas de unilaterales y bilaterales
 
Metodos de correlacion de spearman y pearson
Metodos de correlacion de spearman y pearsonMetodos de correlacion de spearman y pearson
Metodos de correlacion de spearman y pearson
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
REGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEALREGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEAL
 

Similar a Pruebas de hipótesis en estadística: conceptos básicos

Hipotesis
HipotesisHipotesis
HipotesisSer Ar
 
1.1 prueba de hipotesis
1.1 prueba de hipotesis1.1 prueba de hipotesis
1.1 prueba de hipotesisIng Claudia N
 
Taller Estadistica Aplicada con Estudios para la Investigación Biométrica
Taller Estadistica Aplicada con Estudios para la Investigación BiométricaTaller Estadistica Aplicada con Estudios para la Investigación Biométrica
Taller Estadistica Aplicada con Estudios para la Investigación BiométricaSabrina Guamán
 
Intervalos de confianza y pruebas de hipótesis
Intervalos de confianza y pruebas de hipótesisIntervalos de confianza y pruebas de hipótesis
Intervalos de confianza y pruebas de hipótesisrolandodesantiago
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoAriel Saenz
 
Prueba de hipotesis(1)
Prueba de hipotesis(1)Prueba de hipotesis(1)
Prueba de hipotesis(1)amy Lopez
 
Tarea tres de estadistica
Tarea tres de estadisticaTarea tres de estadistica
Tarea tres de estadisticaABJ1990
 
Test de hipotesis
Test de hipotesisTest de hipotesis
Test de hipotesisigalaz2007
 
Test de Hipótesis I
Test de Hipótesis ITest de Hipótesis I
Test de Hipótesis IHector Funes
 
Pruebas de hipotesis
Pruebas de hipotesis Pruebas de hipotesis
Pruebas de hipotesis elizareal
 
Pruebas de hipotesis
Pruebas de hipotesis Pruebas de hipotesis
Pruebas de hipotesis elizareal
 

Similar a Pruebas de hipótesis en estadística: conceptos básicos (20)

Tema 3 1 Prueba de HipóTesis
Tema 3 1 Prueba de HipóTesisTema 3 1 Prueba de HipóTesis
Tema 3 1 Prueba de HipóTesis
 
Unidad 7 Contraste de hipótesis
Unidad 7 Contraste de hipótesisUnidad 7 Contraste de hipótesis
Unidad 7 Contraste de hipótesis
 
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptxSESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
 
Hipotesis
HipotesisHipotesis
Hipotesis
 
1.1 prueba de hipotesis
1.1 prueba de hipotesis1.1 prueba de hipotesis
1.1 prueba de hipotesis
 
Capítulo viii
Capítulo viiiCapítulo viii
Capítulo viii
 
Taller Estadistica Aplicada con Estudios para la Investigación Biométrica
Taller Estadistica Aplicada con Estudios para la Investigación BiométricaTaller Estadistica Aplicada con Estudios para la Investigación Biométrica
Taller Estadistica Aplicada con Estudios para la Investigación Biométrica
 
Tarea 7
Tarea 7Tarea 7
Tarea 7
 
Intervalos de confianza y pruebas de hipótesis
Intervalos de confianza y pruebas de hipótesisIntervalos de confianza y pruebas de hipótesis
Intervalos de confianza y pruebas de hipótesis
 
RESUMEN UNIDAD 1
RESUMEN UNIDAD 1RESUMEN UNIDAD 1
RESUMEN UNIDAD 1
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesis
 
Mic sesión 7
Mic sesión 7Mic sesión 7
Mic sesión 7
 
Estadistica 28
Estadistica 28Estadistica 28
Estadistica 28
 
Prueba de hipotesis(1)
Prueba de hipotesis(1)Prueba de hipotesis(1)
Prueba de hipotesis(1)
 
Tarea tres de estadistica
Tarea tres de estadisticaTarea tres de estadistica
Tarea tres de estadistica
 
Test de hipotesis
Test de hipotesisTest de hipotesis
Test de hipotesis
 
Test de Hipótesis I
Test de Hipótesis ITest de Hipótesis I
Test de Hipótesis I
 
Pruebas de hipotesis
Pruebas de hipotesis Pruebas de hipotesis
Pruebas de hipotesis
 
Pruebas de hipotesis
Pruebas de hipotesis Pruebas de hipotesis
Pruebas de hipotesis
 

Último

OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 
6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docxCeciliaGuerreroGonza1
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxOscarEduardoSanchezC
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteJuan Hernandez
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuaDANNYISAACCARVAJALGA
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleJonathanCovena1
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 

Último (20)

OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 
6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parte
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 
La Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdfLa Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdf
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
Unidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDIUnidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDI
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahua
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo Sostenible
 
Razonamiento Matemático 1. Deta del año 2020
Razonamiento Matemático 1. Deta del año 2020Razonamiento Matemático 1. Deta del año 2020
Razonamiento Matemático 1. Deta del año 2020
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 

Pruebas de hipótesis en estadística: conceptos básicos

  • 1. ESTADISTICA Y PROBABILIDADES Tema: Pruebas de hipótesis . Pruebas de hipótesis 1
  • 2. Objetivos del tema • Conocer el proceso para contrastar hipótesis y su relación con el método científico. • Diferenciar entre hipótesis nula y alternativa • Nivel de significación • Significación • Toma de decisiones, tipos de error y cuantificación del error. . Pruebas de hipótesis 2
  • 3. Contrastando una hipótesis años20X . Pruebas de hipótesis 3 Creo que la edad media es 40 años... Son demasiados... ¡Gran diferencia! Rechazo la hipótesis Muestra aleatoria
  • 4. ¿Qué es una hipótesis? • Una creencia sobre la población, principalmente sus parámetros: – Media – Varianza – Proporción/Tasa • OJO: Si queremos contrastarla, debe establecerse antes del análisis. . Pruebas de hipótesis 4 Creo que el porcentaje de enfermos será el 5%
  • 5. Identificación de hipótesis • Hipótesis nula Ho – La que contrastamos – Los datos pueden refutarla – No debería ser rechazada sin una buena razón. • Hipótesis. Alternativa H1 – Niega a H0 – Los datos pueden mostrar evidencia a favor – No debería ser aceptada sin una gran evidencia a favor. . Pruebas de hipótesis 5    :H :H 1 0 0.5p  0.5p    ,,
  • 6. a) Hipótesis Se debe formular el supuesto valor del parámetro de la población antes de empezar el muestreo. La suposición que se desea probar, se denomina hipótesis nula y se representa por H0. Si se rechaza la hipótesis nula, la conclusión que debemos aceptar se llama hipótesis alternativa y se simboliza por H1. Supongamos que se quiere probar la hipótesis de que el promedio de calificación de los alumnos de cierta Universidad es de 8.5, entonces: H0 :  = 8.5 Establece que la media de la población es igual a 8.5 La hipótesis alternativa se puede interpretar de tres maneras: H1 :   8.5 Establece que la media de la población no es igual a 8.5. H1 :   8.5 Establece que la media de la población es mayor que 8.5. H1 :   8.5 Establece que la media de la población es menor que 8.5. La prueba de hipótesis tiene como finalidad emitir un juicio sobre la diferencia que existe entre el valor calculado del estadístico muestral y el parámetro supuesto de la población. No consiste en poner en duda el valor calculado del estadístico muestral. Después de formular las hipótesis nula y alternativa, se debe decidir el criterio que se va a aplicar para aceptar o rechazar la primera.
  • 7. ¿Quién es H0? 0.5p  . Pruebas de hipótesis 7 • Problema: ¿La osteoporosis está relacionada con el género? • Solución: – Traducir a lenguaje estadístico: – Establecer su opuesto: – Seleccionar la hipótesis nula 0.5p  0 : 0.5H p 
  • 8. ¿Quién es H0? 6 . Pruebas de hipótesis 8 • Problema: ¿El colesterol medio para la dieta mediterránea es 6 mmol/l? • Solución: – Traducir a lenguaje estadístico: – Establecer su opuesto: – Seleccionar la hipótesis nula 6 6:0 H
  • 9. Razonamiento básico 40 20X . Pruebas de hipótesis 9 Si supongo que H0 es cierta... ... el resultado del experimento sería improbable. Sin embargo ocurrió. ¿qué hace un científico cuando su teoría no coincide con sus predicciones?
  • 10. Razonamiento básico 40 20X . Pruebas de hipótesis 10 Si supongo que H0 es cierta... ... el resultado del experimento sería improbable. Sin embargo ocurrió. Rechazo que H0 sea cierta.
  • 11. Razonamiento básico 40 38X . Pruebas de hipótesis 11 Si supongo que H0 es cierta... ... el resultado del experimento es coherente. • No hay evidencia contra H0 •No se rechaza H0 •El experimento no es concluyente •El contraste no es significativo ¿Si una teoría hace predicciones con éxito, queda probado que es cierta?
  • 12. b) Nivel de significancia Supongamos que la media de calificaciones de un ejemplo anterior de 8.5, se expresa con un nivel de confianza del 95%, entonces el nivel de significancia será de 0.05, es decir:  = 1 – 0.95 Entonces:  = 0.05 Que representa el nivel de significancia. Se puede comprender mejor observando la gráfica siguiente:
  • 13.
  • 14. El nivel de significancia está repartido en las zonas de rechazo, 0.025 + 0.025 = 0.05, significa que existe una diferencia significativa entre el estadístico de la muestra y el supuesto parámetro de la población, es decir, que si esto se demuestra, se rechaza la hipótesis nula H0 de que el promedio de la población sea de 8.5 y se acepta la hipótesis alternativa H1. Entonces se concluiría que el promedio de las calificaciones de la población, no es de 8.5, puede ser diferente, mayor o menor de 8.5. El nivel de significancia representa la zona de rechazo de la hipótesis nula y el nivel de confianza de la zona de aceptación.
  • 15. c) Selección de un nivel de significancia No hay un nivel de significancia que sea oficial o universal con el cual probar las hipótesis. Pero la elección del criterio mínimo de una probabilidad aceptable, o nivel de significancia, es asimismo el riesgo que se corre de rechazar una hipótesis nula aunque sea verdadera. Cuando más alto sea el nivel de significancia que utilizamos al probar una hipótesis, mayores probabilidades habrá de rechazar una hipótesis nula que sea verdadera.
  • 16. Región crítica y nivel de significación Región crítica • Valores ‘improbables’ si... • Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Nivel de significación: α • Número pequeño: 1% , 5% • Fijado de antemano por el investigador • Es la probabilidad de rechazar H0 cuando es cierta . Pruebas de hipótesis 16 No rechazo H0 Reg. Crit.Reg. Crit. α=0.05 Η0: µ=40
  • 17. Contrastes: unilateral y bilateral . Pruebas de hipótesis 17 La posición de la región crítica depende de la hipótesis alternativa Unilateral Unilater al Bilateral H1: µ < 40 H1: µ >40 H1: µ 40
  • 18. Significación: p . Pruebas de hipótesis 18 H0: µ = 40 α
  • 19. Significación: p . Pruebas de hipótesis 19 43X No se rechaza H0: µ = 40 H0: µ = 40 α
  • 20. Significación: p . Pruebas de hipótesis 20 43X No se rechaza H0: µ =40 Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α P P α α
  • 21. Significación : p . Pruebas de hipótesis 21 α 50X Se rechaza H0: µ =40 Se acepta H1: µ >40
  • 22. Significación : p . Pruebas de hipótesis 22 Pα Pα 50X Se rechaza H0: µ =40 Se acepta H1: µ >40 El contraste es estadísticamente significativo cuando p < α Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
  • 23. Resumen: α, p y criterio de rechazo • Sobre α – Es número pequeño, preelegido al diseñar el experimento – Conocido α sabemos todo sobre la región crítica • Sobre p – Es conocido tras realizar el experimento – Conocido p sabemos todo sobre el resultado del experimento . Pruebas de hipótesis 23  Sobre el criterio de rechazo  El contraste es significativo si p menor que α
  • 24. Resumen: α, p y criterio de rechazo . Pruebas de hipótesis 24  Sobre el criterio de rechazo  Contraste significativo = p menor que α Estadísticos de contrastea 259753,500 462319,500 -2,317 ,021 U de Mann-Whitney W de Wilcoxon Z Sig. asintót. (bilateral) Edad del encuestado Variable de agrupación: Sexo del encuestadoa.
  • 25. Ejemplo • Problema: ¿Está sesgada la moneda? . Pruebas de hipótesis 25    :H :H 1 0 prob cruz 0.5 prob cruz 0.5 Experimento: Lanzar la moneda repetidamente: P=0.5 P=0.25 P=0.125 P=0.0625 P=0.03 P=0.015
  • 26. Riesgos al tomar decisiones • H0: Hipótesis nula – Es inocente • H1: Hipótesis alternativa – Es culpable . Pruebas de hipótesis 26 Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito Los datos pueden refutarla La que se acepta si las pruebas no indican lo contrario Rechazarla por error tiene graves consecuencias No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior
  • 27. Riesgos al contrastar hipótesis • H0: Hipótesis nula – (Ej.1) Es inocente – (Ej.2) El nuevo tratamiento no tiene efecto – (Ej.3) No hay nada que destacar • H1: Hipótesis alternativa – (Ej.1) Es culpable – (Ej.2) El nuevo tratamiento es útil – (Ej. 3) Hay una situación anormal . Pruebas de hipótesis 27 Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal No especulativa Especulativa
  • 28. d) Errores de tipo I y II Si se rechaza una hipótesis nula que sea verdadera es un error de tipo I, y su probabilidad se representa con . Si se acepta una hipótesis nula que sea falsa se llama error de tipo II, y su probabilidad se representa con . La probabilidad de cometer uno de estos errores se reduce si se aumenta la probabilidad de incurrir en otro tipo de error. A fin de conseguir una  baja, habremos de conformarnos con una  alta. Para sortear esto en situaciones personales y profesionales, los encargados de tomar decisiones eligen el nivel apropiado de significancia examinando los costos o castigos que conllevan a ambos tipos de error. Por ejemplo: supóngase que el cometer un error de tipo I implica el tiempo y el trabajo de reelaborar un lote de sustancias químicas que debería haber sido aceptado. En cambio, el incurrir en un error de tipo II significa correr el riesgo de que se envenene un grupo entero de usuarios de la sustancia. La gerencia de esta compañía preferiría el error de tipo I al de tipo II y, en consecuencia, establecería niveles muy elevados de significancia en sus pruebas para conseguir  bajas.
  • 29. Tipos de error al tomar una decisión Realidad Inocente Culpable veredicto Inocente OK Error Menos grave Culpable Error Muy grave OK . Pruebas de hipótesis 29
  • 30. Tipos de error al contrastar hipótesis Realidad H0 cierta H0 Falsa No Rechazo H0 Correcto El tratamiento no tiene efecto y así se decide. Error de tipo II El tratamiento si tiene efecto pero no lo percibimos. Probabilidad β Rechazo H0 Acepto H1 Error de tipo I El tratamiento no tiene efecto pero se decide que sí. Probabilidad α Correcto El tratamiento tiene efecto y el experimento lo confirma. . Pruebas de hipótesis 30
  • 31. No se puede tener todo • Para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error. • Para reducir β, hay que aumentar el tamaño muestral. . Pruebas de hipótesis 31 α β Recordad lo que pasaba con sensibilidad y especificidad
  • 32. e) Pasos para seleccionar la distribución correcta 1.- Se define el nivel de significancia a usar. 2.- Determinar la distribución adecuada de probabilidad: puede ser la distribución normal o la distribución t. Las reglas para elegir la distribución apropiada al efectuar pruebas de las medias son: a. Si la muestra tomada es mayor de 30 (muestras grandes), debe elegirse la distribución normal (Z). b. Si la muestra tomada es igual o menor que 30 (muestras pequeñas), debe elegirse la distribución t.
  • 33. PRUEBA DE HIPÓTESIS DE LAS MEDIAS DE MUESTRAS GRANDES Realizaremos algunos ejemplos, en diferentes condiciones cuando se conocen las desviaciones estándar de la población.
  • 34. a) Prueba de dos extremos para las medias Es cuando el nivel de significancia (zona de rechazo) abarca los dos extremos o colas de la campana de Gauss.
  • 35. Ejemplo 1.- El fabricante de una llanta especial para camiones afirma que la duración media de la parte rodante de agarre es de 60,000 mi. La desviación estándar de los millajes es de 5,000 mi. Una empresa de transportes compró 48 llantas y halló que la duración media para sus vehículos fue de 59,500 mi. ¿Es la experiencia distinta de la expresada por el fabricante al nivel de significación de 0.05?  = 60,000 mi  = 5,000 mi Datos: n = 48 llantas = 59,500 mi  = 0.05x
  • 36. Solución: Las hipótesis se expresan de la siguiente manera: H0 :  = 60,000 mi La duración de las llantas es de 60,000 millas H1 :   60,000 mi La duración de las llantas es distinta a 60,000 millas Primero, vamos a calcular el error estándar de la media y para ello emplearemos la expresión del error estándar: n x    Sustituyendo valores en ella, se tiene: mixxx 69.721 9282.6 000,5 48 000,5  
  • 37. En el siguiente paso vamos a obtener el valor de “Z” y para ello vamos a apoyarnos en la gráfica siguiente:
  • 38. Recurrimos a las tablas de la distribución normal y en ellas localizamos 0.475, que se ubica en un valor de Z = 1.96 En el tercer paso, vamos a determinar los límites superior e inferior de confianza para el intervalo de la media poblacional ya que se trata de una prueba de dos extremos. Para ello aplicaremos la expresión siguiente: x Sustituyendo valores en ella, se tiene: Lc = 60,000  1.96 (721.69) Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas. Li = 60,000 – 1,414.51 Li = 58,585.49 millas Entonces la media de la población fluctúa entre 58,585.49 y 61,414.51 millas en un nivel de confianza del 95%. xZLc H   0
  • 39. Regresemos a la gráfica anterior para ubicar los límites de confianza y la media muestral. Con ello analizaremos si se acepta la hipótesis nula además de verificar si es verdadera o falsa.
  • 40. La media muestral se ubica dentro de la zona de aceptación, por lo que podemos decir que la hipótesis nula es verdadera, pero vamos a verificar está aseveración por medio de la expresión siguiente: x x Z    __693.0 69.721 000,60500,59 X Z Z    Entonces la media muestral se ubica en -0.693 y se confirma que cae en la zona de aceptación. Concluimos que la duración media de las llantas es muy cercana a la que afirma el fabricante de 60,000 millas, con un nivel de significancia de 0.05. x
  • 41. b) Prueba de un extremo para las medias En este caso, el nivel de significancia (zona de rechazo) sólo abarca un extremo o cola de la campana de Gauss.
  • 42. Ejemplo 2.- Una cadena de restaurantes afirma que el tiempo medio de espera de clientes por atender está distribuido normalmente con una media de 3 minutos y una desviación estándar de 1 minuto. Su departamento de aseguramiento de la calidad halló en una muestra de 50 clientes en un cierto establecimiento que el tiempo medio de espera era de 2.75 minutos. Al nivel de significación de 0.05, ¿Es dicho tiempo menor de 3 minutos?  = 3 minutos.  = 1minutos. Datos: n = 50 clientes. = 2.75 minutos.  = 0.05x
  • 43. Representemos estos datos en la campana de Gauss: Las hipótesis son: Ho :  = 3 El tiempo promedio de espera es de 3 minutos. H1 :   3 El tiempo promedio de espera es menor de 3 minutos.
  • 44. Primero calculemos el error estándar de la media: Ahora determinemos el valor de Z, ya que tenemos una muestra mayor de 30: Como  = 0.05 y es una prueba de hipótesis para un extremo, en este caso, el extremo izquierdo, entonces, el nivel de significancia está contenido en este extremo, por lo que el nivel de confianza es 0.5 – 0.05 = 0.45 . Buscando en las tablas de la distribución normal 0.45, encontramos que: Z= 1.64 El límite izquierdo del intervalo de confianza será: Li = 3 – 1.64 (0.1414) Li = 3 – 0.2319 Li = 2.768 Gráficamente esto se representa así: 1414.0 07.7 1 50 1  xxx  x
  • 45.
  • 46. La media muestral 2.75, se localiza en la zona de rechazo, por lo que se puede establecer que se rechaza la hipótesis nula y se acepta la alternativa. Comprobemos con : x x Z    xZZZ 77.1 1414.0 25.0 1414.0 375.2      Como podemos observar 1.77 está localizado más hacia la izquierda del límite de confianza 1.64. Podemos concluir que el tiempo medio de espera de clientes por atender en este establecimiento es menor de 3 minutos.
  • 47. Ahora realizaremos un ejemplo cuando se desconoce la desviación estándar de la población.
  • 48. Ejemplo 3.- Una cadena grande de tiendas de autoservicio, expide su propia tarjeta de crédito. El gerente de crédito desea averiguar si el saldo insoluto medio mensuales mayor que 400 dólares. El nivel de significación se fija en 0.05. Una revisión aleatoria de 172 saldos insolutos reveló que la media muestral 407 dólares y la desviación estándar de la muestra es 38 dólares. ¿Debería concluir ese funcionario de la media poblacional es mayor que 400 dólares, o es razonable suponer que la diferencia de 7 dólares (obtenida de 407- 400 = 7) se debe al azar?  = 400 dólares. n = 172 saldos insolutos. Datos: = 407 dólares. s = = 38 dólares (desviación estándar estimada).  = 0.05 x ˆ
  • 49. Las hipótesis son: Ho :  = 400 dólares. H1 :   400 dólares. Debido a que la hipótesis alternativa nos indica un sentido a la derecha de la media, debemos aplicar una prueba de una cola. Veamos la gráfica:
  • 50.
  • 51. Si calculamos el error estándar estimados, tenemos que: n x   ˆ ˆ  897.2ˆ 115.13 38ˆ 172 38ˆ  xxx  Si leemos en las tablas de la distribución normal 0.45, encontramos que: Z = 1.64 Determinando el límite superior del intervalo de confianza, se tiene: Ls = 400 + 1.64 (2.897) Ls = 404.75 dólares. Gráficamente esto ocurre: xˆ
  • 52.
  • 53. Comprobando con: x x Z   ˆ   xZZZ ˆ416.2 897.2 7 897.2 400407    Con esto comprobamos que el valor de la media muestral, cae dentro de la zona de rechazo, por lo que se rechaza la hipótesis nula y se acepta la alternativa. Con esto el gerente de crédito debe concluir que el saldo insoluto medio mensuales es mayor que 400 dólares.
  • 54. PRUEBAS DE HIPOTESIS DE LAS MEDIAS DE MUESTRAS PEQUEÑAS.
  • 55. a) Prueba de dos extremos para medias Mediante el siguiente ejemplo explicaremos el razonamiento a seguir para demostrar una prueba de hipótesis de dos extremos con una muestra menor a 30, en donde aplicaremos la distribución t.
  • 56. Ejemplo 1.- Un especialista en personal que labora en una gran corporación, está reclutando un vasto número de empleados para un trabajo en el extranjero. Durante la realización de pruebas, la gerencia pregunta cómo marchan las cosas y el especialista contesta: “Bien, creo que la puntuación promedio en el test de actitudes será 90”. Cuando la gerencia revisa 20 de los resultados de la prueba, averigua que la puntuación media es 84 y la desviación estándar de esta puntuación es 11. Si la gerencia quiere probar la hipótesis del especialista en personal en el nivel de significancia de 0.10, ¿cuál será el procedimiento a que recurra?  = 90’’ n = 20 Datos: = 84 s = = 11  = 0.10 x
  • 57. Las hipótesis son: Ho:  = 90’’ H1 :   90’’ El error estándar estimado de la media será: 46.2ˆ 472.4 11ˆ 20 11ˆ ˆ ˆ  xxx n x    En la tabla t de Student se localiza  = 0.10 y gl = 20 – 1, o sea gl = 19 y se encuentra que: t = 1.729 Con estos datos ya podemos determinar los limites superior e inferior del intervalo de confianza, mediante la expresión: xˆ xtLc  ˆ Lc = 90”  1.729 (2.46) Ls = 90” + 4.246 Ls = 94.25” Li = 90” – 1.729 (2.46) Li = 90” – 4.246 Li = 85.75” Gráficamente esto sucede:
  • 58. Como la media muestral cae en la zona de rechazo, entonces se rechaza la hipótesis nula y se acepta la hipótesis alternativa. Concluimos que la gerencia tiene suficientes evidencias para demostrar que el especialista está equivocado, que la puntuación media no es 90.
  • 59. b) Prueba de un extremo para medias Para este caso, ya sabemos que el nivel de significancia (zona de rechazo) sólo abarca un extremo o cola de la campana de Gauss.
  • 60. Ejemplo 2.- Una persona tomó una muestra aleatoria de 7 casas en un suburbio muy elegante de una gran ciudad y encontró que el valor promedio estimado del mercado era de $560,000, con una desviación estándar de $49,000. Pruebe la hipótesis de que, para todas las casas del área, el valor medio estimado es de $600,000, contra la alternativa de que sea menor que $600,000. Use el nivel de significancia de 0.05. n = 7 casas = $560,000 Datos: s = = $49,000  = $600,000  = 0.05 x ˆ
  • 61. Las hipótesis son: Ho :  = $600,000 H1 :   $600,000 Calculando el error estimado de la muestra, se tiene que: 52.518,18$ˆ 646.2 000,49ˆ 7 000,49ˆ ˆ ˆ  xxx n x    Sabemos que el nivel de significancia es de 0.05, para una cola, por lo que se supone, que si fuera una prueba para dos colas, cada una tendría 0.05, es decir, el nivel de significancia  = 0.10. Por lo tanto 0.10 es el valor que debemos localizar en la tabla correspondiente de la distribución t de Student, con 6 grados de libertad (7 – 1). Encontramos entonces que t = 1.943 Con estos datos, ya podemos determinar el límite inferior del intervalo de confianza en donde se encuentra la verdadera media de la población. xˆ xtLi  ˆ Li = 600,000 – 1.943 (18,518.52) Li = $564,018.52 En la campana de Gauss:
  • 62.
  • 63. Como la media muestral cae la zona de rechazo, entonces se rechaza la hipótesis nula y se acepta la hipótesis alternativa. Comprobando lo anterior, se tiene que: Podemos concluir que el valor medio estimado del valor de todas las casas es menor de $600,000. xZZZ 16.2 52.518,18 000,40 52.518,18 000,600000,560     
  • 64. PRUEBA DE HIPOTESIS PARA PROPORCIONES a) Prueba de dos extremos para proporciones. La prueba de hipótesis para proporciones, tiene algunas variantes en la demostración de las hipótesis respecto a la prueba de hipótesis de medias, variantes que se irán explicando conforme se vayan aplicando.
  • 65. Ejemplo 1.- Una compañía que está evaluando la promovibilidad de sus empleados; es decir, está determinando la proporción de aquellos cuya habilidad, preparación y experiencia en la supervisión los clasifica para un ascenso a niveles superiores de la jerarquía. El director de recursos humanos le dice al presidente que el 80%,o sea el 0.8, de los empleados son “promovibles”. El presidente crea un comité especial para valorar la promovibilidad de todo el personal. El comité realiza entrevistas en profundidad con 150 empleados y en su juicio se da cuenta que sólo el 70% de la muestra llena los requisitos de la promoción. El presidente quiere probar, en un nivel de significancia de 0.05, la hipótesis de que 0.8 de los empleados pueden ser promovidos. p = 0.8 q = 0.2 Datos: n = 150 = 0.7 = 0.3  = 0.05 p q
  • 66. Las hipótesis son: Ho : p = 0.8 80% de los empleados son promovibles. H1 : p  0.8 La proporción de empleados promovibles no es 80%. Primero calculamos el error estándar de la proporción, mediante la siguiente expresión: n qp HH 00  Sustituyendo valores: 0327.00010666.0 150 )2)(.8(.  ppp 
  • 67. En este caso, la compañía quiere saber si la verdadera proporción es mayor o menor que la supuesta proporción. Por consiguiente, es apropiada una prueba de dos extremos para una proporción. El nivel de significancia corresponde a las dos regiones sombreadas, cada una de las cuales contiene 0.025 del área. La región de aceptación de 0.95 se ilustra como dos áreas de 0.475 cada una. Puesto que la muestra es mayor que 30, podemos recurrir la distribución normal. Basándonos en la tabla de ésta distribución, podemos calcular que el valor correspondiente de Z para 0.475 del área bajo la curva es 1.96 . Por tanto, los limites de la región de aceptación son: Lc = PH0  Z Lc = 0.8  1.96(0.0327) Ls = 0.8 + 0.06409 Ls = 0.8641 Li = 0.8 – 0.06409 Li = 0.7359 Viéndolo en la campana de Gauss: 
  • 68.
  • 69. La probabilidad de la muestra = 0.7, se localiza en la zona de rechazo, por lo que se rechaza la hipótesis nula y se acepta la alternativa. Vamos a demostrarlo: p pZZZ 058.3 0327.0 1.0 0327.0 8.07.0      Podemos concluir que existe una diferencia significativa entre la supuesta proporción de empleados promovibles comunicada por el director de recursos humanos y la observada en la muestra, la proporción de toda la compañía no es del 80%.
  • 70. b) Prueba de un extremo para proporciones Ejemplo 2.- Un artículo reciente en el periódico Reforma reportó que un empleado está disponible sólo para que uno de tres egresados universitarios con grado. Las principales razones aportadas fueron que existe una sobreabundancia de graduados de universidad y una economía débil. Suponga que una encuesta con 200 graduados recientes de la institución de usted, revela que 80 estudiantes tenían empleo. Al nivel de significancia de 0.02, ¿se puede concluir que una proporción mayor de estudiantes egresados tienen trabajo? p = 0.8 q = 0.2 Datos: n = 150 = 0.7 = 0.3  = 0.05 p q
  • 71. Las hipótesis son: Ho : p = 0.3333 H1 : p  0.3333 Calcularemos primero el error estándar de la proporción: n qp p HoHo  Sustituyendo valores: 0333.00011. 200 2222.0 200 )6667.0()3333.0(  pppp 
  • 72. En este caso, se quiere saber si la verdadera proporción es mayor que la supuesta proporción. Por consiguiente, es apropiada una prueba de un extremo para una proporción. El nivel de significancia corresponde a la región derecha de rechazo. La región de aceptación de 0.98 se ilustra como un área de 0.5 y otra de 0.48 como la muestra es mayor de 30, podemos recurrir a la distribución normal. Basándonos en la tabla de de esta distribución el valor correspondiente de Z, para 0.48 del área bajo la curva es 2.05, por tanto, el límite de la región de aceptación es: Ls = 0.3333 + 2.05 (0.0333) Ls = 0.3333 + 0.068265 Ls = 0.4016 Como = 0.4, y es menor que 0.4016, se localiza en la zona de aceptación, entonces, se acepta la hipótesis nula. Demostrando lo anterior se tiene: p p pp Z    pZZZ 003.2 0333.0 0667.0 0333.0 3333.04.0    En la campana de Gauss:
  • 73. Concluimos que no es mayor la proporción de estudiantes egresados que tienen trabajo.
  • 74. C) Prueba de hipótesis para proporciones de muestras pequeñas. Si usamos la distribución t para una prueba hipótesis para proporciones en muestras pequeñas, de dos colas, seguimos el mismo procedimiento que se utilizó en la prueba para medias de muestras pequeñas. Lo mismo sucede si se trata de una prueba de un extremo, recordando que, para obtener el valor apropiado de t en un nivel de significancia de 0.05 con 10 grados de libertad, buscaremos en la tabla de la distribución t bajo la columna 0.10, frente al renglón 10 grados de libertad. Esto es verdad porque la columna 0.10 del área bajo la curva contenida en ambos extremos combinados; por ello también representa 0.05 del área bajo la curva contenida en cada uno de los extremos. Por esta razón en lugar de buscar en la columna 0.05, se busca 0.10.
  • 75. Conclusiones • Las hipótesis no se plantean después de observar los datos. • En ciencia, las hipótesis nula y alternativa no tienen el mismo papel: – H0 : Hipótesis científicamente más simple. – H1 : El peso de la prueba recae en ella. • α debe ser pequeño • Rechazar una hipótesis consiste en observar si p < α • Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I • No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II • Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos. . Pruebas de hipótesis 75
  • 76. ¿Qué hemos visto? • Hipótesis – Nula – Alternativa • Nivel de significación – α – Probabilidad de error de tipo I • Significación, p. – Criterio de aceptación / rechazo. • Tipos de error – Tipo I – Tipo II . Pruebas de hipótesis 76