PRUEBA DE HIPÓTESIS
DATOS



La Muestra proviene de la Población femenina del país
de 12 años o más en el año 2001.
X es la variable que mide el nº de hijos nacidos vivos.




Muestras en 5 entidades Federales:




X = 0,1, 2, …, 6, 7
Aragua, Carabobo, Dist. Cap, Miranda y Zulia

Tamaño de la muestra:
Mus1 -> 1000 mujeres
 Mus2 ->
25 mujeres




(Fuente: Instituto Nacional de Estadística, censo 2001)
Tipos de Pruebas
Distribución Normal
Caso General n >30
En R




t.tes(data) me permite hacer la prueba de hipótesis
basada en la t-student
var.tes(data) me permite hacer la prueba de
hipótesis basada en la F de Fisher.
Parámetros de los comandos




t.test(x, y = NULL, alternative = c(“two sided”,
”less”, “greater”), mu =0, paired = FALSE,
var.equal = FALSE, conf.level = 0.95)
var.test(x, y, ratio = 1, alternative = c(“two
sided”, ”less”, “greater”), conf.level = 0.95)
Pruebas
1.

2.

3.

La media del número de hijos en el Distrito Capital
es diferente a 1.
La media del número de hijos en Zulia es mayor a
2.
La media del número de hijos en A es igual a la
media del número de hijos en B, donde A y B son:
a)
b)
c)

d)

A: Distrito Capital, B: Zulia
A: Aragua, B: Miranda
A: Carabobo, B: Zulia
A: Distrito Capital, B: Miranda
 Use

la muestras con n=25 (suponemos normalidad de
los datos
 Dé los resultados al 80%, 90%,95% y 99% de
confianza.
3a)Igualdad de medias


t.test(dc.mus2,zul.mus2)
Welch Two Sample t-test

data: dc.mus2 and zul.mus2
t = -0.2414, df = 47.007, p-value = 0.8103
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.493421 1.173421
sample estimates:
mean of x mean of y
1.88
2.04
Región de Rechazo


Estadístico: t = -0.2414
confianza es 95%, 1- a = 0.95, entonces a = 0.05
es el mayor error tolerado.
 RR:
t t
 ¿ 0.2414  t
?
 Si

a /2;n1  n2  2

 qt(0.025,


0.025;48

48, lower.tail=FALSE)

2.010635

 Como 0.2414  2.010635


entonces acepto H0

t no cae en región de rechazo,
P-valor


Si p-value < a :
 Error

a cometer menor que error tolerado.
 ¿Cuál es el error? Rechazar H0 siendo cierta.
 ¿Cuál es H0? 1  2
 Me arriesgo a cometer un error con chance p-value ya
que es menor que el error que estamos dispuestos a
cometer.
 Rechazo


H0 a favor de Ha

¿Cuál es Ha? 1  2
P-valor


Si p-value > a :
 Error

a cometer mayor que error tolerado.
 ¿Cuál es el error? Rechazar H0 siendo cierta.
 ¿Cuál es H0? 1  2
 No me atrevo a cometer un error con chance p-value
ya que es mayor que el error que estamos dispuestos a
cometer.
 No puedo rechazar H0



P-valor = 0.8103 > 0.05
Acepto la igualdad de medias
0.4
0.3
0.2
0.0

0.1

dx

Cuantil para
probabilidad
0.025

-4

-2

0
x

Estadístico t

2

4
Datos Pareados


Un fabricante desea comparar el proceso de armado común para uno de
sus productos con un método propuesto que supuestamente reduce el
tiempo de armado.

Se seleccionaron ocho trabajadores de la planta de armado y se les pidió
que armaran las unidades con ambos procesos.

¿ Mejora el tiempo en que se arman las unidades con el método propuesto?
Los siguientes son los tiempos observados en minutos.
actual<- c(38,32,41,35,42,32,45,37)
propuesto<- c(30,32,34,37,35,26,38,32)
 t.test(actual,propuesto, paired=T,var.equal=T)
Ejercicio


Cree una función que implemente una Prueba de
Hipótesis para determinar si es igual la proporción de
mujeres que tuvieron menos de 2 hijos nacidos vivos
entre los estados de Aragua y Zulia.
Use la muestras con n=1000
 Dé los resultados al 80%, 90%,95% y 99% de confianza.

Ayuda


ara.p.estim <- sum(ara.prop1<2)/length(ara.prop1)


[1] 0.48

Prueba de hipotesis

  • 1.
  • 2.
    DATOS   La Muestra provienede la Población femenina del país de 12 años o más en el año 2001. X es la variable que mide el nº de hijos nacidos vivos.   Muestras en 5 entidades Federales:   X = 0,1, 2, …, 6, 7 Aragua, Carabobo, Dist. Cap, Miranda y Zulia Tamaño de la muestra: Mus1 -> 1000 mujeres  Mus2 -> 25 mujeres   (Fuente: Instituto Nacional de Estadística, censo 2001)
  • 3.
  • 4.
  • 7.
  • 10.
    En R   t.tes(data) mepermite hacer la prueba de hipótesis basada en la t-student var.tes(data) me permite hacer la prueba de hipótesis basada en la F de Fisher.
  • 11.
    Parámetros de loscomandos   t.test(x, y = NULL, alternative = c(“two sided”, ”less”, “greater”), mu =0, paired = FALSE, var.equal = FALSE, conf.level = 0.95) var.test(x, y, ratio = 1, alternative = c(“two sided”, ”less”, “greater”), conf.level = 0.95)
  • 12.
    Pruebas 1. 2. 3. La media delnúmero de hijos en el Distrito Capital es diferente a 1. La media del número de hijos en Zulia es mayor a 2. La media del número de hijos en A es igual a la media del número de hijos en B, donde A y B son: a) b) c) d) A: Distrito Capital, B: Zulia A: Aragua, B: Miranda A: Carabobo, B: Zulia A: Distrito Capital, B: Miranda
  • 13.
     Use la muestrascon n=25 (suponemos normalidad de los datos  Dé los resultados al 80%, 90%,95% y 99% de confianza.
  • 14.
    3a)Igualdad de medias  t.test(dc.mus2,zul.mus2) WelchTwo Sample t-test data: dc.mus2 and zul.mus2 t = -0.2414, df = 47.007, p-value = 0.8103 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.493421 1.173421 sample estimates: mean of x mean of y 1.88 2.04
  • 15.
    Región de Rechazo  Estadístico:t = -0.2414 confianza es 95%, 1- a = 0.95, entonces a = 0.05 es el mayor error tolerado.  RR: t t  ¿ 0.2414  t ?  Si a /2;n1  n2  2  qt(0.025,  0.025;48 48, lower.tail=FALSE) 2.010635  Como 0.2414  2.010635  entonces acepto H0 t no cae en región de rechazo,
  • 16.
    P-valor  Si p-value <a :  Error a cometer menor que error tolerado.  ¿Cuál es el error? Rechazar H0 siendo cierta.  ¿Cuál es H0? 1  2  Me arriesgo a cometer un error con chance p-value ya que es menor que el error que estamos dispuestos a cometer.  Rechazo  H0 a favor de Ha ¿Cuál es Ha? 1  2
  • 17.
    P-valor  Si p-value >a :  Error a cometer mayor que error tolerado.  ¿Cuál es el error? Rechazar H0 siendo cierta.  ¿Cuál es H0? 1  2  No me atrevo a cometer un error con chance p-value ya que es mayor que el error que estamos dispuestos a cometer.  No puedo rechazar H0
  • 18.
      P-valor = 0.8103> 0.05 Acepto la igualdad de medias
  • 19.
  • 20.
    Datos Pareados  Un fabricantedesea comparar el proceso de armado común para uno de sus productos con un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron ocho trabajadores de la planta de armado y se les pidió que armaran las unidades con ambos procesos. ¿ Mejora el tiempo en que se arman las unidades con el método propuesto? Los siguientes son los tiempos observados en minutos. actual<- c(38,32,41,35,42,32,45,37) propuesto<- c(30,32,34,37,35,26,38,32)  t.test(actual,propuesto, paired=T,var.equal=T)
  • 21.
    Ejercicio  Cree una funciónque implemente una Prueba de Hipótesis para determinar si es igual la proporción de mujeres que tuvieron menos de 2 hijos nacidos vivos entre los estados de Aragua y Zulia. Use la muestras con n=1000  Dé los resultados al 80%, 90%,95% y 99% de confianza. 
  • 22.