SlideShare una empresa de Scribd logo
Dócimas de Hipótesis
Definición. Llamaremos hipótesis estadística a una afirmación que se hace acerca
de la distribución de una o más poblaciones.
La hipótesis estadística puede referirse a la forma o tipo de la
distribución de probabilidades de la población o bien referirse
al valor o valores de uno o más parámetros de una distribución
de probabilidad.
Sea f(x;𝜃) ; la distribución de probabilidad de una población y 𝜃 ∈ Θ su
parámetro. Sea Θ0y Θ1 una partición disjunta de Θ.
Consideremos las siguientes hipótesis estadísticas :
𝐻0: 𝜃 ∈ Θ0 v/s 𝐻1: 𝜃 ∈ Θ1
Hipótesis Hipótesis
nula alternativa
Si Θ0 (Θ1) contiene solamente un punto , se dice que 𝐻0(𝐻1) es una
hipótesis simple, en caso contrario se dice compuesta.
Sea 𝔛 = 𝑥𝑛 𝜖 ℝ𝑛 ;el espacio de información de una muestra aleatoria de tamaño n.
Sean RC y R𝐶𝑐 una partición del espacio de información ; consideremos a 𝑥𝑛 una
una posible solución de la muestra aleatoria de tamaño n ; entonces:
Si 𝑥𝑛 𝜖 RC ; rechazar 𝐻0 ; aceptar 𝐻1
Si 𝑥𝑛 𝜖 R𝐶𝑐
; no rechazar 𝐻0 ; aceptar 𝐻0
al subconjunto RC de ℝ𝑛
, se llama región critica (RC); que es la región que lleva a
rechazar la hipótesis nula.
Definición. Se llama Dócima de Hipótesis a la decisión de rechazar o no rechazar la
hipótesis nula.
Aquí debemos reconocer dos tipos de errores :
Error tipo I : se comete al rechazar 𝐻0 / 𝐻0 es verdadera.
Error tipo II : se comete al no rechazar 𝐻0 / 𝐻0 no es verdadera.
Llamaremos : 𝛼 = P( error tipo I) = P(rechazar 𝐻0 / 𝐻0 es verdadera)
𝛽 = P( error tipo II )= P(no rechazar 𝐻0 / 𝐻0 no es verdadera)
Realidad No rechazar 𝐻0 Rechazar 𝐻0
𝜃 ∈ Θ0 Acierto
1-𝛼
Error tipo I
𝛼
𝜃 ∈ Θ1 Error tipo II
𝛽
Acierto
1-𝛽
Decisión
Definición. Se llama potencia de una dócima de hipótesis a la probabilidad
de rechazar 𝐻0 cuando 𝜃 es verdadera .
La función potencia está dada por : 𝜋 (𝜃) = P(rechazar 𝐻0 / 𝜃 es verdadera)
Una buena Dócima de Hipótesis es aquella que tiene los errores tipo I y
tipo II lo más pequeño posibles.
El procedimiento utilizado en la práctica es limitar la probabilidad de error
tipo I , es decir 𝛼 ≤ 0.1, llamado nivel de significancia(o nivel de riesgo) y
entonces buscar una región critica(RC) que minimice la probabilidad de error
tipo II o que la potencia sea máxima.
Para resolver una dócima (prueba) de hipótesis, se recomienda seguir los
siguientes pasos:
1) Especificar las hipótesis nula y alternativa en el contexto del problema.
2) Identificar o seleccionar un nivel de significancia 𝛼 .
3) Identificar la distribución de la población y la estadística de prueba.
4) Calcular la estadística de prueba y construir la región critica y tomar
la decisión de rechazar o no rechazar la hipótesis nula.
5) Interpretar y concluir su decisión en el contexto del problema.
Dócimas de hipótesis para la media de una población
Población: X ~ N( 𝜇; 𝜎2
)
m.a.(n)
a) 𝜎2
conocida ; 𝐻0 :𝜇 = 𝜇𝑜
estadística: Z=
ത
𝑋 − 𝜇
𝜎
𝑛
~ N(0 ; 1) ; bajo 𝐻0 : 𝑍𝑜𝑏𝑠=
ത
𝑋 − 𝜇
𝜎
𝑛
𝛼 : nivel de significancia:
i) 𝐻1: 𝜇 > 𝜇𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼
ii) 𝐻1: 𝜇 < 𝜇𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
iii) 𝐻1: 𝜇 ≠ 𝜇𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
2
ó 𝑍𝑜𝑏𝑠 > 𝑍1−
𝛼
2
b) 𝜎2
desconocida ; 𝐻0 = 𝜇𝑜
estadística : t =
ത
𝑋 − 𝜇
ൗ
𝑆𝑛−1
𝑛
~ t(n-1) ; bajo 𝐻0 : 𝑡𝑜𝑏𝑠 =
ത
𝑋 − 𝜇
ൗ
𝑆𝑛−1
𝑛
𝛼 : nivel de significancia:
i) 𝐻1: 𝜇 > 𝜇𝑜 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-1)
ii) 𝐻1: 𝜇 < 𝜇𝑜 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-1)
iii) 𝐻1: 𝜇 ≠ 𝜇𝑜 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼
2
(n-1) o 𝑡𝑜𝑏𝑠 > 𝑡1−
𝛼
2
(n-1)
C) Sea f(x) la distribución de probabilidad de la población con 𝜎2
conocida ;
m.a.(n) ≥ 30 ( muestra grande); por el teorema central del limite :
Para 𝐻0 : 𝜇 = 𝜇𝑜 ; estadística: Z=
ത
𝑋 − 𝜇
𝜎
𝑛
≈ N(0 ; 1) ; bajo 𝐻0 : 𝑍𝑜𝑏𝑠=
ത
𝑋 − 𝜇
𝜎
𝑛
La región de rechazo para cada tipo de prueba es la misma del caso a).
Si 𝜎2 es desconocida , use estimador insesgado 𝑆𝑛−1
2
.
Tamaños de Muestra Para docimar la Media
Dadas la probabilidades de 𝛼 y 𝛽 de error tipo I y tipo II respectivamente :
a) 𝐻0 : 𝜇 = 𝜇𝑜 v/s 𝐻1 : 𝜇 = 𝜇1 , donde 𝜇1 < 𝜇0 ; n=
𝑍1−𝛼+𝑍1−𝛽
2
𝜎2
𝜇1−𝜇0
2
b) 𝐻0 : 𝜇 = 𝜇𝑜 v/s 𝐻1 : 𝜇 = 𝜇1 , donde 𝜇0 < 𝜇1 ; n=
𝑍1−𝛼+𝑍1−𝛽
2
𝜎2
𝜇1−𝜇0
2
c) 𝐻0 : 𝜇 = 𝜇𝑜 v/s 𝐻1 : 𝜇 = 𝜇1 , donde 𝜇0 ≠ 𝜇1 ; n=
𝑍1−𝛼/2+𝑍1−𝛽
2
𝜎2
𝜇1−𝜇0
2
Valor p
El valor p es la probabilidad de observar un valor de una estadística, si la hipótesis nula
es verdadera.
Sea W una estadística y 𝑊𝑜𝑏𝑠 su valor observado ;
a) Si 𝐻0= 𝜃0 v/s 𝐻1 > 𝜃0 entonces Valor p = P( W ≥ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero).
b) Si 𝐻0= 𝜃0 v/s 𝐻1 < 𝜃0 entonces Valor p = P( W ≤ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero).
c) Si 𝐻0= 𝜃0 v/s 𝐻1 ≠ 𝜃0 entonces Valor p = 2 P( W ≤ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero)
ó Valor p = 2 P( W ≥ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero).
Decisión : Valor p ≤ 𝛼 ; rechazar 𝐻0 al nivel de significancia 𝛼.
Valor p > 𝛼 ; no rechazar 𝐻0 al nivel de significancia 𝛼.
Si el Valor p ≤ 𝛼 :
i) 𝛼 = 0.1 , hay evidencia que 𝐻0 no es verdadera.
ii) 𝛼 = 0.05 , hay evidencia fuerte que 𝐻0 no es verdadera.
iii) 𝛼 = 0.01 , hay evidencia muy fuerte que 𝐻0 no es verdadera.
iv) 𝛼 = 0.001 , hay evidencia extremadamente fuerte que 𝐻0 no es verdadera.
Dócima de hipótesis para la proporción de una población
Población: X ~ ber(p)
m.a.(n)≥ 30
𝐻0 :p = 𝑝𝑜
estadística: Z =
ො
𝑝−𝑝
𝑝 1−𝑝
𝑛
≈ N(0 ; 1) ; bajo 𝐻0 : 𝑍𝑜𝑏𝑠=
ො
𝑝− 𝑝0
𝑝0 1−𝑝0
𝑛
𝛼 : nivel de significancia:
i) 𝐻1: p > 𝑝𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼
ii) 𝐻1: p < 𝑝𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
iii) 𝐻1: p ≠ 𝑝𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
2
ó 𝑍𝑜𝑏𝑠 > 𝑍1−
𝛼
2
Dócima de hipótesis para la varianza de una población
Población: X ~ N( 𝜇; 𝜎2
)
m.a.(n)
𝐻0 :𝜎2
= 𝜎0
2
estadística : 𝜒2
=
(𝑛−1)𝑆𝑛−1
2
𝜎2 ~ 𝜒2
(n-1) ; bajo 𝐻0 : 𝜒𝑜𝑏𝑠
2
=
(𝑛−1)𝑆𝑛−1
2
𝜎0
2
𝛼 : nivel de significancia:
i) 𝐻1: 𝜎2 > 𝜎0
2
; rechazar 𝐻0 si 𝜒𝑜𝑏𝑠
2
> 𝜒1−𝛼
2
(n-1)
ii) 𝐻1: 𝜎2 < 𝜎0
2
; rechazar 𝐻0 si 𝜒𝑜𝑏𝑠
2
< 𝜒𝛼
2(n-1)
iii) 𝐻1: 𝜎2 ≠ 𝜎0
2
; rechazar 𝐻0 si 𝜒𝑜𝑏𝑠
2
< 𝜒𝛼
2
2
(n-1) ó 𝜒𝑜𝑏𝑠
2
> 𝜒1−
𝛼
2
2
(n-1)
Dócima de hipótesis de dos poblaciones
Dócima de hipótesis para la razón de las varianzas poblacionales
Poblaciones: 𝑋1~ 𝑁( 𝜇1; 𝜎1
2
) e 𝑋2~𝑁 𝜇2; 𝜎2
2
independientes de tamaños 𝑛1 y 𝑛2.
𝐻0 : 𝜎1
2
= 𝜎2
2
estadística : F =
൘
𝑆𝑛1−1
2
𝜎1
2
൘
𝑆𝑛2−1
2
𝜎2
2
=
𝑆𝑛1−1
2
𝑆𝑛2−1
2 *
𝜎2
2
𝜎1
2 ~ F(𝑛1-1 ; 𝑛2-1) ; bajo 𝐻0 : 𝐹𝑜𝑏𝑠 =
𝑆𝑛1−1
2
𝑆𝑛2−1
2
𝛼 : nivel de significancia:
i) 𝐻1: 𝜎1
2
> 𝜎2
2
; rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 > 𝐹1−𝛼(𝑛1−1 ; 𝑛2−1)
ii) 𝐻1: 𝜎1
2
< 𝜎2
2
; rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 < 𝐹𝛼(𝑛1−1 ; 𝑛2−1)
iii) 𝐻1: 𝜎1
2
≠ 𝜎2
2
; rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 < 𝐹𝛼
2
(𝑛1−1 ; 𝑛2−1) ó 𝐹𝑜𝑏𝑠 > 𝐹1−
𝛼
2
(𝑛1−1 ; 𝑛2−1)
Dócima de hipótesis para la diferencia de dos medias poblacionales
Poblaciones: 𝑋1~ 𝑁( 𝜇1; 𝜎1
2
) e 𝑋2~𝑁 𝜇2; 𝜎2
2
independientes de tamaños 𝑛1 y 𝑛2.
𝐻0 : 𝜇1= 𝜇2 o 𝐻0 : 𝜇1 - 𝜇2 = 0
casos a) 𝜎1
2
y 𝜎2
2
conocidas.
estadística : Z =
( ത
𝑋1− ത
𝑋2 ) − 𝜇1− 𝜇2
𝜎1
2
𝑛1
+ 𝜎2
2
𝑛2
~ N (0; 1) ; bajo 𝐻0: 𝑍𝑜𝑏𝑠=
( ത
𝑋1− ത
𝑋2 )
𝜎1
2
𝑛1
+ 𝜎2
2
𝑛2
𝛼 : nivel de significancia:
i) 𝐻1: 𝜇1 > 𝜇2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼
ii) 𝐻1: 𝜇1 < 𝜇2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
iii) 𝐻1: 𝜇1 ≠ 𝜇2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
2
ó 𝑍𝑜𝑏𝑠 > 𝑍1−
𝛼
2
b) 𝜎1
2
= 𝜎2
2
= 𝜎2
desconocidas. c) 𝜎1
2
≠ 𝜎2
2
desconocidas.
estadística: estadística:
t =
( ത
𝑋1− ത
𝑋2 ) − 𝜇1− 𝜇2
𝑆𝑝
1
𝑛1
+ 1
𝑛2
~ 𝑡(𝑛1+𝑛2-2) ; t =
( ത
𝑋1− ത
𝑋2 ) − 𝜇1− 𝜇2
𝑆𝑛1−1
2
𝑛1
+
𝑆𝑛2−1
2
𝑛2
~ 𝑡(𝑣) ;
donde 𝑆𝑝 =
𝑛1−1 𝑆𝑛1−1
2 + 𝑛2−1 𝑆𝑛2−1
2
𝑛1+𝑛2−2
donde 𝑣 =
𝑆𝑛1−1
2
𝑛1
+
𝑆𝑛2 −1
2
𝑛2
2
𝑆𝑛1−1
2
𝑛1
2
𝑛1−1
+
𝑆𝑛2−1
2
𝑛2
2
𝑛2−1
bajo 𝐻0 : 𝑡𝑜𝑏𝑠 =
( ത
𝑋1− ത
𝑋2 )
𝑆𝑝
1
𝑛1
+ 1
𝑛2
bajo 𝐻0 : 𝑡𝑜𝑏𝑠 =
( ത
𝑋1− ത
𝑋2 )
𝑆𝑛1−1
2
𝑛1
+
𝑆𝑛2−1
2
𝑛2
𝛼 : nivel de significancia: 𝛼 : nivel de significancia:
i) 𝐻1: 𝜇1 > 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(𝑛1+𝑛2-2) i) 𝐻1: 𝜇1 > 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(v)
ii) 𝐻1: 𝜇1 < 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 (𝑛1+𝑛2-2) ii) 𝐻1: 𝜇1 < 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 (v)
iii) 𝐻1: 𝜇1 ≠ 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼
2
(𝑛1+𝑛2-2) iii) 𝐻1: 𝜇1 ≠ 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼
2
(v)
ó 𝑡𝑜𝑏𝑠 > 𝑡1−
𝛼
2
(𝑛1+𝑛2-2) ó 𝑡𝑜𝑏𝑠 > 𝑡1−
𝛼
2
(v)
d) La aproximación normal es muy buena si 𝑛1 ≥ 30 𝑦 𝑛2 ≥ 30 (muestras grandes ) sin importar si las
distribuciones de las poblaciones no son normales ,entonces por el teorema central del limite:
la estadística : Z =
( ത
𝑋1− ത
𝑋2 ) − 𝜇1− 𝜇2
𝜎1
2
𝑛1
+ 𝜎2
2
𝑛2
≈ N (0; 1) ; bajo 𝐻0: 𝑍𝑜𝑏𝑠=
( ത
𝑋1− ത
𝑋2 )
𝜎1
2
𝑛1
+ 𝜎2
2
𝑛2
La región de rechazo para cada tipo de prueba es la misma del caso a).
si 𝜎1
2
y 𝜎2
2
son desconocidas use su estimador insesgado respectivo.
Dócima de hipótesis para la diferencia de dos proporciones poblacionales
Poblaciones: X~ ber ( 𝑝1) e Y ~ ber ( 𝑝2) independientes de tamaños 𝑛1 ≥ 30 𝑦 𝑛2 ≥ 30 .
𝐻0 : 𝑝1= 𝑝2 o 𝐻0 : 𝑝1 - 𝑝2 = 0
estadística : Z =
(ෞ
𝑝1 −ෞ
𝑝2) − ( 𝑝1− 𝑝2)
𝑝1 1−𝑝1
𝑛1
+ 𝑝2 1−𝑝2
𝑛2
≈ N (0 ; 1) ; bajo 𝐻0: 𝑍𝑜𝑏𝑠=
(ෞ
𝑝1 −ෞ
𝑝2)
ො
𝑝 1− ො
𝑝
1
𝑛1
+
1
𝑛2
;donde Ƹ
𝑝=
𝑥1+𝑥2
𝑛1+𝑛2
estimador insesgado de p.
𝛼 : nivel de significancia:
i) 𝐻1: 𝑝1 > 𝑝2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼
ii) 𝐻1: 𝑝1 < 𝑝2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
iii) 𝐻1: 𝑝1 ≠ 𝑝2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼
2
ó 𝑍𝑜𝑏𝑠 > 𝑍1−
𝛼
2
Dócima de hipótesis para diferencia de medias poblaciones
(𝜇1- 𝜇2), muestras pareadas
Sea 𝑋1, … … 𝑋𝑛 una m.a. de una población 𝑁( 𝜇1; 𝜎1
2
) e 𝑌1, … … 𝑌𝑛 una m.a. de
una población 𝑁 𝜇2; 𝜎2
2
, la muestra esta formada por los pares
(𝑋1; 𝑌1), (𝑋2; 𝑌2),….. (𝑋𝑛; 𝑌𝑛). Se define la v.a. D= X - Y cuya media es 𝜇𝐷=𝜇1- 𝜇2 y
varianza 𝜎𝐷
2
= 𝜎1
2
+𝜎2
2
- 2cov(X;Y) , entonces D ~ N (𝜇𝐷 ; 𝜎𝐷
2
) .
La muestra aleatoria esta formada por 𝐷𝑖 = 𝑋𝑖 - 𝑌𝑖 ; i = 1,2,……,n .
Los estimadores insesgados para 𝜇𝐷 y 𝜎𝐷
2
son respectivamente ഥ
𝐷 y 𝑆𝐷
2
.
𝐻0: 𝜇𝐷 = 0
estadística : t =
ഥ
𝐷 − 𝜇𝐷
ൗ
𝑆𝐷
𝑛
~ t(n-1) ; bajo 𝐻0 : 𝑡𝑜𝑏𝑠 =
ഥ
𝐷
ൗ
𝑆𝐷
𝑛
𝛼 : nivel de significancia:
i) 𝐻1: 𝜇𝐷 > 0 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-1)
ii) 𝐻1: 𝜇𝐷 < 0 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-1)
iii) 𝐻1: 𝜇𝐷 ≠ 0 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼
2
(n-1) o 𝑡𝑜𝑏𝑠 > 𝑡1−
𝛼
2
(n-1)
Dócimas de Hipótesis : Regresión Lineal Simple y Correlación
Modelo de Regresión Lineal Simple : Y = 𝛽𝑜+𝛽1X + 𝜀
Al tomar una m.a.(n); 𝑥𝑖; 𝑦𝑖 𝑖 = 1, … , 𝑛 de la población (X,Y),
el Modelo de Regresión Lineal Estimado: ෠
𝑌 = መ
𝛽𝑜+ መ
𝛽1X ; por el método de mínimos
cuadrados se obtienen los estimadores para los parámetros 𝛽𝑜 y 𝛽1:
መ
𝛽𝑜= 𝑦 - መ
𝛽1𝑥 y መ
𝛽1=
σ 𝑥𝑖−𝑥 𝑦𝑖−𝑦
σ 𝑥𝑖−𝑥 2 =
𝑛 σ 𝑥𝑖𝑦𝑖−σ 𝑥𝑖 σ 𝑦𝑖
𝑛 σ 𝑥𝑖
2− σ 𝑥𝑖
2
Si los 𝜀𝑖~N( 0; 𝜎2) entonces: መ
𝛽𝑜 ~N(𝛽𝑜;𝜎෡
𝛽𝑜
2
) ;donde: 𝜎෡
𝛽𝑜
2
=
𝜎2 σ 𝑥𝑖
2
𝑛 σ 𝑥𝑖−𝑥 2 y
መ
𝛽1 ~N(𝛽1;𝜎෡
𝛽1
2
) ; 𝜎෡
𝛽1
2
=
𝜎2
σ 𝑥𝑖−𝑥 2
Estimador insesgado para 𝜎2 esta dado por :
෢
𝜎2 =
σ 𝑦𝑖− ො
𝑦𝑖
2
𝑛−2
=
σ 𝑦𝑖
2
−෡
𝛽𝑜 σ 𝑦𝑖−෡
𝛽1 σ 𝑥𝑖𝑦𝑖
𝑛−2
; las varianzas estimadas para መ
𝛽𝑜 y መ
𝛽1 :
෢
𝜎෡
𝛽𝑜
2
=
෢
𝜎2 σ 𝑥𝑖
2
𝑛 σ 𝑥𝑖−𝑥 2 y ෢
𝜎෡
𝛽1
2
=
෢
𝜎2
σ 𝑥𝑖−𝑥 2
La estadística t =
෡
𝛽𝑗−𝛽𝑗
ෝ
𝜎෡
𝛽𝑗
~t(n-2) ; j=0,1
𝐻0: 𝛽𝑗= 𝛽𝑗
∗
; bajo 𝐻0 𝑡𝑜𝑏𝑠=
෡
𝛽𝑗−𝛽𝑗
∗
ෝ
𝜎෡
𝛽𝑗
, j=0,1 , 𝛼:nivel de significancia
i) 𝐻1: 𝛽𝑗 > 𝛽𝑗
∗
; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-2)
ii) 𝐻1: 𝛽𝑗 < 𝛽𝑗
∗
; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-2)
iii) 𝐻1: 𝛽𝑗 ≠ 𝛽𝑗
∗
; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼
2
(n-2) o 𝑡𝑜𝑏𝑠 > 𝑡1−
𝛼
2
(n-2)
Definición. El coeficiente de correlación lineal de la distribución f(x,y) bivariada X e Y
está dada por : 𝜌(x,y) =
𝐸 𝑥−𝐸(𝑥) 𝑦−𝐸(𝑦)
𝐸 𝑥−𝐸(𝑥) 2 𝐸 𝑦−𝐸(𝑦) 2
=
𝐶𝑜𝑣(𝑥,𝑦)
𝜎𝑥 𝜎𝑦
; -1 ≤ 𝜌(x,y) ≤ 1
Al tomar una m.a.(n); 𝑥𝑖; 𝑦𝑖 𝑖 = 1, … , 𝑛 de la población f(x,y);
el estimador esta dado por : r(x,y)=
σ 𝑥−𝑥 𝑦−𝑦
σ 𝑥−𝑥
2
σ 𝑦−𝑦
2
=
𝐶𝑜𝑣(𝑥,𝑦)
𝑆𝑥 𝑆𝑦
; -1 ≤ 𝑟(x,y) ≤ 1
Dócima de Hipótesis para el Coeficiente de Correlación lineal
𝐻0: 𝜌= 0 ; estadística t = 𝑟 − 𝜌
𝑛−2
1−𝑟2 ~ t(n-2) ; bajo 𝐻0 𝑡𝑜𝑏𝑠= 𝑟
𝑛−2
1−𝑟2
𝛼:nivel de significancia
a) 𝐻1: 𝜌 > 0 b) 𝐻1: 𝜌 < 0 c) 𝐻1: 𝜌 ≠ 0
rechazar 𝐻0 si rechazar 𝐻0 si rechazar 𝐻0 si
𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-2) 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-2) 𝑡𝑜𝑏𝑠 < 𝑡𝛼
2
(n-2) o 𝑡𝑜𝑏𝑠 > 𝑡1−
𝛼
2
(n-2)
valor p=P(t(n-2)> 𝑡𝑜𝑏𝑠) valor p=P(t(n-2)< 𝑡𝑜𝑏𝑠) valor p=2P(t(n-2)< 𝑡𝑜𝑏𝑠) ó
valor p=2P(t(n-2)> 𝑡𝑜𝑏𝑠)
Decisión : rechazar 𝐻0 si 𝛼 > valor p.
Nota. Si la inferencia concluye que 𝜌 ≠ 0,entonces para docimar 𝐻0: 𝜌= 𝜌0 se aplica
la siguiente estadística bajo 𝐻0: 𝑍𝑜𝑏𝑠=
𝑛−3
2
ln
1+𝑟 1−𝜌0
1−𝑟 1+𝜌0
Para aplicar esta estadística se supone que las variables aleatorias X e Y tienen
distribución normal bivariada.
𝛼:nivel de significancia
a) 𝐻1: 𝜌 > 𝜌0 b) 𝐻1: 𝜌 < 𝜌0 c) 𝐻1: 𝜌 ≠ 𝜌0
rechazar 𝐻0 si rechazar 𝐻0 si rechazar 𝐻0 si
𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 𝑍𝑜𝑏𝑠 < 𝑍𝛼 𝑍𝑜𝑏𝑠 < 𝑍𝛼
2
o 𝑍𝑜𝑏𝑠 > 𝑍1−
𝛼
2
Análisis de Varianza (ANOVA) ; Hipótesis, 𝐻0 : 𝛽1= 0 v/s 𝐻1: 𝛽1 ≠ 0
𝛼 : nivel de significancia , rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 > 𝐹1−𝛼(1; n-2)
Fuente de Variación SC G.L. CM Fobs
Debida a la Regresión SCR 1 CMR CMR/CME
Debida a los Residuos SCE n-2 CME
Total SCT n-1
Análisis de Varianza (Anova) de un Factor o una Vía
Sea X una variable aleatoria dependiente de un factor A que tiene k niveles o tratamientos
Se supone que los k niveles , son k poblaciones independientes que denotaremos por :
𝑋1, 𝑋2, … … , 𝑋𝑘 cuyas medias y varianzas son respectivamente 𝜇1, 𝜇2, … … , 𝜇𝑘 y
𝜎1
2
, 𝜎2
2
, … … , 𝜎𝑘
2
. Las k poblaciones juntas constituyen la población total de la variable
aleatoria X, cuya media total 𝜇 esta dada por 𝜇=
σ𝑖=1
𝑘
𝜇𝑖
𝑘
.
Los supuestos de este diseño de experimento son:
a) Las k poblaciones son independientes .
b) Cada una de las poblaciones tiene distribución normal, 𝑋𝑖~N(𝜇𝑖; 𝜎𝑖
2
),i=1,2,…..,k
c) Las k varianzas 𝜎𝑖
2
son iguales a la varianza común 𝜎2,(poblaciones homocedasticas).
Sea 𝑋𝑖1, 𝑋𝑖2, … … , 𝑋𝑖𝑛𝑖
una muestra aleatoria de tamaño 𝑛𝑖 de la población i- ésima
(v.a. 𝑋𝑖), tal que σ𝑖=1
𝑘
𝑛𝑖= n es el tamaño total de las K muestras.
Los elementos 𝑋𝑖𝑗, j=1,2,…….,𝑛𝑖 son variables aleatorias independientes con
distribución normal N(𝜇𝑖; 𝜎2
), i=1,2,…..,k .
X11 X21 ……. 𝑋𝑖1 …… 𝑋𝑘1
X12 X21 ……. 𝑋𝑖1 …… 𝑋𝑘1
…………………………………………………….
X1𝑛1
X2𝑛2
……. 𝑋𝑖𝑛𝑖
…… 𝑋𝑘𝑛𝑘
1 2 i k Total
Total 𝑋1. 𝑋2 . ……. 𝑋𝑖. …… 𝑋𝑘. X..
Tamaño 𝑛1 𝑛2 ……. 𝑛𝑖 …… 𝑛𝑘 n
Medias 𝑋1. 𝑋2. ……. 𝑋𝑖. …… 𝑋𝑘. 𝑋..
Niveles o Tratamientos de un
Factor A
Datos de k muestras aleatorias independientes
de la variable dependiente X
donde :
𝑋𝑖. = σ𝑗=1
𝑛𝑖
𝑋𝑖𝑗,datos de la muestra i, i=1,2,..,k
X.. = σ𝑖=1
𝑘 σ𝑗=1
𝑛𝑖
𝑋𝑖𝑗 , total de datos de las k
muestras.
σ𝑖=1
𝑘
𝑛𝑖= n es el total observado en las K
muestras.
𝑋𝑖. =
𝑋𝑖.
𝑛𝑖
es la media de la muestra i,
(estimación insesgada de la media 𝜇𝑖).
𝑋.. =
𝑋..
𝑛
es la media total muestral ,
(estimación insesgada de la media 𝜇).
Dado que E(𝑋𝑖𝑗) = 𝜇𝑖 ; i=1,2,…..,K , el modelo lineal apropiado para el experimento
completamente aleatorizado de un factor es :
𝑋𝑖𝑗= 𝜇𝑖 + 𝑒𝑖𝑗 , j=1,2,…., 𝑛𝑖 , i=1,2,…..,k ,donde 𝑒𝑖𝑗 : error o residuo
Dado que las variables aleatorias 𝑋𝑖𝑗 son independientes y con distribución N(𝜇𝑖;𝜎2
),
entonces los 𝑒𝑖𝑗 son variables independientes con distribución N(0; 𝜎2
).
El modelo puede ser representado en forma equivalente por:
𝑋𝑖𝑗= 𝜇 + 𝛼𝑖 + 𝑒𝑖𝑗 , donde 𝛼𝑖 = 𝜇𝑖 - 𝜇 es el efecto del tratamiento i del factor.
Hipótesis estadísticas en el modelo de clasificación simple(de efectos fijos).
𝐻0 : 𝜇1=𝜇2=……=𝜇𝑘= 𝜇 v/s 𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 , i ≠ j
Las medias de los k tratamientos No todas las medias son iguales.
(poblaciones) son iguales ,(o los k
provienen de la misma población).
En forma equivalente por :
𝐻0 : 𝛼1=𝛼2=……= 𝛼𝑘= 0 v/s 𝐻1 : 𝛼𝑖 ≠ 0
No hay efecto en todos los Al menos un 𝛼𝑖 no es igual a cero.
k tratamientos.
La dócima de hipótesis se basa en la partición de la variabilidad total de X dada por:
σ𝑖=1
𝑘 σ𝑗=1
𝑛𝑖
𝑋𝑖𝑗 − 𝑋..
2
= σ𝑖=1
𝑘
𝑛𝑖 𝑋𝑖. − 𝑋..
2
+ σ𝑖=1
𝑘 σ𝑗=1
𝑛𝑖
𝑋𝑖𝑗 − 𝑋𝑖.
2
Suma cuadrado total. = Suma de cuadrados + Suma de cuadrados dentro
entre tratamientos de los tratamientos (error).
(factor A).
Se puede resumir como SCT = SCA + SCE
Bajo 𝐻0 las varianzas muestrales :
𝑆𝐶𝑇
𝑛−1
,
𝑆𝐶𝐴
𝑘−1
y
𝑆𝐶𝐸
𝑛−𝑘
, son estimaciones insesgadas de 𝜎2.
Las tres estimaciones de la varianza común se denominan cuadrados medios y se
denotan respectivamente : CMT ; CMA y CME .
Además sabemos que :
𝑆𝐶𝑇
𝜎2 ~𝜒2(n-1) ,
𝑆𝐶𝐴
𝜎2 ~𝜒2(k-1) y
𝑆𝐶𝐸
𝜎2 ~𝜒2(n-k),si 𝐻0 es verdadera.
la estadística de la dócima de hipótesis es :
F =
ൗ
𝑆𝐶𝐴
𝜎2 𝑘−1
ൗ
𝑆𝐶𝐸
𝜎2 𝑛−𝑘
=
𝐶𝑀𝐴
𝐶𝑀𝐸
~ F(k-1;n-k) , si 𝛼 es el nivel de significancia
𝐹𝑜𝑏𝑠 > 𝐹𝛼(k-1: n-k) rechazar 𝐻𝑜 y concluimos que hay diferencia entre las medias
y por lo tanto hay influencia de los tratamientos sobre la variable estudiada.
Podemos resumir algunos resultados importantes en la siguiente tabla:
Anova
𝛼 nivel de significancia,
si 𝐹𝑜𝑏𝑠 > 𝐹𝛼(k-1 ; n-k) rechazar 𝐻𝑜 y
concluimos que hay diferencia entre las
medias y por lo tanto hay influencia de
los tratamientos sobre la variable en
estudio.
Usando el valor p = P(𝐹𝛼(k-1 ; n-k) > 𝐹𝑜𝑏𝑠),rechazar 𝐻𝑜 si 𝛼 >valor p.
Para calcular las sumas de cuadrados total, de los tratamientos y del error puede aplicar:
SCT = σ𝑖=1
𝑘 σ𝑗=1
𝑛𝑖
𝑋𝑖𝑗 − 𝑋..
2
= σ𝑖=1
𝑘 σ𝑗=1
𝑛𝑖
𝑋𝑖𝑗
2
- Τ
𝑋. . 2 𝑛
SCA = σ𝑖=1
𝑘
𝑛𝑖 𝑋𝑖. − 𝑋..
2
= σ𝑖=1
𝑘 𝑋𝑖.
2
𝑛𝑖
- Τ
𝑋. . 2 𝑛 y SCE = SCT – SCA .
Fuentes de
Variación
Suma de
Cuadrados
Grados de
Libertad
Cuadrado
Medio
𝐹𝑜𝑏𝑠
Entre Tratamientos
o factor A
Error (Dentro de
los Tratamientos)
SCA
SCE
k-1
n-k
CMA
CME
CMA
CME
Total SCT n-1
Ejemplo. Un ingeniero va a decidir la compra de una de 4 maquinas de marcas diferentes
para su uso en una producción especifica .Por esto, utilizo cada maquina al azar
para procesar 6 unidades del producto registrando los tiempos por unidad, en
segundos, resultando así el experimento completamente aleatorio. Los datos
son los siguientes de las 4 muestras independientes:
X : tiempos (en segundos) empleados en la producción
A:Máquinas
M1 M2 M3 M4
55 60 64 42
46 58 62 45
45 68 51 52
73 58 57 44
50 63 65 42
63 52 68 50
𝑋𝑖. 332 359 367 275 X.. =1333
𝑛𝑖 6 6 6 6 n = 24
𝑋𝑖. 55.33 59.83 61.17 45.83 𝑋.. = 55.54
Con un nivel de significancia de 0.05, Docímese
la hipótesis que las máquinas utilizan la misma
velocidad media para procesar el producto.
Solución. Variable dependiente X: tiempo para procesar
el producto, en segundos.
Variable independiente o factor A: máquinas,
con niveles o tratamientos M1,M2,M3 y M4.
Modelo del Anova : 𝑋𝑖𝑗= 𝜇 + 𝛼𝑖 + 𝑒𝑖𝑗 , donde 𝛼𝑖 = 𝜇𝑖 - 𝜇
es el efecto en X que produce la máquina i del factor.
Hipótesis : 𝐻0 : 𝜇1=𝜇2=𝜇3=𝜇4=𝜇 v/s 𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 , i ≠ j
Anova:
SCT= σ𝑖=1
𝑘 σ𝑗=1
𝑛𝑖
𝑋𝑖𝑗
2
- Τ
𝑋. . 2
𝑛 = 75921-74037.042
= 1883.958
SCA = σ𝑖=1
𝑘 𝑋𝑖.
2
𝑛𝑖
- Τ
𝑋. . 2
𝑛 =74903.167-74037.042
= 866.125
SCE = SCT – SCA = 1883.958 – 866.125 = 1017.833
Fuentes de
Variación
Suma de
Cuadrados
Grados de
Libertad
Cuadrado
Medio
𝐹𝑜𝑏𝑠
Entre las Máquinas
Error
866.125
1017.833
3
20
288.708
50.892
5.673
Total 1883.958 23
RC = { 𝐹𝑜𝑏𝑠 > 𝐹0.95(3 ; 20) } = { 5.673 > 3.0984 }
Decisión : rechazar 𝐻0
Conclusión : El factor máquina tiene efecto significativo sobre el tiempo necesario
para realizar la producción, es decir , existen diferencias significativas
entre las velocidades de las máquinas.
Valor p = P(F (3 ; 20) > 5.673) = 0.0056

Más contenido relacionado

Similar a Unidad3y-4ca.pdf

Que es probabilidad
Que es probabilidadQue es probabilidad
Que es probabilidad
LLendy GIl
 
Estadística ii 1
Estadística ii 1 Estadística ii 1
Estadística ii 1
thomas669
 
Estadística ii
Estadística iiEstadística ii
Estadística ii
thomas669
 
Estimacion de parametros
Estimacion de parametrosEstimacion de parametros
Estimacion de parametros
UFRO
 
Clase02 distribuciones de probabilidad
Clase02   distribuciones de probabilidadClase02   distribuciones de probabilidad
Clase02 distribuciones de probabilidad
Fabrizio Marcillo Morla
 
Clase04 estadistica descriptiva
Clase04   estadistica descriptivaClase04   estadistica descriptiva
Clase04 estadistica descriptiva
Fabrizio Marcillo Morla
 
Jose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de probJose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de prob
Jose Ramon Borges Yepez
 
Contingencia
ContingenciaContingencia
1 - Ditribuciones en el muestreo.pdf
1 - Ditribuciones en el muestreo.pdf1 - Ditribuciones en el muestreo.pdf
1 - Ditribuciones en el muestreo.pdf
GabrielaQu
 
Clase repaso bioestadistica URV 2010
Clase repaso bioestadistica URV 2010Clase repaso bioestadistica URV 2010
Clase repaso bioestadistica URV 2010
AlbertoAmeijide
 
Estadistica
EstadisticaEstadistica
Estadistica
LisbethUTS
 
Hipótesis 1
Hipótesis 1 Hipótesis 1
Hipótesis 1
thomas669
 
Hipótesis
HipótesisHipótesis
Hipótesis
thomas669
 
Distribucion de variable aleatoria discreta
Distribucion de variable aleatoria discretaDistribucion de variable aleatoria discreta
Distribucion de variable aleatoria discreta
Cristhiam Montalvan Coronel
 
Formulario 2020 (Estadística aplicada)
Formulario   2020 (Estadística aplicada)Formulario   2020 (Estadística aplicada)
Formulario 2020 (Estadística aplicada)
Joel Bar
 
Consulta de intervalos de confianza
Consulta de intervalos de confianzaConsulta de intervalos de confianza
Consulta de intervalos de confianza
Irizitha Carreon Rangel
 
Consulta de intervalos de confianza
Consulta de intervalos de confianzaConsulta de intervalos de confianza
Consulta de intervalos de confianza
Irizitha Carreon Rangel
 
Estadistica y probabilidades cap vii
Estadistica y probabilidades cap viiEstadistica y probabilidades cap vii
Estadistica y probabilidades cap vii
Manuel Chavez Leandro
 
4)Distribución muestral.pptx
4)Distribución muestral.pptx4)Distribución muestral.pptx
4)Distribución muestral.pptx
gloria Esparraga
 
Tr bases 3
Tr bases 3Tr bases 3
Tr bases 3
04921
 

Similar a Unidad3y-4ca.pdf (20)

Que es probabilidad
Que es probabilidadQue es probabilidad
Que es probabilidad
 
Estadística ii 1
Estadística ii 1 Estadística ii 1
Estadística ii 1
 
Estadística ii
Estadística iiEstadística ii
Estadística ii
 
Estimacion de parametros
Estimacion de parametrosEstimacion de parametros
Estimacion de parametros
 
Clase02 distribuciones de probabilidad
Clase02   distribuciones de probabilidadClase02   distribuciones de probabilidad
Clase02 distribuciones de probabilidad
 
Clase04 estadistica descriptiva
Clase04   estadistica descriptivaClase04   estadistica descriptiva
Clase04 estadistica descriptiva
 
Jose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de probJose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de prob
 
Contingencia
ContingenciaContingencia
Contingencia
 
1 - Ditribuciones en el muestreo.pdf
1 - Ditribuciones en el muestreo.pdf1 - Ditribuciones en el muestreo.pdf
1 - Ditribuciones en el muestreo.pdf
 
Clase repaso bioestadistica URV 2010
Clase repaso bioestadistica URV 2010Clase repaso bioestadistica URV 2010
Clase repaso bioestadistica URV 2010
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Hipótesis 1
Hipótesis 1 Hipótesis 1
Hipótesis 1
 
Hipótesis
HipótesisHipótesis
Hipótesis
 
Distribucion de variable aleatoria discreta
Distribucion de variable aleatoria discretaDistribucion de variable aleatoria discreta
Distribucion de variable aleatoria discreta
 
Formulario 2020 (Estadística aplicada)
Formulario   2020 (Estadística aplicada)Formulario   2020 (Estadística aplicada)
Formulario 2020 (Estadística aplicada)
 
Consulta de intervalos de confianza
Consulta de intervalos de confianzaConsulta de intervalos de confianza
Consulta de intervalos de confianza
 
Consulta de intervalos de confianza
Consulta de intervalos de confianzaConsulta de intervalos de confianza
Consulta de intervalos de confianza
 
Estadistica y probabilidades cap vii
Estadistica y probabilidades cap viiEstadistica y probabilidades cap vii
Estadistica y probabilidades cap vii
 
4)Distribución muestral.pptx
4)Distribución muestral.pptx4)Distribución muestral.pptx
4)Distribución muestral.pptx
 
Tr bases 3
Tr bases 3Tr bases 3
Tr bases 3
 

Último

exportacion e importacion de bolivia de productos tradicionales y no tradicic...
exportacion e importacion de bolivia de productos tradicionales y no tradicic...exportacion e importacion de bolivia de productos tradicionales y no tradicic...
exportacion e importacion de bolivia de productos tradicionales y no tradicic...
elvamarzamamani
 
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de EmergenciaBBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
Claudia Valdés Muñoz
 
Capitulo 5 de Kotler, mercados de consumo.
Capitulo 5 de Kotler, mercados de consumo.Capitulo 5 de Kotler, mercados de consumo.
Capitulo 5 de Kotler, mercados de consumo.
gonzalo213perez
 
DIM declaracion de importacion de mercancias .pdf
DIM declaracion de importacion de mercancias .pdfDIM declaracion de importacion de mercancias .pdf
DIM declaracion de importacion de mercancias .pdf
LuceroQuispelimachi
 
Importancia-Seguridad-Social-en-Salud-y-Pensiones.pdf
Importancia-Seguridad-Social-en-Salud-y-Pensiones.pdfImportancia-Seguridad-Social-en-Salud-y-Pensiones.pdf
Importancia-Seguridad-Social-en-Salud-y-Pensiones.pdf
emerson vargas panduro
 
Los 6 Pasos hacia una Financiación Exitosa
Los 6 Pasos hacia una Financiación ExitosaLos 6 Pasos hacia una Financiación Exitosa
Los 6 Pasos hacia una Financiación Exitosa
Richard208605
 
La Comisión europea informa sobre el progreso social en la UE.
La Comisión europea informa sobre el progreso social en la UE.La Comisión europea informa sobre el progreso social en la UE.
La Comisión europea informa sobre el progreso social en la UE.
ManfredNolte
 
Tratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdfTratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdf
ClaudioFerreyra8
 
Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...
Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...
Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...
mariaclaudiaortizj
 
Presentación sobre la Teoría Económica de John Maynard Keynes
Presentación sobre la Teoría Económica de John Maynard KeynesPresentación sobre la Teoría Económica de John Maynard Keynes
Presentación sobre la Teoría Económica de John Maynard Keynes
kainaflores0
 
PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024
LuisdelBarri
 
CAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptx
CAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptxCAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptx
CAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptx
DylanKev
 
SEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONAL
SEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONALSEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONAL
SEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONAL
NahomyAlemn1
 
El crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financieraEl crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financiera
MarcoMolina87
 
creditohipotecario del bcrp linnk app02.pptx
creditohipotecario del bcrp linnk app02.pptxcreditohipotecario del bcrp linnk app02.pptx
creditohipotecario del bcrp linnk app02.pptx
ssuser6a2c71
 
Bases para la actividad económica_044737.pptx
Bases para la actividad económica_044737.pptxBases para la actividad económica_044737.pptx
Bases para la actividad económica_044737.pptx
gerardomanrique5
 
SEMINARIO PRACTICO DE AJUSTE POR INFLACION CONTABLE.pdf
SEMINARIO PRACTICO DE   AJUSTE POR INFLACION CONTABLE.pdfSEMINARIO PRACTICO DE   AJUSTE POR INFLACION CONTABLE.pdf
SEMINARIO PRACTICO DE AJUSTE POR INFLACION CONTABLE.pdf
joserondon67
 
SEMINARIO - TESIS RESIDUOS SOLIDOS 2024.docx
SEMINARIO - TESIS  RESIDUOS SOLIDOS 2024.docxSEMINARIO - TESIS  RESIDUOS SOLIDOS 2024.docx
SEMINARIO - TESIS RESIDUOS SOLIDOS 2024.docx
grimarivas21
 
finanzas-en-mi-colegio-cuarto-de-secundaria.pdf
finanzas-en-mi-colegio-cuarto-de-secundaria.pdffinanzas-en-mi-colegio-cuarto-de-secundaria.pdf
finanzas-en-mi-colegio-cuarto-de-secundaria.pdf
dongimontjoy
 
DERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTE
DERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTEDERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTE
DERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTE
lazartejose60
 

Último (20)

exportacion e importacion de bolivia de productos tradicionales y no tradicic...
exportacion e importacion de bolivia de productos tradicionales y no tradicic...exportacion e importacion de bolivia de productos tradicionales y no tradicic...
exportacion e importacion de bolivia de productos tradicionales y no tradicic...
 
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de EmergenciaBBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
 
Capitulo 5 de Kotler, mercados de consumo.
Capitulo 5 de Kotler, mercados de consumo.Capitulo 5 de Kotler, mercados de consumo.
Capitulo 5 de Kotler, mercados de consumo.
 
DIM declaracion de importacion de mercancias .pdf
DIM declaracion de importacion de mercancias .pdfDIM declaracion de importacion de mercancias .pdf
DIM declaracion de importacion de mercancias .pdf
 
Importancia-Seguridad-Social-en-Salud-y-Pensiones.pdf
Importancia-Seguridad-Social-en-Salud-y-Pensiones.pdfImportancia-Seguridad-Social-en-Salud-y-Pensiones.pdf
Importancia-Seguridad-Social-en-Salud-y-Pensiones.pdf
 
Los 6 Pasos hacia una Financiación Exitosa
Los 6 Pasos hacia una Financiación ExitosaLos 6 Pasos hacia una Financiación Exitosa
Los 6 Pasos hacia una Financiación Exitosa
 
La Comisión europea informa sobre el progreso social en la UE.
La Comisión europea informa sobre el progreso social en la UE.La Comisión europea informa sobre el progreso social en la UE.
La Comisión europea informa sobre el progreso social en la UE.
 
Tratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdfTratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdf
 
Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...
Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...
Desafíos del Habeas Data y las nuevas tecnología enfoque comparado Colombia y...
 
Presentación sobre la Teoría Económica de John Maynard Keynes
Presentación sobre la Teoría Económica de John Maynard KeynesPresentación sobre la Teoría Económica de John Maynard Keynes
Presentación sobre la Teoría Económica de John Maynard Keynes
 
PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024
 
CAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptx
CAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptxCAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptx
CAPITULO I - GENERALIDADES DE LA ESTADISTICA.pptx
 
SEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONAL
SEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONALSEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONAL
SEGUROS Y FIANZAS EN EL COMERCIO INTERNACIONAL
 
El crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financieraEl crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financiera
 
creditohipotecario del bcrp linnk app02.pptx
creditohipotecario del bcrp linnk app02.pptxcreditohipotecario del bcrp linnk app02.pptx
creditohipotecario del bcrp linnk app02.pptx
 
Bases para la actividad económica_044737.pptx
Bases para la actividad económica_044737.pptxBases para la actividad económica_044737.pptx
Bases para la actividad económica_044737.pptx
 
SEMINARIO PRACTICO DE AJUSTE POR INFLACION CONTABLE.pdf
SEMINARIO PRACTICO DE   AJUSTE POR INFLACION CONTABLE.pdfSEMINARIO PRACTICO DE   AJUSTE POR INFLACION CONTABLE.pdf
SEMINARIO PRACTICO DE AJUSTE POR INFLACION CONTABLE.pdf
 
SEMINARIO - TESIS RESIDUOS SOLIDOS 2024.docx
SEMINARIO - TESIS  RESIDUOS SOLIDOS 2024.docxSEMINARIO - TESIS  RESIDUOS SOLIDOS 2024.docx
SEMINARIO - TESIS RESIDUOS SOLIDOS 2024.docx
 
finanzas-en-mi-colegio-cuarto-de-secundaria.pdf
finanzas-en-mi-colegio-cuarto-de-secundaria.pdffinanzas-en-mi-colegio-cuarto-de-secundaria.pdf
finanzas-en-mi-colegio-cuarto-de-secundaria.pdf
 
DERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTE
DERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTEDERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTE
DERECHO BANCARIO DIAPOSITIVA DE CARATER ESTUDIANTE
 

Unidad3y-4ca.pdf

  • 1. Dócimas de Hipótesis Definición. Llamaremos hipótesis estadística a una afirmación que se hace acerca de la distribución de una o más poblaciones. La hipótesis estadística puede referirse a la forma o tipo de la distribución de probabilidades de la población o bien referirse al valor o valores de uno o más parámetros de una distribución de probabilidad. Sea f(x;𝜃) ; la distribución de probabilidad de una población y 𝜃 ∈ Θ su parámetro. Sea Θ0y Θ1 una partición disjunta de Θ. Consideremos las siguientes hipótesis estadísticas : 𝐻0: 𝜃 ∈ Θ0 v/s 𝐻1: 𝜃 ∈ Θ1 Hipótesis Hipótesis nula alternativa Si Θ0 (Θ1) contiene solamente un punto , se dice que 𝐻0(𝐻1) es una hipótesis simple, en caso contrario se dice compuesta.
  • 2. Sea 𝔛 = 𝑥𝑛 𝜖 ℝ𝑛 ;el espacio de información de una muestra aleatoria de tamaño n. Sean RC y R𝐶𝑐 una partición del espacio de información ; consideremos a 𝑥𝑛 una una posible solución de la muestra aleatoria de tamaño n ; entonces: Si 𝑥𝑛 𝜖 RC ; rechazar 𝐻0 ; aceptar 𝐻1 Si 𝑥𝑛 𝜖 R𝐶𝑐 ; no rechazar 𝐻0 ; aceptar 𝐻0 al subconjunto RC de ℝ𝑛 , se llama región critica (RC); que es la región que lleva a rechazar la hipótesis nula. Definición. Se llama Dócima de Hipótesis a la decisión de rechazar o no rechazar la hipótesis nula. Aquí debemos reconocer dos tipos de errores : Error tipo I : se comete al rechazar 𝐻0 / 𝐻0 es verdadera. Error tipo II : se comete al no rechazar 𝐻0 / 𝐻0 no es verdadera. Llamaremos : 𝛼 = P( error tipo I) = P(rechazar 𝐻0 / 𝐻0 es verdadera) 𝛽 = P( error tipo II )= P(no rechazar 𝐻0 / 𝐻0 no es verdadera)
  • 3. Realidad No rechazar 𝐻0 Rechazar 𝐻0 𝜃 ∈ Θ0 Acierto 1-𝛼 Error tipo I 𝛼 𝜃 ∈ Θ1 Error tipo II 𝛽 Acierto 1-𝛽 Decisión Definición. Se llama potencia de una dócima de hipótesis a la probabilidad de rechazar 𝐻0 cuando 𝜃 es verdadera . La función potencia está dada por : 𝜋 (𝜃) = P(rechazar 𝐻0 / 𝜃 es verdadera) Una buena Dócima de Hipótesis es aquella que tiene los errores tipo I y tipo II lo más pequeño posibles. El procedimiento utilizado en la práctica es limitar la probabilidad de error tipo I , es decir 𝛼 ≤ 0.1, llamado nivel de significancia(o nivel de riesgo) y entonces buscar una región critica(RC) que minimice la probabilidad de error tipo II o que la potencia sea máxima.
  • 4. Para resolver una dócima (prueba) de hipótesis, se recomienda seguir los siguientes pasos: 1) Especificar las hipótesis nula y alternativa en el contexto del problema. 2) Identificar o seleccionar un nivel de significancia 𝛼 . 3) Identificar la distribución de la población y la estadística de prueba. 4) Calcular la estadística de prueba y construir la región critica y tomar la decisión de rechazar o no rechazar la hipótesis nula. 5) Interpretar y concluir su decisión en el contexto del problema.
  • 5. Dócimas de hipótesis para la media de una población Población: X ~ N( 𝜇; 𝜎2 ) m.a.(n) a) 𝜎2 conocida ; 𝐻0 :𝜇 = 𝜇𝑜 estadística: Z= ത 𝑋 − 𝜇 𝜎 𝑛 ~ N(0 ; 1) ; bajo 𝐻0 : 𝑍𝑜𝑏𝑠= ത 𝑋 − 𝜇 𝜎 𝑛 𝛼 : nivel de significancia: i) 𝐻1: 𝜇 > 𝜇𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 ii) 𝐻1: 𝜇 < 𝜇𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 iii) 𝐻1: 𝜇 ≠ 𝜇𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 2 ó 𝑍𝑜𝑏𝑠 > 𝑍1− 𝛼 2
  • 6. b) 𝜎2 desconocida ; 𝐻0 = 𝜇𝑜 estadística : t = ത 𝑋 − 𝜇 ൗ 𝑆𝑛−1 𝑛 ~ t(n-1) ; bajo 𝐻0 : 𝑡𝑜𝑏𝑠 = ത 𝑋 − 𝜇 ൗ 𝑆𝑛−1 𝑛 𝛼 : nivel de significancia: i) 𝐻1: 𝜇 > 𝜇𝑜 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-1) ii) 𝐻1: 𝜇 < 𝜇𝑜 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-1) iii) 𝐻1: 𝜇 ≠ 𝜇𝑜 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 2 (n-1) o 𝑡𝑜𝑏𝑠 > 𝑡1− 𝛼 2 (n-1)
  • 7. C) Sea f(x) la distribución de probabilidad de la población con 𝜎2 conocida ; m.a.(n) ≥ 30 ( muestra grande); por el teorema central del limite : Para 𝐻0 : 𝜇 = 𝜇𝑜 ; estadística: Z= ത 𝑋 − 𝜇 𝜎 𝑛 ≈ N(0 ; 1) ; bajo 𝐻0 : 𝑍𝑜𝑏𝑠= ത 𝑋 − 𝜇 𝜎 𝑛 La región de rechazo para cada tipo de prueba es la misma del caso a). Si 𝜎2 es desconocida , use estimador insesgado 𝑆𝑛−1 2 . Tamaños de Muestra Para docimar la Media Dadas la probabilidades de 𝛼 y 𝛽 de error tipo I y tipo II respectivamente : a) 𝐻0 : 𝜇 = 𝜇𝑜 v/s 𝐻1 : 𝜇 = 𝜇1 , donde 𝜇1 < 𝜇0 ; n= 𝑍1−𝛼+𝑍1−𝛽 2 𝜎2 𝜇1−𝜇0 2 b) 𝐻0 : 𝜇 = 𝜇𝑜 v/s 𝐻1 : 𝜇 = 𝜇1 , donde 𝜇0 < 𝜇1 ; n= 𝑍1−𝛼+𝑍1−𝛽 2 𝜎2 𝜇1−𝜇0 2 c) 𝐻0 : 𝜇 = 𝜇𝑜 v/s 𝐻1 : 𝜇 = 𝜇1 , donde 𝜇0 ≠ 𝜇1 ; n= 𝑍1−𝛼/2+𝑍1−𝛽 2 𝜎2 𝜇1−𝜇0 2
  • 8. Valor p El valor p es la probabilidad de observar un valor de una estadística, si la hipótesis nula es verdadera. Sea W una estadística y 𝑊𝑜𝑏𝑠 su valor observado ; a) Si 𝐻0= 𝜃0 v/s 𝐻1 > 𝜃0 entonces Valor p = P( W ≥ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero). b) Si 𝐻0= 𝜃0 v/s 𝐻1 < 𝜃0 entonces Valor p = P( W ≤ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero). c) Si 𝐻0= 𝜃0 v/s 𝐻1 ≠ 𝜃0 entonces Valor p = 2 P( W ≤ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero) ó Valor p = 2 P( W ≥ 𝑊𝑜𝑏𝑠; cuando 𝐻0 es verdadero). Decisión : Valor p ≤ 𝛼 ; rechazar 𝐻0 al nivel de significancia 𝛼. Valor p > 𝛼 ; no rechazar 𝐻0 al nivel de significancia 𝛼. Si el Valor p ≤ 𝛼 : i) 𝛼 = 0.1 , hay evidencia que 𝐻0 no es verdadera. ii) 𝛼 = 0.05 , hay evidencia fuerte que 𝐻0 no es verdadera. iii) 𝛼 = 0.01 , hay evidencia muy fuerte que 𝐻0 no es verdadera. iv) 𝛼 = 0.001 , hay evidencia extremadamente fuerte que 𝐻0 no es verdadera.
  • 9. Dócima de hipótesis para la proporción de una población Población: X ~ ber(p) m.a.(n)≥ 30 𝐻0 :p = 𝑝𝑜 estadística: Z = ො 𝑝−𝑝 𝑝 1−𝑝 𝑛 ≈ N(0 ; 1) ; bajo 𝐻0 : 𝑍𝑜𝑏𝑠= ො 𝑝− 𝑝0 𝑝0 1−𝑝0 𝑛 𝛼 : nivel de significancia: i) 𝐻1: p > 𝑝𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 ii) 𝐻1: p < 𝑝𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 iii) 𝐻1: p ≠ 𝑝𝑜 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 2 ó 𝑍𝑜𝑏𝑠 > 𝑍1− 𝛼 2
  • 10. Dócima de hipótesis para la varianza de una población Población: X ~ N( 𝜇; 𝜎2 ) m.a.(n) 𝐻0 :𝜎2 = 𝜎0 2 estadística : 𝜒2 = (𝑛−1)𝑆𝑛−1 2 𝜎2 ~ 𝜒2 (n-1) ; bajo 𝐻0 : 𝜒𝑜𝑏𝑠 2 = (𝑛−1)𝑆𝑛−1 2 𝜎0 2 𝛼 : nivel de significancia: i) 𝐻1: 𝜎2 > 𝜎0 2 ; rechazar 𝐻0 si 𝜒𝑜𝑏𝑠 2 > 𝜒1−𝛼 2 (n-1) ii) 𝐻1: 𝜎2 < 𝜎0 2 ; rechazar 𝐻0 si 𝜒𝑜𝑏𝑠 2 < 𝜒𝛼 2(n-1) iii) 𝐻1: 𝜎2 ≠ 𝜎0 2 ; rechazar 𝐻0 si 𝜒𝑜𝑏𝑠 2 < 𝜒𝛼 2 2 (n-1) ó 𝜒𝑜𝑏𝑠 2 > 𝜒1− 𝛼 2 2 (n-1)
  • 11. Dócima de hipótesis de dos poblaciones Dócima de hipótesis para la razón de las varianzas poblacionales Poblaciones: 𝑋1~ 𝑁( 𝜇1; 𝜎1 2 ) e 𝑋2~𝑁 𝜇2; 𝜎2 2 independientes de tamaños 𝑛1 y 𝑛2. 𝐻0 : 𝜎1 2 = 𝜎2 2 estadística : F = ൘ 𝑆𝑛1−1 2 𝜎1 2 ൘ 𝑆𝑛2−1 2 𝜎2 2 = 𝑆𝑛1−1 2 𝑆𝑛2−1 2 * 𝜎2 2 𝜎1 2 ~ F(𝑛1-1 ; 𝑛2-1) ; bajo 𝐻0 : 𝐹𝑜𝑏𝑠 = 𝑆𝑛1−1 2 𝑆𝑛2−1 2 𝛼 : nivel de significancia: i) 𝐻1: 𝜎1 2 > 𝜎2 2 ; rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 > 𝐹1−𝛼(𝑛1−1 ; 𝑛2−1) ii) 𝐻1: 𝜎1 2 < 𝜎2 2 ; rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 < 𝐹𝛼(𝑛1−1 ; 𝑛2−1) iii) 𝐻1: 𝜎1 2 ≠ 𝜎2 2 ; rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 < 𝐹𝛼 2 (𝑛1−1 ; 𝑛2−1) ó 𝐹𝑜𝑏𝑠 > 𝐹1− 𝛼 2 (𝑛1−1 ; 𝑛2−1)
  • 12. Dócima de hipótesis para la diferencia de dos medias poblacionales Poblaciones: 𝑋1~ 𝑁( 𝜇1; 𝜎1 2 ) e 𝑋2~𝑁 𝜇2; 𝜎2 2 independientes de tamaños 𝑛1 y 𝑛2. 𝐻0 : 𝜇1= 𝜇2 o 𝐻0 : 𝜇1 - 𝜇2 = 0 casos a) 𝜎1 2 y 𝜎2 2 conocidas. estadística : Z = ( ത 𝑋1− ത 𝑋2 ) − 𝜇1− 𝜇2 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 ~ N (0; 1) ; bajo 𝐻0: 𝑍𝑜𝑏𝑠= ( ത 𝑋1− ത 𝑋2 ) 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 𝛼 : nivel de significancia: i) 𝐻1: 𝜇1 > 𝜇2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 ii) 𝐻1: 𝜇1 < 𝜇2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 iii) 𝐻1: 𝜇1 ≠ 𝜇2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 2 ó 𝑍𝑜𝑏𝑠 > 𝑍1− 𝛼 2
  • 13. b) 𝜎1 2 = 𝜎2 2 = 𝜎2 desconocidas. c) 𝜎1 2 ≠ 𝜎2 2 desconocidas. estadística: estadística: t = ( ത 𝑋1− ത 𝑋2 ) − 𝜇1− 𝜇2 𝑆𝑝 1 𝑛1 + 1 𝑛2 ~ 𝑡(𝑛1+𝑛2-2) ; t = ( ത 𝑋1− ത 𝑋2 ) − 𝜇1− 𝜇2 𝑆𝑛1−1 2 𝑛1 + 𝑆𝑛2−1 2 𝑛2 ~ 𝑡(𝑣) ; donde 𝑆𝑝 = 𝑛1−1 𝑆𝑛1−1 2 + 𝑛2−1 𝑆𝑛2−1 2 𝑛1+𝑛2−2 donde 𝑣 = 𝑆𝑛1−1 2 𝑛1 + 𝑆𝑛2 −1 2 𝑛2 2 𝑆𝑛1−1 2 𝑛1 2 𝑛1−1 + 𝑆𝑛2−1 2 𝑛2 2 𝑛2−1 bajo 𝐻0 : 𝑡𝑜𝑏𝑠 = ( ത 𝑋1− ത 𝑋2 ) 𝑆𝑝 1 𝑛1 + 1 𝑛2 bajo 𝐻0 : 𝑡𝑜𝑏𝑠 = ( ത 𝑋1− ത 𝑋2 ) 𝑆𝑛1−1 2 𝑛1 + 𝑆𝑛2−1 2 𝑛2 𝛼 : nivel de significancia: 𝛼 : nivel de significancia: i) 𝐻1: 𝜇1 > 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(𝑛1+𝑛2-2) i) 𝐻1: 𝜇1 > 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(v) ii) 𝐻1: 𝜇1 < 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 (𝑛1+𝑛2-2) ii) 𝐻1: 𝜇1 < 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 (v) iii) 𝐻1: 𝜇1 ≠ 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 2 (𝑛1+𝑛2-2) iii) 𝐻1: 𝜇1 ≠ 𝜇2 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 2 (v) ó 𝑡𝑜𝑏𝑠 > 𝑡1− 𝛼 2 (𝑛1+𝑛2-2) ó 𝑡𝑜𝑏𝑠 > 𝑡1− 𝛼 2 (v)
  • 14. d) La aproximación normal es muy buena si 𝑛1 ≥ 30 𝑦 𝑛2 ≥ 30 (muestras grandes ) sin importar si las distribuciones de las poblaciones no son normales ,entonces por el teorema central del limite: la estadística : Z = ( ത 𝑋1− ത 𝑋2 ) − 𝜇1− 𝜇2 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 ≈ N (0; 1) ; bajo 𝐻0: 𝑍𝑜𝑏𝑠= ( ത 𝑋1− ത 𝑋2 ) 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 La región de rechazo para cada tipo de prueba es la misma del caso a). si 𝜎1 2 y 𝜎2 2 son desconocidas use su estimador insesgado respectivo. Dócima de hipótesis para la diferencia de dos proporciones poblacionales Poblaciones: X~ ber ( 𝑝1) e Y ~ ber ( 𝑝2) independientes de tamaños 𝑛1 ≥ 30 𝑦 𝑛2 ≥ 30 . 𝐻0 : 𝑝1= 𝑝2 o 𝐻0 : 𝑝1 - 𝑝2 = 0 estadística : Z = (ෞ 𝑝1 −ෞ 𝑝2) − ( 𝑝1− 𝑝2) 𝑝1 1−𝑝1 𝑛1 + 𝑝2 1−𝑝2 𝑛2 ≈ N (0 ; 1) ; bajo 𝐻0: 𝑍𝑜𝑏𝑠= (ෞ 𝑝1 −ෞ 𝑝2) ො 𝑝 1− ො 𝑝 1 𝑛1 + 1 𝑛2 ;donde Ƹ 𝑝= 𝑥1+𝑥2 𝑛1+𝑛2 estimador insesgado de p. 𝛼 : nivel de significancia: i) 𝐻1: 𝑝1 > 𝑝2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 ii) 𝐻1: 𝑝1 < 𝑝2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 iii) 𝐻1: 𝑝1 ≠ 𝑝2 ; rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 < 𝑍𝛼 2 ó 𝑍𝑜𝑏𝑠 > 𝑍1− 𝛼 2
  • 15. Dócima de hipótesis para diferencia de medias poblaciones (𝜇1- 𝜇2), muestras pareadas Sea 𝑋1, … … 𝑋𝑛 una m.a. de una población 𝑁( 𝜇1; 𝜎1 2 ) e 𝑌1, … … 𝑌𝑛 una m.a. de una población 𝑁 𝜇2; 𝜎2 2 , la muestra esta formada por los pares (𝑋1; 𝑌1), (𝑋2; 𝑌2),….. (𝑋𝑛; 𝑌𝑛). Se define la v.a. D= X - Y cuya media es 𝜇𝐷=𝜇1- 𝜇2 y varianza 𝜎𝐷 2 = 𝜎1 2 +𝜎2 2 - 2cov(X;Y) , entonces D ~ N (𝜇𝐷 ; 𝜎𝐷 2 ) . La muestra aleatoria esta formada por 𝐷𝑖 = 𝑋𝑖 - 𝑌𝑖 ; i = 1,2,……,n . Los estimadores insesgados para 𝜇𝐷 y 𝜎𝐷 2 son respectivamente ഥ 𝐷 y 𝑆𝐷 2 . 𝐻0: 𝜇𝐷 = 0 estadística : t = ഥ 𝐷 − 𝜇𝐷 ൗ 𝑆𝐷 𝑛 ~ t(n-1) ; bajo 𝐻0 : 𝑡𝑜𝑏𝑠 = ഥ 𝐷 ൗ 𝑆𝐷 𝑛 𝛼 : nivel de significancia: i) 𝐻1: 𝜇𝐷 > 0 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-1) ii) 𝐻1: 𝜇𝐷 < 0 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-1) iii) 𝐻1: 𝜇𝐷 ≠ 0 ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 2 (n-1) o 𝑡𝑜𝑏𝑠 > 𝑡1− 𝛼 2 (n-1)
  • 16. Dócimas de Hipótesis : Regresión Lineal Simple y Correlación Modelo de Regresión Lineal Simple : Y = 𝛽𝑜+𝛽1X + 𝜀 Al tomar una m.a.(n); 𝑥𝑖; 𝑦𝑖 𝑖 = 1, … , 𝑛 de la población (X,Y), el Modelo de Regresión Lineal Estimado: ෠ 𝑌 = መ 𝛽𝑜+ መ 𝛽1X ; por el método de mínimos cuadrados se obtienen los estimadores para los parámetros 𝛽𝑜 y 𝛽1: መ 𝛽𝑜= 𝑦 - መ 𝛽1𝑥 y መ 𝛽1= σ 𝑥𝑖−𝑥 𝑦𝑖−𝑦 σ 𝑥𝑖−𝑥 2 = 𝑛 σ 𝑥𝑖𝑦𝑖−σ 𝑥𝑖 σ 𝑦𝑖 𝑛 σ 𝑥𝑖 2− σ 𝑥𝑖 2 Si los 𝜀𝑖~N( 0; 𝜎2) entonces: መ 𝛽𝑜 ~N(𝛽𝑜;𝜎෡ 𝛽𝑜 2 ) ;donde: 𝜎෡ 𝛽𝑜 2 = 𝜎2 σ 𝑥𝑖 2 𝑛 σ 𝑥𝑖−𝑥 2 y መ 𝛽1 ~N(𝛽1;𝜎෡ 𝛽1 2 ) ; 𝜎෡ 𝛽1 2 = 𝜎2 σ 𝑥𝑖−𝑥 2 Estimador insesgado para 𝜎2 esta dado por : ෢ 𝜎2 = σ 𝑦𝑖− ො 𝑦𝑖 2 𝑛−2 = σ 𝑦𝑖 2 −෡ 𝛽𝑜 σ 𝑦𝑖−෡ 𝛽1 σ 𝑥𝑖𝑦𝑖 𝑛−2 ; las varianzas estimadas para መ 𝛽𝑜 y መ 𝛽1 : ෢ 𝜎෡ 𝛽𝑜 2 = ෢ 𝜎2 σ 𝑥𝑖 2 𝑛 σ 𝑥𝑖−𝑥 2 y ෢ 𝜎෡ 𝛽1 2 = ෢ 𝜎2 σ 𝑥𝑖−𝑥 2
  • 17. La estadística t = ෡ 𝛽𝑗−𝛽𝑗 ෝ 𝜎෡ 𝛽𝑗 ~t(n-2) ; j=0,1 𝐻0: 𝛽𝑗= 𝛽𝑗 ∗ ; bajo 𝐻0 𝑡𝑜𝑏𝑠= ෡ 𝛽𝑗−𝛽𝑗 ∗ ෝ 𝜎෡ 𝛽𝑗 , j=0,1 , 𝛼:nivel de significancia i) 𝐻1: 𝛽𝑗 > 𝛽𝑗 ∗ ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-2) ii) 𝐻1: 𝛽𝑗 < 𝛽𝑗 ∗ ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-2) iii) 𝐻1: 𝛽𝑗 ≠ 𝛽𝑗 ∗ ; rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 < 𝑡𝛼 2 (n-2) o 𝑡𝑜𝑏𝑠 > 𝑡1− 𝛼 2 (n-2)
  • 18. Definición. El coeficiente de correlación lineal de la distribución f(x,y) bivariada X e Y está dada por : 𝜌(x,y) = 𝐸 𝑥−𝐸(𝑥) 𝑦−𝐸(𝑦) 𝐸 𝑥−𝐸(𝑥) 2 𝐸 𝑦−𝐸(𝑦) 2 = 𝐶𝑜𝑣(𝑥,𝑦) 𝜎𝑥 𝜎𝑦 ; -1 ≤ 𝜌(x,y) ≤ 1 Al tomar una m.a.(n); 𝑥𝑖; 𝑦𝑖 𝑖 = 1, … , 𝑛 de la población f(x,y); el estimador esta dado por : r(x,y)= σ 𝑥−𝑥 𝑦−𝑦 σ 𝑥−𝑥 2 σ 𝑦−𝑦 2 = 𝐶𝑜𝑣(𝑥,𝑦) 𝑆𝑥 𝑆𝑦 ; -1 ≤ 𝑟(x,y) ≤ 1 Dócima de Hipótesis para el Coeficiente de Correlación lineal 𝐻0: 𝜌= 0 ; estadística t = 𝑟 − 𝜌 𝑛−2 1−𝑟2 ~ t(n-2) ; bajo 𝐻0 𝑡𝑜𝑏𝑠= 𝑟 𝑛−2 1−𝑟2 𝛼:nivel de significancia a) 𝐻1: 𝜌 > 0 b) 𝐻1: 𝜌 < 0 c) 𝐻1: 𝜌 ≠ 0 rechazar 𝐻0 si rechazar 𝐻0 si rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 > 𝑡1−𝛼(n-2) 𝑡𝑜𝑏𝑠 < 𝑡𝛼(n-2) 𝑡𝑜𝑏𝑠 < 𝑡𝛼 2 (n-2) o 𝑡𝑜𝑏𝑠 > 𝑡1− 𝛼 2 (n-2) valor p=P(t(n-2)> 𝑡𝑜𝑏𝑠) valor p=P(t(n-2)< 𝑡𝑜𝑏𝑠) valor p=2P(t(n-2)< 𝑡𝑜𝑏𝑠) ó valor p=2P(t(n-2)> 𝑡𝑜𝑏𝑠) Decisión : rechazar 𝐻0 si 𝛼 > valor p.
  • 19. Nota. Si la inferencia concluye que 𝜌 ≠ 0,entonces para docimar 𝐻0: 𝜌= 𝜌0 se aplica la siguiente estadística bajo 𝐻0: 𝑍𝑜𝑏𝑠= 𝑛−3 2 ln 1+𝑟 1−𝜌0 1−𝑟 1+𝜌0 Para aplicar esta estadística se supone que las variables aleatorias X e Y tienen distribución normal bivariada. 𝛼:nivel de significancia a) 𝐻1: 𝜌 > 𝜌0 b) 𝐻1: 𝜌 < 𝜌0 c) 𝐻1: 𝜌 ≠ 𝜌0 rechazar 𝐻0 si rechazar 𝐻0 si rechazar 𝐻0 si 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 𝑍𝑜𝑏𝑠 < 𝑍𝛼 𝑍𝑜𝑏𝑠 < 𝑍𝛼 2 o 𝑍𝑜𝑏𝑠 > 𝑍1− 𝛼 2 Análisis de Varianza (ANOVA) ; Hipótesis, 𝐻0 : 𝛽1= 0 v/s 𝐻1: 𝛽1 ≠ 0 𝛼 : nivel de significancia , rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 > 𝐹1−𝛼(1; n-2) Fuente de Variación SC G.L. CM Fobs Debida a la Regresión SCR 1 CMR CMR/CME Debida a los Residuos SCE n-2 CME Total SCT n-1
  • 20. Análisis de Varianza (Anova) de un Factor o una Vía Sea X una variable aleatoria dependiente de un factor A que tiene k niveles o tratamientos Se supone que los k niveles , son k poblaciones independientes que denotaremos por : 𝑋1, 𝑋2, … … , 𝑋𝑘 cuyas medias y varianzas son respectivamente 𝜇1, 𝜇2, … … , 𝜇𝑘 y 𝜎1 2 , 𝜎2 2 , … … , 𝜎𝑘 2 . Las k poblaciones juntas constituyen la población total de la variable aleatoria X, cuya media total 𝜇 esta dada por 𝜇= σ𝑖=1 𝑘 𝜇𝑖 𝑘 . Los supuestos de este diseño de experimento son: a) Las k poblaciones son independientes . b) Cada una de las poblaciones tiene distribución normal, 𝑋𝑖~N(𝜇𝑖; 𝜎𝑖 2 ),i=1,2,…..,k c) Las k varianzas 𝜎𝑖 2 son iguales a la varianza común 𝜎2,(poblaciones homocedasticas). Sea 𝑋𝑖1, 𝑋𝑖2, … … , 𝑋𝑖𝑛𝑖 una muestra aleatoria de tamaño 𝑛𝑖 de la población i- ésima (v.a. 𝑋𝑖), tal que σ𝑖=1 𝑘 𝑛𝑖= n es el tamaño total de las K muestras. Los elementos 𝑋𝑖𝑗, j=1,2,…….,𝑛𝑖 son variables aleatorias independientes con distribución normal N(𝜇𝑖; 𝜎2 ), i=1,2,…..,k .
  • 21. X11 X21 ……. 𝑋𝑖1 …… 𝑋𝑘1 X12 X21 ……. 𝑋𝑖1 …… 𝑋𝑘1 ……………………………………………………. X1𝑛1 X2𝑛2 ……. 𝑋𝑖𝑛𝑖 …… 𝑋𝑘𝑛𝑘 1 2 i k Total Total 𝑋1. 𝑋2 . ……. 𝑋𝑖. …… 𝑋𝑘. X.. Tamaño 𝑛1 𝑛2 ……. 𝑛𝑖 …… 𝑛𝑘 n Medias 𝑋1. 𝑋2. ……. 𝑋𝑖. …… 𝑋𝑘. 𝑋.. Niveles o Tratamientos de un Factor A Datos de k muestras aleatorias independientes de la variable dependiente X donde : 𝑋𝑖. = σ𝑗=1 𝑛𝑖 𝑋𝑖𝑗,datos de la muestra i, i=1,2,..,k X.. = σ𝑖=1 𝑘 σ𝑗=1 𝑛𝑖 𝑋𝑖𝑗 , total de datos de las k muestras. σ𝑖=1 𝑘 𝑛𝑖= n es el total observado en las K muestras. 𝑋𝑖. = 𝑋𝑖. 𝑛𝑖 es la media de la muestra i, (estimación insesgada de la media 𝜇𝑖). 𝑋.. = 𝑋.. 𝑛 es la media total muestral , (estimación insesgada de la media 𝜇).
  • 22. Dado que E(𝑋𝑖𝑗) = 𝜇𝑖 ; i=1,2,…..,K , el modelo lineal apropiado para el experimento completamente aleatorizado de un factor es : 𝑋𝑖𝑗= 𝜇𝑖 + 𝑒𝑖𝑗 , j=1,2,…., 𝑛𝑖 , i=1,2,…..,k ,donde 𝑒𝑖𝑗 : error o residuo Dado que las variables aleatorias 𝑋𝑖𝑗 son independientes y con distribución N(𝜇𝑖;𝜎2 ), entonces los 𝑒𝑖𝑗 son variables independientes con distribución N(0; 𝜎2 ). El modelo puede ser representado en forma equivalente por: 𝑋𝑖𝑗= 𝜇 + 𝛼𝑖 + 𝑒𝑖𝑗 , donde 𝛼𝑖 = 𝜇𝑖 - 𝜇 es el efecto del tratamiento i del factor. Hipótesis estadísticas en el modelo de clasificación simple(de efectos fijos). 𝐻0 : 𝜇1=𝜇2=……=𝜇𝑘= 𝜇 v/s 𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 , i ≠ j Las medias de los k tratamientos No todas las medias son iguales. (poblaciones) son iguales ,(o los k provienen de la misma población). En forma equivalente por : 𝐻0 : 𝛼1=𝛼2=……= 𝛼𝑘= 0 v/s 𝐻1 : 𝛼𝑖 ≠ 0 No hay efecto en todos los Al menos un 𝛼𝑖 no es igual a cero. k tratamientos.
  • 23. La dócima de hipótesis se basa en la partición de la variabilidad total de X dada por: σ𝑖=1 𝑘 σ𝑗=1 𝑛𝑖 𝑋𝑖𝑗 − 𝑋.. 2 = σ𝑖=1 𝑘 𝑛𝑖 𝑋𝑖. − 𝑋.. 2 + σ𝑖=1 𝑘 σ𝑗=1 𝑛𝑖 𝑋𝑖𝑗 − 𝑋𝑖. 2 Suma cuadrado total. = Suma de cuadrados + Suma de cuadrados dentro entre tratamientos de los tratamientos (error). (factor A). Se puede resumir como SCT = SCA + SCE Bajo 𝐻0 las varianzas muestrales : 𝑆𝐶𝑇 𝑛−1 , 𝑆𝐶𝐴 𝑘−1 y 𝑆𝐶𝐸 𝑛−𝑘 , son estimaciones insesgadas de 𝜎2. Las tres estimaciones de la varianza común se denominan cuadrados medios y se denotan respectivamente : CMT ; CMA y CME . Además sabemos que : 𝑆𝐶𝑇 𝜎2 ~𝜒2(n-1) , 𝑆𝐶𝐴 𝜎2 ~𝜒2(k-1) y 𝑆𝐶𝐸 𝜎2 ~𝜒2(n-k),si 𝐻0 es verdadera. la estadística de la dócima de hipótesis es : F = ൗ 𝑆𝐶𝐴 𝜎2 𝑘−1 ൗ 𝑆𝐶𝐸 𝜎2 𝑛−𝑘 = 𝐶𝑀𝐴 𝐶𝑀𝐸 ~ F(k-1;n-k) , si 𝛼 es el nivel de significancia 𝐹𝑜𝑏𝑠 > 𝐹𝛼(k-1: n-k) rechazar 𝐻𝑜 y concluimos que hay diferencia entre las medias y por lo tanto hay influencia de los tratamientos sobre la variable estudiada.
  • 24. Podemos resumir algunos resultados importantes en la siguiente tabla: Anova 𝛼 nivel de significancia, si 𝐹𝑜𝑏𝑠 > 𝐹𝛼(k-1 ; n-k) rechazar 𝐻𝑜 y concluimos que hay diferencia entre las medias y por lo tanto hay influencia de los tratamientos sobre la variable en estudio. Usando el valor p = P(𝐹𝛼(k-1 ; n-k) > 𝐹𝑜𝑏𝑠),rechazar 𝐻𝑜 si 𝛼 >valor p. Para calcular las sumas de cuadrados total, de los tratamientos y del error puede aplicar: SCT = σ𝑖=1 𝑘 σ𝑗=1 𝑛𝑖 𝑋𝑖𝑗 − 𝑋.. 2 = σ𝑖=1 𝑘 σ𝑗=1 𝑛𝑖 𝑋𝑖𝑗 2 - Τ 𝑋. . 2 𝑛 SCA = σ𝑖=1 𝑘 𝑛𝑖 𝑋𝑖. − 𝑋.. 2 = σ𝑖=1 𝑘 𝑋𝑖. 2 𝑛𝑖 - Τ 𝑋. . 2 𝑛 y SCE = SCT – SCA . Fuentes de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio 𝐹𝑜𝑏𝑠 Entre Tratamientos o factor A Error (Dentro de los Tratamientos) SCA SCE k-1 n-k CMA CME CMA CME Total SCT n-1
  • 25. Ejemplo. Un ingeniero va a decidir la compra de una de 4 maquinas de marcas diferentes para su uso en una producción especifica .Por esto, utilizo cada maquina al azar para procesar 6 unidades del producto registrando los tiempos por unidad, en segundos, resultando así el experimento completamente aleatorio. Los datos son los siguientes de las 4 muestras independientes: X : tiempos (en segundos) empleados en la producción A:Máquinas M1 M2 M3 M4 55 60 64 42 46 58 62 45 45 68 51 52 73 58 57 44 50 63 65 42 63 52 68 50 𝑋𝑖. 332 359 367 275 X.. =1333 𝑛𝑖 6 6 6 6 n = 24 𝑋𝑖. 55.33 59.83 61.17 45.83 𝑋.. = 55.54 Con un nivel de significancia de 0.05, Docímese la hipótesis que las máquinas utilizan la misma velocidad media para procesar el producto. Solución. Variable dependiente X: tiempo para procesar el producto, en segundos. Variable independiente o factor A: máquinas, con niveles o tratamientos M1,M2,M3 y M4. Modelo del Anova : 𝑋𝑖𝑗= 𝜇 + 𝛼𝑖 + 𝑒𝑖𝑗 , donde 𝛼𝑖 = 𝜇𝑖 - 𝜇 es el efecto en X que produce la máquina i del factor. Hipótesis : 𝐻0 : 𝜇1=𝜇2=𝜇3=𝜇4=𝜇 v/s 𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 , i ≠ j Anova: SCT= σ𝑖=1 𝑘 σ𝑗=1 𝑛𝑖 𝑋𝑖𝑗 2 - Τ 𝑋. . 2 𝑛 = 75921-74037.042 = 1883.958 SCA = σ𝑖=1 𝑘 𝑋𝑖. 2 𝑛𝑖 - Τ 𝑋. . 2 𝑛 =74903.167-74037.042 = 866.125 SCE = SCT – SCA = 1883.958 – 866.125 = 1017.833
  • 26. Fuentes de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio 𝐹𝑜𝑏𝑠 Entre las Máquinas Error 866.125 1017.833 3 20 288.708 50.892 5.673 Total 1883.958 23 RC = { 𝐹𝑜𝑏𝑠 > 𝐹0.95(3 ; 20) } = { 5.673 > 3.0984 } Decisión : rechazar 𝐻0 Conclusión : El factor máquina tiene efecto significativo sobre el tiempo necesario para realizar la producción, es decir , existen diferencias significativas entre las velocidades de las máquinas. Valor p = P(F (3 ; 20) > 5.673) = 0.0056