SlideShare una empresa de Scribd logo
1 de 178
Descargar para leer sin conexión
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
13 
A. Aspectos preliminares 
1. Competencias 
1.1. Conceptuales 
Reconoce el concepto de estimación puntual y por intervalos. 
1.2. Procedimentales 
Calculan estimaciones puntuales o intervalicas de los parámetros de una población. 
1.3. Actitudinales 
Resuelve situaciones en donde se quiere estimar los parámetros de una población en estudio. 
B. Desarrollo del contenido, sus procedimientos y modalidad 
1. Contenido programático 
El contenido programático de la unidad referida es el siguiente: Estimación de parámetros: Introducción: Estimación Puntual (Estimación puntual para la media poblacional, Estimación Puntual para la varianza poblacional, Estimación de parámetros de dos poblaciones, Estimación puntual de una población de variable cualitativa, Estimación puntual de dos poblaciones de variables cualitativas) y Estimación por intervalos (Intervalo de confianza para la media poblacional, Intervalo de confianza para la diferencia de medias poblacionales, Intervalo de confianza para la proporción poblacional, Intervalo de confianza para la diferencia de proporciones poblacionales). 
2. Modalidad y procedimiento de desarrollo de la unidad 
Durante la fase a distancia 
a) Cada alumno lee la primera unidad del módulo. 
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. 
c) Remite las prácticas y los trabajos a la página web de PROESAD 
Durante la fase presencial/tutorial 
a) Exposición sobre los trabajos elaborados y remitidos. 
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
14 
Tutoría Nº 
Estimación de parámetros: 
estimación puntual y estimación 
por intervalos 
1.1. INTRODUCCIÓN 
Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones respecto a 
una población, de los datos obtenidos realmente de una muestra. 
La inferencia estadística comprende dos tipos principales de técnicas: Estimación de parámetros y 
contrastación de hipótesis. Independientemente de la técnica que se utilice, la finalidad general es 
utilizar datos de una muestra para extraer conclusiones respecto a una población. 
1.2. ESTIMACIÓN DE PARÁMETROS 
Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa respecto 
al valor de una característica de la población y desea conocer cuál podría ser tal valor. 
La estimación puede asumir 2 formas: 
- Estimación puntual 
- Estimación por intervalos 
1.2.1. Estimación puntual 
Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar el 
parámetro desconocido de la población. 
Una desventaja de esta forma de estimación es que no aporta la precisión de la estimación del 
parámetro. 
Las estimaciones puntuales más usuales son: 
(A) Estimación Puntual para la media poblacional. 
Se halla mediante las siguientes fórmulas. 
- Para datos simples - Para datos agrupados 
f 
x f 
= x = 
n 
x 
= x = 
i 
i i i 
(B) Estimación Puntual para la varianza poblacional. 
Se halla mediante las siguientes fórmulas. 
- Para datos simples - Para datos agrupados 
f 
x f n x 
= s = 
n 
x n x 
= s = 2 2 2 
1 
( ) 
1 
( ) 2 2 
2 
2 2 
1
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
15 
(C) Estimación de parámetros de dos poblaciones 
Sea X1 una variable aleatoria que se distribuye como una distribución normal con media 1 
y varianza 2 
1 e X2 otra variable aleatoria que se distribuye como una distribución normal 
con media 2 y varianza 2 
2 . 
La estimación de parámetros de dos poblaciones se pueden realizar mediante: 
a) La comparación de sus medias, luego: 
1 2 1 2 1 2 - = ˆ - ˆ = x - x 
b) La comparación de sus varianzas, luego: 
s 
s 
= = 
2 
x 
2 
x 
x 
x 
x 
2 
x 
2 
1 
2 
1 
2 
2 
1 
2 
ˆ 
ˆ ˆ 
(D) Estimación puntual de una población de variable cualitativa 
Sea X una variable cualitativa con: 
A : Presencia de la característica 
y Q = 1 - P 
0, si X A 
1, si X A 
N 
M 
N 
X 
con P 
X 
i 
Luego: 
y q = 1 - p 
0, si x A 
1, si x A 
n 
m 
N 
x 
con p 
x 
i 
Entonces: P 
p 
(E) Estimación puntual de dos poblaciones de variables cualitativas 
Sea X1 la variable aleatoria de una población cualitativa con Px1 proporción de aciertos en X1 
y sea X2 la variable aleatoria de otra población cualitativa con Px2 proporción de aciertos en 
X2, luego: 
Px1 - Px2 = Px1 - Px2 = px1 - px2 ˆ ˆ 
1.2.2. Estimación por intervalos 
La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el parámetro 
tiene la probabilidad especificada de estar. Los estimados por intervalos se conocen como 
intervalos de confianza y los límites inferior y superior como los límites de confianza. 
En general el intervalo de confianza para el parámetro se expresa: 
P(  - k  + k ) = 1 -  
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
16 
Donde: 
= Parámetro 
= Estimador 
k = Valor tabulado 
= Desviación estándar del estimador 
1 = Nivel de confianza 
Los intervalos de confianza más usuales son: 
(A) Intervalo de confianza para la media poblacional ( ) 
Para determinar el intervalo de confianza para la media poblacional se debe tomar en 
cuenta lo siguiente: 
- Cuando se conoce la varianza de la población y/o el tamaño de muestra n 30. 
P( x - Z 
n 
x + Z 
n 
) = 1 - 
2 2 
(1 ) (1 ) 
- Cuando no se conoce la varianza de la población y el tamaño de muestra n < 30. 
P( x - t 
s 
n 
x + t 
s 
n 
( n ( ) = 1 - 
2 
1 ,n-1) 
2 
, 1) 1 
(B) Intervalo de confianza para la diferencia de medias poblacionales 
Se presentan los siguientes casos: 
- Si 2 
1 y 2 
2 son conocidos 
] = 1 - 
n 
+ 
n 
- ( x - x ) + Z 
n 
+ 
n 
P[( x - x ) - Z 
2 2 2 2 
2 
2 
2 
1 
1 
) 
2 
1 2 1 2 (1 
2 
2 
1 
1 
1 2 (1 ) 
- Si 2 
1 y 2 
2 no son conocidos 
se presentan dos casos: 
a. Si 2 
1 es aproximadamente igual a 2 
y entonces 
2 
1 2 
2 
2 
) ] = 1- 
n 
1 
+ 
n 
1 
) - ( x - x )+t s ( 
n 
1 
+ 
n 
1 
P[( x - x ) - t s ( 2 
,n-1) 
2 
( 
2 
,n-1) 
2 
( 
1 2 
1 2 1 2 1 
1 2 
1 2 1 
n + n - 2 
( n - 1) s + ( n - 1) s 
donde: s = 
2 2 
2 
1 2 
1 1 2 2 
b. Cuando 2 
1 es diferente a 2 
2 
] =1 - 
n 
s 
+ 
n 
s 
- ( x - x ) + t 
n 
s 
+ 
n 
s 
P[( x - x ) - t 
2 2 
n-1) 
2 2 
,n-1) 
2 
( 
2 
2 
1 
1 
, 
2 
1 2 1 2 (1 
2 
2 
1 
1 
1 2 1 
Observación: 
Sí n1+ n2 - 2 30, el valor tabulado es Z(1 - /2) 
Sí n1 + n2 - 2 < 30, el valor tabulado es t(n1 + n2 – 2, 1 - /2)
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
17 
(C) Intervalo de confianza para la proporción poblacional 
Se presentan los siguientes casos: 
- Cuando el tamaño de muestra es grande (n 30) 
P(p - Z 
pq 
n 
P p + Z 
pq 
n 
= 1 - 
2 2 
(1 ) (1 ) ) 
- Cuando el tamaño de muestra es pequeño (n < 30) 
P(p - t 
pq 
n 
P p + t 
pq 
n 
( ) = 1 - 
2 
,n-1) ( 
2 
1 1 ,n-1) 
(D) Intervalo de confianza para la diferencia de proporciones poblacionales 
Se pueden presentan los siguientes casos: 
- Si, n1 y n2 son muestras grandes (n1 + n2 - 2 30) 
] = 1- 
n 
p q 
+ 
n 
p q 
P - P ( p - p )+Z 
n 
p q 
+ 
n 
p q 
P[( p - p ) - Z 
2 2 
2 
2 2 
1 
1 1 
1 2 1 2 (1 ) 
2 
2 2 
1 
1 1 
1 2 (1 ) 
- Si, n1 y n2 son muestras pequeñas (n1 + n2 - 2 30) 
] = 1- 
n 
p q 
+ 
n 
p q 
P - P ( p - p )+t 
n 
p q 
+ 
n 
p q 
P[( p - p ) - t ,n-1) 
2 
,n-1) ( 
2 
( 
2 
2 2 
1 
1 1 
1 2 1 2 1 
2 
2 2 
1 
1 1 
1 1 (1 
Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80, n2 = 20 se 
recomienda emplear: 
n + n 
n p + n p 
donde : p = 
) 
n 
1 
+ 
n 
1 
s = p(1 - p )( 
x y 
2 
1 2 
1 1 2 2 
esta proporción denota la proporción conjunta de las dos muestras. 
Ejemplo 1.1 
Se ensaya un test para determinar el cociente de inteligencia a 8 alumnos; los resultados fueron: 
98, 108, 92, 111, 102, 95, 89, 115. 
Determine: a) estimación puntual y b) estimación por intervalo (use el 90% de confianza) para el 
promedio verdadero del cociente de inteligencia. 
Solución 
n = 8, x = 101.25, s = 9.38 1- = 0.90 Luego 
2 
1 = 0.95 
como n 30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895 
a) Estimación puntual: 
Por formula 
xi 
= x = 
n 
x 101.25
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
18 
b) Estimación por intervalo: 
Por formula 
) = 1 - 
n 
s 
x + t 
n 
s 
P( x - t ( 7,.0.95) ( 7,0.95) 
Reemplazando: 
P( - ) = 1 - 
8 
9.38 
101.25 1.895 
8 
9.38 
101.25 1.895 
Se obtiene 
P[ 94.97 107.53] = 90% 
Luego el promedio verdadero del cociente de inteligencia de los alumnos se encuentra entre 94.97 
y 107.53, con un nivel de confianza de 90%. 
Ejemplo 1.2 
Una muestra aleatoria de 100 hogares de una ciudad indica que el promedio de los ingresos 
mensuales es de $ 500. Encuentre un intervalo de confianza del 95 % para la media poblacional 
de los ingresos de todos los hogares de esa ciudad. Suponga σ = $ 110. 
Solución 
n = 100, x = 500 σ = $ 110 1- = 0.95 luego 
2 
1 = 0.975 
como n = 30, entonces Z(1 - /2) = Z(0.95) = 1.96 
Por formula 
(1 ) (1 ) 
2 2 
P( x - Z x + Z )= 1 - 
n n 
Reemplazando 
110 110 
500 1.96 500 1.96 ) 95% 
100 100 
P( - + = 
Se obtiene 
P[ 478.44 521.56] = 95% 
Esto, es se tiene una confianza del 95% que el promedio del ingreso familiar poblacional de esa 
ciudad, está en el intervalo $ 478.44 y $ 521.56. 
Ejemplo 1.3 
Como parte de un experimento, una gran empresa manufacturera encontró que el tiempo 
promedio requerido para que 16 empleados escogidos al azar completaran una tarea determinada 
era de 26 minutos, la desviación estándar 5 minutos. Construir el intervalo de confianza del 95% 
para la media poblacional. 
Solución 
n = 16 x = 26 s = 5 1- = 0.95 Luego 
2 
1 = 0.975 
como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131 
Por formula 
) = 1 - 
n 
s 
x + t 
n 
s 
P( x - t (15,0.975) (15,0.975)
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
19 
Reemplazando 
) 95% 
16 
5 
26 2.131 
16 
5 
P( 26 - 2.131 + = 
Se obtiene 
P[ 23.34 28.66 ] = 95% 
Ejemplo 1.4 
Se ha hecho un estudio de las diferencias entre estudiantes universitarios del primer año que 
estuvieron en academias y estudiantes que no estuvieron. Para ello se tomó una muestra aleatoria 
de 50 estudiantes universitarios que habían asistido a academias y una muestra aleatoria simple 
independiente de 60 estudiantes que no lo habían hecho. Al final del primer semestre se 
administró a los estudiantes una prueba de rendimiento en matemática. Los que habían asistido a 
academias, obtuvieron un puntaje promedio de 14,5, con una varianza de 4,8; y el puntaje 
promedio para el grupo que no había asistido a la academia, fue de 13,75 con una varianza de 
6,4. Construya un intervalo de confianza para la diferencia entre las dos medias poblacionales 
(use 99% de confianza). 
Solución 
ASISTIERON ACADEMIA 
NO ASISTIERON 
ACADEMIA 
n1 = 50 
x1 =14.5 
s2 
1 = 4.8 
n2 = 60 
2 x =13.75 
s2 
2 = 6.4 
1 - = 0.99 luego 1- 
2 
= 0.995 
Como n1 + n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 
Por formula 
] =1 - 
n 
s 
+ 
n 
s 
- ( x - x ) + z 
n 
s 
+ 
n 
s 
P[( x - x ) - z 
2 2 
) 
2 2 
) 
2 
( 
2 
2 
1 
1 
2 
1 2 1 2 (1 
2 
2 
1 
1 
1 2 1 
Reemplazando 
99% 
60 
6.4 
50 
4.8 
14.5 13.75 2.58 
60 
6.4 
50 
4.8 
14.5 13.75 2.58 1 2 P[( - ) - + - ( - ) + + ] = 
Se obtiene 
0.41 1.91 99% 1 2 P[ - ]= 
Ejemplo 1.5 
Los estudiantes que se matricularon en un curso de investigación educativa fueron distribuidos al 
azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades para enriquecer el curso. 
El grupo B estudió mediante el método tradicional de conferencias. Los puntajes obtenidos en una 
prueba de rendimiento, hecha al terminar el curso dieron los siguientes resultados: 
Grupo n x s 
A (1) 10 80 8 
B (2) 12 72 10 
Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios 
poblacionales.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
20 
Solución 
1 - = 0.90 luego 1 - 
2 
= 0.95 
Como n1 + n2 –2 < 30 entonces t (n1 + n2 –2,1– /2) = t(20, 0.95) = 1.725 
Por formula 
] = 1- 
n 
s 
+ 
n 
s 
- ( x - x )+t 
n 
s 
+ 
n 
s 
P[( x - x ) - t 
2 2 
(n n 
2 2 
(n n 
2 
2 
1 
1 
1 2 1 2 2,1 / 2) 
2 
2 
1 
1 
1 2 1 2 2,1 / 2) 1 2 
Reemplazando 
90% 
12 
100 
10 
64 
80 72 1.725 
12 
100 
10 
64 
80 72 1.725 1 2 P[( - ) - + - ( - )+ + ] = 
Se obtiene 
1.38 14.62 90% 1 2 P[ - ] = 
Ejemplo 1.6 
Una encuesta para verificar las actitudes de los empleados ante el boletín mensual, se les pidió a 
500 empleados de una gran organización nacional que indicaran con que frecuencia leían el 
boletín de noticias. De los 500, 375 informaron que leían todas las ediciones. Construir el intervalo 
de confianza del 95% para la proporción real de los que opinan afirmativamente. 
Solución: 
n = 500 p = 
500 
375 
= 0.75 q =0.25 1- = 0.95 luego 
2 
1 = 0.975 
Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96 
Por formula 
] = 1 - 
n 
pq 
P p + Z 
n 
pq 
P[p - Z (1 / 2) (1 / 2) 
Reemplazando 
95% 
500 
0.75(0.25) 
0.75 1.96 
500 
0.75(0.25) 
P[ 0.75 - 1.96 P + ] = 
Se obtiene 
P[ 0.71 P 0.79 ] = 95% 
Ejemplo 1.7 
En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto programa de 
televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado. Determinar los límites 
de confianza del 99% para la diferencia de proporciones de todos los adultos y jóvenes que vieron 
con agrado el programa. 
Solución 
ADULTOS JÓVENES 
n1= 400 
a1 = 100 
p1 = 0.25 
1 
1 
n 
a 
q1 = 1-p1 = 0.75 
n2 = 60 0 
a2 = 300 
p2 = 0.5 
2 
2 
n 
a 
q2 = 1 – p2 = 0.5 
1 - = 0.99 Luego 1- 
2 
= 0.995
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
21 
Como n1+ n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 
Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza mancomunada 
así: 
n + n 
n p + n p 
p = 
1 2 
1 1 2 2 
Reemplazando 
0.4 
1000 
400 
400 600 
100 300 
+ 
+ 
p = 
) 
n 
1 
+ 
n 
1 
s = p(1 - p )( 
1 2 
) 
1 
+ 
1 
s = ( )( 0.032 
400 600 
0.4 0.6 
Por formula 
) ] =1 - 
n 
1 
+ 
n 
1 
) P - P ( p - p )+ Z p(1 - p )( 
n 
1 
+ 
n 
1 
P[( p - p ) - Z p(1 - p )( 
1 2 
1 2 1 2 (1/ / 2 
1 2 
1 2 (1/ / 2 
Reemplazando 
P[( 0.25 0.5 ) - 2.58(0.032) P - P ( 0.25 0.5 )+2.58(0.032) ] = 99% A J 
Se obtiene 
0.33 0.17 99% 1 2 P[ P - P ] =
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
22 
AUTOEVALUACIÓN 
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: 
( ) El método de estimación de un parámetro puede ser: puntual o por intervalos. 
( ) La Inferencia estadística comprende dos tipos principales de técnicas. 
( ) La estimación por intervalos contiene el cálculo de una sola cifra numérica. 
( ) Se obtiene conclusiones de la población a través de la información de la muestra. 
( ) En la estimación puntual incluye un intervalo en el que están comprendidos los 
valores del parámetro. 
2. De una población se escogieron al azar 10 personas y se les tomo la estatura. Los resultados en cm fueron: 160, 170, 170, 150, 160, 180, 160, 170, 130, 150. 
a) Estime la media y la varianza. 
3. En una universidad se desea conocer la opinión de los estudiantes acerca de ciertas medidas que han tomado las directivas. De 120 estudiantes consultados, 90 estuvieron a favor. 
a) Estime la proporción de estudiantes que están a favor de las medidas 
4. Para estimar la media del consumo (dólares) en el restaurante de una universidad, se tomó una muestra de 49 profesores. Suponga una desviación estándar poblacional de 5 dólares. Si la media en la muestra fue de 24.80 dólares mensuales. 
a) ¿Cuál fue el intervalo de confianza de 95% para el consumo medio poblacional? 
5. Los siguientes números representan el tiempo(en minutos) que tardaron 15 operarios en familiarizarse con el manejo de una nueva máquina adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8. 
a) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo promedio. 
b) El instructor considera que el tiempo promedio requerido por los trabajadores es mayor que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado? 
6. Una marca de lavadoras quiere saber la proporción de amas de casa que preferirían usar su marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usarían. 
a) Calcula un intervalo de confianza del 95% para la verdadera proporción de amas de casa que preferirían dicha lavadora.
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
23 
Unidad 2 
PRUEBA DE HIPOTESIS DE PARAMETRO POBLACIONALES 
Nº de tutorías: Dos 
Tutoría Nº 1: PRUEBA DE HIPÓTESIS: CONCEPTOS BÁSICOS; PRUEBA DE HIPÓTESIS PARA UNA MEDIA; UNA VARIANZA Y DOS VARIANZA POBLACIONAL 
Tutoría Nº 2: PRUEBA DE HIPÓTESIS: PROPORCIÓN POBLACIONAL; DOS MEDIAS POBLACIONALES; DOS PROPORCIONES POBLACIONALES.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
24
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
25 
A. Aspectos preliminares 
1. Competencias 
1.1. Conceptuales 
Reconoce el concepto de prueba de hipótesis para los parámetros. 
1.2. Procedimentales 
Comprobar las pruebas de hipótesis en las investigaciones científicas. 
1.3. Actitudinales 
Resuelve situaciones en donde el interés es probar hipótesis de los parámetros de una población en estudio. 
B. Desarrollo del contenido, sus procedimientos y modalidad 
1. Contenido programático 
El contenido programático de la unidad referida es el siguiente: Introducción, Concepto prueba de hipótesis, hipótesis nula, hipótesis alternativa, errores de prueba y nivel de significación, pruebas bilaterales y unilaterales, prueba de hipótesis referida a la media poblacional, prueba de hipótesis sobre la varianza poblacional, prueba de hipótesis referida a dos variancias poblacionales, prueba de hipótesis referida a la proporción poblacional, prueba de hipótesis referida a la diferencia entre dos medias poblacionales, prueba de hipótesis referida a la diferencia entre dos proporciones poblacionales 
2. Modalidad y procedimiento de desarrollo de la unidad 
Durante la fase a distancia 
a) Cada alumno lee la primera unidad del módulo. 
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. 
c) Remite las prácticas y los trabajos a la página web de PROESAD 
Durante la fase presencial/tutorial 
a) Exposición sobre los trabajos elaborados y remitidos. 
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
26 
Tutoría Nº 
Prueba de hipótesis: conceptos básicos; prueba de hipótesis para una media; una varianza y dos varianza poblacional 
2.1. INTRODUCCIÓN 
El objetivo es dar algunos métodos que se usan para tomar decisiones sobre poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se debe partir de afirmaciones o conjeturas con respecto a la población en el que estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura hecha sobre una población o sobre sus parámetros deberá ser sometida a comprobación experimental con el propósito de saber si los resultados de una muestra aleatoria extraída de esa población, contradicen o no tal conjetura. 
A continuación definiremos algunos conceptos básicos para la prueba de hipótesis. 
2.2. HIPÓTESIS 
Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación. Por esta razón se le denomina hipótesis de investigación. 
Generalmente hay que volver a plantear las hipótesis de investigación convenientemente de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas las hipótesis reciben el nombre de hipótesis estadística. 
2.3. HIPÓTESIS ESTADÍSTICAS 
Una hipótesis estadística es un enunciado o proposición respecto a uno o más parámetros de la población. A fin de probar una proposición, es preciso formular una hipótesis denominada nula juntamente con otra denominada hipótesis alternativa. 
2.3.1. Hipótesis nula (Ho) 
Son aquellas que están referidas a algún parámetro de la población o de las poblaciones de estudio. Estas son llamadas hipótesis científicas. 
2.3.2. Hipótesis alternativa (Ha) 
Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la que sirve para contrastarla. 
2.4. ERRORES DE PRUEBA Y NIVEL DE SIGNIFICACIÓN 
Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal caso estaremos cometiendo el denominado ERROR DE TIPO I. 
De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos, estaremos decidiendo bien. 
2
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
27 
Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha 
probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos 
corresponde al NIVEL DE SIGNIFICACIÓN. 
P(ERROR TIPO I) = 
Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o falsa. 
DECISIÓN 
SOBRE Ho 
NATURALEZA DE Ho 
Cierta Falsa 
No rechazar 
Rechazar 
Decisión 
Correcta 
Error tipo I 
(Probabilidad ) 
Error tipo II 
(probabilidad ) 
Decisión 
correcta 
Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es posible 
minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas de tal modo que 
al disminuir una de ellas la otra aumenta. Así si queremos minimizar inmediatamente aumenta la 
probabilidad de y viceversa. Generalmente el investigador fija apriori el error que está 
dispuesto a tolerar, es decir la probabilidad máxima de cometer el error de tipo I. 
La decisión de una prueba estadística está asociada al nivel de significación: 
a) Si P < 0.05 ( = 0.05) 
se dice que existe significación en la prueba 
b) Si P < 0.01 ( = 0.01) 
se dice que existe alta significación en la prueba 
Pruebas bilaterales y unilaterales 
Cuando tenemos hipótesis alternativa de la forma: 
Ho : = 0 Ho : P = Po 
Ha : 0 Ha : P Po 
Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser mayor, 
significativamente o acaso menor, significativamente. En tales casos el nivel de significación 
queda partido en /2 en cada lado de la distribución del estadístico o función de prueba. 
Tendremos entonces una prueba bilateral o no direccionada (dos puntos críticos) 
De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también 
estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales o direccionada (un 
punto crítico) 
Ho : = 0 
Ha : 0 
1 
2 
1 
2
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
28 
Ho : = 0 
Ha : 0 
A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama REGIÓN 
DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN. 
Una prueba de contrastación de hipótesis estadística se conduce básicamente según el siguiente 
procedimiento. 
1. Plantear las hipótesis 
- Hipótesis nula (Ho) 
- Hipótesis alternativa (Ha) 
2. Establecer el nivel de significación de prueba ( ) 
3. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha función de 
prueba. 
4. Efectuar el reemplazo numérico en la función de prueba con la información muestral. 
5. Determinar las regiones de aceptación o rechazo en la distribución de la función de prueba, 
según se trate de pruebas bilaterales o unilaterales. 
6. Tomar una decisión sobre Ho, según la siguiente regla: 
a. Rechazar Ho si el valor de la función de prueba cae en la región de rechazo. 
En tal caso se concluirá que Ho se rechaza en favor de Ha con una significación 
estadística. 
b. No rechazar Ho si el valor de la función de prueba cae en la región de aceptación. 
En tal caso se concluirá de que la información muestral no brinda suficientes evidencias 
como para sospechar de que Ho no sea cierta. 
7. Establecer la conclusión, según la hipótesis que se acepte. 
2.5. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL 
Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las características de una 
población normal. 
Las hipótesis referentes a este parámetro pueden ser: 
Ho: μ = μo 
Ha: μ μo Prueba bilateral o de dos colas 
Ho: μ = μo 
Ha: μ μo Prueba unilateral de cola a la derecha 
Ho: μ = μo 
Ha: μ μo Prueba unilateral de cola a la izquierda 
Dicha prueba se efectúa mediante la siguiente función de prueba: 
a) Si la desviación estándar poblacional no es conocida o n<30 
o 
o 
t = (n-1) 
x - 
s/ n 
t 
1
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
29 
b) Si la desviación estándar poblacional es conocida ó n≥30 
n 
/ n 
x - 
z = (0,1) 
o 
o 
Ejemplo 2.1 
El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida le 
permite a su compañía vender más pólizas que las compañías "promedio". El promedio mensual 
de ventas de todos los agentes de la compañía es de $300. A una muestra de agentes que han 
recibido el programa de entrenamiento se le encuentra las siguientes ventas en dólares: 300, 270, 
360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el supervisor de estos agentes, adoptaría 
para los restantes el programa de entrenamiento propuesto por el señor Martínez. Emplee 5% de 
significación. 
Solución: 
= 300, n = 10, x = 351.9, s = 48.64 1- = 0.95 
como n 30, entonces t(n – 1, 1– ) = t(9,0.95) = 1.833 
1) Ho: 300 
Ha: 300 
2) = 0.05 
3) f.p. 0 
0 
x 
t 
s 
n 
4) 0 
351.9 300 
3.37 
48.64 
10 
t 
5) t(9,0.95) = 1.833 
6) Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis nula a 
favor de la hipótesis alternativa 
7) Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su 
compañía vender más pólizas de seguro que la compañía promedio, por lo cual se adoptará para 
el resto de los agentes el programa propuesto por el señor Martinez. 
RA 
1 - = 0,95 
RR 
= 0,05 
tt = 1,833 
t0 = 3,37
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
30 
Ejemplo 2.2 
Un investigador afirma que la ingestión diaria de nutrientes (proteína) recomendada en varones de 
18-34 años moderadamente activos, tiene un promedio de 75 grs. para contrastar tal hipótesis se 
tomó una muestra de 116 varones saludables obteniendo los siguientes resultados: 
Proteína encontrada (gr) 
Número de 
varones 
71 
73 
75 
77 
79 
8 
20 
60 
18 
10 
Total 
116 
Pueden estos resultados, sostener la hipótesis formulada por el investigador. Use el 5% de 
significación. 
Solución: 
= 75, n = 116, x = 75.03, s =1.95 = 0.05 
como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96 
1) Ho: = 75 
Ha: 75 
2) = 0.05 
3) f.p. o 
o 
x - 
Z = 
s 
n 
4) 
75.03 75 
0.17 
1.95 
116 
o Z = 
5) 1.96 (0,975) Z = Z t 
6) Decisión: Como Zo RA aceptamos Ho 
7) Conclusión: Se sostiene la hipótesis formulada para el investigador. 
2.6. PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA POBLACIONAL 
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. 
Las hipótesis referentes a este parámetro pueden ser: 
RR 
2 = 0,025 
Zt = -1,96 
RA 
1 - = 0,95 
RR 
2 = 0,025 
Zt =1,96 
Z0 = 0,17
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
31 
Ho: = o 
Ha: o Prueba bilateral 
Ho: = o 
Ha: o Prueba unilateral 
Ho: = o 
Ha: o Prueba unilateral 
Procedimiento: 
Supóngase que se desea probar la hipótesis de que la varianza de una población normal 2 es 
igual a un valor específico, por ejemplo, 2 
o. Sea X1, X2, ..., Xn una muestra aleatoria de n 
observaciones tomadas de esta población. Para probar 
Ho: 2 = 2 
o 
Ha: 2 2 
o 
Se utiliza el estadístico de prueba 
2 
2 
2 ( 1) 
o 
o 
n S 
X 
donde S2 es la varianza muestral. Ahora si Ho: 2 = 2 
o es verdadera, entonces el estadístico de 
prueba X2 
o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se 
calcula el valor de la estadística de prueba X2 
o, y la hipótesis Ho: 2 = 2 
º debe rechazarse si: 
2 
1,1 / 2 
2 
2 
1, / 2 
2 
o n 
o n 
o si 
donde X2 
n-1, /2 y X2 
n-1,1- /2 son los puntos que corresponden a los porcentajes 100 /2 inferior y 
superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente. 
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: 
Ho: 2 = 2 
o 
Ha: 2 > 2 
o 
Se rechaza si: X2 
o > X2 
n-1,1- 
Para la otra hipótesis unilateral: Ho: 2 = 2 
o 
Ha: 2 < 2 
o 
Se rechaza si: X2 
o < X2 
n-1, 
RA 
1 – 
2 
(n 1, / 2) X 
RR 
/2 RR 
/2 
2 
(n 1, 1 / 2) X 
RA 
1 – 
RR 
2 
(n 1,1 ) X
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
32 
PROCEDIMIENTO PARA MUESTRAS GRANDES 
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la 
función de prueba, que cuando el tamaño de muestra es mayor que 30 se utiliza la distribución 
normal. 
El estadístico de prueba es: 
n 
s 
Z 
o 
o 
o 
2 
El gráfico utilizado sería acampanado. 
Ejemplo 2.3 
Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20 
botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas 
de fluido)2. Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2, 
entonces existe una proporción inaceptable de botellas que serán llenadas con una 
cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el 
fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de 
prueba. 
Solución: 
2 = 0.01, n = 20, s2 = 0.0153 = 0.05 
como n < 30, entonces 2 
(n 1,1 ) X = 30.1 2 
(19, 0.95) X 
Ho: 2 = 0.01 
Ha: 2 > 0.01 
= 0.05 
f.p. 29.07 
0.01 
( 1) (19)(0.0153) 
2 
2 
2 
o 
o 
n S 
X 
30.1 2 
(19, 0.95) X 
RA 
1 – 
RR 
2 
(n 1, ) X 
RA 
1 – = 0.95 
RR 
= 0.05 
30.1 
2 
t X 
29.07 
2 
o X
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
33 
Decisión: Como 29.07 
2 
o X RA aceptamos Ho 
Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza es igual a 
0.01. 
2.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES 
La prueba de comparación de muestras, requiere que las variancias de las dos poblaciones 
muestreadas sean iguales. En esta sección describiremos una prueba para la hipótesis nula 2 
1 = 
2 
2 , que se aplica a muestras aleatorias independientes obtenidas de dos poblaciones normales; 
debe utilizarse con mucho cuidado por ser muy sensible a las desviaciones de tal suposición. 
Las hipótesis referentes a este parámetro pueden ser: 
Ho: 1 = 2 
Ha: 1 2 Prueba bilateral 
Ho: 1 = 2 
Ha: 1 2 Prueba unilateral 
Ho: 1 = 2 
Ha: 1 2 Prueba unilateral 
Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones normales 
que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza el siguiente 
estadístico. 
2 
2 
2 
1 
s 
s 
F 
que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1 grados de 
libertad. 
Obs. F1 - (v1,v2) = 
F ( , ) 
1 
2 1 v v 
Regiones críticas para probar 2 
2 
2 
1 
(Poblaciones normales) 
Hipótesis alterna Estadístico de 
prueba 
Rechaza la hipótesis nula si: 
2 
1 < 2 
2 
2 
2 
2 
1 
s 
s 
F 
F < F (n1 – 1, n2 – 1) 
2 
1 > 2 
2 
2 
2 
2 
1 
s 
s 
F 
F > F1- (n1 – 1, n2 – 1) 
2 
1 2 
2 
2 
2 
m 
M 
s 
s 
F 
F < F /2(nM – 1, nm – 1) ó 
F > F1- /2(nM – 1, nm – 1) 
Donde: s2 
M : la mayor de las dos variancias muestrales, 
s2 
m : la más pequeña de las variancias.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
34 
Para hipótesis unilateral: Ho: 2 
2 
2 
1 
Ha: 2 
2 
2 
1 
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho: 
2 
2 
2 
1 
Ha: 2 
2 
2 
1 
Para la otra hipótesis unilateral: Ho: 2 
2 
2 
1 
Ha: 2 
2 
2 
1 
PROCEDIMIENTO PARA MUESTRAS GRANDES 
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la 
función de prueba, que cuando el tamaño de muestra es mayor que 30, se utiliza la distribución 
normal. 
El estadístico de prueba es: 
1 2 
1 2 
2 
1 
2 
1 
n n 
s 
s s 
Z 
p 
o 
RA 
1 – 
F / 2 (nM 1, nm 1) 
RR 
/2 RR 
/2 
F1 / 2 (nM 1, nm 1) 
RA 
1 – 
RR 
F1 (n1 1, n2 1) 
RA 
1 – 
RR 
F1 (n1 1, n2 1)
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
35 
2 
( 1) ( 1) 
: 
1 2 
2 
2 2 
2 
2 1 1 
n n 
n s n s 
s 
donde 
p 
Ejemplo 2.4 
Se requiere determinar si existe menos variabilidad en el plateado realizado por la compañía 1 que 
el efectuado por la compañía 2. Si las muestras aleatorias independientes de tamaño 12 del 
trabajo desempeñado por las compañías producen s1=0,035 mil y s2=0,062 mil, pruébese la 
hipótesis nula de que 2 
1 = 2 
2 contra la hipótesis alterna de que 2 
1 < 2 
2 con un nivel de 
significancia de 0,05. 
Solución: 
n1 = n2 = 12, s1 = 0.035, s2 = 0.062, = 0.05 
como n1 + n2 < 30, entonces ( 1, 1) (11,11) 0.355 1 2 0,05 Ft = F n n F 
Ho: 2 
2 
2 
1 
Ha: 2 
2 
2 
1 
= 0.05 
f.p. 0.319 
(0.062) 
(0.035) 
2 
2 
2 
2 
2 
1 
s 
s 
F 
Decisión: Como 0 F RA se acepta Ho 
Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía 2. Usando 
5% de significación de prueba. 
RA 
1 – = 0.95 
RR 
= 0.05 
Ft 0.355 
F0 0.319
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
36 
AUTOEVALUACIÓN 
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: 
( ) El rechazo de Ho cuando es verdadera se llama error de tipo I 
( ) Si la función de prueba cae en la región crítica entonces aceptamos la Ho 
( ) Ha se formula con el propósito de rechazarla, es la que se va a someter a prueba. 
( ) Es una prueba bilateral cuando la hipótesis se orienta a un solo lado. 
( ) No rechazar la Ho si el valor de la función de prueba cae en la región de aceptación. 
2. Un estudio de 29 familias de una zona residencial de la ciudad de Lima, revela que el ingreso 
medio por familia durante el año 1999 fue de $ 508 con una desviación estándar de $ 16. 
Probar la hipótesis de que el verdadero ingreso medio por familia en Lima durante 1999 fue de 
$ 500 frente a la alternativa de que no fue de $ 500. Utilizar un nivel de significancia del 5%. 
3. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las ventas de la semana 
de un determinado producto de consumo popular tiene una desviación estándar s $6 . Se 
supone que las ventas del producto tienen una distribución normal. Al nivel de significancia del 
5%, ¿se podría inferir que la varianza de la población es menor que $40? 
4. Los pesos netos (en gramos) de las latas de conserva de una muestra, fueron los siguientes: 
121; 119; 124; 123; 119; 121; 124. 
¿Se puede concluir que el peso neto poblacional medio es mayor que 123.5? Utilice un nivel 
de significancia del 1%. 
5. Un determinado proceso de empaquetar un producto está controlado, si el peso medio del 
producto empaquetado es 400 gramos. Si en una muestra aleatoria de 100 paquetes del 
producto se ha encontrado que el peso medio es de 395 gramos. ¿Se podría concluir que el 
proceso está fuera de control al nivel de significación 5%?. Suponga que el peso de los 
productos empaquetados se distribuye normalmente con desviación estándar de 20 gramos. 
6. En un proceso de fabricación, se plantea la hipótesis que la desviación estándar de las 
longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos elegidos al 
azar del proceso de producción se han encontrado las siguientes longitudes en milímetros: 
71, 66, 64, 72, 69, 67, 70, 68, 65, 69. Con estos datos se justifica la suposición 
que la desviación estándar verdadera es 2.0 mm? Use el nivel de significación α=0.05, y 
suponga que la distribución de las longitudes es normal.
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
37 
Tutoría Nº 
Prueba de hipótesis: proporción 
poblacional; dos medias 
poblacionales; dos proporciones 
poblacionales 
3.1. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL 
La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una 
determinada característica. 
Las hipótesis referentes a este parámetro pueden ser: 
Ho: P = Po 
Ha: P Po Prueba bilateral 
Ho: P = Po 
Ha: P Po Prueba unilateral 
Ho: P = Po 
Ha: P Po Prueba unilateral 
La función de prueba para valores de n 30 es: 
o 
o 
o o 
z = (0,1) 
P - p 
p (1- p ) / n 
n 
La función de prueba para valores de n 30 es: 
o 
o 
o o 
t = (n-1) 
P - p 
p (1- p ) / n 
t 
Ejemplo 3.1 
El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a 
favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a 
favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde? 
Solución: 
P = 0.60, n = 120, m = 75, 0.625 
120 
75 
p , = 0.05 
como n > 30, entonces 1.645 (1 ) (0,95) Zt = Z Z 
Ho: P 0.60 
Ha: P 0.60 
= 0.05 
f.p. 0.56 
120 
0.6(0.4) 
0.625 0.6 
0 
P (1- P )/n 
p - P 
Z = 
o o 
o 
3
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
38 
Decisión: Como Zo RA aceptamos Ho 
Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión del 
alcalde. Usando un 5% de significación de prueba. 
Ejemplo 3.2 
Se tomó una muestra aleatoria de 400 escolares, de los cuales 120 tuvieron signos de 
desnutrición. Verifique la hipótesis de que el porcentaje de desnutridos no excede a 25% en la 
cobertura de estudio (Use 5% como nivel de significación). 
Solución 
P = 0.25, n = 400, m = 120, 0.30 
400 
120 
p , = 0.05 
como n > 30, entonces 1.645 ( ) (0,05) Zt = Z Z 
Ho: P 0.25 
Ha: P 0.25 
= 0.05 
f.p. 2.31 
400 
0.25(0.75) 
0.30 0.25 
Zo 
Decisión: Como Zo RA se acepta Ho 
Conclusión: La proporción de desnutridos no excede al 25% en la cobertura de estudio. En un 5% 
de significación de prueba. 
3.2 PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS MEDIAS 
POBLACIONALES 
Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis natural es 
que ambas tienen igual promedio, o en otras palabras que la diferencia de ambos promedios es 
nula o difieren en alguna cantidad específica. 
Las hipótesis referentes a este parámetro pueden ser: 
Ho: μ1 = μ2 
Ha: μ1 μ2 Prueba bilateral 
Ho: μ1 = μ2 
Ha: μ1 μ2 Prueba unilateral 
RR 
= 0,05 
Zt = -1,645 
RA 
1 - = 0,95 
Z0 = 2,31 
RA 
1 - = 0,95 
RR 
= 0,05 
Zt = 1,645 
Z0 = 0,56 
1.645 (0,95) Zt = Z 
1.645 (1 ) (0,95) Zt = Z Z
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
39 
Ho: μ1 = μ2 
Ha: μ1 μ2 Prueba unilateral 
Pueden presentarse varias situaciones dependiendo de como son sus varianzas: 
1. Con varianzas conocidas: 
La función de prueba es: 
n 
n 
+ 
n 
( x - x ) - ( - ) 
z = (0,1) 
2 2 
o 
2 
2 
1 
1 
1 2 1 2 
2. Con varianzas desconocidas y diferentes: 
La función de prueba es: 
t 
n 
s 
+ 
n 
s 
( x - x ) - ( - ) 
t = ( n + n - 2) 
2 2 
o 1 2 
2 
2 
1 
1 
2 2 1 2 
Cuando n1 + n2 2 30 entonces esta función de prueba sigue una distribución normal estándar. 
3. Con varianzas desconocidas y aproximadamente iguales: 
La función de prueba es: 
t 
n 
1 
+ 
n 
1 
s 
( x - x ) - ( - ) 
t = ( n + n - 2) 
2 
o 1 2 
1 2 
1 2 1 2 
Aquí s2 es la varianza mancomunada 
n + n - 2 
(n - 1)s + (n - 1)s 
s = 
2 2 
2 
1 2 
1 1 2 2 
Al igual que en el caso anterior, si n1 + n2 2 30 entonces la función de prueba sigue una 
distribución normal estándar. 
Observación: Antes de realizar la prueba de comparación de medias, es conveniente efectuar la 
prueba de comparación de varianzas para determinar si los datos de ambas poblaciones tienen 
varianzas aproximadamente iguales o diferentes. 
Ejemplo 3.3 
Una compañía desea comparar las expectativas salariales anuales de su personal de ventas 
femenino y masculino, según un nuevo plan de compensaciones venta-más-comisión. Se pidió a 
n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar, predijeron sus ingresos anuales 
bajo el nuevo plan. Las medias y desviaciones muestrales eran: 
x1 = $ 31 083 x2 = $ 29 745 
1 s = $ 2 312 2 s = $ 2 569 
¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del ingreso anual 
esperado tanto entre los vendedores como las vendedoras? Haga la prueba con = 0,10. 
Solución: 
Ho: 1 2 5972552 .5 
1 2 
2 1 2 2 
n + n - 2 
(n - 1)s + (n - 1)s 
s = 
2 2 
2 
Ha: 1 2 1.645 (0,95) Zt = Z
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
40 
= 0.10 
f.p. 2.45 
40 
1 
40 
1 
597255252 .5 
31083 29745 0 
1 1 
1 2 
2 
1 2 1 2 
+ 
n 
+ 
n 
s 
( x - x ) - ( - ) 
Zo = 
Decisión: Como Zo RR no existe suficiente evidencia como para aceptar la hipótesis nula, 
por consiguiente aceptamos la Ha. 
Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia en el 
promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de significación 
de prueba. 
3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS PROPORCIONES 
POBLACIONALES 
Cuando se desea comparar dos poblaciones cualitativas. 
Las hipótesis referentes a este parámetro pueden ser: 
Ho: P1 = P2 
Ha: P1 P2 Prueba bilateral 
Ho: P1 = P2 
Ha: P1 P2 Prueba unilateral 
Ho: P1 = P2 
Ha: P1 P2 Prueba unilateral 
La función de prueba es: 
n 
n 
1 
+ 
n 
1 
p 1 - p 
(p - p ) - ( P - P ) 
z = (0,1) 
1 2 
1 2 1 2 
Aquí p es la proporción mancomunada: 
n + n 
n p + n p 
p = 
1 2 
1 1 2 2 
Ejemplo 3.4 
Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico 
determinado (grupo A) y que ven regularmente lucha en TV. supera mucho a un segundo grupo de 
hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos grupos 
arrojaron los siguientes resultados. 
tamaño de Número de hombres que ven 
Grupo la muestra regularmente lucha en TV 
A (1) n1 = 150 a1 = 98 
B (2) n2 = 200 a2 = 80 
RR 
2 = 0,05 
Zt = -1,645 
RA 
1 - = 0,90 
RR 
2 = 0,05 
Zt =1,645 
Z0 = 2,46
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
41 
¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? use = 
0,05 
Solución: 
Ho: 1 2 P P 0.51 
350 
98 80 
p 
Ha: 1 2 P P 1.645 (0.95) Zt = Z 
0.40 
200 
80 
0.65 
150 
98 
2 
2 
2 
1 
1 
1 
n 
a 
p 
n 
a 
p 
= 0.05 
f.p. 4.63 
200 
1 
150 
1 
0.51(0.49) 
(0.65 0.4) 0 
1 2 
1 2 1 2 
0 
+ 
n 
1 
+ 
n 
1 
p 1 - p 
(p - p ) - ( P - P ) 
Z = 
Decisión: Como Zo RR rechazamos Ho en favor Ha 
Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del 
sociólogo con un 5% de significación de prueba. 
RA 
1 - = 0,95 
RR 
2 = 0,05 
Zt =1,645 
Z0 = 4,63
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
42 
AUTOEVALUACIÓN 
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: 
( ) La hipótesis Ho: P > Po es una prueba bilateral. 
( ) En la prueba F los n1-1 y n2-1 son conocidos como los grados de libertad. 
( ) Cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal. 
( ) Cuando Fo pertenece a la Región de aceptación entonces se rechaza Ho. 
( ) La hipótesis Ho: P > Po es una prueba unilateral a la derecha. 
2. El gerente de una empresa insiste en que a lo más del 33% de los clientes de la empresa esta 
de acuerdo con el cambio de su producto. De 80 clientes tomados al azar, 29 están de 
acuerdo con el cambio del producto. Al nivel de significancia de 5%, ¿tiene razón el gerente? 
3. Ejemplo: Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada 
población reveló que 120 hombres y 120 mujeres estaban a favor de cierto candidato. ¿Se 
puede concluir a un nivel de significación del 5% que la proporción de hombres a favor del 
candidato es mayor que la proporción de mujeres? 
4. Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen desviaciones 
estándar respectivas de 120 horas y 90 horas. Para comparar el promedio de vida útil de estos 
artículos se extrae una muestra aleatoria de 60 artículos de cada fabricante encontrándose la 
duración media de 1.230 horas para la marca A y de 1.190 horas para la marca B. ¿Se puede 
concluir a un nivel de significación del 5% que los artículos de marca A tienen mayor duración 
media que los artículos de marca B? 
5. Se controla la calidad de una muestra aleatoria de 40 piezas producidas por un fabricante. Si 
se hallaron 4 piezas defectuosas, ¿se debería inferir que el porcentaje de todas las piezas 
defectuosas es más del 5% al nivel de significación del 5%? 
6. Un inversionista está por decidir entre dos provincias para abrir un centro comercial. Par esto 
debe probar la hipótesis de que hay diferencia en el promedio de ingresos familiares de las 
dos provincias. Si una muestra de 300 hogares de la provincia 1 da 
_ 
x1 $400 y 1 s $90 y 
otra muestra de 400 hogares de la provincia 2 da 
_ 
2 x $420 y 2 s $120 . ¿se puede inferir 
que las dos medias poblacionales son diferentes?, si es así, ¿en cual de las provincias 
debería abrir la sucursal? Utilice =0.05. 2 s $120 
_ 
2 x $420 
_ 
x1 $400
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
43 
Unidad 3 
ANALISIS DE VARIANZA 
Nº de tutoría: Uno 
Tutoría Nº 4: 
ANÁLISIS DE VARIANZA : ANÁLISIS DE VARIANZA DE UNA VÍA Y 
DE DOS VÍAS.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
44
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
45 
A. Aspectos preliminares 
1. Competencias 
1.1. Conceptuales 
Reconoce el modelo del análisis de varianza. 
1.2. Procedimentales 
Prueba las diferencias entre k-medias. 
1.3. Actitudinales 
Comparan las medias de k-grupos o poblaciones. 
B. Desarrollo del contenido, sus procedimientos y modalidad 
1. Contenido programático 
El contenido programático de la unidad referida es el siguiente: Análisis de varianza: conceptos básicos, Análisis de varianza de una vía (concepto, modelo, prueba de hipótesis); Análisis de varianza de dos vías (concepto, clases: sin interacción y con interacción, modelos) 
2. Modalidad y procedimiento de desarrollo de la unidad 
Durante la fase a distancia 
a) Cada alumno lee la primera unidad del módulo. 
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. 
c) Remite las prácticas y los trabajos a la página web de PROESAD 
Durante la fase presencial/tutorial 
a) Exposición sobre los trabajos elaborados y remitidos. 
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
46 
Tutoría Nº 
Análisis de varianza: análisis de 
varianza de una vía y de dos vías 
4.1. ANÁLISIS DE VARIANZA 
El análisis de varianza se emplea para probar las diferencias entre k medias. Una suposición 
básica implícita en el análisis de varianza es que las diversas medias muestrales se obtienen de 
las poblaciones distribuidas normalmente que tienen la misma varianza ². Sin embargo, se ha 
descubierto que el procedimiento de pruebas no se ve afectado por las violaciones de la 
suposición de normalidad cuando las poblaciones son unimodales y los tamaños de muestra son 
aproximadamente iguales. 
Todos los procedimientos de cálculo presentados son para efectos fijos, contrariamente a los 
modelos de efectos aleatorios. 
El concepto básico en el análisis de varianza fue desarrollado por R.A. Fisher y la distribución F se 
ha denominado en honor suyo. El razonamiento conceptual es el siguiente: 
(1) Se calcula la media para cada grupo de la muestra y después se determina el error estándar 
de la media S_ con base sólo en las diversas medias muestrales. 
(2) Dada la fórmula S_ = S/ n , tenemos que s = 
n S X y que 
X s n S 2 . Esta estimación 
resultante de la varianza de la población se llama la media cuadrática entre los grupos 
(MCE). 
(3) Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo. 
Luego se combinan estos valores de la varianza ponderándolos de acuerdo a n-1 para cada 
muestra. La estimación resultante de la varianza de la población se llama media cuadrática 
dentro de los grupos (MCD). 
(4) Si la hipótesis nula 1 = 2 = 3 = ... = k es verdadera, entonces tenemos que las dos medias 
cuadráticas obtenidas en (2) y (3) no están sesgadas y son estimadores independientes de 
la misma varianza de la población, ². Si la hipótesis nula es falsa, entonces el valor 
esperado de la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre 
las medias de la población inflarán la MCE, mientras que no afectarán la MCD. 
(5) Con base al numeral (4), se involucra una prueba de una cola y la fórmula general de la 
prueba F en el análisis de la varianza es: 
MCE 
MCD 
F 
Si la relación F está en la región de rechazo para el nivel de significación especificado, 
entonces se rechaza la hipótesis de que las diversas medias muestrales se obtuvieron de la 
misma población. 
Para simplificar este procedimiento con diseños en términos del modelo lineal que identifica 
los componentes que influyen sobre la variable aleatoria y se presenta una tabla estándar de 
análisis de varianza que muestra los cálculos necesarios de la media cuadrática para cada 
tipo de diseño experimental. 
4
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
47 
4.2. ANÁLISIS DE VARIANZA DE UNA VÍA 
El modelo del análisis de varianza de una vía se relaciona con la prueba de la diferencia entre k 
medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos 
grupos de tratamiento. 
La ecuación lineal que representa el modelo del análisis de varianza de una vía es: 
Xik = + k + ik 
donde: 
= media global de todos los k grupos de tratamiento 
k = efecto del tratamiento en el grupo específico k, del cual se muestreo el valor 
ik = error aleatorio relacionado con el proceso de muestreo. 
La tabla siguiente es un resumen del análisis de varianza de una vía en la cual; MCD pasa a ser la 
media cuadrática entre los A grupos de tratamiento (MCA) y (MCE) es llamada media cuadrática 
del error, N asigna el tamaño total de la muestra para todos los grupos de tratamiento combinados, 
antes que el tamaño de la población. Tk representa la suma (total) de los valores muestreados en 
todos los grupos combinados. 
La hipótesis nula y alternativa son: 
Ho: k = 0 para todos los niveles de tratamiento 
Ha: k 0 para todos los niveles de tratamiento 
Si la hipótesis nula es verdadera, entonces tenemos que : 
1 = 2 = 3 = ... = k . 
Fuente de 
variación 
Suma de los 
cuadrados, SC 
Grados de 
libertad, gl 
Media 
cuadrática MC 
Relación F 
Entre grupos 
de tratamiento 
A 
N 
T 
n 
T 
SCA 
k 
k 
2 2 
k – 1 
k 1 
SCA 
MCA 
MCE 
MCA 
F0 
Error de 
muestreo, E 
SCE SCT SCA 
n – k 
n k 
SCE 
MCE 
Total, T 
N 
T 
SCT X 
2 
2 
N - 1 
Ejemplo 4.1 
Quince personas que se capacitan en un programa técnico son asignadas en forma aleatoria a 
tres tipos diferentes de enfoques de instrucción. Los puntajes de las pruebas de rendimiento, al 
concluir la especialización, se presentan en la tabla siguiente. Use el procedimiento de análisis de 
varianza para probar la hipótesis nula de que las tres medias muestrales son iguales a un nivel de 
significación del 5%. 
Método de 
Instrucción 
Puntaje de la prueba 
Tk 
Total 
A1 
A2 
A3 
86 
90 
82 
79 
76 
68 
81 
88 
73 
70 
82 
71 
84 
89 
81 
400 
425 
375 
Total 1200
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
48 
Solución: 
Suma de cuadrados de tratamiento = 
N 
T 
n 
T 
SCA 
k 
k 
2 2 
= 250 
15 
1200 
5 
375 
5 
425 
5 
400 2 2 2 2 
Suma de cuadrados del total = 
N 
T 
SCT X 
2 
2 
= 698 
15 
1200 
86 90 82 ... 70 82 71 
2 
2 2 2 2 2 2 
Suma de cuadrados del error = SCE SCT SCA 
= 698 – 250 = 448 
Fuente de 
variación 
Suma de 
cuadrados SC 
grados de 
libertad, gl 
Media 
cuadrática MC 
relación, F 
Entre grupos 
de trat., A 
SCA = 250 
2 
MCA =125 
Fo = 3.35 
Error de 
muestreo, E 
SCE = 448 
12 
MCE =37.33 
Ft = 3.89 
Total, T SCT = 698 14 
Ft = F(1- , glA, glE) = F(0.95, 2, 12) = 3.89 
Ho: 0 1 2 3 
Ha: lg 0 i a ún 
= 0.05 
f.p. Fo = 3.35 
Decisión: Como F RA 0 se acepta Ho 
Conclusión: No hay efecto asociado a los niveles del método de instrucción por lo tanto las 
diferencias de métodos no son significativo, con un 5% de significación de prueba. 
Ejemplo 4.2 
La tabla siguiente presenta el promedio de palabras mecanografiadas por minuto en diferentes 
marcas de máquinas eléctricas, por individuos asignados aleatoriamente sin experiencia previa en 
estas máquinas, después del mismo período de instrucción. Pruebe la hipótesis nula de que la 
media de palabras por minuto lograda para las tres máquinas no es diferente, usando un nivel de 
significación del 5%. 
Marca de las 
máquinas 
Promedio de palabras por minuto 
Tk 
Total 
A1 
A2 
A3 
79 
74 
81 
83 
85 
65 
62 
72 
79 
51 
- 
55 
77 
- 
- 
352 
231 
280 
Total 863 
RA 
1 – = 0,95 RR 
= 0,05 
Ft = 3,89 
F0 = 3,35
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
49 
Solución 
Suma de cuadrados de tratamiento = 
N 
T 
n 
T 
SCA 
k 
k 
2 2 
= 103.72 
12 
863 
4 
280 
3 
231 
5 
352 2 2 2 2 
Suma de cuadrados del total = 
N 
T 
SCT X 
2 
2 
= 1376.96 
12 
863 
79 83 62 ... 65 79 55 
2 
2 2 2 2 2 2 
Suma de cuadrados del error = SCE SCT SCA 
= 1376.96 – 103.72 = 1273.20 
Fuente de 
variación 
Suma de 
cuadrados SC 
Grados de 
libertad, gl 
Media 
cuadrática MC 
Relación, 
F 
Entre grupos 
de trat., A 
SCA = 103.72 
2 
MCA = 51.86 
Fo = 0.37 
Error de 
muestreo, E 
SCE = 1273.20 
9 
MCE = 141.47 
Ft = 4.26 
Total, T 
SCT = 1376.92 
11 
Ho: 0 1 2 3 
Ha: lg 0 i a ún 
= 0.05 
f.p. Fo = 0.37 
Ft = 4.26 
Decisión: Como F RA 0 se acepta Ho 
Conclusión: No existe diferencia significativa entre las 3 máquinas de escribir en términos de 
velocidad de mecanografía, con un 5% de significación de prueba. 
4.3. ANÁLISIS DE VARIANZA DE DOS VÍAS 
El análisis de varianza de dos vías se basa en dos conjuntos de clasificaciones o tratamientos. Por 
ejemplo, al analizar el nivel de rendimiento de un programa de capacitación, podríamos considerar 
ambos efectos, el del método de instrucción y el del rendimiento escolar anterior. Asimismo, 
podríamos investigar el kilometraje de gasolina según la categoría de peso del automóvil y el 
grado de la gasolina. En las tablas de datos, los tratamientos identificados en los encabezamientos 
de la columna se llaman típicamente tratamientos A; aquellos en los encabezamientos de fila se 
denominan tratamientos B. 
La interacción en un experimento de dos factores significa que los dos tratamientos no son 
independientes y que el efecto particular de los niveles de tratamiento en un factor difiere según 
los niveles del otro factor. Por ejemplo, al estudiar el kilometraje de un automóvil, una gasolina de 
octanaje más alto puede mejorar el kilometraje para ciertos tipos de autos pero no p ara otros. 
Además la efectividad de varios métodos de instrucción puede diferir según los niveles de 
RA 
1 – = 0,95 RR 
= 0,05 
Ft = 4,26 
F0 = 0,37
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
50 
capacidad de los estudiantes. Con el objeto de probar la interacción, en cada célula de la tabla de 
datos de dos vías debe incluirse más de una observación o medición muestreada (reiteración). 
4.3.1. Análisis de varianza de dos vías sin interacción (diseño de bloque aleatorizado) 
El modelo de análisis de varianza de dos vías en el cual hay una sola observación por célula se 
denomina a menudo diseño de bloque aleatorizado, debido a un tipo particular de uso para este 
modelo. El objetivo de utilizar éste diseño no tiene propósito específico de probar un efecto de los 
"bloques". Más bien, al ser capaz de asignar alguna variabilidad a los sujetos antes del 
rendimiento, la MCE, puede reducirse y la prueba resultante del efecto de los tratamientos A ser 
más sensible. 
La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es: 
Xjk = + j + k + jk 
Donde: 
= media global de cualquier tratamiento 
j = efecto del tratamiento j o del bloque j en la dimensión B de clasificación. 
k = efecto del tratamiento k en la dimensión A de clasificación. 
ik = error aleatorio relacionado con el proceso de muestreo. 
Las hipótesis correspondientes serían: 
Ho : k = 0 
Ha : k 0 
La tabla de resumen para el análisis de varianza de dos vías sin interacción se da a continuación: 
Fuente de 
variación 
Suma de los 
cuadrados, SC 
Grados 
de 
libertad, 
gl 
Media cuadrática 
MC 
Relación F 
Entre grupos 
de 
tratamiento 
A 
N 
T 
n 
T 
SCA 
k 
k 
2 2 
K - 1 
K 1 
SCA 
MCA 
MCE 
MCA 
F0 
Entre grupos 
de 
tratamiento 
B 
N 
T 
T 
k 
SCB j 
2 
2 1 
J - 1 
J 1 
SCB 
MCB 
Error de 
muestreo, E 
SCE SCT SCA SCB 
(J–1) (K– 
1) 
(J 1) (K 1) 
SCE 
MCE 
Total, T 
N 
T 
SCT X 
2 
2 
N - 1 
Ejemplo 4.3 
Para los datos de la tabla siguiente suponga que en la realidad se utilizó un diseño de bloque 
aleatorizado y que se parearon los participantes antes del experimento, asignando un participante 
de cada grupo de aptitud (con base en los rendimientos anteriores del curso) a cada método de 
instrucción. La tabla siguiente es una revisión de la tabla del ejemplo 1, en el sentido que los 
valores presentados se han reorganizado para reflejar el diseño de bloque aleatorizado. Sin 
embargo observe que en cada grupo de tratamiento A se incluyen los mismos valores, excepto 
que se indican de acuerdo a los grupos de aptitud B y, por lo tanto, están dispuestos en un orden 
diferente. Pruebe la hipótesis nula de que no existe diferencia en el desempeño promedio entre los 
tres métodos de instrucción y los niveles de aptitud, utilizando un nivel de significación del 5%.
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
51 
Nivel de 
aptitud 
Método de instrucción Tj 
A1 A2 A3 Total 
B1 86 90 82 258 
B2 84 89 81 254 
B3 81 88 73 242 
B4 79 76 68 223 
B5 70 82 71 223 
Total Tk 400 425 375 1200 
Solución: 
Suma de cuadrados de tratamiento = 
N 
T 
n 
T 
SCA 
k 
k 
2 2 
= 250 
15 
1200 
5 
375 
5 
425 
5 
400 2 2 2 2 
Suma de cuadrados de bloque = 
N 
T 
T 
k 
SCB j 
2 
2 1 
= 367.33 
15 
1200 
3 
223 
3 
223 
3 
242 
3 
254 
3 
258 2 2 2 2 2 2 
Suma de cuadrados del total = 
N 
T 
SCT X 
2 
2 
= 698 
15 
1200 
86 90 82 ... 70 82 71 
2 
2 2 2 2 2 2 
Suma de cuadrados del error = SCE SCT SCA SCB 
= 698 – 250 – 367.33 = 80.87 
Fuente de 
variación 
Suma de 
cuadrados SC 
grados de 
libertad, gl 
Media 
cuadrática 
MC 
relación, F 
Entre grupos 
de trat., A 
SCA = 250 2 MCA = 125 
Fo = 12.4 
Ft = 4.46 
Entre grupos 
de bloque B 
SCB = 367.33 4 MCB = 91.83 
Error de 
muestreo, E 
SCE = 80.87 (2)(4) = 8 MCE = 10.98 
Total, T SCT = 698 14 
Ho: 0 1 2 3 
Ha: lg 0 i a ún 
= 0.05 
f.p. Fo = 12.4 
Ft = 4.46 
RA 
1 – = 0,95 RR 
= 0,05 
Ft = 4,46 
F0 = 12,4
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
52 
Decisión: 
Como F RR 0 rechazamos Ho 
Conclusión: 
Existe diferencia significativa entre los porcentajes de rendimiento para los diferentes métodos de 
instrucción, cuando se consideran el nivel de aptitud. Utilizando una prueba significativa. 
4.3.2. Análisis de varianza de dos vías con interacción (N observaciones por célula) 
Cuando se utiliza este diseño se pueden probar por el análisis de varianza tres hipótesis nulas 
diferentes; que no hay efectos de columna (las medias de las columnas no son significativamente 
diferentes) y que no hay efectos de fila (las medias de las filas no son significativamente 
diferentes) y que no hay interacción entre los dos factores (los dos factores son independientes). 
Un efecto de interacción significativo indica que el efecto de los tratamientos para un factor varía 
según los niveles del otro factor. En tal caso, la existencia de efectos de columna y de fila puede 
no tener mucho significado desde el punto de vista de la aplicación de los resultados de la 
investigación. 
La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es: 
Xijk = + j + k + ijk + ijk 
Donde: 
= media global independiente de cualquier tratamiento 
j = efecto del tratamiento j en la dimensión B. 
k = efecto del tratamiento k en la dimensión A. 
ijk = efecto de la interacción entre el tratamiento j (del 
factor B) y el tratamiento k (del factor A) 
ik = error aleatorio relacionado con el proceso de muestreo. 
Las hipótesis correspondientes serían: 
Ho : k = 0 Ho : j = 0 Ho : Ijk = 0 
Ha : k 0 Ha : j 0 Ha : Ijk 0 
La tabla de resumen para el análisis de varianza de dos vías con interacción se da a continuación: 
Fuente de 
variación 
Suma de los 
cuadrados, SC 
Grados 
de 
libertad, 
gl 
Media cuadrática 
MC 
Relación F 
Entre grupos 
de 
tratamiento 
A 
N 
T 
T 
n 
SCA k 
2 
2 1 
K - 1 
K 1 
SCA 
MCA 
MCE 
MCA 
F0 
Entre grupos 
de 
tratamiento 
B 
N 
T 
T 
nk 
SCB j 
2 
2 1 
J – 1 
J 1 
SCB 
MCB 
MCE 
MCB 
F0 
Interacción 
(entre 
grupos de 
tratamiento 
A y B) I 
N 
T 
SCA SCB 
X 
n 
SCI 
2 
1 2 
(J–1) (K– 
1) 
(J 1) (K 1) 
SCI 
MCI 
MCE 
MCI 
F0 
Error de 
muestreo, E 
SCI 
SCE SCT SCA SCB 
JK (n–1) 
JK (n 1) 
SCE 
MCE 
Total, T 
N 
T 
SCT X 
2 
2 
N - 1
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
53 
Ejemplo 4.4 
Nueve personas que se capacitan en cada una de cuatro áreas temáticas diferentes fueron 
asignadas en forma aleatoria a tres métodos de instrucción distintos. Se asignaron tres 
estudiantes a cada método de instrucción. Se refiere a la tabla siguiente, pruebe las diversas 
hipótesis nulas que son de interés respecto a tal diseño, a un nivel de significación del 5%. 
Área 
temática 
Método de instrucción Total Tj 
A1 A2 A3 
B1 70 
79 
72 
83 
89 
78 
81 
86 
79 
717 
221 250 246 
B2 77 
81 
79 
77 
87 
88 
74 
69 
77 
709 
237 252 220 
B3 82 
78 
80 
94 
83 
79 
72 
79 
75 
722 
240 256 226 
B4 85 
90 
87 
84 
90 
88 
68 
71 
69 
732 
262 262 208 
Total Tk 960 1020 900 T=2880 
Solución: 
Suma de cuadrados de tratamiento A = 
N 
T 
T 
nk 
SCA k 
2 
2 1 
= 600 
36 
2880 
12 
900 
12 
1020 
12 
960 2 2 2 2 
Suma de cuadrados de tratamiento B = 
N 
T 
T 
nj 
SCB j 
2 
2 1 
= 30.8 
36 
2880 
9 
732 
9 
722 
9 
709 
9 
717 2 2 2 2 2 
Suma de cuadrados de la interacción = 
N 
T 
SCA SCB 
X 
n 
SCI 
2 
1 2 
= 533.9 
36 
2880 
600 30.8 
3 
208 
3 
262 
3 
262 
... 
3 
246 
3 
250 
3 
221 2 2 2 2 2 2 2 
Suma de cuadrados del total = 
N 
T 
SCT X 
2 
2 
= 1600.0 
36 
2880 
70 83 81 ... 87 88 69 
2 
2 2 2 2 2 2 
Suma de cuadrados del error = SCE SCT SCA SCB SCI 
= 1600 – 600 – 30.8 – 533.9 = 435.3
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
54 
Fuente de 
variación 
Suma de 
cuadrados 
SC 
Grados de 
libertad, gl 
Media 
cuadrática MC 
relación, F 
Entre grupos 
de trat., A 
(método) 
SCA = 600.0 3-1 = 2 MCA = 300 Fo = 16.57 
Entre grupos 
de trat., B 
(tema) 
SCB = 30.8 4-1 = 3 MCB = 10.3 Fo = 0.57 
Interacción 
entre 
método y 
tema, I 
SCI = 533.9 (2)(3) = 6 MCI = 18.1 Fo = 4.92 
Error de 
muestreo, E 
SCE = 435.3 
(4)(3)(2) = 
24 
MCE = 18.1 
Total, T SCT = 
1600.0 
36-1=35 
Ho: A1 A2 A3 Ho: B1 BA2 BA3 Ho: 0 jk I 
Ha: lg 0 i a ún Ha: lg 0 j a ún Ha: 0 jk I 
= 0.05 
f.p. 
Fo = 16.57 Fo = 0.57 
Ft = F(2,24,0.95) = 3.4 Ft = F(3,24,0.95) = 3.0 
Fo = 4.92 
Ft = F(6,24,0.95) =2.5 
Decisión: 
1. Como F RR 0 rechazamos Ha 
2. Como F RA 0 aceptamos Ho 
3. Como F RR 0 aceptamos Ha 
Conclusión: Hay diferencia satisfactoria entre los porcentajes de los métodos de instrucción, no 
hay diferencia significante entre las distintas áreas hay interacción importante entre los dos 
factores: 
La última conclusión indica que varía la efectividad de los tres métodos de instrucción para las 
diferentes áreas temáticas. 
RA 
1 – = 0,95 
RR 
= 0,05 
RA 
1 – = 0,95 
RR 
= 0,05 
RA 
1 – = 0,95 
RR 
= 0,05 
Ft = 3.4 Ft = 3.0 
Ft = 2.5 
Fo = 16.57 Fo = 0.57 
Fo = 4.92
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
55 
AUTOEVALUACIÓN 
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: 
( ) El análisis de varianza se emplea para probar las diferencias entre k medias. 
( ) El análisis de varianza de dos vías se basa en dos conjuntos de tratamientos 
( ) Al análisis de varianza de dos vías sin interacción se le conoce como diseños de bloque aleatorizado. 
( ) El modelos del análisis de varianza de dos vías es: Xik = + k + ik 
( ) MCE es llamada media cuadrática del error 
2. En 12 depósitos al por menor se establecieron 4 tipos de exhibiciones de publicidad, con tres depósitos asignados en forma aleatoria a cada una de las exhibiciones con el propósito de estudiar el impacto de la exhibición en el punto de venta. Refiriéndose a la tabla siguiente, pruebe la hipótesis de que no existe diferencia entre las medias de los valores de venta para los cuatro tipos de exhibiciones, usando un nivel de significancia del 5%. 
Tipo 
De Exhibición 
VENTAS 
1 2 3 
E1 
E2 
E3 
E4 
40 44 43 
53 54 59 
48 38 46 
48 61 47 
3. Los siguientes son los números de hornos de microondas que venden cada uno de los vendedores de las tres sucursales de una compañía distribuidora de artículos domésticos 
SUCURSAL ALFA 21 11 17 28 
SUCURSAL BETA 27 15 18 26 17 21 
SUCURSAL GAMMA 24 17 31 12 15 
Realice un ANVA para probar, con un nivel de significancia de 0.05, si la hipótesis nula de que en promedio las ventas de las tres sucursales son las mismas. 
4. Completar la siguiente tabla de análisis de varianza (ANVA) 
FUENTE VARIACION 
SUMA DE CUADRADOS 
GRADO DE LIBERTAD 
MEDIA CUATRADTICA 
F 
Tratamiento 
2 
Error 
9 
10 
Total 
120 
5. Un ejecutivo de marketing llevó a cabo un estudio para examinar el efecto comparativo de 3 técnicas diferentes de promoción en 4 zonas diferentes de ventas y obtuvo los resultados mostrados en la tabla siguiente. Determinar las conclusiones a las que puede llegar usando los resultados de la tabla ANVA y formule en forma clara las hipótesis de contraste. 
FUENTE VARIACION 
SUMA DE CUADRADOS 
GRADO DE LIBERTAD 
MEDIA CUADRATICA 
F 
Entre técnicas promocionales 
7.48 
Entre zonas de ventas 
3 
Error 
3.90 
6 
Total 
11.41 
11
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
56
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
57 
Unidad 4 
TEORIA DE LA TOMA DE DECISIONES 
Nº de tutoría: Uno 
Tutoría Nº 5 
Teoría de la toma de decisiones
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
58
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
59 
A. Aspectos preliminares 
1. Competencias 
1.1. Conceptuales 
Reconoce los conceptos del análisis estadístico en la toma de decisiones. 
1.2. Procedimentales 
Elaboran tabla, diagrama en base a las probabilidades para la toma de decisiones. 
1.3. Actitudinales 
Realiza toma de decisiones basadas en un análisis estadístico en un problema de investigación. 
B. Desarrollo del contenido, sus procedimientos y modalidad 
1. Contenido programático 
El contenido programático de la unidad referida es el siguiente: La estructura bayesiana comparada con la estadística clásica conceptos fundamentales (conceptos generales), estructura de la tabla de decisión; toma de decisiones basadas en probabilidades (criterios: probabilidad máxima, esperanza del evento); toma de decisiones con base sólo en las consecuencias económicas (criterios: maximin, máximax, pena mínimax); toma de decisiones con base en probabilidades y consecuencias económicas (criterios: del valor esperado o criterio bayesiano, mínima pérdida de oportunidad o pena esperada); análisis de árbol de decisión. 
2. Modalidad y procedimiento de desarrollo de la unidad 
Durante la fase a distancia 
a) Cada alumno lee la primera unidad del módulo. 
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. 
c) Remite las prácticas y los trabajos a la página web de PROESAD. 
Durante la fase presencial/tutorial 
a) Exposición sobre los trabajos elaborados y remitidos. 
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
60 
Tutoría Nº 
Teoría de la toma 
de decisiones 
5.1. LA ESTRUCTURA BAYESIANA COMPARADA CON LA ESTADÍSTICA CLÁSICA 
La estadística clásica trata en lo fundamental dos problemas estrechamente relacionados: 
1. El problema de la estimación de algunos parámetros de la población, como la media aritmética de la población y la proporción poblacional p. 
2. El problema de probar una hipótesis respecto a alguna característica o parámetro de la población 
Pero, ya sea que el problema consista en estimar algún parámetro de la población o probar (o contrastar o verificar) una hipótesis respecto al valor de ese parámetro, el método que se usa para resolver el problema es uno y el mismo; se selecciona una muestra aleatoria de la población y esta información muestral se convierte en la base de todas las inferencias acerca de los parámetros de la población. Para ejemplificar esto, supóngase que el problema inmediato es estimar el porcentaje de estudiantes del quinto año de secundaria en un colegio. Si una muestra aleatoria de 100 estudiantes seleccionados de este colegio revela que hay 10 esudiantes del último año, entonces se estimará el porcentaje de estudiantes del último año de todo el colegio como 10/100 ó 10%. 
La información que se puede utilizar al hacer una inferencia sobre una característica de la población, por lo general, se clasifica en dos clases: la información objetiva y la información subjetiva. Por ejemplo, la información que se obtiene por medio de muestreos es información objetiva. Por otra parte, la opinión personal del experto en un campo es información subjetiva. Al estimar el porcentaje de estudiantes del último año del colegio como 10%, se ha adoptado el método tradicional o clásico de la inferencia estadística, un método en el que la inferencia acerca de la población se basa de una manera estricta en información muestral objetiva. 
En contraste con el método estadístico clásico, en el que sólo se puede utilizar información muestral objetiva, un enfoque alternativo de la estadística, llamado estadística de Bayes, puede utilizarse toda la información disponible pertinente: subjetiva y objetiva. En la estadística de Bayes, una inferencia sobre un parámetro de la población puede hacerse partiendo de información subjetiva exclusivamente. Sin embargo, si posteriormente se cuenta con información muestral objetiva, se combinan la información subjetiva y la objetiva, y las inferencias sobre el parámetro de la población se basan en esta información combinada. 
La distinción entre la estadística clásica y la de Bayes, puede presentarse desde una perspectiva definida considerando el ejemplo siguiente: Una compañía manufacturera está considerando la compra de una nueva máquina, denominada la máquina A. La decisión de si se compra o no la máquina A se basará en el porcentaje de partes defectuosas que produzca la máquina. En base a su experiencia pasada con otras máquinas semejantes, el ingeniero de control de calidad de la compañía estima el porcentaje de partes defectuosas producidas por la máquina A según la siguiente tabla: 
PORCENTAJE DE PARTES DEFECTUOSAS 
PROBABILIDAD 
0,05 
0,06 
0,07 
0,30 
0,50 
0,20 
Esto significa que el ingeniero de control de calidad no está absolutamente seguro del porcentaje de partes defectuosas que produce la máquina A. Sin embargo, en base a cualquier conocimiento 5
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
61 
o experiencia que posee, el ingeniero piensa personalmente que es de 0,30 la probabilidad de que el porcentaje de partes defectuosas producidas por la máquina A sea 5% es de 0,50 la probabilidad de que el porcentaje de partes defectuosas sea 6% y hay un riesgo de 0,20 en que el porcentaje de partes defectuosas sea 7%. 
Dos observaciones importantes pueden hacerse en esta fase de la discusión. Primera, la información del ingeniero de control de calidad respecto a la máquina A es personal o subjetiva, puesto que algún otro ingeniero bien podría dar una estimación del porcentaje de partes defectuosas que produce la máquina A. Segunda, en contraste con la estadística de Bayes está especialmente diseñada para hacer uso más constructivo de este tipo de información. De hecho, usando la información subjetiva del ingeniero de control de calidad, la estadística de Bayes permitirá a la compañía decidir si compra o no la máquina A. 
Continuando el caso de la máquina A, supóngase además que en una serie de pruebas, una muestra aleatoria de 100 partes producidas por la máquina A revela que hay 4 partes defectuosas. Ahora bien, según la estadística, el porcentaje de partes defectuosas producidas por la máquina A se estima como 4%. Sin embargo, usando la estadística de Bayes la información muestral se combina con la información subjetiva del ingeniero de control de calidad, y una estimación del porcentaje de partes defectuosas producidas por la máquina A se hace, partiendo de esta combinación de información. 
El uso de información subjetiva en la inferencia estadística es sólo una de las características de la estadística bayesiana. En los últimos años, la estadística bayesiana se ha convertido en una teoría integrada para la toma de decisiones, llamada la teoría de decisión bayesiana. 
La teoría de decisión bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre. Esta teoría le proporciona a quien toma una decisión un procedimiento racional y sistemático que le permite elegir entre varios cursos de acción posible cuando las consecuencias de cada una de estas acciones están sujetas a incertidumbre. 
I. Estructura de tablas de decisión 
Una tabla de decisión identifica la ganancia (o pérdida) ocasional asociada por todas las combinaciones posibles de actos y sucesos de decisión, también indica la probabilidad de ocurrencia para cada uno de los eventos mutuamente excluyentes. 
TABLA 1 
ESTRUCTURA GENERAL DE UNA TABLA DE DECISIÓN 
EVENTO 
PROB. 
ACTOS 
A1 
A2 
A3 
... 
An 
E1 
E2 
E3 
... 
Em 
p1 
p2 
p3 
... 
pm 
X11 
X21 
X31 
... 
Xm1 
X12 
X22 
X32 
... 
Xm2 
X13 
X23 
X33 
... 
Xm3 
... 
... 
... 
... 
... 
X1n 
X2n 
X3n 
... 
Xmn 
Donde: 
Actos: Son los cursos de acción alternativos, o estrategias, que están a disposición de la persona que toma la decisión. Como resultado del análisis se elige uno de estos actos como el mejor. 
Eventos: Identifica las ocurrencias que están fuera del control de la persona que toma la decisión y que determina el nivel de éxito de un acto dado. 
Probabilidad: Deben estar disponibles, pueden basarse en actos objetivos o determinarse subjetivamente con base en el criterio. Las sumas de las probabilidades siempre es 1,00. 
Las entradas en las células: Son valores condicionales o consecuencias económicas condicionales. Frecuentemente se denominan pagos y son condicionales pues el resultado económico depende del acto de decisión que se elige y del evento que ocurre.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
62 
II. Toma de decisiones basadas en probabilidades 
Esto se efectúa haciendo uso de la primera y segunda columna de la tabla 1. 
Criterios 
1º Probabilidad máxima: Es aquel que se selecciona el acto del evento que presenta mayor probabilidad. 
2º Esperanza del evento: Es aquel que se selecciona el acto del evento considerando la esperanza matemática del evento. E(e) = e p(e) 
Obs. Representa una base incompleta para efectuar toma de decisión. 
III. Toma de decisiones con base sólo en las consecuencias económicas 
La tabla que se usa es similar a la tabla 1, excepto que por la ausencia de las probabilidades de los eventos. 
Criterios 
1º Maximin: Esta estrategia de decisión es "altamente conservadora" pues la persona que toma la decisión se preocupa de que "pueda suceder lo peor" respecto a cada acto. 
Cálculo: Se determina el valor mínimo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor. 
2º Máximas: Es el estándar por el cual el mejor acto es el para el que el valor máximo es mayor que el máximo de cualquier otro acto de decisión. Este criterio se opone filosóficamente al criterio maximin, pues la persona que toma las decisiones está orientada hacia "lo mejor que puede suceder" con respecto a cada acto. 
Cálculo: Se determina el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor. 
3º Pena Minimax (Pérdida de oportunidad condicional): Es la diferencia entre el resultado económico del mejor acto dado que ha ocurrido en un evento particular y el resultado económico de acto. El valor "mejor" o más deseado de la pena es "0". 
Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor, en cada fila, luego el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es menor. 
IV. Toma de decisiones con base en probabilidades y consecuencias económicas 
Estos métodos utilizan toda la información contenida en la tabla 1. 
Criterios 
1º Del valor esperado (VE) o Criterio Bayesiano: Es la norma por el cual el mejor acto es aquel para el que el resultado económico esperado es el más alto como promedio a largo plazo. 
Cálculo: Se determina multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es mayor. 
2º Minima pérdida esperada de oportunidad (PEO) o Pena esperada.- El acto con la mayor ganancia esperada tendría la menor pena esperada. 
Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor en cada fila, luego se multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es menor. 
V. Análisis de árbol de decisión 
Es el método que puede utilizarse para identificar el mejor acto inicial, como también los mejores actos subsiguientes. 
Proceso 
1º Construir el árbol de decisión de izquierda a derecha, con sus puntos de decisión (puntos secuenciales en los cuales tiene que hacerse la elección) y eventos causales (puntos
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
63 
secuenciales en los cuales ocurrirá un evento probabilístico). Depende del análisis apropiado, de la situación global de decisión. 
2º Se colocan en el diagrama los valores de probabilidad asociados con los eventos causales y las consecuencias económicas. Los valores esperados de los actos alternativos en el punto inicial de decisión, los valores esperados se calculan sistemáticamente de derecha a izquierda en el árbol de decisión. Este proceso se llama "devolverse". 
Ejemplo 5.1 
Un contratista de calefacción y aire acondicionado debe comprometerse a comprar unidades de aire acondicionado desde el 1ero de abril, para reventa e instalación durante la próxima temporada de verano. Con base en la demanda del verano anterior, en las actuales condiciones económicas y en los factores de competencia del mercado, calcula que hay una probabilidad de 0,10 de vender sólo 5 unidades, una probabilidad de 0,30 de vender 10 unidades, una probabilidad de 0,40 de vender 15 unidades y una probabilidad de 0,20 de vender 20 unidades. Los equipos de aire acondicionado se pueden ordenar sólo en grupos de cinco, siendo el costo unitario de $1000 y el precio al por menor de $1300 (más gastos de instalación). Todas las unidades que no se han vendido al término de la temporada se devuelven al fabricante por un crédito neto de $800, después de deducir los gastos de embarque. Determine los mejores actos de decisión desde el punto de vista de los criterios. 
a) basada sólo en probabilidades, (probabilidad máxima y esperanza del evento). 
b) basada sólo en las consecuencias económicas, (maximin, maximax, pena minimax). 
c) basada en probabilidades y consecuencias económicas, (criterio bayesiano y pena esperada de oportunidad). 
Solución: 
(Tabla de ganancias) 
E 
Demanda 
P (E) 
ACTOS (Compra – Stock) 
A1 = 5 
A2 = 10 
A3 = 15 
A4 = 20 
E1 = 5 
E2 = 10 
E3 = 15 
E4 = 20 
0.10 
0.30 
0.40 
0.20 
1500 
1500 
1500 
1500 
500 
3000 
3000 
3000 
(500) 
2000 
4500 
4500 
(1500) 
1000 
3500 
6000 
Valor esperado 
13,3 
Maximin 1500 
500 
(500) 
(1500) 
Máxima x 
1500 
3000 
4500 6000 
C. Bayesiano 
1500 
2750 3250 
2750 
(Tabla de pérdida de oportunidad) 
E 
Demanda 
P (E) 
ACTOS (Cantidad de orden) 
A1 = 5 
A2 = 10 
A3 = 15 
A4 = 20 
E1 = 5 
E2 = 10 
E3 = 15 
E4 = 20 
0.10 
0.30 
0.40 
0.20 
0 
1500 
3000 
4500 
1000 
0 
1500 
3000 
2000 
1000 
0 
1500 
3000 
2000 
1000 
0 
Pena Mimi max 4500 
3000 2000 
3000 
Pena esperada de oportunidad 
2550 
1300 800 1300 
a) i) Como la probabilidad máxima es 40%, entonces el mejor acto de decisión es ordenar la compra de 15 unidades de aire acondicionado. 
ii) Como el valor esperado = EP(E) = 13,3 y las ordenes se afectan en grupos de 5, luego el mejor acto de decisión, es ordenar la compra de 15 unidades de aire acondicionado. 
b) Maximinin: ordenar comprar 5 unidades de aire acondicionado 
Maximimax: ordenar comprar 20 unidades de aire acondicionado 
Pena mínimas: ordenar comprar 15 unidades de aire acondicionado 
c) Criterio Bayesiano: ordenar comprar 15 unidades de aire acondicionado 
Pena esperada de oportunidad: ordenar comprar 15 unidades de aire acondicionado
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
64 
Ejemplo 5.2 
a. A un fabricante se le presentó un proyecto para un producto nuevo, y debe decidir si desarrollarlo o no. El costo del desarrollo de proyecto es S/. 200 000; la probabilidad de éxito es 0,70. Si el desarrollo no tiene éxito se termina el proyecto. Si tiene éxito, el fabricante debe entonces decidir si el nivel de producción ha de ser alto o bajo. Si la demanda es alta, el aumento en la utilidad, dado un nivel elevado de producción, es de S/. 700 000; dado un nivel bajo, es de S/. 150 000. Si la demanda es baja, el incremento en la utilidad, dado un nivel elevado de producción es S/. 100 000; dado un nivel bajo es S/. 150 000. 
Todos estos incrementos en utilidades son cifras brutas (es decir, antes de restar los S/. 200 000 del costo de desarrollar el producto). Se estima que la probabilidad de una demanda elevada es 0,40 y para la demanda baja es 0,60. Elabore el árbol de decisiones para esta situación. 
La figura muestra el árbol de decisión de este problema: 
: Puntos de decisión 
: Eventos aleatorios 
b. Con referencia a la figura 1, determine si el fabricante debe intentar el desarrollo de este producto o no, determinando la ganancia esperada correspondiente a las acciones alternativas “desarrollar” y “no desarrollar”. 
En la figura 2 se repite el árbol de decisión presentado en la figura 1, pero ahora se incluyen las ganancias esperadas correspondientes a cada una de las decisiones posibles del proceso secuencial, y se eliminan las acciones no preferidas de cada decisión, cruzando con dos rayas la rama correspondiente. Trabajando de derecha a izquierda, se determina la ganancia esperada de la decisión “nivel alto de producción”, y que es de S/. 140 000, de la siguiente manera: 
GE (nivel alto de fabricación) = (0,40) (500 000) + 
(0,60) (-100 000) 
= S/. 140 000 
De manera análoga: 
GE (nivel bajo de fabricación) = (0,40) (-50 000) + 
(0,60) (-50 000) 
= S/. 50 000 
Figura 1. Diagrama del árbol de decisión
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
65 
Al comparar las dos ganancias esperadas, la mejor decisión es “nivel alto de fabricación”; se elimina la posibilidad de la otra acción. Pasando a la izquierda hacia el siguiente punto de decisión (que es también el punto inicial de decisión en este caso), las ganancias esperadas para las dos posibles decisiones son: 
GE (desarrollar) = (0,70) (140 000) + 
(0,30) (-200 000) 
= S/. 38 000 
GE (no desarrollar) = S/. 0 
Al comprar las dos ganancias esperadas, la mejor acción en el punto inicial es “desarrollar”. Al calcular la ganancia esperada de “desarrollar”, debe observarse que la probabilidad de 0,70 (para “desarrollo con éxito”) se multiplica por S/. 140 000, y se ignora la rama adyacente de S/. –50 000, debido a que corresponde a una decisión eliminada en la etapa previa de análisis. 
Figura 2: Diagrama del árbol con reversión
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
66 
AUTOEVALUACIÓN 
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: 
( ) La pena mínimax se calcula en la tabla de perdida. 
( ) El criterio que maximiza los pagos mínimos de todos los actos se llama máximas. 
( ) En el criterio máximax, el mejor acto es aquel para el cual el valor resultante es mayor. 
( ) Los eventos son los cursos de acción alternativos, que están a disposición de la 
persona que toma la decisión. 
( ) La teoria bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre. 
2. Supóngase que un fabricantes de equipos de oficina debe decidir si ampliar la capacidad de su planta ahora o espera otro año. Sus consejeros le advierten que si hace ahora la ampliación y las condiciones económicas siguen siendo favorable, se logrará una utilidad de $ 369 000; si hace ahora la ampliación y existe alguna recesión económica, habrá un pérdida (utilidad negativa) de $ 900 000; si espera otro año y las condiciones económicas siguen siendo favorables, se logrará una utilidad de $ 180 000; y si espera otro año, y existe una recesión económica, se logrará una pequeña utilidad de $ 18 000. 
a) Construya una tabla de pagos. 
b) Construya una tabla de pérdida 
3. Un canillita debe ordenar los periódicos con un día de anticipación. El costo de los periódicos es de $ 2 la docena y el precio de venta es de $ 4 la docena. Los periódicos no vendidos al cabo del día deben devolverse. Si el canillita estima la demanda diaria de su clientela por periódicos en la forma siguiente: Demanda diaria, en docenas: 12, 13, 14. Probabilidad de la demanda 0.20, 0.30, 0.50. 
a) Establecer la tabla de pago y de pérdida. 
b) Determine los mejores actos de decisión desde el punto de vista de los criterios: Probabilidad máxima, valor esperado, maximin, máximax, pena mínimax, criterio bayesiano y pena esperada de oportunidad 
4. Dada la siguiente tabla de resultados: 
UTILIDADES 
Suceso 
Probabilidad 
Acciones 
A 1 A2 A3 A4 
A 
B 
C 
D 
0.1 
0.2 
0.5 
0.2 
20 0 -30 -40 
20 40 20 0 
20 40 60 40 
20 40 60 80 
a) Determínese la acción óptima mediante la Probabilidad Máxima 
b) Determínese la acción óptima utilizando el criterio Bayesiano y Pena Esperada de Oportunidad 
c) Determínese la acción óptima utilizando el criterio MÁXIMAX, MAXIMIN, MINIMAX 
5. La junta directiva de un hospital privado debe decidir, sobre fases financieras, si autoriza fondos a un nuevo centro de atención a pacientes cardiacos. La junta considera que si se construye el nuevo centro y contratan a un cardiólogo de prestigio nacional, el centro percibirá $ 7.2 millones. Si se construye el nuevo centro pero no pueden contratar un cardiólogo eminente, habrá una pérdida de $ 1.25 millones. Si se remodela el antiguo centro de cardiología y se contrata a un cardiólogo eminente, el centro captará $ 2 millones. Si se remodela el centro y no contratan a un cardiólogo eminente, la institución sólo percibirá $ 0.5 millones. 
a) Construya una tabla de pagos. 
b) Trace un árbol de decisión.
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
67 
Unidad 5 
CONTRO DE CALIDAD 
Nº de tutorías: Dos 
Tutoría Nº 6: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA MEDIA DEL PROCESO. 
Tutoría Nº 7: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA VARIACIÓN DEL PROCESO Y PARA LA PROPORCIÓN DE DEFECTUOSOS.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
68
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
69 
A. Aspectos preliminares 
1. Competencias 
1.1. Conceptuales 
Reconoce los conceptos de las técnicas muy útiles que se usan en la 
industria para controlar y mejorar la calidad del producto. 
1.2. Procedimentales 
Elaboran diagramas de control para controlar y mejorar el producto de 
un proceso de manufactura. 
1.3. Actitudinales 
Asegurar que las variables que miden la calidad de un producto queden 
dentro de los intervalos que son aceptables para posibles clientes. 
B. Desarrollo del contenido, sus procedimientos y modalidad 
1. Contenido programático 
El contenido programático de la unidad referida es el siguiente: control 
de calidad, introducción, métodos de control de calidad: técnicas de 
supervisión, técnicas de localización de problemas, técnicas de 
selección, supervisión de la calidad mediante graficas o diagramas de 
control, grafica de control para media del proceso: diagrama de x ; 
gráfica de control para la variación del proceso: diagrama de r, gráfica 
de control para la proporción de defectuosos: diagrama de p; gráfica 
de control para el número de defectuosos por unidad: diagrama de c 
2. Modalidad y procedimiento de desarrollo de la unidad 
Durante la fase a distancia 
a) Cada alumno lee la primera unidad del módulo. 
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos 
prácticos. 
c) Remite las prácticas y los trabajos a la página web de PROESAD. 
Durante la fase presencial/tutorial 
a) Exposición sobre los trabajos elaborados y remitidos. 
b) Refuerzo del profesor con incidencia y corrección en los puntos 
fuertes y debilidades.
Mg. María Vallejos Atalaya 
PROESAD Programa de Educación Superior a Distancia 
70 
Tutoría Nº 
Control de calidad: grafica de control para la media del proceso 
ESTUDIO DE UN CASO 
El Caso del Aceite Perdido 
Considérese un problema administrativo, en el que usted es el encargado de la operación de llenar latas de aceite lubricante para motores. Los envases de un cuarto de galón, el tipo que se compra en una estación de servicio local, se llenan con una máquina que tiene 28 boquillas (inyectores). Cada boquilla descarga el aceite en una lata, y la máquina llena así los 28 envases, uno con cada inyector. 
El problema se presenta cuando los controladores de la compañía detectan una discrepancia extraña. Aunque la cantidad de aceite que se recibe mensualmente para la operación de llenado asciende a 10 000 000 de cuartos de galón, el número de latas de una cuarto que se llenan, es siempre considerablemente menor. Si el número de latas llenadas de un mes dado es de 9 700 000, ¿qué pasó con los 300 000 cuartos de aceite perdido? 
El problema que acabamos de describir es similar al problema encontrado por V. Filimon y sus colegas quienes trabajan, en ese tiempo, para la Estándar Oil Company en Cleveland, Ohio (V. Filimon, R. Maggass, D. Frazier y A. Flingel, “Some Applications of Quality Control Techniques in Motor Oil Can Filing, Industrial Quality Control, Vol. 12, 1995”). Su operación consistió en usar tres maquinas llenadoras cada una con 6 boquillas para latas de un cuarto, otra con 28 boquillas también para un cuarto y una mas con 16 inyectores para latas de un galón. 
La búsqueda del aceite perdido se concentro rápidamente en la maquina llenadora. ¿Se puede ajustar una máquina para que una boquilla descargue exactamente un cuarto de aceite en cada lata? La respuesta es negativa, porque la cantidad de aceite descargada para una sola boquilla difiere ligeramente de la que descargue otra, debido a la variación en el flujo del aceite por la citada boquilla. Así la cantidad x de aceite descargada en una lata, medida en volumen o en peso, varia de una lata a otra y tiene una distribución de frecuencias relativas. Esta variación en el peso de llenado, llevo a Filimon y a sus colegas, a sospechar que el aceite perdido salía de la planta en las mismas latas. 
La operación de llenar los envases, y sus problemas inherentes, es comparable a la mayoría de las operaciones actuales en los negocios. Cada operación origina un producto que se considera aceptable o inaceptable, dependiendo de una o más variables que miden la calidad del producto. El producto de una operación de llenado de envases de aceite es una lata de aceite; una medida de su calidad es la cantidad de aceite depositado en cada lata. El producto de una máquina que origina lámparas eléctricas es una bombilla o un foco, y una medida de su calidad es la cantidad de luz que emita. El producto de un hospital es el tratamiento médico y el cuidado para un solo paciente. La calidad del cuidado de un paciente se mediría, sin duda, mediante un cierto número de variables de calidad. 
En esta unidad presentaremos algunas técnicas administrativas y estadísticas para supervisar, mejorara y controlar la calidad del producto de una operación actual en los negocios. 
6
Estadística Aplicada 
PROESAD Programa de Educación Superior a Distancia 
71 
6.1. INTRODUCCION 
El objetivo de este capitulo es presentar algunas técnicas muy útiles que se usan en la industria para controlar y mejorar la calidad de productos manufacturados así como para el mejoramiento de la calidad de sistemas de administración. 
Como lo indica el titulo, la metodología del control de calidad se estructuro para controlar y mejorar el producto de un proceso de manufactura. Los perfiles o barras de acero deben tener una resistencia a la tensión especifica; un jabón tiene que ser producido con un nivel bajo de impurezas; una caja de cereales debe tener un contenido en peso específico, y los datos de entrada financieros en una computadora para administración tienen que ser exactos y preciso, con una alta probabilidad. Así, el objetivo de un programa de control de calidad es asegurar que las variables que miden la calidad de un producto queden dentro de los intervalos que son aceptables para posibles clientes. 
6.2. MÉTODOS DE CONTROL DE CALIDAD 
Los métodos de control de calidad se clasifican en tres categorías: 
6.2.1. Técnicas de supervisión 
Diseñadas para seguir o rastrear el nivel de las variables de calidad y para detectar cambios indeseables en la calidad del producto; 
6.2.2. Técnicas de localización de problemas 
Ideadas para ayudar a ubicar las causas de cambios indeseables en la calidad del producto; y 
6.2.3. Técnicas de selección 
Diseñadas para eliminar productos defectuosos, o de mala calidad que entran al proceso como materia prima y sirven para realizar el mismo trabajo, en el caso de los productos acabados antes de enviarlos a un cliente. 
Se dice a menudo que el control de calidad consta del 10% de Estadística y de 90% de ingeniería y sentido común. Como se aprender, la mayoría de los métodos de control de calidad se basan en los conceptos estadísticos elementales. El verdadero problema ocurre cuando se detecta uno de los procesos de supervisión o monitoreo o de selección. Así los métodos de control de calidad pueden decir cuando pero no porque ocurren los problemas. Para descubrir la causa de la baja calidad en productos y corregir la situación, es necesario conocer el proceso y tener aptitudes y habilidad para resolver problemas. 
Esta unidad trata de dos de los tres tipos de métodos de control de calidad, los procedimientos para controlar un proceso de producción actual y los métodos utilizados para eliminar materia prima poco satisfactoria que entra al proceso o productos defectuosos que salen del proceso o ambas cosas. La tercera categoría metodológica, los procedimientos estadísticos para localizar la causa de un cambio que haga bajar la calidad del producto, consiste en todos los métodos desarrollados en esta asignatura como en estadística general. Dos de los procedimientos de mayor utilidad son el análisis de regresión y el análisis por tablas de contingencia que pueden establecer con correlación entre una o más materias primas, o variables del proceso o del entorno, y la calidad del producto. 
6.3. SUPERVISION DE LA CALIDAD MEDIANTE GRAFICAS O DIAGRAMAS DE CONTROL 
Las mediciones de una variable de calidad varían en el tiempo. Por ejemplo, las mediciones del diámetro interior de un cojinete cuyo valor es pulgada, variarán ligeramente de una pieza a otra. El diámetro del cojinete tiende a hacerse mas pequeño debido al desgaste del utensilio de corte del proceso de maquinado. Una variación de este tipo se denomina definida por una causa atribuible. Otra variación en la que ocurre pequeños cambios fortuitos que se deben a la gran cantidad de variables desconocidas que afectan el diámetro: cambios en la materia prima, condiciones ambientales, etc., se considera como una variación aleatoria.
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada

Más contenido relacionado

La actualidad más candente

Unidad dos punto n°3
Unidad dos punto n°3Unidad dos punto n°3
Unidad dos punto n°3eduardobarco
 
577544365.u04 poisson - ejercicio resuelto
577544365.u04   poisson - ejercicio resuelto577544365.u04   poisson - ejercicio resuelto
577544365.u04 poisson - ejercicio resueltosaposapoloko
 
Distribución de poisso ejercicios
Distribución de poisso ejerciciosDistribución de poisso ejercicios
Distribución de poisso ejerciciosAurora Sanchez Caro
 
Tarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaTarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaIPN
 
Inferencia introducción
Inferencia introducciónInferencia introducción
Inferencia introducciónnchacinp
 
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesIntervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesYazmin Venegas
 
Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10CUR
 
Tarea 12 de probabilidad y estadística con respuestas
Tarea 12 de probabilidad y  estadística con respuestasTarea 12 de probabilidad y  estadística con respuestas
Tarea 12 de probabilidad y estadística con respuestasIPN
 
Tarea 16 de probabilidad y estadistica con respuestas
Tarea 16 de probabilidad y estadistica  con respuestasTarea 16 de probabilidad y estadistica  con respuestas
Tarea 16 de probabilidad y estadistica con respuestasIPN
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...IPN
 
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Luz Hernández
 
DIAPOSITIVAS DE ESTADÍSTICA COMPLEJA
DIAPOSITIVAS DE ESTADÍSTICA COMPLEJADIAPOSITIVAS DE ESTADÍSTICA COMPLEJA
DIAPOSITIVAS DE ESTADÍSTICA COMPLEJAajimenezz
 
Distribucion de poisson
Distribucion de poissonDistribucion de poisson
Distribucion de poissoncathycontreras
 

La actualidad más candente (20)

Unidad dos punto n°3
Unidad dos punto n°3Unidad dos punto n°3
Unidad dos punto n°3
 
Ejercicios1er con respuestas
Ejercicios1er con respuestasEjercicios1er con respuestas
Ejercicios1er con respuestas
 
Chi cuadrado
Chi  cuadradoChi  cuadrado
Chi cuadrado
 
Estadistica ii crc 4
Estadistica ii crc 4Estadistica ii crc 4
Estadistica ii crc 4
 
577544365.u04 poisson - ejercicio resuelto
577544365.u04   poisson - ejercicio resuelto577544365.u04   poisson - ejercicio resuelto
577544365.u04 poisson - ejercicio resuelto
 
Distribución de poisso ejercicios
Distribución de poisso ejerciciosDistribución de poisso ejercicios
Distribución de poisso ejercicios
 
Tarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaTarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuesta
 
Inferencia introducción
Inferencia introducciónInferencia introducción
Inferencia introducción
 
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesIntervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporciones
 
Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10
 
Tarea 12 de probabilidad y estadística con respuestas
Tarea 12 de probabilidad y  estadística con respuestasTarea 12 de probabilidad y  estadística con respuestas
Tarea 12 de probabilidad y estadística con respuestas
 
Tarea 16 de probabilidad y estadistica con respuestas
Tarea 16 de probabilidad y estadistica  con respuestasTarea 16 de probabilidad y estadistica  con respuestas
Tarea 16 de probabilidad y estadistica con respuestas
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
 
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
 
Distribución de poisson
Distribución de poissonDistribución de poisson
Distribución de poisson
 
Prueba de hipotesis para dos poblaciones
Prueba de hipotesis para dos poblacionesPrueba de hipotesis para dos poblaciones
Prueba de hipotesis para dos poblaciones
 
Distribucion uniforme continua
Distribucion uniforme continuaDistribucion uniforme continua
Distribucion uniforme continua
 
DIAPOSITIVAS DE ESTADÍSTICA COMPLEJA
DIAPOSITIVAS DE ESTADÍSTICA COMPLEJADIAPOSITIVAS DE ESTADÍSTICA COMPLEJA
DIAPOSITIVAS DE ESTADÍSTICA COMPLEJA
 
Distribucion de poisson
Distribucion de poissonDistribucion de poisson
Distribucion de poisson
 
02 de frebreo 2011
02 de frebreo 201102 de frebreo 2011
02 de frebreo 2011
 

Destacado (7)

Trabajo de estadística
Trabajo de  estadísticaTrabajo de  estadística
Trabajo de estadística
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Ejercicios unidad 3 mata
Ejercicios unidad 3 mataEjercicios unidad 3 mata
Ejercicios unidad 3 mata
 
Blo gejercicios de hipotesis
Blo gejercicios de hipotesisBlo gejercicios de hipotesis
Blo gejercicios de hipotesis
 
Trabajo final-estadistica aplicada
Trabajo final-estadistica aplicadaTrabajo final-estadistica aplicada
Trabajo final-estadistica aplicada
 
Clase población muestra y muestreo
Clase población muestra y muestreoClase población muestra y muestreo
Clase población muestra y muestreo
 
Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicada
 

Similar a Estadistica aplicada

ESTADISTICAS MAURICIO AQUIETA
ESTADISTICAS MAURICIO AQUIETAESTADISTICAS MAURICIO AQUIETA
ESTADISTICAS MAURICIO AQUIETAmauricio17nsnsj
 
Estadisticadavid 140929145419-phpapp02
Estadisticadavid 140929145419-phpapp02Estadisticadavid 140929145419-phpapp02
Estadisticadavid 140929145419-phpapp02Hugo Yanez
 
U4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdfU4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdfDANIELMOYA54
 
Se_9_UPN_Modificado año 2016 clases presenciales
Se_9_UPN_Modificado año 2016 clases presencialesSe_9_UPN_Modificado año 2016 clases presenciales
Se_9_UPN_Modificado año 2016 clases presencialesingrhuacho
 
Metodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidadMetodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidadsolymarysol
 
5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptxgloria Esparraga
 
Distribuciones muestrales
Distribuciones muestralesDistribuciones muestrales
Distribuciones muestralesMynor Garcia
 
Diseño muestral...teoria
Diseño muestral...teoriaDiseño muestral...teoria
Diseño muestral...teoriajavier4445
 
Estimacion de parametros
Estimacion de parametrosEstimacion de parametros
Estimacion de parametrosUFRO
 
Clase de estimacion puntual y intervalo
Clase de estimacion puntual y intervaloClase de estimacion puntual y intervalo
Clase de estimacion puntual y intervaloIvan Nuñez Salinas
 

Similar a Estadistica aplicada (20)

ESTADISTICAS MAURICIO AQUIETA
ESTADISTICAS MAURICIO AQUIETAESTADISTICAS MAURICIO AQUIETA
ESTADISTICAS MAURICIO AQUIETA
 
Formulas estadisticas
Formulas estadisticasFormulas estadisticas
Formulas estadisticas
 
Estadisticadavid 140929145419-phpapp02
Estadisticadavid 140929145419-phpapp02Estadisticadavid 140929145419-phpapp02
Estadisticadavid 140929145419-phpapp02
 
Estadistica david
Estadistica davidEstadistica david
Estadistica david
 
Estimacionpuntual1
Estimacionpuntual1Estimacionpuntual1
Estimacionpuntual1
 
Estimacion y desviacion
Estimacion y desviacion Estimacion y desviacion
Estimacion y desviacion
 
U4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdfU4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdf
 
Estimacion
EstimacionEstimacion
Estimacion
 
Se_9_UPN_Modificado año 2016 clases presenciales
Se_9_UPN_Modificado año 2016 clases presencialesSe_9_UPN_Modificado año 2016 clases presenciales
Se_9_UPN_Modificado año 2016 clases presenciales
 
Metodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidadMetodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidad
 
Estimadores
EstimadoresEstimadores
Estimadores
 
5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Distribuciones muestrales
Distribuciones muestralesDistribuciones muestrales
Distribuciones muestrales
 
Formulas 2012 01pdf
Formulas 2012 01pdfFormulas 2012 01pdf
Formulas 2012 01pdf
 
Estimación de Parámetros
Estimación de ParámetrosEstimación de Parámetros
Estimación de Parámetros
 
Diseño muestral...teoria
Diseño muestral...teoriaDiseño muestral...teoria
Diseño muestral...teoria
 
Estimacion de parametros
Estimacion de parametrosEstimacion de parametros
Estimacion de parametros
 
document (1).pdf
document (1).pdfdocument (1).pdf
document (1).pdf
 
Clase de estimacion puntual y intervalo
Clase de estimacion puntual y intervaloClase de estimacion puntual y intervalo
Clase de estimacion puntual y intervalo
 

Estadistica aplicada

  • 1. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 13 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce el concepto de estimación puntual y por intervalos. 1.2. Procedimentales Calculan estimaciones puntuales o intervalicas de los parámetros de una población. 1.3. Actitudinales Resuelve situaciones en donde se quiere estimar los parámetros de una población en estudio. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: Estimación de parámetros: Introducción: Estimación Puntual (Estimación puntual para la media poblacional, Estimación Puntual para la varianza poblacional, Estimación de parámetros de dos poblaciones, Estimación puntual de una población de variable cualitativa, Estimación puntual de dos poblaciones de variables cualitativas) y Estimación por intervalos (Intervalo de confianza para la media poblacional, Intervalo de confianza para la diferencia de medias poblacionales, Intervalo de confianza para la proporción poblacional, Intervalo de confianza para la diferencia de proporciones poblacionales). 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 2. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 14 Tutoría Nº Estimación de parámetros: estimación puntual y estimación por intervalos 1.1. INTRODUCCIÓN Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones respecto a una población, de los datos obtenidos realmente de una muestra. La inferencia estadística comprende dos tipos principales de técnicas: Estimación de parámetros y contrastación de hipótesis. Independientemente de la técnica que se utilice, la finalidad general es utilizar datos de una muestra para extraer conclusiones respecto a una población. 1.2. ESTIMACIÓN DE PARÁMETROS Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa respecto al valor de una característica de la población y desea conocer cuál podría ser tal valor. La estimación puede asumir 2 formas: - Estimación puntual - Estimación por intervalos 1.2.1. Estimación puntual Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar el parámetro desconocido de la población. Una desventaja de esta forma de estimación es que no aporta la precisión de la estimación del parámetro. Las estimaciones puntuales más usuales son: (A) Estimación Puntual para la media poblacional. Se halla mediante las siguientes fórmulas. - Para datos simples - Para datos agrupados f x f = x = n x = x = i i i i (B) Estimación Puntual para la varianza poblacional. Se halla mediante las siguientes fórmulas. - Para datos simples - Para datos agrupados f x f n x = s = n x n x = s = 2 2 2 1 ( ) 1 ( ) 2 2 2 2 2 1
  • 3. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 15 (C) Estimación de parámetros de dos poblaciones Sea X1 una variable aleatoria que se distribuye como una distribución normal con media 1 y varianza 2 1 e X2 otra variable aleatoria que se distribuye como una distribución normal con media 2 y varianza 2 2 . La estimación de parámetros de dos poblaciones se pueden realizar mediante: a) La comparación de sus medias, luego: 1 2 1 2 1 2 - = ˆ - ˆ = x - x b) La comparación de sus varianzas, luego: s s = = 2 x 2 x x x x 2 x 2 1 2 1 2 2 1 2 ˆ ˆ ˆ (D) Estimación puntual de una población de variable cualitativa Sea X una variable cualitativa con: A : Presencia de la característica y Q = 1 - P 0, si X A 1, si X A N M N X con P X i Luego: y q = 1 - p 0, si x A 1, si x A n m N x con p x i Entonces: P p (E) Estimación puntual de dos poblaciones de variables cualitativas Sea X1 la variable aleatoria de una población cualitativa con Px1 proporción de aciertos en X1 y sea X2 la variable aleatoria de otra población cualitativa con Px2 proporción de aciertos en X2, luego: Px1 - Px2 = Px1 - Px2 = px1 - px2 ˆ ˆ 1.2.2. Estimación por intervalos La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el parámetro tiene la probabilidad especificada de estar. Los estimados por intervalos se conocen como intervalos de confianza y los límites inferior y superior como los límites de confianza. En general el intervalo de confianza para el parámetro se expresa: P(  - k  + k ) = 1 -  
  • 4. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 16 Donde: = Parámetro = Estimador k = Valor tabulado = Desviación estándar del estimador 1 = Nivel de confianza Los intervalos de confianza más usuales son: (A) Intervalo de confianza para la media poblacional ( ) Para determinar el intervalo de confianza para la media poblacional se debe tomar en cuenta lo siguiente: - Cuando se conoce la varianza de la población y/o el tamaño de muestra n 30. P( x - Z n x + Z n ) = 1 - 2 2 (1 ) (1 ) - Cuando no se conoce la varianza de la población y el tamaño de muestra n < 30. P( x - t s n x + t s n ( n ( ) = 1 - 2 1 ,n-1) 2 , 1) 1 (B) Intervalo de confianza para la diferencia de medias poblacionales Se presentan los siguientes casos: - Si 2 1 y 2 2 son conocidos ] = 1 - n + n - ( x - x ) + Z n + n P[( x - x ) - Z 2 2 2 2 2 2 2 1 1 ) 2 1 2 1 2 (1 2 2 1 1 1 2 (1 ) - Si 2 1 y 2 2 no son conocidos se presentan dos casos: a. Si 2 1 es aproximadamente igual a 2 y entonces 2 1 2 2 2 ) ] = 1- n 1 + n 1 ) - ( x - x )+t s ( n 1 + n 1 P[( x - x ) - t s ( 2 ,n-1) 2 ( 2 ,n-1) 2 ( 1 2 1 2 1 2 1 1 2 1 2 1 n + n - 2 ( n - 1) s + ( n - 1) s donde: s = 2 2 2 1 2 1 1 2 2 b. Cuando 2 1 es diferente a 2 2 ] =1 - n s + n s - ( x - x ) + t n s + n s P[( x - x ) - t 2 2 n-1) 2 2 ,n-1) 2 ( 2 2 1 1 , 2 1 2 1 2 (1 2 2 1 1 1 2 1 Observación: Sí n1+ n2 - 2 30, el valor tabulado es Z(1 - /2) Sí n1 + n2 - 2 < 30, el valor tabulado es t(n1 + n2 – 2, 1 - /2)
  • 5. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 17 (C) Intervalo de confianza para la proporción poblacional Se presentan los siguientes casos: - Cuando el tamaño de muestra es grande (n 30) P(p - Z pq n P p + Z pq n = 1 - 2 2 (1 ) (1 ) ) - Cuando el tamaño de muestra es pequeño (n < 30) P(p - t pq n P p + t pq n ( ) = 1 - 2 ,n-1) ( 2 1 1 ,n-1) (D) Intervalo de confianza para la diferencia de proporciones poblacionales Se pueden presentan los siguientes casos: - Si, n1 y n2 son muestras grandes (n1 + n2 - 2 30) ] = 1- n p q + n p q P - P ( p - p )+Z n p q + n p q P[( p - p ) - Z 2 2 2 2 2 1 1 1 1 2 1 2 (1 ) 2 2 2 1 1 1 1 2 (1 ) - Si, n1 y n2 son muestras pequeñas (n1 + n2 - 2 30) ] = 1- n p q + n p q P - P ( p - p )+t n p q + n p q P[( p - p ) - t ,n-1) 2 ,n-1) ( 2 ( 2 2 2 1 1 1 1 2 1 2 1 2 2 2 1 1 1 1 1 (1 Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80, n2 = 20 se recomienda emplear: n + n n p + n p donde : p = ) n 1 + n 1 s = p(1 - p )( x y 2 1 2 1 1 2 2 esta proporción denota la proporción conjunta de las dos muestras. Ejemplo 1.1 Se ensaya un test para determinar el cociente de inteligencia a 8 alumnos; los resultados fueron: 98, 108, 92, 111, 102, 95, 89, 115. Determine: a) estimación puntual y b) estimación por intervalo (use el 90% de confianza) para el promedio verdadero del cociente de inteligencia. Solución n = 8, x = 101.25, s = 9.38 1- = 0.90 Luego 2 1 = 0.95 como n 30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895 a) Estimación puntual: Por formula xi = x = n x 101.25
  • 6. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 18 b) Estimación por intervalo: Por formula ) = 1 - n s x + t n s P( x - t ( 7,.0.95) ( 7,0.95) Reemplazando: P( - ) = 1 - 8 9.38 101.25 1.895 8 9.38 101.25 1.895 Se obtiene P[ 94.97 107.53] = 90% Luego el promedio verdadero del cociente de inteligencia de los alumnos se encuentra entre 94.97 y 107.53, con un nivel de confianza de 90%. Ejemplo 1.2 Una muestra aleatoria de 100 hogares de una ciudad indica que el promedio de los ingresos mensuales es de $ 500. Encuentre un intervalo de confianza del 95 % para la media poblacional de los ingresos de todos los hogares de esa ciudad. Suponga σ = $ 110. Solución n = 100, x = 500 σ = $ 110 1- = 0.95 luego 2 1 = 0.975 como n = 30, entonces Z(1 - /2) = Z(0.95) = 1.96 Por formula (1 ) (1 ) 2 2 P( x - Z x + Z )= 1 - n n Reemplazando 110 110 500 1.96 500 1.96 ) 95% 100 100 P( - + = Se obtiene P[ 478.44 521.56] = 95% Esto, es se tiene una confianza del 95% que el promedio del ingreso familiar poblacional de esa ciudad, está en el intervalo $ 478.44 y $ 521.56. Ejemplo 1.3 Como parte de un experimento, una gran empresa manufacturera encontró que el tiempo promedio requerido para que 16 empleados escogidos al azar completaran una tarea determinada era de 26 minutos, la desviación estándar 5 minutos. Construir el intervalo de confianza del 95% para la media poblacional. Solución n = 16 x = 26 s = 5 1- = 0.95 Luego 2 1 = 0.975 como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131 Por formula ) = 1 - n s x + t n s P( x - t (15,0.975) (15,0.975)
  • 7. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 19 Reemplazando ) 95% 16 5 26 2.131 16 5 P( 26 - 2.131 + = Se obtiene P[ 23.34 28.66 ] = 95% Ejemplo 1.4 Se ha hecho un estudio de las diferencias entre estudiantes universitarios del primer año que estuvieron en academias y estudiantes que no estuvieron. Para ello se tomó una muestra aleatoria de 50 estudiantes universitarios que habían asistido a academias y una muestra aleatoria simple independiente de 60 estudiantes que no lo habían hecho. Al final del primer semestre se administró a los estudiantes una prueba de rendimiento en matemática. Los que habían asistido a academias, obtuvieron un puntaje promedio de 14,5, con una varianza de 4,8; y el puntaje promedio para el grupo que no había asistido a la academia, fue de 13,75 con una varianza de 6,4. Construya un intervalo de confianza para la diferencia entre las dos medias poblacionales (use 99% de confianza). Solución ASISTIERON ACADEMIA NO ASISTIERON ACADEMIA n1 = 50 x1 =14.5 s2 1 = 4.8 n2 = 60 2 x =13.75 s2 2 = 6.4 1 - = 0.99 luego 1- 2 = 0.995 Como n1 + n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 Por formula ] =1 - n s + n s - ( x - x ) + z n s + n s P[( x - x ) - z 2 2 ) 2 2 ) 2 ( 2 2 1 1 2 1 2 1 2 (1 2 2 1 1 1 2 1 Reemplazando 99% 60 6.4 50 4.8 14.5 13.75 2.58 60 6.4 50 4.8 14.5 13.75 2.58 1 2 P[( - ) - + - ( - ) + + ] = Se obtiene 0.41 1.91 99% 1 2 P[ - ]= Ejemplo 1.5 Los estudiantes que se matricularon en un curso de investigación educativa fueron distribuidos al azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades para enriquecer el curso. El grupo B estudió mediante el método tradicional de conferencias. Los puntajes obtenidos en una prueba de rendimiento, hecha al terminar el curso dieron los siguientes resultados: Grupo n x s A (1) 10 80 8 B (2) 12 72 10 Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios poblacionales.
  • 8. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 20 Solución 1 - = 0.90 luego 1 - 2 = 0.95 Como n1 + n2 –2 < 30 entonces t (n1 + n2 –2,1– /2) = t(20, 0.95) = 1.725 Por formula ] = 1- n s + n s - ( x - x )+t n s + n s P[( x - x ) - t 2 2 (n n 2 2 (n n 2 2 1 1 1 2 1 2 2,1 / 2) 2 2 1 1 1 2 1 2 2,1 / 2) 1 2 Reemplazando 90% 12 100 10 64 80 72 1.725 12 100 10 64 80 72 1.725 1 2 P[( - ) - + - ( - )+ + ] = Se obtiene 1.38 14.62 90% 1 2 P[ - ] = Ejemplo 1.6 Una encuesta para verificar las actitudes de los empleados ante el boletín mensual, se les pidió a 500 empleados de una gran organización nacional que indicaran con que frecuencia leían el boletín de noticias. De los 500, 375 informaron que leían todas las ediciones. Construir el intervalo de confianza del 95% para la proporción real de los que opinan afirmativamente. Solución: n = 500 p = 500 375 = 0.75 q =0.25 1- = 0.95 luego 2 1 = 0.975 Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96 Por formula ] = 1 - n pq P p + Z n pq P[p - Z (1 / 2) (1 / 2) Reemplazando 95% 500 0.75(0.25) 0.75 1.96 500 0.75(0.25) P[ 0.75 - 1.96 P + ] = Se obtiene P[ 0.71 P 0.79 ] = 95% Ejemplo 1.7 En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto programa de televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado. Determinar los límites de confianza del 99% para la diferencia de proporciones de todos los adultos y jóvenes que vieron con agrado el programa. Solución ADULTOS JÓVENES n1= 400 a1 = 100 p1 = 0.25 1 1 n a q1 = 1-p1 = 0.75 n2 = 60 0 a2 = 300 p2 = 0.5 2 2 n a q2 = 1 – p2 = 0.5 1 - = 0.99 Luego 1- 2 = 0.995
  • 9. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 21 Como n1+ n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza mancomunada así: n + n n p + n p p = 1 2 1 1 2 2 Reemplazando 0.4 1000 400 400 600 100 300 + + p = ) n 1 + n 1 s = p(1 - p )( 1 2 ) 1 + 1 s = ( )( 0.032 400 600 0.4 0.6 Por formula ) ] =1 - n 1 + n 1 ) P - P ( p - p )+ Z p(1 - p )( n 1 + n 1 P[( p - p ) - Z p(1 - p )( 1 2 1 2 1 2 (1/ / 2 1 2 1 2 (1/ / 2 Reemplazando P[( 0.25 0.5 ) - 2.58(0.032) P - P ( 0.25 0.5 )+2.58(0.032) ] = 99% A J Se obtiene 0.33 0.17 99% 1 2 P[ P - P ] =
  • 10. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 22 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) El método de estimación de un parámetro puede ser: puntual o por intervalos. ( ) La Inferencia estadística comprende dos tipos principales de técnicas. ( ) La estimación por intervalos contiene el cálculo de una sola cifra numérica. ( ) Se obtiene conclusiones de la población a través de la información de la muestra. ( ) En la estimación puntual incluye un intervalo en el que están comprendidos los valores del parámetro. 2. De una población se escogieron al azar 10 personas y se les tomo la estatura. Los resultados en cm fueron: 160, 170, 170, 150, 160, 180, 160, 170, 130, 150. a) Estime la media y la varianza. 3. En una universidad se desea conocer la opinión de los estudiantes acerca de ciertas medidas que han tomado las directivas. De 120 estudiantes consultados, 90 estuvieron a favor. a) Estime la proporción de estudiantes que están a favor de las medidas 4. Para estimar la media del consumo (dólares) en el restaurante de una universidad, se tomó una muestra de 49 profesores. Suponga una desviación estándar poblacional de 5 dólares. Si la media en la muestra fue de 24.80 dólares mensuales. a) ¿Cuál fue el intervalo de confianza de 95% para el consumo medio poblacional? 5. Los siguientes números representan el tiempo(en minutos) que tardaron 15 operarios en familiarizarse con el manejo de una nueva máquina adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8. a) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo promedio. b) El instructor considera que el tiempo promedio requerido por los trabajadores es mayor que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado? 6. Una marca de lavadoras quiere saber la proporción de amas de casa que preferirían usar su marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usarían. a) Calcula un intervalo de confianza del 95% para la verdadera proporción de amas de casa que preferirían dicha lavadora.
  • 11. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 23 Unidad 2 PRUEBA DE HIPOTESIS DE PARAMETRO POBLACIONALES Nº de tutorías: Dos Tutoría Nº 1: PRUEBA DE HIPÓTESIS: CONCEPTOS BÁSICOS; PRUEBA DE HIPÓTESIS PARA UNA MEDIA; UNA VARIANZA Y DOS VARIANZA POBLACIONAL Tutoría Nº 2: PRUEBA DE HIPÓTESIS: PROPORCIÓN POBLACIONAL; DOS MEDIAS POBLACIONALES; DOS PROPORCIONES POBLACIONALES.
  • 12. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 24
  • 13. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 25 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce el concepto de prueba de hipótesis para los parámetros. 1.2. Procedimentales Comprobar las pruebas de hipótesis en las investigaciones científicas. 1.3. Actitudinales Resuelve situaciones en donde el interés es probar hipótesis de los parámetros de una población en estudio. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: Introducción, Concepto prueba de hipótesis, hipótesis nula, hipótesis alternativa, errores de prueba y nivel de significación, pruebas bilaterales y unilaterales, prueba de hipótesis referida a la media poblacional, prueba de hipótesis sobre la varianza poblacional, prueba de hipótesis referida a dos variancias poblacionales, prueba de hipótesis referida a la proporción poblacional, prueba de hipótesis referida a la diferencia entre dos medias poblacionales, prueba de hipótesis referida a la diferencia entre dos proporciones poblacionales 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 14. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 26 Tutoría Nº Prueba de hipótesis: conceptos básicos; prueba de hipótesis para una media; una varianza y dos varianza poblacional 2.1. INTRODUCCIÓN El objetivo es dar algunos métodos que se usan para tomar decisiones sobre poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se debe partir de afirmaciones o conjeturas con respecto a la población en el que estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura hecha sobre una población o sobre sus parámetros deberá ser sometida a comprobación experimental con el propósito de saber si los resultados de una muestra aleatoria extraída de esa población, contradicen o no tal conjetura. A continuación definiremos algunos conceptos básicos para la prueba de hipótesis. 2.2. HIPÓTESIS Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación. Por esta razón se le denomina hipótesis de investigación. Generalmente hay que volver a plantear las hipótesis de investigación convenientemente de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas las hipótesis reciben el nombre de hipótesis estadística. 2.3. HIPÓTESIS ESTADÍSTICAS Una hipótesis estadística es un enunciado o proposición respecto a uno o más parámetros de la población. A fin de probar una proposición, es preciso formular una hipótesis denominada nula juntamente con otra denominada hipótesis alternativa. 2.3.1. Hipótesis nula (Ho) Son aquellas que están referidas a algún parámetro de la población o de las poblaciones de estudio. Estas son llamadas hipótesis científicas. 2.3.2. Hipótesis alternativa (Ha) Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la que sirve para contrastarla. 2.4. ERRORES DE PRUEBA Y NIVEL DE SIGNIFICACIÓN Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal caso estaremos cometiendo el denominado ERROR DE TIPO I. De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos, estaremos decidiendo bien. 2
  • 15. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 27 Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos corresponde al NIVEL DE SIGNIFICACIÓN. P(ERROR TIPO I) = Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o falsa. DECISIÓN SOBRE Ho NATURALEZA DE Ho Cierta Falsa No rechazar Rechazar Decisión Correcta Error tipo I (Probabilidad ) Error tipo II (probabilidad ) Decisión correcta Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es posible minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas de tal modo que al disminuir una de ellas la otra aumenta. Así si queremos minimizar inmediatamente aumenta la probabilidad de y viceversa. Generalmente el investigador fija apriori el error que está dispuesto a tolerar, es decir la probabilidad máxima de cometer el error de tipo I. La decisión de una prueba estadística está asociada al nivel de significación: a) Si P < 0.05 ( = 0.05) se dice que existe significación en la prueba b) Si P < 0.01 ( = 0.01) se dice que existe alta significación en la prueba Pruebas bilaterales y unilaterales Cuando tenemos hipótesis alternativa de la forma: Ho : = 0 Ho : P = Po Ha : 0 Ha : P Po Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser mayor, significativamente o acaso menor, significativamente. En tales casos el nivel de significación queda partido en /2 en cada lado de la distribución del estadístico o función de prueba. Tendremos entonces una prueba bilateral o no direccionada (dos puntos críticos) De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales o direccionada (un punto crítico) Ho : = 0 Ha : 0 1 2 1 2
  • 16. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 28 Ho : = 0 Ha : 0 A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama REGIÓN DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN. Una prueba de contrastación de hipótesis estadística se conduce básicamente según el siguiente procedimiento. 1. Plantear las hipótesis - Hipótesis nula (Ho) - Hipótesis alternativa (Ha) 2. Establecer el nivel de significación de prueba ( ) 3. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha función de prueba. 4. Efectuar el reemplazo numérico en la función de prueba con la información muestral. 5. Determinar las regiones de aceptación o rechazo en la distribución de la función de prueba, según se trate de pruebas bilaterales o unilaterales. 6. Tomar una decisión sobre Ho, según la siguiente regla: a. Rechazar Ho si el valor de la función de prueba cae en la región de rechazo. En tal caso se concluirá que Ho se rechaza en favor de Ha con una significación estadística. b. No rechazar Ho si el valor de la función de prueba cae en la región de aceptación. En tal caso se concluirá de que la información muestral no brinda suficientes evidencias como para sospechar de que Ho no sea cierta. 7. Establecer la conclusión, según la hipótesis que se acepte. 2.5. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las características de una población normal. Las hipótesis referentes a este parámetro pueden ser: Ho: μ = μo Ha: μ μo Prueba bilateral o de dos colas Ho: μ = μo Ha: μ μo Prueba unilateral de cola a la derecha Ho: μ = μo Ha: μ μo Prueba unilateral de cola a la izquierda Dicha prueba se efectúa mediante la siguiente función de prueba: a) Si la desviación estándar poblacional no es conocida o n<30 o o t = (n-1) x - s/ n t 1
  • 17. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 29 b) Si la desviación estándar poblacional es conocida ó n≥30 n / n x - z = (0,1) o o Ejemplo 2.1 El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida le permite a su compañía vender más pólizas que las compañías "promedio". El promedio mensual de ventas de todos los agentes de la compañía es de $300. A una muestra de agentes que han recibido el programa de entrenamiento se le encuentra las siguientes ventas en dólares: 300, 270, 360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el supervisor de estos agentes, adoptaría para los restantes el programa de entrenamiento propuesto por el señor Martínez. Emplee 5% de significación. Solución: = 300, n = 10, x = 351.9, s = 48.64 1- = 0.95 como n 30, entonces t(n – 1, 1– ) = t(9,0.95) = 1.833 1) Ho: 300 Ha: 300 2) = 0.05 3) f.p. 0 0 x t s n 4) 0 351.9 300 3.37 48.64 10 t 5) t(9,0.95) = 1.833 6) Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis nula a favor de la hipótesis alternativa 7) Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su compañía vender más pólizas de seguro que la compañía promedio, por lo cual se adoptará para el resto de los agentes el programa propuesto por el señor Martinez. RA 1 - = 0,95 RR = 0,05 tt = 1,833 t0 = 3,37
  • 18. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 30 Ejemplo 2.2 Un investigador afirma que la ingestión diaria de nutrientes (proteína) recomendada en varones de 18-34 años moderadamente activos, tiene un promedio de 75 grs. para contrastar tal hipótesis se tomó una muestra de 116 varones saludables obteniendo los siguientes resultados: Proteína encontrada (gr) Número de varones 71 73 75 77 79 8 20 60 18 10 Total 116 Pueden estos resultados, sostener la hipótesis formulada por el investigador. Use el 5% de significación. Solución: = 75, n = 116, x = 75.03, s =1.95 = 0.05 como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96 1) Ho: = 75 Ha: 75 2) = 0.05 3) f.p. o o x - Z = s n 4) 75.03 75 0.17 1.95 116 o Z = 5) 1.96 (0,975) Z = Z t 6) Decisión: Como Zo RA aceptamos Ho 7) Conclusión: Se sostiene la hipótesis formulada para el investigador. 2.6. PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA POBLACIONAL Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. Las hipótesis referentes a este parámetro pueden ser: RR 2 = 0,025 Zt = -1,96 RA 1 - = 0,95 RR 2 = 0,025 Zt =1,96 Z0 = 0,17
  • 19. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 31 Ho: = o Ha: o Prueba bilateral Ho: = o Ha: o Prueba unilateral Ho: = o Ha: o Prueba unilateral Procedimiento: Supóngase que se desea probar la hipótesis de que la varianza de una población normal 2 es igual a un valor específico, por ejemplo, 2 o. Sea X1, X2, ..., Xn una muestra aleatoria de n observaciones tomadas de esta población. Para probar Ho: 2 = 2 o Ha: 2 2 o Se utiliza el estadístico de prueba 2 2 2 ( 1) o o n S X donde S2 es la varianza muestral. Ahora si Ho: 2 = 2 o es verdadera, entonces el estadístico de prueba X2 o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se calcula el valor de la estadística de prueba X2 o, y la hipótesis Ho: 2 = 2 º debe rechazarse si: 2 1,1 / 2 2 2 1, / 2 2 o n o n o si donde X2 n-1, /2 y X2 n-1,1- /2 son los puntos que corresponden a los porcentajes 100 /2 inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente. El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho: 2 = 2 o Ha: 2 > 2 o Se rechaza si: X2 o > X2 n-1,1- Para la otra hipótesis unilateral: Ho: 2 = 2 o Ha: 2 < 2 o Se rechaza si: X2 o < X2 n-1, RA 1 – 2 (n 1, / 2) X RR /2 RR /2 2 (n 1, 1 / 2) X RA 1 – RR 2 (n 1,1 ) X
  • 20. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 32 PROCEDIMIENTO PARA MUESTRAS GRANDES Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal. El estadístico de prueba es: n s Z o o o 2 El gráfico utilizado sería acampanado. Ejemplo 2.3 Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas de fluido)2. Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2, entonces existe una proporción inaceptable de botellas que serán llenadas con una cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de prueba. Solución: 2 = 0.01, n = 20, s2 = 0.0153 = 0.05 como n < 30, entonces 2 (n 1,1 ) X = 30.1 2 (19, 0.95) X Ho: 2 = 0.01 Ha: 2 > 0.01 = 0.05 f.p. 29.07 0.01 ( 1) (19)(0.0153) 2 2 2 o o n S X 30.1 2 (19, 0.95) X RA 1 – RR 2 (n 1, ) X RA 1 – = 0.95 RR = 0.05 30.1 2 t X 29.07 2 o X
  • 21. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 33 Decisión: Como 29.07 2 o X RA aceptamos Ho Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza es igual a 0.01. 2.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES La prueba de comparación de muestras, requiere que las variancias de las dos poblaciones muestreadas sean iguales. En esta sección describiremos una prueba para la hipótesis nula 2 1 = 2 2 , que se aplica a muestras aleatorias independientes obtenidas de dos poblaciones normales; debe utilizarse con mucho cuidado por ser muy sensible a las desviaciones de tal suposición. Las hipótesis referentes a este parámetro pueden ser: Ho: 1 = 2 Ha: 1 2 Prueba bilateral Ho: 1 = 2 Ha: 1 2 Prueba unilateral Ho: 1 = 2 Ha: 1 2 Prueba unilateral Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones normales que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza el siguiente estadístico. 2 2 2 1 s s F que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1 grados de libertad. Obs. F1 - (v1,v2) = F ( , ) 1 2 1 v v Regiones críticas para probar 2 2 2 1 (Poblaciones normales) Hipótesis alterna Estadístico de prueba Rechaza la hipótesis nula si: 2 1 < 2 2 2 2 2 1 s s F F < F (n1 – 1, n2 – 1) 2 1 > 2 2 2 2 2 1 s s F F > F1- (n1 – 1, n2 – 1) 2 1 2 2 2 2 m M s s F F < F /2(nM – 1, nm – 1) ó F > F1- /2(nM – 1, nm – 1) Donde: s2 M : la mayor de las dos variancias muestrales, s2 m : la más pequeña de las variancias.
  • 22. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 34 Para hipótesis unilateral: Ho: 2 2 2 1 Ha: 2 2 2 1 El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho: 2 2 2 1 Ha: 2 2 2 1 Para la otra hipótesis unilateral: Ho: 2 2 2 1 Ha: 2 2 2 1 PROCEDIMIENTO PARA MUESTRAS GRANDES Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30, se utiliza la distribución normal. El estadístico de prueba es: 1 2 1 2 2 1 2 1 n n s s s Z p o RA 1 – F / 2 (nM 1, nm 1) RR /2 RR /2 F1 / 2 (nM 1, nm 1) RA 1 – RR F1 (n1 1, n2 1) RA 1 – RR F1 (n1 1, n2 1)
  • 23. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 35 2 ( 1) ( 1) : 1 2 2 2 2 2 2 1 1 n n n s n s s donde p Ejemplo 2.4 Se requiere determinar si existe menos variabilidad en el plateado realizado por la compañía 1 que el efectuado por la compañía 2. Si las muestras aleatorias independientes de tamaño 12 del trabajo desempeñado por las compañías producen s1=0,035 mil y s2=0,062 mil, pruébese la hipótesis nula de que 2 1 = 2 2 contra la hipótesis alterna de que 2 1 < 2 2 con un nivel de significancia de 0,05. Solución: n1 = n2 = 12, s1 = 0.035, s2 = 0.062, = 0.05 como n1 + n2 < 30, entonces ( 1, 1) (11,11) 0.355 1 2 0,05 Ft = F n n F Ho: 2 2 2 1 Ha: 2 2 2 1 = 0.05 f.p. 0.319 (0.062) (0.035) 2 2 2 2 2 1 s s F Decisión: Como 0 F RA se acepta Ho Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía 2. Usando 5% de significación de prueba. RA 1 – = 0.95 RR = 0.05 Ft 0.355 F0 0.319
  • 24. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 36 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) El rechazo de Ho cuando es verdadera se llama error de tipo I ( ) Si la función de prueba cae en la región crítica entonces aceptamos la Ho ( ) Ha se formula con el propósito de rechazarla, es la que se va a someter a prueba. ( ) Es una prueba bilateral cuando la hipótesis se orienta a un solo lado. ( ) No rechazar la Ho si el valor de la función de prueba cae en la región de aceptación. 2. Un estudio de 29 familias de una zona residencial de la ciudad de Lima, revela que el ingreso medio por familia durante el año 1999 fue de $ 508 con una desviación estándar de $ 16. Probar la hipótesis de que el verdadero ingreso medio por familia en Lima durante 1999 fue de $ 500 frente a la alternativa de que no fue de $ 500. Utilizar un nivel de significancia del 5%. 3. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las ventas de la semana de un determinado producto de consumo popular tiene una desviación estándar s $6 . Se supone que las ventas del producto tienen una distribución normal. Al nivel de significancia del 5%, ¿se podría inferir que la varianza de la población es menor que $40? 4. Los pesos netos (en gramos) de las latas de conserva de una muestra, fueron los siguientes: 121; 119; 124; 123; 119; 121; 124. ¿Se puede concluir que el peso neto poblacional medio es mayor que 123.5? Utilice un nivel de significancia del 1%. 5. Un determinado proceso de empaquetar un producto está controlado, si el peso medio del producto empaquetado es 400 gramos. Si en una muestra aleatoria de 100 paquetes del producto se ha encontrado que el peso medio es de 395 gramos. ¿Se podría concluir que el proceso está fuera de control al nivel de significación 5%?. Suponga que el peso de los productos empaquetados se distribuye normalmente con desviación estándar de 20 gramos. 6. En un proceso de fabricación, se plantea la hipótesis que la desviación estándar de las longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos elegidos al azar del proceso de producción se han encontrado las siguientes longitudes en milímetros: 71, 66, 64, 72, 69, 67, 70, 68, 65, 69. Con estos datos se justifica la suposición que la desviación estándar verdadera es 2.0 mm? Use el nivel de significación α=0.05, y suponga que la distribución de las longitudes es normal.
  • 25. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 37 Tutoría Nº Prueba de hipótesis: proporción poblacional; dos medias poblacionales; dos proporciones poblacionales 3.1. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una determinada característica. Las hipótesis referentes a este parámetro pueden ser: Ho: P = Po Ha: P Po Prueba bilateral Ho: P = Po Ha: P Po Prueba unilateral Ho: P = Po Ha: P Po Prueba unilateral La función de prueba para valores de n 30 es: o o o o z = (0,1) P - p p (1- p ) / n n La función de prueba para valores de n 30 es: o o o o t = (n-1) P - p p (1- p ) / n t Ejemplo 3.1 El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde? Solución: P = 0.60, n = 120, m = 75, 0.625 120 75 p , = 0.05 como n > 30, entonces 1.645 (1 ) (0,95) Zt = Z Z Ho: P 0.60 Ha: P 0.60 = 0.05 f.p. 0.56 120 0.6(0.4) 0.625 0.6 0 P (1- P )/n p - P Z = o o o 3
  • 26. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 38 Decisión: Como Zo RA aceptamos Ho Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión del alcalde. Usando un 5% de significación de prueba. Ejemplo 3.2 Se tomó una muestra aleatoria de 400 escolares, de los cuales 120 tuvieron signos de desnutrición. Verifique la hipótesis de que el porcentaje de desnutridos no excede a 25% en la cobertura de estudio (Use 5% como nivel de significación). Solución P = 0.25, n = 400, m = 120, 0.30 400 120 p , = 0.05 como n > 30, entonces 1.645 ( ) (0,05) Zt = Z Z Ho: P 0.25 Ha: P 0.25 = 0.05 f.p. 2.31 400 0.25(0.75) 0.30 0.25 Zo Decisión: Como Zo RA se acepta Ho Conclusión: La proporción de desnutridos no excede al 25% en la cobertura de estudio. En un 5% de significación de prueba. 3.2 PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis natural es que ambas tienen igual promedio, o en otras palabras que la diferencia de ambos promedios es nula o difieren en alguna cantidad específica. Las hipótesis referentes a este parámetro pueden ser: Ho: μ1 = μ2 Ha: μ1 μ2 Prueba bilateral Ho: μ1 = μ2 Ha: μ1 μ2 Prueba unilateral RR = 0,05 Zt = -1,645 RA 1 - = 0,95 Z0 = 2,31 RA 1 - = 0,95 RR = 0,05 Zt = 1,645 Z0 = 0,56 1.645 (0,95) Zt = Z 1.645 (1 ) (0,95) Zt = Z Z
  • 27. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 39 Ho: μ1 = μ2 Ha: μ1 μ2 Prueba unilateral Pueden presentarse varias situaciones dependiendo de como son sus varianzas: 1. Con varianzas conocidas: La función de prueba es: n n + n ( x - x ) - ( - ) z = (0,1) 2 2 o 2 2 1 1 1 2 1 2 2. Con varianzas desconocidas y diferentes: La función de prueba es: t n s + n s ( x - x ) - ( - ) t = ( n + n - 2) 2 2 o 1 2 2 2 1 1 2 2 1 2 Cuando n1 + n2 2 30 entonces esta función de prueba sigue una distribución normal estándar. 3. Con varianzas desconocidas y aproximadamente iguales: La función de prueba es: t n 1 + n 1 s ( x - x ) - ( - ) t = ( n + n - 2) 2 o 1 2 1 2 1 2 1 2 Aquí s2 es la varianza mancomunada n + n - 2 (n - 1)s + (n - 1)s s = 2 2 2 1 2 1 1 2 2 Al igual que en el caso anterior, si n1 + n2 2 30 entonces la función de prueba sigue una distribución normal estándar. Observación: Antes de realizar la prueba de comparación de medias, es conveniente efectuar la prueba de comparación de varianzas para determinar si los datos de ambas poblaciones tienen varianzas aproximadamente iguales o diferentes. Ejemplo 3.3 Una compañía desea comparar las expectativas salariales anuales de su personal de ventas femenino y masculino, según un nuevo plan de compensaciones venta-más-comisión. Se pidió a n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar, predijeron sus ingresos anuales bajo el nuevo plan. Las medias y desviaciones muestrales eran: x1 = $ 31 083 x2 = $ 29 745 1 s = $ 2 312 2 s = $ 2 569 ¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del ingreso anual esperado tanto entre los vendedores como las vendedoras? Haga la prueba con = 0,10. Solución: Ho: 1 2 5972552 .5 1 2 2 1 2 2 n + n - 2 (n - 1)s + (n - 1)s s = 2 2 2 Ha: 1 2 1.645 (0,95) Zt = Z
  • 28. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 40 = 0.10 f.p. 2.45 40 1 40 1 597255252 .5 31083 29745 0 1 1 1 2 2 1 2 1 2 + n + n s ( x - x ) - ( - ) Zo = Decisión: Como Zo RR no existe suficiente evidencia como para aceptar la hipótesis nula, por consiguiente aceptamos la Ha. Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia en el promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de significación de prueba. 3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES Cuando se desea comparar dos poblaciones cualitativas. Las hipótesis referentes a este parámetro pueden ser: Ho: P1 = P2 Ha: P1 P2 Prueba bilateral Ho: P1 = P2 Ha: P1 P2 Prueba unilateral Ho: P1 = P2 Ha: P1 P2 Prueba unilateral La función de prueba es: n n 1 + n 1 p 1 - p (p - p ) - ( P - P ) z = (0,1) 1 2 1 2 1 2 Aquí p es la proporción mancomunada: n + n n p + n p p = 1 2 1 1 2 2 Ejemplo 3.4 Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico determinado (grupo A) y que ven regularmente lucha en TV. supera mucho a un segundo grupo de hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos grupos arrojaron los siguientes resultados. tamaño de Número de hombres que ven Grupo la muestra regularmente lucha en TV A (1) n1 = 150 a1 = 98 B (2) n2 = 200 a2 = 80 RR 2 = 0,05 Zt = -1,645 RA 1 - = 0,90 RR 2 = 0,05 Zt =1,645 Z0 = 2,46
  • 29. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 41 ¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? use = 0,05 Solución: Ho: 1 2 P P 0.51 350 98 80 p Ha: 1 2 P P 1.645 (0.95) Zt = Z 0.40 200 80 0.65 150 98 2 2 2 1 1 1 n a p n a p = 0.05 f.p. 4.63 200 1 150 1 0.51(0.49) (0.65 0.4) 0 1 2 1 2 1 2 0 + n 1 + n 1 p 1 - p (p - p ) - ( P - P ) Z = Decisión: Como Zo RR rechazamos Ho en favor Ha Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del sociólogo con un 5% de significación de prueba. RA 1 - = 0,95 RR 2 = 0,05 Zt =1,645 Z0 = 4,63
  • 30. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 42 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) La hipótesis Ho: P > Po es una prueba bilateral. ( ) En la prueba F los n1-1 y n2-1 son conocidos como los grados de libertad. ( ) Cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal. ( ) Cuando Fo pertenece a la Región de aceptación entonces se rechaza Ho. ( ) La hipótesis Ho: P > Po es una prueba unilateral a la derecha. 2. El gerente de una empresa insiste en que a lo más del 33% de los clientes de la empresa esta de acuerdo con el cambio de su producto. De 80 clientes tomados al azar, 29 están de acuerdo con el cambio del producto. Al nivel de significancia de 5%, ¿tiene razón el gerente? 3. Ejemplo: Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada población reveló que 120 hombres y 120 mujeres estaban a favor de cierto candidato. ¿Se puede concluir a un nivel de significación del 5% que la proporción de hombres a favor del candidato es mayor que la proporción de mujeres? 4. Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen desviaciones estándar respectivas de 120 horas y 90 horas. Para comparar el promedio de vida útil de estos artículos se extrae una muestra aleatoria de 60 artículos de cada fabricante encontrándose la duración media de 1.230 horas para la marca A y de 1.190 horas para la marca B. ¿Se puede concluir a un nivel de significación del 5% que los artículos de marca A tienen mayor duración media que los artículos de marca B? 5. Se controla la calidad de una muestra aleatoria de 40 piezas producidas por un fabricante. Si se hallaron 4 piezas defectuosas, ¿se debería inferir que el porcentaje de todas las piezas defectuosas es más del 5% al nivel de significación del 5%? 6. Un inversionista está por decidir entre dos provincias para abrir un centro comercial. Par esto debe probar la hipótesis de que hay diferencia en el promedio de ingresos familiares de las dos provincias. Si una muestra de 300 hogares de la provincia 1 da _ x1 $400 y 1 s $90 y otra muestra de 400 hogares de la provincia 2 da _ 2 x $420 y 2 s $120 . ¿se puede inferir que las dos medias poblacionales son diferentes?, si es así, ¿en cual de las provincias debería abrir la sucursal? Utilice =0.05. 2 s $120 _ 2 x $420 _ x1 $400
  • 31. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 43 Unidad 3 ANALISIS DE VARIANZA Nº de tutoría: Uno Tutoría Nº 4: ANÁLISIS DE VARIANZA : ANÁLISIS DE VARIANZA DE UNA VÍA Y DE DOS VÍAS.
  • 32. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 44
  • 33. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 45 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce el modelo del análisis de varianza. 1.2. Procedimentales Prueba las diferencias entre k-medias. 1.3. Actitudinales Comparan las medias de k-grupos o poblaciones. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: Análisis de varianza: conceptos básicos, Análisis de varianza de una vía (concepto, modelo, prueba de hipótesis); Análisis de varianza de dos vías (concepto, clases: sin interacción y con interacción, modelos) 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 34. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 46 Tutoría Nº Análisis de varianza: análisis de varianza de una vía y de dos vías 4.1. ANÁLISIS DE VARIANZA El análisis de varianza se emplea para probar las diferencias entre k medias. Una suposición básica implícita en el análisis de varianza es que las diversas medias muestrales se obtienen de las poblaciones distribuidas normalmente que tienen la misma varianza ². Sin embargo, se ha descubierto que el procedimiento de pruebas no se ve afectado por las violaciones de la suposición de normalidad cuando las poblaciones son unimodales y los tamaños de muestra son aproximadamente iguales. Todos los procedimientos de cálculo presentados son para efectos fijos, contrariamente a los modelos de efectos aleatorios. El concepto básico en el análisis de varianza fue desarrollado por R.A. Fisher y la distribución F se ha denominado en honor suyo. El razonamiento conceptual es el siguiente: (1) Se calcula la media para cada grupo de la muestra y después se determina el error estándar de la media S_ con base sólo en las diversas medias muestrales. (2) Dada la fórmula S_ = S/ n , tenemos que s = n S X y que X s n S 2 . Esta estimación resultante de la varianza de la población se llama la media cuadrática entre los grupos (MCE). (3) Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo. Luego se combinan estos valores de la varianza ponderándolos de acuerdo a n-1 para cada muestra. La estimación resultante de la varianza de la población se llama media cuadrática dentro de los grupos (MCD). (4) Si la hipótesis nula 1 = 2 = 3 = ... = k es verdadera, entonces tenemos que las dos medias cuadráticas obtenidas en (2) y (3) no están sesgadas y son estimadores independientes de la misma varianza de la población, ². Si la hipótesis nula es falsa, entonces el valor esperado de la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre las medias de la población inflarán la MCE, mientras que no afectarán la MCD. (5) Con base al numeral (4), se involucra una prueba de una cola y la fórmula general de la prueba F en el análisis de la varianza es: MCE MCD F Si la relación F está en la región de rechazo para el nivel de significación especificado, entonces se rechaza la hipótesis de que las diversas medias muestrales se obtuvieron de la misma población. Para simplificar este procedimiento con diseños en términos del modelo lineal que identifica los componentes que influyen sobre la variable aleatoria y se presenta una tabla estándar de análisis de varianza que muestra los cálculos necesarios de la media cuadrática para cada tipo de diseño experimental. 4
  • 35. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 47 4.2. ANÁLISIS DE VARIANZA DE UNA VÍA El modelo del análisis de varianza de una vía se relaciona con la prueba de la diferencia entre k medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos grupos de tratamiento. La ecuación lineal que representa el modelo del análisis de varianza de una vía es: Xik = + k + ik donde: = media global de todos los k grupos de tratamiento k = efecto del tratamiento en el grupo específico k, del cual se muestreo el valor ik = error aleatorio relacionado con el proceso de muestreo. La tabla siguiente es un resumen del análisis de varianza de una vía en la cual; MCD pasa a ser la media cuadrática entre los A grupos de tratamiento (MCA) y (MCE) es llamada media cuadrática del error, N asigna el tamaño total de la muestra para todos los grupos de tratamiento combinados, antes que el tamaño de la población. Tk representa la suma (total) de los valores muestreados en todos los grupos combinados. La hipótesis nula y alternativa son: Ho: k = 0 para todos los niveles de tratamiento Ha: k 0 para todos los niveles de tratamiento Si la hipótesis nula es verdadera, entonces tenemos que : 1 = 2 = 3 = ... = k . Fuente de variación Suma de los cuadrados, SC Grados de libertad, gl Media cuadrática MC Relación F Entre grupos de tratamiento A N T n T SCA k k 2 2 k – 1 k 1 SCA MCA MCE MCA F0 Error de muestreo, E SCE SCT SCA n – k n k SCE MCE Total, T N T SCT X 2 2 N - 1 Ejemplo 4.1 Quince personas que se capacitan en un programa técnico son asignadas en forma aleatoria a tres tipos diferentes de enfoques de instrucción. Los puntajes de las pruebas de rendimiento, al concluir la especialización, se presentan en la tabla siguiente. Use el procedimiento de análisis de varianza para probar la hipótesis nula de que las tres medias muestrales son iguales a un nivel de significación del 5%. Método de Instrucción Puntaje de la prueba Tk Total A1 A2 A3 86 90 82 79 76 68 81 88 73 70 82 71 84 89 81 400 425 375 Total 1200
  • 36. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 48 Solución: Suma de cuadrados de tratamiento = N T n T SCA k k 2 2 = 250 15 1200 5 375 5 425 5 400 2 2 2 2 Suma de cuadrados del total = N T SCT X 2 2 = 698 15 1200 86 90 82 ... 70 82 71 2 2 2 2 2 2 2 Suma de cuadrados del error = SCE SCT SCA = 698 – 250 = 448 Fuente de variación Suma de cuadrados SC grados de libertad, gl Media cuadrática MC relación, F Entre grupos de trat., A SCA = 250 2 MCA =125 Fo = 3.35 Error de muestreo, E SCE = 448 12 MCE =37.33 Ft = 3.89 Total, T SCT = 698 14 Ft = F(1- , glA, glE) = F(0.95, 2, 12) = 3.89 Ho: 0 1 2 3 Ha: lg 0 i a ún = 0.05 f.p. Fo = 3.35 Decisión: Como F RA 0 se acepta Ho Conclusión: No hay efecto asociado a los niveles del método de instrucción por lo tanto las diferencias de métodos no son significativo, con un 5% de significación de prueba. Ejemplo 4.2 La tabla siguiente presenta el promedio de palabras mecanografiadas por minuto en diferentes marcas de máquinas eléctricas, por individuos asignados aleatoriamente sin experiencia previa en estas máquinas, después del mismo período de instrucción. Pruebe la hipótesis nula de que la media de palabras por minuto lograda para las tres máquinas no es diferente, usando un nivel de significación del 5%. Marca de las máquinas Promedio de palabras por minuto Tk Total A1 A2 A3 79 74 81 83 85 65 62 72 79 51 - 55 77 - - 352 231 280 Total 863 RA 1 – = 0,95 RR = 0,05 Ft = 3,89 F0 = 3,35
  • 37. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 49 Solución Suma de cuadrados de tratamiento = N T n T SCA k k 2 2 = 103.72 12 863 4 280 3 231 5 352 2 2 2 2 Suma de cuadrados del total = N T SCT X 2 2 = 1376.96 12 863 79 83 62 ... 65 79 55 2 2 2 2 2 2 2 Suma de cuadrados del error = SCE SCT SCA = 1376.96 – 103.72 = 1273.20 Fuente de variación Suma de cuadrados SC Grados de libertad, gl Media cuadrática MC Relación, F Entre grupos de trat., A SCA = 103.72 2 MCA = 51.86 Fo = 0.37 Error de muestreo, E SCE = 1273.20 9 MCE = 141.47 Ft = 4.26 Total, T SCT = 1376.92 11 Ho: 0 1 2 3 Ha: lg 0 i a ún = 0.05 f.p. Fo = 0.37 Ft = 4.26 Decisión: Como F RA 0 se acepta Ho Conclusión: No existe diferencia significativa entre las 3 máquinas de escribir en términos de velocidad de mecanografía, con un 5% de significación de prueba. 4.3. ANÁLISIS DE VARIANZA DE DOS VÍAS El análisis de varianza de dos vías se basa en dos conjuntos de clasificaciones o tratamientos. Por ejemplo, al analizar el nivel de rendimiento de un programa de capacitación, podríamos considerar ambos efectos, el del método de instrucción y el del rendimiento escolar anterior. Asimismo, podríamos investigar el kilometraje de gasolina según la categoría de peso del automóvil y el grado de la gasolina. En las tablas de datos, los tratamientos identificados en los encabezamientos de la columna se llaman típicamente tratamientos A; aquellos en los encabezamientos de fila se denominan tratamientos B. La interacción en un experimento de dos factores significa que los dos tratamientos no son independientes y que el efecto particular de los niveles de tratamiento en un factor difiere según los niveles del otro factor. Por ejemplo, al estudiar el kilometraje de un automóvil, una gasolina de octanaje más alto puede mejorar el kilometraje para ciertos tipos de autos pero no p ara otros. Además la efectividad de varios métodos de instrucción puede diferir según los niveles de RA 1 – = 0,95 RR = 0,05 Ft = 4,26 F0 = 0,37
  • 38. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 50 capacidad de los estudiantes. Con el objeto de probar la interacción, en cada célula de la tabla de datos de dos vías debe incluirse más de una observación o medición muestreada (reiteración). 4.3.1. Análisis de varianza de dos vías sin interacción (diseño de bloque aleatorizado) El modelo de análisis de varianza de dos vías en el cual hay una sola observación por célula se denomina a menudo diseño de bloque aleatorizado, debido a un tipo particular de uso para este modelo. El objetivo de utilizar éste diseño no tiene propósito específico de probar un efecto de los "bloques". Más bien, al ser capaz de asignar alguna variabilidad a los sujetos antes del rendimiento, la MCE, puede reducirse y la prueba resultante del efecto de los tratamientos A ser más sensible. La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es: Xjk = + j + k + jk Donde: = media global de cualquier tratamiento j = efecto del tratamiento j o del bloque j en la dimensión B de clasificación. k = efecto del tratamiento k en la dimensión A de clasificación. ik = error aleatorio relacionado con el proceso de muestreo. Las hipótesis correspondientes serían: Ho : k = 0 Ha : k 0 La tabla de resumen para el análisis de varianza de dos vías sin interacción se da a continuación: Fuente de variación Suma de los cuadrados, SC Grados de libertad, gl Media cuadrática MC Relación F Entre grupos de tratamiento A N T n T SCA k k 2 2 K - 1 K 1 SCA MCA MCE MCA F0 Entre grupos de tratamiento B N T T k SCB j 2 2 1 J - 1 J 1 SCB MCB Error de muestreo, E SCE SCT SCA SCB (J–1) (K– 1) (J 1) (K 1) SCE MCE Total, T N T SCT X 2 2 N - 1 Ejemplo 4.3 Para los datos de la tabla siguiente suponga que en la realidad se utilizó un diseño de bloque aleatorizado y que se parearon los participantes antes del experimento, asignando un participante de cada grupo de aptitud (con base en los rendimientos anteriores del curso) a cada método de instrucción. La tabla siguiente es una revisión de la tabla del ejemplo 1, en el sentido que los valores presentados se han reorganizado para reflejar el diseño de bloque aleatorizado. Sin embargo observe que en cada grupo de tratamiento A se incluyen los mismos valores, excepto que se indican de acuerdo a los grupos de aptitud B y, por lo tanto, están dispuestos en un orden diferente. Pruebe la hipótesis nula de que no existe diferencia en el desempeño promedio entre los tres métodos de instrucción y los niveles de aptitud, utilizando un nivel de significación del 5%.
  • 39. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 51 Nivel de aptitud Método de instrucción Tj A1 A2 A3 Total B1 86 90 82 258 B2 84 89 81 254 B3 81 88 73 242 B4 79 76 68 223 B5 70 82 71 223 Total Tk 400 425 375 1200 Solución: Suma de cuadrados de tratamiento = N T n T SCA k k 2 2 = 250 15 1200 5 375 5 425 5 400 2 2 2 2 Suma de cuadrados de bloque = N T T k SCB j 2 2 1 = 367.33 15 1200 3 223 3 223 3 242 3 254 3 258 2 2 2 2 2 2 Suma de cuadrados del total = N T SCT X 2 2 = 698 15 1200 86 90 82 ... 70 82 71 2 2 2 2 2 2 2 Suma de cuadrados del error = SCE SCT SCA SCB = 698 – 250 – 367.33 = 80.87 Fuente de variación Suma de cuadrados SC grados de libertad, gl Media cuadrática MC relación, F Entre grupos de trat., A SCA = 250 2 MCA = 125 Fo = 12.4 Ft = 4.46 Entre grupos de bloque B SCB = 367.33 4 MCB = 91.83 Error de muestreo, E SCE = 80.87 (2)(4) = 8 MCE = 10.98 Total, T SCT = 698 14 Ho: 0 1 2 3 Ha: lg 0 i a ún = 0.05 f.p. Fo = 12.4 Ft = 4.46 RA 1 – = 0,95 RR = 0,05 Ft = 4,46 F0 = 12,4
  • 40. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 52 Decisión: Como F RR 0 rechazamos Ho Conclusión: Existe diferencia significativa entre los porcentajes de rendimiento para los diferentes métodos de instrucción, cuando se consideran el nivel de aptitud. Utilizando una prueba significativa. 4.3.2. Análisis de varianza de dos vías con interacción (N observaciones por célula) Cuando se utiliza este diseño se pueden probar por el análisis de varianza tres hipótesis nulas diferentes; que no hay efectos de columna (las medias de las columnas no son significativamente diferentes) y que no hay efectos de fila (las medias de las filas no son significativamente diferentes) y que no hay interacción entre los dos factores (los dos factores son independientes). Un efecto de interacción significativo indica que el efecto de los tratamientos para un factor varía según los niveles del otro factor. En tal caso, la existencia de efectos de columna y de fila puede no tener mucho significado desde el punto de vista de la aplicación de los resultados de la investigación. La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es: Xijk = + j + k + ijk + ijk Donde: = media global independiente de cualquier tratamiento j = efecto del tratamiento j en la dimensión B. k = efecto del tratamiento k en la dimensión A. ijk = efecto de la interacción entre el tratamiento j (del factor B) y el tratamiento k (del factor A) ik = error aleatorio relacionado con el proceso de muestreo. Las hipótesis correspondientes serían: Ho : k = 0 Ho : j = 0 Ho : Ijk = 0 Ha : k 0 Ha : j 0 Ha : Ijk 0 La tabla de resumen para el análisis de varianza de dos vías con interacción se da a continuación: Fuente de variación Suma de los cuadrados, SC Grados de libertad, gl Media cuadrática MC Relación F Entre grupos de tratamiento A N T T n SCA k 2 2 1 K - 1 K 1 SCA MCA MCE MCA F0 Entre grupos de tratamiento B N T T nk SCB j 2 2 1 J – 1 J 1 SCB MCB MCE MCB F0 Interacción (entre grupos de tratamiento A y B) I N T SCA SCB X n SCI 2 1 2 (J–1) (K– 1) (J 1) (K 1) SCI MCI MCE MCI F0 Error de muestreo, E SCI SCE SCT SCA SCB JK (n–1) JK (n 1) SCE MCE Total, T N T SCT X 2 2 N - 1
  • 41. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 53 Ejemplo 4.4 Nueve personas que se capacitan en cada una de cuatro áreas temáticas diferentes fueron asignadas en forma aleatoria a tres métodos de instrucción distintos. Se asignaron tres estudiantes a cada método de instrucción. Se refiere a la tabla siguiente, pruebe las diversas hipótesis nulas que son de interés respecto a tal diseño, a un nivel de significación del 5%. Área temática Método de instrucción Total Tj A1 A2 A3 B1 70 79 72 83 89 78 81 86 79 717 221 250 246 B2 77 81 79 77 87 88 74 69 77 709 237 252 220 B3 82 78 80 94 83 79 72 79 75 722 240 256 226 B4 85 90 87 84 90 88 68 71 69 732 262 262 208 Total Tk 960 1020 900 T=2880 Solución: Suma de cuadrados de tratamiento A = N T T nk SCA k 2 2 1 = 600 36 2880 12 900 12 1020 12 960 2 2 2 2 Suma de cuadrados de tratamiento B = N T T nj SCB j 2 2 1 = 30.8 36 2880 9 732 9 722 9 709 9 717 2 2 2 2 2 Suma de cuadrados de la interacción = N T SCA SCB X n SCI 2 1 2 = 533.9 36 2880 600 30.8 3 208 3 262 3 262 ... 3 246 3 250 3 221 2 2 2 2 2 2 2 Suma de cuadrados del total = N T SCT X 2 2 = 1600.0 36 2880 70 83 81 ... 87 88 69 2 2 2 2 2 2 2 Suma de cuadrados del error = SCE SCT SCA SCB SCI = 1600 – 600 – 30.8 – 533.9 = 435.3
  • 42. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 54 Fuente de variación Suma de cuadrados SC Grados de libertad, gl Media cuadrática MC relación, F Entre grupos de trat., A (método) SCA = 600.0 3-1 = 2 MCA = 300 Fo = 16.57 Entre grupos de trat., B (tema) SCB = 30.8 4-1 = 3 MCB = 10.3 Fo = 0.57 Interacción entre método y tema, I SCI = 533.9 (2)(3) = 6 MCI = 18.1 Fo = 4.92 Error de muestreo, E SCE = 435.3 (4)(3)(2) = 24 MCE = 18.1 Total, T SCT = 1600.0 36-1=35 Ho: A1 A2 A3 Ho: B1 BA2 BA3 Ho: 0 jk I Ha: lg 0 i a ún Ha: lg 0 j a ún Ha: 0 jk I = 0.05 f.p. Fo = 16.57 Fo = 0.57 Ft = F(2,24,0.95) = 3.4 Ft = F(3,24,0.95) = 3.0 Fo = 4.92 Ft = F(6,24,0.95) =2.5 Decisión: 1. Como F RR 0 rechazamos Ha 2. Como F RA 0 aceptamos Ho 3. Como F RR 0 aceptamos Ha Conclusión: Hay diferencia satisfactoria entre los porcentajes de los métodos de instrucción, no hay diferencia significante entre las distintas áreas hay interacción importante entre los dos factores: La última conclusión indica que varía la efectividad de los tres métodos de instrucción para las diferentes áreas temáticas. RA 1 – = 0,95 RR = 0,05 RA 1 – = 0,95 RR = 0,05 RA 1 – = 0,95 RR = 0,05 Ft = 3.4 Ft = 3.0 Ft = 2.5 Fo = 16.57 Fo = 0.57 Fo = 4.92
  • 43. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 55 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) El análisis de varianza se emplea para probar las diferencias entre k medias. ( ) El análisis de varianza de dos vías se basa en dos conjuntos de tratamientos ( ) Al análisis de varianza de dos vías sin interacción se le conoce como diseños de bloque aleatorizado. ( ) El modelos del análisis de varianza de dos vías es: Xik = + k + ik ( ) MCE es llamada media cuadrática del error 2. En 12 depósitos al por menor se establecieron 4 tipos de exhibiciones de publicidad, con tres depósitos asignados en forma aleatoria a cada una de las exhibiciones con el propósito de estudiar el impacto de la exhibición en el punto de venta. Refiriéndose a la tabla siguiente, pruebe la hipótesis de que no existe diferencia entre las medias de los valores de venta para los cuatro tipos de exhibiciones, usando un nivel de significancia del 5%. Tipo De Exhibición VENTAS 1 2 3 E1 E2 E3 E4 40 44 43 53 54 59 48 38 46 48 61 47 3. Los siguientes son los números de hornos de microondas que venden cada uno de los vendedores de las tres sucursales de una compañía distribuidora de artículos domésticos SUCURSAL ALFA 21 11 17 28 SUCURSAL BETA 27 15 18 26 17 21 SUCURSAL GAMMA 24 17 31 12 15 Realice un ANVA para probar, con un nivel de significancia de 0.05, si la hipótesis nula de que en promedio las ventas de las tres sucursales son las mismas. 4. Completar la siguiente tabla de análisis de varianza (ANVA) FUENTE VARIACION SUMA DE CUADRADOS GRADO DE LIBERTAD MEDIA CUATRADTICA F Tratamiento 2 Error 9 10 Total 120 5. Un ejecutivo de marketing llevó a cabo un estudio para examinar el efecto comparativo de 3 técnicas diferentes de promoción en 4 zonas diferentes de ventas y obtuvo los resultados mostrados en la tabla siguiente. Determinar las conclusiones a las que puede llegar usando los resultados de la tabla ANVA y formule en forma clara las hipótesis de contraste. FUENTE VARIACION SUMA DE CUADRADOS GRADO DE LIBERTAD MEDIA CUADRATICA F Entre técnicas promocionales 7.48 Entre zonas de ventas 3 Error 3.90 6 Total 11.41 11
  • 44. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 56
  • 45. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 57 Unidad 4 TEORIA DE LA TOMA DE DECISIONES Nº de tutoría: Uno Tutoría Nº 5 Teoría de la toma de decisiones
  • 46. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 58
  • 47. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 59 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce los conceptos del análisis estadístico en la toma de decisiones. 1.2. Procedimentales Elaboran tabla, diagrama en base a las probabilidades para la toma de decisiones. 1.3. Actitudinales Realiza toma de decisiones basadas en un análisis estadístico en un problema de investigación. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: La estructura bayesiana comparada con la estadística clásica conceptos fundamentales (conceptos generales), estructura de la tabla de decisión; toma de decisiones basadas en probabilidades (criterios: probabilidad máxima, esperanza del evento); toma de decisiones con base sólo en las consecuencias económicas (criterios: maximin, máximax, pena mínimax); toma de decisiones con base en probabilidades y consecuencias económicas (criterios: del valor esperado o criterio bayesiano, mínima pérdida de oportunidad o pena esperada); análisis de árbol de decisión. 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD. Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 48. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 60 Tutoría Nº Teoría de la toma de decisiones 5.1. LA ESTRUCTURA BAYESIANA COMPARADA CON LA ESTADÍSTICA CLÁSICA La estadística clásica trata en lo fundamental dos problemas estrechamente relacionados: 1. El problema de la estimación de algunos parámetros de la población, como la media aritmética de la población y la proporción poblacional p. 2. El problema de probar una hipótesis respecto a alguna característica o parámetro de la población Pero, ya sea que el problema consista en estimar algún parámetro de la población o probar (o contrastar o verificar) una hipótesis respecto al valor de ese parámetro, el método que se usa para resolver el problema es uno y el mismo; se selecciona una muestra aleatoria de la población y esta información muestral se convierte en la base de todas las inferencias acerca de los parámetros de la población. Para ejemplificar esto, supóngase que el problema inmediato es estimar el porcentaje de estudiantes del quinto año de secundaria en un colegio. Si una muestra aleatoria de 100 estudiantes seleccionados de este colegio revela que hay 10 esudiantes del último año, entonces se estimará el porcentaje de estudiantes del último año de todo el colegio como 10/100 ó 10%. La información que se puede utilizar al hacer una inferencia sobre una característica de la población, por lo general, se clasifica en dos clases: la información objetiva y la información subjetiva. Por ejemplo, la información que se obtiene por medio de muestreos es información objetiva. Por otra parte, la opinión personal del experto en un campo es información subjetiva. Al estimar el porcentaje de estudiantes del último año del colegio como 10%, se ha adoptado el método tradicional o clásico de la inferencia estadística, un método en el que la inferencia acerca de la población se basa de una manera estricta en información muestral objetiva. En contraste con el método estadístico clásico, en el que sólo se puede utilizar información muestral objetiva, un enfoque alternativo de la estadística, llamado estadística de Bayes, puede utilizarse toda la información disponible pertinente: subjetiva y objetiva. En la estadística de Bayes, una inferencia sobre un parámetro de la población puede hacerse partiendo de información subjetiva exclusivamente. Sin embargo, si posteriormente se cuenta con información muestral objetiva, se combinan la información subjetiva y la objetiva, y las inferencias sobre el parámetro de la población se basan en esta información combinada. La distinción entre la estadística clásica y la de Bayes, puede presentarse desde una perspectiva definida considerando el ejemplo siguiente: Una compañía manufacturera está considerando la compra de una nueva máquina, denominada la máquina A. La decisión de si se compra o no la máquina A se basará en el porcentaje de partes defectuosas que produzca la máquina. En base a su experiencia pasada con otras máquinas semejantes, el ingeniero de control de calidad de la compañía estima el porcentaje de partes defectuosas producidas por la máquina A según la siguiente tabla: PORCENTAJE DE PARTES DEFECTUOSAS PROBABILIDAD 0,05 0,06 0,07 0,30 0,50 0,20 Esto significa que el ingeniero de control de calidad no está absolutamente seguro del porcentaje de partes defectuosas que produce la máquina A. Sin embargo, en base a cualquier conocimiento 5
  • 49. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 61 o experiencia que posee, el ingeniero piensa personalmente que es de 0,30 la probabilidad de que el porcentaje de partes defectuosas producidas por la máquina A sea 5% es de 0,50 la probabilidad de que el porcentaje de partes defectuosas sea 6% y hay un riesgo de 0,20 en que el porcentaje de partes defectuosas sea 7%. Dos observaciones importantes pueden hacerse en esta fase de la discusión. Primera, la información del ingeniero de control de calidad respecto a la máquina A es personal o subjetiva, puesto que algún otro ingeniero bien podría dar una estimación del porcentaje de partes defectuosas que produce la máquina A. Segunda, en contraste con la estadística de Bayes está especialmente diseñada para hacer uso más constructivo de este tipo de información. De hecho, usando la información subjetiva del ingeniero de control de calidad, la estadística de Bayes permitirá a la compañía decidir si compra o no la máquina A. Continuando el caso de la máquina A, supóngase además que en una serie de pruebas, una muestra aleatoria de 100 partes producidas por la máquina A revela que hay 4 partes defectuosas. Ahora bien, según la estadística, el porcentaje de partes defectuosas producidas por la máquina A se estima como 4%. Sin embargo, usando la estadística de Bayes la información muestral se combina con la información subjetiva del ingeniero de control de calidad, y una estimación del porcentaje de partes defectuosas producidas por la máquina A se hace, partiendo de esta combinación de información. El uso de información subjetiva en la inferencia estadística es sólo una de las características de la estadística bayesiana. En los últimos años, la estadística bayesiana se ha convertido en una teoría integrada para la toma de decisiones, llamada la teoría de decisión bayesiana. La teoría de decisión bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre. Esta teoría le proporciona a quien toma una decisión un procedimiento racional y sistemático que le permite elegir entre varios cursos de acción posible cuando las consecuencias de cada una de estas acciones están sujetas a incertidumbre. I. Estructura de tablas de decisión Una tabla de decisión identifica la ganancia (o pérdida) ocasional asociada por todas las combinaciones posibles de actos y sucesos de decisión, también indica la probabilidad de ocurrencia para cada uno de los eventos mutuamente excluyentes. TABLA 1 ESTRUCTURA GENERAL DE UNA TABLA DE DECISIÓN EVENTO PROB. ACTOS A1 A2 A3 ... An E1 E2 E3 ... Em p1 p2 p3 ... pm X11 X21 X31 ... Xm1 X12 X22 X32 ... Xm2 X13 X23 X33 ... Xm3 ... ... ... ... ... X1n X2n X3n ... Xmn Donde: Actos: Son los cursos de acción alternativos, o estrategias, que están a disposición de la persona que toma la decisión. Como resultado del análisis se elige uno de estos actos como el mejor. Eventos: Identifica las ocurrencias que están fuera del control de la persona que toma la decisión y que determina el nivel de éxito de un acto dado. Probabilidad: Deben estar disponibles, pueden basarse en actos objetivos o determinarse subjetivamente con base en el criterio. Las sumas de las probabilidades siempre es 1,00. Las entradas en las células: Son valores condicionales o consecuencias económicas condicionales. Frecuentemente se denominan pagos y son condicionales pues el resultado económico depende del acto de decisión que se elige y del evento que ocurre.
  • 50. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 62 II. Toma de decisiones basadas en probabilidades Esto se efectúa haciendo uso de la primera y segunda columna de la tabla 1. Criterios 1º Probabilidad máxima: Es aquel que se selecciona el acto del evento que presenta mayor probabilidad. 2º Esperanza del evento: Es aquel que se selecciona el acto del evento considerando la esperanza matemática del evento. E(e) = e p(e) Obs. Representa una base incompleta para efectuar toma de decisión. III. Toma de decisiones con base sólo en las consecuencias económicas La tabla que se usa es similar a la tabla 1, excepto que por la ausencia de las probabilidades de los eventos. Criterios 1º Maximin: Esta estrategia de decisión es "altamente conservadora" pues la persona que toma la decisión se preocupa de que "pueda suceder lo peor" respecto a cada acto. Cálculo: Se determina el valor mínimo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor. 2º Máximas: Es el estándar por el cual el mejor acto es el para el que el valor máximo es mayor que el máximo de cualquier otro acto de decisión. Este criterio se opone filosóficamente al criterio maximin, pues la persona que toma las decisiones está orientada hacia "lo mejor que puede suceder" con respecto a cada acto. Cálculo: Se determina el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor. 3º Pena Minimax (Pérdida de oportunidad condicional): Es la diferencia entre el resultado económico del mejor acto dado que ha ocurrido en un evento particular y el resultado económico de acto. El valor "mejor" o más deseado de la pena es "0". Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor, en cada fila, luego el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es menor. IV. Toma de decisiones con base en probabilidades y consecuencias económicas Estos métodos utilizan toda la información contenida en la tabla 1. Criterios 1º Del valor esperado (VE) o Criterio Bayesiano: Es la norma por el cual el mejor acto es aquel para el que el resultado económico esperado es el más alto como promedio a largo plazo. Cálculo: Se determina multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es mayor. 2º Minima pérdida esperada de oportunidad (PEO) o Pena esperada.- El acto con la mayor ganancia esperada tendría la menor pena esperada. Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor en cada fila, luego se multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es menor. V. Análisis de árbol de decisión Es el método que puede utilizarse para identificar el mejor acto inicial, como también los mejores actos subsiguientes. Proceso 1º Construir el árbol de decisión de izquierda a derecha, con sus puntos de decisión (puntos secuenciales en los cuales tiene que hacerse la elección) y eventos causales (puntos
  • 51. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 63 secuenciales en los cuales ocurrirá un evento probabilístico). Depende del análisis apropiado, de la situación global de decisión. 2º Se colocan en el diagrama los valores de probabilidad asociados con los eventos causales y las consecuencias económicas. Los valores esperados de los actos alternativos en el punto inicial de decisión, los valores esperados se calculan sistemáticamente de derecha a izquierda en el árbol de decisión. Este proceso se llama "devolverse". Ejemplo 5.1 Un contratista de calefacción y aire acondicionado debe comprometerse a comprar unidades de aire acondicionado desde el 1ero de abril, para reventa e instalación durante la próxima temporada de verano. Con base en la demanda del verano anterior, en las actuales condiciones económicas y en los factores de competencia del mercado, calcula que hay una probabilidad de 0,10 de vender sólo 5 unidades, una probabilidad de 0,30 de vender 10 unidades, una probabilidad de 0,40 de vender 15 unidades y una probabilidad de 0,20 de vender 20 unidades. Los equipos de aire acondicionado se pueden ordenar sólo en grupos de cinco, siendo el costo unitario de $1000 y el precio al por menor de $1300 (más gastos de instalación). Todas las unidades que no se han vendido al término de la temporada se devuelven al fabricante por un crédito neto de $800, después de deducir los gastos de embarque. Determine los mejores actos de decisión desde el punto de vista de los criterios. a) basada sólo en probabilidades, (probabilidad máxima y esperanza del evento). b) basada sólo en las consecuencias económicas, (maximin, maximax, pena minimax). c) basada en probabilidades y consecuencias económicas, (criterio bayesiano y pena esperada de oportunidad). Solución: (Tabla de ganancias) E Demanda P (E) ACTOS (Compra – Stock) A1 = 5 A2 = 10 A3 = 15 A4 = 20 E1 = 5 E2 = 10 E3 = 15 E4 = 20 0.10 0.30 0.40 0.20 1500 1500 1500 1500 500 3000 3000 3000 (500) 2000 4500 4500 (1500) 1000 3500 6000 Valor esperado 13,3 Maximin 1500 500 (500) (1500) Máxima x 1500 3000 4500 6000 C. Bayesiano 1500 2750 3250 2750 (Tabla de pérdida de oportunidad) E Demanda P (E) ACTOS (Cantidad de orden) A1 = 5 A2 = 10 A3 = 15 A4 = 20 E1 = 5 E2 = 10 E3 = 15 E4 = 20 0.10 0.30 0.40 0.20 0 1500 3000 4500 1000 0 1500 3000 2000 1000 0 1500 3000 2000 1000 0 Pena Mimi max 4500 3000 2000 3000 Pena esperada de oportunidad 2550 1300 800 1300 a) i) Como la probabilidad máxima es 40%, entonces el mejor acto de decisión es ordenar la compra de 15 unidades de aire acondicionado. ii) Como el valor esperado = EP(E) = 13,3 y las ordenes se afectan en grupos de 5, luego el mejor acto de decisión, es ordenar la compra de 15 unidades de aire acondicionado. b) Maximinin: ordenar comprar 5 unidades de aire acondicionado Maximimax: ordenar comprar 20 unidades de aire acondicionado Pena mínimas: ordenar comprar 15 unidades de aire acondicionado c) Criterio Bayesiano: ordenar comprar 15 unidades de aire acondicionado Pena esperada de oportunidad: ordenar comprar 15 unidades de aire acondicionado
  • 52. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 64 Ejemplo 5.2 a. A un fabricante se le presentó un proyecto para un producto nuevo, y debe decidir si desarrollarlo o no. El costo del desarrollo de proyecto es S/. 200 000; la probabilidad de éxito es 0,70. Si el desarrollo no tiene éxito se termina el proyecto. Si tiene éxito, el fabricante debe entonces decidir si el nivel de producción ha de ser alto o bajo. Si la demanda es alta, el aumento en la utilidad, dado un nivel elevado de producción, es de S/. 700 000; dado un nivel bajo, es de S/. 150 000. Si la demanda es baja, el incremento en la utilidad, dado un nivel elevado de producción es S/. 100 000; dado un nivel bajo es S/. 150 000. Todos estos incrementos en utilidades son cifras brutas (es decir, antes de restar los S/. 200 000 del costo de desarrollar el producto). Se estima que la probabilidad de una demanda elevada es 0,40 y para la demanda baja es 0,60. Elabore el árbol de decisiones para esta situación. La figura muestra el árbol de decisión de este problema: : Puntos de decisión : Eventos aleatorios b. Con referencia a la figura 1, determine si el fabricante debe intentar el desarrollo de este producto o no, determinando la ganancia esperada correspondiente a las acciones alternativas “desarrollar” y “no desarrollar”. En la figura 2 se repite el árbol de decisión presentado en la figura 1, pero ahora se incluyen las ganancias esperadas correspondientes a cada una de las decisiones posibles del proceso secuencial, y se eliminan las acciones no preferidas de cada decisión, cruzando con dos rayas la rama correspondiente. Trabajando de derecha a izquierda, se determina la ganancia esperada de la decisión “nivel alto de producción”, y que es de S/. 140 000, de la siguiente manera: GE (nivel alto de fabricación) = (0,40) (500 000) + (0,60) (-100 000) = S/. 140 000 De manera análoga: GE (nivel bajo de fabricación) = (0,40) (-50 000) + (0,60) (-50 000) = S/. 50 000 Figura 1. Diagrama del árbol de decisión
  • 53. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 65 Al comparar las dos ganancias esperadas, la mejor decisión es “nivel alto de fabricación”; se elimina la posibilidad de la otra acción. Pasando a la izquierda hacia el siguiente punto de decisión (que es también el punto inicial de decisión en este caso), las ganancias esperadas para las dos posibles decisiones son: GE (desarrollar) = (0,70) (140 000) + (0,30) (-200 000) = S/. 38 000 GE (no desarrollar) = S/. 0 Al comprar las dos ganancias esperadas, la mejor acción en el punto inicial es “desarrollar”. Al calcular la ganancia esperada de “desarrollar”, debe observarse que la probabilidad de 0,70 (para “desarrollo con éxito”) se multiplica por S/. 140 000, y se ignora la rama adyacente de S/. –50 000, debido a que corresponde a una decisión eliminada en la etapa previa de análisis. Figura 2: Diagrama del árbol con reversión
  • 54. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 66 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) La pena mínimax se calcula en la tabla de perdida. ( ) El criterio que maximiza los pagos mínimos de todos los actos se llama máximas. ( ) En el criterio máximax, el mejor acto es aquel para el cual el valor resultante es mayor. ( ) Los eventos son los cursos de acción alternativos, que están a disposición de la persona que toma la decisión. ( ) La teoria bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre. 2. Supóngase que un fabricantes de equipos de oficina debe decidir si ampliar la capacidad de su planta ahora o espera otro año. Sus consejeros le advierten que si hace ahora la ampliación y las condiciones económicas siguen siendo favorable, se logrará una utilidad de $ 369 000; si hace ahora la ampliación y existe alguna recesión económica, habrá un pérdida (utilidad negativa) de $ 900 000; si espera otro año y las condiciones económicas siguen siendo favorables, se logrará una utilidad de $ 180 000; y si espera otro año, y existe una recesión económica, se logrará una pequeña utilidad de $ 18 000. a) Construya una tabla de pagos. b) Construya una tabla de pérdida 3. Un canillita debe ordenar los periódicos con un día de anticipación. El costo de los periódicos es de $ 2 la docena y el precio de venta es de $ 4 la docena. Los periódicos no vendidos al cabo del día deben devolverse. Si el canillita estima la demanda diaria de su clientela por periódicos en la forma siguiente: Demanda diaria, en docenas: 12, 13, 14. Probabilidad de la demanda 0.20, 0.30, 0.50. a) Establecer la tabla de pago y de pérdida. b) Determine los mejores actos de decisión desde el punto de vista de los criterios: Probabilidad máxima, valor esperado, maximin, máximax, pena mínimax, criterio bayesiano y pena esperada de oportunidad 4. Dada la siguiente tabla de resultados: UTILIDADES Suceso Probabilidad Acciones A 1 A2 A3 A4 A B C D 0.1 0.2 0.5 0.2 20 0 -30 -40 20 40 20 0 20 40 60 40 20 40 60 80 a) Determínese la acción óptima mediante la Probabilidad Máxima b) Determínese la acción óptima utilizando el criterio Bayesiano y Pena Esperada de Oportunidad c) Determínese la acción óptima utilizando el criterio MÁXIMAX, MAXIMIN, MINIMAX 5. La junta directiva de un hospital privado debe decidir, sobre fases financieras, si autoriza fondos a un nuevo centro de atención a pacientes cardiacos. La junta considera que si se construye el nuevo centro y contratan a un cardiólogo de prestigio nacional, el centro percibirá $ 7.2 millones. Si se construye el nuevo centro pero no pueden contratar un cardiólogo eminente, habrá una pérdida de $ 1.25 millones. Si se remodela el antiguo centro de cardiología y se contrata a un cardiólogo eminente, el centro captará $ 2 millones. Si se remodela el centro y no contratan a un cardiólogo eminente, la institución sólo percibirá $ 0.5 millones. a) Construya una tabla de pagos. b) Trace un árbol de decisión.
  • 55. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 67 Unidad 5 CONTRO DE CALIDAD Nº de tutorías: Dos Tutoría Nº 6: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA MEDIA DEL PROCESO. Tutoría Nº 7: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA VARIACIÓN DEL PROCESO Y PARA LA PROPORCIÓN DE DEFECTUOSOS.
  • 56. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 68
  • 57. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 69 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce los conceptos de las técnicas muy útiles que se usan en la industria para controlar y mejorar la calidad del producto. 1.2. Procedimentales Elaboran diagramas de control para controlar y mejorar el producto de un proceso de manufactura. 1.3. Actitudinales Asegurar que las variables que miden la calidad de un producto queden dentro de los intervalos que son aceptables para posibles clientes. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: control de calidad, introducción, métodos de control de calidad: técnicas de supervisión, técnicas de localización de problemas, técnicas de selección, supervisión de la calidad mediante graficas o diagramas de control, grafica de control para media del proceso: diagrama de x ; gráfica de control para la variación del proceso: diagrama de r, gráfica de control para la proporción de defectuosos: diagrama de p; gráfica de control para el número de defectuosos por unidad: diagrama de c 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD. Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 58. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia 70 Tutoría Nº Control de calidad: grafica de control para la media del proceso ESTUDIO DE UN CASO El Caso del Aceite Perdido Considérese un problema administrativo, en el que usted es el encargado de la operación de llenar latas de aceite lubricante para motores. Los envases de un cuarto de galón, el tipo que se compra en una estación de servicio local, se llenan con una máquina que tiene 28 boquillas (inyectores). Cada boquilla descarga el aceite en una lata, y la máquina llena así los 28 envases, uno con cada inyector. El problema se presenta cuando los controladores de la compañía detectan una discrepancia extraña. Aunque la cantidad de aceite que se recibe mensualmente para la operación de llenado asciende a 10 000 000 de cuartos de galón, el número de latas de una cuarto que se llenan, es siempre considerablemente menor. Si el número de latas llenadas de un mes dado es de 9 700 000, ¿qué pasó con los 300 000 cuartos de aceite perdido? El problema que acabamos de describir es similar al problema encontrado por V. Filimon y sus colegas quienes trabajan, en ese tiempo, para la Estándar Oil Company en Cleveland, Ohio (V. Filimon, R. Maggass, D. Frazier y A. Flingel, “Some Applications of Quality Control Techniques in Motor Oil Can Filing, Industrial Quality Control, Vol. 12, 1995”). Su operación consistió en usar tres maquinas llenadoras cada una con 6 boquillas para latas de un cuarto, otra con 28 boquillas también para un cuarto y una mas con 16 inyectores para latas de un galón. La búsqueda del aceite perdido se concentro rápidamente en la maquina llenadora. ¿Se puede ajustar una máquina para que una boquilla descargue exactamente un cuarto de aceite en cada lata? La respuesta es negativa, porque la cantidad de aceite descargada para una sola boquilla difiere ligeramente de la que descargue otra, debido a la variación en el flujo del aceite por la citada boquilla. Así la cantidad x de aceite descargada en una lata, medida en volumen o en peso, varia de una lata a otra y tiene una distribución de frecuencias relativas. Esta variación en el peso de llenado, llevo a Filimon y a sus colegas, a sospechar que el aceite perdido salía de la planta en las mismas latas. La operación de llenar los envases, y sus problemas inherentes, es comparable a la mayoría de las operaciones actuales en los negocios. Cada operación origina un producto que se considera aceptable o inaceptable, dependiendo de una o más variables que miden la calidad del producto. El producto de una operación de llenado de envases de aceite es una lata de aceite; una medida de su calidad es la cantidad de aceite depositado en cada lata. El producto de una máquina que origina lámparas eléctricas es una bombilla o un foco, y una medida de su calidad es la cantidad de luz que emita. El producto de un hospital es el tratamiento médico y el cuidado para un solo paciente. La calidad del cuidado de un paciente se mediría, sin duda, mediante un cierto número de variables de calidad. En esta unidad presentaremos algunas técnicas administrativas y estadísticas para supervisar, mejorara y controlar la calidad del producto de una operación actual en los negocios. 6
  • 59. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia 71 6.1. INTRODUCCION El objetivo de este capitulo es presentar algunas técnicas muy útiles que se usan en la industria para controlar y mejorar la calidad de productos manufacturados así como para el mejoramiento de la calidad de sistemas de administración. Como lo indica el titulo, la metodología del control de calidad se estructuro para controlar y mejorar el producto de un proceso de manufactura. Los perfiles o barras de acero deben tener una resistencia a la tensión especifica; un jabón tiene que ser producido con un nivel bajo de impurezas; una caja de cereales debe tener un contenido en peso específico, y los datos de entrada financieros en una computadora para administración tienen que ser exactos y preciso, con una alta probabilidad. Así, el objetivo de un programa de control de calidad es asegurar que las variables que miden la calidad de un producto queden dentro de los intervalos que son aceptables para posibles clientes. 6.2. MÉTODOS DE CONTROL DE CALIDAD Los métodos de control de calidad se clasifican en tres categorías: 6.2.1. Técnicas de supervisión Diseñadas para seguir o rastrear el nivel de las variables de calidad y para detectar cambios indeseables en la calidad del producto; 6.2.2. Técnicas de localización de problemas Ideadas para ayudar a ubicar las causas de cambios indeseables en la calidad del producto; y 6.2.3. Técnicas de selección Diseñadas para eliminar productos defectuosos, o de mala calidad que entran al proceso como materia prima y sirven para realizar el mismo trabajo, en el caso de los productos acabados antes de enviarlos a un cliente. Se dice a menudo que el control de calidad consta del 10% de Estadística y de 90% de ingeniería y sentido común. Como se aprender, la mayoría de los métodos de control de calidad se basan en los conceptos estadísticos elementales. El verdadero problema ocurre cuando se detecta uno de los procesos de supervisión o monitoreo o de selección. Así los métodos de control de calidad pueden decir cuando pero no porque ocurren los problemas. Para descubrir la causa de la baja calidad en productos y corregir la situación, es necesario conocer el proceso y tener aptitudes y habilidad para resolver problemas. Esta unidad trata de dos de los tres tipos de métodos de control de calidad, los procedimientos para controlar un proceso de producción actual y los métodos utilizados para eliminar materia prima poco satisfactoria que entra al proceso o productos defectuosos que salen del proceso o ambas cosas. La tercera categoría metodológica, los procedimientos estadísticos para localizar la causa de un cambio que haga bajar la calidad del producto, consiste en todos los métodos desarrollados en esta asignatura como en estadística general. Dos de los procedimientos de mayor utilidad son el análisis de regresión y el análisis por tablas de contingencia que pueden establecer con correlación entre una o más materias primas, o variables del proceso o del entorno, y la calidad del producto. 6.3. SUPERVISION DE LA CALIDAD MEDIANTE GRAFICAS O DIAGRAMAS DE CONTROL Las mediciones de una variable de calidad varían en el tiempo. Por ejemplo, las mediciones del diámetro interior de un cojinete cuyo valor es pulgada, variarán ligeramente de una pieza a otra. El diámetro del cojinete tiende a hacerse mas pequeño debido al desgaste del utensilio de corte del proceso de maquinado. Una variación de este tipo se denomina definida por una causa atribuible. Otra variación en la que ocurre pequeños cambios fortuitos que se deben a la gran cantidad de variables desconocidas que afectan el diámetro: cambios en la materia prima, condiciones ambientales, etc., se considera como una variación aleatoria.