1. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
13
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce el concepto de estimación puntual y por intervalos.
1.2. Procedimentales
Calculan estimaciones puntuales o intervalicas de los parámetros de una población.
1.3. Actitudinales
Resuelve situaciones en donde se quiere estimar los parámetros de una población en estudio.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: Estimación de parámetros: Introducción: Estimación Puntual (Estimación puntual para la media poblacional, Estimación Puntual para la varianza poblacional, Estimación de parámetros de dos poblaciones, Estimación puntual de una población de variable cualitativa, Estimación puntual de dos poblaciones de variables cualitativas) y Estimación por intervalos (Intervalo de confianza para la media poblacional, Intervalo de confianza para la diferencia de medias poblacionales, Intervalo de confianza para la proporción poblacional, Intervalo de confianza para la diferencia de proporciones poblacionales).
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
2. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
14
Tutoría Nº
Estimación de parámetros:
estimación puntual y estimación
por intervalos
1.1. INTRODUCCIÓN
Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones respecto a
una población, de los datos obtenidos realmente de una muestra.
La inferencia estadística comprende dos tipos principales de técnicas: Estimación de parámetros y
contrastación de hipótesis. Independientemente de la técnica que se utilice, la finalidad general es
utilizar datos de una muestra para extraer conclusiones respecto a una población.
1.2. ESTIMACIÓN DE PARÁMETROS
Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa respecto
al valor de una característica de la población y desea conocer cuál podría ser tal valor.
La estimación puede asumir 2 formas:
- Estimación puntual
- Estimación por intervalos
1.2.1. Estimación puntual
Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar el
parámetro desconocido de la población.
Una desventaja de esta forma de estimación es que no aporta la precisión de la estimación del
parámetro.
Las estimaciones puntuales más usuales son:
(A) Estimación Puntual para la media poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
f
x f
= x =
n
x
= x =
i
i i i
(B) Estimación Puntual para la varianza poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
f
x f n x
= s =
n
x n x
= s = 2 2 2
1
( )
1
( ) 2 2
2
2 2
1
3. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
15
(C) Estimación de parámetros de dos poblaciones
Sea X1 una variable aleatoria que se distribuye como una distribución normal con media 1
y varianza 2
1 e X2 otra variable aleatoria que se distribuye como una distribución normal
con media 2 y varianza 2
2 .
La estimación de parámetros de dos poblaciones se pueden realizar mediante:
a) La comparación de sus medias, luego:
1 2 1 2 1 2 - = ˆ - ˆ = x - x
b) La comparación de sus varianzas, luego:
s
s
= =
2
x
2
x
x
x
x
2
x
2
1
2
1
2
2
1
2
ˆ
ˆ ˆ
(D) Estimación puntual de una población de variable cualitativa
Sea X una variable cualitativa con:
A : Presencia de la característica
y Q = 1 - P
0, si X A
1, si X A
N
M
N
X
con P
X
i
Luego:
y q = 1 - p
0, si x A
1, si x A
n
m
N
x
con p
x
i
Entonces: P
p
(E) Estimación puntual de dos poblaciones de variables cualitativas
Sea X1 la variable aleatoria de una población cualitativa con Px1 proporción de aciertos en X1
y sea X2 la variable aleatoria de otra población cualitativa con Px2 proporción de aciertos en
X2, luego:
Px1 - Px2 = Px1 - Px2 = px1 - px2 ˆ ˆ
1.2.2. Estimación por intervalos
La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el parámetro
tiene la probabilidad especificada de estar. Los estimados por intervalos se conocen como
intervalos de confianza y los límites inferior y superior como los límites de confianza.
En general el intervalo de confianza para el parámetro se expresa:
P( - k + k ) = 1 -
4. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
16
Donde:
= Parámetro
= Estimador
k = Valor tabulado
= Desviación estándar del estimador
1 = Nivel de confianza
Los intervalos de confianza más usuales son:
(A) Intervalo de confianza para la media poblacional ( )
Para determinar el intervalo de confianza para la media poblacional se debe tomar en
cuenta lo siguiente:
- Cuando se conoce la varianza de la población y/o el tamaño de muestra n 30.
P( x - Z
n
x + Z
n
) = 1 -
2 2
(1 ) (1 )
- Cuando no se conoce la varianza de la población y el tamaño de muestra n < 30.
P( x - t
s
n
x + t
s
n
( n ( ) = 1 -
2
1 ,n-1)
2
, 1) 1
(B) Intervalo de confianza para la diferencia de medias poblacionales
Se presentan los siguientes casos:
- Si 2
1 y 2
2 son conocidos
] = 1 -
n
+
n
- ( x - x ) + Z
n
+
n
P[( x - x ) - Z
2 2 2 2
2
2
2
1
1
)
2
1 2 1 2 (1
2
2
1
1
1 2 (1 )
- Si 2
1 y 2
2 no son conocidos
se presentan dos casos:
a. Si 2
1 es aproximadamente igual a 2
y entonces
2
1 2
2
2
) ] = 1-
n
1
+
n
1
) - ( x - x )+t s (
n
1
+
n
1
P[( x - x ) - t s ( 2
,n-1)
2
(
2
,n-1)
2
(
1 2
1 2 1 2 1
1 2
1 2 1
n + n - 2
( n - 1) s + ( n - 1) s
donde: s =
2 2
2
1 2
1 1 2 2
b. Cuando 2
1 es diferente a 2
2
] =1 -
n
s
+
n
s
- ( x - x ) + t
n
s
+
n
s
P[( x - x ) - t
2 2
n-1)
2 2
,n-1)
2
(
2
2
1
1
,
2
1 2 1 2 (1
2
2
1
1
1 2 1
Observación:
Sí n1+ n2 - 2 30, el valor tabulado es Z(1 - /2)
Sí n1 + n2 - 2 < 30, el valor tabulado es t(n1 + n2 – 2, 1 - /2)
5. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
17
(C) Intervalo de confianza para la proporción poblacional
Se presentan los siguientes casos:
- Cuando el tamaño de muestra es grande (n 30)
P(p - Z
pq
n
P p + Z
pq
n
= 1 -
2 2
(1 ) (1 ) )
- Cuando el tamaño de muestra es pequeño (n < 30)
P(p - t
pq
n
P p + t
pq
n
( ) = 1 -
2
,n-1) (
2
1 1 ,n-1)
(D) Intervalo de confianza para la diferencia de proporciones poblacionales
Se pueden presentan los siguientes casos:
- Si, n1 y n2 son muestras grandes (n1 + n2 - 2 30)
] = 1-
n
p q
+
n
p q
P - P ( p - p )+Z
n
p q
+
n
p q
P[( p - p ) - Z
2 2
2
2 2
1
1 1
1 2 1 2 (1 )
2
2 2
1
1 1
1 2 (1 )
- Si, n1 y n2 son muestras pequeñas (n1 + n2 - 2 30)
] = 1-
n
p q
+
n
p q
P - P ( p - p )+t
n
p q
+
n
p q
P[( p - p ) - t ,n-1)
2
,n-1) (
2
(
2
2 2
1
1 1
1 2 1 2 1
2
2 2
1
1 1
1 1 (1
Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80, n2 = 20 se
recomienda emplear:
n + n
n p + n p
donde : p =
)
n
1
+
n
1
s = p(1 - p )(
x y
2
1 2
1 1 2 2
esta proporción denota la proporción conjunta de las dos muestras.
Ejemplo 1.1
Se ensaya un test para determinar el cociente de inteligencia a 8 alumnos; los resultados fueron:
98, 108, 92, 111, 102, 95, 89, 115.
Determine: a) estimación puntual y b) estimación por intervalo (use el 90% de confianza) para el
promedio verdadero del cociente de inteligencia.
Solución
n = 8, x = 101.25, s = 9.38 1- = 0.90 Luego
2
1 = 0.95
como n 30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895
a) Estimación puntual:
Por formula
xi
= x =
n
x 101.25
6. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
18
b) Estimación por intervalo:
Por formula
) = 1 -
n
s
x + t
n
s
P( x - t ( 7,.0.95) ( 7,0.95)
Reemplazando:
P( - ) = 1 -
8
9.38
101.25 1.895
8
9.38
101.25 1.895
Se obtiene
P[ 94.97 107.53] = 90%
Luego el promedio verdadero del cociente de inteligencia de los alumnos se encuentra entre 94.97
y 107.53, con un nivel de confianza de 90%.
Ejemplo 1.2
Una muestra aleatoria de 100 hogares de una ciudad indica que el promedio de los ingresos
mensuales es de $ 500. Encuentre un intervalo de confianza del 95 % para la media poblacional
de los ingresos de todos los hogares de esa ciudad. Suponga σ = $ 110.
Solución
n = 100, x = 500 σ = $ 110 1- = 0.95 luego
2
1 = 0.975
como n = 30, entonces Z(1 - /2) = Z(0.95) = 1.96
Por formula
(1 ) (1 )
2 2
P( x - Z x + Z )= 1 -
n n
Reemplazando
110 110
500 1.96 500 1.96 ) 95%
100 100
P( - + =
Se obtiene
P[ 478.44 521.56] = 95%
Esto, es se tiene una confianza del 95% que el promedio del ingreso familiar poblacional de esa
ciudad, está en el intervalo $ 478.44 y $ 521.56.
Ejemplo 1.3
Como parte de un experimento, una gran empresa manufacturera encontró que el tiempo
promedio requerido para que 16 empleados escogidos al azar completaran una tarea determinada
era de 26 minutos, la desviación estándar 5 minutos. Construir el intervalo de confianza del 95%
para la media poblacional.
Solución
n = 16 x = 26 s = 5 1- = 0.95 Luego
2
1 = 0.975
como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131
Por formula
) = 1 -
n
s
x + t
n
s
P( x - t (15,0.975) (15,0.975)
7. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
19
Reemplazando
) 95%
16
5
26 2.131
16
5
P( 26 - 2.131 + =
Se obtiene
P[ 23.34 28.66 ] = 95%
Ejemplo 1.4
Se ha hecho un estudio de las diferencias entre estudiantes universitarios del primer año que
estuvieron en academias y estudiantes que no estuvieron. Para ello se tomó una muestra aleatoria
de 50 estudiantes universitarios que habían asistido a academias y una muestra aleatoria simple
independiente de 60 estudiantes que no lo habían hecho. Al final del primer semestre se
administró a los estudiantes una prueba de rendimiento en matemática. Los que habían asistido a
academias, obtuvieron un puntaje promedio de 14,5, con una varianza de 4,8; y el puntaje
promedio para el grupo que no había asistido a la academia, fue de 13,75 con una varianza de
6,4. Construya un intervalo de confianza para la diferencia entre las dos medias poblacionales
(use 99% de confianza).
Solución
ASISTIERON ACADEMIA
NO ASISTIERON
ACADEMIA
n1 = 50
x1 =14.5
s2
1 = 4.8
n2 = 60
2 x =13.75
s2
2 = 6.4
1 - = 0.99 luego 1-
2
= 0.995
Como n1 + n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Por formula
] =1 -
n
s
+
n
s
- ( x - x ) + z
n
s
+
n
s
P[( x - x ) - z
2 2
)
2 2
)
2
(
2
2
1
1
2
1 2 1 2 (1
2
2
1
1
1 2 1
Reemplazando
99%
60
6.4
50
4.8
14.5 13.75 2.58
60
6.4
50
4.8
14.5 13.75 2.58 1 2 P[( - ) - + - ( - ) + + ] =
Se obtiene
0.41 1.91 99% 1 2 P[ - ]=
Ejemplo 1.5
Los estudiantes que se matricularon en un curso de investigación educativa fueron distribuidos al
azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades para enriquecer el curso.
El grupo B estudió mediante el método tradicional de conferencias. Los puntajes obtenidos en una
prueba de rendimiento, hecha al terminar el curso dieron los siguientes resultados:
Grupo n x s
A (1) 10 80 8
B (2) 12 72 10
Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios
poblacionales.
8. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
20
Solución
1 - = 0.90 luego 1 -
2
= 0.95
Como n1 + n2 –2 < 30 entonces t (n1 + n2 –2,1– /2) = t(20, 0.95) = 1.725
Por formula
] = 1-
n
s
+
n
s
- ( x - x )+t
n
s
+
n
s
P[( x - x ) - t
2 2
(n n
2 2
(n n
2
2
1
1
1 2 1 2 2,1 / 2)
2
2
1
1
1 2 1 2 2,1 / 2) 1 2
Reemplazando
90%
12
100
10
64
80 72 1.725
12
100
10
64
80 72 1.725 1 2 P[( - ) - + - ( - )+ + ] =
Se obtiene
1.38 14.62 90% 1 2 P[ - ] =
Ejemplo 1.6
Una encuesta para verificar las actitudes de los empleados ante el boletín mensual, se les pidió a
500 empleados de una gran organización nacional que indicaran con que frecuencia leían el
boletín de noticias. De los 500, 375 informaron que leían todas las ediciones. Construir el intervalo
de confianza del 95% para la proporción real de los que opinan afirmativamente.
Solución:
n = 500 p =
500
375
= 0.75 q =0.25 1- = 0.95 luego
2
1 = 0.975
Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96
Por formula
] = 1 -
n
pq
P p + Z
n
pq
P[p - Z (1 / 2) (1 / 2)
Reemplazando
95%
500
0.75(0.25)
0.75 1.96
500
0.75(0.25)
P[ 0.75 - 1.96 P + ] =
Se obtiene
P[ 0.71 P 0.79 ] = 95%
Ejemplo 1.7
En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto programa de
televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado. Determinar los límites
de confianza del 99% para la diferencia de proporciones de todos los adultos y jóvenes que vieron
con agrado el programa.
Solución
ADULTOS JÓVENES
n1= 400
a1 = 100
p1 = 0.25
1
1
n
a
q1 = 1-p1 = 0.75
n2 = 60 0
a2 = 300
p2 = 0.5
2
2
n
a
q2 = 1 – p2 = 0.5
1 - = 0.99 Luego 1-
2
= 0.995
9. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
21
Como n1+ n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza mancomunada
así:
n + n
n p + n p
p =
1 2
1 1 2 2
Reemplazando
0.4
1000
400
400 600
100 300
+
+
p =
)
n
1
+
n
1
s = p(1 - p )(
1 2
)
1
+
1
s = ( )( 0.032
400 600
0.4 0.6
Por formula
) ] =1 -
n
1
+
n
1
) P - P ( p - p )+ Z p(1 - p )(
n
1
+
n
1
P[( p - p ) - Z p(1 - p )(
1 2
1 2 1 2 (1/ / 2
1 2
1 2 (1/ / 2
Reemplazando
P[( 0.25 0.5 ) - 2.58(0.032) P - P ( 0.25 0.5 )+2.58(0.032) ] = 99% A J
Se obtiene
0.33 0.17 99% 1 2 P[ P - P ] =
10. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
22
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) El método de estimación de un parámetro puede ser: puntual o por intervalos.
( ) La Inferencia estadística comprende dos tipos principales de técnicas.
( ) La estimación por intervalos contiene el cálculo de una sola cifra numérica.
( ) Se obtiene conclusiones de la población a través de la información de la muestra.
( ) En la estimación puntual incluye un intervalo en el que están comprendidos los
valores del parámetro.
2. De una población se escogieron al azar 10 personas y se les tomo la estatura. Los resultados en cm fueron: 160, 170, 170, 150, 160, 180, 160, 170, 130, 150.
a) Estime la media y la varianza.
3. En una universidad se desea conocer la opinión de los estudiantes acerca de ciertas medidas que han tomado las directivas. De 120 estudiantes consultados, 90 estuvieron a favor.
a) Estime la proporción de estudiantes que están a favor de las medidas
4. Para estimar la media del consumo (dólares) en el restaurante de una universidad, se tomó una muestra de 49 profesores. Suponga una desviación estándar poblacional de 5 dólares. Si la media en la muestra fue de 24.80 dólares mensuales.
a) ¿Cuál fue el intervalo de confianza de 95% para el consumo medio poblacional?
5. Los siguientes números representan el tiempo(en minutos) que tardaron 15 operarios en familiarizarse con el manejo de una nueva máquina adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8.
a) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo promedio.
b) El instructor considera que el tiempo promedio requerido por los trabajadores es mayor que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado?
6. Una marca de lavadoras quiere saber la proporción de amas de casa que preferirían usar su marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usarían.
a) Calcula un intervalo de confianza del 95% para la verdadera proporción de amas de casa que preferirían dicha lavadora.
11. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
23
Unidad 2
PRUEBA DE HIPOTESIS DE PARAMETRO POBLACIONALES
Nº de tutorías: Dos
Tutoría Nº 1: PRUEBA DE HIPÓTESIS: CONCEPTOS BÁSICOS; PRUEBA DE HIPÓTESIS PARA UNA MEDIA; UNA VARIANZA Y DOS VARIANZA POBLACIONAL
Tutoría Nº 2: PRUEBA DE HIPÓTESIS: PROPORCIÓN POBLACIONAL; DOS MEDIAS POBLACIONALES; DOS PROPORCIONES POBLACIONALES.
12. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
24
13. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
25
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce el concepto de prueba de hipótesis para los parámetros.
1.2. Procedimentales
Comprobar las pruebas de hipótesis en las investigaciones científicas.
1.3. Actitudinales
Resuelve situaciones en donde el interés es probar hipótesis de los parámetros de una población en estudio.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: Introducción, Concepto prueba de hipótesis, hipótesis nula, hipótesis alternativa, errores de prueba y nivel de significación, pruebas bilaterales y unilaterales, prueba de hipótesis referida a la media poblacional, prueba de hipótesis sobre la varianza poblacional, prueba de hipótesis referida a dos variancias poblacionales, prueba de hipótesis referida a la proporción poblacional, prueba de hipótesis referida a la diferencia entre dos medias poblacionales, prueba de hipótesis referida a la diferencia entre dos proporciones poblacionales
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
14. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
26
Tutoría Nº
Prueba de hipótesis: conceptos básicos; prueba de hipótesis para una media; una varianza y dos varianza poblacional
2.1. INTRODUCCIÓN
El objetivo es dar algunos métodos que se usan para tomar decisiones sobre poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se debe partir de afirmaciones o conjeturas con respecto a la población en el que estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura hecha sobre una población o sobre sus parámetros deberá ser sometida a comprobación experimental con el propósito de saber si los resultados de una muestra aleatoria extraída de esa población, contradicen o no tal conjetura.
A continuación definiremos algunos conceptos básicos para la prueba de hipótesis.
2.2. HIPÓTESIS
Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación. Por esta razón se le denomina hipótesis de investigación.
Generalmente hay que volver a plantear las hipótesis de investigación convenientemente de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas las hipótesis reciben el nombre de hipótesis estadística.
2.3. HIPÓTESIS ESTADÍSTICAS
Una hipótesis estadística es un enunciado o proposición respecto a uno o más parámetros de la población. A fin de probar una proposición, es preciso formular una hipótesis denominada nula juntamente con otra denominada hipótesis alternativa.
2.3.1. Hipótesis nula (Ho)
Son aquellas que están referidas a algún parámetro de la población o de las poblaciones de estudio. Estas son llamadas hipótesis científicas.
2.3.2. Hipótesis alternativa (Ha)
Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la que sirve para contrastarla.
2.4. ERRORES DE PRUEBA Y NIVEL DE SIGNIFICACIÓN
Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal caso estaremos cometiendo el denominado ERROR DE TIPO I.
De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos, estaremos decidiendo bien.
2
15. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
27
Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha
probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos
corresponde al NIVEL DE SIGNIFICACIÓN.
P(ERROR TIPO I) =
Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o falsa.
DECISIÓN
SOBRE Ho
NATURALEZA DE Ho
Cierta Falsa
No rechazar
Rechazar
Decisión
Correcta
Error tipo I
(Probabilidad )
Error tipo II
(probabilidad )
Decisión
correcta
Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es posible
minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas de tal modo que
al disminuir una de ellas la otra aumenta. Así si queremos minimizar inmediatamente aumenta la
probabilidad de y viceversa. Generalmente el investigador fija apriori el error que está
dispuesto a tolerar, es decir la probabilidad máxima de cometer el error de tipo I.
La decisión de una prueba estadística está asociada al nivel de significación:
a) Si P < 0.05 ( = 0.05)
se dice que existe significación en la prueba
b) Si P < 0.01 ( = 0.01)
se dice que existe alta significación en la prueba
Pruebas bilaterales y unilaterales
Cuando tenemos hipótesis alternativa de la forma:
Ho : = 0 Ho : P = Po
Ha : 0 Ha : P Po
Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser mayor,
significativamente o acaso menor, significativamente. En tales casos el nivel de significación
queda partido en /2 en cada lado de la distribución del estadístico o función de prueba.
Tendremos entonces una prueba bilateral o no direccionada (dos puntos críticos)
De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también
estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales o direccionada (un
punto crítico)
Ho : = 0
Ha : 0
1
2
1
2
16. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
28
Ho : = 0
Ha : 0
A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama REGIÓN
DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN.
Una prueba de contrastación de hipótesis estadística se conduce básicamente según el siguiente
procedimiento.
1. Plantear las hipótesis
- Hipótesis nula (Ho)
- Hipótesis alternativa (Ha)
2. Establecer el nivel de significación de prueba ( )
3. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha función de
prueba.
4. Efectuar el reemplazo numérico en la función de prueba con la información muestral.
5. Determinar las regiones de aceptación o rechazo en la distribución de la función de prueba,
según se trate de pruebas bilaterales o unilaterales.
6. Tomar una decisión sobre Ho, según la siguiente regla:
a. Rechazar Ho si el valor de la función de prueba cae en la región de rechazo.
En tal caso se concluirá que Ho se rechaza en favor de Ha con una significación
estadística.
b. No rechazar Ho si el valor de la función de prueba cae en la región de aceptación.
En tal caso se concluirá de que la información muestral no brinda suficientes evidencias
como para sospechar de que Ho no sea cierta.
7. Establecer la conclusión, según la hipótesis que se acepte.
2.5. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL
Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las características de una
población normal.
Las hipótesis referentes a este parámetro pueden ser:
Ho: μ = μo
Ha: μ μo Prueba bilateral o de dos colas
Ho: μ = μo
Ha: μ μo Prueba unilateral de cola a la derecha
Ho: μ = μo
Ha: μ μo Prueba unilateral de cola a la izquierda
Dicha prueba se efectúa mediante la siguiente función de prueba:
a) Si la desviación estándar poblacional no es conocida o n<30
o
o
t = (n-1)
x -
s/ n
t
1
17. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
29
b) Si la desviación estándar poblacional es conocida ó n≥30
n
/ n
x -
z = (0,1)
o
o
Ejemplo 2.1
El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida le
permite a su compañía vender más pólizas que las compañías "promedio". El promedio mensual
de ventas de todos los agentes de la compañía es de $300. A una muestra de agentes que han
recibido el programa de entrenamiento se le encuentra las siguientes ventas en dólares: 300, 270,
360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el supervisor de estos agentes, adoptaría
para los restantes el programa de entrenamiento propuesto por el señor Martínez. Emplee 5% de
significación.
Solución:
= 300, n = 10, x = 351.9, s = 48.64 1- = 0.95
como n 30, entonces t(n – 1, 1– ) = t(9,0.95) = 1.833
1) Ho: 300
Ha: 300
2) = 0.05
3) f.p. 0
0
x
t
s
n
4) 0
351.9 300
3.37
48.64
10
t
5) t(9,0.95) = 1.833
6) Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis nula a
favor de la hipótesis alternativa
7) Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su
compañía vender más pólizas de seguro que la compañía promedio, por lo cual se adoptará para
el resto de los agentes el programa propuesto por el señor Martinez.
RA
1 - = 0,95
RR
= 0,05
tt = 1,833
t0 = 3,37
18. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
30
Ejemplo 2.2
Un investigador afirma que la ingestión diaria de nutrientes (proteína) recomendada en varones de
18-34 años moderadamente activos, tiene un promedio de 75 grs. para contrastar tal hipótesis se
tomó una muestra de 116 varones saludables obteniendo los siguientes resultados:
Proteína encontrada (gr)
Número de
varones
71
73
75
77
79
8
20
60
18
10
Total
116
Pueden estos resultados, sostener la hipótesis formulada por el investigador. Use el 5% de
significación.
Solución:
= 75, n = 116, x = 75.03, s =1.95 = 0.05
como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96
1) Ho: = 75
Ha: 75
2) = 0.05
3) f.p. o
o
x -
Z =
s
n
4)
75.03 75
0.17
1.95
116
o Z =
5) 1.96 (0,975) Z = Z t
6) Decisión: Como Zo RA aceptamos Ho
7) Conclusión: Se sostiene la hipótesis formulada para el investigador.
2.6. PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA POBLACIONAL
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población.
Las hipótesis referentes a este parámetro pueden ser:
RR
2 = 0,025
Zt = -1,96
RA
1 - = 0,95
RR
2 = 0,025
Zt =1,96
Z0 = 0,17
19. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
31
Ho: = o
Ha: o Prueba bilateral
Ho: = o
Ha: o Prueba unilateral
Ho: = o
Ha: o Prueba unilateral
Procedimiento:
Supóngase que se desea probar la hipótesis de que la varianza de una población normal 2 es
igual a un valor específico, por ejemplo, 2
o. Sea X1, X2, ..., Xn una muestra aleatoria de n
observaciones tomadas de esta población. Para probar
Ho: 2 = 2
o
Ha: 2 2
o
Se utiliza el estadístico de prueba
2
2
2 ( 1)
o
o
n S
X
donde S2 es la varianza muestral. Ahora si Ho: 2 = 2
o es verdadera, entonces el estadístico de
prueba X2
o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se
calcula el valor de la estadística de prueba X2
o, y la hipótesis Ho: 2 = 2
º debe rechazarse si:
2
1,1 / 2
2
2
1, / 2
2
o n
o n
o si
donde X2
n-1, /2 y X2
n-1,1- /2 son los puntos que corresponden a los porcentajes 100 /2 inferior y
superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente.
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral:
Ho: 2 = 2
o
Ha: 2 > 2
o
Se rechaza si: X2
o > X2
n-1,1-
Para la otra hipótesis unilateral: Ho: 2 = 2
o
Ha: 2 < 2
o
Se rechaza si: X2
o < X2
n-1,
RA
1 –
2
(n 1, / 2) X
RR
/2 RR
/2
2
(n 1, 1 / 2) X
RA
1 –
RR
2
(n 1,1 ) X
20. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
32
PROCEDIMIENTO PARA MUESTRAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la
función de prueba, que cuando el tamaño de muestra es mayor que 30 se utiliza la distribución
normal.
El estadístico de prueba es:
n
s
Z
o
o
o
2
El gráfico utilizado sería acampanado.
Ejemplo 2.3
Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20
botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas
de fluido)2. Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2,
entonces existe una proporción inaceptable de botellas que serán llenadas con una
cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el
fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de
prueba.
Solución:
2 = 0.01, n = 20, s2 = 0.0153 = 0.05
como n < 30, entonces 2
(n 1,1 ) X = 30.1 2
(19, 0.95) X
Ho: 2 = 0.01
Ha: 2 > 0.01
= 0.05
f.p. 29.07
0.01
( 1) (19)(0.0153)
2
2
2
o
o
n S
X
30.1 2
(19, 0.95) X
RA
1 –
RR
2
(n 1, ) X
RA
1 – = 0.95
RR
= 0.05
30.1
2
t X
29.07
2
o X
21. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
33
Decisión: Como 29.07
2
o X RA aceptamos Ho
Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza es igual a
0.01.
2.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES
La prueba de comparación de muestras, requiere que las variancias de las dos poblaciones
muestreadas sean iguales. En esta sección describiremos una prueba para la hipótesis nula 2
1 =
2
2 , que se aplica a muestras aleatorias independientes obtenidas de dos poblaciones normales;
debe utilizarse con mucho cuidado por ser muy sensible a las desviaciones de tal suposición.
Las hipótesis referentes a este parámetro pueden ser:
Ho: 1 = 2
Ha: 1 2 Prueba bilateral
Ho: 1 = 2
Ha: 1 2 Prueba unilateral
Ho: 1 = 2
Ha: 1 2 Prueba unilateral
Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones normales
que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza el siguiente
estadístico.
2
2
2
1
s
s
F
que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1 grados de
libertad.
Obs. F1 - (v1,v2) =
F ( , )
1
2 1 v v
Regiones críticas para probar 2
2
2
1
(Poblaciones normales)
Hipótesis alterna Estadístico de
prueba
Rechaza la hipótesis nula si:
2
1 < 2
2
2
2
2
1
s
s
F
F < F (n1 – 1, n2 – 1)
2
1 > 2
2
2
2
2
1
s
s
F
F > F1- (n1 – 1, n2 – 1)
2
1 2
2
2
2
m
M
s
s
F
F < F /2(nM – 1, nm – 1) ó
F > F1- /2(nM – 1, nm – 1)
Donde: s2
M : la mayor de las dos variancias muestrales,
s2
m : la más pequeña de las variancias.
22. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
34
Para hipótesis unilateral: Ho: 2
2
2
1
Ha: 2
2
2
1
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho:
2
2
2
1
Ha: 2
2
2
1
Para la otra hipótesis unilateral: Ho: 2
2
2
1
Ha: 2
2
2
1
PROCEDIMIENTO PARA MUESTRAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la
función de prueba, que cuando el tamaño de muestra es mayor que 30, se utiliza la distribución
normal.
El estadístico de prueba es:
1 2
1 2
2
1
2
1
n n
s
s s
Z
p
o
RA
1 –
F / 2 (nM 1, nm 1)
RR
/2 RR
/2
F1 / 2 (nM 1, nm 1)
RA
1 –
RR
F1 (n1 1, n2 1)
RA
1 –
RR
F1 (n1 1, n2 1)
23. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
35
2
( 1) ( 1)
:
1 2
2
2 2
2
2 1 1
n n
n s n s
s
donde
p
Ejemplo 2.4
Se requiere determinar si existe menos variabilidad en el plateado realizado por la compañía 1 que
el efectuado por la compañía 2. Si las muestras aleatorias independientes de tamaño 12 del
trabajo desempeñado por las compañías producen s1=0,035 mil y s2=0,062 mil, pruébese la
hipótesis nula de que 2
1 = 2
2 contra la hipótesis alterna de que 2
1 < 2
2 con un nivel de
significancia de 0,05.
Solución:
n1 = n2 = 12, s1 = 0.035, s2 = 0.062, = 0.05
como n1 + n2 < 30, entonces ( 1, 1) (11,11) 0.355 1 2 0,05 Ft = F n n F
Ho: 2
2
2
1
Ha: 2
2
2
1
= 0.05
f.p. 0.319
(0.062)
(0.035)
2
2
2
2
2
1
s
s
F
Decisión: Como 0 F RA se acepta Ho
Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía 2. Usando
5% de significación de prueba.
RA
1 – = 0.95
RR
= 0.05
Ft 0.355
F0 0.319
24. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
36
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) El rechazo de Ho cuando es verdadera se llama error de tipo I
( ) Si la función de prueba cae en la región crítica entonces aceptamos la Ho
( ) Ha se formula con el propósito de rechazarla, es la que se va a someter a prueba.
( ) Es una prueba bilateral cuando la hipótesis se orienta a un solo lado.
( ) No rechazar la Ho si el valor de la función de prueba cae en la región de aceptación.
2. Un estudio de 29 familias de una zona residencial de la ciudad de Lima, revela que el ingreso
medio por familia durante el año 1999 fue de $ 508 con una desviación estándar de $ 16.
Probar la hipótesis de que el verdadero ingreso medio por familia en Lima durante 1999 fue de
$ 500 frente a la alternativa de que no fue de $ 500. Utilizar un nivel de significancia del 5%.
3. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las ventas de la semana
de un determinado producto de consumo popular tiene una desviación estándar s $6 . Se
supone que las ventas del producto tienen una distribución normal. Al nivel de significancia del
5%, ¿se podría inferir que la varianza de la población es menor que $40?
4. Los pesos netos (en gramos) de las latas de conserva de una muestra, fueron los siguientes:
121; 119; 124; 123; 119; 121; 124.
¿Se puede concluir que el peso neto poblacional medio es mayor que 123.5? Utilice un nivel
de significancia del 1%.
5. Un determinado proceso de empaquetar un producto está controlado, si el peso medio del
producto empaquetado es 400 gramos. Si en una muestra aleatoria de 100 paquetes del
producto se ha encontrado que el peso medio es de 395 gramos. ¿Se podría concluir que el
proceso está fuera de control al nivel de significación 5%?. Suponga que el peso de los
productos empaquetados se distribuye normalmente con desviación estándar de 20 gramos.
6. En un proceso de fabricación, se plantea la hipótesis que la desviación estándar de las
longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos elegidos al
azar del proceso de producción se han encontrado las siguientes longitudes en milímetros:
71, 66, 64, 72, 69, 67, 70, 68, 65, 69. Con estos datos se justifica la suposición
que la desviación estándar verdadera es 2.0 mm? Use el nivel de significación α=0.05, y
suponga que la distribución de las longitudes es normal.
25. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
37
Tutoría Nº
Prueba de hipótesis: proporción
poblacional; dos medias
poblacionales; dos proporciones
poblacionales
3.1. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL
La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una
determinada característica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: P = Po
Ha: P Po Prueba bilateral
Ho: P = Po
Ha: P Po Prueba unilateral
Ho: P = Po
Ha: P Po Prueba unilateral
La función de prueba para valores de n 30 es:
o
o
o o
z = (0,1)
P - p
p (1- p ) / n
n
La función de prueba para valores de n 30 es:
o
o
o o
t = (n-1)
P - p
p (1- p ) / n
t
Ejemplo 3.1
El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a
favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a
favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde?
Solución:
P = 0.60, n = 120, m = 75, 0.625
120
75
p , = 0.05
como n > 30, entonces 1.645 (1 ) (0,95) Zt = Z Z
Ho: P 0.60
Ha: P 0.60
= 0.05
f.p. 0.56
120
0.6(0.4)
0.625 0.6
0
P (1- P )/n
p - P
Z =
o o
o
3
26. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
38
Decisión: Como Zo RA aceptamos Ho
Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión del
alcalde. Usando un 5% de significación de prueba.
Ejemplo 3.2
Se tomó una muestra aleatoria de 400 escolares, de los cuales 120 tuvieron signos de
desnutrición. Verifique la hipótesis de que el porcentaje de desnutridos no excede a 25% en la
cobertura de estudio (Use 5% como nivel de significación).
Solución
P = 0.25, n = 400, m = 120, 0.30
400
120
p , = 0.05
como n > 30, entonces 1.645 ( ) (0,05) Zt = Z Z
Ho: P 0.25
Ha: P 0.25
= 0.05
f.p. 2.31
400
0.25(0.75)
0.30 0.25
Zo
Decisión: Como Zo RA se acepta Ho
Conclusión: La proporción de desnutridos no excede al 25% en la cobertura de estudio. En un 5%
de significación de prueba.
3.2 PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES
Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis natural es
que ambas tienen igual promedio, o en otras palabras que la diferencia de ambos promedios es
nula o difieren en alguna cantidad específica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: μ1 = μ2
Ha: μ1 μ2 Prueba bilateral
Ho: μ1 = μ2
Ha: μ1 μ2 Prueba unilateral
RR
= 0,05
Zt = -1,645
RA
1 - = 0,95
Z0 = 2,31
RA
1 - = 0,95
RR
= 0,05
Zt = 1,645
Z0 = 0,56
1.645 (0,95) Zt = Z
1.645 (1 ) (0,95) Zt = Z Z
27. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
39
Ho: μ1 = μ2
Ha: μ1 μ2 Prueba unilateral
Pueden presentarse varias situaciones dependiendo de como son sus varianzas:
1. Con varianzas conocidas:
La función de prueba es:
n
n
+
n
( x - x ) - ( - )
z = (0,1)
2 2
o
2
2
1
1
1 2 1 2
2. Con varianzas desconocidas y diferentes:
La función de prueba es:
t
n
s
+
n
s
( x - x ) - ( - )
t = ( n + n - 2)
2 2
o 1 2
2
2
1
1
2 2 1 2
Cuando n1 + n2 2 30 entonces esta función de prueba sigue una distribución normal estándar.
3. Con varianzas desconocidas y aproximadamente iguales:
La función de prueba es:
t
n
1
+
n
1
s
( x - x ) - ( - )
t = ( n + n - 2)
2
o 1 2
1 2
1 2 1 2
Aquí s2 es la varianza mancomunada
n + n - 2
(n - 1)s + (n - 1)s
s =
2 2
2
1 2
1 1 2 2
Al igual que en el caso anterior, si n1 + n2 2 30 entonces la función de prueba sigue una
distribución normal estándar.
Observación: Antes de realizar la prueba de comparación de medias, es conveniente efectuar la
prueba de comparación de varianzas para determinar si los datos de ambas poblaciones tienen
varianzas aproximadamente iguales o diferentes.
Ejemplo 3.3
Una compañía desea comparar las expectativas salariales anuales de su personal de ventas
femenino y masculino, según un nuevo plan de compensaciones venta-más-comisión. Se pidió a
n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar, predijeron sus ingresos anuales
bajo el nuevo plan. Las medias y desviaciones muestrales eran:
x1 = $ 31 083 x2 = $ 29 745
1 s = $ 2 312 2 s = $ 2 569
¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del ingreso anual
esperado tanto entre los vendedores como las vendedoras? Haga la prueba con = 0,10.
Solución:
Ho: 1 2 5972552 .5
1 2
2 1 2 2
n + n - 2
(n - 1)s + (n - 1)s
s =
2 2
2
Ha: 1 2 1.645 (0,95) Zt = Z
28. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
40
= 0.10
f.p. 2.45
40
1
40
1
597255252 .5
31083 29745 0
1 1
1 2
2
1 2 1 2
+
n
+
n
s
( x - x ) - ( - )
Zo =
Decisión: Como Zo RR no existe suficiente evidencia como para aceptar la hipótesis nula,
por consiguiente aceptamos la Ha.
Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia en el
promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de significación
de prueba.
3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS PROPORCIONES
POBLACIONALES
Cuando se desea comparar dos poblaciones cualitativas.
Las hipótesis referentes a este parámetro pueden ser:
Ho: P1 = P2
Ha: P1 P2 Prueba bilateral
Ho: P1 = P2
Ha: P1 P2 Prueba unilateral
Ho: P1 = P2
Ha: P1 P2 Prueba unilateral
La función de prueba es:
n
n
1
+
n
1
p 1 - p
(p - p ) - ( P - P )
z = (0,1)
1 2
1 2 1 2
Aquí p es la proporción mancomunada:
n + n
n p + n p
p =
1 2
1 1 2 2
Ejemplo 3.4
Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico
determinado (grupo A) y que ven regularmente lucha en TV. supera mucho a un segundo grupo de
hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos grupos
arrojaron los siguientes resultados.
tamaño de Número de hombres que ven
Grupo la muestra regularmente lucha en TV
A (1) n1 = 150 a1 = 98
B (2) n2 = 200 a2 = 80
RR
2 = 0,05
Zt = -1,645
RA
1 - = 0,90
RR
2 = 0,05
Zt =1,645
Z0 = 2,46
29. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
41
¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? use =
0,05
Solución:
Ho: 1 2 P P 0.51
350
98 80
p
Ha: 1 2 P P 1.645 (0.95) Zt = Z
0.40
200
80
0.65
150
98
2
2
2
1
1
1
n
a
p
n
a
p
= 0.05
f.p. 4.63
200
1
150
1
0.51(0.49)
(0.65 0.4) 0
1 2
1 2 1 2
0
+
n
1
+
n
1
p 1 - p
(p - p ) - ( P - P )
Z =
Decisión: Como Zo RR rechazamos Ho en favor Ha
Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del
sociólogo con un 5% de significación de prueba.
RA
1 - = 0,95
RR
2 = 0,05
Zt =1,645
Z0 = 4,63
30. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
42
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) La hipótesis Ho: P > Po es una prueba bilateral.
( ) En la prueba F los n1-1 y n2-1 son conocidos como los grados de libertad.
( ) Cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal.
( ) Cuando Fo pertenece a la Región de aceptación entonces se rechaza Ho.
( ) La hipótesis Ho: P > Po es una prueba unilateral a la derecha.
2. El gerente de una empresa insiste en que a lo más del 33% de los clientes de la empresa esta
de acuerdo con el cambio de su producto. De 80 clientes tomados al azar, 29 están de
acuerdo con el cambio del producto. Al nivel de significancia de 5%, ¿tiene razón el gerente?
3. Ejemplo: Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada
población reveló que 120 hombres y 120 mujeres estaban a favor de cierto candidato. ¿Se
puede concluir a un nivel de significación del 5% que la proporción de hombres a favor del
candidato es mayor que la proporción de mujeres?
4. Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen desviaciones
estándar respectivas de 120 horas y 90 horas. Para comparar el promedio de vida útil de estos
artículos se extrae una muestra aleatoria de 60 artículos de cada fabricante encontrándose la
duración media de 1.230 horas para la marca A y de 1.190 horas para la marca B. ¿Se puede
concluir a un nivel de significación del 5% que los artículos de marca A tienen mayor duración
media que los artículos de marca B?
5. Se controla la calidad de una muestra aleatoria de 40 piezas producidas por un fabricante. Si
se hallaron 4 piezas defectuosas, ¿se debería inferir que el porcentaje de todas las piezas
defectuosas es más del 5% al nivel de significación del 5%?
6. Un inversionista está por decidir entre dos provincias para abrir un centro comercial. Par esto
debe probar la hipótesis de que hay diferencia en el promedio de ingresos familiares de las
dos provincias. Si una muestra de 300 hogares de la provincia 1 da
_
x1 $400 y 1 s $90 y
otra muestra de 400 hogares de la provincia 2 da
_
2 x $420 y 2 s $120 . ¿se puede inferir
que las dos medias poblacionales son diferentes?, si es así, ¿en cual de las provincias
debería abrir la sucursal? Utilice =0.05. 2 s $120
_
2 x $420
_
x1 $400
31. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
43
Unidad 3
ANALISIS DE VARIANZA
Nº de tutoría: Uno
Tutoría Nº 4:
ANÁLISIS DE VARIANZA : ANÁLISIS DE VARIANZA DE UNA VÍA Y
DE DOS VÍAS.
32. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
44
33. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
45
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce el modelo del análisis de varianza.
1.2. Procedimentales
Prueba las diferencias entre k-medias.
1.3. Actitudinales
Comparan las medias de k-grupos o poblaciones.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: Análisis de varianza: conceptos básicos, Análisis de varianza de una vía (concepto, modelo, prueba de hipótesis); Análisis de varianza de dos vías (concepto, clases: sin interacción y con interacción, modelos)
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
34. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
46
Tutoría Nº
Análisis de varianza: análisis de
varianza de una vía y de dos vías
4.1. ANÁLISIS DE VARIANZA
El análisis de varianza se emplea para probar las diferencias entre k medias. Una suposición
básica implícita en el análisis de varianza es que las diversas medias muestrales se obtienen de
las poblaciones distribuidas normalmente que tienen la misma varianza ². Sin embargo, se ha
descubierto que el procedimiento de pruebas no se ve afectado por las violaciones de la
suposición de normalidad cuando las poblaciones son unimodales y los tamaños de muestra son
aproximadamente iguales.
Todos los procedimientos de cálculo presentados son para efectos fijos, contrariamente a los
modelos de efectos aleatorios.
El concepto básico en el análisis de varianza fue desarrollado por R.A. Fisher y la distribución F se
ha denominado en honor suyo. El razonamiento conceptual es el siguiente:
(1) Se calcula la media para cada grupo de la muestra y después se determina el error estándar
de la media S_ con base sólo en las diversas medias muestrales.
(2) Dada la fórmula S_ = S/ n , tenemos que s =
n S X y que
X s n S 2 . Esta estimación
resultante de la varianza de la población se llama la media cuadrática entre los grupos
(MCE).
(3) Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo.
Luego se combinan estos valores de la varianza ponderándolos de acuerdo a n-1 para cada
muestra. La estimación resultante de la varianza de la población se llama media cuadrática
dentro de los grupos (MCD).
(4) Si la hipótesis nula 1 = 2 = 3 = ... = k es verdadera, entonces tenemos que las dos medias
cuadráticas obtenidas en (2) y (3) no están sesgadas y son estimadores independientes de
la misma varianza de la población, ². Si la hipótesis nula es falsa, entonces el valor
esperado de la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre
las medias de la población inflarán la MCE, mientras que no afectarán la MCD.
(5) Con base al numeral (4), se involucra una prueba de una cola y la fórmula general de la
prueba F en el análisis de la varianza es:
MCE
MCD
F
Si la relación F está en la región de rechazo para el nivel de significación especificado,
entonces se rechaza la hipótesis de que las diversas medias muestrales se obtuvieron de la
misma población.
Para simplificar este procedimiento con diseños en términos del modelo lineal que identifica
los componentes que influyen sobre la variable aleatoria y se presenta una tabla estándar de
análisis de varianza que muestra los cálculos necesarios de la media cuadrática para cada
tipo de diseño experimental.
4
35. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
47
4.2. ANÁLISIS DE VARIANZA DE UNA VÍA
El modelo del análisis de varianza de una vía se relaciona con la prueba de la diferencia entre k
medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos
grupos de tratamiento.
La ecuación lineal que representa el modelo del análisis de varianza de una vía es:
Xik = + k + ik
donde:
= media global de todos los k grupos de tratamiento
k = efecto del tratamiento en el grupo específico k, del cual se muestreo el valor
ik = error aleatorio relacionado con el proceso de muestreo.
La tabla siguiente es un resumen del análisis de varianza de una vía en la cual; MCD pasa a ser la
media cuadrática entre los A grupos de tratamiento (MCA) y (MCE) es llamada media cuadrática
del error, N asigna el tamaño total de la muestra para todos los grupos de tratamiento combinados,
antes que el tamaño de la población. Tk representa la suma (total) de los valores muestreados en
todos los grupos combinados.
La hipótesis nula y alternativa son:
Ho: k = 0 para todos los niveles de tratamiento
Ha: k 0 para todos los niveles de tratamiento
Si la hipótesis nula es verdadera, entonces tenemos que :
1 = 2 = 3 = ... = k .
Fuente de
variación
Suma de los
cuadrados, SC
Grados de
libertad, gl
Media
cuadrática MC
Relación F
Entre grupos
de tratamiento
A
N
T
n
T
SCA
k
k
2 2
k – 1
k 1
SCA
MCA
MCE
MCA
F0
Error de
muestreo, E
SCE SCT SCA
n – k
n k
SCE
MCE
Total, T
N
T
SCT X
2
2
N - 1
Ejemplo 4.1
Quince personas que se capacitan en un programa técnico son asignadas en forma aleatoria a
tres tipos diferentes de enfoques de instrucción. Los puntajes de las pruebas de rendimiento, al
concluir la especialización, se presentan en la tabla siguiente. Use el procedimiento de análisis de
varianza para probar la hipótesis nula de que las tres medias muestrales son iguales a un nivel de
significación del 5%.
Método de
Instrucción
Puntaje de la prueba
Tk
Total
A1
A2
A3
86
90
82
79
76
68
81
88
73
70
82
71
84
89
81
400
425
375
Total 1200
36. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
48
Solución:
Suma de cuadrados de tratamiento =
N
T
n
T
SCA
k
k
2 2
= 250
15
1200
5
375
5
425
5
400 2 2 2 2
Suma de cuadrados del total =
N
T
SCT X
2
2
= 698
15
1200
86 90 82 ... 70 82 71
2
2 2 2 2 2 2
Suma de cuadrados del error = SCE SCT SCA
= 698 – 250 = 448
Fuente de
variación
Suma de
cuadrados SC
grados de
libertad, gl
Media
cuadrática MC
relación, F
Entre grupos
de trat., A
SCA = 250
2
MCA =125
Fo = 3.35
Error de
muestreo, E
SCE = 448
12
MCE =37.33
Ft = 3.89
Total, T SCT = 698 14
Ft = F(1- , glA, glE) = F(0.95, 2, 12) = 3.89
Ho: 0 1 2 3
Ha: lg 0 i a ún
= 0.05
f.p. Fo = 3.35
Decisión: Como F RA 0 se acepta Ho
Conclusión: No hay efecto asociado a los niveles del método de instrucción por lo tanto las
diferencias de métodos no son significativo, con un 5% de significación de prueba.
Ejemplo 4.2
La tabla siguiente presenta el promedio de palabras mecanografiadas por minuto en diferentes
marcas de máquinas eléctricas, por individuos asignados aleatoriamente sin experiencia previa en
estas máquinas, después del mismo período de instrucción. Pruebe la hipótesis nula de que la
media de palabras por minuto lograda para las tres máquinas no es diferente, usando un nivel de
significación del 5%.
Marca de las
máquinas
Promedio de palabras por minuto
Tk
Total
A1
A2
A3
79
74
81
83
85
65
62
72
79
51
-
55
77
-
-
352
231
280
Total 863
RA
1 – = 0,95 RR
= 0,05
Ft = 3,89
F0 = 3,35
37. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
49
Solución
Suma de cuadrados de tratamiento =
N
T
n
T
SCA
k
k
2 2
= 103.72
12
863
4
280
3
231
5
352 2 2 2 2
Suma de cuadrados del total =
N
T
SCT X
2
2
= 1376.96
12
863
79 83 62 ... 65 79 55
2
2 2 2 2 2 2
Suma de cuadrados del error = SCE SCT SCA
= 1376.96 – 103.72 = 1273.20
Fuente de
variación
Suma de
cuadrados SC
Grados de
libertad, gl
Media
cuadrática MC
Relación,
F
Entre grupos
de trat., A
SCA = 103.72
2
MCA = 51.86
Fo = 0.37
Error de
muestreo, E
SCE = 1273.20
9
MCE = 141.47
Ft = 4.26
Total, T
SCT = 1376.92
11
Ho: 0 1 2 3
Ha: lg 0 i a ún
= 0.05
f.p. Fo = 0.37
Ft = 4.26
Decisión: Como F RA 0 se acepta Ho
Conclusión: No existe diferencia significativa entre las 3 máquinas de escribir en términos de
velocidad de mecanografía, con un 5% de significación de prueba.
4.3. ANÁLISIS DE VARIANZA DE DOS VÍAS
El análisis de varianza de dos vías se basa en dos conjuntos de clasificaciones o tratamientos. Por
ejemplo, al analizar el nivel de rendimiento de un programa de capacitación, podríamos considerar
ambos efectos, el del método de instrucción y el del rendimiento escolar anterior. Asimismo,
podríamos investigar el kilometraje de gasolina según la categoría de peso del automóvil y el
grado de la gasolina. En las tablas de datos, los tratamientos identificados en los encabezamientos
de la columna se llaman típicamente tratamientos A; aquellos en los encabezamientos de fila se
denominan tratamientos B.
La interacción en un experimento de dos factores significa que los dos tratamientos no son
independientes y que el efecto particular de los niveles de tratamiento en un factor difiere según
los niveles del otro factor. Por ejemplo, al estudiar el kilometraje de un automóvil, una gasolina de
octanaje más alto puede mejorar el kilometraje para ciertos tipos de autos pero no p ara otros.
Además la efectividad de varios métodos de instrucción puede diferir según los niveles de
RA
1 – = 0,95 RR
= 0,05
Ft = 4,26
F0 = 0,37
38. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
50
capacidad de los estudiantes. Con el objeto de probar la interacción, en cada célula de la tabla de
datos de dos vías debe incluirse más de una observación o medición muestreada (reiteración).
4.3.1. Análisis de varianza de dos vías sin interacción (diseño de bloque aleatorizado)
El modelo de análisis de varianza de dos vías en el cual hay una sola observación por célula se
denomina a menudo diseño de bloque aleatorizado, debido a un tipo particular de uso para este
modelo. El objetivo de utilizar éste diseño no tiene propósito específico de probar un efecto de los
"bloques". Más bien, al ser capaz de asignar alguna variabilidad a los sujetos antes del
rendimiento, la MCE, puede reducirse y la prueba resultante del efecto de los tratamientos A ser
más sensible.
La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es:
Xjk = + j + k + jk
Donde:
= media global de cualquier tratamiento
j = efecto del tratamiento j o del bloque j en la dimensión B de clasificación.
k = efecto del tratamiento k en la dimensión A de clasificación.
ik = error aleatorio relacionado con el proceso de muestreo.
Las hipótesis correspondientes serían:
Ho : k = 0
Ha : k 0
La tabla de resumen para el análisis de varianza de dos vías sin interacción se da a continuación:
Fuente de
variación
Suma de los
cuadrados, SC
Grados
de
libertad,
gl
Media cuadrática
MC
Relación F
Entre grupos
de
tratamiento
A
N
T
n
T
SCA
k
k
2 2
K - 1
K 1
SCA
MCA
MCE
MCA
F0
Entre grupos
de
tratamiento
B
N
T
T
k
SCB j
2
2 1
J - 1
J 1
SCB
MCB
Error de
muestreo, E
SCE SCT SCA SCB
(J–1) (K–
1)
(J 1) (K 1)
SCE
MCE
Total, T
N
T
SCT X
2
2
N - 1
Ejemplo 4.3
Para los datos de la tabla siguiente suponga que en la realidad se utilizó un diseño de bloque
aleatorizado y que se parearon los participantes antes del experimento, asignando un participante
de cada grupo de aptitud (con base en los rendimientos anteriores del curso) a cada método de
instrucción. La tabla siguiente es una revisión de la tabla del ejemplo 1, en el sentido que los
valores presentados se han reorganizado para reflejar el diseño de bloque aleatorizado. Sin
embargo observe que en cada grupo de tratamiento A se incluyen los mismos valores, excepto
que se indican de acuerdo a los grupos de aptitud B y, por lo tanto, están dispuestos en un orden
diferente. Pruebe la hipótesis nula de que no existe diferencia en el desempeño promedio entre los
tres métodos de instrucción y los niveles de aptitud, utilizando un nivel de significación del 5%.
39. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
51
Nivel de
aptitud
Método de instrucción Tj
A1 A2 A3 Total
B1 86 90 82 258
B2 84 89 81 254
B3 81 88 73 242
B4 79 76 68 223
B5 70 82 71 223
Total Tk 400 425 375 1200
Solución:
Suma de cuadrados de tratamiento =
N
T
n
T
SCA
k
k
2 2
= 250
15
1200
5
375
5
425
5
400 2 2 2 2
Suma de cuadrados de bloque =
N
T
T
k
SCB j
2
2 1
= 367.33
15
1200
3
223
3
223
3
242
3
254
3
258 2 2 2 2 2 2
Suma de cuadrados del total =
N
T
SCT X
2
2
= 698
15
1200
86 90 82 ... 70 82 71
2
2 2 2 2 2 2
Suma de cuadrados del error = SCE SCT SCA SCB
= 698 – 250 – 367.33 = 80.87
Fuente de
variación
Suma de
cuadrados SC
grados de
libertad, gl
Media
cuadrática
MC
relación, F
Entre grupos
de trat., A
SCA = 250 2 MCA = 125
Fo = 12.4
Ft = 4.46
Entre grupos
de bloque B
SCB = 367.33 4 MCB = 91.83
Error de
muestreo, E
SCE = 80.87 (2)(4) = 8 MCE = 10.98
Total, T SCT = 698 14
Ho: 0 1 2 3
Ha: lg 0 i a ún
= 0.05
f.p. Fo = 12.4
Ft = 4.46
RA
1 – = 0,95 RR
= 0,05
Ft = 4,46
F0 = 12,4
40. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
52
Decisión:
Como F RR 0 rechazamos Ho
Conclusión:
Existe diferencia significativa entre los porcentajes de rendimiento para los diferentes métodos de
instrucción, cuando se consideran el nivel de aptitud. Utilizando una prueba significativa.
4.3.2. Análisis de varianza de dos vías con interacción (N observaciones por célula)
Cuando se utiliza este diseño se pueden probar por el análisis de varianza tres hipótesis nulas
diferentes; que no hay efectos de columna (las medias de las columnas no son significativamente
diferentes) y que no hay efectos de fila (las medias de las filas no son significativamente
diferentes) y que no hay interacción entre los dos factores (los dos factores son independientes).
Un efecto de interacción significativo indica que el efecto de los tratamientos para un factor varía
según los niveles del otro factor. En tal caso, la existencia de efectos de columna y de fila puede
no tener mucho significado desde el punto de vista de la aplicación de los resultados de la
investigación.
La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es:
Xijk = + j + k + ijk + ijk
Donde:
= media global independiente de cualquier tratamiento
j = efecto del tratamiento j en la dimensión B.
k = efecto del tratamiento k en la dimensión A.
ijk = efecto de la interacción entre el tratamiento j (del
factor B) y el tratamiento k (del factor A)
ik = error aleatorio relacionado con el proceso de muestreo.
Las hipótesis correspondientes serían:
Ho : k = 0 Ho : j = 0 Ho : Ijk = 0
Ha : k 0 Ha : j 0 Ha : Ijk 0
La tabla de resumen para el análisis de varianza de dos vías con interacción se da a continuación:
Fuente de
variación
Suma de los
cuadrados, SC
Grados
de
libertad,
gl
Media cuadrática
MC
Relación F
Entre grupos
de
tratamiento
A
N
T
T
n
SCA k
2
2 1
K - 1
K 1
SCA
MCA
MCE
MCA
F0
Entre grupos
de
tratamiento
B
N
T
T
nk
SCB j
2
2 1
J – 1
J 1
SCB
MCB
MCE
MCB
F0
Interacción
(entre
grupos de
tratamiento
A y B) I
N
T
SCA SCB
X
n
SCI
2
1 2
(J–1) (K–
1)
(J 1) (K 1)
SCI
MCI
MCE
MCI
F0
Error de
muestreo, E
SCI
SCE SCT SCA SCB
JK (n–1)
JK (n 1)
SCE
MCE
Total, T
N
T
SCT X
2
2
N - 1
41. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
53
Ejemplo 4.4
Nueve personas que se capacitan en cada una de cuatro áreas temáticas diferentes fueron
asignadas en forma aleatoria a tres métodos de instrucción distintos. Se asignaron tres
estudiantes a cada método de instrucción. Se refiere a la tabla siguiente, pruebe las diversas
hipótesis nulas que son de interés respecto a tal diseño, a un nivel de significación del 5%.
Área
temática
Método de instrucción Total Tj
A1 A2 A3
B1 70
79
72
83
89
78
81
86
79
717
221 250 246
B2 77
81
79
77
87
88
74
69
77
709
237 252 220
B3 82
78
80
94
83
79
72
79
75
722
240 256 226
B4 85
90
87
84
90
88
68
71
69
732
262 262 208
Total Tk 960 1020 900 T=2880
Solución:
Suma de cuadrados de tratamiento A =
N
T
T
nk
SCA k
2
2 1
= 600
36
2880
12
900
12
1020
12
960 2 2 2 2
Suma de cuadrados de tratamiento B =
N
T
T
nj
SCB j
2
2 1
= 30.8
36
2880
9
732
9
722
9
709
9
717 2 2 2 2 2
Suma de cuadrados de la interacción =
N
T
SCA SCB
X
n
SCI
2
1 2
= 533.9
36
2880
600 30.8
3
208
3
262
3
262
...
3
246
3
250
3
221 2 2 2 2 2 2 2
Suma de cuadrados del total =
N
T
SCT X
2
2
= 1600.0
36
2880
70 83 81 ... 87 88 69
2
2 2 2 2 2 2
Suma de cuadrados del error = SCE SCT SCA SCB SCI
= 1600 – 600 – 30.8 – 533.9 = 435.3
42. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
54
Fuente de
variación
Suma de
cuadrados
SC
Grados de
libertad, gl
Media
cuadrática MC
relación, F
Entre grupos
de trat., A
(método)
SCA = 600.0 3-1 = 2 MCA = 300 Fo = 16.57
Entre grupos
de trat., B
(tema)
SCB = 30.8 4-1 = 3 MCB = 10.3 Fo = 0.57
Interacción
entre
método y
tema, I
SCI = 533.9 (2)(3) = 6 MCI = 18.1 Fo = 4.92
Error de
muestreo, E
SCE = 435.3
(4)(3)(2) =
24
MCE = 18.1
Total, T SCT =
1600.0
36-1=35
Ho: A1 A2 A3 Ho: B1 BA2 BA3 Ho: 0 jk I
Ha: lg 0 i a ún Ha: lg 0 j a ún Ha: 0 jk I
= 0.05
f.p.
Fo = 16.57 Fo = 0.57
Ft = F(2,24,0.95) = 3.4 Ft = F(3,24,0.95) = 3.0
Fo = 4.92
Ft = F(6,24,0.95) =2.5
Decisión:
1. Como F RR 0 rechazamos Ha
2. Como F RA 0 aceptamos Ho
3. Como F RR 0 aceptamos Ha
Conclusión: Hay diferencia satisfactoria entre los porcentajes de los métodos de instrucción, no
hay diferencia significante entre las distintas áreas hay interacción importante entre los dos
factores:
La última conclusión indica que varía la efectividad de los tres métodos de instrucción para las
diferentes áreas temáticas.
RA
1 – = 0,95
RR
= 0,05
RA
1 – = 0,95
RR
= 0,05
RA
1 – = 0,95
RR
= 0,05
Ft = 3.4 Ft = 3.0
Ft = 2.5
Fo = 16.57 Fo = 0.57
Fo = 4.92
43. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
55
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) El análisis de varianza se emplea para probar las diferencias entre k medias.
( ) El análisis de varianza de dos vías se basa en dos conjuntos de tratamientos
( ) Al análisis de varianza de dos vías sin interacción se le conoce como diseños de bloque aleatorizado.
( ) El modelos del análisis de varianza de dos vías es: Xik = + k + ik
( ) MCE es llamada media cuadrática del error
2. En 12 depósitos al por menor se establecieron 4 tipos de exhibiciones de publicidad, con tres depósitos asignados en forma aleatoria a cada una de las exhibiciones con el propósito de estudiar el impacto de la exhibición en el punto de venta. Refiriéndose a la tabla siguiente, pruebe la hipótesis de que no existe diferencia entre las medias de los valores de venta para los cuatro tipos de exhibiciones, usando un nivel de significancia del 5%.
Tipo
De Exhibición
VENTAS
1 2 3
E1
E2
E3
E4
40 44 43
53 54 59
48 38 46
48 61 47
3. Los siguientes son los números de hornos de microondas que venden cada uno de los vendedores de las tres sucursales de una compañía distribuidora de artículos domésticos
SUCURSAL ALFA 21 11 17 28
SUCURSAL BETA 27 15 18 26 17 21
SUCURSAL GAMMA 24 17 31 12 15
Realice un ANVA para probar, con un nivel de significancia de 0.05, si la hipótesis nula de que en promedio las ventas de las tres sucursales son las mismas.
4. Completar la siguiente tabla de análisis de varianza (ANVA)
FUENTE VARIACION
SUMA DE CUADRADOS
GRADO DE LIBERTAD
MEDIA CUATRADTICA
F
Tratamiento
2
Error
9
10
Total
120
5. Un ejecutivo de marketing llevó a cabo un estudio para examinar el efecto comparativo de 3 técnicas diferentes de promoción en 4 zonas diferentes de ventas y obtuvo los resultados mostrados en la tabla siguiente. Determinar las conclusiones a las que puede llegar usando los resultados de la tabla ANVA y formule en forma clara las hipótesis de contraste.
FUENTE VARIACION
SUMA DE CUADRADOS
GRADO DE LIBERTAD
MEDIA CUADRATICA
F
Entre técnicas promocionales
7.48
Entre zonas de ventas
3
Error
3.90
6
Total
11.41
11
44. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
56
45. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
57
Unidad 4
TEORIA DE LA TOMA DE DECISIONES
Nº de tutoría: Uno
Tutoría Nº 5
Teoría de la toma de decisiones
46. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
58
47. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
59
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce los conceptos del análisis estadístico en la toma de decisiones.
1.2. Procedimentales
Elaboran tabla, diagrama en base a las probabilidades para la toma de decisiones.
1.3. Actitudinales
Realiza toma de decisiones basadas en un análisis estadístico en un problema de investigación.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: La estructura bayesiana comparada con la estadística clásica conceptos fundamentales (conceptos generales), estructura de la tabla de decisión; toma de decisiones basadas en probabilidades (criterios: probabilidad máxima, esperanza del evento); toma de decisiones con base sólo en las consecuencias económicas (criterios: maximin, máximax, pena mínimax); toma de decisiones con base en probabilidades y consecuencias económicas (criterios: del valor esperado o criterio bayesiano, mínima pérdida de oportunidad o pena esperada); análisis de árbol de decisión.
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD.
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
48. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
60
Tutoría Nº
Teoría de la toma
de decisiones
5.1. LA ESTRUCTURA BAYESIANA COMPARADA CON LA ESTADÍSTICA CLÁSICA
La estadística clásica trata en lo fundamental dos problemas estrechamente relacionados:
1. El problema de la estimación de algunos parámetros de la población, como la media aritmética de la población y la proporción poblacional p.
2. El problema de probar una hipótesis respecto a alguna característica o parámetro de la población
Pero, ya sea que el problema consista en estimar algún parámetro de la población o probar (o contrastar o verificar) una hipótesis respecto al valor de ese parámetro, el método que se usa para resolver el problema es uno y el mismo; se selecciona una muestra aleatoria de la población y esta información muestral se convierte en la base de todas las inferencias acerca de los parámetros de la población. Para ejemplificar esto, supóngase que el problema inmediato es estimar el porcentaje de estudiantes del quinto año de secundaria en un colegio. Si una muestra aleatoria de 100 estudiantes seleccionados de este colegio revela que hay 10 esudiantes del último año, entonces se estimará el porcentaje de estudiantes del último año de todo el colegio como 10/100 ó 10%.
La información que se puede utilizar al hacer una inferencia sobre una característica de la población, por lo general, se clasifica en dos clases: la información objetiva y la información subjetiva. Por ejemplo, la información que se obtiene por medio de muestreos es información objetiva. Por otra parte, la opinión personal del experto en un campo es información subjetiva. Al estimar el porcentaje de estudiantes del último año del colegio como 10%, se ha adoptado el método tradicional o clásico de la inferencia estadística, un método en el que la inferencia acerca de la población se basa de una manera estricta en información muestral objetiva.
En contraste con el método estadístico clásico, en el que sólo se puede utilizar información muestral objetiva, un enfoque alternativo de la estadística, llamado estadística de Bayes, puede utilizarse toda la información disponible pertinente: subjetiva y objetiva. En la estadística de Bayes, una inferencia sobre un parámetro de la población puede hacerse partiendo de información subjetiva exclusivamente. Sin embargo, si posteriormente se cuenta con información muestral objetiva, se combinan la información subjetiva y la objetiva, y las inferencias sobre el parámetro de la población se basan en esta información combinada.
La distinción entre la estadística clásica y la de Bayes, puede presentarse desde una perspectiva definida considerando el ejemplo siguiente: Una compañía manufacturera está considerando la compra de una nueva máquina, denominada la máquina A. La decisión de si se compra o no la máquina A se basará en el porcentaje de partes defectuosas que produzca la máquina. En base a su experiencia pasada con otras máquinas semejantes, el ingeniero de control de calidad de la compañía estima el porcentaje de partes defectuosas producidas por la máquina A según la siguiente tabla:
PORCENTAJE DE PARTES DEFECTUOSAS
PROBABILIDAD
0,05
0,06
0,07
0,30
0,50
0,20
Esto significa que el ingeniero de control de calidad no está absolutamente seguro del porcentaje de partes defectuosas que produce la máquina A. Sin embargo, en base a cualquier conocimiento 5
49. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
61
o experiencia que posee, el ingeniero piensa personalmente que es de 0,30 la probabilidad de que el porcentaje de partes defectuosas producidas por la máquina A sea 5% es de 0,50 la probabilidad de que el porcentaje de partes defectuosas sea 6% y hay un riesgo de 0,20 en que el porcentaje de partes defectuosas sea 7%.
Dos observaciones importantes pueden hacerse en esta fase de la discusión. Primera, la información del ingeniero de control de calidad respecto a la máquina A es personal o subjetiva, puesto que algún otro ingeniero bien podría dar una estimación del porcentaje de partes defectuosas que produce la máquina A. Segunda, en contraste con la estadística de Bayes está especialmente diseñada para hacer uso más constructivo de este tipo de información. De hecho, usando la información subjetiva del ingeniero de control de calidad, la estadística de Bayes permitirá a la compañía decidir si compra o no la máquina A.
Continuando el caso de la máquina A, supóngase además que en una serie de pruebas, una muestra aleatoria de 100 partes producidas por la máquina A revela que hay 4 partes defectuosas. Ahora bien, según la estadística, el porcentaje de partes defectuosas producidas por la máquina A se estima como 4%. Sin embargo, usando la estadística de Bayes la información muestral se combina con la información subjetiva del ingeniero de control de calidad, y una estimación del porcentaje de partes defectuosas producidas por la máquina A se hace, partiendo de esta combinación de información.
El uso de información subjetiva en la inferencia estadística es sólo una de las características de la estadística bayesiana. En los últimos años, la estadística bayesiana se ha convertido en una teoría integrada para la toma de decisiones, llamada la teoría de decisión bayesiana.
La teoría de decisión bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre. Esta teoría le proporciona a quien toma una decisión un procedimiento racional y sistemático que le permite elegir entre varios cursos de acción posible cuando las consecuencias de cada una de estas acciones están sujetas a incertidumbre.
I. Estructura de tablas de decisión
Una tabla de decisión identifica la ganancia (o pérdida) ocasional asociada por todas las combinaciones posibles de actos y sucesos de decisión, también indica la probabilidad de ocurrencia para cada uno de los eventos mutuamente excluyentes.
TABLA 1
ESTRUCTURA GENERAL DE UNA TABLA DE DECISIÓN
EVENTO
PROB.
ACTOS
A1
A2
A3
...
An
E1
E2
E3
...
Em
p1
p2
p3
...
pm
X11
X21
X31
...
Xm1
X12
X22
X32
...
Xm2
X13
X23
X33
...
Xm3
...
...
...
...
...
X1n
X2n
X3n
...
Xmn
Donde:
Actos: Son los cursos de acción alternativos, o estrategias, que están a disposición de la persona que toma la decisión. Como resultado del análisis se elige uno de estos actos como el mejor.
Eventos: Identifica las ocurrencias que están fuera del control de la persona que toma la decisión y que determina el nivel de éxito de un acto dado.
Probabilidad: Deben estar disponibles, pueden basarse en actos objetivos o determinarse subjetivamente con base en el criterio. Las sumas de las probabilidades siempre es 1,00.
Las entradas en las células: Son valores condicionales o consecuencias económicas condicionales. Frecuentemente se denominan pagos y son condicionales pues el resultado económico depende del acto de decisión que se elige y del evento que ocurre.
50. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
62
II. Toma de decisiones basadas en probabilidades
Esto se efectúa haciendo uso de la primera y segunda columna de la tabla 1.
Criterios
1º Probabilidad máxima: Es aquel que se selecciona el acto del evento que presenta mayor probabilidad.
2º Esperanza del evento: Es aquel que se selecciona el acto del evento considerando la esperanza matemática del evento. E(e) = e p(e)
Obs. Representa una base incompleta para efectuar toma de decisión.
III. Toma de decisiones con base sólo en las consecuencias económicas
La tabla que se usa es similar a la tabla 1, excepto que por la ausencia de las probabilidades de los eventos.
Criterios
1º Maximin: Esta estrategia de decisión es "altamente conservadora" pues la persona que toma la decisión se preocupa de que "pueda suceder lo peor" respecto a cada acto.
Cálculo: Se determina el valor mínimo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor.
2º Máximas: Es el estándar por el cual el mejor acto es el para el que el valor máximo es mayor que el máximo de cualquier otro acto de decisión. Este criterio se opone filosóficamente al criterio maximin, pues la persona que toma las decisiones está orientada hacia "lo mejor que puede suceder" con respecto a cada acto.
Cálculo: Se determina el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor.
3º Pena Minimax (Pérdida de oportunidad condicional): Es la diferencia entre el resultado económico del mejor acto dado que ha ocurrido en un evento particular y el resultado económico de acto. El valor "mejor" o más deseado de la pena es "0".
Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor, en cada fila, luego el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es menor.
IV. Toma de decisiones con base en probabilidades y consecuencias económicas
Estos métodos utilizan toda la información contenida en la tabla 1.
Criterios
1º Del valor esperado (VE) o Criterio Bayesiano: Es la norma por el cual el mejor acto es aquel para el que el resultado económico esperado es el más alto como promedio a largo plazo.
Cálculo: Se determina multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es mayor.
2º Minima pérdida esperada de oportunidad (PEO) o Pena esperada.- El acto con la mayor ganancia esperada tendría la menor pena esperada.
Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor en cada fila, luego se multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es menor.
V. Análisis de árbol de decisión
Es el método que puede utilizarse para identificar el mejor acto inicial, como también los mejores actos subsiguientes.
Proceso
1º Construir el árbol de decisión de izquierda a derecha, con sus puntos de decisión (puntos secuenciales en los cuales tiene que hacerse la elección) y eventos causales (puntos
51. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
63
secuenciales en los cuales ocurrirá un evento probabilístico). Depende del análisis apropiado, de la situación global de decisión.
2º Se colocan en el diagrama los valores de probabilidad asociados con los eventos causales y las consecuencias económicas. Los valores esperados de los actos alternativos en el punto inicial de decisión, los valores esperados se calculan sistemáticamente de derecha a izquierda en el árbol de decisión. Este proceso se llama "devolverse".
Ejemplo 5.1
Un contratista de calefacción y aire acondicionado debe comprometerse a comprar unidades de aire acondicionado desde el 1ero de abril, para reventa e instalación durante la próxima temporada de verano. Con base en la demanda del verano anterior, en las actuales condiciones económicas y en los factores de competencia del mercado, calcula que hay una probabilidad de 0,10 de vender sólo 5 unidades, una probabilidad de 0,30 de vender 10 unidades, una probabilidad de 0,40 de vender 15 unidades y una probabilidad de 0,20 de vender 20 unidades. Los equipos de aire acondicionado se pueden ordenar sólo en grupos de cinco, siendo el costo unitario de $1000 y el precio al por menor de $1300 (más gastos de instalación). Todas las unidades que no se han vendido al término de la temporada se devuelven al fabricante por un crédito neto de $800, después de deducir los gastos de embarque. Determine los mejores actos de decisión desde el punto de vista de los criterios.
a) basada sólo en probabilidades, (probabilidad máxima y esperanza del evento).
b) basada sólo en las consecuencias económicas, (maximin, maximax, pena minimax).
c) basada en probabilidades y consecuencias económicas, (criterio bayesiano y pena esperada de oportunidad).
Solución:
(Tabla de ganancias)
E
Demanda
P (E)
ACTOS (Compra – Stock)
A1 = 5
A2 = 10
A3 = 15
A4 = 20
E1 = 5
E2 = 10
E3 = 15
E4 = 20
0.10
0.30
0.40
0.20
1500
1500
1500
1500
500
3000
3000
3000
(500)
2000
4500
4500
(1500)
1000
3500
6000
Valor esperado
13,3
Maximin 1500
500
(500)
(1500)
Máxima x
1500
3000
4500 6000
C. Bayesiano
1500
2750 3250
2750
(Tabla de pérdida de oportunidad)
E
Demanda
P (E)
ACTOS (Cantidad de orden)
A1 = 5
A2 = 10
A3 = 15
A4 = 20
E1 = 5
E2 = 10
E3 = 15
E4 = 20
0.10
0.30
0.40
0.20
0
1500
3000
4500
1000
0
1500
3000
2000
1000
0
1500
3000
2000
1000
0
Pena Mimi max 4500
3000 2000
3000
Pena esperada de oportunidad
2550
1300 800 1300
a) i) Como la probabilidad máxima es 40%, entonces el mejor acto de decisión es ordenar la compra de 15 unidades de aire acondicionado.
ii) Como el valor esperado = EP(E) = 13,3 y las ordenes se afectan en grupos de 5, luego el mejor acto de decisión, es ordenar la compra de 15 unidades de aire acondicionado.
b) Maximinin: ordenar comprar 5 unidades de aire acondicionado
Maximimax: ordenar comprar 20 unidades de aire acondicionado
Pena mínimas: ordenar comprar 15 unidades de aire acondicionado
c) Criterio Bayesiano: ordenar comprar 15 unidades de aire acondicionado
Pena esperada de oportunidad: ordenar comprar 15 unidades de aire acondicionado
52. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
64
Ejemplo 5.2
a. A un fabricante se le presentó un proyecto para un producto nuevo, y debe decidir si desarrollarlo o no. El costo del desarrollo de proyecto es S/. 200 000; la probabilidad de éxito es 0,70. Si el desarrollo no tiene éxito se termina el proyecto. Si tiene éxito, el fabricante debe entonces decidir si el nivel de producción ha de ser alto o bajo. Si la demanda es alta, el aumento en la utilidad, dado un nivel elevado de producción, es de S/. 700 000; dado un nivel bajo, es de S/. 150 000. Si la demanda es baja, el incremento en la utilidad, dado un nivel elevado de producción es S/. 100 000; dado un nivel bajo es S/. 150 000.
Todos estos incrementos en utilidades son cifras brutas (es decir, antes de restar los S/. 200 000 del costo de desarrollar el producto). Se estima que la probabilidad de una demanda elevada es 0,40 y para la demanda baja es 0,60. Elabore el árbol de decisiones para esta situación.
La figura muestra el árbol de decisión de este problema:
: Puntos de decisión
: Eventos aleatorios
b. Con referencia a la figura 1, determine si el fabricante debe intentar el desarrollo de este producto o no, determinando la ganancia esperada correspondiente a las acciones alternativas “desarrollar” y “no desarrollar”.
En la figura 2 se repite el árbol de decisión presentado en la figura 1, pero ahora se incluyen las ganancias esperadas correspondientes a cada una de las decisiones posibles del proceso secuencial, y se eliminan las acciones no preferidas de cada decisión, cruzando con dos rayas la rama correspondiente. Trabajando de derecha a izquierda, se determina la ganancia esperada de la decisión “nivel alto de producción”, y que es de S/. 140 000, de la siguiente manera:
GE (nivel alto de fabricación) = (0,40) (500 000) +
(0,60) (-100 000)
= S/. 140 000
De manera análoga:
GE (nivel bajo de fabricación) = (0,40) (-50 000) +
(0,60) (-50 000)
= S/. 50 000
Figura 1. Diagrama del árbol de decisión
53. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
65
Al comparar las dos ganancias esperadas, la mejor decisión es “nivel alto de fabricación”; se elimina la posibilidad de la otra acción. Pasando a la izquierda hacia el siguiente punto de decisión (que es también el punto inicial de decisión en este caso), las ganancias esperadas para las dos posibles decisiones son:
GE (desarrollar) = (0,70) (140 000) +
(0,30) (-200 000)
= S/. 38 000
GE (no desarrollar) = S/. 0
Al comprar las dos ganancias esperadas, la mejor acción en el punto inicial es “desarrollar”. Al calcular la ganancia esperada de “desarrollar”, debe observarse que la probabilidad de 0,70 (para “desarrollo con éxito”) se multiplica por S/. 140 000, y se ignora la rama adyacente de S/. –50 000, debido a que corresponde a una decisión eliminada en la etapa previa de análisis.
Figura 2: Diagrama del árbol con reversión
54. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
66
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) La pena mínimax se calcula en la tabla de perdida.
( ) El criterio que maximiza los pagos mínimos de todos los actos se llama máximas.
( ) En el criterio máximax, el mejor acto es aquel para el cual el valor resultante es mayor.
( ) Los eventos son los cursos de acción alternativos, que están a disposición de la
persona que toma la decisión.
( ) La teoria bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre.
2. Supóngase que un fabricantes de equipos de oficina debe decidir si ampliar la capacidad de su planta ahora o espera otro año. Sus consejeros le advierten que si hace ahora la ampliación y las condiciones económicas siguen siendo favorable, se logrará una utilidad de $ 369 000; si hace ahora la ampliación y existe alguna recesión económica, habrá un pérdida (utilidad negativa) de $ 900 000; si espera otro año y las condiciones económicas siguen siendo favorables, se logrará una utilidad de $ 180 000; y si espera otro año, y existe una recesión económica, se logrará una pequeña utilidad de $ 18 000.
a) Construya una tabla de pagos.
b) Construya una tabla de pérdida
3. Un canillita debe ordenar los periódicos con un día de anticipación. El costo de los periódicos es de $ 2 la docena y el precio de venta es de $ 4 la docena. Los periódicos no vendidos al cabo del día deben devolverse. Si el canillita estima la demanda diaria de su clientela por periódicos en la forma siguiente: Demanda diaria, en docenas: 12, 13, 14. Probabilidad de la demanda 0.20, 0.30, 0.50.
a) Establecer la tabla de pago y de pérdida.
b) Determine los mejores actos de decisión desde el punto de vista de los criterios: Probabilidad máxima, valor esperado, maximin, máximax, pena mínimax, criterio bayesiano y pena esperada de oportunidad
4. Dada la siguiente tabla de resultados:
UTILIDADES
Suceso
Probabilidad
Acciones
A 1 A2 A3 A4
A
B
C
D
0.1
0.2
0.5
0.2
20 0 -30 -40
20 40 20 0
20 40 60 40
20 40 60 80
a) Determínese la acción óptima mediante la Probabilidad Máxima
b) Determínese la acción óptima utilizando el criterio Bayesiano y Pena Esperada de Oportunidad
c) Determínese la acción óptima utilizando el criterio MÁXIMAX, MAXIMIN, MINIMAX
5. La junta directiva de un hospital privado debe decidir, sobre fases financieras, si autoriza fondos a un nuevo centro de atención a pacientes cardiacos. La junta considera que si se construye el nuevo centro y contratan a un cardiólogo de prestigio nacional, el centro percibirá $ 7.2 millones. Si se construye el nuevo centro pero no pueden contratar un cardiólogo eminente, habrá una pérdida de $ 1.25 millones. Si se remodela el antiguo centro de cardiología y se contrata a un cardiólogo eminente, el centro captará $ 2 millones. Si se remodela el centro y no contratan a un cardiólogo eminente, la institución sólo percibirá $ 0.5 millones.
a) Construya una tabla de pagos.
b) Trace un árbol de decisión.
55. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
67
Unidad 5
CONTRO DE CALIDAD
Nº de tutorías: Dos
Tutoría Nº 6: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA MEDIA DEL PROCESO.
Tutoría Nº 7: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA VARIACIÓN DEL PROCESO Y PARA LA PROPORCIÓN DE DEFECTUOSOS.
56. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
68
57. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
69
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce los conceptos de las técnicas muy útiles que se usan en la
industria para controlar y mejorar la calidad del producto.
1.2. Procedimentales
Elaboran diagramas de control para controlar y mejorar el producto de
un proceso de manufactura.
1.3. Actitudinales
Asegurar que las variables que miden la calidad de un producto queden
dentro de los intervalos que son aceptables para posibles clientes.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: control
de calidad, introducción, métodos de control de calidad: técnicas de
supervisión, técnicas de localización de problemas, técnicas de
selección, supervisión de la calidad mediante graficas o diagramas de
control, grafica de control para media del proceso: diagrama de x ;
gráfica de control para la variación del proceso: diagrama de r, gráfica
de control para la proporción de defectuosos: diagrama de p; gráfica
de control para el número de defectuosos por unidad: diagrama de c
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos
prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD.
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos
fuertes y debilidades.
58. Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia
70
Tutoría Nº
Control de calidad: grafica de control para la media del proceso
ESTUDIO DE UN CASO
El Caso del Aceite Perdido
Considérese un problema administrativo, en el que usted es el encargado de la operación de llenar latas de aceite lubricante para motores. Los envases de un cuarto de galón, el tipo que se compra en una estación de servicio local, se llenan con una máquina que tiene 28 boquillas (inyectores). Cada boquilla descarga el aceite en una lata, y la máquina llena así los 28 envases, uno con cada inyector.
El problema se presenta cuando los controladores de la compañía detectan una discrepancia extraña. Aunque la cantidad de aceite que se recibe mensualmente para la operación de llenado asciende a 10 000 000 de cuartos de galón, el número de latas de una cuarto que se llenan, es siempre considerablemente menor. Si el número de latas llenadas de un mes dado es de 9 700 000, ¿qué pasó con los 300 000 cuartos de aceite perdido?
El problema que acabamos de describir es similar al problema encontrado por V. Filimon y sus colegas quienes trabajan, en ese tiempo, para la Estándar Oil Company en Cleveland, Ohio (V. Filimon, R. Maggass, D. Frazier y A. Flingel, “Some Applications of Quality Control Techniques in Motor Oil Can Filing, Industrial Quality Control, Vol. 12, 1995”). Su operación consistió en usar tres maquinas llenadoras cada una con 6 boquillas para latas de un cuarto, otra con 28 boquillas también para un cuarto y una mas con 16 inyectores para latas de un galón.
La búsqueda del aceite perdido se concentro rápidamente en la maquina llenadora. ¿Se puede ajustar una máquina para que una boquilla descargue exactamente un cuarto de aceite en cada lata? La respuesta es negativa, porque la cantidad de aceite descargada para una sola boquilla difiere ligeramente de la que descargue otra, debido a la variación en el flujo del aceite por la citada boquilla. Así la cantidad x de aceite descargada en una lata, medida en volumen o en peso, varia de una lata a otra y tiene una distribución de frecuencias relativas. Esta variación en el peso de llenado, llevo a Filimon y a sus colegas, a sospechar que el aceite perdido salía de la planta en las mismas latas.
La operación de llenar los envases, y sus problemas inherentes, es comparable a la mayoría de las operaciones actuales en los negocios. Cada operación origina un producto que se considera aceptable o inaceptable, dependiendo de una o más variables que miden la calidad del producto. El producto de una operación de llenado de envases de aceite es una lata de aceite; una medida de su calidad es la cantidad de aceite depositado en cada lata. El producto de una máquina que origina lámparas eléctricas es una bombilla o un foco, y una medida de su calidad es la cantidad de luz que emita. El producto de un hospital es el tratamiento médico y el cuidado para un solo paciente. La calidad del cuidado de un paciente se mediría, sin duda, mediante un cierto número de variables de calidad.
En esta unidad presentaremos algunas técnicas administrativas y estadísticas para supervisar, mejorara y controlar la calidad del producto de una operación actual en los negocios.
6
59. Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia
71
6.1. INTRODUCCION
El objetivo de este capitulo es presentar algunas técnicas muy útiles que se usan en la industria para controlar y mejorar la calidad de productos manufacturados así como para el mejoramiento de la calidad de sistemas de administración.
Como lo indica el titulo, la metodología del control de calidad se estructuro para controlar y mejorar el producto de un proceso de manufactura. Los perfiles o barras de acero deben tener una resistencia a la tensión especifica; un jabón tiene que ser producido con un nivel bajo de impurezas; una caja de cereales debe tener un contenido en peso específico, y los datos de entrada financieros en una computadora para administración tienen que ser exactos y preciso, con una alta probabilidad. Así, el objetivo de un programa de control de calidad es asegurar que las variables que miden la calidad de un producto queden dentro de los intervalos que son aceptables para posibles clientes.
6.2. MÉTODOS DE CONTROL DE CALIDAD
Los métodos de control de calidad se clasifican en tres categorías:
6.2.1. Técnicas de supervisión
Diseñadas para seguir o rastrear el nivel de las variables de calidad y para detectar cambios indeseables en la calidad del producto;
6.2.2. Técnicas de localización de problemas
Ideadas para ayudar a ubicar las causas de cambios indeseables en la calidad del producto; y
6.2.3. Técnicas de selección
Diseñadas para eliminar productos defectuosos, o de mala calidad que entran al proceso como materia prima y sirven para realizar el mismo trabajo, en el caso de los productos acabados antes de enviarlos a un cliente.
Se dice a menudo que el control de calidad consta del 10% de Estadística y de 90% de ingeniería y sentido común. Como se aprender, la mayoría de los métodos de control de calidad se basan en los conceptos estadísticos elementales. El verdadero problema ocurre cuando se detecta uno de los procesos de supervisión o monitoreo o de selección. Así los métodos de control de calidad pueden decir cuando pero no porque ocurren los problemas. Para descubrir la causa de la baja calidad en productos y corregir la situación, es necesario conocer el proceso y tener aptitudes y habilidad para resolver problemas.
Esta unidad trata de dos de los tres tipos de métodos de control de calidad, los procedimientos para controlar un proceso de producción actual y los métodos utilizados para eliminar materia prima poco satisfactoria que entra al proceso o productos defectuosos que salen del proceso o ambas cosas. La tercera categoría metodológica, los procedimientos estadísticos para localizar la causa de un cambio que haga bajar la calidad del producto, consiste en todos los métodos desarrollados en esta asignatura como en estadística general. Dos de los procedimientos de mayor utilidad son el análisis de regresión y el análisis por tablas de contingencia que pueden establecer con correlación entre una o más materias primas, o variables del proceso o del entorno, y la calidad del producto.
6.3. SUPERVISION DE LA CALIDAD MEDIANTE GRAFICAS O DIAGRAMAS DE CONTROL
Las mediciones de una variable de calidad varían en el tiempo. Por ejemplo, las mediciones del diámetro interior de un cojinete cuyo valor es pulgada, variarán ligeramente de una pieza a otra. El diámetro del cojinete tiende a hacerse mas pequeño debido al desgaste del utensilio de corte del proceso de maquinado. Una variación de este tipo se denomina definida por una causa atribuible. Otra variación en la que ocurre pequeños cambios fortuitos que se deben a la gran cantidad de variables desconocidas que afectan el diámetro: cambios en la materia prima, condiciones ambientales, etc., se considera como una variación aleatoria.