SlideShare una empresa de Scribd logo
1 de 178
Descargar para leer sin conexión
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia13
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce el concepto de estimación puntual y por intervalos.
1.2. Procedimentales
Calculan estimaciones puntuales o intervalicas de los parámetros de
una población.
1.3. Actitudinales
Resuelve situaciones en donde se quiere estimar los parámetros de
una población en estudio.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente:
Estimación de parámetros: Introducción: Estimación Puntual
(Estimación puntual para la media poblacional, Estimación
Puntual para la varianza poblacional, Estimación de parámetros
de dos poblaciones, Estimación puntual de una población de
variable cualitativa, Estimación puntual de dos poblaciones de
variables cualitativas) y Estimación por intervalos (Intervalo de
confianza para la media poblacional, Intervalo de confianza para
la diferencia de medias poblacionales, Intervalo de confianza
para la proporción poblacional, Intervalo de confianza para la
diferencia de proporciones poblacionales).
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos
prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos
fuertes y debilidades.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia14
Tutoría Nº
Estimación de parámetros:
estimación puntual y estimación
por intervalos
1.1. INTRODUCCIÓN
Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones respecto a
una población, de los datos obtenidos realmente de una muestra.
La inferencia estadística comprende dos tipos principales de técnicas: Estimación de parámetros y
contrastación de hipótesis. Independientemente de la técnica que se utilice, la finalidad general es
utilizar datos de una muestra para extraer conclusiones respecto a una población.
1.2. ESTIMACIÓN DE PARÁMETROS
Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa respecto
al valor de una característica de la población y desea conocer cuál podría ser tal valor.
La estimación puede asumir 2 formas:
- Estimación puntual
- Estimación por intervalos
1.2.1. Estimación puntual
Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar el
parámetro desconocido de la población.
Una desventaja de esta forma de estimación es que no aporta la precisión de la estimación del
parámetro.
Las estimaciones puntuales más usuales son:
(A) Estimación Puntual para la media poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
f
fx
=x=
n
x
=x=
i
iii
(B) Estimación Puntual para la varianza poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
f
xnfx
=s=
n
xnx
=s= 222
1
)(
1
)( 22
2
22
1
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia15
(C) Estimación de parámetros de dos poblaciones
Sea X1 una variable aleatoria que se distribuye como una distribución normal con media 1
y varianza
2
1 e X2 otra variable aleatoria que se distribuye como una distribución normal
con media 2 y varianza
2
2 .
La estimación de parámetros de dos poblaciones se pueden realizar mediante:
a) La comparación de sus medias, luego:
212121
ˆˆ x-x=-=-
b) La comparación de sus varianzas, luego:
s
s
== 2
x
2
x
x
x
x
2
x
2
1
2
1
2
2
1
2
ˆ
ˆˆ
(D) Estimación puntual de una población de variable cualitativa
Sea X una variable cualitativa con:
ticacaracterísladePresencia:A
P-1=Qy
AXsi0,
AXsi1,
N
M
N
X
Pcon
X
i
Luego:
p-1=qy
Axsi0,
Axsi1,
n
m
N
x
pcon
x
i
Entonces: P p
(E) Estimación puntual de dos poblaciones de variables cualitativas
Sea X1 la variable aleatoria de una población cualitativa con Px1 proporción de aciertos en X1
y sea X2 la variable aleatoria de otra población cualitativa con Px2 proporción de aciertos en
X2, luego:
p-p=P-P=P-P xxxxxx 212121 ˆˆ
1.2.2. Estimación por intervalos
La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el parámetro
tiene la probabilidad especificada de estar. Los estimados por intervalos se conocen como
intervalos de confianza y los límites inferior y superior como los límites de confianza.
En general el intervalo de confianza para el parámetro se expresa:
P( - k + k ) = 1 -  
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia16
Donde:
= Parámetro
= Estimador
k = Valor tabulado
= Desviación estándar del estimador
1 = Nivel de confianza
Los intervalos de confianza más usuales son:
(A) Intervalo de confianza para la media poblacional ( )
Para determinar el intervalo de confianza para la media poblacional se debe tomar en
cuenta lo siguiente:
- Cuando se conoce la varianza de la población y/o el tamaño de muestra n 30.
P( x - Z
n
x + Z
n
) = 1 -
2 2
( ) ( )1 1
- Cuando no se conoce la varianza de la población y el tamaño de muestra n < 30.
P( x - t
s
n
x + t
s
n
) = 1 -( n (
2
,n-1)1
2
1 1, )
(B) Intervalo de confianza para la diferencia de medias poblacionales
Se presentan los siguientes casos:
- Si
2
1 y
2
2 son conocidos
-1=]
n
+
n
Z+)x-x(-
n
+
n
Z-)x-xP[(
2222
2
2
2
1
1
)
2
1(2121
2
2
1
1
)1(21
- Si
2
1 y
2
2 no son conocidos
se presentan dos casos:
a. Si
2
1 es aproximadamente igual a 2
y entonces
2
1
2
2
2
-1=])
n
1
+
n
1
(st+)x-x(-)
n
1
+
n
1
(st-)x-xP[( 2
1)-n,
2
(
2
1)-n,
2
(
21
12121
21
121
2-n+n
s1)-n(+s1)-n(
=s:donde
22
2
21
2211
b. Cuando
2
1 es diferente a
2
2
-1=]
n
s
+
n
s
t+)x-x(-
n
s
+
n
s
t-)x-xP[(
22
1)-n
22
1)-n,
2
(
2
2
1
1
,
2
1(2121
2
2
1
1
121
Observación:
Sí n1+ n2 - 2 30, el valor tabulado es Z(1 - /2)
Sí n1 + n2 - 2 < 30, el valor tabulado es t(n1 + n2 – 2, 1 - /2)
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia17
(C) Intervalo de confianza para la proporción poblacional
Se presentan los siguientes casos:
- Cuando el tamaño de muestra es grande (n 30)
P(p - Z
pq
n
P p + Z
pq
n
= 1 -
2 2
( ) ( ) )1 1
- Cuando el tamaño de muestra es pequeño (n < 30)
P(p - t
pq
n
P p + t
pq
n
) = 1 -(
2
,n-1) (
2
,n-1)1 1
(D) Intervalo de confianza para la diferencia de proporciones poblacionales
Se pueden presentan los siguientes casos:
- Si, n1 y n2 son muestras grandes (n1 + n2 - 2 30)
-1=]
n
qp
+
n
qp
Z+)p-p(P-P
n
qp
+
n
qp
Z-)p-pP[(
22
2
22
1
11
)1(2121
2
22
1
11
)1(21
- Si, n1 y n2 son muestras pequeñas (n1 + n2 - 2 30)
-1=]
n
qp
+
n
qp
t+)p-p(P-P
n
qp
+
n
qp
t-)p-pP[( 1)-n,
2
(1)-n,
2
(
2
22
1
11
12121
2
22
1
11
1(11
Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80, n2 = 20 se
recomienda emplear:
n+n
pn+pn
=p:donde
)
n
1
+
n
1
)(p-(1p=s
yx
2
21
2211
esta proporción denota la proporción conjunta de las dos muestras.
Ejemplo 1.1
Se ensaya un test para determinar el cociente de inteligencia a 8 alumnos; los resultados fueron:
98, 108, 92, 111, 102, 95, 89, 115.
Determine: a) estimación puntual y b) estimación por intervalo (use el 90% de confianza) para el
promedio verdadero del cociente de inteligencia.
Solución
n = 8, x = 101.25, s = 9.38 -1 = 0.90 Luego 2
1 = 0.95
como n 30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895
a) Estimación puntual:
Por formula
ix
= x=
n
25.101x
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia18
b) Estimación por intervalo:
Por formula
-1=)
n
s
t+x
n
s
t-xP( )(( 95.0,7)95.0,.7
Reemplazando:
-1=)-P(
8
38.9
895.125.101
8
38.9
895.125.101
Se obtiene
%9053.10797.94 =]P[
Luego el promedio verdadero del cociente de inteligencia de los alumnos se encuentra entre 94.97
y 107.53, con un nivel de confianza de 90%.
Ejemplo 1.2
Una muestra aleatoria de 100 hogares de una ciudad indica que el promedio de los ingresos
mensuales es de $ 500. Encuentre un intervalo de confianza del 95 % para la media poblacional
de los ingresos de todos los hogares de esa ciudad. Suponga σ = $ 110.
Solución
n = 100, x = 500 σ = $ 110 -1 = 0.95 luego 2
1 = 0.975
como n = 30, entonces Z(1 - /2) = Z(0.95) = 1.96
Por formula
(1 ) (1 )
2 2
)P( x - x+ =1-Z Z
n n
Reemplazando
110 110
500 1.96 500 1.96 ) 95%
100 100
P( - + =
Se obtiene
478.44 521.56 95%P[ ] =
Esto, es se tiene una confianza del 95% que el promedio del ingreso familiar poblacional de esa
ciudad, está en el intervalo $ 478.44 y $ 521.56.
Ejemplo 1.3
Como parte de un experimento, una gran empresa manufacturera encontró que el tiempo
promedio requerido para que 16 empleados escogidos al azar completaran una tarea determinada
era de 26 minutos, la desviación estándar 5 minutos. Construir el intervalo de confianza del 95%
para la media poblacional.
Solución
n = 16 x = 26 s = 5 1- = 0.95 Luego 2
1 = 0.975
como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131
Por formula
-1=)
n
s
t+x
n
s
t-xP( )(( 975.0,15)975.0,15
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia19
Reemplazando
%95)
16
5
131.226
16
5
131.226 =+-P(
Se obtiene
%9566.2834.23 =]P[
Ejemplo 1.4
Se ha hecho un estudio de las diferencias entre estudiantes universitarios del primer año que
estuvieron en academias y estudiantes que no estuvieron. Para ello se tomó una muestra aleatoria
de 50 estudiantes universitarios que habían asistido a academias y una muestra aleatoria simple
independiente de 60 estudiantes que no lo habían hecho. Al final del primer semestre se
administró a los estudiantes una prueba de rendimiento en matemática. Los que habían asistido a
academias, obtuvieron un puntaje promedio de 14,5, con una varianza de 4,8; y el puntaje
promedio para el grupo que no había asistido a la academia, fue de 13,75 con una varianza de
6,4. Construya un intervalo de confianza para la diferencia entre las dos medias poblacionales
(use 99% de confianza).
Solución
ASISTIERON ACADEMIA
NO ASISTIERON
ACADEMIA
n1 = 50
1x =14.5
s
2
1 = 4.8
n2 = 60
2x =13.75
s
2
2 = 6.4
1 - = 0.99 luego 1- 2
= 0.995
Como n1 + n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Por formula
-1=]
n
s
+
n
s
z+)x-x(-
n
s
+
n
s
z-)x-xP[(
22
)
22
)
2
(
2
2
1
1
2
1(2121
2
2
1
1
121
Reemplazando
%99
60
4.6
50
8.4
58.275.135.14
60
4.6
50
8.4
58.275.135.14 21 =]++)-(-+-)-P[(
Se obtiene
%9991.141.0 21 =]-P[
Ejemplo 1.5
Los estudiantes que se matricularon en un curso de investigación educativa fueron distribuidos al
azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades para enriquecer el curso.
El grupo B estudió mediante el método tradicional de conferencias. Los puntajes obtenidos en una
prueba de rendimiento, hecha al terminar el curso dieron los siguientes resultados:
Grupo n x s
A (1) 10 80 8
B (2) 12 72 10
Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios
poblacionales.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia20
Solución
1 - = 0.90 luego 1 - 2
= 0.95
Como n1 + n2 –2 < 30 entonces t (n1 + n2 –2,1– /2) = t(20, 0.95) = 1.725
Por formula
-1=]
n
s
+
n
s
t+)x-x(-
n
s
+
n
s
t-)x-xP[(
22
n(n
22
n(n
2
2
1
1
)2/1,22121
2
2
1
1
)2/1,221 2121
Reemplazando
%90
12
100
10
64
725.17280
12
100
10
64
725.17280 21 =]++)-(-+-)-P[(
Se obtiene
%9062.1438.1 21 =]-P[
Ejemplo 1.6
Una encuesta para verificar las actitudes de los empleados ante el boletín mensual, se les pidió a
500 empleados de una gran organización nacional que indicaran con que frecuencia leían el
boletín de noticias. De los 500, 375 informaron que leían todas las ediciones. Construir el intervalo
de confianza del 95% para la proporción real de los que opinan afirmativamente.
Solución:
n = 500 p =
500
375
= 0.75 q =0.25 1- = 0.95 luego 2
1 = 0.975
Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96
Por formula
-1=]
n
pq
Z+pP
n
pq
Z-P[p )2/1()2/1(
Reemplazando
%95
500
)25.0(75.0
96.175.0
500
)25.0(75.0
96.175.0 =]+P-P[
Se obtiene
%9579.071.0 =]PP[
Ejemplo 1.7
En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto programa de
televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado. Determinar los límites
de confianza del 99% para la diferencia de proporciones de todos los adultos y jóvenes que vieron
con agrado el programa.
Solución
ADULTOS JÓVENES
n1 = 400
a1 = 100
p1
= 25.0
1
1
n
a
q1
= 1-p1 = 0.75
n2 = 60 0
a2 = 300
p2
= 5.0
2
2
n
a
q2
= 1 – p2 = 0.5
1 - = 0.99 Luego 1- 2
= 0.995
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia21
Como n1+ n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza mancomunada
así:
n+n
pn+pn
=p
21
2211
Reemplazando
4.0
1000
400
600400
300100
+
+
=p
)
n
1
+
n
1
)(p-(1p=s
21
)
1
+
1
)((=s 032.0
600400
6.04.0
Por formula
-1=])
n
1
+
n
1
)(p-(1pZ+)p-p(P-P)
n
1
+
n
1
)(p-(1pZ-)p-pP[(
21
2//1(2121
21
2//1(21
Reemplazando
%99)032.0(58.25.025.0)032.0(58.25.025.0 =]+)(P-P-)P[( JA
Se obtiene
%9917.033.0 21 =]P-PP[
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia22
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) El método de estimación de un parámetro puede ser: puntual o por intervalos.
( ) La Inferencia estadística comprende dos tipos principales de técnicas.
( ) La estimación por intervalos contiene el cálculo de una sola cifra numérica.
( ) Se obtiene conclusiones de la población a través de la información de la muestra.
( ) En la estimación puntual incluye un intervalo en el que están comprendidos los
valores del parámetro.
2. De una población se escogieron al azar 10 personas y se les tomo la estatura. Los resultados
en cm fueron: 160, 170, 170, 150, 160, 180, 160, 170, 130, 150.
a) Estime la media y la varianza.
3. En una universidad se desea conocer la opinión de los estudiantes acerca de ciertas medidas
que han tomado las directivas. De 120 estudiantes consultados, 90 estuvieron a favor.
a) Estime la proporción de estudiantes que están a favor de las medidas
4. Para estimar la media del consumo (dólares) en el restaurante de una universidad, se tomó
una muestra de 49 profesores. Suponga una desviación estándar poblacional de 5 dólares. Si
la media en la muestra fue de 24.80 dólares mensuales.
a) ¿Cuál fue el intervalo de confianza de 95% para el consumo medio poblacional?
5. Los siguientes números representan el tiempo(en minutos) que tardaron 15 operarios en
familiarizarse con el manejo de una nueva máquina adquirida por la empresa: 3.4, 2.8, 4.4,
2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8.
a) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo
promedio.
b) El instructor considera que el tiempo promedio requerido por los trabajadores es mayor
que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado?
6. Una marca de lavadoras quiere saber la proporción de amas de casa que preferirían usar su
marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usarían.
a) Calcula un intervalo de confianza del 95% para la verdadera proporción de amas de casa
que preferirían dicha lavadora.
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia23
Unidad 2
PRUEBA DE HIPOTESIS DE PARAMETRO POBLACIONALES
Nº de tutorías: Dos
Tutoría Nº 1: PRUEBA DE HIPÓTESIS: CONCEPTOS BÁSICOS; PRUEBA DE
HIPÓTESIS PARA UNA MEDIA; UNA VARIANZA Y DOS VARIANZA
POBLACIONAL
Tutoría Nº 2: PRUEBA DE HIPÓTESIS: PROPORCIÓN POBLACIONAL; DOS
MEDIAS POBLACIONALES; DOS PROPORCIONES POBLACIONALES.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia24
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia25
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce el concepto de prueba de hipótesis para los parámetros.
1.2. Procedimentales
Comprobar las pruebas de hipótesis en las investigaciones científicas.
1.3. Actitudinales
Resuelve situaciones en donde el interés es probar hipótesis de los
parámetros de una población en estudio.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente:
Introducción, Concepto prueba de hipótesis, hipótesis nula, hipótesis
alternativa, errores de prueba y nivel de significación, pruebas
bilaterales y unilaterales, prueba de hipótesis referida a la media
poblacional, prueba de hipótesis sobre la varianza poblacional, prueba
de hipótesis referida a dos variancias poblacionales, prueba de
hipótesis referida a la proporción poblacional, prueba de hipótesis
referida a la diferencia entre dos medias poblacionales, prueba de
hipótesis referida a la diferencia entre dos proporciones poblacionales
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos
prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos
fuertes y debilidades.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia26
Tutoría Nº
Prueba de hipótesis: conceptos
básicos; prueba de hipótesis para
una media; una varianza y dos
varianza poblacional
2.1. INTRODUCCIÓN
El objetivo es dar algunos métodos que se usan para tomar decisiones sobre poblaciones, a partir
de los resultados de una muestra aleatoria escogida de esa población. Para llegar a tomar
decisiones estadísticas se debe partir de afirmaciones o conjeturas con respecto a la población en
el que estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura
hecha sobre una población o sobre sus parámetros deberá ser sometida a comprobación
experimental con el propósito de saber si los resultados de una muestra aleatoria extraída de esa
población, contradicen o no tal conjetura.
A continuación definiremos algunos conceptos básicos para la prueba de hipótesis.
2.2. HIPÓTESIS
Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede hacerse
la hipótesis de que cierto método de enseñanza mejora el rendimiento de los alumnos. Hipótesis
establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación.
Por esta razón se le denomina hipótesis de investigación.
Generalmente hay que volver a plantear las hipótesis de investigación convenientemente de tal
forma que se puedan comprobar mediante los métodos estadísticos, así planteadas las hipótesis
reciben el nombre de hipótesis estadística.
2.3. HIPÓTESIS ESTADÍSTICAS
Una hipótesis estadística es un enunciado o proposición respecto a uno o más parámetros de la
población. A fin de probar una proposición, es preciso formular una hipótesis denominada nula
juntamente con otra denominada hipótesis alternativa.
2.3.1. Hipótesis nula (Ho)
Son aquellas que están referidas a algún parámetro de la población o de las poblaciones de
estudio. Estas son llamadas hipótesis científicas.
2.3.2. Hipótesis alternativa (Ha)
Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la que sirve
para contrastarla.
2.4. ERRORES DE PRUEBA Y NIVEL DE SIGNIFICACIÓN
Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad no nula de
que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal caso estaremos
cometiendo el denominado ERROR DE TIPO I.
De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la decisión
equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE TIPO II. Obviamente,
si Ho es cierta y no lo rechazamos o si es falsa y rechazamos, estaremos decidiendo bien.
2
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia27
Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha
probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos
corresponde al NIVEL DE SIGNIFICACIÓN.
P(ERROR TIPO I) =
Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o falsa.
DECISIÓN
SOBRE Ho
NATURALEZA DE Ho
Cierta Falsa
No rechazar
Rechazar
Decisión
Correcta
Error tipo I
(Probabilidad )
Error tipo II
(probabilidad )
Decisión
correcta
Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es posible
minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas de tal modo que
al disminuir una de ellas la otra aumenta. Así si queremos minimizar inmediatamente aumenta la
probabilidad de y viceversa. Generalmente el investigador fija apriori el error que está
dispuesto a tolerar, es decir la probabilidad máxima de cometer el error de tipo I.
La decisión de una prueba estadística está asociada al nivel de significación:
a) Si P < 0.05 ( = 0.05)
se dice que existe significación en la prueba
b) Si P < 0.01 ( = 0.01)
se dice que existe alta significación en la prueba
Pruebas bilaterales y unilaterales
Cuando tenemos hipótesis alternativa de la forma:
Ho : = 0 Ho : P = Po
Ha : 0 Ha : P Po
Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser mayor,
significativamente o acaso menor, significativamente. En tales casos el nivel de significación
queda partido en /2 en cada lado de la distribución del estadístico o función de prueba.
Tendremos entonces una prueba bilateral o no direccionada (dos puntos críticos)
De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también
estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales o direccionada (un
punto crítico)
Ho : = 0
Ha : 0 1
2
1
2
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia28
Ho : = 0
Ha : 0
A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama REGIÓN
DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN.
Una prueba de contrastación de hipótesis estadística se conduce básicamente según el siguiente
procedimiento.
1. Plantear las hipótesis
- Hipótesis nula (Ho)
- Hipótesis alternativa (Ha)
2. Establecer el nivel de significación de prueba ( )
3. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha función de
prueba.
4. Efectuar el reemplazo numérico en la función de prueba con la información muestral.
5. Determinar las regiones de aceptación o rechazo en la distribución de la función de prueba,
según se trate de pruebas bilaterales o unilaterales.
6. Tomar una decisión sobre Ho, según la siguiente regla:
a. Rechazar Ho si el valor de la función de prueba cae en la región de rechazo.
En tal caso se concluirá que Ho se rechaza en favor de Ha con una significación
estadística.
b. No rechazar Ho si el valor de la función de prueba cae en la región de aceptación.
En tal caso se concluirá de que la información muestral no brinda suficientes evidencias
como para sospechar de que Ho no sea cierta.
7. Establecer la conclusión, según la hipótesis que se acepte.
2.5. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL
Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las características de una
población normal.
Las hipótesis referentes a este parámetro pueden ser:
Ho: µ = µo
Ha: µ µo Prueba bilateral o de dos colas
Ho: µ = µo
Ha: µ µo Prueba unilateral de cola a la derecha
Ho: µ = µo
Ha: µ µo Prueba unilateral de cola a la izquierda
Dicha prueba se efectúa mediante la siguiente función de prueba:
a) Si la desviación estándar poblacional no es conocida o n<30
o
o
(n-1)t =
x -
s/ n
t
1
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia29
b) Si la desviación estándar poblacional es conocida ó n≥30
n
n/
-x
=z (0,1)
o
o
Ejemplo 2.1
El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida le
permite a su compañía vender más pólizas que las compañías "promedio". El promedio mensual
de ventas de todos los agentes de la compañía es de $300. A una muestra de agentes que han
recibido el programa de entrenamiento se le encuentra las siguientes ventas en dólares: 300, 270,
360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el supervisor de estos agentes, adoptaría
para los restantes el programa de entrenamiento propuesto por el señor Martínez. Emplee 5% de
significación.
Solución:
= 300, n = 10, x = 351.9, s = 48.64 -1 = 0.95
como n 30, entonces t(n – 1, 1– ) = t(9,0.95) = 1.833
1) Ho: 300
Ha: 300
2) = 0.05
3) f.p. 0
0
x
t
s
n
4) 0
351.9 300
3.37
48.64
10
t
5) t(9,0.95) = 1.833
6) Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis nula a
favor de la hipótesis alternativa
7) Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su
compañía vender más pólizas de seguro que la compañía promedio, por lo cual se adoptará para
el resto de los agentes el programa propuesto por el señor Martinez.
RA
1 - = 0,95
RR
= 0,05
tt = 1,833
t0 = 3,37
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia30
Ejemplo 2.2
Un investigador afirma que la ingestión diaria de nutrientes (proteína) recomendada en varones de
18-34 años moderadamente activos, tiene un promedio de 75 grs. para contrastar tal hipótesis se
tomó una muestra de 116 varones saludables obteniendo los siguientes resultados:
Proteína encontrada (gr) Número de
varones
71
73
75
77
79
8
20
60
18
10
Total 116
Pueden estos resultados, sostener la hipótesis formulada por el investigador. Use el 5% de
significación.
Solución:
= 75, n = 116, x = 75.03, s =1.95 = 0.05
como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96
1) Ho: = 75
Ha: 75
2) = 0.05
3) f.p. o
o
x -
=Z
s
n
4)
75.03 75
0.17
1.95
116
o =Z
5) 96.1)975,0(Z=Zt
6) Decisión: Como Zo RA aceptamos Ho
7) Conclusión: Se sostiene la hipótesis formulada para el investigador.
2.6. PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA POBLACIONAL
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población.
Las hipótesis referentes a este parámetro pueden ser:
RR
2 = 0,025
Zt = -1,96
RA
1 - = 0,95
RR
2 = 0,025
Zt =1,96
Z0 = 0,17
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia31
Ho: = o
Ha: o Prueba bilateral
Ho: = o
Ha: o Prueba unilateral
Ho: = o
Ha: o Prueba unilateral
Procedimiento:
Supóngase que se desea probar la hipótesis de que la varianza de una población normal
2
es
igual a un valor específico, por ejemplo,
2
o. Sea X1, X2, ..., Xn una muestra aleatoria de n
observaciones tomadas de esta población. Para probar
Ho:
2
=
2
o
Ha:
2 2
o
Se utiliza el estadístico de prueba
2
2
2 )1(
o
o
Sn
X
donde S
2
es la varianza muestral. Ahora si Ho:
2
=
2
o es verdadera, entonces el estadístico de
prueba X
2
o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se
calcula el valor de la estadística de prueba X
2
o, y la hipótesis Ho:
2
=
2
º debe rechazarse si:
2
2/1,1
2
2
2/,1
2
no
no
sio
donde X
2
n-1, /2 y X
2
n-1,1- /2 son los puntos que corresponden a los porcentajes 100 /2 inferior y
superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente.
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral:
Ho:
2
=
2
o
Ha:
2
>
2
o
Se rechaza si: X
2
o > X
2
n-1,1-
Para la otra hipótesis unilateral: Ho:
2
=
2
o
Ha:
2
<
2
o
Se rechaza si: X
2
o < X
2
n-1,
RA
1 –
2
)2/,1(nX
RR
/2 RR
/2
2
)2/1,1(nX
RA
1 –
RR
2
)1,1(nX
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia32
PROCEDIMIENTO PARA MUESTRAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la
función de prueba, que cuando el tamaño de muestra es mayor que 30 se utiliza la distribución
normal.
El estadístico de prueba es:
n
s
Z
o
o
o
2
El gráfico utilizado sería acampanado.
Ejemplo 2.3
Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20
botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas
de fluido)2
. Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2
,
entonces existe una proporción inaceptable de botellas que serán llenadas con una
cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el
fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de
prueba.
Solución:
2
= 0.01, n = 20, s
2
= 0.0153 = 0.05
como n < 30, entonces
2
)1,1(nX = 1.302
)95.0,19(X
Ho:
2
= 0.01
Ha:
2
> 0.01
= 0.05
f.p. 07.29
01.0
)0153.0)(19()1(
2
2
2
o
o
Sn
X
1.302
)95.0,19(X
RA
1 –
RR
2
),1(nX
RA
1 – = 0.95
RR
= 0.05
1.30
2
tX
07.29
2
oX
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia33
Decisión: Como 07.29
2
oX RA aceptamos Ho
Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza es igual a
0.01.
2.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES
La prueba de comparación de muestras, requiere que las variancias de las dos poblaciones
muestreadas sean iguales. En esta sección describiremos una prueba para la hipótesis nula
2
1 =
2
2 , que se aplica a muestras aleatorias independientes obtenidas de dos poblaciones normales;
debe utilizarse con mucho cuidado por ser muy sensible a las desviaciones de tal suposición.
Las hipótesis referentes a este parámetro pueden ser:
Ho: 1 = 2
Ha: 1 2 Prueba bilateral
Ho: 1 = 2
Ha: 1 2 Prueba unilateral
Ho: 1 = 2
Ha: 1 2 Prueba unilateral
Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones normales
que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza el siguiente
estadístico.
2
2
2
1
s
s
F
que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1 grados de
libertad.
Obs. F1 - (v1,v2) =
),(F
1
12 vv
Regiones críticas para probar
2
2
2
1
(Poblaciones normales)
Hipótesis alterna Estadístico de
prueba
Rechaza la hipótesis nula si:
2
1 <
2
2
2
2
2
1
s
s
F
F < F (n1 – 1, n2 – 1)
2
1 >
2
2
2
2
2
1
s
s
F
F > F1- (n1 – 1, n2 – 1)
2
1
2
2
2
2
m
M
s
s
F
F < F /2(nM – 1, nm – 1) ó
F > F1- /2(nM – 1, nm – 1)
Donde: s
2
M : la mayor de las dos variancias muestrales,
s
2
m : la más pequeña de las variancias.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia34
Para hipótesis unilateral: Ho:
2
2
2
1
Ha:
2
2
2
1
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho:
2
2
2
1
Ha:
2
2
2
1
Para la otra hipótesis unilateral: Ho:
2
2
2
1
Ha:
2
2
2
1
PROCEDIMIENTO PARA MUESTRAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la
función de prueba, que cuando el tamaño de muestra es mayor que 30, se utiliza la distribución
normal.
El estadístico de prueba es:
21
21
2
1
2
1
nn
s
ss
Z
p
o
RA
1 –
)1,1(2/ mnMnF
RR
/2 RR
/2
)1,1(2/1 mnMnF
RA
1 –
RR
)12,11(1 nnF
RA
1 –
RR
)12,11(1 nnF
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia35
2
)1()1(
:
21
2
22
2
112
nn
snsn
s
donde
p
Ejemplo 2.4
Se requiere determinar si existe menos variabilidad en el plateado realizado por la compañía 1 que
el efectuado por la compañía 2. Si las muestras aleatorias independientes de tamaño 12 del
trabajo desempeñado por las compañías producen s1=0,035 mil y s2=0,062 mil, pruébese la
hipótesis nula de que
2
1 =
2
2 contra la hipótesis alterna de que
2
1 <
2
2 con un nivel de
significancia de 0,05.
Solución:
n1 = n2 = 12, s1 = 0.035, s2 = 0.062, = 0.05
como n1 + n2 < 30, entonces 355.0)11,11()1,1( 05,021 FnnF=Ft
Ho:
2
2
2
1
Ha:
2
2
2
1
= 0.05
f.p. 319.0
)062.0(
)035.0(
2
2
2
2
2
1
s
s
F
Decisión: Como 0F RA se acepta Ho
Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía 2. Usando
5% de significación de prueba.
RA
1 – = 0.95
RR
= 0.05
355.0tF
319.00F
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia36
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) El rechazo de Ho cuando es verdadera se llama error de tipo I
( ) Si la función de prueba cae en la región crítica entonces aceptamos la Ho
( ) Ha se formula con el propósito de rechazarla, es la que se va a someter a prueba.
( ) Es una prueba bilateral cuando la hipótesis se orienta a un solo lado.
( ) No rechazar la Ho si el valor de la función de prueba cae en la región de aceptación.
2. Un estudio de 29 familias de una zona residencial de la ciudad de Lima, revela que el ingreso
medio por familia durante el año 1999 fue de $ 508 con una desviación estándar de $ 16.
Probar la hipótesis de que el verdadero ingreso medio por familia en Lima durante 1999 fue de
$ 500 frente a la alternativa de que no fue de $ 500. Utilizar un nivel de significancia del 5%.
3. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las ventas de la semana
de un determinado producto de consumo popular tiene una desviación estándar $6s . Se
supone que las ventas del producto tienen una distribución normal. Al nivel de significancia del
5%, ¿se podría inferir que la varianza de la población es menor que $40?
4. Los pesos netos (en gramos) de las latas de conserva de una muestra, fueron los siguientes:
121; 119; 124; 123; 119; 121; 124.
¿Se puede concluir que el peso neto poblacional medio es mayor que 123.5? Utilice un nivel
de significancia del 1%.
5. Un determinado proceso de empaquetar un producto está controlado, si el peso medio del
producto empaquetado es 400 gramos. Si en una muestra aleatoria de 100 paquetes del
producto se ha encontrado que el peso medio es de 395 gramos. ¿Se podría concluir que el
proceso está fuera de control al nivel de significación 5%?. Suponga que el peso de los
productos empaquetados se distribuye normalmente con desviación estándar de 20 gramos.
6. En un proceso de fabricación, se plantea la hipótesis que la desviación estándar de las
longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos elegidos al
azar del proceso de producción se han encontrado las siguientes longitudes en milímetros:
71, 66, 64, 72, 69, 67, 70, 68, 65, 69. Con estos datos se justifica la suposición
que la desviación estándar verdadera es 2.0 mm? Use el nivel de significación α=0.05, y
suponga que la distribución de las longitudes es normal.
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia37
Tutoría Nº
Prueba de hipótesis: proporción
poblacional; dos medias
poblacionales; dos proporciones
poblacionales
3.1. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL
La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una
determinada característica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: P = Po
Ha: P Po Prueba bilateral
Ho: P = Po
Ha: P Po Prueba unilateral
Ho: P = Po
Ha: P Po Prueba unilateral
La función de prueba para valores de n 30 es:
o
o
o o
(0,1)z =
P - p
p (1- p ) / n
n
La función de prueba para valores de n 30 es:
o
o
o o
(n-1)t =
P - p
p (1- p ) / n
t
Ejemplo 3.1
El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a
favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a
favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde?
Solución:
P = 0.60, n = 120, m = 75, 625.0
120
75
p , = 0.05
como n > 30, entonces 645.1)95,0()1( ZZ=Zt
Ho: 60.0P
Ha: 60.0P
= 0.05
f.p. 56.0
120
)4.0(6.0
6.0625.0
0
)/nP-(1P
P-p
=Z
oo
o
3
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia38
Decisión: Como Zo RA aceptamos Ho
Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión del
alcalde. Usando un 5% de significación de prueba.
Ejemplo 3.2
Se tomó una muestra aleatoria de 400 escolares, de los cuales 120 tuvieron signos de
desnutrición. Verifique la hipótesis de que el porcentaje de desnutridos no excede a 25% en la
cobertura de estudio (Use 5% como nivel de significación).
Solución
P = 0.25, n = 400, m = 120, 30.0
400
120
p , = 0.05
como n > 30, entonces 645.1)05,0()( ZZ=Zt
Ho: 25.0P
Ha: 25.0P
= 0.05
f.p. 31.2
400
)75.0(25.0
25.030.0
Zo
Decisión: Como Zo RA se acepta Ho
Conclusión: La proporción de desnutridos no excede al 25% en la cobertura de estudio. En un 5%
de significación de prueba.
3.2 PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES
Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis natural es
que ambas tienen igual promedio, o en otras palabras que la diferencia de ambos promedios es
nula o difieren en alguna cantidad específica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: µ1 = µ2
Ha: µ1 µ2 Prueba bilateral
Ho: µ1 = µ2
Ha: µ1 µ2 Prueba unilateral
RR
= 0,05
Zt = -1,645
RA
1 - = 0,95
Z0 = 2,31
RA
1 - = 0,95
RR
= 0,05
Zt = 1,645
Z0 = 0,56
645.1)95,0(Z=Zt
645.1)95,0()1( ZZ=Zt
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia39
Ho: µ1 = µ2
Ha: µ1 µ2 Prueba unilateral
Pueden presentarse varias situaciones dependiendo de como son sus varianzas:
1. Con varianzas conocidas:
La función de prueba es:
n
n
+
n
)-(-)x-x(
=z (0,1)
22
o
2
2
1
1
2121
2. Con varianzas desconocidas y diferentes:
La función de prueba es:
t
n
s
+
n
s
)-(-)x-x(
=t 2)-n+n(
22
o 21
2
2
1
1
2122
Cuando n1 + n2 2 30 entonces esta función de prueba sigue una distribución normal estándar.
3. Con varianzas desconocidas y aproximadamente iguales:
La función de prueba es:
t
n
1
+
n
1
s
)-(-)x-x(
=t 2)-n+n(
2
o 21
21
2121
Aquí s
2
es la varianza mancomunada
2-n+n
s1)-(n+s1)-(n
=s
22
2
21
2211
Al igual que en el caso anterior, si n1 + n2 2 30 entonces la función de prueba sigue una
distribución normal estándar.
Observación: Antes de realizar la prueba de comparación de medias, es conveniente efectuar la
prueba de comparación de varianzas para determinar si los datos de ambas poblaciones tienen
varianzas aproximadamente iguales o diferentes.
Ejemplo 3.3
Una compañía desea comparar las expectativas salariales anuales de su personal de ventas
femenino y masculino, según un nuevo plan de compensaciones venta-más-comisión. Se pidió a
n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar, predijeron sus ingresos anuales
bajo el nuevo plan. Las medias y desviaciones muestrales eran:
1x = $ 31 083 2x = $ 29 745
1s = $ 2 312 2s = $ 2 569
¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del ingreso anual
esperado tanto entre los vendedores como las vendedoras? Haga la prueba con = 0,10.
Solución:
Ho: 21 5.5972552
21
2212
2-n+n
s1)-(n+s1)-(n
=s
22
2
Ha: 21
645.1)95,0(Z=Zt
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia40
= 0.10
f.p. 45.2
40
1
40
1
5.597255252
02974531083
11
21
2
2121
+
n
+
n
s
)-(-)x-x(
=Zo
Decisión: Como Zo RR no existe suficiente evidencia como para aceptar la hipótesis nula,
por consiguiente aceptamos la Ha.
Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia en el
promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de significación
de prueba.
3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS PROPORCIONES
POBLACIONALES
Cuando se desea comparar dos poblaciones cualitativas.
Las hipótesis referentes a este parámetro pueden ser:
Ho: P1 = P2
Ha: P1 P2 Prueba bilateral
Ho: P1 = P2
Ha: P1 P2 Prueba unilateral
Ho: P1 = P2
Ha: P1 P2 Prueba unilateral
La función de prueba es:
n
n
1
+
n
1
p-1p
)P-P(-)p-(p
=z (0,1)
21
2121
Aquí p es la proporción mancomunada:
n+n
pn+pn
=p
21
2211
Ejemplo 3.4
Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico
determinado (grupo A) y que ven regularmente lucha en TV. supera mucho a un segundo grupo de
hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos grupos
arrojaron los siguientes resultados.
tamaño de Número de hombres que ven
Grupo la muestra regularmente lucha en TV
A (1) n1 = 150 a1 = 98
B (2) n2 = 200 a2 = 80
RR
2 = 0,05
Zt = -1,645
RA
1 - = 0,90
RR
2 = 0,05
Zt =1,645
Z0 = 2,46
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia41
¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? use =
0,05
Solución:
Ho: 21 PP 51.0
350
8098
p
Ha: 21 PP 645.1)95.0(Z=Zt
40.0
200
80
65.0
150
98
2
2
2
1
1
1
n
a
p
n
a
p
= 0.05
f.p. 63.4
200
1
150
1
)49.0(51.0
0)4.065.0(
21
2121
0
+
n
1
+
n
1
p-1p
)P-P(-)p-(p
=Z
Decisión: Como Zo RR rechazamos Ho en favor Ha
Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del
sociólogo con un 5% de significación de prueba.
RA
1 - = 0,95
RR
2 = 0,05
Zt =1,645
Z0 = 4,63
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia42
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) La hipótesis Ho: P > Po es una prueba bilateral.
( ) En la prueba F los n1-1 y n2-1 son conocidos como los grados de libertad.
( ) Cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal.
( ) Cuando Fo pertenece a la Región de aceptación entonces se rechaza Ho.
( ) La hipótesis Ho: P > Po es una prueba unilateral a la derecha.
2. El gerente de una empresa insiste en que a lo más del 33% de los clientes de la empresa esta
de acuerdo con el cambio de su producto. De 80 clientes tomados al azar, 29 están de
acuerdo con el cambio del producto. Al nivel de significancia de 5%, ¿tiene razón el gerente?
3. Ejemplo: Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada
población reveló que 120 hombres y 120 mujeres estaban a favor de cierto candidato. ¿Se
puede concluir a un nivel de significación del 5% que la proporción de hombres a favor del
candidato es mayor que la proporción de mujeres?
4. Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen desviaciones
estándar respectivas de 120 horas y 90 horas. Para comparar el promedio de vida útil de estos
artículos se extrae una muestra aleatoria de 60 artículos de cada fabricante encontrándose la
duración media de 1.230 horas para la marca A y de 1.190 horas para la marca B. ¿Se puede
concluir a un nivel de significación del 5% que los artículos de marca A tienen mayor duración
media que los artículos de marca B?
5. Se controla la calidad de una muestra aleatoria de 40 piezas producidas por un fabricante. Si
se hallaron 4 piezas defectuosas, ¿se debería inferir que el porcentaje de todas las piezas
defectuosas es más del 5% al nivel de significación del 5%?
6. Un inversionista está por decidir entre dos provincias para abrir un centro comercial. Par esto
debe probar la hipótesis de que hay diferencia en el promedio de ingresos familiares de las
dos provincias. Si una muestra de 300 hogares de la provincia 1 da
_
1 $400x y 1 $90s y
otra muestra de 400 hogares de la provincia 2 da
_
2 $420x y 2 $120s . ¿se puede inferir
que las dos medias poblacionales son diferentes?, si es así, ¿en cual de las provincias
debería abrir la sucursal? Utilice =0.05. 2 $120s
_
2 $420x
_
1 $400x
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia43
Unidad 3
ANALISIS DE VARIANZA
Nº de tutoría: Uno
Tutoría Nº 4:
ANÁLISIS DE VARIANZA : ANÁLISIS DE VARIANZA DE UNA VÍA Y
DE DOS VÍAS.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia44
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia45
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce el modelo del análisis de varianza.
1.2. Procedimentales
Prueba las diferencias entre k-medias.
1.3. Actitudinales
Comparan las medias de k-grupos o poblaciones.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: Análisis
de varianza: conceptos básicos, Análisis de varianza de una vía
(concepto, modelo, prueba de hipótesis); Análisis de varianza de dos
vías (concepto, clases: sin interacción y con interacción, modelos)
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos
prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos
fuertes y debilidades.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia46
Tutoría Nº
Análisis de varianza: análisis de
varianza de una vía y de dos vías
4.1. ANÁLISIS DE VARIANZA
El análisis de varianza se emplea para probar las diferencias entre k medias. Una suposición
básica implícita en el análisis de varianza es que las diversas medias muestrales se obtienen de
las poblaciones distribuidas normalmente que tienen la misma varianza ². Sin embargo, se ha
descubierto que el procedimiento de pruebas no se ve afectado por las violaciones de la
suposición de normalidad cuando las poblaciones son unimodales y los tamaños de muestra son
aproximadamente iguales.
Todos los procedimientos de cálculo presentados son para efectos fijos, contrariamente a los
modelos de efectos aleatorios.
El concepto básico en el análisis de varianza fue desarrollado por R.A. Fisher y la distribución F se
ha denominado en honor suyo. El razonamiento conceptual es el siguiente:
(1) Se calcula la media para cada grupo de la muestra y después se determina el error estándar
de la media S_ con base sólo en las diversas medias muestrales.
(2) Dada la fórmula S_ = S/ n , tenemos que s = X
Sn y que X
Sns2
. Esta estimación
resultante de la varianza de la población se llama la media cuadrática entre los grupos
(MCE).
(3) Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo.
Luego se combinan estos valores de la varianza ponderándolos de acuerdo a n-1 para cada
muestra. La estimación resultante de la varianza de la población se llama media cuadrática
dentro de los grupos (MCD).
(4) Si la hipótesis nula 1 = 2 = 3 = ... = k es verdadera, entonces tenemos que las dos medias
cuadráticas obtenidas en (2) y (3) no están sesgadas y son estimadores independientes de
la misma varianza de la población, ². Si la hipótesis nula es falsa, entonces el valor
esperado de la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre
las medias de la población inflarán la MCE, mientras que no afectarán la MCD.
(5) Con base al numeral (4), se involucra una prueba de una cola y la fórmula general de la
prueba F en el análisis de la varianza es:
MCE
MCD
F
Si la relación F está en la región de rechazo para el nivel de significación especificado,
entonces se rechaza la hipótesis de que las diversas medias muestrales se obtuvieron de la
misma población.
Para simplificar este procedimiento con diseños en términos del modelo lineal que identifica
los componentes que influyen sobre la variable aleatoria y se presenta una tabla estándar de
análisis de varianza que muestra los cálculos necesarios de la media cuadrática para cada
tipo de diseño experimental.
4
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia47
4.2. ANÁLISIS DE VARIANZA DE UNA VÍA
El modelo del análisis de varianza de una vía se relaciona con la prueba de la diferencia entre k
medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos
grupos de tratamiento.
La ecuación lineal que representa el modelo del análisis de varianza de una vía es:
Xik = + k + ik
donde:
= media global de todos los k grupos de tratamiento
k = efecto del tratamiento en el grupo específico k, del cual se muestreo el valor
ik = error aleatorio relacionado con el proceso de muestreo.
La tabla siguiente es un resumen del análisis de varianza de una vía en la cual; MCD pasa a ser la
media cuadrática entre los A grupos de tratamiento (MCA) y (MCE) es llamada media cuadrática
del error, N asigna el tamaño total de la muestra para todos los grupos de tratamiento combinados,
antes que el tamaño de la población. Tk representa la suma (total) de los valores muestreados en
todos los grupos combinados.
La hipótesis nula y alternativa son:
Ho: k = 0 para todos los niveles de tratamiento
Ha: k 0 para todos los niveles de tratamiento
Si la hipótesis nula es verdadera, entonces tenemos que :
1 = 2 = 3 = ... = k .
Fuente de
variación
Suma de los
cuadrados, SC
Grados de
libertad, gl
Media
cuadrática MC
Relación F
Entre grupos
de tratamiento
A
N
T
n
T
SCA
k
k
22
k – 1
1k
SCA
MCA
MCE
MCA
F0
Error de
muestreo, E
SCASCTSCE n – k
kn
SCE
MCE
Total, T N
T
XSCT
2
2 N - 1
Ejemplo 4.1
Quince personas que se capacitan en un programa técnico son asignadas en forma aleatoria a
tres tipos diferentes de enfoques de instrucción. Los puntajes de las pruebas de rendimiento, al
concluir la especialización, se presentan en la tabla siguiente. Use el procedimiento de análisis de
varianza para probar la hipótesis nula de que las tres medias muestrales son iguales a un nivel de
significación del 5%.
Método de
Instrucción
Puntaje de la prueba
Tk
Total
A1
A2
A3
86
90
82
79
76
68
81
88
73
70
82
71
84
89
81
400
425
375
Total 1200
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia48
Solución:
Suma de cuadrados de tratamiento =
N
T
n
T
SCA
k
k
22
= 250
15
1200
5
375
5
425
5
400 2222
Suma de cuadrados del total =
N
T
XSCT
2
2
= 698
15
1200
718270...829086
2
222222
Suma de cuadrados del error = SCASCTSCE
= 698 – 250 = 448
Fuente de
variación
Suma de
cuadrados SC
grados de
libertad, gl
Media
cuadrática MC
relación, F
Entre grupos
de trat., A SCA = 250 2 MCA =125 Fo = 3.35
Error de
muestreo, E SCE = 448 12 MCE =37.33 Ft = 3.89
Total, T SCT = 698 14
Ft = F(1- , glA, glE) = F(0.95, 2, 12) = 3.89
Ho: 0321
Ha: 0lg iúna
= 0.05
f.p. Fo = 3.35
Decisión: Como RAF0 se acepta Ho
Conclusión: No hay efecto asociado a los niveles del método de instrucción por lo tanto las
diferencias de métodos no son significativo, con un 5% de significación de prueba.
Ejemplo 4.2
La tabla siguiente presenta el promedio de palabras mecanografiadas por minuto en diferentes
marcas de máquinas eléctricas, por individuos asignados aleatoriamente sin experiencia previa en
estas máquinas, después del mismo período de instrucción. Pruebe la hipótesis nula de que la
media de palabras por minuto lograda para las tres máquinas no es diferente, usando un nivel de
significación del 5%.
Marca de las
máquinas
Promedio de palabras por minuto
Tk
Total
A1
A2
A3
79
74
81
83
85
65
62
72
79
51
-
55
77
-
-
352
231
280
Total 863
RA
1 – = 0,95 RR
= 0,05
Ft = 3,89
F0 = 3,35
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia49
Solución
Suma de cuadrados de tratamiento =
N
T
n
T
SCA
k
k
22
= 72.103
12
863
4
280
3
231
5
352 2222
Suma de cuadrados del total =
N
T
XSCT
2
2
= 96.1376
12
863
557965...628379
2
222222
Suma de cuadrados del error = SCASCTSCE
= 1376.96 – 103.72 = 1273.20
Fuente de
variación
Suma de
cuadrados SC
Grados de
libertad, gl
Media
cuadrática MC
Relación,
F
Entre grupos
de trat., A
SCA = 103.72 2 MCA = 51.86 Fo = 0.37
Error de
muestreo, E
SCE = 1273.20 9 MCE = 141.47 Ft = 4.26
Total, T SCT = 1376.92 11
Ho: 0321
Ha: 0lg iúna
= 0.05
f.p. Fo = 0.37
Ft = 4.26
Decisión: Como RAF0 se acepta Ho
Conclusión: No existe diferencia significativa entre las 3 máquinas de escribir en términos de
velocidad de mecanografía, con un 5% de significación de prueba.
4.3. ANÁLISIS DE VARIANZA DE DOS VÍAS
El análisis de varianza de dos vías se basa en dos conjuntos de clasificaciones o tratamientos. Por
ejemplo, al analizar el nivel de rendimiento de un programa de capacitación, podríamos considerar
ambos efectos, el del método de instrucción y el del rendimiento escolar anterior. Asimismo,
podríamos investigar el kilometraje de gasolina según la categoría de peso del automóvil y el
grado de la gasolina. En las tablas de datos, los tratamientos identificados en los encabezamientos
de la columna se llaman típicamente tratamientos A; aquellos en los encabezamientos de fila se
denominan tratamientos B.
La interacción en un experimento de dos factores significa que los dos tratamientos no son
independientes y que el efecto particular de los niveles de tratamiento en un factor difiere según
los niveles del otro factor. Por ejemplo, al estudiar el kilometraje de un automóvil, una gasolina de
octanaje más alto puede mejorar el kilometraje para ciertos tipos de autos pero no p ara otros.
Además la efectividad de varios métodos de instrucción puede diferir según los niveles de
RA
1 – = 0,95 RR
= 0,05
Ft = 4,26
F0 = 0,37
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia50
capacidad de los estudiantes. Con el objeto de probar la interacción, en cada célula de la tabla de
datos de dos vías debe incluirse más de una observación o medición muestreada (reiteración).
4.3.1. Análisis de varianza de dos vías sin interacción (diseño de bloque aleatorizado)
El modelo de análisis de varianza de dos vías en el cual hay una sola observación por célula se
denomina a menudo diseño de bloque aleatorizado, debido a un tipo particular de uso para este
modelo. El objetivo de utilizar éste diseño no tiene propósito específico de probar un efecto de los
"bloques". Más bien, al ser capaz de asignar alguna variabilidad a los sujetos antes del
rendimiento, la MCE, puede reducirse y la prueba resultante del efecto de los tratamientos A ser
más sensible.
La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es:
Xjk = + j + k + jk
Donde:
= media global de cualquier tratamiento
j = efecto del tratamiento j o del bloque j en la dimensión B de clasificación.
k = efecto del tratamiento k en la dimensión A de clasificación.
ik = error aleatorio relacionado con el proceso de muestreo.
Las hipótesis correspondientes serían:
Ho : k = 0
Ha : k 0
La tabla de resumen para el análisis de varianza de dos vías sin interacción se da a continuación:
Fuente de
variación
Suma de los
cuadrados, SC
Grados
de
libertad,
gl
Media cuadrática
MC
Relación F
Entre grupos
de
tratamiento
A
N
T
n
T
SCA
k
k
22
K - 1
1K
SCA
MCA
MCE
MCA
F0
Entre grupos
de
tratamiento
B
N
T
T
k
SCB j
2
21 J - 1
1J
SCB
MCB
Error de
muestreo, E
SCBSCASCTSCE (J–1) (K–
1) )1()1( KJ
SCE
MCE
Total, T N
T
XSCT
2
2 N - 1
Ejemplo 4.3
Para los datos de la tabla siguiente suponga que en la realidad se utilizó un diseño de bloque
aleatorizado y que se parearon los participantes antes del experimento, asignando un participante
de cada grupo de aptitud (con base en los rendimientos anteriores del curso) a cada método de
instrucción. La tabla siguiente es una revisión de la tabla del ejemplo 1, en el sentido que los
valores presentados se han reorganizado para reflejar el diseño de bloque aleatorizado. Sin
embargo observe que en cada grupo de tratamiento A se incluyen los mismos valores, excepto
que se indican de acuerdo a los grupos de aptitud B y, por lo tanto, están dispuestos en un orden
diferente. Pruebe la hipótesis nula de que no existe diferencia en el desempeño promedio entre los
tres métodos de instrucción y los niveles de aptitud, utilizando un nivel de significación del 5%.
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia51
Nivel de
aptitud
Método de instrucción Tj
TotalA1 A2 A3
B1 86 90 82 258
B2 84 89 81 254
B3 81 88 73 242
B4 79 76 68 223
B5 70 82 71 223
Total Tk 400 425 375 1200
Solución:
Suma de cuadrados de tratamiento =
N
T
n
T
SCA
k
k
22
= 250
15
1200
5
375
5
425
5
400 2222
Suma de cuadrados de bloque =
N
T
T
k
SCB j
2
21
= 33.367
15
1200
3
223
3
223
3
242
3
254
3
258 222222
Suma de cuadrados del total =
N
T
XSCT
2
2
= 698
15
1200
718270...829086
2
222222
Suma de cuadrados del error = SCBSCASCTSCE
= 698 – 250 – 367.33 = 80.87
Fuente de
variación
Suma de
cuadrados SC
grados de
libertad, gl
Media
cuadrática
MC
relación, F
Entre grupos
de trat., A
SCA = 250 2 MCA = 125
Fo = 12.4
Ft = 4.46
Entre grupos
de bloque B
SCB = 367.33 4 MCB = 91.83
Error de
muestreo, E
SCE = 80.87 (2)(4) = 8 MCE = 10.98
Total, T SCT = 698 14
Ho: 0321
Ha: 0lg iúna
= 0.05
f.p. Fo = 12.4
Ft = 4.46
RA
1 – = 0,95 RR
= 0,05
Ft = 4,46
F0 = 12,4
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia52
Decisión:
Como RRF0 rechazamos Ho
Conclusión:
Existe diferencia significativa entre los porcentajes de rendimiento para los diferentes métodos de
instrucción, cuando se consideran el nivel de aptitud. Utilizando una prueba significativa.
4.3.2. Análisis de varianza de dos vías con interacción (N observaciones por célula)
Cuando se utiliza este diseño se pueden probar por el análisis de varianza tres hipótesis nulas
diferentes; que no hay efectos de columna (las medias de las columnas no son significativamente
diferentes) y que no hay efectos de fila (las medias de las filas no son significativamente
diferentes) y que no hay interacción entre los dos factores (los dos factores son independientes).
Un efecto de interacción significativo indica que el efecto de los tratamientos para un factor varía
según los niveles del otro factor. En tal caso, la existencia de efectos de columna y de fila puede
no tener mucho significado desde el punto de vista de la aplicación de los resultados de la
investigación.
La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es:
Xijk = + j + k + ijk + ijk
Donde:
= media global independiente de cualquier tratamiento
j = efecto del tratamiento j en la dimensión B.
k = efecto del tratamiento k en la dimensión A.
ijk = efecto de la interacción entre el tratamiento j (del
factor B) y el tratamiento k (del factor A)
ik = error aleatorio relacionado con el proceso de muestreo.
Las hipótesis correspondientes serían:
Ho : k = 0 Ho : j = 0 Ho : Ijk = 0
Ha : k 0 Ha : j 0 Ha : Ijk 0
La tabla de resumen para el análisis de varianza de dos vías con interacción se da a continuación:
Fuente de
variación
Suma de los
cuadrados, SC
Grados
de
libertad,
gl
Media cuadrática
MC
Relación F
Entre grupos
de
tratamiento
A
N
T
T
n
SCA k
2
21 K - 1
1K
SCA
MCA
MCE
MCA
F0
Entre grupos
de
tratamiento
B
N
T
T
kn
SCB j
2
21 J – 1
1J
SCB
MCB
MCE
MCB
F0
Interacción
(entre
grupos de
tratamiento
A y B) I
N
T
SCBSCA
X
n
SCI
2
21
(J–1) (K–
1)
)1()1( KJ
SCI
MCI
MCE
MCI
F0
Error de
muestreo, E SCI
SCBSCASCTSCE JK (n–1)
)1(nJK
SCE
MCE
Total, T N
T
XSCT
2
2 N - 1
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia53
Ejemplo 4.4
Nueve personas que se capacitan en cada una de cuatro áreas temáticas diferentes fueron
asignadas en forma aleatoria a tres métodos de instrucción distintos. Se asignaron tres
estudiantes a cada método de instrucción. Se refiere a la tabla siguiente, pruebe las diversas
hipótesis nulas que son de interés respecto a tal diseño, a un nivel de significación del 5%.
Área
temática
Método de instrucción Total Tj
A1 A2 A3
B1 70
79
72
83
89
78
81
86
79
717
221 250 246
B2 77
81
79
77
87
88
74
69
77
709
237 252 220
B3 82
78
80
94
83
79
72
79
75
722
240 256 226
B4 85
90
87
84
90
88
68
71
69
732
262 262 208
Total Tk 960 1020 900 T=2880
Solución:
Suma de cuadrados de tratamiento A =
N
T
T
nk
SCA k
2
21
= 600
36
2880
12
900
12
1020
12
960 2222
Suma de cuadrados de tratamiento B =
N
T
T
nj
SCB j
2
21
= 8.30
36
2880
9
732
9
722
9
709
9
717 22222
Suma de cuadrados de la interacción =
N
T
SCBSCA
X
n
SCI
2
21
= 9.533
36
2880
8.30600
3
208
3
262
3
262
...
3
246
3
250
3
221 2222222
Suma de cuadrados del total =
N
T
XSCT
2
2
= 0.1600
36
2880
698887...818370
2
222222
Suma de cuadrados del error = SCISCBSCASCTSCE
= 1600 – 600 – 30.8 – 533.9 = 435.3
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia54
Fuente de
variación
Suma de
cuadrados
SC
Grados de
libertad, gl
Media
cuadrática MC
relación, F
Entre grupos
de trat., A
(método)
SCA = 600.0 3-1 = 2 MCA = 300 Fo = 16.57
Entre grupos
de trat., B
(tema)
SCB = 30.8 4-1 = 3 MCB = 10.3 Fo = 0.57
Interacción
entre
método y
tema, I
SCI = 533.9 (2)(3) = 6 MCI = 18.1 Fo = 4.92
Error de
muestreo, E
SCE = 435.3
(4)(3)(2) =
24
MCE = 18.1
Total, T SCT =
1600.0
36-1=35
Ho: 321 AAA Ho: 321 BABAB Ho: 0jkI
Ha: 0lg iúna Ha: 0lg júna Ha: 0jkI
= 0.05
f.p.
Fo = 16.57 Fo = 0.57
Ft = F(2,24,0.95) = 3.4 Ft = F(3,24,0.95) = 3.0
Fo = 4.92
Ft = F(6,24,0.95) =2.5
Decisión:
1. Como RRF0 rechazamos Ha
2. Como RAF0 aceptamos Ho
3. Como RRF0 aceptamos Ha
Conclusión: Hay diferencia satisfactoria entre los porcentajes de los métodos de instrucción, no
hay diferencia significante entre las distintas áreas hay interacción importante entre los dos
factores:
La última conclusión indica que varía la efectividad de los tres métodos de instrucción para las
diferentes áreas temáticas.
RA
1 – = 0,95
RR
= 0,05
RA
1 – = 0,95
RR
= 0,05
RA
1 – = 0,95
RR
= 0,05
Ft = 3.4 Ft = 3.0
Ft = 2.5
Fo = 16.57 Fo = 0.57
Fo = 4.92
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia55
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) El análisis de varianza se emplea para probar las diferencias entre k medias.
( ) El análisis de varianza de dos vías se basa en dos conjuntos de tratamientos
( ) Al análisis de varianza de dos vías sin interacción se le conoce como diseños de bloque
aleatorizado.
( ) El modelos del análisis de varianza de dos vías es: Xik = + k + ik
( ) MCE es llamada media cuadrática del error
2. En 12 depósitos al por menor se establecieron 4 tipos de exhibiciones de publicidad, con tres
depósitos asignados en forma aleatoria a cada una de las exhibiciones con el propósito de
estudiar el impacto de la exhibición en el punto de venta. Refiriéndose a la tabla siguiente,
pruebe la hipótesis de que no existe diferencia entre las medias de los valores de venta para
los cuatro tipos de exhibiciones, usando un nivel de significancia del 5%.
Tipo
De Exhibición
VENTAS
1 2 3
E1
E2
E3
E4
40 44 43
53 54 59
48 38 46
48 61 47
3. Los siguientes son los números de hornos de microondas que venden cada uno de los
vendedores de las tres sucursales de una compañía distribuidora de artículos domésticos
SUCURSAL ALFA 21 11 17 28
SUCURSAL BETA 27 15 18 26 17 21
SUCURSAL GAMMA 24 17 31 12 15
Realice un ANVA para probar, con un nivel de significancia de 0.05, si la hipótesis nula de que en
promedio las ventas de las tres sucursales son las mismas.
4. Completar la siguiente tabla de análisis de varianza (ANVA)
FUENTE
VARIACION
SUMA DE
CUADRADO
S
GRADO DE
LIBERTAD
MEDIA
CUATRADTICA
F
Tratamiento 2
Error 9 10
Total 120
5. Un ejecutivo de marketing llevó a cabo un estudio para examinar el efecto comparativo de 3
técnicas diferentes de promoción en 4 zonas diferentes de ventas y obtuvo los resultados
mostrados en la tabla siguiente. Determinar las conclusiones a las que puede llegar usando
los resultados de la tabla ANVA y formule en forma clara las hipótesis de contraste.
FUENTE
VARIACION
SUMA DE
CUADRADOS
GRADO DE
LIBERTAD
MEDIA
CUADRATICA
F
Entre técnicas
promocionales
7.48
Entre zonas de
ventas
3
Error 3.90 6
Total 11.41 11
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia56
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia57
Unidad 4
TEORIA DE LA TOMA DE DECISIONES
Nº de tutoría: Uno
Tutoría Nº 5
Teoría de la toma de decisiones
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia58
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia59
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce los conceptos del análisis estadístico en la toma de
decisiones.
1.2. Procedimentales
Elaboran tabla, diagrama en base a las probabilidades para la toma de
decisiones.
1.3. Actitudinales
Realiza toma de decisiones basadas en un análisis estadístico en un
problema de investigación.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: La
estructura bayesiana comparada con la estadística clásica conceptos
fundamentales (conceptos generales), estructura de la tabla de
decisión; toma de decisiones basadas en probabilidades (criterios:
probabilidad máxima, esperanza del evento); toma de decisiones con
base sólo en las consecuencias económicas (criterios: maximin,
máximax, pena mínimax); toma de decisiones con base en
probabilidades y consecuencias económicas (criterios: del valor
esperado o criterio bayesiano, mínima pérdida de oportunidad o pena
esperada); análisis de árbol de decisión.
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos
prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD.
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos
fuertes y debilidades.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia60
Tutoría Nº
Teoría de la toma
de decisiones
5.1. LA ESTRUCTURA BAYESIANA COMPARADA CON LA ESTADÍSTICA CLÁSICA
La estadística clásica trata en lo fundamental dos problemas estrechamente relacionados:
1. El problema de la estimación de algunos parámetros de la población, como la media aritmética
de la población y la proporción poblacional p.
2. El problema de probar una hipótesis respecto a alguna característica o parámetro de la
población
Pero, ya sea que el problema consista en estimar algún parámetro de la población o probar (o
contrastar o verificar) una hipótesis respecto al valor de ese parámetro, el método que se usa para
resolver el problema es uno y el mismo; se selecciona una muestra aleatoria de la población y esta
información muestral se convierte en la base de todas las inferencias acerca de los parámetros de
la población. Para ejemplificar esto, supóngase que el problema inmediato es estimar el porcentaje
de estudiantes del quinto año de secundaria en un colegio. Si una muestra aleatoria de 100
estudiantes seleccionados de este colegio revela que hay 10 esudiantes del último año, entonces
se estimará el porcentaje de estudiantes del último año de todo el colegio como 10/100 ó 10%.
La información que se puede utilizar al hacer una inferencia sobre una característica de la
población, por lo general, se clasifica en dos clases: la información objetiva y la información
subjetiva. Por ejemplo, la información que se obtiene por medio de muestreos es información
objetiva. Por otra parte, la opinión personal del experto en un campo es información subjetiva. Al
estimar el porcentaje de estudiantes del último año del colegio como 10%, se ha adoptado el
método tradicional o clásico de la inferencia estadística, un método en el que la inferencia acerca
de la población se basa de una manera estricta en información muestral objetiva.
En contraste con el método estadístico clásico, en el que sólo se puede utilizar información
muestral objetiva, un enfoque alternativo de la estadística, llamado estadística de Bayes, puede
utilizarse toda la información disponible pertinente: subjetiva y objetiva. En la estadística de Bayes,
una inferencia sobre un parámetro de la población puede hacerse partiendo de información
subjetiva exclusivamente. Sin embargo, si posteriormente se cuenta con información muestral
objetiva, se combinan la información subjetiva y la objetiva, y las inferencias sobre el parámetro de
la población se basan en esta información combinada.
La distinción entre la estadística clásica y la de Bayes, puede presentarse desde una perspectiva
definida considerando el ejemplo siguiente: Una compañía manufacturera está considerando la
compra de una nueva máquina, denominada la máquina A. La decisión de si se compra o no la
máquina A se basará en el porcentaje de partes defectuosas que produzca la máquina. En base a
su experiencia pasada con otras máquinas semejantes, el ingeniero de control de calidad de la
compañía estima el porcentaje de partes defectuosas producidas por la máquina A según la
siguiente tabla:
PORCENTAJE DE PARTES
DEFECTUOSAS
PROBABILIDAD
0,05
0,06
0,07
0,30
0,50
0,20
Esto significa que el ingeniero de control de calidad no está absolutamente seguro del porcentaje
de partes defectuosas que produce la máquina A. Sin embargo, en base a cualquier conocimiento
5
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia61
o experiencia que posee, el ingeniero piensa personalmente que es de 0,30 la probabilidad de que
el porcentaje de partes defectuosas producidas por la máquina A sea 5% es de 0,50 la
probabilidad de que el porcentaje de partes defectuosas sea 6% y hay un riesgo de 0,20 en que el
porcentaje de partes defectuosas sea 7%.
Dos observaciones importantes pueden hacerse en esta fase de la discusión. Primera, la
información del ingeniero de control de calidad respecto a la máquina A es personal o subjetiva,
puesto que algún otro ingeniero bien podría dar una estimación del porcentaje de partes
defectuosas que produce la máquina A. Segunda, en contraste con la estadística de Bayes está
especialmente diseñada para hacer uso más constructivo de este tipo de información. De hecho,
usando la información subjetiva del ingeniero de control de calidad, la estadística de Bayes
permitirá a la compañía decidir si compra o no la máquina A.
Continuando el caso de la máquina A, supóngase además que en una serie de pruebas, una
muestra aleatoria de 100 partes producidas por la máquina A revela que hay 4 partes defectuosas.
Ahora bien, según la estadística, el porcentaje de partes defectuosas producidas por la máquina A
se estima como 4%. Sin embargo, usando la estadística de Bayes la información muestral se
combina con la información subjetiva del ingeniero de control de calidad, y una estimación del
porcentaje de partes defectuosas producidas por la máquina A se hace, partiendo de esta
combinación de información.
El uso de información subjetiva en la inferencia estadística es sólo una de las características de la
estadística bayesiana. En los últimos años, la estadística bayesiana se ha convertido en una teoría
integrada para la toma de decisiones, llamada la teoría de decisión bayesiana.
La teoría de decisión bayesiana trata el problema de la toma de decisiones bajo condiciones de
incertidumbre. Esta teoría le proporciona a quien toma una decisión un procedimiento racional y
sistemático que le permite elegir entre varios cursos de acción posible cuando las consecuencias
de cada una de estas acciones están sujetas a incertidumbre.
I. Estructura de tablas de decisión
Una tabla de decisión identifica la ganancia (o pérdida) ocasional asociada por todas las
combinaciones posibles de actos y sucesos de decisión, también indica la probabilidad de
ocurrencia para cada uno de los eventos mutuamente excluyentes.
TABLA 1
ESTRUCTURA GENERAL DE UNA TABLA DE DECISIÓN
EVENTO PROB.
ACTOS
A1 A2 A3 ... An
E1
E2
E3
...
Em
p1
p2
p3
...
pm
X11
X21
X31
...
Xm1
X12
X22
X32
...
Xm2
X13
X23
X33
...
Xm3
...
...
...
...
...
X1n
X2n
X3n
...
Xmn
Donde:
Actos: Son los cursos de acción alternativos, o estrategias, que están a disposición de la
persona que toma la decisión. Como resultado del análisis se elige uno de estos
actos como el mejor.
Eventos: Identifica las ocurrencias que están fuera del control de la persona que toma la
decisión y que determina el nivel de éxito de un acto dado.
Probabilidad: Deben estar disponibles, pueden basarse en actos objetivos o determinarse
subjetivamente con base en el criterio. Las sumas de las probabilidades siempre
es 1,00.
Las entradas en las células: Son valores condicionales o consecuencias económicas
condicionales. Frecuentemente se denominan pagos y son condicionales pues el
resultado económico depende del acto de decisión que se elige y del evento que
ocurre.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia62
II. Toma de decisiones basadas en probabilidades
Esto se efectúa haciendo uso de la primera y segunda columna de la tabla 1.
Criterios
1º Probabilidad máxima: Es aquel que se selecciona el acto del evento que presenta mayor
probabilidad.
2º Esperanza del evento: Es aquel que se selecciona el acto del evento considerando la
esperanza matemática del evento. E(e) = e p(e)
Obs. Representa una base incompleta para efectuar toma de decisión.
III. Toma de decisiones con base sólo en las consecuencias económicas
La tabla que se usa es similar a la tabla 1, excepto que por la ausencia de las probabilidades
de los eventos.
Criterios
1º Maximin: Esta estrategia de decisión es "altamente conservadora" pues la persona que
toma la decisión se preocupa de que "pueda suceder lo peor" respecto a cada acto.
Cálculo: Se determina el valor mínimo de cada columna. El mejor acto es aquel para el
cual el valor resultante es mayor.
2º Máximas: Es el estándar por el cual el mejor acto es el para el que el valor máximo es
mayor que el máximo de cualquier otro acto de decisión. Este criterio se opone
filosóficamente al criterio maximin, pues la persona que toma las decisiones está
orientada hacia "lo mejor que puede suceder" con respecto a cada acto.
Cálculo: Se determina el valor máximo de cada columna. El mejor acto es aquel para el
cual el valor resultante es mayor.
3º Pena Minimax (Pérdida de oportunidad condicional): Es la diferencia entre el resultado
económico del mejor acto dado que ha ocurrido en un evento particular y el resultado
económico de acto. El valor "mejor" o más deseado de la pena es "0".
Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del
mejor, en cada fila, luego el valor máximo de cada columna. El mejor acto es aquel para
el cual el valor resultante es menor.
IV. Toma de decisiones con base en probabilidades y consecuencias económicas
Estos métodos utilizan toda la información contenida en la tabla 1.
Criterios
1º Del valor esperado (VE) o Criterio Bayesiano: Es la norma por el cual el mejor acto es
aquel para el que el resultado económico esperado es el más alto como promedio a
largo plazo.
Cálculo: Se determina multiplicando el valor condicional para cada combinación
evento/acto por la probabilidad del evento y sumando estos resultados para cada acto
(columna). El mejor acto es aquel para el cual el valor resultante es mayor.
2º Minima pérdida esperada de oportunidad (PEO) o Pena esperada.- El acto con la mayor
ganancia esperada tendría la menor pena esperada.
Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del
mejor en cada fila, luego se multiplicando el valor condicional para cada combinación
evento/acto por la probabilidad del evento y sumando estos resultados para cada acto
(columna). El mejor acto es aquel para el cual el valor resultante es menor.
V. Análisis de árbol de decisión
Es el método que puede utilizarse para identificar el mejor acto inicial, como también los
mejores actos subsiguientes.
Proceso
1º Construir el árbol de decisión de izquierda a derecha, con sus puntos de decisión (puntos
secuenciales en los cuales tiene que hacerse la elección) y eventos causales (puntos
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia63
secuenciales en los cuales ocurrirá un evento probabilístico). Depende del análisis
apropiado, de la situación global de decisión.
2º Se colocan en el diagrama los valores de probabilidad asociados con los eventos
causales y las consecuencias económicas. Los valores esperados de los actos
alternativos en el punto inicial de decisión, los valores esperados se calculan
sistemáticamente de derecha a izquierda en el árbol de decisión. Este proceso se llama
"devolverse".
Ejemplo 5.1
Un contratista de calefacción y aire acondicionado debe comprometerse a comprar unidades de
aire acondicionado desde el 1ero de abril, para reventa e instalación durante la próxima temporada
de verano. Con base en la demanda del verano anterior, en las actuales condiciones económicas
y en los factores de competencia del mercado, calcula que hay una probabilidad de 0,10 de vender
sólo 5 unidades, una probabilidad de 0,30 de vender 10 unidades, una probabilidad de 0,40 de
vender 15 unidades y una probabilidad de 0,20 de vender 20 unidades. Los equipos de aire
acondicionado se pueden ordenar sólo en grupos de cinco, siendo el costo unitario de $1000 y el
precio al por menor de $1300 (más gastos de instalación). Todas las unidades que no se han
vendido al término de la temporada se devuelven al fabricante por un crédito neto de $800,
después de deducir los gastos de embarque. Determine los mejores actos de decisión desde el
punto de vista de los criterios.
a) basada sólo en probabilidades, (probabilidad máxima y esperanza del evento).
b) basada sólo en las consecuencias económicas, (maximin, maximax, pena minimax).
c) basada en probabilidades y consecuencias económicas, (criterio bayesiano y pena esperada
de oportunidad).
Solución:
(Tabla de ganancias)
E
Demanda
P (E)
ACTOS (Compra – Stock)
A1 = 5 A2 = 10 A3 = 15 A4 = 20
E1 = 5
E2 = 10
E3 = 15
E4 = 20
0.10
0.30
0.40
0.20
1500
1500
1500
1500
500
3000
3000
3000
(500)
2000
4500
4500
(1500)
1000
3500
6000
Valor esperado 13,3
Maximin 1500 500 (500) (1500)
Máxima x 1500 3000 4500 6000
C. Bayesiano 1500 2750 3250 2750
(Tabla de pérdida de oportunidad)
E
Demanda
P (E)
ACTOS (Cantidad de orden)
A1 = 5 A2 = 10 A3 = 15 A4 = 20
E1 = 5
E2 = 10
E3 = 15
E4 = 20
0.10
0.30
0.40
0.20
0
1500
3000
4500
1000
0
1500
3000
2000
1000
0
1500
3000
2000
1000
0
Pena Mimi max 4500 3000 2000 3000
Pena esperada de oportunidad 2550 1300 800 1300
a) i) Como la probabilidad máxima es 40%, entonces el mejor acto de decisión es ordenar la
compra de 15 unidades de aire acondicionado.
ii) Como el valor esperado = EP(E) = 13,3 y las ordenes se afectan en grupos de 5, luego el
mejor acto de decisión, es ordenar la compra de 15 unidades de aire acondicionado.
b) Maximinin: ordenar comprar 5 unidades de aire acondicionado
Maximimax: ordenar comprar 20 unidades de aire acondicionado
Pena mínimas: ordenar comprar 15 unidades de aire acondicionado
c) Criterio Bayesiano: ordenar comprar 15 unidades de aire acondicionado
Pena esperada de oportunidad: ordenar comprar 15 unidades de aire acondicionado
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia64
Ejemplo 5.2
a. A un fabricante se le presentó un proyecto para un producto nuevo, y debe decidir si
desarrollarlo o no. El costo del desarrollo de proyecto es S/. 200 000; la probabilidad de éxito
es 0,70. Si el desarrollo no tiene éxito se termina el proyecto. Si tiene éxito, el fabricante debe
entonces decidir si el nivel de producción ha de ser alto o bajo. Si la demanda es alta, el
aumento en la utilidad, dado un nivel elevado de producción, es de S/. 700 000; dado un nivel
bajo, es de S/. 150 000. Si la demanda es baja, el incremento en la utilidad, dado un nivel
elevado de producción es S/. 100 000; dado un nivel bajo es S/. 150 000.
Todos estos incrementos en utilidades son cifras brutas (es decir, antes de restar los S/. 200 000
del costo de desarrollar el producto). Se estima que la probabilidad de una demanda elevada es
0,40 y para la demanda baja es 0,60. Elabore el árbol de decisiones para esta situación.
La figura muestra el árbol de decisión de este problema:
: Puntos de decisión
: Eventos aleatorios
b. Con referencia a la figura 1, determine si el fabricante debe intentar el desarrollo de este
producto o no, determinando la ganancia esperada correspondiente a las acciones alternativas
“desarrollar” y “no desarrollar”.
En la figura 2 se repite el árbol de decisión presentado en la figura 1, pero ahora se incluyen las
ganancias esperadas correspondientes a cada una de las decisiones posibles del proceso
secuencial, y se eliminan las acciones no preferidas de cada decisión, cruzando con dos rayas la
rama correspondiente. Trabajando de derecha a izquierda, se determina la ganancia esperada de
la decisión “nivel alto de producción”, y que es de S/. 140 000, de la siguiente manera:
GE (nivel alto de fabricación) = (0,40) (500 000) +
(0,60) (-100 000)
= S/. 140 000
De manera análoga:
GE (nivel bajo de fabricación) = (0,40) (-50 000) +
(0,60) (-50 000)
= S/. 50 000
Figura 1. Diagrama del árbol de decisión
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia65
Al comparar las dos ganancias esperadas, la mejor decisión es “nivel alto de fabricación”; se
elimina la posibilidad de la otra acción. Pasando a la izquierda hacia el siguiente punto de decisión
(que es también el punto inicial de decisión en este caso), las ganancias esperadas para las dos
posibles decisiones son:
GE (desarrollar) = (0,70) (140 000) +
(0,30) (-200 000)
= S/. 38 000
GE (no desarrollar) = S/. 0
Al comprar las dos ganancias esperadas, la mejor acción en el punto inicial es “desarrollar”. Al
calcular la ganancia esperada de “desarrollar”, debe observarse que la probabilidad de 0,70 (para
“desarrollo con éxito”) se multiplica por S/. 140 000, y se ignora la rama adyacente de S/. –50 000,
debido a que corresponde a una decisión eliminada en la etapa previa de análisis.
Figura 2: Diagrama del árbol con reversión
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia66
AUTOEVALUACIÓN
1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:
( ) La pena mínimax se calcula en la tabla de perdida.
( ) El criterio que maximiza los pagos mínimos de todos los actos se llama máximas.
( ) En el criterio máximax, el mejor acto es aquel para el cual el valor resultante es mayor.
( ) Los eventos son los cursos de acción alternativos, que están a disposición de la
persona que toma la decisión.
( ) La teoria bayesiana trata el problema de la toma de decisiones bajo condiciones de
incertidumbre.
2. Supóngase que un fabricantes de equipos de oficina debe decidir si ampliar la capacidad de
su planta ahora o espera otro año. Sus consejeros le advierten que si hace ahora la
ampliación y las condiciones económicas siguen siendo favorable, se logrará una utilidad de $
369 000; si hace ahora la ampliación y existe alguna recesión económica, habrá un pérdida
(utilidad negativa) de $ 900 000; si espera otro año y las condiciones económicas siguen
siendo favorables, se logrará una utilidad de $ 180 000; y si espera otro año, y existe una
recesión económica, se logrará una pequeña utilidad de $ 18 000.
a) Construya una tabla de pagos.
b) Construya una tabla de pérdida
3. Un canillita debe ordenar los periódicos con un día de anticipación. El costo de los periódicos
es de $ 2 la docena y el precio de venta es de $ 4 la docena. Los periódicos no vendidos al
cabo del día deben devolverse. Si el canillita estima la demanda diaria de su clientela por
periódicos en la forma siguiente: Demanda diaria, en docenas: 12, 13, 14. Probabilidad de la
demanda 0.20, 0.30, 0.50.
a) Establecer la tabla de pago y de pérdida.
b) Determine los mejores actos de decisión desde el punto de vista de los criterios:
Probabilidad máxima, valor esperado, maximin, máximax, pena mínimax, criterio
bayesiano y pena esperada de oportunidad
4. Dada la siguiente tabla de resultados:
UTILIDADES
Suceso Probabilidad Acciones
A 1 A2 A3 A4
A
B
C
D
0.1
0.2
0.5
0.2
20 0 -30 -40
20 40 20 0
20 40 60 40
20 40 60 80
a) Determínese la acción óptima mediante la Probabilidad Máxima
b) Determínese la acción óptima utilizando el criterio Bayesiano y Pena Esperada de
Oportunidad
c) Determínese la acción óptima utilizando el criterio MÁXIMAX, MAXIMIN, MINIMAX
5. La junta directiva de un hospital privado debe decidir, sobre fases financieras, si autoriza
fondos a un nuevo centro de atención a pacientes cardiacos. La junta considera que si se
construye el nuevo centro y contratan a un cardiólogo de prestigio nacional, el centro percibirá
$ 7.2 millones. Si se construye el nuevo centro pero no pueden contratar un cardiólogo
eminente, habrá una pérdida de $ 1.25 millones. Si se remodela el antiguo centro de
cardiología y se contrata a un cardiólogo eminente, el centro captará $ 2 millones. Si se
remodela el centro y no contratan a un cardiólogo eminente, la institución sólo percibirá $ 0.5
millones.
a) Construya una tabla de pagos.
b) Trace un árbol de decisión.
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia67
Unidad 5
CONTRO DE CALIDAD
Nº de tutorías: Dos
Tutoría Nº 6: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA
MEDIA DEL PROCESO.
Tutoría Nº 7: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA
VARIACIÓN DEL PROCESO Y PARA LA PROPORCIÓN DE DEFECTUOSOS.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia68
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia69
A. Aspectos preliminares
1. Competencias
1.1. Conceptuales
Reconoce los conceptos de las técnicas muy útiles que se usan en la
industria para controlar y mejorar la calidad del producto.
1.2. Procedimentales
Elaboran diagramas de control para controlar y mejorar el producto de
un proceso de manufactura.
1.3. Actitudinales
Asegurar que las variables que miden la calidad de un producto queden
dentro de los intervalos que son aceptables para posibles clientes.
B. Desarrollo del contenido, sus procedimientos y modalidad
1. Contenido programático
El contenido programático de la unidad referida es el siguiente: control
de calidad, introducción, métodos de control de calidad: técnicas de
supervisión, técnicas de localización de problemas, técnicas de
selección, supervisión de la calidad mediante graficas o diagramas de
control, grafica de control para media del proceso: diagrama de x ;
gráfica de control para la variación del proceso: diagrama de r, gráfica
de control para la proporción de defectuosos: diagrama de p; gráfica
de control para el número de defectuosos por unidad: diagrama de c
2. Modalidad y procedimiento de desarrollo de la unidad
Durante la fase a distancia
a) Cada alumno lee la primera unidad del módulo.
b) Cada alumno desarrolla las prácticas dirigidas y los trabajos
prácticos.
c) Remite las prácticas y los trabajos a la página web de PROESAD.
Durante la fase presencial/tutorial
a) Exposición sobre los trabajos elaborados y remitidos.
b) Refuerzo del profesor con incidencia y corrección en los puntos
fuertes y debilidades.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia70
Tutoría Nº
Control de calidad: grafica de
control para la media del proceso
ESTUDIO DE UN CASO
El Caso del Aceite Perdido
Considérese un problema administrativo, en el que usted es el encargado de la operación de llenar
latas de aceite lubricante para motores. Los envases de un cuarto de galón, el tipo que se compra
en una estación de servicio local, se llenan con una máquina que tiene 28 boquillas (inyectores).
Cada boquilla descarga el aceite en una lata, y la máquina llena así los 28 envases, uno con cada
inyector.
El problema se presenta cuando los controladores de la compañía detectan una discrepancia
extraña. Aunque la cantidad de aceite que se recibe mensualmente para la operación de llenado
asciende a 10 000 000 de cuartos de galón, el número de latas de una cuarto que se llenan, es
siempre considerablemente menor. Si el número de latas llenadas de un mes dado es de 9 700
000, ¿qué pasó con los 300 000 cuartos de aceite perdido?
El problema que acabamos de describir es similar al problema encontrado por V. Filimon y sus
colegas quienes trabajan, en ese tiempo, para la Estándar Oil Company en Cleveland, Ohio (V.
Filimon, R. Maggass, D. Frazier y A. Flingel, “Some Applications of Quality Control Techniques in
Motor Oil Can Filing, Industrial Quality Control, Vol. 12, 1995”). Su operación consistió en usar tres
maquinas llenadoras cada una con 6 boquillas para latas de un cuarto, otra con 28 boquillas
también para un cuarto y una mas con 16 inyectores para latas de un galón.
La búsqueda del aceite perdido se concentro rápidamente en la maquina llenadora. ¿Se puede
ajustar una máquina para que una boquilla descargue exactamente un cuarto de aceite en cada
lata? La respuesta es negativa, porque la cantidad de aceite descargada para una sola boquilla
difiere ligeramente de la que descargue otra, debido a la variación en el flujo del aceite por la
citada boquilla. Así la cantidad x de aceite descargada en una lata, medida en volumen o en peso,
varia de una lata a otra y tiene una distribución de frecuencias relativas. Esta variación en el peso
de llenado, llevo a Filimon y a sus colegas, a sospechar que el aceite perdido salía de la planta en
las mismas latas.
La operación de llenar los envases, y sus problemas inherentes, es comparable a la mayoría de
las operaciones actuales en los negocios. Cada operación origina un producto que se considera
aceptable o inaceptable, dependiendo de una o más variables que miden la calidad del producto.
El producto de una operación de llenado de envases de aceite es una lata de aceite; una medida
de su calidad es la cantidad de aceite depositado en cada lata. El producto de una máquina que
origina lámparas eléctricas es una bombilla o un foco, y una medida de su calidad es la cantidad
de luz que emita. El producto de un hospital es el tratamiento médico y el cuidado para un solo
paciente. La calidad del cuidado de un paciente se mediría, sin duda, mediante un cierto número
de variables de calidad.
En esta unidad presentaremos algunas técnicas administrativas y estadísticas para supervisar,
mejorara y controlar la calidad del producto de una operación actual en los negocios.
6
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia71
6.1. INTRODUCCION
El objetivo de este capitulo es presentar algunas técnicas muy útiles que se usan en la industria
para controlar y mejorar la calidad de productos manufacturados así como para el mejoramiento
de la calidad de sistemas de administración.
Como lo indica el titulo, la metodología del control de calidad se estructuro para controlar y mejorar
el producto de un proceso de manufactura. Los perfiles o barras de acero deben tener una
resistencia a la tensión especifica; un jabón tiene que ser producido con un nivel bajo de
impurezas; una caja de cereales debe tener un contenido en peso específico, y los datos de
entrada financieros en una computadora para administración tienen que ser exactos y preciso, con
una alta probabilidad. Así, el objetivo de un programa de control de calidad es asegurar que las
variables que miden la calidad de un producto queden dentro de los intervalos que son aceptables
para posibles clientes.
6.2. MÉTODOS DE CONTROL DE CALIDAD
Los métodos de control de calidad se clasifican en tres categorías:
6.2.1. Técnicas de supervisión
Diseñadas para seguir o rastrear el nivel de las variables de calidad y para detectar cambios
indeseables en la calidad del producto;
6.2.2. Técnicas de localización de problemas
Ideadas para ayudar a ubicar las causas de cambios indeseables en la calidad del producto; y
6.2.3. Técnicas de selección
Diseñadas para eliminar productos defectuosos, o de mala calidad que entran al proceso como
materia prima y sirven para realizar el mismo trabajo, en el caso de los productos acabados antes
de enviarlos a un cliente.
Se dice a menudo que el control de calidad consta del 10% de Estadística y de 90% de ingeniería
y sentido común. Como se aprender, la mayoría de los métodos de control de calidad se basan en
los conceptos estadísticos elementales. El verdadero problema ocurre cuando se detecta uno de
los procesos de supervisión o monitoreo o de selección. Así los métodos de control de calidad
pueden decir cuando pero no porque ocurren los problemas. Para descubrir la causa de la baja
calidad en productos y corregir la situación, es necesario conocer el proceso y tener aptitudes y
habilidad para resolver problemas.
Esta unidad trata de dos de los tres tipos de métodos de control de calidad, los procedimientos
para controlar un proceso de producción actual y los métodos utilizados para eliminar materia
prima poco satisfactoria que entra al proceso o productos defectuosos que salen del proceso o
ambas cosas. La tercera categoría metodológica, los procedimientos estadísticos para localizar la
causa de un cambio que haga bajar la calidad del producto, consiste en todos los métodos
desarrollados en esta asignatura como en estadística general. Dos de los procedimientos de
mayor utilidad son el análisis de regresión y el análisis por tablas de contingencia que pueden
establecer con correlación entre una o más materias primas, o variables del proceso o del entorno,
y la calidad del producto.
6.3. SUPERVISION DE LA CALIDAD MEDIANTE GRAFICAS O DIAGRAMAS DE CONTROL
Las mediciones de una variable de calidad varían en el tiempo. Por ejemplo, las mediciones del
diámetro interior de un cojinete cuyo valor es pulgada, variarán ligeramente de una pieza a otra. El
diámetro del cojinete tiende a hacerse mas pequeño debido al desgaste del utensilio de corte del
proceso de maquinado. Una variación de este tipo se denomina definida por una causa
atribuible. Otra variación en la que ocurre pequeños cambios fortuitos que se deben a la gran
cantidad de variables desconocidas que afectan el diámetro: cambios en la materia prima,
condiciones ambientales, etc., se considera como una variación aleatoria.
Mg. María Vallejos Atalaya
PROESAD Programa de Educación Superior a Distancia72
Si la variación de una variable de calidad es únicamente el tipo aleatorio, se dice que el proceso
esta bajo control. El hecho de estar bajo control no indica que el producto origine productos 100%
aceptables. Los valores de la variable de la calidad pueden o no localizarse de manera fortuita,
dentro de los límites especificados por los clientes del fabricante.
La figura 1 (a) muestra una representación grafica o diagrama de los valores de diámetros de
cojinetes, según una medición por hora, en el caso de un proceso industrial que se encuentra bajo
control y que produce cojinetes que cumplen con las especificaciones de los clientes, por ejemplo,
de 0.980 a 1.020 pulgadas.
La figura 1 (b) muestra una gráfica similar para un proceso que se encuentra bajo control, pero
que produce muchos cojinetes con diámetros que no cumplen las especificaciones y que se
considerarían defectuosos.
La figura 1 (c) ilustra como seria una grafica si existiera una causa de variación atribuible.
Obsérvese que los diámetros señalados ya no parecen variar de modo aleatorio, sino que tienen
una manifiesta tendencia decreciente con respecto al tiempo.
FIGURA 1: Gráficas respecto al tiempo de los diámetros de cojinetes producidos.
1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 21
.980
1.000
1.020
Límite inferior de especificación
Límite superior de especificación
Tiempo (en horas)
(a) Proceso bajo control que cumple las
especificaciones
Diámetrodelcojinete
1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 21
.980
1.000
1.020
Límite inferior de especificación
Tiempo (en horas)
(b) Proceso bajo control que no cumple las
especificaciones
Diámetrodelcojinete
Límite superior de especificación
1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 21
.980
1.000
1.020
Límite inferior de especificación
Límite superior de especificación
Tiempo (en horas)
(c) Proceso fuera de control
Diámetrodelcojinete
Estadística Aplicada
PROESAD Programa de Educación Superior a Distancia73
El primer objetivo de un fabricante es liminar las causas de variación atribuibles de una variable de
calidad y mantener el proceso bajo control. El siguiente paso es reducir la variación del proceso y
tener la distribución de las mediciones de calidad dentro de especificaciones. El valor medio de la
distribución tendría que encontrarse cerca o en el centro del intervalo de los valores de
especificación, y la varianza de la distribución tendría que ser la más pequeña posible. Una
distribución deseable para los diámetros interiores de cojinetes es que se cumple absolutamente
con las especificaciones, como se muestra en la figura 2.
FIGURA 2. Una distribución deseable.
Una vez que un proceso esta bajo control y que produce productos satisfactorios, se controlan el
medio del proceso y su varianza mediante diagramas de control. Se sacan muestras de n
artículos del proceso a intervalos de tiempo específicos, digamos cada media hora o cada hora, y
se calcula la media muestral x y la amplitud total (“rango”) R. Se transportan estas variables
estadísticas a gráficas de x y R similares a las que se tienen en la figura 1 Se utiliza el diagrama
de control de la media muestral x para detectar posibles corrimientos en la media de la
distribución de una variable de calidad. De igual manera, se emplea un diagrama de control para la
amplitud de variación de la muestra R, a fin de detectar cambios en la variancia de las distribución.
Se analizan los diagramas de control para la media x y para la amplitud R, respectivamente.
6.4. GRAFICA DE CONTROL PARA MEDIA DEL PROCESO: DIAGRAMA DE x
Suponga que se seleccionan n artículos del proceso de producción a intervalos iguales (en el
tiempo o en los números de artículos producidos) y que se registran las mediciones de la variable
de calidad. Por ejemplo, la figura 3 presenta una gráfica de la media de los diámetros de n = 5
cojinetes, seleccionados cada hora, de un proceso de maquinado.
FIGURA 3. Diagrama de x par control
La lógica que apoya un diagrama x para control es que si el proceso esta controlado, las medias
muestrales tendrán que variar alrededor de la media poblacional de manera aleatoria, y que
casi todos los valores de x tendrán que estar en un intervalo (
X
3 ).
Diámetro0.980 x
1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 25
Límite inferior de control, LIC
Número de la muestra
Límite superior de control, LSC
21 22 23 24
x
3
x
3
Línea central x
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada
Estadistica aplicada

Más contenido relacionado

La actualidad más candente

Tarea 17 de probabilidad y estadistica con respuestas
Tarea 17 de probabilidad y estadistica con respuestasTarea 17 de probabilidad y estadistica con respuestas
Tarea 17 de probabilidad y estadistica con respuestasIPN
 
Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Luz Hernández
 
Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Luz Hernández
 
Ejercicios sobre muestreo
Ejercicios sobre muestreoEjercicios sobre muestreo
Ejercicios sobre muestreo216846
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporcioneseraperez
 
Trabajos resueltos de inferencia 2015
Trabajos resueltos de inferencia 2015Trabajos resueltos de inferencia 2015
Trabajos resueltos de inferencia 2015omarbsc
 
50ejerciciodeestadistica docx1-120121174706-phpapp01
50ejerciciodeestadistica docx1-120121174706-phpapp0150ejerciciodeestadistica docx1-120121174706-phpapp01
50ejerciciodeestadistica docx1-120121174706-phpapp01Alex Figueroa Ramos
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesisug-dipa
 
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Luz Hernández
 
Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8) Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8) Luz Hernández
 
Distribuciones continuas de probabilidad
Distribuciones continuas de probabilidadDistribuciones continuas de probabilidad
Distribuciones continuas de probabilidadangiegutierrez11
 
Uso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandarUso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandarAraceli Gomez
 
Tarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaTarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaIPN
 
Tarea 4 de probabilidad con respuestas
Tarea 4 de probabilidad con respuestasTarea 4 de probabilidad con respuestas
Tarea 4 de probabilidad con respuestasIPN
 

La actualidad más candente (20)

Tarea 17 de probabilidad y estadistica con respuestas
Tarea 17 de probabilidad y estadistica con respuestasTarea 17 de probabilidad y estadistica con respuestas
Tarea 17 de probabilidad y estadistica con respuestas
 
Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)
 
Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)
 
Ejercicios sobre muestreo
Ejercicios sobre muestreoEjercicios sobre muestreo
Ejercicios sobre muestreo
 
problemas de programacion lineal resueltos
problemas de programacion lineal resueltosproblemas de programacion lineal resueltos
problemas de programacion lineal resueltos
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
 
Trabajos resueltos de inferencia 2015
Trabajos resueltos de inferencia 2015Trabajos resueltos de inferencia 2015
Trabajos resueltos de inferencia 2015
 
Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02
 
50ejerciciodeestadistica docx1-120121174706-phpapp01
50ejerciciodeestadistica docx1-120121174706-phpapp0150ejerciciodeestadistica docx1-120121174706-phpapp01
50ejerciciodeestadistica docx1-120121174706-phpapp01
 
Distribucion uniforme continua
Distribucion uniforme continuaDistribucion uniforme continua
Distribucion uniforme continua
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesis
 
ejercicios resuelto de estadística l
ejercicios resuelto de estadística lejercicios resuelto de estadística l
ejercicios resuelto de estadística l
 
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
 
Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8) Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8)
 
Distribuciones continuas de probabilidad
Distribuciones continuas de probabilidadDistribuciones continuas de probabilidad
Distribuciones continuas de probabilidad
 
S12 distribución binomial (1)
S12 distribución binomial (1)S12 distribución binomial (1)
S12 distribución binomial (1)
 
Estadistica ii crc 4
Estadistica ii crc 4Estadistica ii crc 4
Estadistica ii crc 4
 
Uso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandarUso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandar
 
Tarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaTarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuesta
 
Tarea 4 de probabilidad con respuestas
Tarea 4 de probabilidad con respuestasTarea 4 de probabilidad con respuestas
Tarea 4 de probabilidad con respuestas
 

Destacado

Estadistica para administracion y economia anderson - solucionario
Estadistica para administracion y economia   anderson - solucionarioEstadistica para administracion y economia   anderson - solucionario
Estadistica para administracion y economia anderson - solucionarioOscar Barba Sanchez
 
control estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesiscontrol estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesisSonia Ynés Huaripaucar G
 
Parcial cultura ambiental 1
Parcial cultura ambiental 1Parcial cultura ambiental 1
Parcial cultura ambiental 1Jhonjhon_123
 
IMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIA
IMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIAIMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIA
IMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIAdanny
 
100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltosLuis Elias
 
Examen Parcial resuelto
Examen Parcial resueltoExamen Parcial resuelto
Examen Parcial resueltoLalita A.S
 
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleSolucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleMiguel Leonardo Sánchez Fajardo
 

Destacado (9)

Estadístico de Prueba
Estadístico de PruebaEstadístico de Prueba
Estadístico de Prueba
 
Estadistica para administracion y economia anderson - solucionario
Estadistica para administracion y economia   anderson - solucionarioEstadistica para administracion y economia   anderson - solucionario
Estadistica para administracion y economia anderson - solucionario
 
control estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesiscontrol estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesis
 
Parcial cultura ambiental 1
Parcial cultura ambiental 1Parcial cultura ambiental 1
Parcial cultura ambiental 1
 
Ejercicios Resueltos LEVIN
Ejercicios Resueltos LEVINEjercicios Resueltos LEVIN
Ejercicios Resueltos LEVIN
 
IMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIA
IMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIAIMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIA
IMPACTOS AMBIENTALES DE LA MINERIA EN COLOMBIA
 
100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos
 
Examen Parcial resuelto
Examen Parcial resueltoExamen Parcial resuelto
Examen Parcial resuelto
 
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleSolucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
 

Similar a Estadistica aplicada

Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicadaRoxana Mabel
 
U4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdfU4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdfDANIELMOYA54
 
Metodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidadMetodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidadsolymarysol
 
5.2 estimacion puntual y por intervalos
5.2 estimacion puntual y por intervalos5.2 estimacion puntual y por intervalos
5.2 estimacion puntual y por intervalosivanmmrmoca
 
Veter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporcionesVeter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporcionesUniv Peruana Los Andes
 
Diseño muestral...teoria
Diseño muestral...teoriaDiseño muestral...teoria
Diseño muestral...teoriajavier4445
 
5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptxgloria Esparraga
 
Estadística-Inferencial.ppt
Estadística-Inferencial.pptEstadística-Inferencial.ppt
Estadística-Inferencial.pptJulioVargas19409
 
Estadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.pptEstadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.ppterick492359
 

Similar a Estadistica aplicada (20)

Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicada
 
U4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdfU4_Estimación por intervalos de confianza y tipos de muestreo.pdf
U4_Estimación por intervalos de confianza y tipos de muestreo.pdf
 
Metodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidadMetodos estadísticos 09 primera unidad
Metodos estadísticos 09 primera unidad
 
document (1).pdf
document (1).pdfdocument (1).pdf
document (1).pdf
 
Estimación de Parámetros
Estimación de ParámetrosEstimación de Parámetros
Estimación de Parámetros
 
Estimacionpuntual1
Estimacionpuntual1Estimacionpuntual1
Estimacionpuntual1
 
5.2 estimacion puntual y por intervalos
5.2 estimacion puntual y por intervalos5.2 estimacion puntual y por intervalos
5.2 estimacion puntual y por intervalos
 
Estimación estadística
Estimación estadísticaEstimación estadística
Estimación estadística
 
Estimacion
EstimacionEstimacion
Estimacion
 
Veter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporcionesVeter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporciones
 
Estimacion y desviacion
Estimacion y desviacion Estimacion y desviacion
Estimacion y desviacion
 
Diseño muestral...teoria
Diseño muestral...teoriaDiseño muestral...teoria
Diseño muestral...teoria
 
Estimacion de Parámetro.pdf
Estimacion de Parámetro.pdfEstimacion de Parámetro.pdf
Estimacion de Parámetro.pdf
 
5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx
 
Semana 3 1_
Semana 3 1_Semana 3 1_
Semana 3 1_
 
Clase04 estadistica descriptiva
Clase04   estadistica descriptivaClase04   estadistica descriptiva
Clase04 estadistica descriptiva
 
Formulas estadisticas
Formulas estadisticasFormulas estadisticas
Formulas estadisticas
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Estadística-Inferencial.ppt
Estadística-Inferencial.pptEstadística-Inferencial.ppt
Estadística-Inferencial.ppt
 
Estadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.pptEstadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.ppt
 

Último

PRESENTACIÓN ANALISIS ESTRUCTURAL II.pptx
PRESENTACIÓN ANALISIS ESTRUCTURAL II.pptxPRESENTACIÓN ANALISIS ESTRUCTURAL II.pptx
PRESENTACIÓN ANALISIS ESTRUCTURAL II.pptxStibeCr
 
MECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargar
MECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargarMECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargar
MECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargarAdrielQuispeLpez
 
Presentación GP Nº03.ppt reapso general maqinas electricas
Presentación GP Nº03.ppt  reapso general maqinas electricasPresentación GP Nº03.ppt  reapso general maqinas electricas
Presentación GP Nº03.ppt reapso general maqinas electricasANDREJEANPIERREMACHU
 
PROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURA
PROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURAPROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURA
PROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURAHeribertoTiscareo
 
PROBLEMAS RELACIONADOS RESUELTOS DE GENETICA
PROBLEMAS RELACIONADOS RESUELTOS DE GENETICAPROBLEMAS RELACIONADOS RESUELTOS DE GENETICA
PROBLEMAS RELACIONADOS RESUELTOS DE GENETICAMaxiMus221
 
Guía para la identificación de materiales peligrosos
Guía para la identificación de materiales peligrososGuía para la identificación de materiales peligrosos
Guía para la identificación de materiales peligrososAdrianVarela22
 
GeoS33333333333333333333333333333333.pdf
GeoS33333333333333333333333333333333.pdfGeoS33333333333333333333333333333333.pdf
GeoS33333333333333333333333333333333.pdffredyflores58
 
SEMICONDUCTORES lafhnoealifsncknisz.pptx
SEMICONDUCTORES lafhnoealifsncknisz.pptxSEMICONDUCTORES lafhnoealifsncknisz.pptx
SEMICONDUCTORES lafhnoealifsncknisz.pptxOSCARADRIANMEDINADUR
 
Accidente mortal con un Torno mecánico.pptx
Accidente mortal con un Torno mecánico.pptxAccidente mortal con un Torno mecánico.pptx
Accidente mortal con un Torno mecánico.pptxBuddyroi
 
LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...
LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...
LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...PeraltaFrank
 
INFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdf
INFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdfINFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdf
INFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdfsolidalilaalvaradoro
 
Sales binarias y oxisales química inorganica
Sales binarias y oxisales química inorganicaSales binarias y oxisales química inorganica
Sales binarias y oxisales química inorganicakiaranoemi
 
La Evolución Industrial en el Ecuador.pdf
La Evolución Industrial en el Ecuador.pdfLa Evolución Industrial en el Ecuador.pdf
La Evolución Industrial en el Ecuador.pdfAnthony Gualpa
 
Analisis de reparación de fisuras superficiales en pavimentos.pptx
Analisis de reparación de fisuras superficiales en pavimentos.pptxAnalisis de reparación de fisuras superficiales en pavimentos.pptx
Analisis de reparación de fisuras superficiales en pavimentos.pptxasotomayorm2
 
Parciales y Semestral Profesor David cedeño
Parciales y Semestral Profesor David cedeñoParciales y Semestral Profesor David cedeño
Parciales y Semestral Profesor David cedeñomonicabetancur29
 
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIALFUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIALPamelaGranda5
 
Análisis de Varianza- Anova y pruebas de estadística
Análisis de Varianza- Anova y pruebas de estadísticaAnálisis de Varianza- Anova y pruebas de estadística
Análisis de Varianza- Anova y pruebas de estadísticaJoellyAlejandraRodrg
 
TR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdf
TR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdfTR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdf
TR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdfFRANCISCOJUSTOSIERRA
 
Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...
Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...
Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...jfmolina199
 
bombas-hidraulicas para permitir transporte en una instalación
bombas-hidraulicas para permitir  transporte en una instalaciónbombas-hidraulicas para permitir  transporte en una instalación
bombas-hidraulicas para permitir transporte en una instalaciónLuisLobatoingaruca
 

Último (20)

PRESENTACIÓN ANALISIS ESTRUCTURAL II.pptx
PRESENTACIÓN ANALISIS ESTRUCTURAL II.pptxPRESENTACIÓN ANALISIS ESTRUCTURAL II.pptx
PRESENTACIÓN ANALISIS ESTRUCTURAL II.pptx
 
MECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargar
MECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargarMECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargar
MECANICA DE FLUIDOS 1 mecánica de fluidos en documento para descargar
 
Presentación GP Nº03.ppt reapso general maqinas electricas
Presentación GP Nº03.ppt  reapso general maqinas electricasPresentación GP Nº03.ppt  reapso general maqinas electricas
Presentación GP Nº03.ppt reapso general maqinas electricas
 
PROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURA
PROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURAPROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURA
PROCESAMIENTO DE CERAMICAS. PROCESOS DE MANUFACTURA
 
PROBLEMAS RELACIONADOS RESUELTOS DE GENETICA
PROBLEMAS RELACIONADOS RESUELTOS DE GENETICAPROBLEMAS RELACIONADOS RESUELTOS DE GENETICA
PROBLEMAS RELACIONADOS RESUELTOS DE GENETICA
 
Guía para la identificación de materiales peligrosos
Guía para la identificación de materiales peligrososGuía para la identificación de materiales peligrosos
Guía para la identificación de materiales peligrosos
 
GeoS33333333333333333333333333333333.pdf
GeoS33333333333333333333333333333333.pdfGeoS33333333333333333333333333333333.pdf
GeoS33333333333333333333333333333333.pdf
 
SEMICONDUCTORES lafhnoealifsncknisz.pptx
SEMICONDUCTORES lafhnoealifsncknisz.pptxSEMICONDUCTORES lafhnoealifsncknisz.pptx
SEMICONDUCTORES lafhnoealifsncknisz.pptx
 
Accidente mortal con un Torno mecánico.pptx
Accidente mortal con un Torno mecánico.pptxAccidente mortal con un Torno mecánico.pptx
Accidente mortal con un Torno mecánico.pptx
 
LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...
LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...
LABORATORIO CALIFICADO 02 PESO VOLUMÉTRICO DE SUELOS COHESIVOS- MÉTODO DE LA ...
 
INFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdf
INFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdfINFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdf
INFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdf
 
Sales binarias y oxisales química inorganica
Sales binarias y oxisales química inorganicaSales binarias y oxisales química inorganica
Sales binarias y oxisales química inorganica
 
La Evolución Industrial en el Ecuador.pdf
La Evolución Industrial en el Ecuador.pdfLa Evolución Industrial en el Ecuador.pdf
La Evolución Industrial en el Ecuador.pdf
 
Analisis de reparación de fisuras superficiales en pavimentos.pptx
Analisis de reparación de fisuras superficiales en pavimentos.pptxAnalisis de reparación de fisuras superficiales en pavimentos.pptx
Analisis de reparación de fisuras superficiales en pavimentos.pptx
 
Parciales y Semestral Profesor David cedeño
Parciales y Semestral Profesor David cedeñoParciales y Semestral Profesor David cedeño
Parciales y Semestral Profesor David cedeño
 
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIALFUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
 
Análisis de Varianza- Anova y pruebas de estadística
Análisis de Varianza- Anova y pruebas de estadísticaAnálisis de Varianza- Anova y pruebas de estadística
Análisis de Varianza- Anova y pruebas de estadística
 
TR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdf
TR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdfTR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdf
TR-514 (3) - DOS COLUMNAS PASCUA 2024 3.4 8.4.24.pdf
 
Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...
Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...
Pueden_los_sistemas_de_informacion_ayudar_a_evitar_una_crisis_de_salud_public...
 
bombas-hidraulicas para permitir transporte en una instalación
bombas-hidraulicas para permitir  transporte en una instalaciónbombas-hidraulicas para permitir  transporte en una instalación
bombas-hidraulicas para permitir transporte en una instalación
 

Estadistica aplicada

  • 1. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia13 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce el concepto de estimación puntual y por intervalos. 1.2. Procedimentales Calculan estimaciones puntuales o intervalicas de los parámetros de una población. 1.3. Actitudinales Resuelve situaciones en donde se quiere estimar los parámetros de una población en estudio. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: Estimación de parámetros: Introducción: Estimación Puntual (Estimación puntual para la media poblacional, Estimación Puntual para la varianza poblacional, Estimación de parámetros de dos poblaciones, Estimación puntual de una población de variable cualitativa, Estimación puntual de dos poblaciones de variables cualitativas) y Estimación por intervalos (Intervalo de confianza para la media poblacional, Intervalo de confianza para la diferencia de medias poblacionales, Intervalo de confianza para la proporción poblacional, Intervalo de confianza para la diferencia de proporciones poblacionales). 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 2. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia14 Tutoría Nº Estimación de parámetros: estimación puntual y estimación por intervalos 1.1. INTRODUCCIÓN Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones respecto a una población, de los datos obtenidos realmente de una muestra. La inferencia estadística comprende dos tipos principales de técnicas: Estimación de parámetros y contrastación de hipótesis. Independientemente de la técnica que se utilice, la finalidad general es utilizar datos de una muestra para extraer conclusiones respecto a una población. 1.2. ESTIMACIÓN DE PARÁMETROS Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa respecto al valor de una característica de la población y desea conocer cuál podría ser tal valor. La estimación puede asumir 2 formas: - Estimación puntual - Estimación por intervalos 1.2.1. Estimación puntual Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar el parámetro desconocido de la población. Una desventaja de esta forma de estimación es que no aporta la precisión de la estimación del parámetro. Las estimaciones puntuales más usuales son: (A) Estimación Puntual para la media poblacional. Se halla mediante las siguientes fórmulas. - Para datos simples - Para datos agrupados f fx =x= n x =x= i iii (B) Estimación Puntual para la varianza poblacional. Se halla mediante las siguientes fórmulas. - Para datos simples - Para datos agrupados f xnfx =s= n xnx =s= 222 1 )( 1 )( 22 2 22 1
  • 3. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia15 (C) Estimación de parámetros de dos poblaciones Sea X1 una variable aleatoria que se distribuye como una distribución normal con media 1 y varianza 2 1 e X2 otra variable aleatoria que se distribuye como una distribución normal con media 2 y varianza 2 2 . La estimación de parámetros de dos poblaciones se pueden realizar mediante: a) La comparación de sus medias, luego: 212121 ˆˆ x-x=-=- b) La comparación de sus varianzas, luego: s s == 2 x 2 x x x x 2 x 2 1 2 1 2 2 1 2 ˆ ˆˆ (D) Estimación puntual de una población de variable cualitativa Sea X una variable cualitativa con: ticacaracterísladePresencia:A P-1=Qy AXsi0, AXsi1, N M N X Pcon X i Luego: p-1=qy Axsi0, Axsi1, n m N x pcon x i Entonces: P p (E) Estimación puntual de dos poblaciones de variables cualitativas Sea X1 la variable aleatoria de una población cualitativa con Px1 proporción de aciertos en X1 y sea X2 la variable aleatoria de otra población cualitativa con Px2 proporción de aciertos en X2, luego: p-p=P-P=P-P xxxxxx 212121 ˆˆ 1.2.2. Estimación por intervalos La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el parámetro tiene la probabilidad especificada de estar. Los estimados por intervalos se conocen como intervalos de confianza y los límites inferior y superior como los límites de confianza. En general el intervalo de confianza para el parámetro se expresa: P( - k + k ) = 1 -  
  • 4. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia16 Donde: = Parámetro = Estimador k = Valor tabulado = Desviación estándar del estimador 1 = Nivel de confianza Los intervalos de confianza más usuales son: (A) Intervalo de confianza para la media poblacional ( ) Para determinar el intervalo de confianza para la media poblacional se debe tomar en cuenta lo siguiente: - Cuando se conoce la varianza de la población y/o el tamaño de muestra n 30. P( x - Z n x + Z n ) = 1 - 2 2 ( ) ( )1 1 - Cuando no se conoce la varianza de la población y el tamaño de muestra n < 30. P( x - t s n x + t s n ) = 1 -( n ( 2 ,n-1)1 2 1 1, ) (B) Intervalo de confianza para la diferencia de medias poblacionales Se presentan los siguientes casos: - Si 2 1 y 2 2 son conocidos -1=] n + n Z+)x-x(- n + n Z-)x-xP[( 2222 2 2 2 1 1 ) 2 1(2121 2 2 1 1 )1(21 - Si 2 1 y 2 2 no son conocidos se presentan dos casos: a. Si 2 1 es aproximadamente igual a 2 y entonces 2 1 2 2 2 -1=]) n 1 + n 1 (st+)x-x(-) n 1 + n 1 (st-)x-xP[( 2 1)-n, 2 ( 2 1)-n, 2 ( 21 12121 21 121 2-n+n s1)-n(+s1)-n( =s:donde 22 2 21 2211 b. Cuando 2 1 es diferente a 2 2 -1=] n s + n s t+)x-x(- n s + n s t-)x-xP[( 22 1)-n 22 1)-n, 2 ( 2 2 1 1 , 2 1(2121 2 2 1 1 121 Observación: Sí n1+ n2 - 2 30, el valor tabulado es Z(1 - /2) Sí n1 + n2 - 2 < 30, el valor tabulado es t(n1 + n2 – 2, 1 - /2)
  • 5. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia17 (C) Intervalo de confianza para la proporción poblacional Se presentan los siguientes casos: - Cuando el tamaño de muestra es grande (n 30) P(p - Z pq n P p + Z pq n = 1 - 2 2 ( ) ( ) )1 1 - Cuando el tamaño de muestra es pequeño (n < 30) P(p - t pq n P p + t pq n ) = 1 -( 2 ,n-1) ( 2 ,n-1)1 1 (D) Intervalo de confianza para la diferencia de proporciones poblacionales Se pueden presentan los siguientes casos: - Si, n1 y n2 son muestras grandes (n1 + n2 - 2 30) -1=] n qp + n qp Z+)p-p(P-P n qp + n qp Z-)p-pP[( 22 2 22 1 11 )1(2121 2 22 1 11 )1(21 - Si, n1 y n2 son muestras pequeñas (n1 + n2 - 2 30) -1=] n qp + n qp t+)p-p(P-P n qp + n qp t-)p-pP[( 1)-n, 2 (1)-n, 2 ( 2 22 1 11 12121 2 22 1 11 1(11 Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80, n2 = 20 se recomienda emplear: n+n pn+pn =p:donde ) n 1 + n 1 )(p-(1p=s yx 2 21 2211 esta proporción denota la proporción conjunta de las dos muestras. Ejemplo 1.1 Se ensaya un test para determinar el cociente de inteligencia a 8 alumnos; los resultados fueron: 98, 108, 92, 111, 102, 95, 89, 115. Determine: a) estimación puntual y b) estimación por intervalo (use el 90% de confianza) para el promedio verdadero del cociente de inteligencia. Solución n = 8, x = 101.25, s = 9.38 -1 = 0.90 Luego 2 1 = 0.95 como n 30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895 a) Estimación puntual: Por formula ix = x= n 25.101x
  • 6. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia18 b) Estimación por intervalo: Por formula -1=) n s t+x n s t-xP( )(( 95.0,7)95.0,.7 Reemplazando: -1=)-P( 8 38.9 895.125.101 8 38.9 895.125.101 Se obtiene %9053.10797.94 =]P[ Luego el promedio verdadero del cociente de inteligencia de los alumnos se encuentra entre 94.97 y 107.53, con un nivel de confianza de 90%. Ejemplo 1.2 Una muestra aleatoria de 100 hogares de una ciudad indica que el promedio de los ingresos mensuales es de $ 500. Encuentre un intervalo de confianza del 95 % para la media poblacional de los ingresos de todos los hogares de esa ciudad. Suponga σ = $ 110. Solución n = 100, x = 500 σ = $ 110 -1 = 0.95 luego 2 1 = 0.975 como n = 30, entonces Z(1 - /2) = Z(0.95) = 1.96 Por formula (1 ) (1 ) 2 2 )P( x - x+ =1-Z Z n n Reemplazando 110 110 500 1.96 500 1.96 ) 95% 100 100 P( - + = Se obtiene 478.44 521.56 95%P[ ] = Esto, es se tiene una confianza del 95% que el promedio del ingreso familiar poblacional de esa ciudad, está en el intervalo $ 478.44 y $ 521.56. Ejemplo 1.3 Como parte de un experimento, una gran empresa manufacturera encontró que el tiempo promedio requerido para que 16 empleados escogidos al azar completaran una tarea determinada era de 26 minutos, la desviación estándar 5 minutos. Construir el intervalo de confianza del 95% para la media poblacional. Solución n = 16 x = 26 s = 5 1- = 0.95 Luego 2 1 = 0.975 como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131 Por formula -1=) n s t+x n s t-xP( )(( 975.0,15)975.0,15
  • 7. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia19 Reemplazando %95) 16 5 131.226 16 5 131.226 =+-P( Se obtiene %9566.2834.23 =]P[ Ejemplo 1.4 Se ha hecho un estudio de las diferencias entre estudiantes universitarios del primer año que estuvieron en academias y estudiantes que no estuvieron. Para ello se tomó una muestra aleatoria de 50 estudiantes universitarios que habían asistido a academias y una muestra aleatoria simple independiente de 60 estudiantes que no lo habían hecho. Al final del primer semestre se administró a los estudiantes una prueba de rendimiento en matemática. Los que habían asistido a academias, obtuvieron un puntaje promedio de 14,5, con una varianza de 4,8; y el puntaje promedio para el grupo que no había asistido a la academia, fue de 13,75 con una varianza de 6,4. Construya un intervalo de confianza para la diferencia entre las dos medias poblacionales (use 99% de confianza). Solución ASISTIERON ACADEMIA NO ASISTIERON ACADEMIA n1 = 50 1x =14.5 s 2 1 = 4.8 n2 = 60 2x =13.75 s 2 2 = 6.4 1 - = 0.99 luego 1- 2 = 0.995 Como n1 + n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 Por formula -1=] n s + n s z+)x-x(- n s + n s z-)x-xP[( 22 ) 22 ) 2 ( 2 2 1 1 2 1(2121 2 2 1 1 121 Reemplazando %99 60 4.6 50 8.4 58.275.135.14 60 4.6 50 8.4 58.275.135.14 21 =]++)-(-+-)-P[( Se obtiene %9991.141.0 21 =]-P[ Ejemplo 1.5 Los estudiantes que se matricularon en un curso de investigación educativa fueron distribuidos al azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades para enriquecer el curso. El grupo B estudió mediante el método tradicional de conferencias. Los puntajes obtenidos en una prueba de rendimiento, hecha al terminar el curso dieron los siguientes resultados: Grupo n x s A (1) 10 80 8 B (2) 12 72 10 Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios poblacionales.
  • 8. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia20 Solución 1 - = 0.90 luego 1 - 2 = 0.95 Como n1 + n2 –2 < 30 entonces t (n1 + n2 –2,1– /2) = t(20, 0.95) = 1.725 Por formula -1=] n s + n s t+)x-x(- n s + n s t-)x-xP[( 22 n(n 22 n(n 2 2 1 1 )2/1,22121 2 2 1 1 )2/1,221 2121 Reemplazando %90 12 100 10 64 725.17280 12 100 10 64 725.17280 21 =]++)-(-+-)-P[( Se obtiene %9062.1438.1 21 =]-P[ Ejemplo 1.6 Una encuesta para verificar las actitudes de los empleados ante el boletín mensual, se les pidió a 500 empleados de una gran organización nacional que indicaran con que frecuencia leían el boletín de noticias. De los 500, 375 informaron que leían todas las ediciones. Construir el intervalo de confianza del 95% para la proporción real de los que opinan afirmativamente. Solución: n = 500 p = 500 375 = 0.75 q =0.25 1- = 0.95 luego 2 1 = 0.975 Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96 Por formula -1=] n pq Z+pP n pq Z-P[p )2/1()2/1( Reemplazando %95 500 )25.0(75.0 96.175.0 500 )25.0(75.0 96.175.0 =]+P-P[ Se obtiene %9579.071.0 =]PP[ Ejemplo 1.7 En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto programa de televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado. Determinar los límites de confianza del 99% para la diferencia de proporciones de todos los adultos y jóvenes que vieron con agrado el programa. Solución ADULTOS JÓVENES n1 = 400 a1 = 100 p1 = 25.0 1 1 n a q1 = 1-p1 = 0.75 n2 = 60 0 a2 = 300 p2 = 5.0 2 2 n a q2 = 1 – p2 = 0.5 1 - = 0.99 Luego 1- 2 = 0.995
  • 9. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia21 Como n1+ n2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza mancomunada así: n+n pn+pn =p 21 2211 Reemplazando 4.0 1000 400 600400 300100 + + =p ) n 1 + n 1 )(p-(1p=s 21 ) 1 + 1 )((=s 032.0 600400 6.04.0 Por formula -1=]) n 1 + n 1 )(p-(1pZ+)p-p(P-P) n 1 + n 1 )(p-(1pZ-)p-pP[( 21 2//1(2121 21 2//1(21 Reemplazando %99)032.0(58.25.025.0)032.0(58.25.025.0 =]+)(P-P-)P[( JA Se obtiene %9917.033.0 21 =]P-PP[
  • 10. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia22 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) El método de estimación de un parámetro puede ser: puntual o por intervalos. ( ) La Inferencia estadística comprende dos tipos principales de técnicas. ( ) La estimación por intervalos contiene el cálculo de una sola cifra numérica. ( ) Se obtiene conclusiones de la población a través de la información de la muestra. ( ) En la estimación puntual incluye un intervalo en el que están comprendidos los valores del parámetro. 2. De una población se escogieron al azar 10 personas y se les tomo la estatura. Los resultados en cm fueron: 160, 170, 170, 150, 160, 180, 160, 170, 130, 150. a) Estime la media y la varianza. 3. En una universidad se desea conocer la opinión de los estudiantes acerca de ciertas medidas que han tomado las directivas. De 120 estudiantes consultados, 90 estuvieron a favor. a) Estime la proporción de estudiantes que están a favor de las medidas 4. Para estimar la media del consumo (dólares) en el restaurante de una universidad, se tomó una muestra de 49 profesores. Suponga una desviación estándar poblacional de 5 dólares. Si la media en la muestra fue de 24.80 dólares mensuales. a) ¿Cuál fue el intervalo de confianza de 95% para el consumo medio poblacional? 5. Los siguientes números representan el tiempo(en minutos) que tardaron 15 operarios en familiarizarse con el manejo de una nueva máquina adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8. a) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo promedio. b) El instructor considera que el tiempo promedio requerido por los trabajadores es mayor que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado? 6. Una marca de lavadoras quiere saber la proporción de amas de casa que preferirían usar su marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usarían. a) Calcula un intervalo de confianza del 95% para la verdadera proporción de amas de casa que preferirían dicha lavadora.
  • 11. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia23 Unidad 2 PRUEBA DE HIPOTESIS DE PARAMETRO POBLACIONALES Nº de tutorías: Dos Tutoría Nº 1: PRUEBA DE HIPÓTESIS: CONCEPTOS BÁSICOS; PRUEBA DE HIPÓTESIS PARA UNA MEDIA; UNA VARIANZA Y DOS VARIANZA POBLACIONAL Tutoría Nº 2: PRUEBA DE HIPÓTESIS: PROPORCIÓN POBLACIONAL; DOS MEDIAS POBLACIONALES; DOS PROPORCIONES POBLACIONALES.
  • 12. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia24
  • 13. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia25 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce el concepto de prueba de hipótesis para los parámetros. 1.2. Procedimentales Comprobar las pruebas de hipótesis en las investigaciones científicas. 1.3. Actitudinales Resuelve situaciones en donde el interés es probar hipótesis de los parámetros de una población en estudio. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: Introducción, Concepto prueba de hipótesis, hipótesis nula, hipótesis alternativa, errores de prueba y nivel de significación, pruebas bilaterales y unilaterales, prueba de hipótesis referida a la media poblacional, prueba de hipótesis sobre la varianza poblacional, prueba de hipótesis referida a dos variancias poblacionales, prueba de hipótesis referida a la proporción poblacional, prueba de hipótesis referida a la diferencia entre dos medias poblacionales, prueba de hipótesis referida a la diferencia entre dos proporciones poblacionales 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 14. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia26 Tutoría Nº Prueba de hipótesis: conceptos básicos; prueba de hipótesis para una media; una varianza y dos varianza poblacional 2.1. INTRODUCCIÓN El objetivo es dar algunos métodos que se usan para tomar decisiones sobre poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se debe partir de afirmaciones o conjeturas con respecto a la población en el que estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura hecha sobre una población o sobre sus parámetros deberá ser sometida a comprobación experimental con el propósito de saber si los resultados de una muestra aleatoria extraída de esa población, contradicen o no tal conjetura. A continuación definiremos algunos conceptos básicos para la prueba de hipótesis. 2.2. HIPÓTESIS Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación. Por esta razón se le denomina hipótesis de investigación. Generalmente hay que volver a plantear las hipótesis de investigación convenientemente de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas las hipótesis reciben el nombre de hipótesis estadística. 2.3. HIPÓTESIS ESTADÍSTICAS Una hipótesis estadística es un enunciado o proposición respecto a uno o más parámetros de la población. A fin de probar una proposición, es preciso formular una hipótesis denominada nula juntamente con otra denominada hipótesis alternativa. 2.3.1. Hipótesis nula (Ho) Son aquellas que están referidas a algún parámetro de la población o de las poblaciones de estudio. Estas son llamadas hipótesis científicas. 2.3.2. Hipótesis alternativa (Ha) Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la que sirve para contrastarla. 2.4. ERRORES DE PRUEBA Y NIVEL DE SIGNIFICACIÓN Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal caso estaremos cometiendo el denominado ERROR DE TIPO I. De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos, estaremos decidiendo bien. 2
  • 15. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia27 Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos corresponde al NIVEL DE SIGNIFICACIÓN. P(ERROR TIPO I) = Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o falsa. DECISIÓN SOBRE Ho NATURALEZA DE Ho Cierta Falsa No rechazar Rechazar Decisión Correcta Error tipo I (Probabilidad ) Error tipo II (probabilidad ) Decisión correcta Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es posible minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas de tal modo que al disminuir una de ellas la otra aumenta. Así si queremos minimizar inmediatamente aumenta la probabilidad de y viceversa. Generalmente el investigador fija apriori el error que está dispuesto a tolerar, es decir la probabilidad máxima de cometer el error de tipo I. La decisión de una prueba estadística está asociada al nivel de significación: a) Si P < 0.05 ( = 0.05) se dice que existe significación en la prueba b) Si P < 0.01 ( = 0.01) se dice que existe alta significación en la prueba Pruebas bilaterales y unilaterales Cuando tenemos hipótesis alternativa de la forma: Ho : = 0 Ho : P = Po Ha : 0 Ha : P Po Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser mayor, significativamente o acaso menor, significativamente. En tales casos el nivel de significación queda partido en /2 en cada lado de la distribución del estadístico o función de prueba. Tendremos entonces una prueba bilateral o no direccionada (dos puntos críticos) De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales o direccionada (un punto crítico) Ho : = 0 Ha : 0 1 2 1 2
  • 16. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia28 Ho : = 0 Ha : 0 A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama REGIÓN DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN. Una prueba de contrastación de hipótesis estadística se conduce básicamente según el siguiente procedimiento. 1. Plantear las hipótesis - Hipótesis nula (Ho) - Hipótesis alternativa (Ha) 2. Establecer el nivel de significación de prueba ( ) 3. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha función de prueba. 4. Efectuar el reemplazo numérico en la función de prueba con la información muestral. 5. Determinar las regiones de aceptación o rechazo en la distribución de la función de prueba, según se trate de pruebas bilaterales o unilaterales. 6. Tomar una decisión sobre Ho, según la siguiente regla: a. Rechazar Ho si el valor de la función de prueba cae en la región de rechazo. En tal caso se concluirá que Ho se rechaza en favor de Ha con una significación estadística. b. No rechazar Ho si el valor de la función de prueba cae en la región de aceptación. En tal caso se concluirá de que la información muestral no brinda suficientes evidencias como para sospechar de que Ho no sea cierta. 7. Establecer la conclusión, según la hipótesis que se acepte. 2.5. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las características de una población normal. Las hipótesis referentes a este parámetro pueden ser: Ho: µ = µo Ha: µ µo Prueba bilateral o de dos colas Ho: µ = µo Ha: µ µo Prueba unilateral de cola a la derecha Ho: µ = µo Ha: µ µo Prueba unilateral de cola a la izquierda Dicha prueba se efectúa mediante la siguiente función de prueba: a) Si la desviación estándar poblacional no es conocida o n<30 o o (n-1)t = x - s/ n t 1
  • 17. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia29 b) Si la desviación estándar poblacional es conocida ó n≥30 n n/ -x =z (0,1) o o Ejemplo 2.1 El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida le permite a su compañía vender más pólizas que las compañías "promedio". El promedio mensual de ventas de todos los agentes de la compañía es de $300. A una muestra de agentes que han recibido el programa de entrenamiento se le encuentra las siguientes ventas en dólares: 300, 270, 360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el supervisor de estos agentes, adoptaría para los restantes el programa de entrenamiento propuesto por el señor Martínez. Emplee 5% de significación. Solución: = 300, n = 10, x = 351.9, s = 48.64 -1 = 0.95 como n 30, entonces t(n – 1, 1– ) = t(9,0.95) = 1.833 1) Ho: 300 Ha: 300 2) = 0.05 3) f.p. 0 0 x t s n 4) 0 351.9 300 3.37 48.64 10 t 5) t(9,0.95) = 1.833 6) Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis nula a favor de la hipótesis alternativa 7) Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su compañía vender más pólizas de seguro que la compañía promedio, por lo cual se adoptará para el resto de los agentes el programa propuesto por el señor Martinez. RA 1 - = 0,95 RR = 0,05 tt = 1,833 t0 = 3,37
  • 18. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia30 Ejemplo 2.2 Un investigador afirma que la ingestión diaria de nutrientes (proteína) recomendada en varones de 18-34 años moderadamente activos, tiene un promedio de 75 grs. para contrastar tal hipótesis se tomó una muestra de 116 varones saludables obteniendo los siguientes resultados: Proteína encontrada (gr) Número de varones 71 73 75 77 79 8 20 60 18 10 Total 116 Pueden estos resultados, sostener la hipótesis formulada por el investigador. Use el 5% de significación. Solución: = 75, n = 116, x = 75.03, s =1.95 = 0.05 como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96 1) Ho: = 75 Ha: 75 2) = 0.05 3) f.p. o o x - =Z s n 4) 75.03 75 0.17 1.95 116 o =Z 5) 96.1)975,0(Z=Zt 6) Decisión: Como Zo RA aceptamos Ho 7) Conclusión: Se sostiene la hipótesis formulada para el investigador. 2.6. PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA POBLACIONAL Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. Las hipótesis referentes a este parámetro pueden ser: RR 2 = 0,025 Zt = -1,96 RA 1 - = 0,95 RR 2 = 0,025 Zt =1,96 Z0 = 0,17
  • 19. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia31 Ho: = o Ha: o Prueba bilateral Ho: = o Ha: o Prueba unilateral Ho: = o Ha: o Prueba unilateral Procedimiento: Supóngase que se desea probar la hipótesis de que la varianza de una población normal 2 es igual a un valor específico, por ejemplo, 2 o. Sea X1, X2, ..., Xn una muestra aleatoria de n observaciones tomadas de esta población. Para probar Ho: 2 = 2 o Ha: 2 2 o Se utiliza el estadístico de prueba 2 2 2 )1( o o Sn X donde S 2 es la varianza muestral. Ahora si Ho: 2 = 2 o es verdadera, entonces el estadístico de prueba X 2 o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se calcula el valor de la estadística de prueba X 2 o, y la hipótesis Ho: 2 = 2 º debe rechazarse si: 2 2/1,1 2 2 2/,1 2 no no sio donde X 2 n-1, /2 y X 2 n-1,1- /2 son los puntos que corresponden a los porcentajes 100 /2 inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente. El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho: 2 = 2 o Ha: 2 > 2 o Se rechaza si: X 2 o > X 2 n-1,1- Para la otra hipótesis unilateral: Ho: 2 = 2 o Ha: 2 < 2 o Se rechaza si: X 2 o < X 2 n-1, RA 1 – 2 )2/,1(nX RR /2 RR /2 2 )2/1,1(nX RA 1 – RR 2 )1,1(nX
  • 20. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia32 PROCEDIMIENTO PARA MUESTRAS GRANDES Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal. El estadístico de prueba es: n s Z o o o 2 El gráfico utilizado sería acampanado. Ejemplo 2.3 Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas de fluido)2 . Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2 , entonces existe una proporción inaceptable de botellas que serán llenadas con una cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de prueba. Solución: 2 = 0.01, n = 20, s 2 = 0.0153 = 0.05 como n < 30, entonces 2 )1,1(nX = 1.302 )95.0,19(X Ho: 2 = 0.01 Ha: 2 > 0.01 = 0.05 f.p. 07.29 01.0 )0153.0)(19()1( 2 2 2 o o Sn X 1.302 )95.0,19(X RA 1 – RR 2 ),1(nX RA 1 – = 0.95 RR = 0.05 1.30 2 tX 07.29 2 oX
  • 21. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia33 Decisión: Como 07.29 2 oX RA aceptamos Ho Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza es igual a 0.01. 2.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES La prueba de comparación de muestras, requiere que las variancias de las dos poblaciones muestreadas sean iguales. En esta sección describiremos una prueba para la hipótesis nula 2 1 = 2 2 , que se aplica a muestras aleatorias independientes obtenidas de dos poblaciones normales; debe utilizarse con mucho cuidado por ser muy sensible a las desviaciones de tal suposición. Las hipótesis referentes a este parámetro pueden ser: Ho: 1 = 2 Ha: 1 2 Prueba bilateral Ho: 1 = 2 Ha: 1 2 Prueba unilateral Ho: 1 = 2 Ha: 1 2 Prueba unilateral Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones normales que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza el siguiente estadístico. 2 2 2 1 s s F que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1 grados de libertad. Obs. F1 - (v1,v2) = ),(F 1 12 vv Regiones críticas para probar 2 2 2 1 (Poblaciones normales) Hipótesis alterna Estadístico de prueba Rechaza la hipótesis nula si: 2 1 < 2 2 2 2 2 1 s s F F < F (n1 – 1, n2 – 1) 2 1 > 2 2 2 2 2 1 s s F F > F1- (n1 – 1, n2 – 1) 2 1 2 2 2 2 m M s s F F < F /2(nM – 1, nm – 1) ó F > F1- /2(nM – 1, nm – 1) Donde: s 2 M : la mayor de las dos variancias muestrales, s 2 m : la más pequeña de las variancias.
  • 22. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia34 Para hipótesis unilateral: Ho: 2 2 2 1 Ha: 2 2 2 1 El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho: 2 2 2 1 Ha: 2 2 2 1 Para la otra hipótesis unilateral: Ho: 2 2 2 1 Ha: 2 2 2 1 PROCEDIMIENTO PARA MUESTRAS GRANDES Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30, se utiliza la distribución normal. El estadístico de prueba es: 21 21 2 1 2 1 nn s ss Z p o RA 1 – )1,1(2/ mnMnF RR /2 RR /2 )1,1(2/1 mnMnF RA 1 – RR )12,11(1 nnF RA 1 – RR )12,11(1 nnF
  • 23. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia35 2 )1()1( : 21 2 22 2 112 nn snsn s donde p Ejemplo 2.4 Se requiere determinar si existe menos variabilidad en el plateado realizado por la compañía 1 que el efectuado por la compañía 2. Si las muestras aleatorias independientes de tamaño 12 del trabajo desempeñado por las compañías producen s1=0,035 mil y s2=0,062 mil, pruébese la hipótesis nula de que 2 1 = 2 2 contra la hipótesis alterna de que 2 1 < 2 2 con un nivel de significancia de 0,05. Solución: n1 = n2 = 12, s1 = 0.035, s2 = 0.062, = 0.05 como n1 + n2 < 30, entonces 355.0)11,11()1,1( 05,021 FnnF=Ft Ho: 2 2 2 1 Ha: 2 2 2 1 = 0.05 f.p. 319.0 )062.0( )035.0( 2 2 2 2 2 1 s s F Decisión: Como 0F RA se acepta Ho Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía 2. Usando 5% de significación de prueba. RA 1 – = 0.95 RR = 0.05 355.0tF 319.00F
  • 24. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia36 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) El rechazo de Ho cuando es verdadera se llama error de tipo I ( ) Si la función de prueba cae en la región crítica entonces aceptamos la Ho ( ) Ha se formula con el propósito de rechazarla, es la que se va a someter a prueba. ( ) Es una prueba bilateral cuando la hipótesis se orienta a un solo lado. ( ) No rechazar la Ho si el valor de la función de prueba cae en la región de aceptación. 2. Un estudio de 29 familias de una zona residencial de la ciudad de Lima, revela que el ingreso medio por familia durante el año 1999 fue de $ 508 con una desviación estándar de $ 16. Probar la hipótesis de que el verdadero ingreso medio por familia en Lima durante 1999 fue de $ 500 frente a la alternativa de que no fue de $ 500. Utilizar un nivel de significancia del 5%. 3. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las ventas de la semana de un determinado producto de consumo popular tiene una desviación estándar $6s . Se supone que las ventas del producto tienen una distribución normal. Al nivel de significancia del 5%, ¿se podría inferir que la varianza de la población es menor que $40? 4. Los pesos netos (en gramos) de las latas de conserva de una muestra, fueron los siguientes: 121; 119; 124; 123; 119; 121; 124. ¿Se puede concluir que el peso neto poblacional medio es mayor que 123.5? Utilice un nivel de significancia del 1%. 5. Un determinado proceso de empaquetar un producto está controlado, si el peso medio del producto empaquetado es 400 gramos. Si en una muestra aleatoria de 100 paquetes del producto se ha encontrado que el peso medio es de 395 gramos. ¿Se podría concluir que el proceso está fuera de control al nivel de significación 5%?. Suponga que el peso de los productos empaquetados se distribuye normalmente con desviación estándar de 20 gramos. 6. En un proceso de fabricación, se plantea la hipótesis que la desviación estándar de las longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos elegidos al azar del proceso de producción se han encontrado las siguientes longitudes en milímetros: 71, 66, 64, 72, 69, 67, 70, 68, 65, 69. Con estos datos se justifica la suposición que la desviación estándar verdadera es 2.0 mm? Use el nivel de significación α=0.05, y suponga que la distribución de las longitudes es normal.
  • 25. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia37 Tutoría Nº Prueba de hipótesis: proporción poblacional; dos medias poblacionales; dos proporciones poblacionales 3.1. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una determinada característica. Las hipótesis referentes a este parámetro pueden ser: Ho: P = Po Ha: P Po Prueba bilateral Ho: P = Po Ha: P Po Prueba unilateral Ho: P = Po Ha: P Po Prueba unilateral La función de prueba para valores de n 30 es: o o o o (0,1)z = P - p p (1- p ) / n n La función de prueba para valores de n 30 es: o o o o (n-1)t = P - p p (1- p ) / n t Ejemplo 3.1 El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde? Solución: P = 0.60, n = 120, m = 75, 625.0 120 75 p , = 0.05 como n > 30, entonces 645.1)95,0()1( ZZ=Zt Ho: 60.0P Ha: 60.0P = 0.05 f.p. 56.0 120 )4.0(6.0 6.0625.0 0 )/nP-(1P P-p =Z oo o 3
  • 26. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia38 Decisión: Como Zo RA aceptamos Ho Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión del alcalde. Usando un 5% de significación de prueba. Ejemplo 3.2 Se tomó una muestra aleatoria de 400 escolares, de los cuales 120 tuvieron signos de desnutrición. Verifique la hipótesis de que el porcentaje de desnutridos no excede a 25% en la cobertura de estudio (Use 5% como nivel de significación). Solución P = 0.25, n = 400, m = 120, 30.0 400 120 p , = 0.05 como n > 30, entonces 645.1)05,0()( ZZ=Zt Ho: 25.0P Ha: 25.0P = 0.05 f.p. 31.2 400 )75.0(25.0 25.030.0 Zo Decisión: Como Zo RA se acepta Ho Conclusión: La proporción de desnutridos no excede al 25% en la cobertura de estudio. En un 5% de significación de prueba. 3.2 PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis natural es que ambas tienen igual promedio, o en otras palabras que la diferencia de ambos promedios es nula o difieren en alguna cantidad específica. Las hipótesis referentes a este parámetro pueden ser: Ho: µ1 = µ2 Ha: µ1 µ2 Prueba bilateral Ho: µ1 = µ2 Ha: µ1 µ2 Prueba unilateral RR = 0,05 Zt = -1,645 RA 1 - = 0,95 Z0 = 2,31 RA 1 - = 0,95 RR = 0,05 Zt = 1,645 Z0 = 0,56 645.1)95,0(Z=Zt 645.1)95,0()1( ZZ=Zt
  • 27. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia39 Ho: µ1 = µ2 Ha: µ1 µ2 Prueba unilateral Pueden presentarse varias situaciones dependiendo de como son sus varianzas: 1. Con varianzas conocidas: La función de prueba es: n n + n )-(-)x-x( =z (0,1) 22 o 2 2 1 1 2121 2. Con varianzas desconocidas y diferentes: La función de prueba es: t n s + n s )-(-)x-x( =t 2)-n+n( 22 o 21 2 2 1 1 2122 Cuando n1 + n2 2 30 entonces esta función de prueba sigue una distribución normal estándar. 3. Con varianzas desconocidas y aproximadamente iguales: La función de prueba es: t n 1 + n 1 s )-(-)x-x( =t 2)-n+n( 2 o 21 21 2121 Aquí s 2 es la varianza mancomunada 2-n+n s1)-(n+s1)-(n =s 22 2 21 2211 Al igual que en el caso anterior, si n1 + n2 2 30 entonces la función de prueba sigue una distribución normal estándar. Observación: Antes de realizar la prueba de comparación de medias, es conveniente efectuar la prueba de comparación de varianzas para determinar si los datos de ambas poblaciones tienen varianzas aproximadamente iguales o diferentes. Ejemplo 3.3 Una compañía desea comparar las expectativas salariales anuales de su personal de ventas femenino y masculino, según un nuevo plan de compensaciones venta-más-comisión. Se pidió a n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar, predijeron sus ingresos anuales bajo el nuevo plan. Las medias y desviaciones muestrales eran: 1x = $ 31 083 2x = $ 29 745 1s = $ 2 312 2s = $ 2 569 ¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del ingreso anual esperado tanto entre los vendedores como las vendedoras? Haga la prueba con = 0,10. Solución: Ho: 21 5.5972552 21 2212 2-n+n s1)-(n+s1)-(n =s 22 2 Ha: 21 645.1)95,0(Z=Zt
  • 28. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia40 = 0.10 f.p. 45.2 40 1 40 1 5.597255252 02974531083 11 21 2 2121 + n + n s )-(-)x-x( =Zo Decisión: Como Zo RR no existe suficiente evidencia como para aceptar la hipótesis nula, por consiguiente aceptamos la Ha. Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia en el promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de significación de prueba. 3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES Cuando se desea comparar dos poblaciones cualitativas. Las hipótesis referentes a este parámetro pueden ser: Ho: P1 = P2 Ha: P1 P2 Prueba bilateral Ho: P1 = P2 Ha: P1 P2 Prueba unilateral Ho: P1 = P2 Ha: P1 P2 Prueba unilateral La función de prueba es: n n 1 + n 1 p-1p )P-P(-)p-(p =z (0,1) 21 2121 Aquí p es la proporción mancomunada: n+n pn+pn =p 21 2211 Ejemplo 3.4 Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico determinado (grupo A) y que ven regularmente lucha en TV. supera mucho a un segundo grupo de hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos grupos arrojaron los siguientes resultados. tamaño de Número de hombres que ven Grupo la muestra regularmente lucha en TV A (1) n1 = 150 a1 = 98 B (2) n2 = 200 a2 = 80 RR 2 = 0,05 Zt = -1,645 RA 1 - = 0,90 RR 2 = 0,05 Zt =1,645 Z0 = 2,46
  • 29. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia41 ¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? use = 0,05 Solución: Ho: 21 PP 51.0 350 8098 p Ha: 21 PP 645.1)95.0(Z=Zt 40.0 200 80 65.0 150 98 2 2 2 1 1 1 n a p n a p = 0.05 f.p. 63.4 200 1 150 1 )49.0(51.0 0)4.065.0( 21 2121 0 + n 1 + n 1 p-1p )P-P(-)p-(p =Z Decisión: Como Zo RR rechazamos Ho en favor Ha Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del sociólogo con un 5% de significación de prueba. RA 1 - = 0,95 RR 2 = 0,05 Zt =1,645 Z0 = 4,63
  • 30. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia42 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) La hipótesis Ho: P > Po es una prueba bilateral. ( ) En la prueba F los n1-1 y n2-1 son conocidos como los grados de libertad. ( ) Cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal. ( ) Cuando Fo pertenece a la Región de aceptación entonces se rechaza Ho. ( ) La hipótesis Ho: P > Po es una prueba unilateral a la derecha. 2. El gerente de una empresa insiste en que a lo más del 33% de los clientes de la empresa esta de acuerdo con el cambio de su producto. De 80 clientes tomados al azar, 29 están de acuerdo con el cambio del producto. Al nivel de significancia de 5%, ¿tiene razón el gerente? 3. Ejemplo: Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada población reveló que 120 hombres y 120 mujeres estaban a favor de cierto candidato. ¿Se puede concluir a un nivel de significación del 5% que la proporción de hombres a favor del candidato es mayor que la proporción de mujeres? 4. Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen desviaciones estándar respectivas de 120 horas y 90 horas. Para comparar el promedio de vida útil de estos artículos se extrae una muestra aleatoria de 60 artículos de cada fabricante encontrándose la duración media de 1.230 horas para la marca A y de 1.190 horas para la marca B. ¿Se puede concluir a un nivel de significación del 5% que los artículos de marca A tienen mayor duración media que los artículos de marca B? 5. Se controla la calidad de una muestra aleatoria de 40 piezas producidas por un fabricante. Si se hallaron 4 piezas defectuosas, ¿se debería inferir que el porcentaje de todas las piezas defectuosas es más del 5% al nivel de significación del 5%? 6. Un inversionista está por decidir entre dos provincias para abrir un centro comercial. Par esto debe probar la hipótesis de que hay diferencia en el promedio de ingresos familiares de las dos provincias. Si una muestra de 300 hogares de la provincia 1 da _ 1 $400x y 1 $90s y otra muestra de 400 hogares de la provincia 2 da _ 2 $420x y 2 $120s . ¿se puede inferir que las dos medias poblacionales son diferentes?, si es así, ¿en cual de las provincias debería abrir la sucursal? Utilice =0.05. 2 $120s _ 2 $420x _ 1 $400x
  • 31. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia43 Unidad 3 ANALISIS DE VARIANZA Nº de tutoría: Uno Tutoría Nº 4: ANÁLISIS DE VARIANZA : ANÁLISIS DE VARIANZA DE UNA VÍA Y DE DOS VÍAS.
  • 32. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia44
  • 33. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia45 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce el modelo del análisis de varianza. 1.2. Procedimentales Prueba las diferencias entre k-medias. 1.3. Actitudinales Comparan las medias de k-grupos o poblaciones. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: Análisis de varianza: conceptos básicos, Análisis de varianza de una vía (concepto, modelo, prueba de hipótesis); Análisis de varianza de dos vías (concepto, clases: sin interacción y con interacción, modelos) 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 34. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia46 Tutoría Nº Análisis de varianza: análisis de varianza de una vía y de dos vías 4.1. ANÁLISIS DE VARIANZA El análisis de varianza se emplea para probar las diferencias entre k medias. Una suposición básica implícita en el análisis de varianza es que las diversas medias muestrales se obtienen de las poblaciones distribuidas normalmente que tienen la misma varianza ². Sin embargo, se ha descubierto que el procedimiento de pruebas no se ve afectado por las violaciones de la suposición de normalidad cuando las poblaciones son unimodales y los tamaños de muestra son aproximadamente iguales. Todos los procedimientos de cálculo presentados son para efectos fijos, contrariamente a los modelos de efectos aleatorios. El concepto básico en el análisis de varianza fue desarrollado por R.A. Fisher y la distribución F se ha denominado en honor suyo. El razonamiento conceptual es el siguiente: (1) Se calcula la media para cada grupo de la muestra y después se determina el error estándar de la media S_ con base sólo en las diversas medias muestrales. (2) Dada la fórmula S_ = S/ n , tenemos que s = X Sn y que X Sns2 . Esta estimación resultante de la varianza de la población se llama la media cuadrática entre los grupos (MCE). (3) Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo. Luego se combinan estos valores de la varianza ponderándolos de acuerdo a n-1 para cada muestra. La estimación resultante de la varianza de la población se llama media cuadrática dentro de los grupos (MCD). (4) Si la hipótesis nula 1 = 2 = 3 = ... = k es verdadera, entonces tenemos que las dos medias cuadráticas obtenidas en (2) y (3) no están sesgadas y son estimadores independientes de la misma varianza de la población, ². Si la hipótesis nula es falsa, entonces el valor esperado de la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre las medias de la población inflarán la MCE, mientras que no afectarán la MCD. (5) Con base al numeral (4), se involucra una prueba de una cola y la fórmula general de la prueba F en el análisis de la varianza es: MCE MCD F Si la relación F está en la región de rechazo para el nivel de significación especificado, entonces se rechaza la hipótesis de que las diversas medias muestrales se obtuvieron de la misma población. Para simplificar este procedimiento con diseños en términos del modelo lineal que identifica los componentes que influyen sobre la variable aleatoria y se presenta una tabla estándar de análisis de varianza que muestra los cálculos necesarios de la media cuadrática para cada tipo de diseño experimental. 4
  • 35. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia47 4.2. ANÁLISIS DE VARIANZA DE UNA VÍA El modelo del análisis de varianza de una vía se relaciona con la prueba de la diferencia entre k medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos grupos de tratamiento. La ecuación lineal que representa el modelo del análisis de varianza de una vía es: Xik = + k + ik donde: = media global de todos los k grupos de tratamiento k = efecto del tratamiento en el grupo específico k, del cual se muestreo el valor ik = error aleatorio relacionado con el proceso de muestreo. La tabla siguiente es un resumen del análisis de varianza de una vía en la cual; MCD pasa a ser la media cuadrática entre los A grupos de tratamiento (MCA) y (MCE) es llamada media cuadrática del error, N asigna el tamaño total de la muestra para todos los grupos de tratamiento combinados, antes que el tamaño de la población. Tk representa la suma (total) de los valores muestreados en todos los grupos combinados. La hipótesis nula y alternativa son: Ho: k = 0 para todos los niveles de tratamiento Ha: k 0 para todos los niveles de tratamiento Si la hipótesis nula es verdadera, entonces tenemos que : 1 = 2 = 3 = ... = k . Fuente de variación Suma de los cuadrados, SC Grados de libertad, gl Media cuadrática MC Relación F Entre grupos de tratamiento A N T n T SCA k k 22 k – 1 1k SCA MCA MCE MCA F0 Error de muestreo, E SCASCTSCE n – k kn SCE MCE Total, T N T XSCT 2 2 N - 1 Ejemplo 4.1 Quince personas que se capacitan en un programa técnico son asignadas en forma aleatoria a tres tipos diferentes de enfoques de instrucción. Los puntajes de las pruebas de rendimiento, al concluir la especialización, se presentan en la tabla siguiente. Use el procedimiento de análisis de varianza para probar la hipótesis nula de que las tres medias muestrales son iguales a un nivel de significación del 5%. Método de Instrucción Puntaje de la prueba Tk Total A1 A2 A3 86 90 82 79 76 68 81 88 73 70 82 71 84 89 81 400 425 375 Total 1200
  • 36. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia48 Solución: Suma de cuadrados de tratamiento = N T n T SCA k k 22 = 250 15 1200 5 375 5 425 5 400 2222 Suma de cuadrados del total = N T XSCT 2 2 = 698 15 1200 718270...829086 2 222222 Suma de cuadrados del error = SCASCTSCE = 698 – 250 = 448 Fuente de variación Suma de cuadrados SC grados de libertad, gl Media cuadrática MC relación, F Entre grupos de trat., A SCA = 250 2 MCA =125 Fo = 3.35 Error de muestreo, E SCE = 448 12 MCE =37.33 Ft = 3.89 Total, T SCT = 698 14 Ft = F(1- , glA, glE) = F(0.95, 2, 12) = 3.89 Ho: 0321 Ha: 0lg iúna = 0.05 f.p. Fo = 3.35 Decisión: Como RAF0 se acepta Ho Conclusión: No hay efecto asociado a los niveles del método de instrucción por lo tanto las diferencias de métodos no son significativo, con un 5% de significación de prueba. Ejemplo 4.2 La tabla siguiente presenta el promedio de palabras mecanografiadas por minuto en diferentes marcas de máquinas eléctricas, por individuos asignados aleatoriamente sin experiencia previa en estas máquinas, después del mismo período de instrucción. Pruebe la hipótesis nula de que la media de palabras por minuto lograda para las tres máquinas no es diferente, usando un nivel de significación del 5%. Marca de las máquinas Promedio de palabras por minuto Tk Total A1 A2 A3 79 74 81 83 85 65 62 72 79 51 - 55 77 - - 352 231 280 Total 863 RA 1 – = 0,95 RR = 0,05 Ft = 3,89 F0 = 3,35
  • 37. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia49 Solución Suma de cuadrados de tratamiento = N T n T SCA k k 22 = 72.103 12 863 4 280 3 231 5 352 2222 Suma de cuadrados del total = N T XSCT 2 2 = 96.1376 12 863 557965...628379 2 222222 Suma de cuadrados del error = SCASCTSCE = 1376.96 – 103.72 = 1273.20 Fuente de variación Suma de cuadrados SC Grados de libertad, gl Media cuadrática MC Relación, F Entre grupos de trat., A SCA = 103.72 2 MCA = 51.86 Fo = 0.37 Error de muestreo, E SCE = 1273.20 9 MCE = 141.47 Ft = 4.26 Total, T SCT = 1376.92 11 Ho: 0321 Ha: 0lg iúna = 0.05 f.p. Fo = 0.37 Ft = 4.26 Decisión: Como RAF0 se acepta Ho Conclusión: No existe diferencia significativa entre las 3 máquinas de escribir en términos de velocidad de mecanografía, con un 5% de significación de prueba. 4.3. ANÁLISIS DE VARIANZA DE DOS VÍAS El análisis de varianza de dos vías se basa en dos conjuntos de clasificaciones o tratamientos. Por ejemplo, al analizar el nivel de rendimiento de un programa de capacitación, podríamos considerar ambos efectos, el del método de instrucción y el del rendimiento escolar anterior. Asimismo, podríamos investigar el kilometraje de gasolina según la categoría de peso del automóvil y el grado de la gasolina. En las tablas de datos, los tratamientos identificados en los encabezamientos de la columna se llaman típicamente tratamientos A; aquellos en los encabezamientos de fila se denominan tratamientos B. La interacción en un experimento de dos factores significa que los dos tratamientos no son independientes y que el efecto particular de los niveles de tratamiento en un factor difiere según los niveles del otro factor. Por ejemplo, al estudiar el kilometraje de un automóvil, una gasolina de octanaje más alto puede mejorar el kilometraje para ciertos tipos de autos pero no p ara otros. Además la efectividad de varios métodos de instrucción puede diferir según los niveles de RA 1 – = 0,95 RR = 0,05 Ft = 4,26 F0 = 0,37
  • 38. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia50 capacidad de los estudiantes. Con el objeto de probar la interacción, en cada célula de la tabla de datos de dos vías debe incluirse más de una observación o medición muestreada (reiteración). 4.3.1. Análisis de varianza de dos vías sin interacción (diseño de bloque aleatorizado) El modelo de análisis de varianza de dos vías en el cual hay una sola observación por célula se denomina a menudo diseño de bloque aleatorizado, debido a un tipo particular de uso para este modelo. El objetivo de utilizar éste diseño no tiene propósito específico de probar un efecto de los "bloques". Más bien, al ser capaz de asignar alguna variabilidad a los sujetos antes del rendimiento, la MCE, puede reducirse y la prueba resultante del efecto de los tratamientos A ser más sensible. La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es: Xjk = + j + k + jk Donde: = media global de cualquier tratamiento j = efecto del tratamiento j o del bloque j en la dimensión B de clasificación. k = efecto del tratamiento k en la dimensión A de clasificación. ik = error aleatorio relacionado con el proceso de muestreo. Las hipótesis correspondientes serían: Ho : k = 0 Ha : k 0 La tabla de resumen para el análisis de varianza de dos vías sin interacción se da a continuación: Fuente de variación Suma de los cuadrados, SC Grados de libertad, gl Media cuadrática MC Relación F Entre grupos de tratamiento A N T n T SCA k k 22 K - 1 1K SCA MCA MCE MCA F0 Entre grupos de tratamiento B N T T k SCB j 2 21 J - 1 1J SCB MCB Error de muestreo, E SCBSCASCTSCE (J–1) (K– 1) )1()1( KJ SCE MCE Total, T N T XSCT 2 2 N - 1 Ejemplo 4.3 Para los datos de la tabla siguiente suponga que en la realidad se utilizó un diseño de bloque aleatorizado y que se parearon los participantes antes del experimento, asignando un participante de cada grupo de aptitud (con base en los rendimientos anteriores del curso) a cada método de instrucción. La tabla siguiente es una revisión de la tabla del ejemplo 1, en el sentido que los valores presentados se han reorganizado para reflejar el diseño de bloque aleatorizado. Sin embargo observe que en cada grupo de tratamiento A se incluyen los mismos valores, excepto que se indican de acuerdo a los grupos de aptitud B y, por lo tanto, están dispuestos en un orden diferente. Pruebe la hipótesis nula de que no existe diferencia en el desempeño promedio entre los tres métodos de instrucción y los niveles de aptitud, utilizando un nivel de significación del 5%.
  • 39. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia51 Nivel de aptitud Método de instrucción Tj TotalA1 A2 A3 B1 86 90 82 258 B2 84 89 81 254 B3 81 88 73 242 B4 79 76 68 223 B5 70 82 71 223 Total Tk 400 425 375 1200 Solución: Suma de cuadrados de tratamiento = N T n T SCA k k 22 = 250 15 1200 5 375 5 425 5 400 2222 Suma de cuadrados de bloque = N T T k SCB j 2 21 = 33.367 15 1200 3 223 3 223 3 242 3 254 3 258 222222 Suma de cuadrados del total = N T XSCT 2 2 = 698 15 1200 718270...829086 2 222222 Suma de cuadrados del error = SCBSCASCTSCE = 698 – 250 – 367.33 = 80.87 Fuente de variación Suma de cuadrados SC grados de libertad, gl Media cuadrática MC relación, F Entre grupos de trat., A SCA = 250 2 MCA = 125 Fo = 12.4 Ft = 4.46 Entre grupos de bloque B SCB = 367.33 4 MCB = 91.83 Error de muestreo, E SCE = 80.87 (2)(4) = 8 MCE = 10.98 Total, T SCT = 698 14 Ho: 0321 Ha: 0lg iúna = 0.05 f.p. Fo = 12.4 Ft = 4.46 RA 1 – = 0,95 RR = 0,05 Ft = 4,46 F0 = 12,4
  • 40. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia52 Decisión: Como RRF0 rechazamos Ho Conclusión: Existe diferencia significativa entre los porcentajes de rendimiento para los diferentes métodos de instrucción, cuando se consideran el nivel de aptitud. Utilizando una prueba significativa. 4.3.2. Análisis de varianza de dos vías con interacción (N observaciones por célula) Cuando se utiliza este diseño se pueden probar por el análisis de varianza tres hipótesis nulas diferentes; que no hay efectos de columna (las medias de las columnas no son significativamente diferentes) y que no hay efectos de fila (las medias de las filas no son significativamente diferentes) y que no hay interacción entre los dos factores (los dos factores son independientes). Un efecto de interacción significativo indica que el efecto de los tratamientos para un factor varía según los niveles del otro factor. En tal caso, la existencia de efectos de columna y de fila puede no tener mucho significado desde el punto de vista de la aplicación de los resultados de la investigación. La ecuación lineal para el modelo del análisis de varianza de dos vías sin interacción es: Xijk = + j + k + ijk + ijk Donde: = media global independiente de cualquier tratamiento j = efecto del tratamiento j en la dimensión B. k = efecto del tratamiento k en la dimensión A. ijk = efecto de la interacción entre el tratamiento j (del factor B) y el tratamiento k (del factor A) ik = error aleatorio relacionado con el proceso de muestreo. Las hipótesis correspondientes serían: Ho : k = 0 Ho : j = 0 Ho : Ijk = 0 Ha : k 0 Ha : j 0 Ha : Ijk 0 La tabla de resumen para el análisis de varianza de dos vías con interacción se da a continuación: Fuente de variación Suma de los cuadrados, SC Grados de libertad, gl Media cuadrática MC Relación F Entre grupos de tratamiento A N T T n SCA k 2 21 K - 1 1K SCA MCA MCE MCA F0 Entre grupos de tratamiento B N T T kn SCB j 2 21 J – 1 1J SCB MCB MCE MCB F0 Interacción (entre grupos de tratamiento A y B) I N T SCBSCA X n SCI 2 21 (J–1) (K– 1) )1()1( KJ SCI MCI MCE MCI F0 Error de muestreo, E SCI SCBSCASCTSCE JK (n–1) )1(nJK SCE MCE Total, T N T XSCT 2 2 N - 1
  • 41. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia53 Ejemplo 4.4 Nueve personas que se capacitan en cada una de cuatro áreas temáticas diferentes fueron asignadas en forma aleatoria a tres métodos de instrucción distintos. Se asignaron tres estudiantes a cada método de instrucción. Se refiere a la tabla siguiente, pruebe las diversas hipótesis nulas que son de interés respecto a tal diseño, a un nivel de significación del 5%. Área temática Método de instrucción Total Tj A1 A2 A3 B1 70 79 72 83 89 78 81 86 79 717 221 250 246 B2 77 81 79 77 87 88 74 69 77 709 237 252 220 B3 82 78 80 94 83 79 72 79 75 722 240 256 226 B4 85 90 87 84 90 88 68 71 69 732 262 262 208 Total Tk 960 1020 900 T=2880 Solución: Suma de cuadrados de tratamiento A = N T T nk SCA k 2 21 = 600 36 2880 12 900 12 1020 12 960 2222 Suma de cuadrados de tratamiento B = N T T nj SCB j 2 21 = 8.30 36 2880 9 732 9 722 9 709 9 717 22222 Suma de cuadrados de la interacción = N T SCBSCA X n SCI 2 21 = 9.533 36 2880 8.30600 3 208 3 262 3 262 ... 3 246 3 250 3 221 2222222 Suma de cuadrados del total = N T XSCT 2 2 = 0.1600 36 2880 698887...818370 2 222222 Suma de cuadrados del error = SCISCBSCASCTSCE = 1600 – 600 – 30.8 – 533.9 = 435.3
  • 42. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia54 Fuente de variación Suma de cuadrados SC Grados de libertad, gl Media cuadrática MC relación, F Entre grupos de trat., A (método) SCA = 600.0 3-1 = 2 MCA = 300 Fo = 16.57 Entre grupos de trat., B (tema) SCB = 30.8 4-1 = 3 MCB = 10.3 Fo = 0.57 Interacción entre método y tema, I SCI = 533.9 (2)(3) = 6 MCI = 18.1 Fo = 4.92 Error de muestreo, E SCE = 435.3 (4)(3)(2) = 24 MCE = 18.1 Total, T SCT = 1600.0 36-1=35 Ho: 321 AAA Ho: 321 BABAB Ho: 0jkI Ha: 0lg iúna Ha: 0lg júna Ha: 0jkI = 0.05 f.p. Fo = 16.57 Fo = 0.57 Ft = F(2,24,0.95) = 3.4 Ft = F(3,24,0.95) = 3.0 Fo = 4.92 Ft = F(6,24,0.95) =2.5 Decisión: 1. Como RRF0 rechazamos Ha 2. Como RAF0 aceptamos Ho 3. Como RRF0 aceptamos Ha Conclusión: Hay diferencia satisfactoria entre los porcentajes de los métodos de instrucción, no hay diferencia significante entre las distintas áreas hay interacción importante entre los dos factores: La última conclusión indica que varía la efectividad de los tres métodos de instrucción para las diferentes áreas temáticas. RA 1 – = 0,95 RR = 0,05 RA 1 – = 0,95 RR = 0,05 RA 1 – = 0,95 RR = 0,05 Ft = 3.4 Ft = 3.0 Ft = 2.5 Fo = 16.57 Fo = 0.57 Fo = 4.92
  • 43. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia55 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) El análisis de varianza se emplea para probar las diferencias entre k medias. ( ) El análisis de varianza de dos vías se basa en dos conjuntos de tratamientos ( ) Al análisis de varianza de dos vías sin interacción se le conoce como diseños de bloque aleatorizado. ( ) El modelos del análisis de varianza de dos vías es: Xik = + k + ik ( ) MCE es llamada media cuadrática del error 2. En 12 depósitos al por menor se establecieron 4 tipos de exhibiciones de publicidad, con tres depósitos asignados en forma aleatoria a cada una de las exhibiciones con el propósito de estudiar el impacto de la exhibición en el punto de venta. Refiriéndose a la tabla siguiente, pruebe la hipótesis de que no existe diferencia entre las medias de los valores de venta para los cuatro tipos de exhibiciones, usando un nivel de significancia del 5%. Tipo De Exhibición VENTAS 1 2 3 E1 E2 E3 E4 40 44 43 53 54 59 48 38 46 48 61 47 3. Los siguientes son los números de hornos de microondas que venden cada uno de los vendedores de las tres sucursales de una compañía distribuidora de artículos domésticos SUCURSAL ALFA 21 11 17 28 SUCURSAL BETA 27 15 18 26 17 21 SUCURSAL GAMMA 24 17 31 12 15 Realice un ANVA para probar, con un nivel de significancia de 0.05, si la hipótesis nula de que en promedio las ventas de las tres sucursales son las mismas. 4. Completar la siguiente tabla de análisis de varianza (ANVA) FUENTE VARIACION SUMA DE CUADRADO S GRADO DE LIBERTAD MEDIA CUATRADTICA F Tratamiento 2 Error 9 10 Total 120 5. Un ejecutivo de marketing llevó a cabo un estudio para examinar el efecto comparativo de 3 técnicas diferentes de promoción en 4 zonas diferentes de ventas y obtuvo los resultados mostrados en la tabla siguiente. Determinar las conclusiones a las que puede llegar usando los resultados de la tabla ANVA y formule en forma clara las hipótesis de contraste. FUENTE VARIACION SUMA DE CUADRADOS GRADO DE LIBERTAD MEDIA CUADRATICA F Entre técnicas promocionales 7.48 Entre zonas de ventas 3 Error 3.90 6 Total 11.41 11
  • 44. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia56
  • 45. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia57 Unidad 4 TEORIA DE LA TOMA DE DECISIONES Nº de tutoría: Uno Tutoría Nº 5 Teoría de la toma de decisiones
  • 46. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia58
  • 47. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia59 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce los conceptos del análisis estadístico en la toma de decisiones. 1.2. Procedimentales Elaboran tabla, diagrama en base a las probabilidades para la toma de decisiones. 1.3. Actitudinales Realiza toma de decisiones basadas en un análisis estadístico en un problema de investigación. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: La estructura bayesiana comparada con la estadística clásica conceptos fundamentales (conceptos generales), estructura de la tabla de decisión; toma de decisiones basadas en probabilidades (criterios: probabilidad máxima, esperanza del evento); toma de decisiones con base sólo en las consecuencias económicas (criterios: maximin, máximax, pena mínimax); toma de decisiones con base en probabilidades y consecuencias económicas (criterios: del valor esperado o criterio bayesiano, mínima pérdida de oportunidad o pena esperada); análisis de árbol de decisión. 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD. Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 48. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia60 Tutoría Nº Teoría de la toma de decisiones 5.1. LA ESTRUCTURA BAYESIANA COMPARADA CON LA ESTADÍSTICA CLÁSICA La estadística clásica trata en lo fundamental dos problemas estrechamente relacionados: 1. El problema de la estimación de algunos parámetros de la población, como la media aritmética de la población y la proporción poblacional p. 2. El problema de probar una hipótesis respecto a alguna característica o parámetro de la población Pero, ya sea que el problema consista en estimar algún parámetro de la población o probar (o contrastar o verificar) una hipótesis respecto al valor de ese parámetro, el método que se usa para resolver el problema es uno y el mismo; se selecciona una muestra aleatoria de la población y esta información muestral se convierte en la base de todas las inferencias acerca de los parámetros de la población. Para ejemplificar esto, supóngase que el problema inmediato es estimar el porcentaje de estudiantes del quinto año de secundaria en un colegio. Si una muestra aleatoria de 100 estudiantes seleccionados de este colegio revela que hay 10 esudiantes del último año, entonces se estimará el porcentaje de estudiantes del último año de todo el colegio como 10/100 ó 10%. La información que se puede utilizar al hacer una inferencia sobre una característica de la población, por lo general, se clasifica en dos clases: la información objetiva y la información subjetiva. Por ejemplo, la información que se obtiene por medio de muestreos es información objetiva. Por otra parte, la opinión personal del experto en un campo es información subjetiva. Al estimar el porcentaje de estudiantes del último año del colegio como 10%, se ha adoptado el método tradicional o clásico de la inferencia estadística, un método en el que la inferencia acerca de la población se basa de una manera estricta en información muestral objetiva. En contraste con el método estadístico clásico, en el que sólo se puede utilizar información muestral objetiva, un enfoque alternativo de la estadística, llamado estadística de Bayes, puede utilizarse toda la información disponible pertinente: subjetiva y objetiva. En la estadística de Bayes, una inferencia sobre un parámetro de la población puede hacerse partiendo de información subjetiva exclusivamente. Sin embargo, si posteriormente se cuenta con información muestral objetiva, se combinan la información subjetiva y la objetiva, y las inferencias sobre el parámetro de la población se basan en esta información combinada. La distinción entre la estadística clásica y la de Bayes, puede presentarse desde una perspectiva definida considerando el ejemplo siguiente: Una compañía manufacturera está considerando la compra de una nueva máquina, denominada la máquina A. La decisión de si se compra o no la máquina A se basará en el porcentaje de partes defectuosas que produzca la máquina. En base a su experiencia pasada con otras máquinas semejantes, el ingeniero de control de calidad de la compañía estima el porcentaje de partes defectuosas producidas por la máquina A según la siguiente tabla: PORCENTAJE DE PARTES DEFECTUOSAS PROBABILIDAD 0,05 0,06 0,07 0,30 0,50 0,20 Esto significa que el ingeniero de control de calidad no está absolutamente seguro del porcentaje de partes defectuosas que produce la máquina A. Sin embargo, en base a cualquier conocimiento 5
  • 49. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia61 o experiencia que posee, el ingeniero piensa personalmente que es de 0,30 la probabilidad de que el porcentaje de partes defectuosas producidas por la máquina A sea 5% es de 0,50 la probabilidad de que el porcentaje de partes defectuosas sea 6% y hay un riesgo de 0,20 en que el porcentaje de partes defectuosas sea 7%. Dos observaciones importantes pueden hacerse en esta fase de la discusión. Primera, la información del ingeniero de control de calidad respecto a la máquina A es personal o subjetiva, puesto que algún otro ingeniero bien podría dar una estimación del porcentaje de partes defectuosas que produce la máquina A. Segunda, en contraste con la estadística de Bayes está especialmente diseñada para hacer uso más constructivo de este tipo de información. De hecho, usando la información subjetiva del ingeniero de control de calidad, la estadística de Bayes permitirá a la compañía decidir si compra o no la máquina A. Continuando el caso de la máquina A, supóngase además que en una serie de pruebas, una muestra aleatoria de 100 partes producidas por la máquina A revela que hay 4 partes defectuosas. Ahora bien, según la estadística, el porcentaje de partes defectuosas producidas por la máquina A se estima como 4%. Sin embargo, usando la estadística de Bayes la información muestral se combina con la información subjetiva del ingeniero de control de calidad, y una estimación del porcentaje de partes defectuosas producidas por la máquina A se hace, partiendo de esta combinación de información. El uso de información subjetiva en la inferencia estadística es sólo una de las características de la estadística bayesiana. En los últimos años, la estadística bayesiana se ha convertido en una teoría integrada para la toma de decisiones, llamada la teoría de decisión bayesiana. La teoría de decisión bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre. Esta teoría le proporciona a quien toma una decisión un procedimiento racional y sistemático que le permite elegir entre varios cursos de acción posible cuando las consecuencias de cada una de estas acciones están sujetas a incertidumbre. I. Estructura de tablas de decisión Una tabla de decisión identifica la ganancia (o pérdida) ocasional asociada por todas las combinaciones posibles de actos y sucesos de decisión, también indica la probabilidad de ocurrencia para cada uno de los eventos mutuamente excluyentes. TABLA 1 ESTRUCTURA GENERAL DE UNA TABLA DE DECISIÓN EVENTO PROB. ACTOS A1 A2 A3 ... An E1 E2 E3 ... Em p1 p2 p3 ... pm X11 X21 X31 ... Xm1 X12 X22 X32 ... Xm2 X13 X23 X33 ... Xm3 ... ... ... ... ... X1n X2n X3n ... Xmn Donde: Actos: Son los cursos de acción alternativos, o estrategias, que están a disposición de la persona que toma la decisión. Como resultado del análisis se elige uno de estos actos como el mejor. Eventos: Identifica las ocurrencias que están fuera del control de la persona que toma la decisión y que determina el nivel de éxito de un acto dado. Probabilidad: Deben estar disponibles, pueden basarse en actos objetivos o determinarse subjetivamente con base en el criterio. Las sumas de las probabilidades siempre es 1,00. Las entradas en las células: Son valores condicionales o consecuencias económicas condicionales. Frecuentemente se denominan pagos y son condicionales pues el resultado económico depende del acto de decisión que se elige y del evento que ocurre.
  • 50. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia62 II. Toma de decisiones basadas en probabilidades Esto se efectúa haciendo uso de la primera y segunda columna de la tabla 1. Criterios 1º Probabilidad máxima: Es aquel que se selecciona el acto del evento que presenta mayor probabilidad. 2º Esperanza del evento: Es aquel que se selecciona el acto del evento considerando la esperanza matemática del evento. E(e) = e p(e) Obs. Representa una base incompleta para efectuar toma de decisión. III. Toma de decisiones con base sólo en las consecuencias económicas La tabla que se usa es similar a la tabla 1, excepto que por la ausencia de las probabilidades de los eventos. Criterios 1º Maximin: Esta estrategia de decisión es "altamente conservadora" pues la persona que toma la decisión se preocupa de que "pueda suceder lo peor" respecto a cada acto. Cálculo: Se determina el valor mínimo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor. 2º Máximas: Es el estándar por el cual el mejor acto es el para el que el valor máximo es mayor que el máximo de cualquier otro acto de decisión. Este criterio se opone filosóficamente al criterio maximin, pues la persona que toma las decisiones está orientada hacia "lo mejor que puede suceder" con respecto a cada acto. Cálculo: Se determina el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es mayor. 3º Pena Minimax (Pérdida de oportunidad condicional): Es la diferencia entre el resultado económico del mejor acto dado que ha ocurrido en un evento particular y el resultado económico de acto. El valor "mejor" o más deseado de la pena es "0". Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor, en cada fila, luego el valor máximo de cada columna. El mejor acto es aquel para el cual el valor resultante es menor. IV. Toma de decisiones con base en probabilidades y consecuencias económicas Estos métodos utilizan toda la información contenida en la tabla 1. Criterios 1º Del valor esperado (VE) o Criterio Bayesiano: Es la norma por el cual el mejor acto es aquel para el que el resultado económico esperado es el más alto como promedio a largo plazo. Cálculo: Se determina multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es mayor. 2º Minima pérdida esperada de oportunidad (PEO) o Pena esperada.- El acto con la mayor ganancia esperada tendría la menor pena esperada. Cálculo: Se determina la tabla pena minimáx restando el resultado de cada acto del mejor en cada fila, luego se multiplicando el valor condicional para cada combinación evento/acto por la probabilidad del evento y sumando estos resultados para cada acto (columna). El mejor acto es aquel para el cual el valor resultante es menor. V. Análisis de árbol de decisión Es el método que puede utilizarse para identificar el mejor acto inicial, como también los mejores actos subsiguientes. Proceso 1º Construir el árbol de decisión de izquierda a derecha, con sus puntos de decisión (puntos secuenciales en los cuales tiene que hacerse la elección) y eventos causales (puntos
  • 51. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia63 secuenciales en los cuales ocurrirá un evento probabilístico). Depende del análisis apropiado, de la situación global de decisión. 2º Se colocan en el diagrama los valores de probabilidad asociados con los eventos causales y las consecuencias económicas. Los valores esperados de los actos alternativos en el punto inicial de decisión, los valores esperados se calculan sistemáticamente de derecha a izquierda en el árbol de decisión. Este proceso se llama "devolverse". Ejemplo 5.1 Un contratista de calefacción y aire acondicionado debe comprometerse a comprar unidades de aire acondicionado desde el 1ero de abril, para reventa e instalación durante la próxima temporada de verano. Con base en la demanda del verano anterior, en las actuales condiciones económicas y en los factores de competencia del mercado, calcula que hay una probabilidad de 0,10 de vender sólo 5 unidades, una probabilidad de 0,30 de vender 10 unidades, una probabilidad de 0,40 de vender 15 unidades y una probabilidad de 0,20 de vender 20 unidades. Los equipos de aire acondicionado se pueden ordenar sólo en grupos de cinco, siendo el costo unitario de $1000 y el precio al por menor de $1300 (más gastos de instalación). Todas las unidades que no se han vendido al término de la temporada se devuelven al fabricante por un crédito neto de $800, después de deducir los gastos de embarque. Determine los mejores actos de decisión desde el punto de vista de los criterios. a) basada sólo en probabilidades, (probabilidad máxima y esperanza del evento). b) basada sólo en las consecuencias económicas, (maximin, maximax, pena minimax). c) basada en probabilidades y consecuencias económicas, (criterio bayesiano y pena esperada de oportunidad). Solución: (Tabla de ganancias) E Demanda P (E) ACTOS (Compra – Stock) A1 = 5 A2 = 10 A3 = 15 A4 = 20 E1 = 5 E2 = 10 E3 = 15 E4 = 20 0.10 0.30 0.40 0.20 1500 1500 1500 1500 500 3000 3000 3000 (500) 2000 4500 4500 (1500) 1000 3500 6000 Valor esperado 13,3 Maximin 1500 500 (500) (1500) Máxima x 1500 3000 4500 6000 C. Bayesiano 1500 2750 3250 2750 (Tabla de pérdida de oportunidad) E Demanda P (E) ACTOS (Cantidad de orden) A1 = 5 A2 = 10 A3 = 15 A4 = 20 E1 = 5 E2 = 10 E3 = 15 E4 = 20 0.10 0.30 0.40 0.20 0 1500 3000 4500 1000 0 1500 3000 2000 1000 0 1500 3000 2000 1000 0 Pena Mimi max 4500 3000 2000 3000 Pena esperada de oportunidad 2550 1300 800 1300 a) i) Como la probabilidad máxima es 40%, entonces el mejor acto de decisión es ordenar la compra de 15 unidades de aire acondicionado. ii) Como el valor esperado = EP(E) = 13,3 y las ordenes se afectan en grupos de 5, luego el mejor acto de decisión, es ordenar la compra de 15 unidades de aire acondicionado. b) Maximinin: ordenar comprar 5 unidades de aire acondicionado Maximimax: ordenar comprar 20 unidades de aire acondicionado Pena mínimas: ordenar comprar 15 unidades de aire acondicionado c) Criterio Bayesiano: ordenar comprar 15 unidades de aire acondicionado Pena esperada de oportunidad: ordenar comprar 15 unidades de aire acondicionado
  • 52. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia64 Ejemplo 5.2 a. A un fabricante se le presentó un proyecto para un producto nuevo, y debe decidir si desarrollarlo o no. El costo del desarrollo de proyecto es S/. 200 000; la probabilidad de éxito es 0,70. Si el desarrollo no tiene éxito se termina el proyecto. Si tiene éxito, el fabricante debe entonces decidir si el nivel de producción ha de ser alto o bajo. Si la demanda es alta, el aumento en la utilidad, dado un nivel elevado de producción, es de S/. 700 000; dado un nivel bajo, es de S/. 150 000. Si la demanda es baja, el incremento en la utilidad, dado un nivel elevado de producción es S/. 100 000; dado un nivel bajo es S/. 150 000. Todos estos incrementos en utilidades son cifras brutas (es decir, antes de restar los S/. 200 000 del costo de desarrollar el producto). Se estima que la probabilidad de una demanda elevada es 0,40 y para la demanda baja es 0,60. Elabore el árbol de decisiones para esta situación. La figura muestra el árbol de decisión de este problema: : Puntos de decisión : Eventos aleatorios b. Con referencia a la figura 1, determine si el fabricante debe intentar el desarrollo de este producto o no, determinando la ganancia esperada correspondiente a las acciones alternativas “desarrollar” y “no desarrollar”. En la figura 2 se repite el árbol de decisión presentado en la figura 1, pero ahora se incluyen las ganancias esperadas correspondientes a cada una de las decisiones posibles del proceso secuencial, y se eliminan las acciones no preferidas de cada decisión, cruzando con dos rayas la rama correspondiente. Trabajando de derecha a izquierda, se determina la ganancia esperada de la decisión “nivel alto de producción”, y que es de S/. 140 000, de la siguiente manera: GE (nivel alto de fabricación) = (0,40) (500 000) + (0,60) (-100 000) = S/. 140 000 De manera análoga: GE (nivel bajo de fabricación) = (0,40) (-50 000) + (0,60) (-50 000) = S/. 50 000 Figura 1. Diagrama del árbol de decisión
  • 53. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia65 Al comparar las dos ganancias esperadas, la mejor decisión es “nivel alto de fabricación”; se elimina la posibilidad de la otra acción. Pasando a la izquierda hacia el siguiente punto de decisión (que es también el punto inicial de decisión en este caso), las ganancias esperadas para las dos posibles decisiones son: GE (desarrollar) = (0,70) (140 000) + (0,30) (-200 000) = S/. 38 000 GE (no desarrollar) = S/. 0 Al comprar las dos ganancias esperadas, la mejor acción en el punto inicial es “desarrollar”. Al calcular la ganancia esperada de “desarrollar”, debe observarse que la probabilidad de 0,70 (para “desarrollo con éxito”) se multiplica por S/. 140 000, y se ignora la rama adyacente de S/. –50 000, debido a que corresponde a una decisión eliminada en la etapa previa de análisis. Figura 2: Diagrama del árbol con reversión
  • 54. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia66 AUTOEVALUACIÓN 1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados: ( ) La pena mínimax se calcula en la tabla de perdida. ( ) El criterio que maximiza los pagos mínimos de todos los actos se llama máximas. ( ) En el criterio máximax, el mejor acto es aquel para el cual el valor resultante es mayor. ( ) Los eventos son los cursos de acción alternativos, que están a disposición de la persona que toma la decisión. ( ) La teoria bayesiana trata el problema de la toma de decisiones bajo condiciones de incertidumbre. 2. Supóngase que un fabricantes de equipos de oficina debe decidir si ampliar la capacidad de su planta ahora o espera otro año. Sus consejeros le advierten que si hace ahora la ampliación y las condiciones económicas siguen siendo favorable, se logrará una utilidad de $ 369 000; si hace ahora la ampliación y existe alguna recesión económica, habrá un pérdida (utilidad negativa) de $ 900 000; si espera otro año y las condiciones económicas siguen siendo favorables, se logrará una utilidad de $ 180 000; y si espera otro año, y existe una recesión económica, se logrará una pequeña utilidad de $ 18 000. a) Construya una tabla de pagos. b) Construya una tabla de pérdida 3. Un canillita debe ordenar los periódicos con un día de anticipación. El costo de los periódicos es de $ 2 la docena y el precio de venta es de $ 4 la docena. Los periódicos no vendidos al cabo del día deben devolverse. Si el canillita estima la demanda diaria de su clientela por periódicos en la forma siguiente: Demanda diaria, en docenas: 12, 13, 14. Probabilidad de la demanda 0.20, 0.30, 0.50. a) Establecer la tabla de pago y de pérdida. b) Determine los mejores actos de decisión desde el punto de vista de los criterios: Probabilidad máxima, valor esperado, maximin, máximax, pena mínimax, criterio bayesiano y pena esperada de oportunidad 4. Dada la siguiente tabla de resultados: UTILIDADES Suceso Probabilidad Acciones A 1 A2 A3 A4 A B C D 0.1 0.2 0.5 0.2 20 0 -30 -40 20 40 20 0 20 40 60 40 20 40 60 80 a) Determínese la acción óptima mediante la Probabilidad Máxima b) Determínese la acción óptima utilizando el criterio Bayesiano y Pena Esperada de Oportunidad c) Determínese la acción óptima utilizando el criterio MÁXIMAX, MAXIMIN, MINIMAX 5. La junta directiva de un hospital privado debe decidir, sobre fases financieras, si autoriza fondos a un nuevo centro de atención a pacientes cardiacos. La junta considera que si se construye el nuevo centro y contratan a un cardiólogo de prestigio nacional, el centro percibirá $ 7.2 millones. Si se construye el nuevo centro pero no pueden contratar un cardiólogo eminente, habrá una pérdida de $ 1.25 millones. Si se remodela el antiguo centro de cardiología y se contrata a un cardiólogo eminente, el centro captará $ 2 millones. Si se remodela el centro y no contratan a un cardiólogo eminente, la institución sólo percibirá $ 0.5 millones. a) Construya una tabla de pagos. b) Trace un árbol de decisión.
  • 55. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia67 Unidad 5 CONTRO DE CALIDAD Nº de tutorías: Dos Tutoría Nº 6: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA MEDIA DEL PROCESO. Tutoría Nº 7: CONTROL DE CALIDAD: GRAFICA DE CONTROL PARA LA VARIACIÓN DEL PROCESO Y PARA LA PROPORCIÓN DE DEFECTUOSOS.
  • 56. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia68
  • 57. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia69 A. Aspectos preliminares 1. Competencias 1.1. Conceptuales Reconoce los conceptos de las técnicas muy útiles que se usan en la industria para controlar y mejorar la calidad del producto. 1.2. Procedimentales Elaboran diagramas de control para controlar y mejorar el producto de un proceso de manufactura. 1.3. Actitudinales Asegurar que las variables que miden la calidad de un producto queden dentro de los intervalos que son aceptables para posibles clientes. B. Desarrollo del contenido, sus procedimientos y modalidad 1. Contenido programático El contenido programático de la unidad referida es el siguiente: control de calidad, introducción, métodos de control de calidad: técnicas de supervisión, técnicas de localización de problemas, técnicas de selección, supervisión de la calidad mediante graficas o diagramas de control, grafica de control para media del proceso: diagrama de x ; gráfica de control para la variación del proceso: diagrama de r, gráfica de control para la proporción de defectuosos: diagrama de p; gráfica de control para el número de defectuosos por unidad: diagrama de c 2. Modalidad y procedimiento de desarrollo de la unidad Durante la fase a distancia a) Cada alumno lee la primera unidad del módulo. b) Cada alumno desarrolla las prácticas dirigidas y los trabajos prácticos. c) Remite las prácticas y los trabajos a la página web de PROESAD. Durante la fase presencial/tutorial a) Exposición sobre los trabajos elaborados y remitidos. b) Refuerzo del profesor con incidencia y corrección en los puntos fuertes y debilidades.
  • 58. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia70 Tutoría Nº Control de calidad: grafica de control para la media del proceso ESTUDIO DE UN CASO El Caso del Aceite Perdido Considérese un problema administrativo, en el que usted es el encargado de la operación de llenar latas de aceite lubricante para motores. Los envases de un cuarto de galón, el tipo que se compra en una estación de servicio local, se llenan con una máquina que tiene 28 boquillas (inyectores). Cada boquilla descarga el aceite en una lata, y la máquina llena así los 28 envases, uno con cada inyector. El problema se presenta cuando los controladores de la compañía detectan una discrepancia extraña. Aunque la cantidad de aceite que se recibe mensualmente para la operación de llenado asciende a 10 000 000 de cuartos de galón, el número de latas de una cuarto que se llenan, es siempre considerablemente menor. Si el número de latas llenadas de un mes dado es de 9 700 000, ¿qué pasó con los 300 000 cuartos de aceite perdido? El problema que acabamos de describir es similar al problema encontrado por V. Filimon y sus colegas quienes trabajan, en ese tiempo, para la Estándar Oil Company en Cleveland, Ohio (V. Filimon, R. Maggass, D. Frazier y A. Flingel, “Some Applications of Quality Control Techniques in Motor Oil Can Filing, Industrial Quality Control, Vol. 12, 1995”). Su operación consistió en usar tres maquinas llenadoras cada una con 6 boquillas para latas de un cuarto, otra con 28 boquillas también para un cuarto y una mas con 16 inyectores para latas de un galón. La búsqueda del aceite perdido se concentro rápidamente en la maquina llenadora. ¿Se puede ajustar una máquina para que una boquilla descargue exactamente un cuarto de aceite en cada lata? La respuesta es negativa, porque la cantidad de aceite descargada para una sola boquilla difiere ligeramente de la que descargue otra, debido a la variación en el flujo del aceite por la citada boquilla. Así la cantidad x de aceite descargada en una lata, medida en volumen o en peso, varia de una lata a otra y tiene una distribución de frecuencias relativas. Esta variación en el peso de llenado, llevo a Filimon y a sus colegas, a sospechar que el aceite perdido salía de la planta en las mismas latas. La operación de llenar los envases, y sus problemas inherentes, es comparable a la mayoría de las operaciones actuales en los negocios. Cada operación origina un producto que se considera aceptable o inaceptable, dependiendo de una o más variables que miden la calidad del producto. El producto de una operación de llenado de envases de aceite es una lata de aceite; una medida de su calidad es la cantidad de aceite depositado en cada lata. El producto de una máquina que origina lámparas eléctricas es una bombilla o un foco, y una medida de su calidad es la cantidad de luz que emita. El producto de un hospital es el tratamiento médico y el cuidado para un solo paciente. La calidad del cuidado de un paciente se mediría, sin duda, mediante un cierto número de variables de calidad. En esta unidad presentaremos algunas técnicas administrativas y estadísticas para supervisar, mejorara y controlar la calidad del producto de una operación actual en los negocios. 6
  • 59. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia71 6.1. INTRODUCCION El objetivo de este capitulo es presentar algunas técnicas muy útiles que se usan en la industria para controlar y mejorar la calidad de productos manufacturados así como para el mejoramiento de la calidad de sistemas de administración. Como lo indica el titulo, la metodología del control de calidad se estructuro para controlar y mejorar el producto de un proceso de manufactura. Los perfiles o barras de acero deben tener una resistencia a la tensión especifica; un jabón tiene que ser producido con un nivel bajo de impurezas; una caja de cereales debe tener un contenido en peso específico, y los datos de entrada financieros en una computadora para administración tienen que ser exactos y preciso, con una alta probabilidad. Así, el objetivo de un programa de control de calidad es asegurar que las variables que miden la calidad de un producto queden dentro de los intervalos que son aceptables para posibles clientes. 6.2. MÉTODOS DE CONTROL DE CALIDAD Los métodos de control de calidad se clasifican en tres categorías: 6.2.1. Técnicas de supervisión Diseñadas para seguir o rastrear el nivel de las variables de calidad y para detectar cambios indeseables en la calidad del producto; 6.2.2. Técnicas de localización de problemas Ideadas para ayudar a ubicar las causas de cambios indeseables en la calidad del producto; y 6.2.3. Técnicas de selección Diseñadas para eliminar productos defectuosos, o de mala calidad que entran al proceso como materia prima y sirven para realizar el mismo trabajo, en el caso de los productos acabados antes de enviarlos a un cliente. Se dice a menudo que el control de calidad consta del 10% de Estadística y de 90% de ingeniería y sentido común. Como se aprender, la mayoría de los métodos de control de calidad se basan en los conceptos estadísticos elementales. El verdadero problema ocurre cuando se detecta uno de los procesos de supervisión o monitoreo o de selección. Así los métodos de control de calidad pueden decir cuando pero no porque ocurren los problemas. Para descubrir la causa de la baja calidad en productos y corregir la situación, es necesario conocer el proceso y tener aptitudes y habilidad para resolver problemas. Esta unidad trata de dos de los tres tipos de métodos de control de calidad, los procedimientos para controlar un proceso de producción actual y los métodos utilizados para eliminar materia prima poco satisfactoria que entra al proceso o productos defectuosos que salen del proceso o ambas cosas. La tercera categoría metodológica, los procedimientos estadísticos para localizar la causa de un cambio que haga bajar la calidad del producto, consiste en todos los métodos desarrollados en esta asignatura como en estadística general. Dos de los procedimientos de mayor utilidad son el análisis de regresión y el análisis por tablas de contingencia que pueden establecer con correlación entre una o más materias primas, o variables del proceso o del entorno, y la calidad del producto. 6.3. SUPERVISION DE LA CALIDAD MEDIANTE GRAFICAS O DIAGRAMAS DE CONTROL Las mediciones de una variable de calidad varían en el tiempo. Por ejemplo, las mediciones del diámetro interior de un cojinete cuyo valor es pulgada, variarán ligeramente de una pieza a otra. El diámetro del cojinete tiende a hacerse mas pequeño debido al desgaste del utensilio de corte del proceso de maquinado. Una variación de este tipo se denomina definida por una causa atribuible. Otra variación en la que ocurre pequeños cambios fortuitos que se deben a la gran cantidad de variables desconocidas que afectan el diámetro: cambios en la materia prima, condiciones ambientales, etc., se considera como una variación aleatoria.
  • 60. Mg. María Vallejos Atalaya PROESAD Programa de Educación Superior a Distancia72 Si la variación de una variable de calidad es únicamente el tipo aleatorio, se dice que el proceso esta bajo control. El hecho de estar bajo control no indica que el producto origine productos 100% aceptables. Los valores de la variable de la calidad pueden o no localizarse de manera fortuita, dentro de los límites especificados por los clientes del fabricante. La figura 1 (a) muestra una representación grafica o diagrama de los valores de diámetros de cojinetes, según una medición por hora, en el caso de un proceso industrial que se encuentra bajo control y que produce cojinetes que cumplen con las especificaciones de los clientes, por ejemplo, de 0.980 a 1.020 pulgadas. La figura 1 (b) muestra una gráfica similar para un proceso que se encuentra bajo control, pero que produce muchos cojinetes con diámetros que no cumplen las especificaciones y que se considerarían defectuosos. La figura 1 (c) ilustra como seria una grafica si existiera una causa de variación atribuible. Obsérvese que los diámetros señalados ya no parecen variar de modo aleatorio, sino que tienen una manifiesta tendencia decreciente con respecto al tiempo. FIGURA 1: Gráficas respecto al tiempo de los diámetros de cojinetes producidos. 1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 21 .980 1.000 1.020 Límite inferior de especificación Límite superior de especificación Tiempo (en horas) (a) Proceso bajo control que cumple las especificaciones Diámetrodelcojinete 1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 21 .980 1.000 1.020 Límite inferior de especificación Tiempo (en horas) (b) Proceso bajo control que no cumple las especificaciones Diámetrodelcojinete Límite superior de especificación 1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 21 .980 1.000 1.020 Límite inferior de especificación Límite superior de especificación Tiempo (en horas) (c) Proceso fuera de control Diámetrodelcojinete
  • 61. Estadística Aplicada PROESAD Programa de Educación Superior a Distancia73 El primer objetivo de un fabricante es liminar las causas de variación atribuibles de una variable de calidad y mantener el proceso bajo control. El siguiente paso es reducir la variación del proceso y tener la distribución de las mediciones de calidad dentro de especificaciones. El valor medio de la distribución tendría que encontrarse cerca o en el centro del intervalo de los valores de especificación, y la varianza de la distribución tendría que ser la más pequeña posible. Una distribución deseable para los diámetros interiores de cojinetes es que se cumple absolutamente con las especificaciones, como se muestra en la figura 2. FIGURA 2. Una distribución deseable. Una vez que un proceso esta bajo control y que produce productos satisfactorios, se controlan el medio del proceso y su varianza mediante diagramas de control. Se sacan muestras de n artículos del proceso a intervalos de tiempo específicos, digamos cada media hora o cada hora, y se calcula la media muestral x y la amplitud total (“rango”) R. Se transportan estas variables estadísticas a gráficas de x y R similares a las que se tienen en la figura 1 Se utiliza el diagrama de control de la media muestral x para detectar posibles corrimientos en la media de la distribución de una variable de calidad. De igual manera, se emplea un diagrama de control para la amplitud de variación de la muestra R, a fin de detectar cambios en la variancia de las distribución. Se analizan los diagramas de control para la media x y para la amplitud R, respectivamente. 6.4. GRAFICA DE CONTROL PARA MEDIA DEL PROCESO: DIAGRAMA DE x Suponga que se seleccionan n artículos del proceso de producción a intervalos iguales (en el tiempo o en los números de artículos producidos) y que se registran las mediciones de la variable de calidad. Por ejemplo, la figura 3 presenta una gráfica de la media de los diámetros de n = 5 cojinetes, seleccionados cada hora, de un proceso de maquinado. FIGURA 3. Diagrama de x par control La lógica que apoya un diagrama x para control es que si el proceso esta controlado, las medias muestrales tendrán que variar alrededor de la media poblacional de manera aleatoria, y que casi todos los valores de x tendrán que estar en un intervalo ( X 3 ). Diámetro0.980 x 1 2 3 4 5 6 7 8 9 10 1112 1413 151617181920 25 Límite inferior de control, LIC Número de la muestra Límite superior de control, LSC 21 22 23 24 x 3 x 3 Línea central x