SlideShare una empresa de Scribd logo
1 de 47
Descargar para leer sin conexión
Universidad Peruana Unión
Facultad de Ingeniería y
Arquitectura
EAP Ingeniería de Ambiental
MEINV
MÉTODOS ESTADÍSTICOS
PARA LA INVESTIGACIÓN
Docente
Mg. María Vallejos Atalaya
I Semestre 2009
Métodos Estadísticos para la investigación 2
Presentación
El presente módulo ha sido preparado con el propósito de servir al estudiante de la
Escuela Académica Profesional de Ingeniería de Alimentos - Facultad de Ingeniería -
Universidad Peruana Unión, en la formación inicial del amplio campo que constituye la
teoría de los métodos estadísticos aplicados a la investigación.
El propósito del módulo, es presentar una introducción en el marco de estudio de la
estadística de manera que el estudiante de nuestra escuela conozca las múltiples
aplicaciones, no solamente en los campos de ciencias naturales, ingeniería, sino también
en ciencias sociales y, especialmente, en ingeniería de alimentos. Como se demostrará
mas adelante el conocimiento del comportamiento de los parámetros es vital para extraer
conclusiones respecto a la población.
El presente módulo está organizado en tres unidades, en las cuales se enfoca el
aprendizaje de los métodos estadísticos para la aplicación en actividades de
especialización profesional como de investigación y en la vida misma.
La primera unidad consta de conceptos fundamentales, estimación de parámetros y
pruebas de hipótesis paramétricas.
La segunda unidad estudia la construcción de diseños experimentales, el análisis de
varianza y pruebas de comparaciones múltiples.
La tercera unidad centra su atención en el análisis de regresión, covarianza, superficie de
respuesta y pruebas no paramétricas.
Es el anhelo de la tutora que este módulo contribuya al logro de los objetivos de la
asignatura.
Métodos Estadísticos para la investigación 3
INDICE GENERAL
PRIMERA UNIDAD ........................................................................................................................................ 4
ESTIMACIONES Y PRUEBAS DE HIPÓTESIS............................................................................................ 4
1. ESTIMACIÓN DE PARÁMETROS ........................................................................................................ 4
1.1. ESTIMACIÓN PUNTUAL............................................................................................................ 4
1.1.1. Estimación Puntual para la media poblacional. ......................................................................... 5
1.1.2. Estimación Puntual para la varianza poblacional. ..................................................................... 5
1.1.3. Estimación de parámetros de dos poblaciones........................................................................... 5
1.1.4. Estimación puntual de una población de variable cualitativa .................................................... 6
1.1.5. Estimación puntual de dos poblaciones de variables cualitativas.............................................. 6
1.2. ESTIMACIÓN INTERVÁLICA.................................................................................................... 6
1.2.1. Intervalo confidencial para la media poblacional ...................................................................... 6
1.2.2. Intervalo confidencial para la diferencia de medias poblacionales............................................ 7
1.2.3. Intervalo confidencial para la proporción poblacional .............................................................. 8
1.2.4. Intervalo confidencial para la diferencia de proporciones poblacionales .................................. 8
2. SELECCIÓN DEL TAMAÑO DE MUESTRA en m.a.s........................................................................ 15
3. PRUEBAS DE HIPÓTESIS.................................................................................................................... 20
3.1. PRUEBA DE NORMALIDAD DE DATOS ............................................................................... 23
3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL ................................. 29
3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL......................... 32
3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL ..................... 35
3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES............... 38
3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES........................ 42
3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES POBLACIONALES ......... 45
Métodos Estadísticos para la investigación 4
PRIMERA UNIDAD
ESTIMACIONES Y PRUEBAS DE HIPÓTESIS
Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones
respecto a una población, de los datos obtenidos realmente de una muestra.
La inferencia estadística comprende dos tipos principales de técnicas: Estimación de
parámetros y contrastación de hipótesis. Independientemente de la técnica que se utilice,
la finalidad general es utilizar datos de una muestra para extraer conclusiones respecto a
una población.
1. ESTIMACIÓN DE PARÁMETROS
Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa
respecto al valor de una característica de la población y desea conocer cuál podría ser tal
valor.
La estimación puede asumir 2 formas:
- Estimación puntual
- Estimación por intervalos
1.1. ESTIMACIÓN PUNTUAL.
Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar
el parámetro desconocido de la población.
Una desventaja de esta forma de estimación es que no aporta la precisión de la
estimación del parámetro.
Las estimaciones puntuales más usuales son:
COMPETENCIAS:
1. Estima parámetros mediante la estimación puntual e interválica.
2. Determina el tamaño adecuado de una muestra aleatoria
3. Contrasta hipótesis pramétricas para la media, varianza, proporción en una y dos
poblaciones
Métodos Estadísticos para la investigación 5
1.1.1. Estimación Puntual para la media poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
f
fx
=x=
n
x
=x=
i
iii


 ˆˆ
1.1.2. Estimación Puntual para la varianza poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
2 2 i
2
2 2 i
2
i
i
= s =
( x - x )
n - 1
= s =
( x - x ) f
f - 1
  
 

1.1.3. Estimación de parámetros de dos poblaciones
Sea X una variable aleatoria que se distribuye como una distribución normal con media x
y varianza ²x e Y otra variable aleatoria que se distribuye como una distribución normal
con media y y varianza ²y.
La estimación de parámetros de dos poblaciones se pueden realizar mediante:
a) La comparación de sus medias, luego:
212121
ˆˆ x-x=-=- 
b) La comparación de sus varianzas, luego:
s
s
== 2
x
2
x
x
x
x
2
x
2
1
2
1
2
2
1
2
ˆ
ˆˆ




Métodos Estadísticos para la investigación 6
1.1.4. Estimación puntual de una población de variable cualitativa
Sea X una variable cualitativa con:
P-1=Qy
AXsi0,
AXsi1,
N
M
N
X
Pcon
X
i








Luego:
p-1=qy
Axsi0,
Axsi1,
n
m
N
x
pcon
x
i








Entonces: P p
1.1.5. Estimación puntual de dos poblaciones de variables cualitativas.
Sea X la variables aleatoria de una población cualitativa con Px proporción de aciertos en
X y sea Y la variables aleatoria de otra población cualitativa con Py proporción de aciertos
en Y, luego:
p-p=P-P=P-P xxxxxx 212121 ˆˆ
1.2. ESTIMACIÓN INTERVÁLICA
La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el
parámetro tiene la probabilidad especificada de estar. Los estimados por intervalos se
conoce como intervalos de confianza y los límites inferior y superior como los límites de
confianza.
En general el intervalo de confianza para el parámetro  se expresa:
  -1=)k+k-P( ˆˆ
ˆˆ 
Los intervalos confidenciales más usuales son:
1.2.1. Intervalo confidencial para la media poblacional
Para determinar el intervalo confidencial para la media poblacional se debe tomar en
cuenta lo siguiente:
Métodos Estadísticos para la investigación 7
- Cuando se conoce la varianza de la población (n  30)



  -1=)
n
Z+x
n
Z-xP(
22
)1()1(  
- Cuando no se conoce la varianza de la población (n  30)
P( x - t
s
n
x + t
s
n
) = 1 -( n (
2
,n-1)1
2
1 1     , )
1.2.2. Intervalo confidencial para la diferencia de medias poblacionales
Cuando n1 + n2 - 2  30 se usa el valor de la abscisa de la distribución normal
estándar Z(1-α/2)
Si, n1 + n2 - 2 < 30 se usa el valor de la abscisa de la distribución t student ( t(n-1, 1-α/2)
Se presentan los siguientes casos:
- Si ²1 y ²2 son conocidos



  -1=]
n
+
n
Z+)x-x(-
n
+
n
Z-)x-xP[(
22
2
2
2
2
1
2
1
)
2
1(2121
2
2
1
1
)1(21  
- Si ²1 y ²2 no son conocidos
se presentan dos casos:
a. Si ²1 es aproximadamente igual a ²2 entonces; ²1  ²2  ²
2-n+n
1)s-n(+1)s-n(
=s:donde
-1=])
n
1
+
n
1
(st+)x-x(-)
n
1
+
n
1
(st-)x-xP[(
2
2
)-nn(
2
)-nn(
21
2
22
2
11
21
2,
2
12121
21
2,
2
121 2121
 
 
Cuando ²1 es diferente a ²2
  -1=]
n
s
+
n
s
t+)x-x(_-_
n
s
+
n
s
t-)x-xP[(
22
)-nn
22
)-nn(
2
2
1
1
2,
2
1(2121
2
2
1
1
2,
2
121 2121 
Métodos Estadísticos para la investigación 8
1.2.3. Intervalo confidencial para la proporción poblacional
Se presentan los siguientes casos:
- Cuando se conoce la proporción poblacional o n 30
 -1=
n
pq
Z+pP
n
pq
Z-P(p
22
))1()1(  
- Cuando no se conoce la proporción poblacional o n30
P(p - t
pq
n
P p + t
pq
n
) = 1 -(
2
,n-1) (
2
,n-1)1 1    
1.2.4. Intervalo confidencial para la diferencia de proporciones
poblacionales
Se pueden presentan los siguientes casos:
- Si P1 y P2 son proporciones poblacionales conocidas o n1 y n2 son muestras grandes
(n30)
 -1=]
n
qp
+
n
qp
Z+)p-p(p-P
n
qp
+
n
qp
Z-)p-pP[(
22
2
22
1
11
)1(2121
2
22
1
11
)1(21  
- Si P1 y P2 son proporciones poblacionales desconocidas o n1 y n2 son muestras
pequeñas (n<30)
 -1=]
n
qp
+
n
qp
t+)p-p(P-P
n
qp
+
n
qp
t-)p-pP[( )-nn()-nn(
2
22
1
11
2,
2
12121
2
22
1
11
2,
2
1(21 2121  
Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80 , n2 = 20 se
recomienda emplear:
n+n
pn+pn
=p:donde
)
n
1
+
n
1
)(p-(1p=s
2
21
2211
21
Esta proporción denota la proporción conjunta de las dos muestras.
Métodos Estadísticos para la investigación 9
EJEMPLOS
1. Se ensaya un test para determinar el coeficiente de inteligencia a 8 alumnos; los
resultados fueron:
98, 108, 92, 111, 102, 95, 89, 115.
Determine la estimación puntual e interválica (use el 90% de confianza) para el promedio
verdadero del cociente de inteligencia.
Solución
n = 8, x = 101.25, s = 9.377 -1 = 0.90 Luego 2

1 = 0.95
como n  30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895
a) Estimación puntual: 25.101

x
b) Estimación intervalica:
Por formula
 -1=)
n
s
t+x
n
s
t-xP( )(( 95.0,7)95.0,7 
Reemplazando
 -1=)-P(
8
377.9
895.125.101
8
377.9
895.125.101 
Se obtiene
%9053.10797.94 =]P[  
2. Un biólogo desea hacer una estimación, con un intervalo de confianza del 95%, de
la cantidad promedio de agua que consume diariamente cierta especie animal en
condiciones experimentales. El investigador supone que la población de valores de
consumo diario de agua está normalmente distribuido y, con base en experiencias
pasadas, que la varianza de la población es de 4 gramos cuadrados. Una muestra
aleatoria de 25 animales arroja una media de 16,5 gramos.
Métodos Estadísticos para la investigación 10
De acuerdo con los datos suministrados, el biólogo puede construir un intervalo de
confianza del 95%.
Solución
n = 25, x = 16.5, s = 2 -1 = 0.95 Luego 2

1 = 0.975
como n  30, entonces t(n – 1, 1 - /2) = t(24,0.975) = 2.064
Estimación intervalica:
Por formula
 -1=)
n
s
t+x
n
s
t-xP( )(( 95.07)95.07  
Reemplazando
%95
24
2
064.25.16
24
2
064.25.16 =)-P(  
Se obtiene
%9034.1766.15 =]P[  
3. Como parte de un experimento, una gran empresa manufacturera encontró que el
tiempo promedio requerido para que 16 empleados escogidos al azar completaran una
tarea determinada era de 26 minutos. La desviación estándar era de 5 minutos. Construir
el intervalo de confianza del 95% para la media poblacional.
Solución
n = 16 x = 26 s = 5 1-  = 0.95 entonces 2

1 = 0.975
como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131
Por formula
 -1=)
n
s
t+x
n
s
t-xP( )(( 975.0,15)975.0,15 
Métodos Estadísticos para la investigación 11
Reemplazando
%95)
16
5
131.226
16
5
131.226 =+-P(  
Se obtiene
%9566.2834.23 =]P[  
4. Se ha hecho un estudio de las diferencias entre estudiantes universitarios del
primer año que estuvieron en academias y estudiantes que no estuvieron. Para ello se
tomó una muestra aleatoria de 50 estudiantes universitarios que habían asistido a
academias y una muestra aleatoria simple independiente de 60 estudiantes que no lo
habían hecho. Al final del primer semestre se administró a los estudiantes una prueba de
rendimiento en matemática. Los que habían asistido a academias, obtuvieron un puntaje
promedio de 14,5, con una varianza de 4,8; y el puntaje promedio para el grupo que no
había asistido a la academia, fue de 13,75 con una varianza de 6,4. Construya un
intervalo de confianza para la diferencia entre las dos medias poblacionales (use 99% de
confianza).
Solución
ASISTIERON
ACADEMIA
NO ASISTIERON
ACADEMIA
nx1 = 50
1x =14.5
s
2
x1 = 4.8
nx2 = 60
2x =13.75
s
2
x2 = 6.4
1 -  = 0.99 luego 1- 2

= 0.995
Como nx1 + nx2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Por formula
  -1=]
n
s
+
n
s
z+)x-x(_-_
n
s
+
n
s
z-)x-xP[(
22
)(
22
)(
2
2
1
1
2
12121
2
2
1
1
2
121 
Métodos Estadísticos para la investigación 12
Reemplazando
%99
60
4.6
50
8.4
58.275.135.14
60
4.6
50
8.4
58.275.135.14 21 =]++)-(-+-)-P[(  
Se obtiene
%9991.141.0 21 =]-P[  
5. Los estudiantes que se matricularon en un curso de Métodos Estadísticos fueron
distribuidas al azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades
para enriquecer el curso. El grupo B estudió mediante el método tradicional de
conferencias. Los puntajes obtenidos en una prueba de rendimiento, hecha al terminar el
curso dieron los siguientes resultados:
Grupo n x s
A 10 80 8
B 12 72 10
Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios
poblacionales.
Solución
La confianza, 1 -  = 0.90 luego 1 - 2

= 0.95
Como nA + nB –2 < 30 entonces t (nA + nB –2,1– /2) = t(20, 0.95) = 1.725
Por formula
  -1=]
n
s
+
n
s
t+)x-x(-
n
s
+
n
s
t-)x-xP[(
B
2
B
A
2
A
n(nBABA
B
2
B
A
2
A
n(nBA BABA )2/1,2)2/1,2  
Reemplazando
%90
12
100
10
64
725.17280
12
100
10
64
725.17280 =]++)-(-+-)-P[( BA  
Se obtiene
%9062.1438.1 =]-P[ BA  
Métodos Estadísticos para la investigación 13
6. Una encuesta para verificar las actitudes de los trabajadores ante el boletín
mensual, se les pidió a 500 trabajadores de una gran empresa que indicaran con que
frecuencia leían el boletín de noticias. De los 500, 375 informaron que leían todas las
ediciones. Construir el intervalo de confianza del 95% para la proporción real de los que
opinan afirmativamente.
Solución
n = 500 p =
500
375
= 0.75 q =0.25 1-  = 0.95 luego 2

1 = 0.975
Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96
Por formula
 -1=]
n
pq
Z+pP
n
pq
Z-P[p )2/1()2/1(  
Reemplazando
%95
500
)25.0(75.0
96.175.0
500
)25.0(75.0
96.175.0 =]+P-P[ 
Se obtiene:
%9579.071.0 =]PP[ 
7. En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto
programa de televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado.
Determinar los límites de confianza del 99% para la diferencia de proporciones de todos
los adultos y jóvenes que vieron con agrado el programa.
Solución
ADULTOS JÓVENES
nA = 400
aA = 100
pA =0,25
qA = 0,75
nJ = 600
aJ = 300
pJ =0,50
qJ = 0,50
Métodos Estadísticos para la investigación 14
1 -  = 0.99 luego 1- 2

= 0.995
Como nA+ nJ - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza
mancomunada así:
n+n
pn+pn
=p
JA
JAJA
Reemplazando
4.0
1000
400
600400
50,0*60025,0*400

+
+
=p
)
n
1
+
n
1
)(p-(1p=s
JA
)
1
+
1
)((=s 032.0
600400
6.04.0 
Por formula
 -1=])
n
1
+
n
1
)(p-(1pZ+)p-p(P-P)
n
1
+
n
1
)(p-(1pZ-)p-pP[(
JA
JAJA
JA
JA 2//1(2//1( 
Reemplazando
%99)032.0(58.25.025.0)032.0(58.25.025.0 =]+)(P-P-)P[( JA 
Se obtiene
%9917.033.0 =]P-PP[ JA 
Métodos Estadísticos para la investigación 15
2. SELECCIÓN DEL TAMAÑO DE MUESTRA EN M.A.S
El procedimiento de muestreo, o diseño experimental, como se le llama comúnmente,
influye en la cantidad de información por observación o medición. Este diseño, junto con
el tamaño muestral n, determina la cantidad total de información relevante en la muestra.
Salvo en contadas ocasiones, trataremos la situación de muestreo más sencilla, un
muestreo de una población relativamente grande, y se enfocará la atención del tamaño
de muestra n.
Para ver cómo el tamaño muestral afecta al ancho de un intervalo de confianza,
considérese la desviación estándar de la distribución para cualquier estimador puntual.
Por ejemplo, la desviación estándar de la media muestral x , es:
n
x

 
Nota: si se desea que el ancho de un intervalo de confianza sea pequeño, debe
aumentarse el tamaño de muestra.
Procedimiento para seleccionar el tamaño muestra
Sea  el parámetro que se quiere estimar, y sea  la desviación estándar del estimador
puntual. Entonces se procede según los pasos siguientes.
Elegir d, la cota para el error de estimación, y un coeficiente de confianza (1 - ),
Resolver la siguiente ecuación para el tamaño de muestra n:
dZ  

 )2/1(
Nota: Para la mayoría de los estimadores 

 es una función del tamaño de muestra n.
Propósito: Estimar la media poblacional
Como se recordardará la media muestral x se distribuye normalmente con media  y
varianza 2
/n, entonces dado un valor z(1-/2), enla distribución normal entre - z(1-/2) y
z(1-/2), se encuentra 1-  de los posibles valores de x .
Métodos Estadísticos para la investigación 16
1-
/2 /2
-Z1- /2  Z1- /2
Entonces para tener una “confiabilidad” de 1-  debe usarse el coeficiente de
“confiabilidad” de Z1- /2 (que llamaremos sólo z) obtenido en la tabla de distribución
normal estándar o en la función de estadísticas de Excel.
De otro lado si establecemos que el nivel de precisión de nuestra estimación de la media
es d unidades, estaríamos estableciendo el margen de error admisible para la media
muestral respecto a la media poblacional , entonces:
P( x -   d) = 1 - 
Implica que se tiene una confiabilidad de 1-  de que el nivel de precisión se cumpla en la
estimación de la media poblacional a través de la media muestral x .
n
zd
2


Entonces,
El tamaño de muestra para poblaciones infinitas es:
2
22
d
z
n


Si de otro lado, el muestreo es sobre una población finita, entonces
1


N
nN
n
z
d

Entonces,
El tamaño de muestra para poblaciones finitas es:
222
22
)1( 

zNd
zN
n


Ajuste de tamaño de muestra:
Métodos Estadísticos para la investigación 17
Si 10.0
N
n
entonces n0 =
N
n
n
1
Ejemplo 1.
De una población de 4000 individuos se desea estudiar la media de la presión arterial
sistólica, la cual se distribuye normalmente con  = 10, para ello se ha fijado un nivel de
confiabilidad de 95% y el nivel de precisión en 2. ¿Cuál será el tamaño de muestra
adecuado?
Solución:
Como datos del problema tenemos:
Z1- /2= Z0.975 = 1.96
d = 2
 = 10
Entonces:
94
10)96.1()14000(2
10)96.1(4000
)1( 222
22
222
22







zNd
zN
n
Como 10.0
N
n
, entonces no es necesario usar la corrección n0.
El tamaño de 94 individuos es suficiente.
Ejemplo 2.
Resuelva el mismo problema pero considerando una precisión de d=0.8
Solución:
Tenemos ahora,
523
10)96.1()14000(8,0
10)96.1(4000
)1( 222
22
222
22







zNd
zN
n
Métodos Estadísticos para la investigación 18
Como 10.0
N
n
, entonces el tamaño de muestra será:
463
4000
523
1
523
1
0 




N
n
n
n
Deberá tomarse entonces una muestra de 463 individuos.
Propósito: Estimar la proporción poblacional
El procedimiento es análogo al propósito anterior, debiendo emplearse ahora:
Para poblaciones infinitas
2
2
d
pqz
n 
Para poblaciones finitas
pqzNd
pqzN
n 22
2
)1( 

Y si 10.0
N
n
entonces completar el cálculo con:
N
n
n
n


1
0
Ejemplo:
Se desea estudiar una población de 2000 alumnos referente a la prevalencia de
desnutrición. Se estima p estaría muy cercano a 0,25 y para ello se ha establecido como
nivel de confiabilidad el 95% y el nivel de precisión 0,05 ¡Cuál es el tamaño de muestra
necesario?
Solución:
N = 2000
Z1 - /2 = Z0,975 = 1.96
p = 0,25
Métodos Estadísticos para la investigación 19
q = 1 – p = 1 – 0,25 = 0,75
d = 0,05
Entonces,
252
)75,0)(25,0()96,1()12000()05,0(
)75,0)(25,0()96,1(2000
)1( 22
2
22
2





pqzNd
pqzN
n
Como 10.0
N
n
, entonces el tamaño de muestra será:
224
2000
252
1
252
1
0 




N
n
n
n
El tamaño de muestra necesario es de 253 alumnos.
Métodos Estadísticos para la investigación 20
3. PRUEBAS DE HIPÓTESIS
A continuación definiremos algunos conceptos básicos para la prueba de hipótesis.
Hipótesis
Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede
hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los
alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para
realizar una investigación. Por esta razón se le denomina hipótesis de investigación.
Generalmente hay que volver a plantear las hipótesis de investigación convenientemente
de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas
las hipótesis reciben el nombre de hipótesis estadística.
Hipótesis nula (Ho)
Son aquellas que están referidas a algún parámetro de la población o de las poblaciones
de estudio. Estas son llamadas hipótesis científicas.
Hipótesis alternativa (Ha)
Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la
que sirve para contrastarla.
Errores de prueba y nivel de significación
Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad
no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal
caso estaremos cometiendo el denominado ERROR DE TIPO I.
De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la
decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE
TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos,
estaremos decidiendo bien.
Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha
probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos
corresponde al NIVEL DE SIGNIFICACIÓN.
P(ERROR TIPO I) = 
Métodos Estadísticos para la investigación 21
Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o
falsa.
DECISIÓN NATURALEZA DE Ho
SOBRE Ho Cierta Falsa
No rechazar Decisión Error tipo II
correcta (probabilidad )
Rechazar Error tipo I Decisión
(Probabilidad ) correcta
Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es
posible minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas
de tal modo que al disminuir una de ellas la otra aumenta. Así si queremos minimizar 
inmediatamente aumenta la probabilidad de  y viceversa. Generalmente el investigador
fija apriori el error  que está dispuesto a tolerar, es decir la probabilidad máxima de
cometer el error de tipo I.
La decisión de una prueba estadística está asociada al nivel de significación:
a) Si P < 0.05 ( = 0.05)
se dice que existe significación en la prueba
b) Si P < 0.01 ( = 0.01)
se dice que existe alta significación en la prueba
Pruebas bilaterales y unilaterales
Cuando tenemos hipótesis alternativa de la forma:
Ho :  = o Ho : P = Po
Ha :   o Ha : P  Po
Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser
mayor, significativamente o acaso menor, significativamente. En tales casos el nivel de
significación  queda partido en /2 en cada lado de la distribución del estadístico o
función de prueba.
Métodos Estadísticos para la investigación 22
Tendremos entonces una prueba bilateral. (dos puntos críticos)
1 - 
/2 /2
De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación
también estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales.
(un punto crítico)
Ho :  = o
Ha :  > o
1 -  
Ho :  = o
Ha :  < o
 1 - 
A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama
REGIÓN DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN.
Una prueba de contrastación de hipótesis estadística se conduce básicamente según el
siguiente procedimiento.
1. Seleccionar el parámetro de interés
2. Plantear las hipótesis
- Hipótesis nula (Ho)
- Hipótesis alternativa (Ha)
3. Establecer el nivel de significación de prueba ()
4. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha
función de prueba.
5. Efectuar el reemplazo numérico en la función de prueba con la información
muestral.
6. Determinar las regiones de aceptación o rechazo en la distribución de la función
de prueba, según se trate de pruebas bilaterales o unilaterales.
7. Tomar una decisión sobre Ho, según la siguiente regla:
a.- Rechazar Ho si el valor de la función de prueba cae en la región de
rechazo.
En tal caso se concluirá que Ho se rechaza en favor de Ha con una
Métodos Estadísticos para la investigación 23
significación estadística.
b.- No rechazar Ho si el valor de la función de prueba cae en la región de
aceptación.
En tal caso se concluirá de que la información muestral no brinda
suficientes evidencias como para sospechar de que Ho no sea cierta.
8. Establecer la conclusión.
Antes de poder estimar parámetros o realizar la prueba de hipótesis para hacer
conclusiones sobre los parámetros de la población es necesario que la variable en
estudio se ajuste a una distribución normal para que los resultados de la investigación
sean confiables. Por lo tanto la primera prueba de hipótesis a estudiar corresponde a la
PRUEBA DE NORMALIDAD DE DATOS, que nos permite determinar si la variables en
estudio se distribuye normalmente o no.
3.1. PRUEBA DE NORMALIDAD DE DATOS
1. Reconocimiento de una ley de probabilidad con información real.
a. Reconocimiento teórico (distribución de probabilidad)
b. Ajuste empírico de una población real a una teórica.
c. Pruebas de bondad de ajuste
- Prueba Ji-cuadrada
- Prueba de Kolmogorov-Smirnov
d. Construcción de muestras aleatorias
e. Construcción de muestras artificiales con una ley de probabilidad arbitraria. (método
de Monte Carlo).
f. Prueba de aleatoriedad.
2. Transformaciones de variables aleatorias no normales a normales.
Transformación raíz cuadrada:
Se usa cuando se tiene una variable (X) que se aproxima a una
distribución de Poisson, así:
20Xdecires, Xdepequeñosvalorespara1+X=Z
XdegrandesvaloresparaX=Z
ii
ii
Métodos Estadísticos para la investigación 24
Transformación angular:
Se usa cuando se tiene una variable (X) que se aproxima a una
distribución Binomial, así:
Xdepequeñosvalorespara1+Xarcsen=Z
XdegrandesvaloresparaXarcsen=Z
ii
ii
Transformación logarítmica:
Se usa cuando se tiene una variable (X) tiende a crecer
20Xdecires, Xdepequeñosvalorespara1+X=Z
XdegrandesvaloresparaX=Z
ii
ii
Transformación de Fisher:
Se usa cuando se tiene una variable (X) que se aproxima a una distribución Ji-cuadrada
con n grados de libertad.
i i
2
Z = 2 X - 2n - 1 para cualesquier valor de X
3. PRUEBA DE BONDAD DE AJUSTE A LA DISTRIBUCIÓN NORMAL
Procedimiento
(1) Formular la hipótesis:
Ho: La información dada se ajusta a una ley de distribución normal
Ha: La información dada no se ajusta a una ley de distribución normal
(2) Fijar el nivel de significancia ()
las más usadas son;  = 0,05; 0,01; 0,10
1 -  = 0,90; 0,99; 0,90 grados de confianza
(3) Elegir la función pivotal
)(prueba
e
)e-f(
=U
22
1)-(r
i
2
ii
o 
Métodos Estadísticos para la investigación 25
donde: r = m - k,
m = Nº de clases en la inf. real
n = Nº de parámetros de la ley de prob.
fi = frecuencia absoluta simple observada
ei = frecuencia absoluta simple esperada
ei = n pi ; ei  5
Uo = máx Sn(x) - P(x) (Prueba de Kolmogorov)
donde: Sn(x) = Hi frec. rel. acum. observada
P(x) = Fi = P(Xx) frec. acum. Esperada
Tabla de la prueba de Kolmogoroy Smirnov ***
Tamaño
de la
Muestra (n)
Nivel de significación correspondiente a D = el valor
máximo de Fo (X) = SN (X)
0.20 0.15 0.10 0.05 0.01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
más de 35
0.900
0.684
0.565
0.494
0.446
0.410
0.381
0.358
0.339
0.322
0.307
0.295
0.284
0.274
0.266
0.258
0.250
0.244
0.237
0.231
0.21
0.19
0.18
n
07.1
0.925
0.726
0.597
0.525
0.474
0.436
0.405
0.381
0.360
0.342
0.326
0.313
0.302
0.292
0.283
0.274
0.266
0.259
0.262
0.246
0.22
0.20
0.19
n
14.1
0.950
0.776
0.642
0.564
0.510
0.470
0.438
0.411
0.388
0.368
0.352
0.338
0.325
0.314
0.304
0.295
0.286
0.278
0.272
0.264
0.24
0.22
0.21
n
22.1
0.975
0.842
0.708
0.624
0.565
0.521
0.486
0.457
0.432
0.410
0.391
0.375
0.361
0.349
0.338
0.328
0.318
0.309
0.301
0.294
0.27
0.24
0.23
n
36.1
0.995
0.929
0.828
0.733
0.669
0.618
0.577
0.543
0.514
0.490
0.468
0.450
0.433
0.418
0.404
0.392
0.381
0.371
0.363
0.358
0.32
0.29
0.27
n
63.1
De S. Siegel, Nonparametric Statistica, McGraw-Hill Book Company, Nueva York, 1958. Se ha adaptado de
F. J. Massey, Jr., “the Kolmogorov-Smirnov Test for Goodness of Fit”, J. Amer. Statist. Ass., vol. 46, pág. 70,
1951, con la amable autorización del autor y el editor.
Métodos Estadísticos para la investigación 26
Ej. n = 10.  = 0.05 P(U  c) = 0.95 c = 0.410
(4) Determinar la región de rechazo y la región de aceptación.
(5) Tomar la decisión.
Si Uo  RA entonces aceptamos Ho es decir la información se ajusta a una distribución
normal, si Uo  RR entonces rechazamos Ho es decir la información no se ajusta a una
distribución normal.
Antes de realizar cualquier análisis estadístico se deben tener presentes las condiciones
de aplicación del mismo. En casi todos los análisis estadísticos, la asunción de
normalidad es un común denominador. De ahí que comencemos este apartado con la
prueba estadística de Normalidad. Ésta se denomina prueba de Kolmogorov - Smirnov y
se halla en el SPSS en el menú de Análisis, dentro de la opción de Pruebas no
paramétricas y finalmente bajo el nombre abreviado de K-S de una muestra... . El cuadro
de diálogo nos permite seleccionar la variable a analizar y la ley de probabilidad que se
propone como de la población de la que ha sido extraída la muestra.
Es importante notar que a veces las asunciones se refieren a la Normalidad de las
poblaciones que se comparan, por lo que esta prueba de K-S debe repetirse para cada
una de las muestras a comparar.
RA
1 – 
RA

f(u)
U
U0
Métodos Estadísticos para la investigación 27
Ejemplo:
La tabla siguiente presenta la información de notas de 162 estudiantes en el curso de
estadística durante un año dado. Probar que la siguiente muestra fue extraía de una
población de notas distribuidas en forma normal con  = 0,01.
Notas 30-40 40-50 50-60 60-70 70-80 80-90 90-100
N de est. 5 10 28 52 31 26 10
Solución
Ho: Las notas se ajustan a una ley de distribución normal
Ha: Las notas no se ajustan a una ley de distribución normal
 = 0.01
Notas
x
Estandarizando
z
Nº
Estudiantes
f
Probabilidad
P
Valores
Esperados
ei = npi
Ji-
Cuadrada
(fi-ei)2/ei
30 – 40 -2.70 – -1.99 5 0.0198 3.20
40 – 50 -1.99 – -1.28 10 0.0767 12.42 0.02
50 – 60 -1.28 – -0.57 28 0.1833 29.69 0.10
60 – 70 -0.57 – 0.14 52 0.2706 43.84 1.52
70 – 80 0.14 – 0.84 31 0.2468 39.99 2.02
80 – 90 0.84 – 1.55 26 0.1391 22.53 0.53
90 – 100 1.55 – 2.26 10 0.0484 7.84 0.60
TOTAL 162 U0 = 4.79
Notas
x
Estandarizand
o
Z
Nº
Estudiante
f
Frecuencia
Relativas
h
Probabilid
ad
p
Frecuencias
Relativas
Acumulada
Sn(x)= Hi
Probabilida
d
Acumulada
P(x)
Kolmogorov
MaxH-P
30 – 40 -2.70 – -1.99 5 0.0309 0.0198 0.0309 0.0198 0.0111
40 – 50 -1.99 – -1.28 10 0.0617 0.0767 0.0926 0.0964 0.0038
50 – 60 -1.28 – -0.57 28 0.1728 0.1833 0.2654 0.2797 0.0143
60 – 70 -0.57 – 0.14 52 0.3210 0.2706 0.5864 0.5504 0.0360
70 – 80 0.14 – 0.84 31 0.1914 0.2468 0.7778 0.7972 0.0194
80 – 90 0.84 – 1.55 26 0.1605 0.1391 0.9383 0.9363 0.0020
90 – 100 1.55 – 2.26 10 0.0617 0.0484 1.0000 0.9847 0.0153
TOTAL 162 1 U0 = 0.0360
x = 68.09 s = 14.11
70.2
11.14
09.6830
1 

Z
0198.00035.00233.070.299.199.170.21  ]ZP[]ZP[=]Z[p
15 15.68
Métodos Estadísticos para la investigación 28
Prueba X²:
345.112
)0.99,3(
  =
e
)e-f(
=U
2
1)-(r
i
2
ii
o
Como r = m – k = 6 – 2 = 4
Donde:
m: Nº de filas ajustadas
k: Nº parámetros de la distribución normal
Uo = 4.490
Ut = 11.345
Decisión:
Como Uo RA  aceptamos Ho la información se ajusta a la distribución normal.
Prueba de Kolmogorov
Uo = máx Sn(x) - P(x) = 0.0342
 = 0.01
n = 162
U = 0,0342
Ut = 128.0
162
63.163.1

n
, obtenido de la tabla de Kolmogorov
RA
1 –  = 4,490
 = 0,01
f(u)
U
Ut = 11,345
RR
U0 = 4,490
RA
1 –  = 0,99
 = 0,01
f(u)
U
Ut = 0,128
RR
U0 = 0,0342
Métodos Estadísticos para la investigación 29
Decisión:
Como Uo RA  aceptamos Ho
Conclusión:
Se concluye que la información se ajusta a la distribución normal con el 1% de
significación de prueba.
3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL
Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las
características de una población normal.
Las hipótesis referentes a este parámetro pueden ser:
Ho:  = o
Ha:   o Prueba bilateral
Ho:  = o
Ha:  > o Prueba unilateral
Ho:  = o
Ha:  < o Prueba unilateral
Dicha prueba se efectúa mediante la siguiente función de prueba:
a) Si la desviación estándar poblacional no es conocida o n<30
)1,1( 

 n
o
o t
ns/
-x
=t
b) Si la desviación estándar poblacional es conocida o n30
n
n/
-x
=z (0,1)
o
o 


Métodos Estadísticos para la investigación 30
Ejemplo 1:
El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida
le permite a su compañía vender más pólizas que las compañías "promedio". El promedio
mensual de ventas de todos los agentes de la compañía es de $300. A una muestra de
agentes que han recibido el programa de entrenamiento se le encuentra las siguientes
ventas en dólares: 300, 270, 360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el
supervisor de estos agentes, adoptaría para los restantes el programa de entrenamiento
propuesto por el señor Martínez. Emplee 5% de nivel de significación.
Solución
 = 300, n = 10, x = 351.9, s = 48.64 -1 = 0.95
como n  30, entonces t(n – 1, 1-) = t(9,0.95) = 1.895
Ho: 300
Ha: 300
 = 0.05
f.p. 37.3
10
64.48
3009.3510
0 




n
s
x
t

Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis
nula a favor de la hipótesis alternativa
Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su
compañía vender más pólizas de seguro que la compañía promedio, por lo cual se
adoptará para el resto de los agentes el programa propuesto por el señor Martinez.
Ejemplo 2:
Los sistemas de escape de emergencia para tripulantes de aeronaves son impulsados
por un combustible sólido. Una de las características importantes de este producto es la
RA
1 -  = 0,95
RR
 = 0,05
tt = 1,812
t0 = 3,37
Métodos Estadísticos para la investigación 31
rapidez de combustión. Las especificaciones requieren que la rapidez promedio de
combustión sea 50 cm/s. Se sabe que la desviación estándar de esta rapidéz es 2 cm/s.
El experimentador decide especificar una probabilidad para el error tipo I del 5%. Se
selecciona una muestra aleatoria de 25 y obtiene una rapidez promedio muestral de
combustión de 51,3 cm/s. ¿A qué conclusión debe llegar?
Solución:
 = 50, n = 25, x = 51.3,  =2  = 0.05
como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96
Ho:  = 50
Ha:   50
 = 0.05
f.p. 25.3
25
2
503.51



n
-x
=Z
o
o


96.1)975,0( Z=Zt
Decisión: Como Zo RR  Rechazamos la Ho , a favor de Ha
Conclusión: Por lo tanto no se cumple con las especificaciones la rapidez promedio de
combustión difiere de 50 cm/s. Usando 5% de significación de prueba.
RR
2 = 0,025
Zt = -1,96
RA
1 -  = 0,95
RR
2 = 0,025
Zt =1,96
Z0 =3.25
Métodos Estadísticos para la investigación 32
3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una
población.
Procedimiento:
Supóngase que se desea probar la hipótesis de que la varianza de una población normal
2
es igual a un valor específico, por ejemplo, 2
o. Sea X1, X2, ..., Xn una muestra aleatoria
de n observaciones tomadas de esta población.
Las hipótesis referentes a este parámetro pueden ser:
Ho: 2
= 2
o
Ha: 2
 2
o Prueba bilateral
Ho: 2
= 2
o
Ha: 2
> 2
o Prueba unilateral
Ho: 2
= 2
o
Ha: 2
< 2
o Prueba unilateral
Se utiliza el estadístico de prueba
2
2
2 )1(
o
o
Sn
X



donde S2
es la varianza muestral. Ahora si Ho: 2
= 2
o es verdadera, entonces el
estadístico de prueba X2
o sigue una distribución ji-cuadrada con n-1 grados de libertad.
Por consiguiente, se calcula el valor de la estadística de prueba X2
o, y la hipótesis Ho: 2
= 2
º , debe rechazarse si:
2
2/1,1
2
2
2/,1
2








no
no
sio
Métodos Estadísticos para la investigación 33
donde X2
n-1,/2 y X2
n-1,1-/2 son los puntos que corresponden a los porcentajes 100/2
inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad,
respectivamente.
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis
unilateral: Ho: 2
= 2
o
Ha: 2
> 2
o
Se rechaza si: X2
o > X2
(n-1,1-)
Para la otra hipótesis unilateral: Ho: 2
= 2
o
Ha: 2
< 2
o
Se rechaza si: X2
o < X2
n-1,
RA
1 – 
2
)2/,1( nX
RR
 /2 RR
 /2
2
)2/1,1( nX
RA
1 – 
RR

2
)1,1( nX
RA
1 – 
RR

2
),1( nX
Métodos Estadísticos para la investigación 34
PROCEDIMIENTO PARA MUESTAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se
modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30 se
utiliza la distribución normal.
El estadístico de prueba es:
n
s
Z
o
o
o
2



El gráfico utilizado sería acampanado.
Ejemplo:
Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20
botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas
de fluido)2
. Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2
,
entonces existe una proporción inaceptable de botellas que serán llenadas con una
cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el
fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de
prueba.
Solución:
2
= 0.01, n = 20, s2
= 0.0153  = 0.05
como n < 30, entonces 2
)1,1( nX = 1.302
)95.0,19( X
Ho: 2
= 0.01
Ha: 2
> 0.01
 = 0.05
Métodos Estadísticos para la investigación 35
f.p. 07.29
01.0
)0153.0)(19()1(
2
2
2



o
o
Sn
X

1.302
)95.0,19( X
Decisión: Como 07.29
2
oX  RA  aceptamos Ho
Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza
es igual a 0.01.
3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN
POBLACIONAL
La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una
determinada característica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: P = Po
Ha: P  Po Prueba bilateral
Ho: P = Po
Ha: P > Po Prueba unilateral
Ho: P = Po
Ha: P < Po Prueba unilateral
La función de prueba para valores de n  30 es:
n
)/np-(1p
p-P
=z (0,1)
oo
o
o 
RA
1 –  = 0.95
RR
 = 0.05
1.30
2
tX
07.29
2
oX
Métodos Estadísticos para la investigación 36
La función de prueba para valores de n < 30 es:
t
)/np-(1p
p-P
=t 1)-(n
oo
o
o 
Ejemplo 1:
El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio
adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos,
75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como
para apoyar la opinión del alcalde?
Solución
P = 0.60, n = 120, m = 75, 625.0
120
75
p ,  = 0.05
como n > 30, entonces 645.1)95,0()1(  ZZ=Zt 
Ho: 60.0P 
Ha: 60.0P 
 = 0.05
f.p. 56.0
120
)4.0(6.0
6.0625.0
0 


)/np-(1p
p-P
=Z
oo
o
Decisión: Como Zo RA  aceptamos Ho
Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión
del alcalde. Usando un 5% de significación de prueba.
RA
1 -  = 0,95
RR
 = 0,05
Zt = 1,645
Z0 = 0,56
645.1)95,0( Z=Zt
Métodos Estadísticos para la investigación 37
Ejemplo 2:
Un fabricante de semiconductores produce controladores que se emplean en
aplicaciones de motores automovilísticos. El cliente requiere que la fracción de
controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que
0,05, y que el fabricante demuestre esta característica del proceso de fabricación con
este nivel de calidad, utilizando  = 0,05. El fabricante de semiconductores toma una
muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El
fabricante puede demostrar al cliente la calidad del proceso?
Solución
P = 0.05, n = 200, m = 4, 02.0
200
4
p ,  = 0.05
como n > 30, entonces 645.1)95,0()1(  ZZ=Zt 
Ho: 05.0P 
Ha: 05.0P 
 = 0.05
f.p. 94.1
200
)95.0(05.0
05.002.0
0 


)/nP-(1P
P-p
=Z
oo
o
Decisión: Como Zo RR  rechazamos Ho , a favor de la Ha
Conclusión: El fabricante puede demostrar al cliente la calidad del proceso. Usando un
5% de significación de prueba.
RA
1 -  = 0,95
RR
 = 0,05
Zt = -1,645
Z0 = 3.03
645.1)95,0( Z=Zt
Métodos Estadísticos para la investigación 38
3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS
POBLACIONALES
La prueba de comparación de muestras, requiere que las variancias de las dos
poblaciones muestreadas sean iguales. En esta sección describiremos una prueba para
la hipótesis nula 2
1 = 2
2 , que se aplica a muestras aleatorias independientes obtenidas
de dos poblaciones normales; debe utilizarse con mucho cuidado por ser muy sensible a
las desviaciones de tal suposición
Las hipótesis referentes a este parámetro pueden ser:
Ho: 2
1 = 2
2
Ha: 2
1  2
2 Prueba bilateral
Ho: 2
1 = 2
2
Ha: 2
1 > 2
2 Prueba unilateral
Ho: 2
1 = 2
2
Ha: 2
1 < 2
2 Prueba unilateral
.Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones
normales que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza
el siguiente estadístico.
2
2
2
1
s
s
F 
que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1
grados de libertad.
Obs. F1 -  (v1,v2) =
),(F
1
12 vv
Regiones críticas para probar 2
2
2
1  
Métodos Estadísticos para la investigación 39
Hipótesis alterna Estadístico de prueba Rechaza la hipótesis nula si:
2
1 < 2
2
2
2
2
1
s
s
F 
F < F(n1 – 1, n2 – 1)
2
1 > 2
2
2
2
2
1
s
s
F 
F > F1-(n1 – 1, n2 – 1)
2
1  2
2
2
2
m
M
s
s
F 
F < F/2(nM – 1, nm – 1) ó
F > F1-/2(nM – 1, nm – 1)
Donde: s2
M : la mayor de las dos variancias muestrales,
s2
m : la más pequeña de las variancias.
Para hipótesis unilateral: Ho: 2
2
2
1  
Ha: 2
2
2
1  
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis
unilateral:
Ho: 2
2
2
1  
Ha: 2
2
2
1  
Para la otra hipótesis unilateral:
Ho:
2
2
2
1  
Ha:
2
2
2
1  
RA
1 – 
)1,1(2/  mnMnF
RR
 /2 RR
 /2
)1,1(2/1  mnMnF 
RA
1 – 
RR

)12,11(1  nnF 
Métodos Estadísticos para la investigación 40
PROCEDIMIENTO PARA MUESTAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se
modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30, se
utiliza la distribución normal.
El estadístico de prueba es:
21
21
2
1
2
1
nn
s
ss
Z
p
o



2
)1()1(
:
21
2
22
2
112



nn
snsn
s
donde
p
Ejemplo 1:
Se requiere determinar si existe menos variabilidad en el plateado realizado por la
compañía 1 que el efectuado por la compañía 2. Si las muestras aleatorias
independientes de tamaño 12 del trabajo desempeñado por las compañías producen
s1=0,035 mil y s2=0,062 mil, pruébese la hipótesis nula de que 2
1 = 2
2 contra la hipótesis
alterna de que 2
1 < 2
2 con un nivel de significancia de 0,05.
Solución:
n1 = n2 = 12, s1 = 0.035, s2 = 0.062,  = 0.05
como n1 + n2 < 30, entonces 355.0)11,11()1,1( 05,021  FnnF=Ft 
RA
1 – 
RR

)12,11(1  nnF 
Métodos Estadísticos para la investigación 41
Ho: 2
2
2
1  
Ha: 2
2
2
1  
 = 0.05
f.p. 319.0
)062.0(
)035.0(
2
2
2
2
2
1

s
s
F
Decisión: Como 0F RA  se acepta Ho
Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía
2. Usando 5% de significación de prueba.
Ejemplo 2:
Las siguientes muestras aleatorias son mediciones de la capacidad de producción de
calor (en millones de calorías por tonelada (de especímenes de carbón de dos minas:
Mina 1: 8,260, 8,130, 8,350, 8,070, 8,340
Mina 2: 7,950, 7,890, 7,900, 8,140, 7,920, 7,840,
Utilícese un nivel de significancia de 0,02 para probar si es razonable suponer que las
variancias de las poblaciones muestreadas son iguales.
Solución:
n1 = 5, n2 = 6, s1 = 0.1275, s2 = 0.1045,  = 0.02
como n1 + n2 < 30, entonces 39.11)5,4(06.0)5,4()1,1( 99.001.021  FFnnF=Ft 
RA
1 –  = 0.95
RR
 = 0.05
355.0tF
319.00 F
Métodos Estadísticos para la investigación 42
Ho: 2
2
2
1  
Ha: 2
2
2
1  
 = 0.05
f.p. 49.1
)1045.0(
)1275.0(
2
2
2
2
2
1

s
s
F
49.1oF
Decisión: Como 0F RA  se acepta Ho
Conclusión: La variabilidad de ambas poblaciones es igual. Usando 2% de significación
de prueba.
3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES
Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis
natural es que ambas tienen igual promedio, o en otras palabras que la diferencia de
ambos promedios es nula o difieren en alguna cantidad específica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: 1 = 2
Ha: 1  2 Prueba bilateral
Ho: 1 = 2
Ha: 1 > 2 Prueba unilateral
Ho: 1 = 2
Ha: 1 < 3 Prueba unilateral
RA
1 – 
06.02/ F
RR
 /2 RR
 /2
39.112/1 F
Métodos Estadísticos para la investigación 43
Pueden presentarse varias situaciones dependiendo de como son sus varianzas:
Con varianzas conocidas:
La función de prueba es:
n
n
+
n
)-(-)x-x(
=z (0,1)
22
o 
2
2
1
1
2121


Con varianzas desconocidas y diferentes:
La función de prueba es:
t
n
s
+
n
s
)-(-)x-x(
=t 2)-n+n(
22
o 21
2
2
1
1
2121


como n1 + n2 - 2  30 entonces esta función de prueba sigue una distribución normal
estándar.
Con varianzas desconocidas y aproximadamente iguales, la función de prueba es:
2-n+n
s1)-(n+s1)-(n
=s
a.mancomunadvarianzalaessaquÍ
t
)
n
1
+
n
1
(s
)-(-)x-x(
=t
22
2
2
2)-n+n(
2
o
21
21
21
2121
21


Al igual que en el caso anterior, si n1 + n2 - 2  30 entonces la función de prueba sigue
una distribución normal estándar.
Ejemplo
Una compañía desea comparar las expectativas salariales anuales de su personal de
ventas femenino y masculino, según un nuevo plan de compensaciones venta-más-
comisión. Se pidió a n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar,
Métodos Estadísticos para la investigación 44
predijeron sus ingresos anuales bajo el nuevo plan. Las medias y desviaciones
muestrales eran:
1x = $ 31 083 2x = $ 29 745
s1 = $ 2 312 s2 = $ 2 569
¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del
ingreso anual esperado tanto entre los vendedores como las vendedoras? Haga la
prueba con =0,10.
Solución:
Ho: 21   5.5972552
2-n+n
s1)-(n+s1)-(n
=s
yx
2
y
2
x2
Ha: 21  
 = 0.10
f.p. 45.2
40
1
40
1
5.597255252
02974531083
11
21
2















+
n
+
n
s
)-(-)y-x(
=Z
xx
yx
o

645.1)95,0( Z=Zt
Decisión: Como Zo RR  no existe suficiente evidencia como para aceptar la
hipótesis nula, por consiguiente aceptamos la Ha.
Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia
en el promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de
significación de prueba.
RR
2 = 0,05
Zt = -1,645
RA
1 -  = 0,90
RR
2 = 0,05
Zt =1,645
Z0 = 2,46
Métodos Estadísticos para la investigación 45
3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES
POBLACIONALES
Cuando se desea comparar dos poblaciones cualitativas
Las hipótesis referentes a este parámetro pueden ser:
Ho: P1 = P2
Ha: P1  P2 Prueba bilateral
Ho: P1 = P2
Ha: P1 > P2 Prueba unilateral
Ho: P1 = P2
Ha: P1 < P3 Prueba unilateral
La función de prueba es:
n+n
pn+pn
=p
:amancomunadproporciónlaespAquÍ
n
)
n
1
+
n
1
)(p-(1p
)P-(P-)p-(p
=z (0,1)
21
2211
21
2121

Ejemplo 1:
Un sociólogo cree que la proporción de hombres que pertenecen a un grupo
socioeconómico determinado (grupo A) y que ven regularmente lucha en TV. supera
mucho a un segundo grupo de hombres (grupo B) que también ven lucha. Muestras
aleatorias simples de los dos grupos arrojaron los siguientes resultados.
Tamaño de Número de hombres que ven
Grupo la muestra regularmente lucha en TV
A nA = 150 98
B nB = 200 80
¿proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo?
use = 0,05
Métodos Estadísticos para la investigación 46
Solución:
51.0
350
8098




p
Ho: BA PP 
Ha: BA PP 
 = 0.05
f.p. 63.4
200
1
150
1
)49.0(51.0
0)4.065.0(
0 







+
=Z
645.1)95.0( Z=Zt
Decisión: Como Zo RR  rechazamos Ho en favor Ha
Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del
sociólogo con un 5% de significación de prueba.
RA
1 -  = 0,95
RR
2 = 0,05
Zt =1,645
Z0 = 4,63
Métodos Estadísticos para la investigación 47
REFERENCIAS
1. Downie, N, Heath, R. 1986. Métodos Estadísticos Aplicados. Quinta edición.
México: Editorial Harla.
2. Ferran, M. 2001. SPSS Análisis Estadístico. España: Editorial Mc Graw–Hill /
Interamericana.
3. Hernandez R, Fernandez C. Y Baptista P. 1996. Metodología de la Investigación.
Colombia: Editorial Mc Graw-Hill.
4. Martinez, Ciro. 1995. Estadística. Santa Fe de Bogotá: Editorial Presencia.
5. Mendenhall W, Sincich T. 1997. Probabilidad y estadística para ingeniería y
ciencias. Cuarta edición. México: Editorial Prentice-Hall hispanoamericana, S.A.
6. Meza de Castillo E. 1994. Probabilidad. Lima: CONCYTEC.
7. Miller F, Johnson. 1992. Probabilidad y Estadística para Ingenieros. Cuarta
edición. México: Editorial Prince Hall.
8. Mitacc Meza M. 1994. Tópicos de Estadística y Probabilidad. Lima: Editorial San
Marcos.
9. Montgomery D, Runger G. 1996. Probabilidad y Estadística aplicadas a la
Ingeniería. México: Mc Graw-Hill.
10. Montgomery D. 2004. Diseño y Análisis de Experimentos. Segunda edición.
México: Editorial Limusa S.A.
11. Morris H. 1988. Probabilidad y Estadística. Estados Unidos: Editorial ADDISON-
WESLEY Iberoamericana.
12. Moya R, Saravia A. 1998. Probabilidad e Inferencia Estadística. Segunda edición.
Lima: Editorial San Marcos.
13. Sierra Bravo R. 1994. Análisis Estadístico Multivariado, teoría y ejercicios.
España: Editorial Paraninfo, S.A.
14. Wonnacott y Wonnacott. 1991. Estadística Básica Practica. México: Editorial
Limusa

Más contenido relacionado

La actualidad más candente

Ejercicio1 taller de bernoulli (octubre 21 2021)
Ejercicio1 taller de bernoulli (octubre 21 2021)Ejercicio1 taller de bernoulli (octubre 21 2021)
Ejercicio1 taller de bernoulli (octubre 21 2021)Miguel Antonio Bula Picon
 
SEDIMENTACION CENTRIFUGACION equipo 4 .pptx
SEDIMENTACION CENTRIFUGACION equipo 4 .pptxSEDIMENTACION CENTRIFUGACION equipo 4 .pptx
SEDIMENTACION CENTRIFUGACION equipo 4 .pptxjhasmanycano1
 
Laboratorio 10
Laboratorio 10Laboratorio 10
Laboratorio 10cfcInforma
 
Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferencialesAplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferencialesjuliocesarmontoya
 
Coeficientes de actividad
Coeficientes de actividadCoeficientes de actividad
Coeficientes de actividadcruizgaray
 
Ecuaciones de primer orden.
Ecuaciones de primer orden.Ecuaciones de primer orden.
Ecuaciones de primer orden.Andre Clavijo
 
Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...
Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...
Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...yusmely_zavala
 
Cuarto_Parcial_Completo.pdf.pdf
Cuarto_Parcial_Completo.pdf.pdfCuarto_Parcial_Completo.pdf.pdf
Cuarto_Parcial_Completo.pdf.pdfBrayanArias23
 
Reporte intercambiadores de calor
Reporte intercambiadores de calorReporte intercambiadores de calor
Reporte intercambiadores de calorAndres Flores
 
Ejercicios prueba de hipótesis
Ejercicios prueba de hipótesisEjercicios prueba de hipótesis
Ejercicios prueba de hipótesisHugo_Franco
 
Problemas desarrollados de balance de m y e
Problemas desarrollados de  balance de  m y eProblemas desarrollados de  balance de  m y e
Problemas desarrollados de balance de m y eHaydee Melo Javier
 
Informe de laboratorio 4 turbidez
Informe de laboratorio 4 turbidezInforme de laboratorio 4 turbidez
Informe de laboratorio 4 turbidezNicky Madroñero
 

La actualidad más candente (20)

Ejercicio1 taller de bernoulli (octubre 21 2021)
Ejercicio1 taller de bernoulli (octubre 21 2021)Ejercicio1 taller de bernoulli (octubre 21 2021)
Ejercicio1 taller de bernoulli (octubre 21 2021)
 
Tipo de distribuciones
Tipo de distribucionesTipo de distribuciones
Tipo de distribuciones
 
SEDIMENTACION CENTRIFUGACION equipo 4 .pptx
SEDIMENTACION CENTRIFUGACION equipo 4 .pptxSEDIMENTACION CENTRIFUGACION equipo 4 .pptx
SEDIMENTACION CENTRIFUGACION equipo 4 .pptx
 
Laboratorio 10
Laboratorio 10Laboratorio 10
Laboratorio 10
 
Formulario de termodinamica 1
Formulario de termodinamica 1Formulario de termodinamica 1
Formulario de termodinamica 1
 
Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferencialesAplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferenciales
 
Coeficientes de actividad
Coeficientes de actividadCoeficientes de actividad
Coeficientes de actividad
 
Ecuaciones de primer orden.
Ecuaciones de primer orden.Ecuaciones de primer orden.
Ecuaciones de primer orden.
 
Distribución
Distribución Distribución
Distribución
 
Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...
Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...
Ingenieria Quimica Tema: 2 Balance de Materia y Energia en Mezclado y Evapora...
 
Informe de lab.1
Informe de lab.1Informe de lab.1
Informe de lab.1
 
Ley de enfriamiento de newton
Ley de enfriamiento de newtonLey de enfriamiento de newton
Ley de enfriamiento de newton
 
Ecuación de Rayleigh en función de la Volatilidad Relativa
Ecuación de Rayleigh en función de la Volatilidad RelativaEcuación de Rayleigh en función de la Volatilidad Relativa
Ecuación de Rayleigh en función de la Volatilidad Relativa
 
Cuarto_Parcial_Completo.pdf.pdf
Cuarto_Parcial_Completo.pdf.pdfCuarto_Parcial_Completo.pdf.pdf
Cuarto_Parcial_Completo.pdf.pdf
 
Reporte intercambiadores de calor
Reporte intercambiadores de calorReporte intercambiadores de calor
Reporte intercambiadores de calor
 
Ejercicios prueba de hipótesis
Ejercicios prueba de hipótesisEjercicios prueba de hipótesis
Ejercicios prueba de hipótesis
 
Problemas desarrollados de balance de m y e
Problemas desarrollados de  balance de  m y eProblemas desarrollados de  balance de  m y e
Problemas desarrollados de balance de m y e
 
Informe de laboratorio 4 turbidez
Informe de laboratorio 4 turbidezInforme de laboratorio 4 turbidez
Informe de laboratorio 4 turbidez
 
Distribuciones
DistribucionesDistribuciones
Distribuciones
 
BALANCE DE MATERIA Y ENERGÍA
BALANCE DE MATERIA Y ENERGÍABALANCE DE MATERIA Y ENERGÍA
BALANCE DE MATERIA Y ENERGÍA
 

Destacado

Metodo estadistico
Metodo estadisticoMetodo estadistico
Metodo estadisticopelao1972
 
Ejemplo de Ficha de trabajo y bibliografica
Ejemplo de Ficha de trabajo y bibliograficaEjemplo de Ficha de trabajo y bibliografica
Ejemplo de Ficha de trabajo y bibliograficajannetcastillo
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadisticaPAHOLA24
 
El modelo de investigación cualitativa y cuantitativa
El modelo de investigación cualitativa y cuantitativaEl modelo de investigación cualitativa y cuantitativa
El modelo de investigación cualitativa y cuantitativaJaaz06
 
Modelos cuantitativos toma de decisiones
Modelos cuantitativos toma de decisionesModelos cuantitativos toma de decisiones
Modelos cuantitativos toma de decisionesgarciara
 

Destacado (6)

Metodo estadistico
Metodo estadisticoMetodo estadistico
Metodo estadistico
 
Ejemplo de Ficha de trabajo y bibliografica
Ejemplo de Ficha de trabajo y bibliograficaEjemplo de Ficha de trabajo y bibliografica
Ejemplo de Ficha de trabajo y bibliografica
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadistica
 
El modelo de investigación cualitativa y cuantitativa
El modelo de investigación cualitativa y cuantitativaEl modelo de investigación cualitativa y cuantitativa
El modelo de investigación cualitativa y cuantitativa
 
Análisis Estadístico
Análisis EstadísticoAnálisis Estadístico
Análisis Estadístico
 
Modelos cuantitativos toma de decisiones
Modelos cuantitativos toma de decisionesModelos cuantitativos toma de decisiones
Modelos cuantitativos toma de decisiones
 

Similar a Métodos Estadísticos para la Investigación

Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicadaNancy Curasi
 
Muestreo. Lic Henry Andrade
Muestreo. Lic Henry AndradeMuestreo. Lic Henry Andrade
Muestreo. Lic Henry AndradeHenry Andrade
 
Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicadaRoxana Mabel
 
Contenido estadistica descriptiva
Contenido estadistica descriptivaContenido estadistica descriptiva
Contenido estadistica descriptivawacner galindez
 
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdfLibro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdfVeritoIlma
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)daniela515873
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)LauraOspina49
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)SarahOrdez
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)daniela515873
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)valentinasatizabalar
 
322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdf
322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdf322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdf
322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdfSergioChinoGuaygua1
 
Programa matemática aplicada_2011
Programa matemática aplicada_2011Programa matemática aplicada_2011
Programa matemática aplicada_2011Lucas Crotti
 
Silabo estadistica auditoria
Silabo estadistica auditoriaSilabo estadistica auditoria
Silabo estadistica auditorialuz orelllana
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata hamlet mata mata
 

Similar a Métodos Estadísticos para la Investigación (20)

Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicada
 
Muestreo. Lic Henry Andrade
Muestreo. Lic Henry AndradeMuestreo. Lic Henry Andrade
Muestreo. Lic Henry Andrade
 
Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicada
 
Ensayo
EnsayoEnsayo
Ensayo
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Contenido estadistica descriptiva
Contenido estadistica descriptivaContenido estadistica descriptiva
Contenido estadistica descriptiva
 
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdfLibro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdf
322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdf322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdf
322179852-Metodologia-de-La-Investigacion-Matriz-Mapic.pdf
 
Programa matemática aplicada_2011
Programa matemática aplicada_2011Programa matemática aplicada_2011
Programa matemática aplicada_2011
 
20101 d403020321203010401114460
20101 d40302032120301040111446020101 d403020321203010401114460
20101 d403020321203010401114460
 
Tamaño de muestra revisado
Tamaño de muestra revisadoTamaño de muestra revisado
Tamaño de muestra revisado
 
212064 91 fase 2
212064 91 fase 2212064 91 fase 2
212064 91 fase 2
 
Silabo estadistica auditoria
Silabo estadistica auditoriaSilabo estadistica auditoria
Silabo estadistica auditoria
 
Paso 5 - Presentación de resultados.docx
Paso 5 - Presentación de resultados.docxPaso 5 - Presentación de resultados.docx
Paso 5 - Presentación de resultados.docx
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
 

Último

TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfAntonioGonzalezIzqui
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfAdelaHerrera9
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAJAMESDIAZ55
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdfEdwinAlexanderSnchez2
 
Uso y Manejo de Extintores Lucha contra incendios
Uso y Manejo de Extintores Lucha contra incendiosUso y Manejo de Extintores Lucha contra incendios
Uso y Manejo de Extintores Lucha contra incendioseduardochavezg1
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPJosLuisFrancoCaldern
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfrolandolazartep
 
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfPresentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfMirthaFernandez12
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptxGARCIARAMIREZCESAR
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALKATHIAMILAGRITOSSANC
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdfFlorenciopeaortiz
 
Topografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la IngenieríasTopografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la IngenieríasSegundo Silva Maguiña
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxLuisvila35
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)ssuser6958b11
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para PlataformasSegundo Silva Maguiña
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones025ca20
 
Conservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaConservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaANDECE
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciazacariasd49
 
CE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdf
CE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdfCE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdf
CE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdfssuserc34f44
 
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUSesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUMarcosAlvarezSalinas
 

Último (20)

TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf
 
Uso y Manejo de Extintores Lucha contra incendios
Uso y Manejo de Extintores Lucha contra incendiosUso y Manejo de Extintores Lucha contra incendios
Uso y Manejo de Extintores Lucha contra incendios
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdf
 
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdfPresentación Proyecto Trabajo Creativa Profesional Azul.pdf
Presentación Proyecto Trabajo Creativa Profesional Azul.pdf
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdf
 
Topografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la IngenieríasTopografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la Ingenierías
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para Plataformas
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones
 
Conservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaConservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de Almería
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potencia
 
CE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdf
CE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdfCE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdf
CE.040 DRENAJE PLUVIAL_RM 126-2021-VIVIENDA.pdf
 
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUSesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
 

Métodos Estadísticos para la Investigación

  • 1. Universidad Peruana Unión Facultad de Ingeniería y Arquitectura EAP Ingeniería de Ambiental MEINV MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN Docente Mg. María Vallejos Atalaya I Semestre 2009
  • 2. Métodos Estadísticos para la investigación 2 Presentación El presente módulo ha sido preparado con el propósito de servir al estudiante de la Escuela Académica Profesional de Ingeniería de Alimentos - Facultad de Ingeniería - Universidad Peruana Unión, en la formación inicial del amplio campo que constituye la teoría de los métodos estadísticos aplicados a la investigación. El propósito del módulo, es presentar una introducción en el marco de estudio de la estadística de manera que el estudiante de nuestra escuela conozca las múltiples aplicaciones, no solamente en los campos de ciencias naturales, ingeniería, sino también en ciencias sociales y, especialmente, en ingeniería de alimentos. Como se demostrará mas adelante el conocimiento del comportamiento de los parámetros es vital para extraer conclusiones respecto a la población. El presente módulo está organizado en tres unidades, en las cuales se enfoca el aprendizaje de los métodos estadísticos para la aplicación en actividades de especialización profesional como de investigación y en la vida misma. La primera unidad consta de conceptos fundamentales, estimación de parámetros y pruebas de hipótesis paramétricas. La segunda unidad estudia la construcción de diseños experimentales, el análisis de varianza y pruebas de comparaciones múltiples. La tercera unidad centra su atención en el análisis de regresión, covarianza, superficie de respuesta y pruebas no paramétricas. Es el anhelo de la tutora que este módulo contribuya al logro de los objetivos de la asignatura.
  • 3. Métodos Estadísticos para la investigación 3 INDICE GENERAL PRIMERA UNIDAD ........................................................................................................................................ 4 ESTIMACIONES Y PRUEBAS DE HIPÓTESIS............................................................................................ 4 1. ESTIMACIÓN DE PARÁMETROS ........................................................................................................ 4 1.1. ESTIMACIÓN PUNTUAL............................................................................................................ 4 1.1.1. Estimación Puntual para la media poblacional. ......................................................................... 5 1.1.2. Estimación Puntual para la varianza poblacional. ..................................................................... 5 1.1.3. Estimación de parámetros de dos poblaciones........................................................................... 5 1.1.4. Estimación puntual de una población de variable cualitativa .................................................... 6 1.1.5. Estimación puntual de dos poblaciones de variables cualitativas.............................................. 6 1.2. ESTIMACIÓN INTERVÁLICA.................................................................................................... 6 1.2.1. Intervalo confidencial para la media poblacional ...................................................................... 6 1.2.2. Intervalo confidencial para la diferencia de medias poblacionales............................................ 7 1.2.3. Intervalo confidencial para la proporción poblacional .............................................................. 8 1.2.4. Intervalo confidencial para la diferencia de proporciones poblacionales .................................. 8 2. SELECCIÓN DEL TAMAÑO DE MUESTRA en m.a.s........................................................................ 15 3. PRUEBAS DE HIPÓTESIS.................................................................................................................... 20 3.1. PRUEBA DE NORMALIDAD DE DATOS ............................................................................... 23 3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL ................................. 29 3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL......................... 32 3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL ..................... 35 3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES............... 38 3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES........................ 42 3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES POBLACIONALES ......... 45
  • 4. Métodos Estadísticos para la investigación 4 PRIMERA UNIDAD ESTIMACIONES Y PRUEBAS DE HIPÓTESIS Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones respecto a una población, de los datos obtenidos realmente de una muestra. La inferencia estadística comprende dos tipos principales de técnicas: Estimación de parámetros y contrastación de hipótesis. Independientemente de la técnica que se utilice, la finalidad general es utilizar datos de una muestra para extraer conclusiones respecto a una población. 1. ESTIMACIÓN DE PARÁMETROS Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa respecto al valor de una característica de la población y desea conocer cuál podría ser tal valor. La estimación puede asumir 2 formas: - Estimación puntual - Estimación por intervalos 1.1. ESTIMACIÓN PUNTUAL. Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar el parámetro desconocido de la población. Una desventaja de esta forma de estimación es que no aporta la precisión de la estimación del parámetro. Las estimaciones puntuales más usuales son: COMPETENCIAS: 1. Estima parámetros mediante la estimación puntual e interválica. 2. Determina el tamaño adecuado de una muestra aleatoria 3. Contrasta hipótesis pramétricas para la media, varianza, proporción en una y dos poblaciones
  • 5. Métodos Estadísticos para la investigación 5 1.1.1. Estimación Puntual para la media poblacional. Se halla mediante las siguientes fórmulas. - Para datos simples - Para datos agrupados f fx =x= n x =x= i iii    ˆˆ 1.1.2. Estimación Puntual para la varianza poblacional. Se halla mediante las siguientes fórmulas. - Para datos simples - Para datos agrupados 2 2 i 2 2 2 i 2 i i = s = ( x - x ) n - 1 = s = ( x - x ) f f - 1       1.1.3. Estimación de parámetros de dos poblaciones Sea X una variable aleatoria que se distribuye como una distribución normal con media x y varianza ²x e Y otra variable aleatoria que se distribuye como una distribución normal con media y y varianza ²y. La estimación de parámetros de dos poblaciones se pueden realizar mediante: a) La comparación de sus medias, luego: 212121 ˆˆ x-x=-=-  b) La comparación de sus varianzas, luego: s s == 2 x 2 x x x x 2 x 2 1 2 1 2 2 1 2 ˆ ˆˆ    
  • 6. Métodos Estadísticos para la investigación 6 1.1.4. Estimación puntual de una población de variable cualitativa Sea X una variable cualitativa con: P-1=Qy AXsi0, AXsi1, N M N X Pcon X i         Luego: p-1=qy Axsi0, Axsi1, n m N x pcon x i         Entonces: P p 1.1.5. Estimación puntual de dos poblaciones de variables cualitativas. Sea X la variables aleatoria de una población cualitativa con Px proporción de aciertos en X y sea Y la variables aleatoria de otra población cualitativa con Py proporción de aciertos en Y, luego: p-p=P-P=P-P xxxxxx 212121 ˆˆ 1.2. ESTIMACIÓN INTERVÁLICA La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el parámetro tiene la probabilidad especificada de estar. Los estimados por intervalos se conoce como intervalos de confianza y los límites inferior y superior como los límites de confianza. En general el intervalo de confianza para el parámetro  se expresa:   -1=)k+k-P( ˆˆ ˆˆ  Los intervalos confidenciales más usuales son: 1.2.1. Intervalo confidencial para la media poblacional Para determinar el intervalo confidencial para la media poblacional se debe tomar en cuenta lo siguiente:
  • 7. Métodos Estadísticos para la investigación 7 - Cuando se conoce la varianza de la población (n  30)      -1=) n Z+x n Z-xP( 22 )1()1(   - Cuando no se conoce la varianza de la población (n  30) P( x - t s n x + t s n ) = 1 -( n ( 2 ,n-1)1 2 1 1     , ) 1.2.2. Intervalo confidencial para la diferencia de medias poblacionales Cuando n1 + n2 - 2  30 se usa el valor de la abscisa de la distribución normal estándar Z(1-α/2) Si, n1 + n2 - 2 < 30 se usa el valor de la abscisa de la distribución t student ( t(n-1, 1-α/2) Se presentan los siguientes casos: - Si ²1 y ²2 son conocidos      -1=] n + n Z+)x-x(- n + n Z-)x-xP[( 22 2 2 2 2 1 2 1 ) 2 1(2121 2 2 1 1 )1(21   - Si ²1 y ²2 no son conocidos se presentan dos casos: a. Si ²1 es aproximadamente igual a ²2 entonces; ²1  ²2  ² 2-n+n 1)s-n(+1)s-n( =s:donde -1=]) n 1 + n 1 (st+)x-x(-) n 1 + n 1 (st-)x-xP[( 2 2 )-nn( 2 )-nn( 21 2 22 2 11 21 2, 2 12121 21 2, 2 121 2121     Cuando ²1 es diferente a ²2   -1=] n s + n s t+)x-x(_-_ n s + n s t-)x-xP[( 22 )-nn 22 )-nn( 2 2 1 1 2, 2 1(2121 2 2 1 1 2, 2 121 2121 
  • 8. Métodos Estadísticos para la investigación 8 1.2.3. Intervalo confidencial para la proporción poblacional Se presentan los siguientes casos: - Cuando se conoce la proporción poblacional o n 30  -1= n pq Z+pP n pq Z-P(p 22 ))1()1(   - Cuando no se conoce la proporción poblacional o n30 P(p - t pq n P p + t pq n ) = 1 -( 2 ,n-1) ( 2 ,n-1)1 1     1.2.4. Intervalo confidencial para la diferencia de proporciones poblacionales Se pueden presentan los siguientes casos: - Si P1 y P2 son proporciones poblacionales conocidas o n1 y n2 son muestras grandes (n30)  -1=] n qp + n qp Z+)p-p(p-P n qp + n qp Z-)p-pP[( 22 2 22 1 11 )1(2121 2 22 1 11 )1(21   - Si P1 y P2 son proporciones poblacionales desconocidas o n1 y n2 son muestras pequeñas (n<30)  -1=] n qp + n qp t+)p-p(P-P n qp + n qp t-)p-pP[( )-nn()-nn( 2 22 1 11 2, 2 12121 2 22 1 11 2, 2 1(21 2121   Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80 , n2 = 20 se recomienda emplear: n+n pn+pn =p:donde ) n 1 + n 1 )(p-(1p=s 2 21 2211 21 Esta proporción denota la proporción conjunta de las dos muestras.
  • 9. Métodos Estadísticos para la investigación 9 EJEMPLOS 1. Se ensaya un test para determinar el coeficiente de inteligencia a 8 alumnos; los resultados fueron: 98, 108, 92, 111, 102, 95, 89, 115. Determine la estimación puntual e interválica (use el 90% de confianza) para el promedio verdadero del cociente de inteligencia. Solución n = 8, x = 101.25, s = 9.377 -1 = 0.90 Luego 2  1 = 0.95 como n  30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895 a) Estimación puntual: 25.101  x b) Estimación intervalica: Por formula  -1=) n s t+x n s t-xP( )(( 95.0,7)95.0,7  Reemplazando  -1=)-P( 8 377.9 895.125.101 8 377.9 895.125.101  Se obtiene %9053.10797.94 =]P[   2. Un biólogo desea hacer una estimación, con un intervalo de confianza del 95%, de la cantidad promedio de agua que consume diariamente cierta especie animal en condiciones experimentales. El investigador supone que la población de valores de consumo diario de agua está normalmente distribuido y, con base en experiencias pasadas, que la varianza de la población es de 4 gramos cuadrados. Una muestra aleatoria de 25 animales arroja una media de 16,5 gramos.
  • 10. Métodos Estadísticos para la investigación 10 De acuerdo con los datos suministrados, el biólogo puede construir un intervalo de confianza del 95%. Solución n = 25, x = 16.5, s = 2 -1 = 0.95 Luego 2  1 = 0.975 como n  30, entonces t(n – 1, 1 - /2) = t(24,0.975) = 2.064 Estimación intervalica: Por formula  -1=) n s t+x n s t-xP( )(( 95.07)95.07   Reemplazando %95 24 2 064.25.16 24 2 064.25.16 =)-P(   Se obtiene %9034.1766.15 =]P[   3. Como parte de un experimento, una gran empresa manufacturera encontró que el tiempo promedio requerido para que 16 empleados escogidos al azar completaran una tarea determinada era de 26 minutos. La desviación estándar era de 5 minutos. Construir el intervalo de confianza del 95% para la media poblacional. Solución n = 16 x = 26 s = 5 1-  = 0.95 entonces 2  1 = 0.975 como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131 Por formula  -1=) n s t+x n s t-xP( )(( 975.0,15)975.0,15 
  • 11. Métodos Estadísticos para la investigación 11 Reemplazando %95) 16 5 131.226 16 5 131.226 =+-P(   Se obtiene %9566.2834.23 =]P[   4. Se ha hecho un estudio de las diferencias entre estudiantes universitarios del primer año que estuvieron en academias y estudiantes que no estuvieron. Para ello se tomó una muestra aleatoria de 50 estudiantes universitarios que habían asistido a academias y una muestra aleatoria simple independiente de 60 estudiantes que no lo habían hecho. Al final del primer semestre se administró a los estudiantes una prueba de rendimiento en matemática. Los que habían asistido a academias, obtuvieron un puntaje promedio de 14,5, con una varianza de 4,8; y el puntaje promedio para el grupo que no había asistido a la academia, fue de 13,75 con una varianza de 6,4. Construya un intervalo de confianza para la diferencia entre las dos medias poblacionales (use 99% de confianza). Solución ASISTIERON ACADEMIA NO ASISTIERON ACADEMIA nx1 = 50 1x =14.5 s 2 x1 = 4.8 nx2 = 60 2x =13.75 s 2 x2 = 6.4 1 -  = 0.99 luego 1- 2  = 0.995 Como nx1 + nx2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 Por formula   -1=] n s + n s z+)x-x(_-_ n s + n s z-)x-xP[( 22 )( 22 )( 2 2 1 1 2 12121 2 2 1 1 2 121 
  • 12. Métodos Estadísticos para la investigación 12 Reemplazando %99 60 4.6 50 8.4 58.275.135.14 60 4.6 50 8.4 58.275.135.14 21 =]++)-(-+-)-P[(   Se obtiene %9991.141.0 21 =]-P[   5. Los estudiantes que se matricularon en un curso de Métodos Estadísticos fueron distribuidas al azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades para enriquecer el curso. El grupo B estudió mediante el método tradicional de conferencias. Los puntajes obtenidos en una prueba de rendimiento, hecha al terminar el curso dieron los siguientes resultados: Grupo n x s A 10 80 8 B 12 72 10 Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios poblacionales. Solución La confianza, 1 -  = 0.90 luego 1 - 2  = 0.95 Como nA + nB –2 < 30 entonces t (nA + nB –2,1– /2) = t(20, 0.95) = 1.725 Por formula   -1=] n s + n s t+)x-x(- n s + n s t-)x-xP[( B 2 B A 2 A n(nBABA B 2 B A 2 A n(nBA BABA )2/1,2)2/1,2   Reemplazando %90 12 100 10 64 725.17280 12 100 10 64 725.17280 =]++)-(-+-)-P[( BA   Se obtiene %9062.1438.1 =]-P[ BA  
  • 13. Métodos Estadísticos para la investigación 13 6. Una encuesta para verificar las actitudes de los trabajadores ante el boletín mensual, se les pidió a 500 trabajadores de una gran empresa que indicaran con que frecuencia leían el boletín de noticias. De los 500, 375 informaron que leían todas las ediciones. Construir el intervalo de confianza del 95% para la proporción real de los que opinan afirmativamente. Solución n = 500 p = 500 375 = 0.75 q =0.25 1-  = 0.95 luego 2  1 = 0.975 Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96 Por formula  -1=] n pq Z+pP n pq Z-P[p )2/1()2/1(   Reemplazando %95 500 )25.0(75.0 96.175.0 500 )25.0(75.0 96.175.0 =]+P-P[  Se obtiene: %9579.071.0 =]PP[  7. En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto programa de televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado. Determinar los límites de confianza del 99% para la diferencia de proporciones de todos los adultos y jóvenes que vieron con agrado el programa. Solución ADULTOS JÓVENES nA = 400 aA = 100 pA =0,25 qA = 0,75 nJ = 600 aJ = 300 pJ =0,50 qJ = 0,50
  • 14. Métodos Estadísticos para la investigación 14 1 -  = 0.99 luego 1- 2  = 0.995 Como nA+ nJ - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58 Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza mancomunada así: n+n pn+pn =p JA JAJA Reemplazando 4.0 1000 400 600400 50,0*60025,0*400  + + =p ) n 1 + n 1 )(p-(1p=s JA ) 1 + 1 )((=s 032.0 600400 6.04.0  Por formula  -1=]) n 1 + n 1 )(p-(1pZ+)p-p(P-P) n 1 + n 1 )(p-(1pZ-)p-pP[( JA JAJA JA JA 2//1(2//1(  Reemplazando %99)032.0(58.25.025.0)032.0(58.25.025.0 =]+)(P-P-)P[( JA  Se obtiene %9917.033.0 =]P-PP[ JA 
  • 15. Métodos Estadísticos para la investigación 15 2. SELECCIÓN DEL TAMAÑO DE MUESTRA EN M.A.S El procedimiento de muestreo, o diseño experimental, como se le llama comúnmente, influye en la cantidad de información por observación o medición. Este diseño, junto con el tamaño muestral n, determina la cantidad total de información relevante en la muestra. Salvo en contadas ocasiones, trataremos la situación de muestreo más sencilla, un muestreo de una población relativamente grande, y se enfocará la atención del tamaño de muestra n. Para ver cómo el tamaño muestral afecta al ancho de un intervalo de confianza, considérese la desviación estándar de la distribución para cualquier estimador puntual. Por ejemplo, la desviación estándar de la media muestral x , es: n x    Nota: si se desea que el ancho de un intervalo de confianza sea pequeño, debe aumentarse el tamaño de muestra. Procedimiento para seleccionar el tamaño muestra Sea  el parámetro que se quiere estimar, y sea  la desviación estándar del estimador puntual. Entonces se procede según los pasos siguientes. Elegir d, la cota para el error de estimación, y un coeficiente de confianza (1 - ), Resolver la siguiente ecuación para el tamaño de muestra n: dZ     )2/1( Nota: Para la mayoría de los estimadores    es una función del tamaño de muestra n. Propósito: Estimar la media poblacional Como se recordardará la media muestral x se distribuye normalmente con media  y varianza 2 /n, entonces dado un valor z(1-/2), enla distribución normal entre - z(1-/2) y z(1-/2), se encuentra 1-  de los posibles valores de x .
  • 16. Métodos Estadísticos para la investigación 16 1- /2 /2 -Z1- /2  Z1- /2 Entonces para tener una “confiabilidad” de 1-  debe usarse el coeficiente de “confiabilidad” de Z1- /2 (que llamaremos sólo z) obtenido en la tabla de distribución normal estándar o en la función de estadísticas de Excel. De otro lado si establecemos que el nivel de precisión de nuestra estimación de la media es d unidades, estaríamos estableciendo el margen de error admisible para la media muestral respecto a la media poblacional , entonces: P( x -   d) = 1 -  Implica que se tiene una confiabilidad de 1-  de que el nivel de precisión se cumpla en la estimación de la media poblacional a través de la media muestral x . n zd 2   Entonces, El tamaño de muestra para poblaciones infinitas es: 2 22 d z n   Si de otro lado, el muestreo es sobre una población finita, entonces 1   N nN n z d  Entonces, El tamaño de muestra para poblaciones finitas es: 222 22 )1(   zNd zN n   Ajuste de tamaño de muestra:
  • 17. Métodos Estadísticos para la investigación 17 Si 10.0 N n entonces n0 = N n n 1 Ejemplo 1. De una población de 4000 individuos se desea estudiar la media de la presión arterial sistólica, la cual se distribuye normalmente con  = 10, para ello se ha fijado un nivel de confiabilidad de 95% y el nivel de precisión en 2. ¿Cuál será el tamaño de muestra adecuado? Solución: Como datos del problema tenemos: Z1- /2= Z0.975 = 1.96 d = 2  = 10 Entonces: 94 10)96.1()14000(2 10)96.1(4000 )1( 222 22 222 22        zNd zN n Como 10.0 N n , entonces no es necesario usar la corrección n0. El tamaño de 94 individuos es suficiente. Ejemplo 2. Resuelva el mismo problema pero considerando una precisión de d=0.8 Solución: Tenemos ahora, 523 10)96.1()14000(8,0 10)96.1(4000 )1( 222 22 222 22        zNd zN n
  • 18. Métodos Estadísticos para la investigación 18 Como 10.0 N n , entonces el tamaño de muestra será: 463 4000 523 1 523 1 0      N n n n Deberá tomarse entonces una muestra de 463 individuos. Propósito: Estimar la proporción poblacional El procedimiento es análogo al propósito anterior, debiendo emplearse ahora: Para poblaciones infinitas 2 2 d pqz n  Para poblaciones finitas pqzNd pqzN n 22 2 )1(   Y si 10.0 N n entonces completar el cálculo con: N n n n   1 0 Ejemplo: Se desea estudiar una población de 2000 alumnos referente a la prevalencia de desnutrición. Se estima p estaría muy cercano a 0,25 y para ello se ha establecido como nivel de confiabilidad el 95% y el nivel de precisión 0,05 ¡Cuál es el tamaño de muestra necesario? Solución: N = 2000 Z1 - /2 = Z0,975 = 1.96 p = 0,25
  • 19. Métodos Estadísticos para la investigación 19 q = 1 – p = 1 – 0,25 = 0,75 d = 0,05 Entonces, 252 )75,0)(25,0()96,1()12000()05,0( )75,0)(25,0()96,1(2000 )1( 22 2 22 2      pqzNd pqzN n Como 10.0 N n , entonces el tamaño de muestra será: 224 2000 252 1 252 1 0      N n n n El tamaño de muestra necesario es de 253 alumnos.
  • 20. Métodos Estadísticos para la investigación 20 3. PRUEBAS DE HIPÓTESIS A continuación definiremos algunos conceptos básicos para la prueba de hipótesis. Hipótesis Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación. Por esta razón se le denomina hipótesis de investigación. Generalmente hay que volver a plantear las hipótesis de investigación convenientemente de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas las hipótesis reciben el nombre de hipótesis estadística. Hipótesis nula (Ho) Son aquellas que están referidas a algún parámetro de la población o de las poblaciones de estudio. Estas son llamadas hipótesis científicas. Hipótesis alternativa (Ha) Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la que sirve para contrastarla. Errores de prueba y nivel de significación Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal caso estaremos cometiendo el denominado ERROR DE TIPO I. De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos, estaremos decidiendo bien. Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos corresponde al NIVEL DE SIGNIFICACIÓN. P(ERROR TIPO I) = 
  • 21. Métodos Estadísticos para la investigación 21 Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o falsa. DECISIÓN NATURALEZA DE Ho SOBRE Ho Cierta Falsa No rechazar Decisión Error tipo II correcta (probabilidad ) Rechazar Error tipo I Decisión (Probabilidad ) correcta Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es posible minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas de tal modo que al disminuir una de ellas la otra aumenta. Así si queremos minimizar  inmediatamente aumenta la probabilidad de  y viceversa. Generalmente el investigador fija apriori el error  que está dispuesto a tolerar, es decir la probabilidad máxima de cometer el error de tipo I. La decisión de una prueba estadística está asociada al nivel de significación: a) Si P < 0.05 ( = 0.05) se dice que existe significación en la prueba b) Si P < 0.01 ( = 0.01) se dice que existe alta significación en la prueba Pruebas bilaterales y unilaterales Cuando tenemos hipótesis alternativa de la forma: Ho :  = o Ho : P = Po Ha :   o Ha : P  Po Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser mayor, significativamente o acaso menor, significativamente. En tales casos el nivel de significación  queda partido en /2 en cada lado de la distribución del estadístico o función de prueba.
  • 22. Métodos Estadísticos para la investigación 22 Tendremos entonces una prueba bilateral. (dos puntos críticos) 1 -  /2 /2 De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales. (un punto crítico) Ho :  = o Ha :  > o 1 -   Ho :  = o Ha :  < o  1 -  A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama REGIÓN DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN. Una prueba de contrastación de hipótesis estadística se conduce básicamente según el siguiente procedimiento. 1. Seleccionar el parámetro de interés 2. Plantear las hipótesis - Hipótesis nula (Ho) - Hipótesis alternativa (Ha) 3. Establecer el nivel de significación de prueba () 4. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha función de prueba. 5. Efectuar el reemplazo numérico en la función de prueba con la información muestral. 6. Determinar las regiones de aceptación o rechazo en la distribución de la función de prueba, según se trate de pruebas bilaterales o unilaterales. 7. Tomar una decisión sobre Ho, según la siguiente regla: a.- Rechazar Ho si el valor de la función de prueba cae en la región de rechazo. En tal caso se concluirá que Ho se rechaza en favor de Ha con una
  • 23. Métodos Estadísticos para la investigación 23 significación estadística. b.- No rechazar Ho si el valor de la función de prueba cae en la región de aceptación. En tal caso se concluirá de que la información muestral no brinda suficientes evidencias como para sospechar de que Ho no sea cierta. 8. Establecer la conclusión. Antes de poder estimar parámetros o realizar la prueba de hipótesis para hacer conclusiones sobre los parámetros de la población es necesario que la variable en estudio se ajuste a una distribución normal para que los resultados de la investigación sean confiables. Por lo tanto la primera prueba de hipótesis a estudiar corresponde a la PRUEBA DE NORMALIDAD DE DATOS, que nos permite determinar si la variables en estudio se distribuye normalmente o no. 3.1. PRUEBA DE NORMALIDAD DE DATOS 1. Reconocimiento de una ley de probabilidad con información real. a. Reconocimiento teórico (distribución de probabilidad) b. Ajuste empírico de una población real a una teórica. c. Pruebas de bondad de ajuste - Prueba Ji-cuadrada - Prueba de Kolmogorov-Smirnov d. Construcción de muestras aleatorias e. Construcción de muestras artificiales con una ley de probabilidad arbitraria. (método de Monte Carlo). f. Prueba de aleatoriedad. 2. Transformaciones de variables aleatorias no normales a normales. Transformación raíz cuadrada: Se usa cuando se tiene una variable (X) que se aproxima a una distribución de Poisson, así: 20Xdecires, Xdepequeñosvalorespara1+X=Z XdegrandesvaloresparaX=Z ii ii
  • 24. Métodos Estadísticos para la investigación 24 Transformación angular: Se usa cuando se tiene una variable (X) que se aproxima a una distribución Binomial, así: Xdepequeñosvalorespara1+Xarcsen=Z XdegrandesvaloresparaXarcsen=Z ii ii Transformación logarítmica: Se usa cuando se tiene una variable (X) tiende a crecer 20Xdecires, Xdepequeñosvalorespara1+X=Z XdegrandesvaloresparaX=Z ii ii Transformación de Fisher: Se usa cuando se tiene una variable (X) que se aproxima a una distribución Ji-cuadrada con n grados de libertad. i i 2 Z = 2 X - 2n - 1 para cualesquier valor de X 3. PRUEBA DE BONDAD DE AJUSTE A LA DISTRIBUCIÓN NORMAL Procedimiento (1) Formular la hipótesis: Ho: La información dada se ajusta a una ley de distribución normal Ha: La información dada no se ajusta a una ley de distribución normal (2) Fijar el nivel de significancia () las más usadas son;  = 0,05; 0,01; 0,10 1 -  = 0,90; 0,99; 0,90 grados de confianza (3) Elegir la función pivotal )(prueba e )e-f( =U 22 1)-(r i 2 ii o 
  • 25. Métodos Estadísticos para la investigación 25 donde: r = m - k, m = Nº de clases en la inf. real n = Nº de parámetros de la ley de prob. fi = frecuencia absoluta simple observada ei = frecuencia absoluta simple esperada ei = n pi ; ei  5 Uo = máx Sn(x) - P(x) (Prueba de Kolmogorov) donde: Sn(x) = Hi frec. rel. acum. observada P(x) = Fi = P(Xx) frec. acum. Esperada Tabla de la prueba de Kolmogoroy Smirnov *** Tamaño de la Muestra (n) Nivel de significación correspondiente a D = el valor máximo de Fo (X) = SN (X) 0.20 0.15 0.10 0.05 0.01 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 más de 35 0.900 0.684 0.565 0.494 0.446 0.410 0.381 0.358 0.339 0.322 0.307 0.295 0.284 0.274 0.266 0.258 0.250 0.244 0.237 0.231 0.21 0.19 0.18 n 07.1 0.925 0.726 0.597 0.525 0.474 0.436 0.405 0.381 0.360 0.342 0.326 0.313 0.302 0.292 0.283 0.274 0.266 0.259 0.262 0.246 0.22 0.20 0.19 n 14.1 0.950 0.776 0.642 0.564 0.510 0.470 0.438 0.411 0.388 0.368 0.352 0.338 0.325 0.314 0.304 0.295 0.286 0.278 0.272 0.264 0.24 0.22 0.21 n 22.1 0.975 0.842 0.708 0.624 0.565 0.521 0.486 0.457 0.432 0.410 0.391 0.375 0.361 0.349 0.338 0.328 0.318 0.309 0.301 0.294 0.27 0.24 0.23 n 36.1 0.995 0.929 0.828 0.733 0.669 0.618 0.577 0.543 0.514 0.490 0.468 0.450 0.433 0.418 0.404 0.392 0.381 0.371 0.363 0.358 0.32 0.29 0.27 n 63.1 De S. Siegel, Nonparametric Statistica, McGraw-Hill Book Company, Nueva York, 1958. Se ha adaptado de F. J. Massey, Jr., “the Kolmogorov-Smirnov Test for Goodness of Fit”, J. Amer. Statist. Ass., vol. 46, pág. 70, 1951, con la amable autorización del autor y el editor.
  • 26. Métodos Estadísticos para la investigación 26 Ej. n = 10.  = 0.05 P(U  c) = 0.95 c = 0.410 (4) Determinar la región de rechazo y la región de aceptación. (5) Tomar la decisión. Si Uo  RA entonces aceptamos Ho es decir la información se ajusta a una distribución normal, si Uo  RR entonces rechazamos Ho es decir la información no se ajusta a una distribución normal. Antes de realizar cualquier análisis estadístico se deben tener presentes las condiciones de aplicación del mismo. En casi todos los análisis estadísticos, la asunción de normalidad es un común denominador. De ahí que comencemos este apartado con la prueba estadística de Normalidad. Ésta se denomina prueba de Kolmogorov - Smirnov y se halla en el SPSS en el menú de Análisis, dentro de la opción de Pruebas no paramétricas y finalmente bajo el nombre abreviado de K-S de una muestra... . El cuadro de diálogo nos permite seleccionar la variable a analizar y la ley de probabilidad que se propone como de la población de la que ha sido extraída la muestra. Es importante notar que a veces las asunciones se refieren a la Normalidad de las poblaciones que se comparan, por lo que esta prueba de K-S debe repetirse para cada una de las muestras a comparar. RA 1 –  RA  f(u) U U0
  • 27. Métodos Estadísticos para la investigación 27 Ejemplo: La tabla siguiente presenta la información de notas de 162 estudiantes en el curso de estadística durante un año dado. Probar que la siguiente muestra fue extraía de una población de notas distribuidas en forma normal con  = 0,01. Notas 30-40 40-50 50-60 60-70 70-80 80-90 90-100 N de est. 5 10 28 52 31 26 10 Solución Ho: Las notas se ajustan a una ley de distribución normal Ha: Las notas no se ajustan a una ley de distribución normal  = 0.01 Notas x Estandarizando z Nº Estudiantes f Probabilidad P Valores Esperados ei = npi Ji- Cuadrada (fi-ei)2/ei 30 – 40 -2.70 – -1.99 5 0.0198 3.20 40 – 50 -1.99 – -1.28 10 0.0767 12.42 0.02 50 – 60 -1.28 – -0.57 28 0.1833 29.69 0.10 60 – 70 -0.57 – 0.14 52 0.2706 43.84 1.52 70 – 80 0.14 – 0.84 31 0.2468 39.99 2.02 80 – 90 0.84 – 1.55 26 0.1391 22.53 0.53 90 – 100 1.55 – 2.26 10 0.0484 7.84 0.60 TOTAL 162 U0 = 4.79 Notas x Estandarizand o Z Nº Estudiante f Frecuencia Relativas h Probabilid ad p Frecuencias Relativas Acumulada Sn(x)= Hi Probabilida d Acumulada P(x) Kolmogorov MaxH-P 30 – 40 -2.70 – -1.99 5 0.0309 0.0198 0.0309 0.0198 0.0111 40 – 50 -1.99 – -1.28 10 0.0617 0.0767 0.0926 0.0964 0.0038 50 – 60 -1.28 – -0.57 28 0.1728 0.1833 0.2654 0.2797 0.0143 60 – 70 -0.57 – 0.14 52 0.3210 0.2706 0.5864 0.5504 0.0360 70 – 80 0.14 – 0.84 31 0.1914 0.2468 0.7778 0.7972 0.0194 80 – 90 0.84 – 1.55 26 0.1605 0.1391 0.9383 0.9363 0.0020 90 – 100 1.55 – 2.26 10 0.0617 0.0484 1.0000 0.9847 0.0153 TOTAL 162 1 U0 = 0.0360 x = 68.09 s = 14.11 70.2 11.14 09.6830 1   Z 0198.00035.00233.070.299.199.170.21  ]ZP[]ZP[=]Z[p 15 15.68
  • 28. Métodos Estadísticos para la investigación 28 Prueba X²: 345.112 )0.99,3(   = e )e-f( =U 2 1)-(r i 2 ii o Como r = m – k = 6 – 2 = 4 Donde: m: Nº de filas ajustadas k: Nº parámetros de la distribución normal Uo = 4.490 Ut = 11.345 Decisión: Como Uo RA  aceptamos Ho la información se ajusta a la distribución normal. Prueba de Kolmogorov Uo = máx Sn(x) - P(x) = 0.0342  = 0.01 n = 162 U = 0,0342 Ut = 128.0 162 63.163.1  n , obtenido de la tabla de Kolmogorov RA 1 –  = 4,490  = 0,01 f(u) U Ut = 11,345 RR U0 = 4,490 RA 1 –  = 0,99  = 0,01 f(u) U Ut = 0,128 RR U0 = 0,0342
  • 29. Métodos Estadísticos para la investigación 29 Decisión: Como Uo RA  aceptamos Ho Conclusión: Se concluye que la información se ajusta a la distribución normal con el 1% de significación de prueba. 3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las características de una población normal. Las hipótesis referentes a este parámetro pueden ser: Ho:  = o Ha:   o Prueba bilateral Ho:  = o Ha:  > o Prueba unilateral Ho:  = o Ha:  < o Prueba unilateral Dicha prueba se efectúa mediante la siguiente función de prueba: a) Si la desviación estándar poblacional no es conocida o n<30 )1,1(    n o o t ns/ -x =t b) Si la desviación estándar poblacional es conocida o n30 n n/ -x =z (0,1) o o   
  • 30. Métodos Estadísticos para la investigación 30 Ejemplo 1: El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida le permite a su compañía vender más pólizas que las compañías "promedio". El promedio mensual de ventas de todos los agentes de la compañía es de $300. A una muestra de agentes que han recibido el programa de entrenamiento se le encuentra las siguientes ventas en dólares: 300, 270, 360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el supervisor de estos agentes, adoptaría para los restantes el programa de entrenamiento propuesto por el señor Martínez. Emplee 5% de nivel de significación. Solución  = 300, n = 10, x = 351.9, s = 48.64 -1 = 0.95 como n  30, entonces t(n – 1, 1-) = t(9,0.95) = 1.895 Ho: 300 Ha: 300  = 0.05 f.p. 37.3 10 64.48 3009.3510 0      n s x t  Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis nula a favor de la hipótesis alternativa Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su compañía vender más pólizas de seguro que la compañía promedio, por lo cual se adoptará para el resto de los agentes el programa propuesto por el señor Martinez. Ejemplo 2: Los sistemas de escape de emergencia para tripulantes de aeronaves son impulsados por un combustible sólido. Una de las características importantes de este producto es la RA 1 -  = 0,95 RR  = 0,05 tt = 1,812 t0 = 3,37
  • 31. Métodos Estadísticos para la investigación 31 rapidez de combustión. Las especificaciones requieren que la rapidez promedio de combustión sea 50 cm/s. Se sabe que la desviación estándar de esta rapidéz es 2 cm/s. El experimentador decide especificar una probabilidad para el error tipo I del 5%. Se selecciona una muestra aleatoria de 25 y obtiene una rapidez promedio muestral de combustión de 51,3 cm/s. ¿A qué conclusión debe llegar? Solución:  = 50, n = 25, x = 51.3,  =2  = 0.05 como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96 Ho:  = 50 Ha:   50  = 0.05 f.p. 25.3 25 2 503.51    n -x =Z o o   96.1)975,0( Z=Zt Decisión: Como Zo RR  Rechazamos la Ho , a favor de Ha Conclusión: Por lo tanto no se cumple con las especificaciones la rapidez promedio de combustión difiere de 50 cm/s. Usando 5% de significación de prueba. RR 2 = 0,025 Zt = -1,96 RA 1 -  = 0,95 RR 2 = 0,025 Zt =1,96 Z0 =3.25
  • 32. Métodos Estadísticos para la investigación 32 3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. Procedimiento: Supóngase que se desea probar la hipótesis de que la varianza de una población normal 2 es igual a un valor específico, por ejemplo, 2 o. Sea X1, X2, ..., Xn una muestra aleatoria de n observaciones tomadas de esta población. Las hipótesis referentes a este parámetro pueden ser: Ho: 2 = 2 o Ha: 2  2 o Prueba bilateral Ho: 2 = 2 o Ha: 2 > 2 o Prueba unilateral Ho: 2 = 2 o Ha: 2 < 2 o Prueba unilateral Se utiliza el estadístico de prueba 2 2 2 )1( o o Sn X    donde S2 es la varianza muestral. Ahora si Ho: 2 = 2 o es verdadera, entonces el estadístico de prueba X2 o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se calcula el valor de la estadística de prueba X2 o, y la hipótesis Ho: 2 = 2 º , debe rechazarse si: 2 2/1,1 2 2 2/,1 2         no no sio
  • 33. Métodos Estadísticos para la investigación 33 donde X2 n-1,/2 y X2 n-1,1-/2 son los puntos que corresponden a los porcentajes 100/2 inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente. El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho: 2 = 2 o Ha: 2 > 2 o Se rechaza si: X2 o > X2 (n-1,1-) Para la otra hipótesis unilateral: Ho: 2 = 2 o Ha: 2 < 2 o Se rechaza si: X2 o < X2 n-1, RA 1 –  2 )2/,1( nX RR  /2 RR  /2 2 )2/1,1( nX RA 1 –  RR  2 )1,1( nX RA 1 –  RR  2 ),1( nX
  • 34. Métodos Estadísticos para la investigación 34 PROCEDIMIENTO PARA MUESTAS GRANDES Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30 se utiliza la distribución normal. El estadístico de prueba es: n s Z o o o 2    El gráfico utilizado sería acampanado. Ejemplo: Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas de fluido)2 . Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2 , entonces existe una proporción inaceptable de botellas que serán llenadas con una cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de prueba. Solución: 2 = 0.01, n = 20, s2 = 0.0153  = 0.05 como n < 30, entonces 2 )1,1( nX = 1.302 )95.0,19( X Ho: 2 = 0.01 Ha: 2 > 0.01  = 0.05
  • 35. Métodos Estadísticos para la investigación 35 f.p. 07.29 01.0 )0153.0)(19()1( 2 2 2    o o Sn X  1.302 )95.0,19( X Decisión: Como 07.29 2 oX  RA  aceptamos Ho Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza es igual a 0.01. 3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una determinada característica. Las hipótesis referentes a este parámetro pueden ser: Ho: P = Po Ha: P  Po Prueba bilateral Ho: P = Po Ha: P > Po Prueba unilateral Ho: P = Po Ha: P < Po Prueba unilateral La función de prueba para valores de n  30 es: n )/np-(1p p-P =z (0,1) oo o o  RA 1 –  = 0.95 RR  = 0.05 1.30 2 tX 07.29 2 oX
  • 36. Métodos Estadísticos para la investigación 36 La función de prueba para valores de n < 30 es: t )/np-(1p p-P =t 1)-(n oo o o  Ejemplo 1: El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde? Solución P = 0.60, n = 120, m = 75, 625.0 120 75 p ,  = 0.05 como n > 30, entonces 645.1)95,0()1(  ZZ=Zt  Ho: 60.0P  Ha: 60.0P   = 0.05 f.p. 56.0 120 )4.0(6.0 6.0625.0 0    )/np-(1p p-P =Z oo o Decisión: Como Zo RA  aceptamos Ho Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión del alcalde. Usando un 5% de significación de prueba. RA 1 -  = 0,95 RR  = 0,05 Zt = 1,645 Z0 = 0,56 645.1)95,0( Z=Zt
  • 37. Métodos Estadísticos para la investigación 37 Ejemplo 2: Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0,05, y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando  = 0,05. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad del proceso? Solución P = 0.05, n = 200, m = 4, 02.0 200 4 p ,  = 0.05 como n > 30, entonces 645.1)95,0()1(  ZZ=Zt  Ho: 05.0P  Ha: 05.0P   = 0.05 f.p. 94.1 200 )95.0(05.0 05.002.0 0    )/nP-(1P P-p =Z oo o Decisión: Como Zo RR  rechazamos Ho , a favor de la Ha Conclusión: El fabricante puede demostrar al cliente la calidad del proceso. Usando un 5% de significación de prueba. RA 1 -  = 0,95 RR  = 0,05 Zt = -1,645 Z0 = 3.03 645.1)95,0( Z=Zt
  • 38. Métodos Estadísticos para la investigación 38 3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES La prueba de comparación de muestras, requiere que las variancias de las dos poblaciones muestreadas sean iguales. En esta sección describiremos una prueba para la hipótesis nula 2 1 = 2 2 , que se aplica a muestras aleatorias independientes obtenidas de dos poblaciones normales; debe utilizarse con mucho cuidado por ser muy sensible a las desviaciones de tal suposición Las hipótesis referentes a este parámetro pueden ser: Ho: 2 1 = 2 2 Ha: 2 1  2 2 Prueba bilateral Ho: 2 1 = 2 2 Ha: 2 1 > 2 2 Prueba unilateral Ho: 2 1 = 2 2 Ha: 2 1 < 2 2 Prueba unilateral .Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones normales que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza el siguiente estadístico. 2 2 2 1 s s F  que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1 grados de libertad. Obs. F1 -  (v1,v2) = ),(F 1 12 vv Regiones críticas para probar 2 2 2 1  
  • 39. Métodos Estadísticos para la investigación 39 Hipótesis alterna Estadístico de prueba Rechaza la hipótesis nula si: 2 1 < 2 2 2 2 2 1 s s F  F < F(n1 – 1, n2 – 1) 2 1 > 2 2 2 2 2 1 s s F  F > F1-(n1 – 1, n2 – 1) 2 1  2 2 2 2 m M s s F  F < F/2(nM – 1, nm – 1) ó F > F1-/2(nM – 1, nm – 1) Donde: s2 M : la mayor de las dos variancias muestrales, s2 m : la más pequeña de las variancias. Para hipótesis unilateral: Ho: 2 2 2 1   Ha: 2 2 2 1   El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis unilateral: Ho: 2 2 2 1   Ha: 2 2 2 1   Para la otra hipótesis unilateral: Ho: 2 2 2 1   Ha: 2 2 2 1   RA 1 –  )1,1(2/  mnMnF RR  /2 RR  /2 )1,1(2/1  mnMnF  RA 1 –  RR  )12,11(1  nnF 
  • 40. Métodos Estadísticos para la investigación 40 PROCEDIMIENTO PARA MUESTAS GRANDES Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30, se utiliza la distribución normal. El estadístico de prueba es: 21 21 2 1 2 1 nn s ss Z p o    2 )1()1( : 21 2 22 2 112    nn snsn s donde p Ejemplo 1: Se requiere determinar si existe menos variabilidad en el plateado realizado por la compañía 1 que el efectuado por la compañía 2. Si las muestras aleatorias independientes de tamaño 12 del trabajo desempeñado por las compañías producen s1=0,035 mil y s2=0,062 mil, pruébese la hipótesis nula de que 2 1 = 2 2 contra la hipótesis alterna de que 2 1 < 2 2 con un nivel de significancia de 0,05. Solución: n1 = n2 = 12, s1 = 0.035, s2 = 0.062,  = 0.05 como n1 + n2 < 30, entonces 355.0)11,11()1,1( 05,021  FnnF=Ft  RA 1 –  RR  )12,11(1  nnF 
  • 41. Métodos Estadísticos para la investigación 41 Ho: 2 2 2 1   Ha: 2 2 2 1    = 0.05 f.p. 319.0 )062.0( )035.0( 2 2 2 2 2 1  s s F Decisión: Como 0F RA  se acepta Ho Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía 2. Usando 5% de significación de prueba. Ejemplo 2: Las siguientes muestras aleatorias son mediciones de la capacidad de producción de calor (en millones de calorías por tonelada (de especímenes de carbón de dos minas: Mina 1: 8,260, 8,130, 8,350, 8,070, 8,340 Mina 2: 7,950, 7,890, 7,900, 8,140, 7,920, 7,840, Utilícese un nivel de significancia de 0,02 para probar si es razonable suponer que las variancias de las poblaciones muestreadas son iguales. Solución: n1 = 5, n2 = 6, s1 = 0.1275, s2 = 0.1045,  = 0.02 como n1 + n2 < 30, entonces 39.11)5,4(06.0)5,4()1,1( 99.001.021  FFnnF=Ft  RA 1 –  = 0.95 RR  = 0.05 355.0tF 319.00 F
  • 42. Métodos Estadísticos para la investigación 42 Ho: 2 2 2 1   Ha: 2 2 2 1    = 0.05 f.p. 49.1 )1045.0( )1275.0( 2 2 2 2 2 1  s s F 49.1oF Decisión: Como 0F RA  se acepta Ho Conclusión: La variabilidad de ambas poblaciones es igual. Usando 2% de significación de prueba. 3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis natural es que ambas tienen igual promedio, o en otras palabras que la diferencia de ambos promedios es nula o difieren en alguna cantidad específica. Las hipótesis referentes a este parámetro pueden ser: Ho: 1 = 2 Ha: 1  2 Prueba bilateral Ho: 1 = 2 Ha: 1 > 2 Prueba unilateral Ho: 1 = 2 Ha: 1 < 3 Prueba unilateral RA 1 –  06.02/ F RR  /2 RR  /2 39.112/1 F
  • 43. Métodos Estadísticos para la investigación 43 Pueden presentarse varias situaciones dependiendo de como son sus varianzas: Con varianzas conocidas: La función de prueba es: n n + n )-(-)x-x( =z (0,1) 22 o  2 2 1 1 2121   Con varianzas desconocidas y diferentes: La función de prueba es: t n s + n s )-(-)x-x( =t 2)-n+n( 22 o 21 2 2 1 1 2121   como n1 + n2 - 2  30 entonces esta función de prueba sigue una distribución normal estándar. Con varianzas desconocidas y aproximadamente iguales, la función de prueba es: 2-n+n s1)-(n+s1)-(n =s a.mancomunadvarianzalaessaquÍ t ) n 1 + n 1 (s )-(-)x-x( =t 22 2 2 2)-n+n( 2 o 21 21 21 2121 21   Al igual que en el caso anterior, si n1 + n2 - 2  30 entonces la función de prueba sigue una distribución normal estándar. Ejemplo Una compañía desea comparar las expectativas salariales anuales de su personal de ventas femenino y masculino, según un nuevo plan de compensaciones venta-más- comisión. Se pidió a n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar,
  • 44. Métodos Estadísticos para la investigación 44 predijeron sus ingresos anuales bajo el nuevo plan. Las medias y desviaciones muestrales eran: 1x = $ 31 083 2x = $ 29 745 s1 = $ 2 312 s2 = $ 2 569 ¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del ingreso anual esperado tanto entre los vendedores como las vendedoras? Haga la prueba con =0,10. Solución: Ho: 21   5.5972552 2-n+n s1)-(n+s1)-(n =s yx 2 y 2 x2 Ha: 21    = 0.10 f.p. 45.2 40 1 40 1 5.597255252 02974531083 11 21 2                + n + n s )-(-)y-x( =Z xx yx o  645.1)95,0( Z=Zt Decisión: Como Zo RR  no existe suficiente evidencia como para aceptar la hipótesis nula, por consiguiente aceptamos la Ha. Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia en el promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de significación de prueba. RR 2 = 0,05 Zt = -1,645 RA 1 -  = 0,90 RR 2 = 0,05 Zt =1,645 Z0 = 2,46
  • 45. Métodos Estadísticos para la investigación 45 3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES POBLACIONALES Cuando se desea comparar dos poblaciones cualitativas Las hipótesis referentes a este parámetro pueden ser: Ho: P1 = P2 Ha: P1  P2 Prueba bilateral Ho: P1 = P2 Ha: P1 > P2 Prueba unilateral Ho: P1 = P2 Ha: P1 < P3 Prueba unilateral La función de prueba es: n+n pn+pn =p :amancomunadproporciónlaespAquÍ n ) n 1 + n 1 )(p-(1p )P-(P-)p-(p =z (0,1) 21 2211 21 2121  Ejemplo 1: Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico determinado (grupo A) y que ven regularmente lucha en TV. supera mucho a un segundo grupo de hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos grupos arrojaron los siguientes resultados. Tamaño de Número de hombres que ven Grupo la muestra regularmente lucha en TV A nA = 150 98 B nB = 200 80 ¿proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? use = 0,05
  • 46. Métodos Estadísticos para la investigación 46 Solución: 51.0 350 8098     p Ho: BA PP  Ha: BA PP   = 0.05 f.p. 63.4 200 1 150 1 )49.0(51.0 0)4.065.0( 0         + =Z 645.1)95.0( Z=Zt Decisión: Como Zo RR  rechazamos Ho en favor Ha Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del sociólogo con un 5% de significación de prueba. RA 1 -  = 0,95 RR 2 = 0,05 Zt =1,645 Z0 = 4,63
  • 47. Métodos Estadísticos para la investigación 47 REFERENCIAS 1. Downie, N, Heath, R. 1986. Métodos Estadísticos Aplicados. Quinta edición. México: Editorial Harla. 2. Ferran, M. 2001. SPSS Análisis Estadístico. España: Editorial Mc Graw–Hill / Interamericana. 3. Hernandez R, Fernandez C. Y Baptista P. 1996. Metodología de la Investigación. Colombia: Editorial Mc Graw-Hill. 4. Martinez, Ciro. 1995. Estadística. Santa Fe de Bogotá: Editorial Presencia. 5. Mendenhall W, Sincich T. 1997. Probabilidad y estadística para ingeniería y ciencias. Cuarta edición. México: Editorial Prentice-Hall hispanoamericana, S.A. 6. Meza de Castillo E. 1994. Probabilidad. Lima: CONCYTEC. 7. Miller F, Johnson. 1992. Probabilidad y Estadística para Ingenieros. Cuarta edición. México: Editorial Prince Hall. 8. Mitacc Meza M. 1994. Tópicos de Estadística y Probabilidad. Lima: Editorial San Marcos. 9. Montgomery D, Runger G. 1996. Probabilidad y Estadística aplicadas a la Ingeniería. México: Mc Graw-Hill. 10. Montgomery D. 2004. Diseño y Análisis de Experimentos. Segunda edición. México: Editorial Limusa S.A. 11. Morris H. 1988. Probabilidad y Estadística. Estados Unidos: Editorial ADDISON- WESLEY Iberoamericana. 12. Moya R, Saravia A. 1998. Probabilidad e Inferencia Estadística. Segunda edición. Lima: Editorial San Marcos. 13. Sierra Bravo R. 1994. Análisis Estadístico Multivariado, teoría y ejercicios. España: Editorial Paraninfo, S.A. 14. Wonnacott y Wonnacott. 1991. Estadística Básica Practica. México: Editorial Limusa