SlideShare una empresa de Scribd logo
1 de 44
Descargar para leer sin conexión
169
Capítulo IV
Pruebas de hipótesis para
medidas de asociación
[11]
En muchas situaciones es de interés estudiar la relación entre dos
o más variables definidas en una población, basados en los resul-
tados encontrados en la muestra. Por ejemplo, podemos estar in-
teresados en estudiar la relación entre el sexo y el lugar de proce-
dencia de los participantes, entre el sexo y el rendimiento acadé-
mico en el curso de álgebra, entre la edad y el tiempo de servicio
de los participantes en el programa de capacitación. En todos los
casos nos basamos en valores que encontramos en la muestra y nos
preguntamos si dichos valores son estadísticamente significativos.
Para abordar el problema planteado, en cada tipo de si-
tuación, primero presentaremos la metodología para calcu-
lar el coeficiente de correlación en la muestra y luego la metodo-
logía correspondiente a pruebas de hipótesis para el parámetro
poblacional.
El estudio de la relación entre dos variables cuantitativas se
realizará en el siguiente capítulo, juntamente con el tópico de
análisis regresión.
Prueba de hipótesis para el coeficiente de
correlación PHI
Cuando se desea estudiar la asociación entre dos variables de
naturaleza cualitativas dicotómicas, se recomienda obtener el co-
170
eficiente de correlación phi. Por ejemplo, se desea estudiar la aso-
ciación entre las variables estado civil y deserción de los estudian-
tes de maestría; entre el sexo de los estudiantes y su opinión respec-
to a la reelección del Decano.
Coeficiente de correlación phi en la muestra
Se definen:
X: variable dicotómica con valores 0 y 1,
Y: variable dicotómica con valores 0 y 1,
px
: proporción de puntuaciones 1 en la variable X,
qx
: proporción de puntuaciones 0 en la variable X,
py
: proporción de puntuaciones 1 en la variable Y,
qy
: proporción de puntuaciones 0 en la variable Y,
pxy
: proporción de puntuaciones 1 tanto en la variable X como
en la variable Y,
luego, el coeficiente de correlación phi, φ , se calcula de la
siguiente manera:
(4.1).
qpqp
ppp
yyxx
yxxy
−
=φ
Cuando los datos están tabulados en una tabla de contin-
gencia (tabla que muestra la ocurrencia conjunta de pares de pun-
tuaciones en dos variables), puede calcularse φ mediante la si-
Valores de la Valores de la Total
variable Y variable X
0 1
1 A B a + b
0 C D c + d
Total a + c b + d
guiente metodología:
.
))()()(( dcbadbca
adbc
++++
−
=φ
171
Este coeficiente tomará el valor 1 solamente cuando (a+b) y
(c+d) son iguales (consecuentemente a=d) en una tabla de contin-
gencia de dos por dos; es decir, cuando la proporción de "unos" es
la misma en X y en Y". entonces Y no puede predecirse perfectamen-
te a partir de X, por lo que algunos estadísticos consideran este
hecho como una desventaja del coeficiente phi.
Prueba de hipótesis para el coeficiente poblacional phi
Paso 1: La hipótesis nula indica que no existe asociación entre
las dos variables en la población y la hipótesis alternativa niega
esta afirmación. Denotemos con phiρ la asociación o el coeficien-
te de correlación phi en la población, entonces, las hipótesis son:
0:0 =phiH ρ 0:1 ≠phiH ρ
Paso 2: Bajo la hipótesis nula, para un tamaño de muestra ma-
yor que 20, la estadística de prueba φnz = tiene distribución
aproximadamente normal con media 0 y varianza 1. Con el va-
lor del coeficiente obtenido en la muestra y bajo la hipótesis nula
se calcula el valor de la estadística de prueba, cz .
Paso 3: Para α = 0.05, ( ) 975.0=< teóricozZP , en la tabla de la
distribución normal se encuentra el valor de 96.1=teóricoz . La re-
gión de rechazo es el intervalo (-∞, -1.96) U(1.96, ∞).
Paso 4: Si el valor de la estadística de prueba,, cae en el intervalo
indicado, se rechaza la hipótesis nula.
Ejemplo 4.1
Se ha observado que los estudiantes que inician sus estudios de
maestría presentan mucha dificultad en el primer semestre por
lo que algunos de ellos abandonan sus estudios. A continuación
172
se presentan los resultados de un seguimiento realizado a 15 estu-
diantes de la maestría en Política Social que se matricularon en el
semestre 2004-II y que abandonaron el curso de Herramientas de
Análisis Cuantitativo. Encontraremos el coeficiente de correla-
ción phi y haremos la prueba de hipótesis correspondiente.
X: estado civil 1: no casado 0: casado
Y: permanencia 0: abandona el curso
1: permanece en el curso hasta el final
Estudiante Estado civil( ix ) Permanencia( iy )
1 0 0
2 1 1
3 0 1
4 0 0
5 1 1
6 1 0
7 0 0
8 1 1
9 0 0
10 0 1
11 0 0
12 1 1
13 0 0
14 0 0
15 0 0
Solución
La información anterior se resume en el siguiente cuadro:
Valores de la Valores de la variable X
variable Y
0 (casado) 1 Total
1 (permanece) 2 4 6
0 (abandona) 8 1 9
Total 10 5 15
173
y se calculan las respectivas proporciones:
3333.0
15
5
==px
6667.0
15
10
==qx
4.0
15
6
==py
6.0
15
9
==qy
2667.0
15
4
==pxy
que se reemplazan en la fórmula:
( )( )( )( )
.578.0
6.04.06667.03333.0
)4.0)(3333.0(2667.0
=
−
=φ
El coeficiente de correlación phi en la muestra entre estado
civil y deserción vale 0.578. ¿Es estadísticamente significativo el
valor encontrado?. A continuación responderemos la pregunta
planteada usando la metodología de pruebas de hipótesis.
Paso 1: La hipótesis nula es que no existe asociación entre esta-
do civil y deserción en los estudios y la hipótesis alternativa nie-
ga ese enunciado. Si phiρ es la asociación entre estado civil y de-
serción, las hipótesis son:
0:0 =phiH ρ 0:1 ≠phiH ρ
Paso 2: El valor de la estadística de prueba es:
φnzc = = =)578.0(15 2.24
Paso 3: Para α = 0.05, ( ) 95.0=< teóricozZP , por lo que la región
de rechazo es el intervalo (- ∞, -1.96) ∪ (1.96, ∞).
Paso 4: Como el valor de cz = 2.24, cae en el intervalo indicado,
se rechaza la hipótesis nula. Luego, con nivel de significación 0.05,
existe evidencia para rechazar la hipótesis nula.
Cabe indicar, que por razones estrictamente académicas, en
el ejemplo se ha considerado un tamaño de muestra menor que
174
el exigido.
A continuación se hace la ilustración con el auxilio del SPSS y
la regla de decisión se basa en el concepto valuep _ que ya fue
explicado en el capítulo anterior.
Ejemplo 4.2
Se ha observado que los estudiantes que inician sus estudios de
Maestría presentan mucha dificultad en el primer semestre por
lo que algunos de ellos abandonan sus estudios. A continuación
se presentan los resultados de un seguimiento realizado a 41 es-
tudiantes de las maestrías en derecho y educación, que se matri-
cularon en el semestre 2004-II y que abandonaron el curso de
Herramientas de Análisis Cuantitativo. Encontraremos el coefi-
ciente de correlación phi y luego la correspondiente prueba de
hipótesis para el parámetro poblacional. Los datos se encuentran
en la base de DATOS4-phi.
Solución
A continuación se describe el procedimiento de pruebas de hipóte-
sis y en el paso 2 se incluyen comandos del SPSS que permiten en-
contrar el valor del coeficiente de correlación phi en la muestra.
Paso 1: En la hipótesis nula se plantea que no existe asociación
entre estado civil y deserción de los estudiantes y la hipótesis al-
ternativa niega tal enunciado. Si phiρ es la asociación entre esta-
do civil y deserción, las hipótesis son:
0:0 =phiH ρ 0:1 ≠phiH ρ
Paso 2: El valor de la estadística de prueba se obtiene usando los
siguientes comandos del SPSS:
Abrir la base de DATOS4-phi.
ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS/para ROW
escoger la variable DESERCIÓN y para COLUMNS la variable ES-
175
de donde el valor del coeficiente phi en la muestra es 119.0−=φ .
φnzc = = =− )119.0(41 -0.76.
Paso 3: Para α = 0.05 ( ) 975.0=< teóricozZP , por lo que la región
de rechazo es el intervalo (- ∞, -1.96) ó el intervalo (1.96, ∞).
Asimismo, con el criterio del valuep _ la decisión es la si-
guiente: Si valuep _ α< se rechaza la hipótesis nula.
Paso 4: Como el valor de cz = -0.76 no cae en el intervalo indica-
do, no se rechaza la hipótesis nula. Luego, con nivel de significa-
ción 0.05, no existe evidencia para rechazar la hipótesis nula de
que las variables deserción y estado civil no están asociadas.
Se llega a la misma decisión si se compara valuep _ con el
valor de α, pues valuep _ = 0.446 > 0.05, por lo que no existe
evidencia para rechazar la hipótesis nula.
TADOCIVIL/STATISTICS/seleccionarPHI/CONTINUE/OK.
El output del SPSS es el siguiente:
ESTADO CIVIL
Total
0 1
DESERCIÓN 0 9 7 16
1 17 8 25
Total 26 15 41
Symmetric Measures
Value Approx. Sig.
Nominal by Nominal Phi -.119 .446
N of Valid Cases 41
176
Prueba de hipótesis para el coeficiente de
correlación biseral-puntual
El coeficiente de correlación biseral-puntual se usa cuando una
variable es de naturaleza cualitativa dicotómica y la segunda es
interval o de razón. Por ejemplo, podemos estar interesados en
saber si existe alguna asociación entre sexo (Y) y altura de los
estudiantes (X).
Coeficiente de correlación biseral-puntual en la muestra
Y es una variable dicotómica (1 y 0),
X es una variable continua
1X es la media de las puntuaciones de la variable para los que
la variable tiene puntaje "1",
0X es la media de las puntuaciones de la variable para los que
la variable tiene puntaje "0",
Sx es la desviación estándar de los valores de la variable X,
n1: número de unos en la variable Y,
n0: número de ceros en la variable Y,
luego, el coeficiente de correlación biseral se calcula con:
)1(
1001
−
−
=
nn
nn
S
XXr
x
bP
(4.2)
Prueba de hipótesis para el coeficiente de correlación
Paso 1: En la hipótesis nula se postula que no existe asociación
entre las dos variables en la población y la hipótesis alternativa
niega en afirmación. Si denotamos con bpρ el coeficiente de co-
rrelación biseral-puntual en la población, entonces, las hipótesis
son:
177
0:0 =bpH ρ 0:1 ≠bpH ρ
Paso 2: Bajo la hipótesis nula, la estadística de prueba
2
1 2
−
−
=
n
r
r
t
bp
bp
tiene distribución t-Student con ( 2−n ) grados de libertad.
Con el valor del coeficiente de correlación obtenido en la
muestra y bajo la hipótesis nula se calcula el valor del estadístico
de prueba, ct .
Paso 3: Para α = 0.05 ( ) 975.0)2( =<− teóricon ttP , en la tabla t-Stu-
dent con 2−n grados de libertad se encuentra el valor de teóricot .
Luego, la región de rechazo es el intervalo ( teóricot , 8).
Paso 4: Si el valor de la estadística de prueba, ct , cae en el inter-
valo indicado, se rechaza la hipótesis nula.
Ejemplo 4.3
En la 2da y 3ra columnas del siguiente cuadro se presenta los
datos del sexo y estaturas de 15 adolescentes que realizan depor-
tes todos los fines de semana en el Parque Zonal Sinchi Roca.
Vamos a encontrar el coeficiente de correlación biseral-puntual
y luego haremos la prueba de hipótesis para el coeficiente de co-
rrelación poblacional.
Denotemos con:
Y: la variable sexo con niveles 0: femenino 1: masculino,
X: la variable estatura de los adolescentes (en pulgadas).
Se crean las variables ficticias:
X0: con las estaturas de los adolescentes del sexo femenino,
178
X1: con las estaturas de los adolescentes del sexo masculino. Es
decir:
Y se realizan los cálculos auxiliares, para luego obtener el co-
eficiente de correlación biseral-puntual:
75.66
8
6263666472657369
1
=
+++++++
=x
14.61
7
60636160625567
0
=
++++++
=x
749.478 x01
=== snn
61.0
)14
)8)(7(
749.4
14.6175.66
(15
=
−
=rbP
¿Es estadísticamente significativo el valor del coeficiente de
correlación biseral puntual encontrado en la muestra?. Para res-
ponder la pregunta planteada, procederemos a usar la metodo-
logía de pruebas de hipótesis.
Adolescente Sexo (Y) Estatura (X) X0 X1
1 1 69 - 69
2 0 67 67 -
3 1 73 - 73
4 1 65 - 65
5 0 55 55 -
6 1 72 - 72
7 0 62 62 -
8 0 60 60 -
9 1 64 - 64
10 1 66 - 66
11 1 63 - 63
12 0 61 61 -
13 1 62 - 62
14 0 63 63 -
15 0 60 60 -
179
Paso 1: Se postula como hipótesis nula que no existe asociación
entre sexo y estatura en la población y la hipótesis alternativa
niega esa afirmación. Si se denota con bpρ el coeficiente de correla-
ción biseral-puntual en la población, entonces, las hipótesis son:
0:0 =bpH ρ 0:1 ≠bpH ρ
Paso 2: El valor de la estadística de prueba es:
2
1 2
−
−
=
n
r
r
t
bp
bp
c = 77.2
13
)61.0(1
61.0
2
=
−
Paso 3: Para α = 0.05 ( ) 975.0)13( =< teóricottP , en la tabla t-Stu-
dent se encuentra el valor de 16.2=teóricot . Luego, la región de
rechazo es el intervalo (2.16, ∞).
Paso 4: Como el valor de ct = 2.77 cae en el intervalo indicado,
se rechaza la hipótesis nula.
Ejemplo 4.4
Si se quiere resolver el ejemplo anterior usando comandos del
SPSS no se puede encontrar directamente el coeficiente, pues el
SPSS sólo nos proporciona los cálculos auxiliares que luego se
reemplaza en la fórmula (4.2) y se sigue la trayectoria descrita
para realizar la prueba de hipótesis. En el SPSS se siguen los si-
guientes pasos:
Crear (o abrir) el archivo, en este caso vamos a ilustrar con la
base de DATOS9-puntual, con las dos variables X e Y.
Crear la variable ficticia X0 donde se guarda las estaturas del sexo
femenino. Se usa el comando recode.
Crear la variable ficticia X1 donde se guarda las estaturas del sexo
masculino. Se usa el comando recode.
180
El output del SPSS es el siguiente.
Valores en negrita se reemplazan en la fórmula (4.2) y se en-
cuentra que el valor del coeficiente es 0.61, como ya se vio en el
ejemplo 4.3.
Prueba de hipótesis para el coeficiente de
correlación tetracorico
Este tipo de coeficiente es recomendable en situaciones donde
dos variables cuantitativas de naturaleza subyacente normal, han
sido dicotomizadas. Así por ejemplo, el autor de una pregunta
que mide la capacidad de razonamiento matemático de los estu-
diantes de quinto año de secundaria considera que es un rasgo
normalmente distribuido; pero el ítem sólo permitirá identificar
al grupo que responda correctamente, al que se le asigna pun-
tuación 1 y al grupo que responda incorrectamente, al que se le
asigna un 0.
Por otro lado, suponga que las estaturas de 1000 estudiantes
se distribuyen normalmente, pero el entrenador asigna puntaje 1
a los que tienen estatura de 1.50 mts o superior y le asigna punta-
je 0 a los que tienen estatura inferior a 1.50 mts.
Vamos a estudiar la asociación para situaciones similares
Calcular la media aritmética de X0, X1 y calcular la desviación es-
tándar de X.
Para detalles remitirse al libro: ESTADÍSTICA DESCRIPTIVA
(Gómez y colaboradores, 2005).
N Mean Std. Deviation
estatura de los
estudiantes 15 64.13 4.749
Xo 7 61.1429 3.62531
x1 8 66.7500 4.13176
181
como la descrita.
Coeficiente de correlación en la muestra
Sean:
X: variable con distribución normal que ha sido dicotomizada
X = 1 estatura ≥ 1.50 mts
0 estatuta < 1.50 mts
Y: variable con distribución normal que ha sido dicotomizada
Y = 1 respuesta correcta
0 respuesta incorrecta,
para las que se encuentra la siguiente tabla bidimensional:
Se calcula el cociente
da
cb
y luego ubicar el valor en la Tabla
E del Apéndice, donde se encuentran funciones del cociente
obtenido:
• Si la proporción
da
cb
es mayor que 1, de la Tabla E se obtiene
directamente el valor del coeficiente tetracórico, en la co-
lumna rt , (4.3)
• Si la proporción
da
cb
es menor que 1, en la Tabla E se lee la
columna (ad)/(bc) y el valor rt del coeficiente tetracórico
será negativo.
Prueba de hipótesis para el coeficiente
ITEM Y ITEM X
0 1
1 a b
0 c d
182
Paso 1: La hipótesis nula indica que no existe asociación entre las
dos variables en la población y la hipótesis alternativa niega esa
afirmación. Si denotemos con trρ el coeficiente de correlación tetra-
córico en la población, entonces, las hipótesis son:
0:0 =trH ρ 0:1 ≠trH ρ
Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo-
res que 20, la distribución del coeficiente rt es aproximadamen-
te normal con medio cero y desviación estándar
yx
yyxx
uun
qpqp 1 ,
donde:
xp es la proporción de puntuaciones "1" en la variable X dicoto-
mizada,
yp es la proporción de puntuaciones "0" en la variable dicoto-
mizada Y,
xu es la ordenada de la curva normal unitaria correspondiente
a la puntuación z en el cual se halla la proporción xp del
área (ver la tabla A) y
yu es la ordenada de la curva normal unitaria correspondiente
a la puntuación z en el cual se halla la proporción yp del
área (ver la tabla A). Así, para un tamaño de muestra mode-
rado o muy grande:
yx
yyxx
t
uun
qpqp
r
z
1
= puede compararse con la distribución
normal unitaria para contrastar que el coeficiente tρ de la po-
blación vale cero.
Con los resultados obtenidos en la muestra se calcula el va-
lor de la estadística de prueba: cz .
Paso 3: Para α = 0.05 ( ) 975.0)2( =<− teóricon ttP , en la tabla t-Stu-
dent con )2( −n grados de libertad se encuentra el valor de teóricot .
183
córico, primero se obtiene la tabla de doble entrada.
En la tabla anterior se identifica a=4, b=19, c=21 y d=6 y se
encuentra el valor de
da
cb
= 16.625. Con dicho valor se va a la Tabla
E.
El valor de
da
cb
es mayor que 1, y al usar la Tabla E para la
proporción anterior, el valor aproximado del coeficiente de co-
rrelación tetracórico es 0.81.
.81.0625.16 =====>= rt
ad
bc
¿Es estadísticamente significativo el valor encontrado?.
Responderemos la pregunta con la metodología de pruebas
Luego, la región de rechazo es el intervalo ( teóricot , ∞).
Paso 4: Si el valor del estadístico de prueba, ct , cae en el intervalo
indicado se rechaza la hipótesis nula.
Ejemplo 4.5
A un grupo de 50 estudiantes se les evalúa con dos ítems de apti-
tud matemática y se asigna 1 a la respuesta correcta y 0 a la res-
puesta incorrecta. Si se denota con X la primera pregunta y con Y
la segunda pregunta, los resultados se presentan en la siguiente
tabla bidimensional.
Para encontrar el valor del coeficiente de correlación tetra-
ITEM2(Y) ITEM1(X) Total
0 1
1 4 19 23
0 21 6 27
Total 25 25 50
184
de hipótesis.
Paso 1: Se postula en la hipótesis nula que no existe asociación
entre las respuestas a las preguntas X e Y. La hipótesis alternati-
va niega dicha afirmación.
0:0 =trH ρ 0:1 ≠trH ρ
Paso 2: Con los datos de la muestra procedemos a realizar los
cálculos de:
xp 5.0
50
25
== yp 46.0
50
23
==
En la Tabla A del anexo se observa que la ordenada de la
curva normal unitaria que corresponde a xp = 0.5 de área, es
xu =0.3989 y la ordenada de la curva correspondiente al punto
en el cual se obtiene yp = 0,46, es xu = 0,3970.
Finalmente obtenemos el valor de la estadística de prueba:
)397.0)(3989.0(
1
50
)54.0)(46.0)(5.0)(5.0(
812.0
=cz =3.64
Paso 3: Para α = 0.05 ( ) 975.0=< teóricozzP , en la tabla normal
se encuentra el valor de teóricoz = 1.96.
Luego, la región de rechazo es el intervalo (1.96, ∞).
Paso 4: Como el valor de cz = 3.64 cae en el intervalo indicado,
se rechaza la hipótesis nula y concluimos que el coeficiente de
correlación tetracórico de la población no es nulo, cuando el ni-
vel de significación es 0.05.
Ejemplo 4.6
Suponga que para una determinada tabla de contingencia 2x2,
185
a=62, b=20, c=10, d=24 y se desea obtener el valor del coeficiente
de correlación tetracórico.
Como
da
cb
= 0.1344, para encontrar el valor del coeficiente
se consulta la Tabla A, bajo los valores de la columna 44.7=
bc
ad
.
Se encuentra que el valor del coeficiente de correlación tetracó-
rico es negativo, rt = -0.67.
Debe prevenirse al lector sobre la posibilidad de cometer se-
rios errores. No debe emplearse el método si
n
db
n
ba ++
o
se apartan considerablemente de 0.5. Si
n
db
n
ba ++
o son ma-
yores que 0.7 o menores que 0.3, tampoco debería utilizarse la
tabla A, y en su lugar, debería emplearse las tablas de Jenkins
(1955).
Cuando las distribuciones subyacentes son normales, sola-
mente esta propiedad confiere superioridad al coeficiente rt so-
bre el coeficiente PHI como medida de asociación.
Ejemplo 4.7
Si deseamos encontrar el coeficiente de correlación tatracórico
para las variables de la base de DATOS6-tetracórico, se observa
que son 99 estudiantes, donde las notas del curso de estadística y
del curso de metodología de investigación han sido dicotomiza-
das, pues los profesores calificaron con aprobado o desaproba-
do. Obtendremos el coeficiente de correlación tetracórico.
Y: notas en el curso de estadística- dicotimizada,
0 desaprobó con notas inferiores a 11
1 aprobó con notas de 11 o más
X: notas en el curso de metodología de investigación-dico-
tomizada,
0 desaprobó con notas inferiores a 11
186
1 aprobó con notas de 11 o más.
Solución
Activar el SPSS. Abrir la base de DATOS6-tetracórico y ejecutar
los siguientes comandos:
ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS/para
ROW escoger NOTAS DE ESTADÍSTICA y para COLUMNS es-
coger NOTAS DE METODOLOGÍA/ en FORMAT activar DES-
CENDENT/CONTINUE/OK.
El outptup del SPSS muestra el siguiente cuadro:
notas de estadística * notas de metodología de la investi-
gación Crosstabulation
a partir del que se calcula el valor de
da
cb
= 6.18. En la Tabla E,
al valor 6.18 de
da
cb
le corresponde el valor rt = 0.62 para el coefi-
ciente tetracórico.
Ahora se plantea la siguiente pregunta: ¿Es significativamen-
Count
notas de metodología
de la investigación
Total
desaprobó Aprobó
notas de aprobó a=11 b=36 47
estadística desaprobó c=34 d=18 52
Total 45 54 99
187
te diferente de cero el coeficiente de correlación tetracórico en la
población?. Se deja como ejercicio para el estudiante.
Prueba de hipótesis para el coeficiente de
correlación biseral
Se usa en situaciones donde se tiene dos variables con distri-
buciones normales subyacentes, una de las cuales ha sido di-
cotomizada.
Una de las situaciones donde se puede obtener el coeficiente
de correlación biseral es la siguiente. Un profesor desea relacio-
nar el tiempo que los estudiantes emplean en resolver un proble-
ma (X) y la habilidad que tiene para resolver el problema (Y).
El profesor anota el tiempo (X) que cada estudiante demora
en resolver el problema, pero la variable Y no la calificó con una
nota en la escala vigecimal o cualquier otra, sólo anotó que apro-
bó (1) si llegó a la solución correcta y anotó no aprobó (0) si no
llegó a la solución correcta.
Coeficiente de correlación biseral en la muestra
Sean las variables continuas Y dicotomizada (1 y 0) y X también
dicotomizada (0 y 1).
Calcular:
0X : la media de las puntuaciones de la variable X para los que
en Y tienen puntaje "0",
1X : la media de las puntuaciones de la variable X para los que
en Y tienen puntaje "1",
XS : desviación estándar de la variable X,
n1: número de unos en Y,
n0: número de ceros en Y.
Usar la TABLA A, para obtener:
u : ordenada (es decir la altura) de la unidad de la distribución
188
normal, en el punto a partir del cual se obtiene el porcentaje
100(
n
n1
) del área bajo la curva normal, donde nnn =+ 01 .
Luego el coeficiente de correlación biseral muestral es igual a:
.
2
0101








−
−
=
nnu n
nn
S
XXr
x
b (4.4)
Este coeficiente puede ser menor que -1 y mayor que +1.
Estos valores extremos indican que no era cierto que las
puntuaciones X, categorizadas, tienen distribución normal sub-
yacente o también puede indicar fluctuaciones de muestreo cuan-
do n es pequeño y produce una distribución de X marcadamente
platicúrtica.
Prueba de hipótesis para el coeficiente
Paso 1: La hipótesis nula indica que no existe asociación entre
las dos variables en la población y la hipótesis alternativa niega
dicha afirmación. Si denotamos con bρ el coeficiente de correla-
ción biseral en la población, entonces, las hipótesis son:
0:0 =bH ρ 0:1 ≠bH ρ
Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo-
res que 20, la distribución del coeficiente rb es aproximadamen-
te normal con medio cero y desviación estándar
nun
nn 101 . La
estadística:
nun
nn
r
z b
101
= puede compararse con la distribución normal uni-
taria para contrastar que el coeficiente bρ poblacional vale cero.
189
Con los resultados obtenidos en la muestra se calcula el valor
de la estadística de prueba: cz .
Paso 3: Para α = 0.05 ( ) 975.0} =< teóricozzP , en la tabla normal se
encuentra el valor de teóricoz .
Luego, la región de rechazo es el intervalo ( teóricoz , ∞).
Paso 4: Si el valor de la estadística de prueba, cz , cae en el inter-
valo indicado, se rechaza la hipótesis nula.
Ejemplo 4.8
Los datos que se presentan en el siguiente cuadro correspondien-
tes al tiempo que los alumnos invierten en resolver una pregun-
Alumno Tiempo (X) Nota en la prueba (Y)
1 16 1
2 12 0
3 11 0
4 7 1
5 15 1
6 14 1
7 10 0
8 11 0
9 15 1
10 9 0
11 13 1
12 7 0
13 13 1
14 11 1
15 10 0
16 11 1
17 10 1
18 11 1
ta de matemáticas (X) y la habilidad que tienen para llegar a la
solución (Y).
Sean:
X: tiempo que demoró en resolver la pregunta, en minutos,
Y = 1 solución correcta Y= 0 solución incorrecta.
190
Se crean las variables ficticias X0 y X1 con las notas de los
que resolvieron de manera incorrecta y correcta respectivamen-
te. Luego se calculan las medias aritméticas y la desviación están-
dar del tiempo que demoran en resolver la pregunta, sin discrimi-
nar si llegaron o no a la solución correcta. Así:
n1 = 11 n0 = 7 n= 18 x1 = 12.36 x0 = 10
Para encontrar el valor de la ordenada de la distribución nor-
mal, se usa la Tabla A del anexo, para lo que se plantea la si-
guiente relación:
3836.061.0
18
11
)( =====>==< uzZP , y luego se encuentra el
coeficiente
.60.0
18)18(3836.0
)7(11
55.2
0.1036.12
18
2
=








−
−
=rb
¿Es significativamente diferente de cero el coeficiente en-
contrado?. Responderemos con la metodología de pruebas de
hipótesis.
Paso 1: Enla hipótesis se postula que el coeficiente de correla-
ción biseral en la población,, vale cero y la hipótesis alternativa
niega ese enunciado:
0:0 =bH ρ 0:1 ≠bH ρ
Paso 2: Con la información obtenida en la muestra:
111=n , 70=n , 3836.0=u , 60.0=br ,
nun
nn 101
=
)18)(3836.0(
1
18
)7(11
= 0.2995, el valor que toma la
estadística de prueba es:
191
nun
nn
r
z b
c
101
= =
)18)(3836.0(
1
18
)7)(11(
6.0
2995.0
6.0
= = 2.0.
Paso 3: Para α = 0.05 ( ) 975.0} =< teóricozzP , en la tabla normal se
encuentra el valor de teóricoz . Luego, la región de rechazo es el inter-
valo (1.96, ∞).
Paso 4: Como cz = 2.0 cae en el intervalo indicado, la decisión es
rechazar la hipótesis nula con nivel de significación 0.05.
Ejemplo 4.9
Los datos que se presentan en la base de DATOS7-biseral corres-
ponden a una muestra de 99 alumnos de quinto año de secunda-
ria, donde el profesor desea saber si están asociadas las varia-
bles: el tiempo que un estudiante demora en resolver una pre-
gunta y la habilidad que tiene para resolver el problema. Se de-
nota con:
X: el tiempo en minutos que los alumnos gastan en resolver una
pregunta de matemáticas,
Y: la habilidad del alumno para llegar a la solución. A la solu-
ción correcta el profesor le asignó 1 y a la solución incorrec-
ta le asignó = 0.
Vamos a estudiar la asociación entre dichas variables.
Solución
Previamente, en la base de datos se crea: la variable X0 donde se
guarda los tiempos que demoran en resolver la pregunta, los
alumnos que no llegaron a la solución correcta y la variable X1
donde se guarda los tiempos que demoran en resolver la pregun-
ta, los alumnos que llegaron a la solución correcta.
Con el auxilio del SPSS los cálculos auxiliares para encon-
192
ger las variables TIEMPO PARA RESOLVER, X0 y X1/OPTIONS/
activar MEAN Y STD DEVIATION/ CONTINUE/ OK.
La salidad del SPSS es la siguiente:
donde:
n1 = 47 n0 = 52 x1 = 64.13 x0 = 63.01
4747.0
99
471
==
n
n . En la TABLA A se encuentra el valor de u , por-
que: 4747.0
99
47
)( ==< zZP , entonces 9823.0=u .
Luego, el valor del coeficiente de correlación biseral en la
muestra es:








−
−
=
nnu n
nn
s
xxr
x
b 2
0101








−
−
=
9999)99(3982.0
)52(47
168.10
01.6313.64
2 = 0.07.
Por razones estrictamente académicas continuamos con la
prueba de hipótesis, a pesar que sabemos que el valor de la esta-
dística de prueba va a ser muy pequeño.
Paso 1: El coeficiente de correlación biseral poblacional entre el
trar el valor del coeficiente de correlación biseral muestral. Luego
haremos la prueba de hipótesis correspondiente.
Abrir la base de DATOS7-biseral y ejecultar los comandos:
ANALYZE/DESCRIPTIVE STATISTICS/ DESCRIPTIVES/ esco-
tiempo para
resolver xo X1
N Valid 99 52 47
Mean 63.54 63.0113 64.1310
Std. Deviation 10.168 10.58776 9.76176
193
tiempo empleado y la habilidad para resolver el problema es cero,
frente a la hipótesis que niega esa afirmación: .
0:0 =bH ρ 0:1 ≠bH ρ
Paso 2: Con la información obtenida en la muestra obtenemos el
valor de la estadística de prueba, es decir, para:
n1 = 47 n0 = 52 x1 = 64.13 x0 = 63.01 3982.0=u 07.0=br
nun
nn 101
=
)99)(3982.0(
1
99
)52(47
= 0.126, el valor que toma
la estadística de prueba es:
nun
nn
r
z b
c
101
=
126.0
07.0
= = 0.55.
Paso 3: Para α = 0.05 ( ) 975.0} =< teóricozzP , el valor de teóricoz es 1.96.
Luego, la región de rechazo es el intervalo (1.96, ∞).
Paso 4: Como cz = 0.55 no cae en el intervalo indicado, la deci-
sión es no rechazar la hipótesis nula con nivel de significación
0.05.
Prueba de hipóstesis para el coeficiente de
correlación de spearman
El coeficiente de correlación producto-momento calculado a par-
tir de dos series de n posiciones o rangos consecutivos indepen-
dientes, que van de 1 hasta n se conoce con el nombre de coefi-
ciente de correlación por rangos ordenados de Spearman. En este
caso ambas variables X e Y medidas en la escala ordinales.
Si los datos directos son cuantitativos, estos pueden conver-
tirse en rangos o posiciones.
Por ejemplo, la "posición u orden de mérito en el salón de
clase" es un ejemplo de conversión de puntuaciones ordenadas
194
en rangos. Es decir, en un grupo de 50 estudiantes se le asigna la
posición 1 al que alcanzó el más alto puntaje, posición 2 al si-
guiente,..., y posición 50 al puntaje mas bajo. Los juicios sobre la
excelencia de una declaración también constituyen un ejemplo
de agrupamiento de posiciones o rangos según los datos origina-
les. 10 estudiantes recitan una poesía y un juez asigna un "1" a la
mejor declamación, un "2" a la segunda,..., y 10 a la peor decla-
mación.
Independientemente de cómo se originaron las puntuacio-
nes 1, 2, 3,.............,( 1−n ), n; pueden correlacionarse dos series de
rangos para los mismos individuos.
Coeficiente de correlación de SPEARMAN en la muestra
Sean:
xx n
,....,1 : rangos asignados a la variable X,
yy n
,....,
1
: rangos asignados a la variable Y
n: tamaño de muestra o número de indivíduos
yx ii
− : diferencia entre el rango asignado a la variable X y el
rango asignado a la variable Y de la i-ésima persona.
Si existen dos o más valores iguales (valores empatados) los
rangos de cada uno de éstos son iguales al promedio de los ran-
gos que les correspondería en el caso de que fueran diferentes.
Así por ejemplo si las edades de los participantes en un progra-
ma de capacitación docente son las siguientes: 40 41 42 43 43 44
46, los rangos asignados son: 1, 2, 3, 4.5, 4.5, 6 y 7.
Luego, el coeficiente de correlación de Spearman se define
de la siguiente manera:
( )
( )1
6
1 2
2
−
−=
∑ −
n
yx
r n
ii
S (4.5)
11 ≤≤− rS
195
su valor no puede ser menor que -1 ni mayor que 1, alcanza
su máximo valor (+1) cuando los individuos ocupan los mismos
rangos o posiciones en X e Y.
Este coeficiente es muy útil cuando los datos originales son
rangos o posiciones y cuando se emiten juicios para clasificar indi-
viduos o cosas, pero se recomienda que el tamaño de muestra sea
superior a 10.
Pruebas de hipótesis para el coeficiente
Paso 1: En la hipótesis se postula que no existe asociación entre
las dos variables en la población y la hipótesis alternativa niega
esa afirmación. Denotemos con sρ la asociación o el coeficiente
de correlación de Spearman en la población, entonces, las hipó-
tesis son:
0:0 =sH ρ 0:0 ≠sH ρ
Paso 2: Bajo la hipótesis nula, la estadística de prueba
2
1 2
−
−
=
n
r
r
t
s
s
tiene distribución t-Student con (n-2) grados de libertad.
Con el valor obtenido en la muestra y bajo la hipótesis nula
se calcula el valor del estadístico de prueba, ct .
Paso 3: Para α = 0.05, ( ) 025.0)2( =>− teóricon ttP o ( ) 975.0)2( =<− teóricon ttP ,
en la tabla B-t-Student se encuentra el valor de ct .
Luego, la región de rechazo es el intervalo ( teóricot , ∞).
Paso 4: Si el valor del estadístico de prueba, ct , cae en el inter-
valo indicado, se rechaza la hipótesis nula.
Ejemplo 4.10
196
Los siguientes datos corresponden a una muestra aleatoria de 12
estudiantes para quienes un juez asignó posiciones o rangos en
base a la hostilidad que manifiestan los estudiantes a su profesor
de metodología de la investigación y a sus compañeros de clase,
es decir, dos series de rangos. Se desea encontrar el coeficiente de
correlación de Spearman.
Sea X: la hostilidad manifestada por el estudiante a su pro-
fesor de matemáticas donde:
1: es el puntaje asignado al que manifiesta mayor hostilidad al
profesor,
12: es el puntaje asignado al que manifiesta menor hostilidad al
profesor,
Y: la hostilidad manifestada por el estudiante hacia sus otros
compañeros donde:
1: es el puntaje asignado al que manifiesta mayor hostilidad
hacia sus compañeros
12: es el puntaje asignado al que manifiesta menor hostilidad
hacia sus compañeros.
Estudiante Hostilidad Hostilidad a yx ii − ( )yx ii−
2
al profesor los compañeros
xi yi
1 2 6 - 4 16
2 8 5 3 9
3 12 10 2 4
4 3 7 - 4 16
5 1 3 - 2 4
6 6 4 2 4
7 7 9 - 2 4
8 10 8 2 4
9 4 1 2 4
10 9 11 2 4
11 11 12 - 1 1
12 5 2 3 9
TOTAL 84
.84)(
2
∑ − =yx ii
197
En el siguiente cuadro se presentan los datos y las corres-
pondientes cuentas,
Luego, el valor del coeficiente de correlación de Spearman es
706.0
143
42
1
)1144(12
)84(6
1 =−=
−
−=rS
¿La relación encontrada entre la hostilidad manifiesta a los
compañeros y la hostilidad manifiesta al profesor, es estadística-
mente significativa?. Responderemos con la metodología de prue-
bas de hipótesis.
Paso 1: En la hipótesis nula se postula que no existe asociación
entre las variables hostilidad a los compañeros y hostilidad al
profesor y la hipótesis alternativa esa dicha afirmación, es decir:
0:0 =sH ρ 0:0 ≠sH ρ
Paso 2: El valor de la estadística de prueba es:
2
1 2
−
−
=
n
r
r
t
s
s
c =
212
706.01
706.0
2
−
−
= 3.15.
Paso 3: Para α = 0.05 ( ) 975.0)2( =<− teóricon ttP , en la tabla t-Stu-
dent se encuentra el valor de teóricot = 2.228. Luego, la región de
rechazo es el intervalo (2.228, ∞).
Paso 4: Como el valor de ct = 3.15, cae en el intervalo indicado,
se rechaza la hipótesis nula. Al nivel de significación 0.05 las va-
riables hostilidad al profesor y hostilidad a los compañeros no
están asociadas.
198
Ejemplo 4.11
En la entrevista personal para ingresar a la carrera docente en
una universidad, participaron 40 postulantes quienes fueron ca-
lificados por dos miembros del jurado. En la base de DATOS7-jura-
do se dispone de la siguiente información:
P: postulantes
X1: puntaje asignado a cada postulante por el miembro 1 del ju-
rado,
X2: puntaje asignado a cada postulante por el miembro 2 del ju-
rado,
X: rango que corresponde a las calificaciones del jurado 1,
Y: rango que corresponde a las calificaciones del jurado 2,
y se desea encontrar el coeficiente de correlación de Spearman.
Solución
Paso1: En la hipótesis nula se postula que los puntajes asigna-
dos por los dos jurados no están relacionados y la hipótesis alter-
nativa niega esa afirmación.
0:0 =sH ρ 0:0 ≠sH ρ
Paso 2: Obtendremos el valor de la estadística de prueba me-
diante el soporte del SPSS.
Abrir la base de DATOS7-jurado, donde la información está
preparada de acuerdo a las exigencias de la fórmula del coefi-
ciente de correlación de Spearman y ejecutar los siguientes co-
mandos:
Rango a las Rango a las
notas del notas del
jurado1 jurado2
Spearman's rho Rango a las Correlation Coefficient 1.000 .332
notas del Sig. (2-tailed)
jurado 1 .036
Rango a las Correlation Coefficient .332 1.000
notas del Sig. (2-tailed) .036
jurado 2
199
ANALYZE/CORRELATE/BIVARIATE/ seleccionar las varia-
bles X e Y/ activar SPEARMAN/ OK.
El output del SPSS nos muestra lo siguiente:
Con el valor del coeficiente de correlación de Spearman de la
muestra 332.0=sr , obtenemos el valor de la estadística de prueba:
2
1 2
−
−
=
n
r
r
t
s
s
c =
240
332.01
332.0
2
−
−
= 2.17
Paso 3: En la tabla t-Student para el nivel de significación 0.05 y
38 grados de libertad se encuentra el valor teórico: 02.2=teóricot .
Paso 4: Como el valor de 217=ct es mayor que el valor teórico,
entonces se rechaza la hipótesis nula. Obsérvese la importancia
del tamaño de muestra.
También si usamos el criterio del valuep _ se llega a la mis-
ma decisión, pues sabemos que si α<valuep _ se rechaza la hi-
pótesis nula. En el presente caso el valor de valuep _ = 0.036 es
menor que α = 0.05.
Pruebas de hipótesis para tablas de contingencia
Tablas bidimensionales para dos variables cualitativas
En una muestra de n individuos en quienes se han observado las
variables X e Y, se denota con A1, A2, …, Ak los k niveles o
modalidades de X y con B1, B2, …, Br los r niveles o modalidades
de Y. La distribución de los individuos considerando las dos
características, se puede presentar en una tabla de doble en-
trada o en una tabla bidimensional como la siguiente, donde
los niveles de una de las variables ocupa la posición de las filas y
los niveles de la otra variable ocupa la posición de las columnas
200
y los valores dentro de la tabla o celdas son las frecuencias absolu-
tas conjuntas.
donde:
f ij
, es el número de elementos con las modalidades Ai y Bj, de-
nominadas frecuencias absolutas conjuntas,
f i.
, es el número de elementos con la modalidad Ai denomina-
da i-ésima frecuencia marginal,
f j.
, es el número de elementos con la modalidad Bj denominada
j-ésima frecuencia marginal,
Eligiendo X como variable fila e Y como variable columna,
se cumplen las siguientes propiedades:
ff j
k
i
ij .
1
=∑=
, ff i
r
j
ij .
1
=∑=
.
1
.
1
.
11
n
r
j
j
k
i
i
r
j
ij
k
i
fff === ∑∑∑∑ ====
Al dividir las frecuencias absolutas conjuntas entre el nú-
mero total de observaciones se obtienen las frecuencias relativas
conjuntas hij correspondiente a las modalidades Ai y Bj, y las co-
rrespondientes frecuencias relativas marginales; hi.
y h j. , las que
Tabla de frecuencias conjuntas absolutas
X Y
B1 B2 ……. Bj …… Br Total
A1 f11 f12 …. f1j …. f1r f1.
A2 f21 f22 …. f2j …. f2r f2.
….. …. ….. …. …. …. … …
Ai fi1 fi2 …. fij …. fir fi.
…. …. …. …. …. …. …. …
Ak fk1 fk2 …. fki …. fkr fk.
Total f.1 f.2 ……. f.j … f.r n
201
se presentan en la siguiente tabla de frecuencias relativas bidimen-
sionales.
donde:
n
f
h
ij
ij
=
Asimismo, al dividir las frecuencias absolutas marginales
entre el número total de observaciones se obtienen las frecuen-
cias relativas marginales:
n
f
h
n
f
h
j
j
i
i
.
.
.
.
== .
Ejemplo 4.12
Se toma una pequeña muestra de docentes que participan en un
programa de capacitación, para quienes registramos los valores
de las variables sexo y estado civil. Se tabulará la información en
Tabla de frecuencias relativas conjuntas
X Y
B1 B2 ……. Bj …… Br Total
A1 h11 h12 …. h1j …. h1r h1.
A2 h21 h22 …. h2j …. h2r h2.
….. …. ….. …. …. …. … …
Ai hi1 hi2 …. hij …. hir hi.
…. …. …. …. …. …. …. …
Ak hk1 hk2 …. hki …. hkr hk.
Total h.1 h.2 ……. h.j … h.r n
202
una tabla de doble entrada donde la variable sexo está representa-
da en las filas y el estado civil en las columnas.
Solución
Sólo con fines didácticos no hacemos uso del SPSS y contamos el
número de veces que se repite la categoría Ai de la variable sexo
y el número de veces que se repite la categoría Bj de la variable
estado civil. Así, para A1= femenino, A2 = masculino, B1= soltero,
B2 = casado se tiene: f22 = 2, es decir, son 2 los estudiantes del sexo
masculino y casados; f12 = 6, es decir, son 6 estudiantes del sexo
Sexo Civil Sexo Civil Sexo civil sexo civil
Femenino Soltero Femenino Soltero Femenino soltero femenino soltero
Femenino soltero Masculino Soltero Masculino casado masculino casado
Masculino soltero Masculino soltero femenino casado femenino casado
Femenino casado Femenino casado Masculino soltero masculino soltero
Masculino soltero Femenino soltero femenino casado masculino soltero
Masculino soltero Femenino soltero femenino casado masculino soltero
Cuadro Nº 4.1 Distribución de los docentes según sexo y estado civil,
participantes en el Programa de Capacitación de la FCM-UNMSM
Lima - 2004
SEXO ESTADO CIVIL Total
Soltero Casado
Femenino 7 6 13
Masculino 9 2 11
Total 16 8 24
femenino y casados. En el siguiente cuadro se presentan las fre-
cuencias conjuntas.
203
Son 7 docentes solteras y 6 casadas del sexo femenino. Los
estudiantes del sexo masculino 9 son solteros y 2 casados.
En tablas de doble entrada para dos variables cualitativas se
calcula el coeficiente de contingencia que mide la relación entre las
dos variables. Como se verá, éste índice está en función de la esta-
dística ji-cuadrado, χ
2
, ampliamente usada por los investigadores
de las ciencias sociales, pero que su interpretación a veces reviste
dificultades porque no existe un valor de comparación y puede
tomar cualquier valor positivo. El valor del coeficiente de contin-
gencia oscila entre 0 y 1.
Coeficiente de contingencia en la muestra
Para la presentación general de una tabla de contingencia para
dos variables cualitativas se tiene:
n: tamaño de la muestra,
f ij
: frecuencia absoluta conjunta que corresponde al i-ésimo nivel
de la variable fila y al j-ésimo nivel de la variable columna,
eij : la frecuencia esperada conjunta que corresponde al i-ésimo
nivel de la variable fila y al j-ésimo nivel de la variable co-
lumna, que se calcula con la siguiente fórmula:
n
ff
e
ji
ij
..
= y el valor de la estadística ji-cuadrado es:
( )∑∑
−
= =
=
r
j
k
i ije
ef ijij
1 1
2
2
χ .
Finalmente se define el coeficiente de contingencia como:
204
n
C
+
=
χ
χ
2
2
cuyos valores oscilan entre 0 y 1.
Pruebas de hipótesis para el parámetro poblacional
Paso 1: Se plantea independencia entre la variable fila y la va-
riable columna de la tabla de contingencia. En el ejemplo, el sexo
y el estado civil de los participantes son independientes. Simbo-
lizaremos con:
0H : Las variables fila y columna son independientes.
1H : Las variables fila y columna no son independientes.
Paso 2: Bajo la hipótesis nula, el estadístico de prueba
( )∑∑
−
= =
=
r
j
k
i ije
ef ijij
1 1
2
2
χ tiene distribución chi-cuadrado con (k-1)
(r-1) grados de libertad, donde k: es el número de niveles de la
variable fila y r es el número de niveles de la variable columna.
Con los datos de la muestra y bajo la hipótesis nula se calcu-
la el valor de la estadística de prueba,
2
cχ .
Paso 3: Con un nivel de significación α, se compara el valor cal-
culado en el paso 2, con el percentil ( ) %1001 α− de la distribu-
ción chi-cuadrado con (k-1)(r-1) grados de libertad, percentil que
se denota por .2
)1)(1()1( −−− rkxα En la Tabla C del Apéndice se expo-
nen algunos percentiles de las distribuciones chi-cuadrado.
Paso 4: Si el valor de la estadística de prueba, es mayor que
2
)1)(1()1( −−− rkxα , se rechaza la hipótesis nula.
205
Ejemplo 4.13
Para la siguiente tabla de contingencia vamos a encontrar el co-
eficiente de contingencia entre el sexo y escuela académico pro-
fesional de los estudiantes.
Solución
a) Se identifican las frecuencias observadas: f11 = 21 f12 = 33 f13
= 47 f21 = 37 f22 = 35 f23 = 27. f 1. = 101, f 2. = 99, f .1 = 58, f .2 =
68, f.3 = 74.
b) Se encuentran las frecuencias esperadas con las siguientes
fórmulas:
29.29
200
)58(1011..1
11
===
n
e
ff
34.34
200
)68(1012..1
12
===
n
e
ff
37.37
200
)74(1013..1
13
===
n
e
ff
Cuadro 4.2 Distribución de los estudiantes de la Facultad de
Ciencias Matemáticas según sexo y escuelas profesionales.
Censo universitario- UNMSM. Lima - 2002
ESCUELAS ACADÉMICO
PROFESIONALES
SEXO Total
Matemáticas Estadística Investigación
Operativa
FEMENINO 21 33 47 101
MASCULINO 37 35 27 99
Total 58 68 74 200
206
71.28
200
)58(991..2
21
===
n
e
ff
66.33
200
)68(992..2
22
===
n
e
ff
63.36
200
)74(993..2
23
===
n
e
ff
c) Se calcula el valor de la estadística ji-cuadrado:
( )∑∑
−
= =
=
3
1
2
1
2
2
j i ije
ef ijij
χ ( )
29.29
29.2921
2
−= +
( )
34.34
34.3433
2
− +
( )
37.37
37.3747
2
−
+
( )
71.28
71.2837
2
−
+
( )
66.33
66.3335
2
−
+
( )
63.36
63.3627
2
−
=9.859.
d) Finalmente, el valor del coeficiente de contingencia es:
217.0047.0
859.209
859.9
===C .
¿ Para α = 0.05, es estadísticamente significativo el valor en-
contrado?.
Pasamos a aplicar la metodología de pruebas de hipótesis.
Prueba de hipótesis para independencia en tablas de
contingencia
Paso 1: Se plantean las hipótesis nula y alternativa:
0H : El sexo y la escuela académico profesional son inde-
pendientes.
1H : El sexo y la escuela académico profesional no son
independientes.
Paso 2: Bajo la hipótesis nula, el valor de la estadística de
prueba es:
207
( )∑∑
−
= =
=
r
j
k
i ije
ef ijij
1 1
2
2
χ
Paso 3: Con un nivel de significación α = 0.05, el percentil 95 de la
distribución chi-cuadrado con (k-1)(r-1)=(2-1)(3-1)=2 grado de li-
bertad, es igual a:
2
)1)(1()1( −−− rkxα =
2
)2()95.0( x = 5.99. La región de rechazo
es el intervalo (5.99, ∞).
Paso 4: El valor de la estadística de prueba es 9.859 y es mayor que
2
)2()95.0( x = 5.99, por lo que se rechaza la hipótesis nula de indepen-
dencia, con un nivel de significación 0.05.
Observe la importancia del tamaño de la muestra.
Ejemplo 4.14
Los datos que dieron origen a la tabla de contingencia usada en
el ejemplo 4.13 se encuentran en la base de DATOS8-chi-cuadra-
do. Resolveremos el ejemplo anterior usando comandos del SPSS.
Solución
sexo de los estudiantes- FACULTAD DE MATEMÁTICAS
* escuelas académico profesionales- FACULTAD DE
MATEMÁTICAS Crosstabulation
Count
escuelas académico profesionales-
FACULTADDEMATEMÁTICAS
matematicas estadística investigación Total
operativa
sexo de los FEMENINO 21 33 47 101
estudiantes-
FACULTADDE MASCULINO 37 35 27 99
MATEMÁTICAS
Total 58 68 74 200
208
Abrir la base de DATOS8-chi-cuadrado y ejecutar los comandos:
ANALYZE/DESCRIPTIVE STATISTICS/STATISTIC / elegir en
ROW la variable SEXO y como COLUMNS la variable ESCUELA
ACADÉMICO PROFESIONAL/ STATISTICS/ activar CHI-
CUADRADO CONTINGENCY/ PEARSON/ CONTINUE/ OK.
El output del SP=SS es el siguiente:
Se observa que el valor del coeficiente de contingencia es 0.217
y el valor de la estadística de prueba es 9.859, valores que coinciden
con los obtenidos en el paso anterior.
Para la prueba de hipótesis procedemos de la siguiente
manera:
Paso 1: Se plantean las hipótesis nula y alternativa:
0H : El sexo y la escuela académico profesional son inde-
pendientes.
1H : El sexo y la escuela académico profesional no son
independientes.
Paso 2: Bajo la hipótesis nula, el valor de la estadística de prue-
ba es: 859.92
=cχ .
Value df Asymp.
Sig. (2-sided)
Pearson
Chi-Square 9.859 2 .007
Value Approx. Sig.
Nominalby Contingency .217 .007
Nominal Coefficient
209
Paso 3: Con un nivel de significación α = 0.05, si valuep _ < α
se rechaza la hipótesis nula.
Paso 4: Como valuep _ = 0.007 < 0.05, la decisión es recha-
zar la hipótesis nula de independencia entre sexo y la elec-
ción de la Escuela Académico Profesional, para el nivel de sig-
nificación 0.05
Ejercicios
Seleccione la base de DATOS10-maestría y:
a) Construya las tablas de doble entrada con las frecuencias
absolutas y relativas para las variables condición laboral de
los estudiantes y el método con el que estudiaron el curso de
estadística.
b) Interprete algunas frecuencias absolutas y relativas con-
juntas.
c) Encuentre el coeficiente de contingencia e interpretar su
valor.
d) Con α = 0.10, ¿es estadísticamente significativa la asocia-
ción encontrada entre la condición laboral de los estudian-
tes y el método con el que estudiaron?. Resuelva detallada-
mente considerando todos los pasos desde el planteamiento
de las hipótesis hasta la decisión.
Seleccione la base de DATOS8-chi-cuadrado y:
a) Construya las tablas de doble entrada con las frecuencias
absolutas y relativas para las variables expectativas respec-
to a su futuro y escuela profesional.
b) Interprete algunas frecuencias absolutas y relativas con-
juntas.
c) Encontrar el coeficiente de contingencia.
d) Con α = 0.10, ¿es estadísticamente significativa la asocia-
ción encontrada entre las expectativas respecto a su futuro
y la escuela profesional escogida?. Resuelva detalladamente
considerando todos los pasos desde el planteamiento de las
210
hipótesis hasta la decisión.
Seleccione la base de DATOS8-chi-cuadrado y:
a) Construya las tablas de doble entrada con las frecuencias
absolutas y relativas para el medio de transporte que usan
para dirigirse a la universidad y el sexo de los estudiantes.
b) Interprete algunas frecuencias absolutas y relativas con-
juntas.
c) Encuentre el coeficiente de contingencia e interpretar su valor.
d) Con α = 0.10, ¿es estadísticamente significativa la asociación
encontrada entre el medio de transporte utilizado para dirigir-
se a la universidad y el sexo de los estudiantes?. Resuelva deta-
lladamente considerando todos los pasos desde el planteamien-
to de las hipótesis hasta la decisión.
Para el ejercicio 4.1 encuentre el coeficiente de asociación phi
entre la variable fila condición laboral y la variable columna
método con el que estudiaron el curso de estadística. Interprete.
Al nivel de significación α = 0.10, es estadísticamente significati-
vo el valor encontrado?.
En la base de DATOS10-maestría seleccione las variables méto-
do de enseñanza y notas en el curso de estadística.
a) Defina una nueva variable ficticia X0 y guarde en ella las
notas de estadística para los que estudiaron con el método
tradicional.
b) Defina una nueva variable ficticia X1 y guarde en ella las
notas de estadística para los que estudiaron con el método
no tradicional.
c) Encuentre la media aritmética de las dos variables ante-
riores.
d) Encuentre la desviación estándar de las notas de estadística.
e) Encuentre el coeficiente de correlación biseral-puntual e in-
terprete su valor.
f) Es estadísticamente significativo el valor encontrado, cuan-
do α = 0.10?.
211
De una población de niños de 10 años se seleccionó una muestra
de 100 niños, 50 de los cuales tenían algún conocimiento de in-
glés y los otros 50 niños no tenían ningún conocimiento de in-
glés. Se les aplicó las pruebas de retención de dígitos y de voca-
bulario, con los siguientes resultados:
a) Calcular e interprete el coeficiente phi entre el idioma y la
retención de dígitos.
b) Es estadísticamente significativo el valor encontrado?. Use
α = 0.10.
c) Calcule e interprete el coeficiente phi entre el idioma y la
retención de vocabulario.
d) ¿Es estadísticamente significativo el valor encontrado?. Use
α = 0.10.
De una muestra de 150 estudiantes se escogió datos dicoto-
RETENCIÓN DE DÍGITOS
INGLÉS
NO(0) SI(1)
CONOCEN (1) 25 25 50
NO CONOCEN (0) 39 21 50
64 56 100
RETENCIÓN DE VOCABULARIO
INGLÉS
NO(0) SI(1) TOTAL
CONOCEN (1) 22 28 50
NO CONOCEN (0) 39 11 50
TOTAL 61 39 100
212
mizados en ejecución de lectura X y en lateralidad Y (consisten-
cia con el cual se emplea "un solo" lado del cuerpo ojo-mano-
pie). Los datos se dieron en forma de juicios de ejecución, mala
lectura (0), buena lectura (1) y consistencia en el uso de un solo
lado del cuerpo, alta (19 o baja (0). Los resultados fueron los
siguientes:
Suponga que las dos variables subyacentes a ambas dicotómicas
son continuas.
a) Calcule el coeficiente de correlación tetracórico entre ejecu-
ción de lectura y lateralidad.
a) ¿Es estadísticamente significativo el coeficiente encontrado?.
Use α = 0.10.
b) Encuentre el coeficiente de correlación biseral entre la nota
de ingreso y el rendimiento
Use la base de DATOS10-maestría:
b) Dicotomice la variable nota de ingreso a la maestría. prome-
dio al semestre 99-II.
c) ¿Es estadísticamente significativo el coeficiente encontrado?.
Use α = 0.10.
Resuelva los ejercicios propuestos en el desarrollo del capítulo.
EJECUCIÓN EN LECTURA
LATERAL
MALA(0) BUENA(1) TOTAL
ALTA(1) 18 42 60
BAJA(0) 28 62 90
TOTAL 46 104 150

Más contenido relacionado

La actualidad más candente

Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanPatricia Castillo
 
Presentacion estadistica descriptiva
Presentacion estadistica descriptivaPresentacion estadistica descriptiva
Presentacion estadistica descriptivabetis081281
 
Coeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y PearsonCoeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y Pearsonanicar31
 
DISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENT
DISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENTDISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENT
DISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENTJonatan Gabriel Linares
 
T de student para dos muestras independientes
T de student para dos muestras independientesT de student para dos muestras independientes
T de student para dos muestras independientesJoseph AB
 
Coeficiente de correlacion
Coeficiente de correlacionCoeficiente de correlacion
Coeficiente de correlacionGEONARKIS
 
Ejercicios resueltos de pruebas de hipótesis
Ejercicios resueltos de pruebas de hipótesisEjercicios resueltos de pruebas de hipótesis
Ejercicios resueltos de pruebas de hipótesisronald gamarra rojas
 
Exposicion mann whitney
Exposicion mann whitneyExposicion mann whitney
Exposicion mann whitneyazael214
 
Cálculo del Coeficiente de Correlación de Pearson
Cálculo del Coeficiente de Correlación de PearsonCálculo del Coeficiente de Correlación de Pearson
Cálculo del Coeficiente de Correlación de Pearsonsaulvalper
 
Regresion y correlacion ppt
Regresion y correlacion pptRegresion y correlacion ppt
Regresion y correlacion pptrodrigomartinezs
 
Distribución t student
Distribución t studentDistribución t student
Distribución t studentecruzo
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisCarol Ramos
 
Ejercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaEjercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaMark Ardiles Alegre
 
Diapositivas coef. pearson y sperman
Diapositivas coef. pearson y spermanDiapositivas coef. pearson y sperman
Diapositivas coef. pearson y spermanpablo velasquez
 
Diapositiva Medidas de Dispersion
Diapositiva Medidas de DispersionDiapositiva Medidas de Dispersion
Diapositiva Medidas de DispersionRaquelMasters
 

La actualidad más candente (20)

Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y Spearman
 
Presentacion estadistica descriptiva
Presentacion estadistica descriptivaPresentacion estadistica descriptiva
Presentacion estadistica descriptiva
 
Coef Contingencia
Coef ContingenciaCoef Contingencia
Coef Contingencia
 
Prueba de U Mann-whitney
Prueba de U Mann-whitneyPrueba de U Mann-whitney
Prueba de U Mann-whitney
 
estadistica no parametrica
estadistica no parametricaestadistica no parametrica
estadistica no parametrica
 
Correlación PEARSON
Correlación PEARSONCorrelación PEARSON
Correlación PEARSON
 
Coeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y PearsonCoeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y Pearson
 
DISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENT
DISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENTDISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENT
DISTRIBUCION DE JI-CUADRADO, FISHER Y T-STUDENT
 
T de student para dos muestras independientes
T de student para dos muestras independientesT de student para dos muestras independientes
T de student para dos muestras independientes
 
Coeficiente de correlacion
Coeficiente de correlacionCoeficiente de correlacion
Coeficiente de correlacion
 
Correlaciones
CorrelacionesCorrelaciones
Correlaciones
 
Ejercicios resueltos de pruebas de hipótesis
Ejercicios resueltos de pruebas de hipótesisEjercicios resueltos de pruebas de hipótesis
Ejercicios resueltos de pruebas de hipótesis
 
Exposicion mann whitney
Exposicion mann whitneyExposicion mann whitney
Exposicion mann whitney
 
Cálculo del Coeficiente de Correlación de Pearson
Cálculo del Coeficiente de Correlación de PearsonCálculo del Coeficiente de Correlación de Pearson
Cálculo del Coeficiente de Correlación de Pearson
 
Regresion y correlacion ppt
Regresion y correlacion pptRegresion y correlacion ppt
Regresion y correlacion ppt
 
Distribución t student
Distribución t studentDistribución t student
Distribución t student
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Ejercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaEjercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadística
 
Diapositivas coef. pearson y sperman
Diapositivas coef. pearson y spermanDiapositivas coef. pearson y sperman
Diapositivas coef. pearson y sperman
 
Diapositiva Medidas de Dispersion
Diapositiva Medidas de DispersionDiapositiva Medidas de Dispersion
Diapositiva Medidas de Dispersion
 

Destacado

Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03
Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03
Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03Teresa Clotilde Ojeda Sánchez
 
Ejercicio de equilibrio liquido-liquido
Ejercicio de equilibrio liquido-liquidoEjercicio de equilibrio liquido-liquido
Ejercicio de equilibrio liquido-liquidoDavid Soler Camargo
 
FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03
FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03
FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03INFORMATICA_FAYN
 
Ejercicio ejemplo de chi cuadrado
Ejercicio ejemplo de chi cuadradoEjercicio ejemplo de chi cuadrado
Ejercicio ejemplo de chi cuadradomerysunny
 
Prueba Chi-Cuadrado
Prueba Chi-CuadradoPrueba Chi-Cuadrado
Prueba Chi-CuadradoJulio Rivera
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadisticaPAHOLA24
 
100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltosLuis Elias
 
Problemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaProblemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaYohana Bonilla Gutiérrez
 

Destacado (14)

Guía excel internet
Guía excel internetGuía excel internet
Guía excel internet
 
Spss
SpssSpss
Spss
 
Eso dificil
Eso dificilEso dificil
Eso dificil
 
Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03
Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03
Documentos primaria-sesiones-unidad03-sexto grado-matematica-6g-u3-mat-sesion03
 
Ejercicio de equilibrio liquido-liquido
Ejercicio de equilibrio liquido-liquidoEjercicio de equilibrio liquido-liquido
Ejercicio de equilibrio liquido-liquido
 
FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03
FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03
FUNDAMENTOS DE LA INFOMATICA - MANUAL SESION 03
 
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
 
Computcion senati
Computcion senatiComputcion senati
Computcion senati
 
Ejercicio ejemplo de chi cuadrado
Ejercicio ejemplo de chi cuadradoEjercicio ejemplo de chi cuadrado
Ejercicio ejemplo de chi cuadrado
 
Prueba Chi-Cuadrado
Prueba Chi-CuadradoPrueba Chi-Cuadrado
Prueba Chi-Cuadrado
 
Ejercicios Resueltos LEVIN
Ejercicios Resueltos LEVINEjercicios Resueltos LEVIN
Ejercicios Resueltos LEVIN
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadistica
 
100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos
 
Problemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaProblemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptiva
 

Similar a Coeficiente phi

CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.pptCLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.pptMaricelaOstosAlva
 
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.pptCLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.pptMaricelaOstosAlva
 
Uso de los coeficientes de correlación de pearson y de spearman
Uso de los coeficientes de correlación de pearson y de spearmanUso de los coeficientes de correlación de pearson y de spearman
Uso de los coeficientes de correlación de pearson y de spearmanedinxon peterson
 
coeficientes de correlacion spearman y pearson
coeficientes de correlacion spearman y pearsoncoeficientes de correlacion spearman y pearson
coeficientes de correlacion spearman y pearsongabrieladvpr
 
Ejemplo de verificacion de hipotesis
Ejemplo de verificacion de hipotesisEjemplo de verificacion de hipotesis
Ejemplo de verificacion de hipotesisFreddyLalaleo
 
Coeficientes pearson-y-spearman
Coeficientes pearson-y-spearmanCoeficientes pearson-y-spearman
Coeficientes pearson-y-spearmanVivianaMl
 
COEFICIENTE DE SPERMAN1111111111111111111111111111
COEFICIENTE DE SPERMAN1111111111111111111111111111COEFICIENTE DE SPERMAN1111111111111111111111111111
COEFICIENTE DE SPERMAN1111111111111111111111111111SamKerryFigueroaPait
 
Estadisticamanuelbeltraan 150515133729-lva1-app6892
Estadisticamanuelbeltraan 150515133729-lva1-app6892Estadisticamanuelbeltraan 150515133729-lva1-app6892
Estadisticamanuelbeltraan 150515133729-lva1-app6892manuelbeltran2015
 
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.pptUNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.pptcodinboscultural
 
Correlacion de Pearson
Correlacion de PearsonCorrelacion de Pearson
Correlacion de PearsonValentina
 
Correlación de Pearson y de Sperman
Correlación de Pearson y de SpermanCorrelación de Pearson y de Sperman
Correlación de Pearson y de SpermanAnderson Subero
 
Correlacion pearson y sperman
Correlacion pearson y spermanCorrelacion pearson y sperman
Correlacion pearson y spermansoaric
 
Presentacion slidershare 21 01 16 Josuana Bello
Presentacion slidershare 21 01 16 Josuana BelloPresentacion slidershare 21 01 16 Josuana Bello
Presentacion slidershare 21 01 16 Josuana BelloAndrea Bello
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajusteCarlos Becerra
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadisticanatorabet
 
Seminario 10
Seminario 10Seminario 10
Seminario 10sangarram
 

Similar a Coeficiente phi (20)

CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.pptCLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
 
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.pptCLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
CLASE Nº 5 -ESTADISTICA - Correlación y Regresión.ppt
 
Uso de los coeficientes de correlación de pearson y de spearman
Uso de los coeficientes de correlación de pearson y de spearmanUso de los coeficientes de correlación de pearson y de spearman
Uso de los coeficientes de correlación de pearson y de spearman
 
coeficientes de correlacion spearman y pearson
coeficientes de correlacion spearman y pearsoncoeficientes de correlacion spearman y pearson
coeficientes de correlacion spearman y pearson
 
Ejemplo de verificacion de hipotesis
Ejemplo de verificacion de hipotesisEjemplo de verificacion de hipotesis
Ejemplo de verificacion de hipotesis
 
el chi cuadrado
el chi cuadradoel chi cuadrado
el chi cuadrado
 
Coeficientes pearson-y-spearman
Coeficientes pearson-y-spearmanCoeficientes pearson-y-spearman
Coeficientes pearson-y-spearman
 
COEFICIENTE DE SPERMAN1111111111111111111111111111
COEFICIENTE DE SPERMAN1111111111111111111111111111COEFICIENTE DE SPERMAN1111111111111111111111111111
COEFICIENTE DE SPERMAN1111111111111111111111111111
 
Seminario 9 de estadísticas
Seminario 9 de estadísticasSeminario 9 de estadísticas
Seminario 9 de estadísticas
 
Estadisticamanuelbeltraan 150515133729-lva1-app6892
Estadisticamanuelbeltraan 150515133729-lva1-app6892Estadisticamanuelbeltraan 150515133729-lva1-app6892
Estadisticamanuelbeltraan 150515133729-lva1-app6892
 
EstimacióN Y Prueba De HipóTesis
EstimacióN Y Prueba De HipóTesisEstimacióN Y Prueba De HipóTesis
EstimacióN Y Prueba De HipóTesis
 
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.pptUNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
 
Correlacion de Pearson
Correlacion de PearsonCorrelacion de Pearson
Correlacion de Pearson
 
Correlación de Pearson y de Sperman
Correlación de Pearson y de SpermanCorrelación de Pearson y de Sperman
Correlación de Pearson y de Sperman
 
Correlacion pearson y sperman
Correlacion pearson y spermanCorrelacion pearson y sperman
Correlacion pearson y sperman
 
Presentacion slidershare 21 01 16 Josuana Bello
Presentacion slidershare 21 01 16 Josuana BelloPresentacion slidershare 21 01 16 Josuana Bello
Presentacion slidershare 21 01 16 Josuana Bello
 
Pruebasdebondaddeajuste 151127221517-lva1-app6891
Pruebasdebondaddeajuste 151127221517-lva1-app6891Pruebasdebondaddeajuste 151127221517-lva1-app6891
Pruebasdebondaddeajuste 151127221517-lva1-app6891
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadistica
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 

Último

TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxKevinHeredia14
 
Trabajo de Sifilisn…………………………………………………..
Trabajo de Sifilisn…………………………………………………..Trabajo de Sifilisn…………………………………………………..
Trabajo de Sifilisn…………………………………………………..JoseRamirez247144
 
Efectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxEfectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxCONSTRUCTORAEINVERSI3
 
MARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxMARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxgabyardon485
 
diseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxdiseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxjuanleivagdf
 
modelo de flujo maximo unidad 4 en modelos de optimización de recursos
modelo de flujo maximo unidad 4 en modelos de optimización de recursosmodelo de flujo maximo unidad 4 en modelos de optimización de recursos
modelo de flujo maximo unidad 4 en modelos de optimización de recursosk7v476sp7t
 
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docxPLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docxwilliamzaveltab
 
informacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfinformacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfPriscilaBermello
 
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptxTEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptxFrancoSGonzales
 
DELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdfDELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdfJaquelinRamos6
 
exportacion y comercializacion de palta hass
exportacion y comercializacion de palta hassexportacion y comercializacion de palta hass
exportacion y comercializacion de palta hassJhonnyvalenssYupanqu
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfConstructiva
 
Presentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financierosPresentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financierosmadaloga01
 
AUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptxAUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptxMatiasGodoy33
 
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYCarlosAlbertoVillafu3
 
fracturas de antebhbunununrazo [II].pptx
fracturas de antebhbunununrazo  [II].pptxfracturas de antebhbunununrazo  [II].pptx
fracturas de antebhbunununrazo [II].pptxkarlagonzalez159945
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónjesuscub33
 
EGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptxEGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptxDr. Edwin Hernandez
 
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsxINFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsxCORPORACIONJURIDICA
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzassuperamigo2014
 

Último (20)

TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
 
Trabajo de Sifilisn…………………………………………………..
Trabajo de Sifilisn…………………………………………………..Trabajo de Sifilisn…………………………………………………..
Trabajo de Sifilisn…………………………………………………..
 
Efectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxEfectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptx
 
MARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxMARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptx
 
diseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxdiseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptx
 
modelo de flujo maximo unidad 4 en modelos de optimización de recursos
modelo de flujo maximo unidad 4 en modelos de optimización de recursosmodelo de flujo maximo unidad 4 en modelos de optimización de recursos
modelo de flujo maximo unidad 4 en modelos de optimización de recursos
 
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docxPLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
 
informacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfinformacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdf
 
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptxTEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
 
DELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdfDELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdf
 
exportacion y comercializacion de palta hass
exportacion y comercializacion de palta hassexportacion y comercializacion de palta hass
exportacion y comercializacion de palta hass
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
 
Presentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financierosPresentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financieros
 
AUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptxAUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptx
 
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
 
fracturas de antebhbunununrazo [II].pptx
fracturas de antebhbunununrazo  [II].pptxfracturas de antebhbunununrazo  [II].pptx
fracturas de antebhbunununrazo [II].pptx
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarización
 
EGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptxEGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptx
 
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsxINFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzas
 

Coeficiente phi

  • 1. 169 Capítulo IV Pruebas de hipótesis para medidas de asociación [11] En muchas situaciones es de interés estudiar la relación entre dos o más variables definidas en una población, basados en los resul- tados encontrados en la muestra. Por ejemplo, podemos estar in- teresados en estudiar la relación entre el sexo y el lugar de proce- dencia de los participantes, entre el sexo y el rendimiento acadé- mico en el curso de álgebra, entre la edad y el tiempo de servicio de los participantes en el programa de capacitación. En todos los casos nos basamos en valores que encontramos en la muestra y nos preguntamos si dichos valores son estadísticamente significativos. Para abordar el problema planteado, en cada tipo de si- tuación, primero presentaremos la metodología para calcu- lar el coeficiente de correlación en la muestra y luego la metodo- logía correspondiente a pruebas de hipótesis para el parámetro poblacional. El estudio de la relación entre dos variables cuantitativas se realizará en el siguiente capítulo, juntamente con el tópico de análisis regresión. Prueba de hipótesis para el coeficiente de correlación PHI Cuando se desea estudiar la asociación entre dos variables de naturaleza cualitativas dicotómicas, se recomienda obtener el co-
  • 2. 170 eficiente de correlación phi. Por ejemplo, se desea estudiar la aso- ciación entre las variables estado civil y deserción de los estudian- tes de maestría; entre el sexo de los estudiantes y su opinión respec- to a la reelección del Decano. Coeficiente de correlación phi en la muestra Se definen: X: variable dicotómica con valores 0 y 1, Y: variable dicotómica con valores 0 y 1, px : proporción de puntuaciones 1 en la variable X, qx : proporción de puntuaciones 0 en la variable X, py : proporción de puntuaciones 1 en la variable Y, qy : proporción de puntuaciones 0 en la variable Y, pxy : proporción de puntuaciones 1 tanto en la variable X como en la variable Y, luego, el coeficiente de correlación phi, φ , se calcula de la siguiente manera: (4.1). qpqp ppp yyxx yxxy − =φ Cuando los datos están tabulados en una tabla de contin- gencia (tabla que muestra la ocurrencia conjunta de pares de pun- tuaciones en dos variables), puede calcularse φ mediante la si- Valores de la Valores de la Total variable Y variable X 0 1 1 A B a + b 0 C D c + d Total a + c b + d guiente metodología: . ))()()(( dcbadbca adbc ++++ − =φ
  • 3. 171 Este coeficiente tomará el valor 1 solamente cuando (a+b) y (c+d) son iguales (consecuentemente a=d) en una tabla de contin- gencia de dos por dos; es decir, cuando la proporción de "unos" es la misma en X y en Y". entonces Y no puede predecirse perfectamen- te a partir de X, por lo que algunos estadísticos consideran este hecho como una desventaja del coeficiente phi. Prueba de hipótesis para el coeficiente poblacional phi Paso 1: La hipótesis nula indica que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega esta afirmación. Denotemos con phiρ la asociación o el coeficien- te de correlación phi en la población, entonces, las hipótesis son: 0:0 =phiH ρ 0:1 ≠phiH ρ Paso 2: Bajo la hipótesis nula, para un tamaño de muestra ma- yor que 20, la estadística de prueba φnz = tiene distribución aproximadamente normal con media 0 y varianza 1. Con el va- lor del coeficiente obtenido en la muestra y bajo la hipótesis nula se calcula el valor de la estadística de prueba, cz . Paso 3: Para α = 0.05, ( ) 975.0=< teóricozZP , en la tabla de la distribución normal se encuentra el valor de 96.1=teóricoz . La re- gión de rechazo es el intervalo (-∞, -1.96) U(1.96, ∞). Paso 4: Si el valor de la estadística de prueba,, cae en el intervalo indicado, se rechaza la hipótesis nula. Ejemplo 4.1 Se ha observado que los estudiantes que inician sus estudios de maestría presentan mucha dificultad en el primer semestre por lo que algunos de ellos abandonan sus estudios. A continuación
  • 4. 172 se presentan los resultados de un seguimiento realizado a 15 estu- diantes de la maestría en Política Social que se matricularon en el semestre 2004-II y que abandonaron el curso de Herramientas de Análisis Cuantitativo. Encontraremos el coeficiente de correla- ción phi y haremos la prueba de hipótesis correspondiente. X: estado civil 1: no casado 0: casado Y: permanencia 0: abandona el curso 1: permanece en el curso hasta el final Estudiante Estado civil( ix ) Permanencia( iy ) 1 0 0 2 1 1 3 0 1 4 0 0 5 1 1 6 1 0 7 0 0 8 1 1 9 0 0 10 0 1 11 0 0 12 1 1 13 0 0 14 0 0 15 0 0 Solución La información anterior se resume en el siguiente cuadro: Valores de la Valores de la variable X variable Y 0 (casado) 1 Total 1 (permanece) 2 4 6 0 (abandona) 8 1 9 Total 10 5 15
  • 5. 173 y se calculan las respectivas proporciones: 3333.0 15 5 ==px 6667.0 15 10 ==qx 4.0 15 6 ==py 6.0 15 9 ==qy 2667.0 15 4 ==pxy que se reemplazan en la fórmula: ( )( )( )( ) .578.0 6.04.06667.03333.0 )4.0)(3333.0(2667.0 = − =φ El coeficiente de correlación phi en la muestra entre estado civil y deserción vale 0.578. ¿Es estadísticamente significativo el valor encontrado?. A continuación responderemos la pregunta planteada usando la metodología de pruebas de hipótesis. Paso 1: La hipótesis nula es que no existe asociación entre esta- do civil y deserción en los estudios y la hipótesis alternativa nie- ga ese enunciado. Si phiρ es la asociación entre estado civil y de- serción, las hipótesis son: 0:0 =phiH ρ 0:1 ≠phiH ρ Paso 2: El valor de la estadística de prueba es: φnzc = = =)578.0(15 2.24 Paso 3: Para α = 0.05, ( ) 95.0=< teóricozZP , por lo que la región de rechazo es el intervalo (- ∞, -1.96) ∪ (1.96, ∞). Paso 4: Como el valor de cz = 2.24, cae en el intervalo indicado, se rechaza la hipótesis nula. Luego, con nivel de significación 0.05, existe evidencia para rechazar la hipótesis nula. Cabe indicar, que por razones estrictamente académicas, en el ejemplo se ha considerado un tamaño de muestra menor que
  • 6. 174 el exigido. A continuación se hace la ilustración con el auxilio del SPSS y la regla de decisión se basa en el concepto valuep _ que ya fue explicado en el capítulo anterior. Ejemplo 4.2 Se ha observado que los estudiantes que inician sus estudios de Maestría presentan mucha dificultad en el primer semestre por lo que algunos de ellos abandonan sus estudios. A continuación se presentan los resultados de un seguimiento realizado a 41 es- tudiantes de las maestrías en derecho y educación, que se matri- cularon en el semestre 2004-II y que abandonaron el curso de Herramientas de Análisis Cuantitativo. Encontraremos el coefi- ciente de correlación phi y luego la correspondiente prueba de hipótesis para el parámetro poblacional. Los datos se encuentran en la base de DATOS4-phi. Solución A continuación se describe el procedimiento de pruebas de hipóte- sis y en el paso 2 se incluyen comandos del SPSS que permiten en- contrar el valor del coeficiente de correlación phi en la muestra. Paso 1: En la hipótesis nula se plantea que no existe asociación entre estado civil y deserción de los estudiantes y la hipótesis al- ternativa niega tal enunciado. Si phiρ es la asociación entre esta- do civil y deserción, las hipótesis son: 0:0 =phiH ρ 0:1 ≠phiH ρ Paso 2: El valor de la estadística de prueba se obtiene usando los siguientes comandos del SPSS: Abrir la base de DATOS4-phi. ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS/para ROW escoger la variable DESERCIÓN y para COLUMNS la variable ES-
  • 7. 175 de donde el valor del coeficiente phi en la muestra es 119.0−=φ . φnzc = = =− )119.0(41 -0.76. Paso 3: Para α = 0.05 ( ) 975.0=< teóricozZP , por lo que la región de rechazo es el intervalo (- ∞, -1.96) ó el intervalo (1.96, ∞). Asimismo, con el criterio del valuep _ la decisión es la si- guiente: Si valuep _ α< se rechaza la hipótesis nula. Paso 4: Como el valor de cz = -0.76 no cae en el intervalo indica- do, no se rechaza la hipótesis nula. Luego, con nivel de significa- ción 0.05, no existe evidencia para rechazar la hipótesis nula de que las variables deserción y estado civil no están asociadas. Se llega a la misma decisión si se compara valuep _ con el valor de α, pues valuep _ = 0.446 > 0.05, por lo que no existe evidencia para rechazar la hipótesis nula. TADOCIVIL/STATISTICS/seleccionarPHI/CONTINUE/OK. El output del SPSS es el siguiente: ESTADO CIVIL Total 0 1 DESERCIÓN 0 9 7 16 1 17 8 25 Total 26 15 41 Symmetric Measures Value Approx. Sig. Nominal by Nominal Phi -.119 .446 N of Valid Cases 41
  • 8. 176 Prueba de hipótesis para el coeficiente de correlación biseral-puntual El coeficiente de correlación biseral-puntual se usa cuando una variable es de naturaleza cualitativa dicotómica y la segunda es interval o de razón. Por ejemplo, podemos estar interesados en saber si existe alguna asociación entre sexo (Y) y altura de los estudiantes (X). Coeficiente de correlación biseral-puntual en la muestra Y es una variable dicotómica (1 y 0), X es una variable continua 1X es la media de las puntuaciones de la variable para los que la variable tiene puntaje "1", 0X es la media de las puntuaciones de la variable para los que la variable tiene puntaje "0", Sx es la desviación estándar de los valores de la variable X, n1: número de unos en la variable Y, n0: número de ceros en la variable Y, luego, el coeficiente de correlación biseral se calcula con: )1( 1001 − − = nn nn S XXr x bP (4.2) Prueba de hipótesis para el coeficiente de correlación Paso 1: En la hipótesis nula se postula que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega en afirmación. Si denotamos con bpρ el coeficiente de co- rrelación biseral-puntual en la población, entonces, las hipótesis son:
  • 9. 177 0:0 =bpH ρ 0:1 ≠bpH ρ Paso 2: Bajo la hipótesis nula, la estadística de prueba 2 1 2 − − = n r r t bp bp tiene distribución t-Student con ( 2−n ) grados de libertad. Con el valor del coeficiente de correlación obtenido en la muestra y bajo la hipótesis nula se calcula el valor del estadístico de prueba, ct . Paso 3: Para α = 0.05 ( ) 975.0)2( =<− teóricon ttP , en la tabla t-Stu- dent con 2−n grados de libertad se encuentra el valor de teóricot . Luego, la región de rechazo es el intervalo ( teóricot , 8). Paso 4: Si el valor de la estadística de prueba, ct , cae en el inter- valo indicado, se rechaza la hipótesis nula. Ejemplo 4.3 En la 2da y 3ra columnas del siguiente cuadro se presenta los datos del sexo y estaturas de 15 adolescentes que realizan depor- tes todos los fines de semana en el Parque Zonal Sinchi Roca. Vamos a encontrar el coeficiente de correlación biseral-puntual y luego haremos la prueba de hipótesis para el coeficiente de co- rrelación poblacional. Denotemos con: Y: la variable sexo con niveles 0: femenino 1: masculino, X: la variable estatura de los adolescentes (en pulgadas). Se crean las variables ficticias: X0: con las estaturas de los adolescentes del sexo femenino,
  • 10. 178 X1: con las estaturas de los adolescentes del sexo masculino. Es decir: Y se realizan los cálculos auxiliares, para luego obtener el co- eficiente de correlación biseral-puntual: 75.66 8 6263666472657369 1 = +++++++ =x 14.61 7 60636160625567 0 = ++++++ =x 749.478 x01 === snn 61.0 )14 )8)(7( 749.4 14.6175.66 (15 = − =rbP ¿Es estadísticamente significativo el valor del coeficiente de correlación biseral puntual encontrado en la muestra?. Para res- ponder la pregunta planteada, procederemos a usar la metodo- logía de pruebas de hipótesis. Adolescente Sexo (Y) Estatura (X) X0 X1 1 1 69 - 69 2 0 67 67 - 3 1 73 - 73 4 1 65 - 65 5 0 55 55 - 6 1 72 - 72 7 0 62 62 - 8 0 60 60 - 9 1 64 - 64 10 1 66 - 66 11 1 63 - 63 12 0 61 61 - 13 1 62 - 62 14 0 63 63 - 15 0 60 60 -
  • 11. 179 Paso 1: Se postula como hipótesis nula que no existe asociación entre sexo y estatura en la población y la hipótesis alternativa niega esa afirmación. Si se denota con bpρ el coeficiente de correla- ción biseral-puntual en la población, entonces, las hipótesis son: 0:0 =bpH ρ 0:1 ≠bpH ρ Paso 2: El valor de la estadística de prueba es: 2 1 2 − − = n r r t bp bp c = 77.2 13 )61.0(1 61.0 2 = − Paso 3: Para α = 0.05 ( ) 975.0)13( =< teóricottP , en la tabla t-Stu- dent se encuentra el valor de 16.2=teóricot . Luego, la región de rechazo es el intervalo (2.16, ∞). Paso 4: Como el valor de ct = 2.77 cae en el intervalo indicado, se rechaza la hipótesis nula. Ejemplo 4.4 Si se quiere resolver el ejemplo anterior usando comandos del SPSS no se puede encontrar directamente el coeficiente, pues el SPSS sólo nos proporciona los cálculos auxiliares que luego se reemplaza en la fórmula (4.2) y se sigue la trayectoria descrita para realizar la prueba de hipótesis. En el SPSS se siguen los si- guientes pasos: Crear (o abrir) el archivo, en este caso vamos a ilustrar con la base de DATOS9-puntual, con las dos variables X e Y. Crear la variable ficticia X0 donde se guarda las estaturas del sexo femenino. Se usa el comando recode. Crear la variable ficticia X1 donde se guarda las estaturas del sexo masculino. Se usa el comando recode.
  • 12. 180 El output del SPSS es el siguiente. Valores en negrita se reemplazan en la fórmula (4.2) y se en- cuentra que el valor del coeficiente es 0.61, como ya se vio en el ejemplo 4.3. Prueba de hipótesis para el coeficiente de correlación tetracorico Este tipo de coeficiente es recomendable en situaciones donde dos variables cuantitativas de naturaleza subyacente normal, han sido dicotomizadas. Así por ejemplo, el autor de una pregunta que mide la capacidad de razonamiento matemático de los estu- diantes de quinto año de secundaria considera que es un rasgo normalmente distribuido; pero el ítem sólo permitirá identificar al grupo que responda correctamente, al que se le asigna pun- tuación 1 y al grupo que responda incorrectamente, al que se le asigna un 0. Por otro lado, suponga que las estaturas de 1000 estudiantes se distribuyen normalmente, pero el entrenador asigna puntaje 1 a los que tienen estatura de 1.50 mts o superior y le asigna punta- je 0 a los que tienen estatura inferior a 1.50 mts. Vamos a estudiar la asociación para situaciones similares Calcular la media aritmética de X0, X1 y calcular la desviación es- tándar de X. Para detalles remitirse al libro: ESTADÍSTICA DESCRIPTIVA (Gómez y colaboradores, 2005). N Mean Std. Deviation estatura de los estudiantes 15 64.13 4.749 Xo 7 61.1429 3.62531 x1 8 66.7500 4.13176
  • 13. 181 como la descrita. Coeficiente de correlación en la muestra Sean: X: variable con distribución normal que ha sido dicotomizada X = 1 estatura ≥ 1.50 mts 0 estatuta < 1.50 mts Y: variable con distribución normal que ha sido dicotomizada Y = 1 respuesta correcta 0 respuesta incorrecta, para las que se encuentra la siguiente tabla bidimensional: Se calcula el cociente da cb y luego ubicar el valor en la Tabla E del Apéndice, donde se encuentran funciones del cociente obtenido: • Si la proporción da cb es mayor que 1, de la Tabla E se obtiene directamente el valor del coeficiente tetracórico, en la co- lumna rt , (4.3) • Si la proporción da cb es menor que 1, en la Tabla E se lee la columna (ad)/(bc) y el valor rt del coeficiente tetracórico será negativo. Prueba de hipótesis para el coeficiente ITEM Y ITEM X 0 1 1 a b 0 c d
  • 14. 182 Paso 1: La hipótesis nula indica que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega esa afirmación. Si denotemos con trρ el coeficiente de correlación tetra- córico en la población, entonces, las hipótesis son: 0:0 =trH ρ 0:1 ≠trH ρ Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo- res que 20, la distribución del coeficiente rt es aproximadamen- te normal con medio cero y desviación estándar yx yyxx uun qpqp 1 , donde: xp es la proporción de puntuaciones "1" en la variable X dicoto- mizada, yp es la proporción de puntuaciones "0" en la variable dicoto- mizada Y, xu es la ordenada de la curva normal unitaria correspondiente a la puntuación z en el cual se halla la proporción xp del área (ver la tabla A) y yu es la ordenada de la curva normal unitaria correspondiente a la puntuación z en el cual se halla la proporción yp del área (ver la tabla A). Así, para un tamaño de muestra mode- rado o muy grande: yx yyxx t uun qpqp r z 1 = puede compararse con la distribución normal unitaria para contrastar que el coeficiente tρ de la po- blación vale cero. Con los resultados obtenidos en la muestra se calcula el va- lor de la estadística de prueba: cz . Paso 3: Para α = 0.05 ( ) 975.0)2( =<− teóricon ttP , en la tabla t-Stu- dent con )2( −n grados de libertad se encuentra el valor de teóricot .
  • 15. 183 córico, primero se obtiene la tabla de doble entrada. En la tabla anterior se identifica a=4, b=19, c=21 y d=6 y se encuentra el valor de da cb = 16.625. Con dicho valor se va a la Tabla E. El valor de da cb es mayor que 1, y al usar la Tabla E para la proporción anterior, el valor aproximado del coeficiente de co- rrelación tetracórico es 0.81. .81.0625.16 =====>= rt ad bc ¿Es estadísticamente significativo el valor encontrado?. Responderemos la pregunta con la metodología de pruebas Luego, la región de rechazo es el intervalo ( teóricot , ∞). Paso 4: Si el valor del estadístico de prueba, ct , cae en el intervalo indicado se rechaza la hipótesis nula. Ejemplo 4.5 A un grupo de 50 estudiantes se les evalúa con dos ítems de apti- tud matemática y se asigna 1 a la respuesta correcta y 0 a la res- puesta incorrecta. Si se denota con X la primera pregunta y con Y la segunda pregunta, los resultados se presentan en la siguiente tabla bidimensional. Para encontrar el valor del coeficiente de correlación tetra- ITEM2(Y) ITEM1(X) Total 0 1 1 4 19 23 0 21 6 27 Total 25 25 50
  • 16. 184 de hipótesis. Paso 1: Se postula en la hipótesis nula que no existe asociación entre las respuestas a las preguntas X e Y. La hipótesis alternati- va niega dicha afirmación. 0:0 =trH ρ 0:1 ≠trH ρ Paso 2: Con los datos de la muestra procedemos a realizar los cálculos de: xp 5.0 50 25 == yp 46.0 50 23 == En la Tabla A del anexo se observa que la ordenada de la curva normal unitaria que corresponde a xp = 0.5 de área, es xu =0.3989 y la ordenada de la curva correspondiente al punto en el cual se obtiene yp = 0,46, es xu = 0,3970. Finalmente obtenemos el valor de la estadística de prueba: )397.0)(3989.0( 1 50 )54.0)(46.0)(5.0)(5.0( 812.0 =cz =3.64 Paso 3: Para α = 0.05 ( ) 975.0=< teóricozzP , en la tabla normal se encuentra el valor de teóricoz = 1.96. Luego, la región de rechazo es el intervalo (1.96, ∞). Paso 4: Como el valor de cz = 3.64 cae en el intervalo indicado, se rechaza la hipótesis nula y concluimos que el coeficiente de correlación tetracórico de la población no es nulo, cuando el ni- vel de significación es 0.05. Ejemplo 4.6 Suponga que para una determinada tabla de contingencia 2x2,
  • 17. 185 a=62, b=20, c=10, d=24 y se desea obtener el valor del coeficiente de correlación tetracórico. Como da cb = 0.1344, para encontrar el valor del coeficiente se consulta la Tabla A, bajo los valores de la columna 44.7= bc ad . Se encuentra que el valor del coeficiente de correlación tetracó- rico es negativo, rt = -0.67. Debe prevenirse al lector sobre la posibilidad de cometer se- rios errores. No debe emplearse el método si n db n ba ++ o se apartan considerablemente de 0.5. Si n db n ba ++ o son ma- yores que 0.7 o menores que 0.3, tampoco debería utilizarse la tabla A, y en su lugar, debería emplearse las tablas de Jenkins (1955). Cuando las distribuciones subyacentes son normales, sola- mente esta propiedad confiere superioridad al coeficiente rt so- bre el coeficiente PHI como medida de asociación. Ejemplo 4.7 Si deseamos encontrar el coeficiente de correlación tatracórico para las variables de la base de DATOS6-tetracórico, se observa que son 99 estudiantes, donde las notas del curso de estadística y del curso de metodología de investigación han sido dicotomiza- das, pues los profesores calificaron con aprobado o desaproba- do. Obtendremos el coeficiente de correlación tetracórico. Y: notas en el curso de estadística- dicotimizada, 0 desaprobó con notas inferiores a 11 1 aprobó con notas de 11 o más X: notas en el curso de metodología de investigación-dico- tomizada, 0 desaprobó con notas inferiores a 11
  • 18. 186 1 aprobó con notas de 11 o más. Solución Activar el SPSS. Abrir la base de DATOS6-tetracórico y ejecutar los siguientes comandos: ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS/para ROW escoger NOTAS DE ESTADÍSTICA y para COLUMNS es- coger NOTAS DE METODOLOGÍA/ en FORMAT activar DES- CENDENT/CONTINUE/OK. El outptup del SPSS muestra el siguiente cuadro: notas de estadística * notas de metodología de la investi- gación Crosstabulation a partir del que se calcula el valor de da cb = 6.18. En la Tabla E, al valor 6.18 de da cb le corresponde el valor rt = 0.62 para el coefi- ciente tetracórico. Ahora se plantea la siguiente pregunta: ¿Es significativamen- Count notas de metodología de la investigación Total desaprobó Aprobó notas de aprobó a=11 b=36 47 estadística desaprobó c=34 d=18 52 Total 45 54 99
  • 19. 187 te diferente de cero el coeficiente de correlación tetracórico en la población?. Se deja como ejercicio para el estudiante. Prueba de hipótesis para el coeficiente de correlación biseral Se usa en situaciones donde se tiene dos variables con distri- buciones normales subyacentes, una de las cuales ha sido di- cotomizada. Una de las situaciones donde se puede obtener el coeficiente de correlación biseral es la siguiente. Un profesor desea relacio- nar el tiempo que los estudiantes emplean en resolver un proble- ma (X) y la habilidad que tiene para resolver el problema (Y). El profesor anota el tiempo (X) que cada estudiante demora en resolver el problema, pero la variable Y no la calificó con una nota en la escala vigecimal o cualquier otra, sólo anotó que apro- bó (1) si llegó a la solución correcta y anotó no aprobó (0) si no llegó a la solución correcta. Coeficiente de correlación biseral en la muestra Sean las variables continuas Y dicotomizada (1 y 0) y X también dicotomizada (0 y 1). Calcular: 0X : la media de las puntuaciones de la variable X para los que en Y tienen puntaje "0", 1X : la media de las puntuaciones de la variable X para los que en Y tienen puntaje "1", XS : desviación estándar de la variable X, n1: número de unos en Y, n0: número de ceros en Y. Usar la TABLA A, para obtener: u : ordenada (es decir la altura) de la unidad de la distribución
  • 20. 188 normal, en el punto a partir del cual se obtiene el porcentaje 100( n n1 ) del área bajo la curva normal, donde nnn =+ 01 . Luego el coeficiente de correlación biseral muestral es igual a: . 2 0101         − − = nnu n nn S XXr x b (4.4) Este coeficiente puede ser menor que -1 y mayor que +1. Estos valores extremos indican que no era cierto que las puntuaciones X, categorizadas, tienen distribución normal sub- yacente o también puede indicar fluctuaciones de muestreo cuan- do n es pequeño y produce una distribución de X marcadamente platicúrtica. Prueba de hipótesis para el coeficiente Paso 1: La hipótesis nula indica que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega dicha afirmación. Si denotamos con bρ el coeficiente de correla- ción biseral en la población, entonces, las hipótesis son: 0:0 =bH ρ 0:1 ≠bH ρ Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo- res que 20, la distribución del coeficiente rb es aproximadamen- te normal con medio cero y desviación estándar nun nn 101 . La estadística: nun nn r z b 101 = puede compararse con la distribución normal uni- taria para contrastar que el coeficiente bρ poblacional vale cero.
  • 21. 189 Con los resultados obtenidos en la muestra se calcula el valor de la estadística de prueba: cz . Paso 3: Para α = 0.05 ( ) 975.0} =< teóricozzP , en la tabla normal se encuentra el valor de teóricoz . Luego, la región de rechazo es el intervalo ( teóricoz , ∞). Paso 4: Si el valor de la estadística de prueba, cz , cae en el inter- valo indicado, se rechaza la hipótesis nula. Ejemplo 4.8 Los datos que se presentan en el siguiente cuadro correspondien- tes al tiempo que los alumnos invierten en resolver una pregun- Alumno Tiempo (X) Nota en la prueba (Y) 1 16 1 2 12 0 3 11 0 4 7 1 5 15 1 6 14 1 7 10 0 8 11 0 9 15 1 10 9 0 11 13 1 12 7 0 13 13 1 14 11 1 15 10 0 16 11 1 17 10 1 18 11 1 ta de matemáticas (X) y la habilidad que tienen para llegar a la solución (Y). Sean: X: tiempo que demoró en resolver la pregunta, en minutos, Y = 1 solución correcta Y= 0 solución incorrecta.
  • 22. 190 Se crean las variables ficticias X0 y X1 con las notas de los que resolvieron de manera incorrecta y correcta respectivamen- te. Luego se calculan las medias aritméticas y la desviación están- dar del tiempo que demoran en resolver la pregunta, sin discrimi- nar si llegaron o no a la solución correcta. Así: n1 = 11 n0 = 7 n= 18 x1 = 12.36 x0 = 10 Para encontrar el valor de la ordenada de la distribución nor- mal, se usa la Tabla A del anexo, para lo que se plantea la si- guiente relación: 3836.061.0 18 11 )( =====>==< uzZP , y luego se encuentra el coeficiente .60.0 18)18(3836.0 )7(11 55.2 0.1036.12 18 2 =         − − =rb ¿Es significativamente diferente de cero el coeficiente en- contrado?. Responderemos con la metodología de pruebas de hipótesis. Paso 1: Enla hipótesis se postula que el coeficiente de correla- ción biseral en la población,, vale cero y la hipótesis alternativa niega ese enunciado: 0:0 =bH ρ 0:1 ≠bH ρ Paso 2: Con la información obtenida en la muestra: 111=n , 70=n , 3836.0=u , 60.0=br , nun nn 101 = )18)(3836.0( 1 18 )7(11 = 0.2995, el valor que toma la estadística de prueba es:
  • 23. 191 nun nn r z b c 101 = = )18)(3836.0( 1 18 )7)(11( 6.0 2995.0 6.0 = = 2.0. Paso 3: Para α = 0.05 ( ) 975.0} =< teóricozzP , en la tabla normal se encuentra el valor de teóricoz . Luego, la región de rechazo es el inter- valo (1.96, ∞). Paso 4: Como cz = 2.0 cae en el intervalo indicado, la decisión es rechazar la hipótesis nula con nivel de significación 0.05. Ejemplo 4.9 Los datos que se presentan en la base de DATOS7-biseral corres- ponden a una muestra de 99 alumnos de quinto año de secunda- ria, donde el profesor desea saber si están asociadas las varia- bles: el tiempo que un estudiante demora en resolver una pre- gunta y la habilidad que tiene para resolver el problema. Se de- nota con: X: el tiempo en minutos que los alumnos gastan en resolver una pregunta de matemáticas, Y: la habilidad del alumno para llegar a la solución. A la solu- ción correcta el profesor le asignó 1 y a la solución incorrec- ta le asignó = 0. Vamos a estudiar la asociación entre dichas variables. Solución Previamente, en la base de datos se crea: la variable X0 donde se guarda los tiempos que demoran en resolver la pregunta, los alumnos que no llegaron a la solución correcta y la variable X1 donde se guarda los tiempos que demoran en resolver la pregun- ta, los alumnos que llegaron a la solución correcta. Con el auxilio del SPSS los cálculos auxiliares para encon-
  • 24. 192 ger las variables TIEMPO PARA RESOLVER, X0 y X1/OPTIONS/ activar MEAN Y STD DEVIATION/ CONTINUE/ OK. La salidad del SPSS es la siguiente: donde: n1 = 47 n0 = 52 x1 = 64.13 x0 = 63.01 4747.0 99 471 == n n . En la TABLA A se encuentra el valor de u , por- que: 4747.0 99 47 )( ==< zZP , entonces 9823.0=u . Luego, el valor del coeficiente de correlación biseral en la muestra es:         − − = nnu n nn s xxr x b 2 0101         − − = 9999)99(3982.0 )52(47 168.10 01.6313.64 2 = 0.07. Por razones estrictamente académicas continuamos con la prueba de hipótesis, a pesar que sabemos que el valor de la esta- dística de prueba va a ser muy pequeño. Paso 1: El coeficiente de correlación biseral poblacional entre el trar el valor del coeficiente de correlación biseral muestral. Luego haremos la prueba de hipótesis correspondiente. Abrir la base de DATOS7-biseral y ejecultar los comandos: ANALYZE/DESCRIPTIVE STATISTICS/ DESCRIPTIVES/ esco- tiempo para resolver xo X1 N Valid 99 52 47 Mean 63.54 63.0113 64.1310 Std. Deviation 10.168 10.58776 9.76176
  • 25. 193 tiempo empleado y la habilidad para resolver el problema es cero, frente a la hipótesis que niega esa afirmación: . 0:0 =bH ρ 0:1 ≠bH ρ Paso 2: Con la información obtenida en la muestra obtenemos el valor de la estadística de prueba, es decir, para: n1 = 47 n0 = 52 x1 = 64.13 x0 = 63.01 3982.0=u 07.0=br nun nn 101 = )99)(3982.0( 1 99 )52(47 = 0.126, el valor que toma la estadística de prueba es: nun nn r z b c 101 = 126.0 07.0 = = 0.55. Paso 3: Para α = 0.05 ( ) 975.0} =< teóricozzP , el valor de teóricoz es 1.96. Luego, la región de rechazo es el intervalo (1.96, ∞). Paso 4: Como cz = 0.55 no cae en el intervalo indicado, la deci- sión es no rechazar la hipótesis nula con nivel de significación 0.05. Prueba de hipóstesis para el coeficiente de correlación de spearman El coeficiente de correlación producto-momento calculado a par- tir de dos series de n posiciones o rangos consecutivos indepen- dientes, que van de 1 hasta n se conoce con el nombre de coefi- ciente de correlación por rangos ordenados de Spearman. En este caso ambas variables X e Y medidas en la escala ordinales. Si los datos directos son cuantitativos, estos pueden conver- tirse en rangos o posiciones. Por ejemplo, la "posición u orden de mérito en el salón de clase" es un ejemplo de conversión de puntuaciones ordenadas
  • 26. 194 en rangos. Es decir, en un grupo de 50 estudiantes se le asigna la posición 1 al que alcanzó el más alto puntaje, posición 2 al si- guiente,..., y posición 50 al puntaje mas bajo. Los juicios sobre la excelencia de una declaración también constituyen un ejemplo de agrupamiento de posiciones o rangos según los datos origina- les. 10 estudiantes recitan una poesía y un juez asigna un "1" a la mejor declamación, un "2" a la segunda,..., y 10 a la peor decla- mación. Independientemente de cómo se originaron las puntuacio- nes 1, 2, 3,.............,( 1−n ), n; pueden correlacionarse dos series de rangos para los mismos individuos. Coeficiente de correlación de SPEARMAN en la muestra Sean: xx n ,....,1 : rangos asignados a la variable X, yy n ,...., 1 : rangos asignados a la variable Y n: tamaño de muestra o número de indivíduos yx ii − : diferencia entre el rango asignado a la variable X y el rango asignado a la variable Y de la i-ésima persona. Si existen dos o más valores iguales (valores empatados) los rangos de cada uno de éstos son iguales al promedio de los ran- gos que les correspondería en el caso de que fueran diferentes. Así por ejemplo si las edades de los participantes en un progra- ma de capacitación docente son las siguientes: 40 41 42 43 43 44 46, los rangos asignados son: 1, 2, 3, 4.5, 4.5, 6 y 7. Luego, el coeficiente de correlación de Spearman se define de la siguiente manera: ( ) ( )1 6 1 2 2 − −= ∑ − n yx r n ii S (4.5) 11 ≤≤− rS
  • 27. 195 su valor no puede ser menor que -1 ni mayor que 1, alcanza su máximo valor (+1) cuando los individuos ocupan los mismos rangos o posiciones en X e Y. Este coeficiente es muy útil cuando los datos originales son rangos o posiciones y cuando se emiten juicios para clasificar indi- viduos o cosas, pero se recomienda que el tamaño de muestra sea superior a 10. Pruebas de hipótesis para el coeficiente Paso 1: En la hipótesis se postula que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega esa afirmación. Denotemos con sρ la asociación o el coeficiente de correlación de Spearman en la población, entonces, las hipó- tesis son: 0:0 =sH ρ 0:0 ≠sH ρ Paso 2: Bajo la hipótesis nula, la estadística de prueba 2 1 2 − − = n r r t s s tiene distribución t-Student con (n-2) grados de libertad. Con el valor obtenido en la muestra y bajo la hipótesis nula se calcula el valor del estadístico de prueba, ct . Paso 3: Para α = 0.05, ( ) 025.0)2( =>− teóricon ttP o ( ) 975.0)2( =<− teóricon ttP , en la tabla B-t-Student se encuentra el valor de ct . Luego, la región de rechazo es el intervalo ( teóricot , ∞). Paso 4: Si el valor del estadístico de prueba, ct , cae en el inter- valo indicado, se rechaza la hipótesis nula. Ejemplo 4.10
  • 28. 196 Los siguientes datos corresponden a una muestra aleatoria de 12 estudiantes para quienes un juez asignó posiciones o rangos en base a la hostilidad que manifiestan los estudiantes a su profesor de metodología de la investigación y a sus compañeros de clase, es decir, dos series de rangos. Se desea encontrar el coeficiente de correlación de Spearman. Sea X: la hostilidad manifestada por el estudiante a su pro- fesor de matemáticas donde: 1: es el puntaje asignado al que manifiesta mayor hostilidad al profesor, 12: es el puntaje asignado al que manifiesta menor hostilidad al profesor, Y: la hostilidad manifestada por el estudiante hacia sus otros compañeros donde: 1: es el puntaje asignado al que manifiesta mayor hostilidad hacia sus compañeros 12: es el puntaje asignado al que manifiesta menor hostilidad hacia sus compañeros. Estudiante Hostilidad Hostilidad a yx ii − ( )yx ii− 2 al profesor los compañeros xi yi 1 2 6 - 4 16 2 8 5 3 9 3 12 10 2 4 4 3 7 - 4 16 5 1 3 - 2 4 6 6 4 2 4 7 7 9 - 2 4 8 10 8 2 4 9 4 1 2 4 10 9 11 2 4 11 11 12 - 1 1 12 5 2 3 9 TOTAL 84 .84)( 2 ∑ − =yx ii
  • 29. 197 En el siguiente cuadro se presentan los datos y las corres- pondientes cuentas, Luego, el valor del coeficiente de correlación de Spearman es 706.0 143 42 1 )1144(12 )84(6 1 =−= − −=rS ¿La relación encontrada entre la hostilidad manifiesta a los compañeros y la hostilidad manifiesta al profesor, es estadística- mente significativa?. Responderemos con la metodología de prue- bas de hipótesis. Paso 1: En la hipótesis nula se postula que no existe asociación entre las variables hostilidad a los compañeros y hostilidad al profesor y la hipótesis alternativa esa dicha afirmación, es decir: 0:0 =sH ρ 0:0 ≠sH ρ Paso 2: El valor de la estadística de prueba es: 2 1 2 − − = n r r t s s c = 212 706.01 706.0 2 − − = 3.15. Paso 3: Para α = 0.05 ( ) 975.0)2( =<− teóricon ttP , en la tabla t-Stu- dent se encuentra el valor de teóricot = 2.228. Luego, la región de rechazo es el intervalo (2.228, ∞). Paso 4: Como el valor de ct = 3.15, cae en el intervalo indicado, se rechaza la hipótesis nula. Al nivel de significación 0.05 las va- riables hostilidad al profesor y hostilidad a los compañeros no están asociadas.
  • 30. 198 Ejemplo 4.11 En la entrevista personal para ingresar a la carrera docente en una universidad, participaron 40 postulantes quienes fueron ca- lificados por dos miembros del jurado. En la base de DATOS7-jura- do se dispone de la siguiente información: P: postulantes X1: puntaje asignado a cada postulante por el miembro 1 del ju- rado, X2: puntaje asignado a cada postulante por el miembro 2 del ju- rado, X: rango que corresponde a las calificaciones del jurado 1, Y: rango que corresponde a las calificaciones del jurado 2, y se desea encontrar el coeficiente de correlación de Spearman. Solución Paso1: En la hipótesis nula se postula que los puntajes asigna- dos por los dos jurados no están relacionados y la hipótesis alter- nativa niega esa afirmación. 0:0 =sH ρ 0:0 ≠sH ρ Paso 2: Obtendremos el valor de la estadística de prueba me- diante el soporte del SPSS. Abrir la base de DATOS7-jurado, donde la información está preparada de acuerdo a las exigencias de la fórmula del coefi- ciente de correlación de Spearman y ejecutar los siguientes co- mandos: Rango a las Rango a las notas del notas del jurado1 jurado2 Spearman's rho Rango a las Correlation Coefficient 1.000 .332 notas del Sig. (2-tailed) jurado 1 .036 Rango a las Correlation Coefficient .332 1.000 notas del Sig. (2-tailed) .036 jurado 2
  • 31. 199 ANALYZE/CORRELATE/BIVARIATE/ seleccionar las varia- bles X e Y/ activar SPEARMAN/ OK. El output del SPSS nos muestra lo siguiente: Con el valor del coeficiente de correlación de Spearman de la muestra 332.0=sr , obtenemos el valor de la estadística de prueba: 2 1 2 − − = n r r t s s c = 240 332.01 332.0 2 − − = 2.17 Paso 3: En la tabla t-Student para el nivel de significación 0.05 y 38 grados de libertad se encuentra el valor teórico: 02.2=teóricot . Paso 4: Como el valor de 217=ct es mayor que el valor teórico, entonces se rechaza la hipótesis nula. Obsérvese la importancia del tamaño de muestra. También si usamos el criterio del valuep _ se llega a la mis- ma decisión, pues sabemos que si α<valuep _ se rechaza la hi- pótesis nula. En el presente caso el valor de valuep _ = 0.036 es menor que α = 0.05. Pruebas de hipótesis para tablas de contingencia Tablas bidimensionales para dos variables cualitativas En una muestra de n individuos en quienes se han observado las variables X e Y, se denota con A1, A2, …, Ak los k niveles o modalidades de X y con B1, B2, …, Br los r niveles o modalidades de Y. La distribución de los individuos considerando las dos características, se puede presentar en una tabla de doble en- trada o en una tabla bidimensional como la siguiente, donde los niveles de una de las variables ocupa la posición de las filas y los niveles de la otra variable ocupa la posición de las columnas
  • 32. 200 y los valores dentro de la tabla o celdas son las frecuencias absolu- tas conjuntas. donde: f ij , es el número de elementos con las modalidades Ai y Bj, de- nominadas frecuencias absolutas conjuntas, f i. , es el número de elementos con la modalidad Ai denomina- da i-ésima frecuencia marginal, f j. , es el número de elementos con la modalidad Bj denominada j-ésima frecuencia marginal, Eligiendo X como variable fila e Y como variable columna, se cumplen las siguientes propiedades: ff j k i ij . 1 =∑= , ff i r j ij . 1 =∑= . 1 . 1 . 11 n r j j k i i r j ij k i fff === ∑∑∑∑ ==== Al dividir las frecuencias absolutas conjuntas entre el nú- mero total de observaciones se obtienen las frecuencias relativas conjuntas hij correspondiente a las modalidades Ai y Bj, y las co- rrespondientes frecuencias relativas marginales; hi. y h j. , las que Tabla de frecuencias conjuntas absolutas X Y B1 B2 ……. Bj …… Br Total A1 f11 f12 …. f1j …. f1r f1. A2 f21 f22 …. f2j …. f2r f2. ….. …. ….. …. …. …. … … Ai fi1 fi2 …. fij …. fir fi. …. …. …. …. …. …. …. … Ak fk1 fk2 …. fki …. fkr fk. Total f.1 f.2 ……. f.j … f.r n
  • 33. 201 se presentan en la siguiente tabla de frecuencias relativas bidimen- sionales. donde: n f h ij ij = Asimismo, al dividir las frecuencias absolutas marginales entre el número total de observaciones se obtienen las frecuen- cias relativas marginales: n f h n f h j j i i . . . . == . Ejemplo 4.12 Se toma una pequeña muestra de docentes que participan en un programa de capacitación, para quienes registramos los valores de las variables sexo y estado civil. Se tabulará la información en Tabla de frecuencias relativas conjuntas X Y B1 B2 ……. Bj …… Br Total A1 h11 h12 …. h1j …. h1r h1. A2 h21 h22 …. h2j …. h2r h2. ….. …. ….. …. …. …. … … Ai hi1 hi2 …. hij …. hir hi. …. …. …. …. …. …. …. … Ak hk1 hk2 …. hki …. hkr hk. Total h.1 h.2 ……. h.j … h.r n
  • 34. 202 una tabla de doble entrada donde la variable sexo está representa- da en las filas y el estado civil en las columnas. Solución Sólo con fines didácticos no hacemos uso del SPSS y contamos el número de veces que se repite la categoría Ai de la variable sexo y el número de veces que se repite la categoría Bj de la variable estado civil. Así, para A1= femenino, A2 = masculino, B1= soltero, B2 = casado se tiene: f22 = 2, es decir, son 2 los estudiantes del sexo masculino y casados; f12 = 6, es decir, son 6 estudiantes del sexo Sexo Civil Sexo Civil Sexo civil sexo civil Femenino Soltero Femenino Soltero Femenino soltero femenino soltero Femenino soltero Masculino Soltero Masculino casado masculino casado Masculino soltero Masculino soltero femenino casado femenino casado Femenino casado Femenino casado Masculino soltero masculino soltero Masculino soltero Femenino soltero femenino casado masculino soltero Masculino soltero Femenino soltero femenino casado masculino soltero Cuadro Nº 4.1 Distribución de los docentes según sexo y estado civil, participantes en el Programa de Capacitación de la FCM-UNMSM Lima - 2004 SEXO ESTADO CIVIL Total Soltero Casado Femenino 7 6 13 Masculino 9 2 11 Total 16 8 24 femenino y casados. En el siguiente cuadro se presentan las fre- cuencias conjuntas.
  • 35. 203 Son 7 docentes solteras y 6 casadas del sexo femenino. Los estudiantes del sexo masculino 9 son solteros y 2 casados. En tablas de doble entrada para dos variables cualitativas se calcula el coeficiente de contingencia que mide la relación entre las dos variables. Como se verá, éste índice está en función de la esta- dística ji-cuadrado, χ 2 , ampliamente usada por los investigadores de las ciencias sociales, pero que su interpretación a veces reviste dificultades porque no existe un valor de comparación y puede tomar cualquier valor positivo. El valor del coeficiente de contin- gencia oscila entre 0 y 1. Coeficiente de contingencia en la muestra Para la presentación general de una tabla de contingencia para dos variables cualitativas se tiene: n: tamaño de la muestra, f ij : frecuencia absoluta conjunta que corresponde al i-ésimo nivel de la variable fila y al j-ésimo nivel de la variable columna, eij : la frecuencia esperada conjunta que corresponde al i-ésimo nivel de la variable fila y al j-ésimo nivel de la variable co- lumna, que se calcula con la siguiente fórmula: n ff e ji ij .. = y el valor de la estadística ji-cuadrado es: ( )∑∑ − = = = r j k i ije ef ijij 1 1 2 2 χ . Finalmente se define el coeficiente de contingencia como:
  • 36. 204 n C + = χ χ 2 2 cuyos valores oscilan entre 0 y 1. Pruebas de hipótesis para el parámetro poblacional Paso 1: Se plantea independencia entre la variable fila y la va- riable columna de la tabla de contingencia. En el ejemplo, el sexo y el estado civil de los participantes son independientes. Simbo- lizaremos con: 0H : Las variables fila y columna son independientes. 1H : Las variables fila y columna no son independientes. Paso 2: Bajo la hipótesis nula, el estadístico de prueba ( )∑∑ − = = = r j k i ije ef ijij 1 1 2 2 χ tiene distribución chi-cuadrado con (k-1) (r-1) grados de libertad, donde k: es el número de niveles de la variable fila y r es el número de niveles de la variable columna. Con los datos de la muestra y bajo la hipótesis nula se calcu- la el valor de la estadística de prueba, 2 cχ . Paso 3: Con un nivel de significación α, se compara el valor cal- culado en el paso 2, con el percentil ( ) %1001 α− de la distribu- ción chi-cuadrado con (k-1)(r-1) grados de libertad, percentil que se denota por .2 )1)(1()1( −−− rkxα En la Tabla C del Apéndice se expo- nen algunos percentiles de las distribuciones chi-cuadrado. Paso 4: Si el valor de la estadística de prueba, es mayor que 2 )1)(1()1( −−− rkxα , se rechaza la hipótesis nula.
  • 37. 205 Ejemplo 4.13 Para la siguiente tabla de contingencia vamos a encontrar el co- eficiente de contingencia entre el sexo y escuela académico pro- fesional de los estudiantes. Solución a) Se identifican las frecuencias observadas: f11 = 21 f12 = 33 f13 = 47 f21 = 37 f22 = 35 f23 = 27. f 1. = 101, f 2. = 99, f .1 = 58, f .2 = 68, f.3 = 74. b) Se encuentran las frecuencias esperadas con las siguientes fórmulas: 29.29 200 )58(1011..1 11 === n e ff 34.34 200 )68(1012..1 12 === n e ff 37.37 200 )74(1013..1 13 === n e ff Cuadro 4.2 Distribución de los estudiantes de la Facultad de Ciencias Matemáticas según sexo y escuelas profesionales. Censo universitario- UNMSM. Lima - 2002 ESCUELAS ACADÉMICO PROFESIONALES SEXO Total Matemáticas Estadística Investigación Operativa FEMENINO 21 33 47 101 MASCULINO 37 35 27 99 Total 58 68 74 200
  • 38. 206 71.28 200 )58(991..2 21 === n e ff 66.33 200 )68(992..2 22 === n e ff 63.36 200 )74(993..2 23 === n e ff c) Se calcula el valor de la estadística ji-cuadrado: ( )∑∑ − = = = 3 1 2 1 2 2 j i ije ef ijij χ ( ) 29.29 29.2921 2 −= + ( ) 34.34 34.3433 2 − + ( ) 37.37 37.3747 2 − + ( ) 71.28 71.2837 2 − + ( ) 66.33 66.3335 2 − + ( ) 63.36 63.3627 2 − =9.859. d) Finalmente, el valor del coeficiente de contingencia es: 217.0047.0 859.209 859.9 ===C . ¿ Para α = 0.05, es estadísticamente significativo el valor en- contrado?. Pasamos a aplicar la metodología de pruebas de hipótesis. Prueba de hipótesis para independencia en tablas de contingencia Paso 1: Se plantean las hipótesis nula y alternativa: 0H : El sexo y la escuela académico profesional son inde- pendientes. 1H : El sexo y la escuela académico profesional no son independientes. Paso 2: Bajo la hipótesis nula, el valor de la estadística de prueba es:
  • 39. 207 ( )∑∑ − = = = r j k i ije ef ijij 1 1 2 2 χ Paso 3: Con un nivel de significación α = 0.05, el percentil 95 de la distribución chi-cuadrado con (k-1)(r-1)=(2-1)(3-1)=2 grado de li- bertad, es igual a: 2 )1)(1()1( −−− rkxα = 2 )2()95.0( x = 5.99. La región de rechazo es el intervalo (5.99, ∞). Paso 4: El valor de la estadística de prueba es 9.859 y es mayor que 2 )2()95.0( x = 5.99, por lo que se rechaza la hipótesis nula de indepen- dencia, con un nivel de significación 0.05. Observe la importancia del tamaño de la muestra. Ejemplo 4.14 Los datos que dieron origen a la tabla de contingencia usada en el ejemplo 4.13 se encuentran en la base de DATOS8-chi-cuadra- do. Resolveremos el ejemplo anterior usando comandos del SPSS. Solución sexo de los estudiantes- FACULTAD DE MATEMÁTICAS * escuelas académico profesionales- FACULTAD DE MATEMÁTICAS Crosstabulation Count escuelas académico profesionales- FACULTADDEMATEMÁTICAS matematicas estadística investigación Total operativa sexo de los FEMENINO 21 33 47 101 estudiantes- FACULTADDE MASCULINO 37 35 27 99 MATEMÁTICAS Total 58 68 74 200
  • 40. 208 Abrir la base de DATOS8-chi-cuadrado y ejecutar los comandos: ANALYZE/DESCRIPTIVE STATISTICS/STATISTIC / elegir en ROW la variable SEXO y como COLUMNS la variable ESCUELA ACADÉMICO PROFESIONAL/ STATISTICS/ activar CHI- CUADRADO CONTINGENCY/ PEARSON/ CONTINUE/ OK. El output del SP=SS es el siguiente: Se observa que el valor del coeficiente de contingencia es 0.217 y el valor de la estadística de prueba es 9.859, valores que coinciden con los obtenidos en el paso anterior. Para la prueba de hipótesis procedemos de la siguiente manera: Paso 1: Se plantean las hipótesis nula y alternativa: 0H : El sexo y la escuela académico profesional son inde- pendientes. 1H : El sexo y la escuela académico profesional no son independientes. Paso 2: Bajo la hipótesis nula, el valor de la estadística de prue- ba es: 859.92 =cχ . Value df Asymp. Sig. (2-sided) Pearson Chi-Square 9.859 2 .007 Value Approx. Sig. Nominalby Contingency .217 .007 Nominal Coefficient
  • 41. 209 Paso 3: Con un nivel de significación α = 0.05, si valuep _ < α se rechaza la hipótesis nula. Paso 4: Como valuep _ = 0.007 < 0.05, la decisión es recha- zar la hipótesis nula de independencia entre sexo y la elec- ción de la Escuela Académico Profesional, para el nivel de sig- nificación 0.05 Ejercicios Seleccione la base de DATOS10-maestría y: a) Construya las tablas de doble entrada con las frecuencias absolutas y relativas para las variables condición laboral de los estudiantes y el método con el que estudiaron el curso de estadística. b) Interprete algunas frecuencias absolutas y relativas con- juntas. c) Encuentre el coeficiente de contingencia e interpretar su valor. d) Con α = 0.10, ¿es estadísticamente significativa la asocia- ción encontrada entre la condición laboral de los estudian- tes y el método con el que estudiaron?. Resuelva detallada- mente considerando todos los pasos desde el planteamiento de las hipótesis hasta la decisión. Seleccione la base de DATOS8-chi-cuadrado y: a) Construya las tablas de doble entrada con las frecuencias absolutas y relativas para las variables expectativas respec- to a su futuro y escuela profesional. b) Interprete algunas frecuencias absolutas y relativas con- juntas. c) Encontrar el coeficiente de contingencia. d) Con α = 0.10, ¿es estadísticamente significativa la asocia- ción encontrada entre las expectativas respecto a su futuro y la escuela profesional escogida?. Resuelva detalladamente considerando todos los pasos desde el planteamiento de las
  • 42. 210 hipótesis hasta la decisión. Seleccione la base de DATOS8-chi-cuadrado y: a) Construya las tablas de doble entrada con las frecuencias absolutas y relativas para el medio de transporte que usan para dirigirse a la universidad y el sexo de los estudiantes. b) Interprete algunas frecuencias absolutas y relativas con- juntas. c) Encuentre el coeficiente de contingencia e interpretar su valor. d) Con α = 0.10, ¿es estadísticamente significativa la asociación encontrada entre el medio de transporte utilizado para dirigir- se a la universidad y el sexo de los estudiantes?. Resuelva deta- lladamente considerando todos los pasos desde el planteamien- to de las hipótesis hasta la decisión. Para el ejercicio 4.1 encuentre el coeficiente de asociación phi entre la variable fila condición laboral y la variable columna método con el que estudiaron el curso de estadística. Interprete. Al nivel de significación α = 0.10, es estadísticamente significati- vo el valor encontrado?. En la base de DATOS10-maestría seleccione las variables méto- do de enseñanza y notas en el curso de estadística. a) Defina una nueva variable ficticia X0 y guarde en ella las notas de estadística para los que estudiaron con el método tradicional. b) Defina una nueva variable ficticia X1 y guarde en ella las notas de estadística para los que estudiaron con el método no tradicional. c) Encuentre la media aritmética de las dos variables ante- riores. d) Encuentre la desviación estándar de las notas de estadística. e) Encuentre el coeficiente de correlación biseral-puntual e in- terprete su valor. f) Es estadísticamente significativo el valor encontrado, cuan- do α = 0.10?.
  • 43. 211 De una población de niños de 10 años se seleccionó una muestra de 100 niños, 50 de los cuales tenían algún conocimiento de in- glés y los otros 50 niños no tenían ningún conocimiento de in- glés. Se les aplicó las pruebas de retención de dígitos y de voca- bulario, con los siguientes resultados: a) Calcular e interprete el coeficiente phi entre el idioma y la retención de dígitos. b) Es estadísticamente significativo el valor encontrado?. Use α = 0.10. c) Calcule e interprete el coeficiente phi entre el idioma y la retención de vocabulario. d) ¿Es estadísticamente significativo el valor encontrado?. Use α = 0.10. De una muestra de 150 estudiantes se escogió datos dicoto- RETENCIÓN DE DÍGITOS INGLÉS NO(0) SI(1) CONOCEN (1) 25 25 50 NO CONOCEN (0) 39 21 50 64 56 100 RETENCIÓN DE VOCABULARIO INGLÉS NO(0) SI(1) TOTAL CONOCEN (1) 22 28 50 NO CONOCEN (0) 39 11 50 TOTAL 61 39 100
  • 44. 212 mizados en ejecución de lectura X y en lateralidad Y (consisten- cia con el cual se emplea "un solo" lado del cuerpo ojo-mano- pie). Los datos se dieron en forma de juicios de ejecución, mala lectura (0), buena lectura (1) y consistencia en el uso de un solo lado del cuerpo, alta (19 o baja (0). Los resultados fueron los siguientes: Suponga que las dos variables subyacentes a ambas dicotómicas son continuas. a) Calcule el coeficiente de correlación tetracórico entre ejecu- ción de lectura y lateralidad. a) ¿Es estadísticamente significativo el coeficiente encontrado?. Use α = 0.10. b) Encuentre el coeficiente de correlación biseral entre la nota de ingreso y el rendimiento Use la base de DATOS10-maestría: b) Dicotomice la variable nota de ingreso a la maestría. prome- dio al semestre 99-II. c) ¿Es estadísticamente significativo el coeficiente encontrado?. Use α = 0.10. Resuelva los ejercicios propuestos en el desarrollo del capítulo. EJECUCIÓN EN LECTURA LATERAL MALA(0) BUENA(1) TOTAL ALTA(1) 18 42 60 BAJA(0) 28 62 90 TOTAL 46 104 150