Este documento describe los conceptos de confiabilidad y validez en la medición psicológica. Explica que la confiabilidad se refiere al grado en que una medición es libre de error aleatorio, mientras que la validez se refiere a si una prueba mide lo que pretende medir. Luego detalla varias técnicas para estimar la confiabilidad, como test-retest, bipartición y formas paralelas. Finalmente, ofrece pautas para la interpretación de los coeficientes de confiabilidad.
2. Dos aspectos en la medición
Un instrumento debe satisfacer dos condiciones para
que pueda utilizarse en la práctica:
- Confiabilidad
- Validez
La validez: Grado en que el instrumento mide lo que
pretende medir
2
3. Confiabilidad
Grado en que una serie de medidas están libres de
error aleatorio... Dice relación con la estabilidad de
las mediciones en el tiempo.
Si un instrumento no es confiable, inmediatamente
se cuestiona su validez. Pero si es confiable, esto no
garantiza de que sea válido.
3
4. La confiabilidad de una prueba se expresa por un
número decimal positivo que fluctúa entre 0 y 1
0= ausencia de confiabilidad
1= confiabilidad perfecta
4
5. ERROR DE MEDIDA
ERROR SISTEMÁTICO
• Afecta a todas las medidas en una misma dirección.
• Por ejemplo: Las respuestas a un ítem contaminado por
deseabilidad social. Se da mucho en selección de personal
con ítemes muy transparentes.
ERROR ALEATORIO
• Afecta a las mediciones en direcciones dispares.
• Por ejemplo: fatiga temporal de los sujetos; fluctuaciones de la
memoria; factores instantáneos en los sujetos o el instrumento
(conceptos mal entendidos, instrumento borroso que no se
entiende)
6. TECNICAS PARA ESTIMAR CONFIABILIDAD
• Test – Retest (confiabilidad por Estabilidad)
• Bipartición (confiabilidad por Exactitud)
• Multipartición (confiabilidad por Exactitud)
• Formas Paralelas (confiabilidad por Exactitud)
7. TEST - RETEST
• Proporciona un índice llamado CONFIABILIDAD DE
ESTABILIDAD.
• A un mismo grupos de personas se aplica dos veces el mismo
instrumento, dejando un intervalo razonable entre una aplicación
y otra.
• Ambos valores se correlacionan (r de pearson).
8. BIPARTICION
• Consiste en aplicar el test una sola vez a los sujetos y luego
dividir el test en dos subconjuntos de ítemes equivalentes.
9. Métodos de cálculo de la confiabilidad
Coeficiente Test- retest:
Se utiliza para evaluar si el test mide consistentemente de
una ocasión a otra, toma en consideración errores debidos a
diferencias en las condiciones.
Este coeficiente correlaciona las calificaciones obtenidas
por un grupo de personas en una primera aplicación con las
obtenidas en una segunda aplicación.
A menor tiempo, mayor es el coeficiente
9
10. Coeficiente de Formas Paralelas:
- Intenta soslayar el problema de la recordación
diferencial de las personas ante los reactivos
- Utiliza una forma paralela del instrumento, con
reactivos similares pero no iguales
- Permite evaluar los errores de medición debidos a los
diferentes reactivos y a los diferentes momentos de
aplicación
- Para evitar confusiones debe aplicarse en un primer
momento a la mitad del grupo la forma A y al otro el B, y
en el segundo momento al revés.
10
11. a) Método de división por mitades:
- Una sola prueba se considera compuesta de dos partes
que miden la misma cosa.
- Se puede asignar calificaciones separadas a sus dos
mitades seleccionadas arbitrariamente. Por ejemplo
los pares v/s los impares. (se asume medias y
varianzas iguales)
- La correlación entre las dos calificaciones obtenidas
por un grupo de personas es el coeficiente de
confiabilidad.
11
Coeficientes de consistencia Interna
12. Interpretación de los coeficientes de
confiabilidad
Un nivel satisfactorio depende de para qué
se utilizará la medida
- En las primeras etapas de la investigación
(investigación básica) puede bastar una
confiabilidad modesta como 0.70
- En investigaciones sobre grupos por ejemplo y
para saber diferencias entre tratamientos
experimentales es adecuada una confiabilidad
de 0.80
12
13. En casos de decisiones cruciales como por ejemplo
en el caso de la evaluación de inteligencia y el
ingreso a escuelas especiales 0.90 es lo mínimo
aceptado y más de 0.95 es lo deseable.
13
20. En la tabla “Estadísticos de fiabilidad”, se indica el resultado de la
consistencia interna de las escalas, en nuestro ejemplo la técnica de
Alfa de Cronbach arroja 0,78 para 10 elementos o ítems, lo cual
indica que se posee una confiabilidad adecuada (α > 0,7).
21. En Estadísticos total-elemento, arroja varios resultados interesantes:
En primer lugar indica la media y varianza de la escala si se elimina el elemento o ítem.
En este sentido, se considerará adecuada una varianza mayor a cero, pues indica la
existencia de una mayor cantidad de respuestas diferentes de los sujetos al ítem.
En segundo lugar, se indica la columna de la correlación elemento-total. El criterio es
que un ítem es adecuado en la medida en que posee una mayor correlación con el
test, por ejemplo, si el ítem posee una correlación baja (menor o igual a 0,25) estará
en observación o será candidato a eliminarse.
Finalmente, indica el coeficiente de Alfa si se elimina el ítem, en nuestro ejemplo si
eliminamos el ítem 5, la confiabilidad aumenta a 0,785. Sin embargo, se sugiere
eliminar el ítem de la escala, si el salto en la confiabilidad pasa de un rango a otro, por
ejemplo si la escala hubiese aumentado a una confiabilidad de 0,9.
22. Referencias
Aiken, L. (2003). Test Psicológicos y evaluación. México, D. F: Pearson
Prentice Hall.
Magnusson (1981). Teoría de los test. México D.F: Ed Trillas.
Nunnally, J. y Berstein, I. (1995). Teoría Psicométrica. México, DF:
McGraw Hill.
22