PS. María José Córdova
1
CONFIABILIDAD
Dos aspectos en la medición
 Un instrumento debe satisfacer dos condiciones para
que pueda utilizarse en la práctica:
- Confiabilidad
- Validez
 La validez: Grado en que el instrumento mide lo que
pretende medir
2
Confiabilidad
 Grado en que una serie de medidas están libres de
error aleatorio... Dice relación con la estabilidad de
las mediciones en el tiempo.
Si un instrumento no es confiable, inmediatamente
se cuestiona su validez. Pero si es confiable, esto no
garantiza de que sea válido.
3
 La confiabilidad de una prueba se expresa por un
número decimal positivo que fluctúa entre 0 y 1
0= ausencia de confiabilidad
1= confiabilidad perfecta
4
ERROR DE MEDIDA
ERROR SISTEMÁTICO
• Afecta a todas las medidas en una misma dirección.
• Por ejemplo: Las respuestas a un ítem contaminado por
deseabilidad social. Se da mucho en selección de personal
con ítemes muy transparentes.
ERROR ALEATORIO
• Afecta a las mediciones en direcciones dispares.
• Por ejemplo: fatiga temporal de los sujetos; fluctuaciones de la
memoria; factores instantáneos en los sujetos o el instrumento
(conceptos mal entendidos, instrumento borroso que no se
entiende)
TECNICAS PARA ESTIMAR CONFIABILIDAD
• Test – Retest (confiabilidad por Estabilidad)
• Bipartición (confiabilidad por Exactitud)
• Multipartición (confiabilidad por Exactitud)
• Formas Paralelas (confiabilidad por Exactitud)
TEST - RETEST
• Proporciona un índice llamado CONFIABILIDAD DE
ESTABILIDAD.
• A un mismo grupos de personas se aplica dos veces el mismo
instrumento, dejando un intervalo razonable entre una aplicación
y otra.
• Ambos valores se correlacionan (r de pearson).
BIPARTICION
• Consiste en aplicar el test una sola vez a los sujetos y luego
dividir el test en dos subconjuntos de ítemes equivalentes.
Métodos de cálculo de la confiabilidad
 Coeficiente Test- retest:
Se utiliza para evaluar si el test mide consistentemente de
una ocasión a otra, toma en consideración errores debidos a
diferencias en las condiciones.
Este coeficiente correlaciona las calificaciones obtenidas
por un grupo de personas en una primera aplicación con las
obtenidas en una segunda aplicación.
A menor tiempo, mayor es el coeficiente
9
 Coeficiente de Formas Paralelas:
- Intenta soslayar el problema de la recordación
diferencial de las personas ante los reactivos
- Utiliza una forma paralela del instrumento, con
reactivos similares pero no iguales
- Permite evaluar los errores de medición debidos a los
diferentes reactivos y a los diferentes momentos de
aplicación
- Para evitar confusiones debe aplicarse en un primer
momento a la mitad del grupo la forma A y al otro el B, y
en el segundo momento al revés.
10
a) Método de división por mitades:
- Una sola prueba se considera compuesta de dos partes
que miden la misma cosa.
- Se puede asignar calificaciones separadas a sus dos
mitades seleccionadas arbitrariamente. Por ejemplo
los pares v/s los impares. (se asume medias y
varianzas iguales)
- La correlación entre las dos calificaciones obtenidas
por un grupo de personas es el coeficiente de
confiabilidad.
11
Coeficientes de consistencia Interna
Interpretación de los coeficientes de
confiabilidad
 Un nivel satisfactorio depende de para qué
se utilizará la medida
- En las primeras etapas de la investigación
(investigación básica) puede bastar una
confiabilidad modesta como 0.70
- En investigaciones sobre grupos por ejemplo y
para saber diferencias entre tratamientos
experimentales es adecuada una confiabilidad
de 0.80
12
 En casos de decisiones cruciales como por ejemplo
en el caso de la evaluación de inteligencia y el
ingreso a escuelas especiales 0.90 es lo mínimo
aceptado y más de 0.95 es lo deseable.
13
EJEMPLO DE ANÁLISIS DE
CONFIABILIDAD POR CONSISTENCIA
INTERNA CON SPSS
Abrir Base de datos
Analizar-Escala-Análisis de fiabilidad
Se seleccionan los ítems que se quieren analizar, por ejemplo los de la
escala de autoestima de Rosenberg
En estadísticos-marcar las casillas Elemento, Escala, Escala si se
elimina el elemento, medias y varianzas, y luego presiona continuar y
aceptar
En resultados, existen 2 tablas relevantes: Estadísticos de fiabilidad y
total-elemento
En la tabla “Estadísticos de fiabilidad”, se indica el resultado de la
consistencia interna de las escalas, en nuestro ejemplo la técnica de
Alfa de Cronbach arroja 0,78 para 10 elementos o ítems, lo cual
indica que se posee una confiabilidad adecuada (α > 0,7).
En Estadísticos total-elemento, arroja varios resultados interesantes:
En primer lugar indica la media y varianza de la escala si se elimina el elemento o ítem.
En este sentido, se considerará adecuada una varianza mayor a cero, pues indica la
existencia de una mayor cantidad de respuestas diferentes de los sujetos al ítem.
En segundo lugar, se indica la columna de la correlación elemento-total. El criterio es
que un ítem es adecuado en la medida en que posee una mayor correlación con el
test, por ejemplo, si el ítem posee una correlación baja (menor o igual a 0,25) estará
en observación o será candidato a eliminarse.
Finalmente, indica el coeficiente de Alfa si se elimina el ítem, en nuestro ejemplo si
eliminamos el ítem 5, la confiabilidad aumenta a 0,785. Sin embargo, se sugiere
eliminar el ítem de la escala, si el salto en la confiabilidad pasa de un rango a otro, por
ejemplo si la escala hubiese aumentado a una confiabilidad de 0,9.
Referencias
 Aiken, L. (2003). Test Psicológicos y evaluación. México, D. F: Pearson
Prentice Hall.
 Magnusson (1981). Teoría de los test. México D.F: Ed Trillas.
 Nunnally, J. y Berstein, I. (1995). Teoría Psicométrica. México, DF:
McGraw Hill.
22

Confiabilidad.pdf

  • 1.
    PS. María JoséCórdova 1 CONFIABILIDAD
  • 2.
    Dos aspectos enla medición  Un instrumento debe satisfacer dos condiciones para que pueda utilizarse en la práctica: - Confiabilidad - Validez  La validez: Grado en que el instrumento mide lo que pretende medir 2
  • 3.
    Confiabilidad  Grado enque una serie de medidas están libres de error aleatorio... Dice relación con la estabilidad de las mediciones en el tiempo. Si un instrumento no es confiable, inmediatamente se cuestiona su validez. Pero si es confiable, esto no garantiza de que sea válido. 3
  • 4.
     La confiabilidadde una prueba se expresa por un número decimal positivo que fluctúa entre 0 y 1 0= ausencia de confiabilidad 1= confiabilidad perfecta 4
  • 5.
    ERROR DE MEDIDA ERRORSISTEMÁTICO • Afecta a todas las medidas en una misma dirección. • Por ejemplo: Las respuestas a un ítem contaminado por deseabilidad social. Se da mucho en selección de personal con ítemes muy transparentes. ERROR ALEATORIO • Afecta a las mediciones en direcciones dispares. • Por ejemplo: fatiga temporal de los sujetos; fluctuaciones de la memoria; factores instantáneos en los sujetos o el instrumento (conceptos mal entendidos, instrumento borroso que no se entiende)
  • 6.
    TECNICAS PARA ESTIMARCONFIABILIDAD • Test – Retest (confiabilidad por Estabilidad) • Bipartición (confiabilidad por Exactitud) • Multipartición (confiabilidad por Exactitud) • Formas Paralelas (confiabilidad por Exactitud)
  • 7.
    TEST - RETEST •Proporciona un índice llamado CONFIABILIDAD DE ESTABILIDAD. • A un mismo grupos de personas se aplica dos veces el mismo instrumento, dejando un intervalo razonable entre una aplicación y otra. • Ambos valores se correlacionan (r de pearson).
  • 8.
    BIPARTICION • Consiste enaplicar el test una sola vez a los sujetos y luego dividir el test en dos subconjuntos de ítemes equivalentes.
  • 9.
    Métodos de cálculode la confiabilidad  Coeficiente Test- retest: Se utiliza para evaluar si el test mide consistentemente de una ocasión a otra, toma en consideración errores debidos a diferencias en las condiciones. Este coeficiente correlaciona las calificaciones obtenidas por un grupo de personas en una primera aplicación con las obtenidas en una segunda aplicación. A menor tiempo, mayor es el coeficiente 9
  • 10.
     Coeficiente deFormas Paralelas: - Intenta soslayar el problema de la recordación diferencial de las personas ante los reactivos - Utiliza una forma paralela del instrumento, con reactivos similares pero no iguales - Permite evaluar los errores de medición debidos a los diferentes reactivos y a los diferentes momentos de aplicación - Para evitar confusiones debe aplicarse en un primer momento a la mitad del grupo la forma A y al otro el B, y en el segundo momento al revés. 10
  • 11.
    a) Método dedivisión por mitades: - Una sola prueba se considera compuesta de dos partes que miden la misma cosa. - Se puede asignar calificaciones separadas a sus dos mitades seleccionadas arbitrariamente. Por ejemplo los pares v/s los impares. (se asume medias y varianzas iguales) - La correlación entre las dos calificaciones obtenidas por un grupo de personas es el coeficiente de confiabilidad. 11 Coeficientes de consistencia Interna
  • 12.
    Interpretación de loscoeficientes de confiabilidad  Un nivel satisfactorio depende de para qué se utilizará la medida - En las primeras etapas de la investigación (investigación básica) puede bastar una confiabilidad modesta como 0.70 - En investigaciones sobre grupos por ejemplo y para saber diferencias entre tratamientos experimentales es adecuada una confiabilidad de 0.80 12
  • 13.
     En casosde decisiones cruciales como por ejemplo en el caso de la evaluación de inteligencia y el ingreso a escuelas especiales 0.90 es lo mínimo aceptado y más de 0.95 es lo deseable. 13
  • 14.
    EJEMPLO DE ANÁLISISDE CONFIABILIDAD POR CONSISTENCIA INTERNA CON SPSS
  • 15.
  • 16.
  • 17.
    Se seleccionan losítems que se quieren analizar, por ejemplo los de la escala de autoestima de Rosenberg
  • 18.
    En estadísticos-marcar lascasillas Elemento, Escala, Escala si se elimina el elemento, medias y varianzas, y luego presiona continuar y aceptar
  • 19.
    En resultados, existen2 tablas relevantes: Estadísticos de fiabilidad y total-elemento
  • 20.
    En la tabla“Estadísticos de fiabilidad”, se indica el resultado de la consistencia interna de las escalas, en nuestro ejemplo la técnica de Alfa de Cronbach arroja 0,78 para 10 elementos o ítems, lo cual indica que se posee una confiabilidad adecuada (α > 0,7).
  • 21.
    En Estadísticos total-elemento,arroja varios resultados interesantes: En primer lugar indica la media y varianza de la escala si se elimina el elemento o ítem. En este sentido, se considerará adecuada una varianza mayor a cero, pues indica la existencia de una mayor cantidad de respuestas diferentes de los sujetos al ítem. En segundo lugar, se indica la columna de la correlación elemento-total. El criterio es que un ítem es adecuado en la medida en que posee una mayor correlación con el test, por ejemplo, si el ítem posee una correlación baja (menor o igual a 0,25) estará en observación o será candidato a eliminarse. Finalmente, indica el coeficiente de Alfa si se elimina el ítem, en nuestro ejemplo si eliminamos el ítem 5, la confiabilidad aumenta a 0,785. Sin embargo, se sugiere eliminar el ítem de la escala, si el salto en la confiabilidad pasa de un rango a otro, por ejemplo si la escala hubiese aumentado a una confiabilidad de 0,9.
  • 22.
    Referencias  Aiken, L.(2003). Test Psicológicos y evaluación. México, D. F: Pearson Prentice Hall.  Magnusson (1981). Teoría de los test. México D.F: Ed Trillas.  Nunnally, J. y Berstein, I. (1995). Teoría Psicométrica. México, DF: McGraw Hill. 22