Este documento describe la teoría de respuesta al ítem, la cual se enfoca en analizar las propiedades psicométricas de los ítems individuales, en contraste con la teoría clásica de los test que se enfoca en las propiedades globales del test. Explica conceptos como la curva característica del ítem, los parámetros de dificultad, discriminación y aciertos al azar de cada ítem. También cubre supuestos como la unidimensionalidad y la independencia local de los ítems.
2. LA MEDICIÓN
• El problema de la medición es estimar el
ERROR DE MEDICIÓN
• Se usa un modelo matemático
TEORÍA CLÁSICA DE LOS TEST TEORÍA RESPUESTA AL ITEM
La unidad de análisis es el TEST
Aspectos psicométricos del TEST
Propiedades globales del test
La unidad de análisis es el ITEM
Aspectos psicométricos de los ITEMS
Propiedades de los ítems individuales
3. PUNTUACIONES EN LOS TEST
• Hay que asegurarse que el instrumento
mide con precisión, con poco ERROR.
• Puntuaciones empíricas en que medida
son las puntuaciones verdaderas.?
X = V + e
• Para averiguarlo necesitamos un modelo
estadístico.
• Se propone un modelo lineal clásico
4. Supuestos
• La puntuación verdadera (V) es la esperanza
matemática de la puntuación empírica, que
formalmente puede escribirse así: V = E(X).
• Si se aplica el test infinitas veces la puntuación verdadera
de una persona es la media de dichas puntuaciones.
• No existe relación entre la cuantía de las
puntuaciones verdaderas de las personas y el
tamaño de los errores que afectan a esas
puntuaciones. . r (v,e) = 0.
• Puede haber puntuaciones verdaderas altas con errores
bajos, o altos, no hay conexión entre el tamaño de la
puntuación verdadera y el tamaño de los errores
5. Supuestos
• Los errores de medida de las personas en un test
no están relacionados con los errores de medida
en otro test distinto. puede expresarse así:
r(ej, ek)=0.
• Es decir, no hay ninguna razón para pensar que los errores
cometidos en una ocasión vayan a covariar
sistemáticamente con los cometidos en otra ocasión.
• Tests Paralelos, aquellos tests que miden lo
mismo exactamente pero con distintos ítems.
• Las puntuaciones verdaderas de las personas en los tests
paralelos serían las mismas, y también serían iguales las
varianzas de los errores de medida.
Estimar el grado de error que contienen las puntuaciones de los tests, se
denomina : Fiabilidad de los Test
6. Limitaciones
• Las mediciones no resultan invariantes respecto
al instrumento utilizado
• Si evaluamos tres personas con un test diferente para
cada persona, los resultados no son comparables.
• la ausencia de invarianza de las propiedades de
los tests respecto de las personas utilizadas para
estimarlas.
• Propiedades psicométricas de los tests, tales como la
dificultad de los ítems, o la fiabilidad del test, estaban en
función del tipo de personas utilizadas para calcularlas, la
dificultad de los ítems, o los coeficientes de fiabilidad
dependen en gran medida del tipo de muestra utilizada
para calcularlos.
7. TEORIA CLASICA DE LOS TEST
• Spearman, C. (1904). The proof and
measurement of association between two things.
American Journal of Psychology,15, 72-101.
• Spearman, C. (1907). Demonstration of formulae
for true measurement of correlation. American
Journal ofPsychology,18, 160-169 .
• Spearman, C. (1913). Correlations of sums and
differences. British Journal of Psychology. 5 417-
426.
Charles Spearman
(Londres, 1863-1945)
9. Parámetros para caracterizar a los ítems y a las pruebas, de
acuerdo con su calidad para la medición:
1. La dificultad del ítem, medida por el porcentaje de
respuestas correctas.
2. La discriminación del ítem, medida generalmente por
la correlación entre el puntaje en el ítem y el puntaje
total en la prueba.
3. La estimación del puntaje total en la prueba como la
suma o promedio simple de los puntajes obtenidos en
los ítems.
4. La confiabilidad total de la prueba medida por el alfa
de Cronbach (α).
Zúñiga y Montero(2007) Actualidades en Psicología
10. SUPUESTOS
• Unidimensionalidad: La respuesta del
sujeto esta dada por una variable llamada
RASGO LATENTE.
¿Cómo comprobamos la unidimensionalidad.?
• Los items deben medir una sola APTITUD
o RASGO.
• Independencia local de sus ítems: exige
que la respuesta del sujeto esté
determinada solamente por su nivel de
rasgo latente
11. CURVA CARACTERÍSTICA DEL ITEM
• Probabilidad de responder correctamente
al ítem con el nivel de habilidad que tiene
en la variable medida por el ítem quien
responde a él. Se expresa matemáticamente
como una función logística.
Test de inteligencia aplicado a 100,000 ps. Supongamos que la menor y
mayor puntuación obtenidas en el test son 80 y 120.
Para observar el rendimiento en un ítem:
Nos fijamos en todas las personas que han obtenido la puntuación 80
(supongamos que son 132). Vemos cuantas personas de las anteriores
han acertado el ítem (supongamos que han sido sólo 2) y calculamos la
proporción (2/132 = 0.02). Hacemos lo mismo con los que obtuvieron en
el test 81 puntos (y obtenemos la proporción, supongamos que 0.02),...
con las que obtuvieron en el test 100 (la proporción fue 0.50),... con las
que obtuvieron 120 (la proporción fue 0.99). La siguiente gráfica
muestra la proporción de acertar el ítem dentro de cada grupo de
personas
Cuanto mayor es el cociente intelectual de las personas, mayor es la probabilidad de acertar el ítem. A una puntuación de
100 le corresponde una probabilidad de acertar de 0.5; mientras que a una de 120 le corresponde una probabilidad de 0.99
12. PARÁMETROS
• Nivel de habilidad
denominado zeta
• La dificultad: Modelo logístico
de un parámetro. Rasch
• La discriminación: Modelo
logístico de dos parámetros
Birnbaum.
• Aciertos la azar. Modelo
logístico de tres parámetros.