2. Psicometría
• Conjunto de técnicas, métodos y teorías
implicados en la medición de variables
psicológica; estudia las propiedades métricas
exigibles en las mediciones psicológicas y
establece las bases para que éstas se realicen de
manera adecuada. Origen en 1904.
3. Teoría Clásica de las pruebas
Diseño de instrumentos presenta importantes
problemas:
• No existe una sola aproximación a la medición de un
constructo que sea universalmente aceptada
• Las medidas psicológicas se basan en muestras
limitadas de la conducta
• La medida obtenida siempre tiene error
• Falta de escalas con origen y unidades de medida bien
definidas
• Los constructos psicológicos no pueden definirse
aisladamente en términos de definiciones
operacionales únicamente
4. Teoría Clásica de las pruebas
A nivel empírico, si el instrumento está bien
construido, esperaríamos que la puntuación
obtenida por el sujeto reflejara lo mejor posible su
puntuación verdadera y el error de medición fuer
acercano a cero.
6. Fuentes de error en la medición
• Selección de los reactivos
• Aplicación de la prueba
• Calificación
Aleatorios
No sistemáticos
7. Fuentes de error en la medición
• Seguir procedimiento
• Obtener coeficiente de confiablidad
Sistemáticos
8. Estabilidad de la medida
• Se refiere que al medir un atributo psicológico
las medidas obtenidas sean estables en el tiempo
• Test retest (r de Pearson)
• Formas Equivalente de prueba
9. Consistencia Interna
• Reactivos de un instrumento consistentes entre
sí en la forma en que evalúan el atributo
• División por mitades (Spearman-Brown)
• Consistencia interna de los reactivos
individuales (Alfa de Cronbach)
10. Validez
• Un instrumento de medición es valido si hace
aquello para lo que fue concebido a la validez de
una prueba concierne a lo que esta mide , du
eficacia y lo que podemos inferir de los puntajes
obtenidos en la prueba.
• Validez de constructo (validar teoría subyacente)
• Validez de criterio (predicción criterio externo)
• Validez de contenido (reactivos muestra
representativa)
11. Aspectos complementarios validez de
contenido
En la construcción de un instrumento
• No incluya aspectos irrelevantes de la conducta
de interés
• Contenga todos los aspectos importantes que
definen el dominio conductual
12. Clasificación de las pruebas
psicológicas
• Interpretación
• Forma de comparación
• Finalidad
• Modo de aplicación
• Área de comportamiento que miden
15. CONSIDERACIONES
• Una prueba es sólo uno de entre varios métodos
posibles de obtención de la información
deseada.
• Existen pruebas publicadas disponibles en la
mayoría de los campos de la actividad
psicológica
16. ETAPAS EN LA CONSTRUCCION DE UNA
PRUEBA
1. Especificaciones
de la finalidad
2. Definición
del rasgo
3. Elaboración
de reactivos
4. Comprobación
y análisis de los
reactivos
5. Estructura de
la forma final
de la prueba
6. Estandarización
7. Análisis
técnico de la
prueba
17. 1. FINALIDAD DE LA PRUEBA
• Determinar el contenido de la prueba y
• Su formato
¿para que fines servirá la prueba?
¿Qué grupos de sujetos serán
sometidos al examen?
Respuesta libre
Velocidad /poder
Máxima/típica
Papel y lápiz /ejecución
Colectiva /individual
Estructurada / proyectivas
18. 2. DEFINICION DEL RASGO
• En el caso de las pruebas psicológicas deberá de
definir de modo tan explicito como sea posible el
rasgo que se medirá.
• A continuación tendrá que indicar las conductas
a través de las cuales se manifestará el rasgo, es
decir que describirá las conductas observables,
las habilidades o las aptitudes que sean
indicadoras del rasgo que se medirá
19. 3. ELABORACION DE REACTIVOS
• En la construcción de cualquier prueba existen
una serie de reglas que facilitan la redacción de
los items (Navas, 2001):
Escribir en forma clara, precisa y simple
Expresar una única idea por item
Evitar expresiones del tipo “ninguna es valida” o
“todas son validas”
20. ¿Qué es un item?
• Es la unidad básica que configura el material o
contenido de un instrumento de medición
• Comprende la pregunta y la respuesta. La
pregunta es una situación problema a la que el
sujeto ha de dar una sola respuesta.
¿Por qué son importantes?
Porque el test tiene como finalidad medir una
variable cuyos resultados sirven de apoyo para
obtener conclusiones
21. Ejemplo:
Reactivo Rasgo que valora Test
“actúa de manera
nerviosa e inestable”
Estabilidad emocional perfil e inventario de
personalidad
La letra que sigue es:
xgwhviuj
Razonamiento Psicología Industrial de
Venezuela (PIV)
“me pongo nervioso (a)
y preocupado (a)
cuando tengo que salir
de casa para hacer un
viaje corto
Miedos Inventario multifasico
de la personalidad de
Minessota (MMPI-2)
22. 4. ANALSIS DE LOS REACTIVOS
Es el estudio de los items para conocer sus
propiedades estadísticas y como se relacionan
con las propiedades estadísticas del test.
Esta relación es directamente proporcional, ya
que existe una relación directa entre los estudios
estadísticos de los items y los estudios del
puntaje total.
23. ANALISIS DE LOS RECTIVOS
• Son tres los indicadores que se utilizan para
describir las características psicométricas de los
reactivos de un test objetivo:
Su nivel de dificultad
Su poder de discriminación
funcionamiento de sus distractores
24. Partes de un item /Pruebas de
conocimiento, habilidades
Enunciado:
Frase en forma
afirmativa que
presenta la situación
que debe ser
respondida o
resuelta
Clave:
La opción que se
considera responde
adecuadamente el
enunciado. Es la
respuesta correcta
Distractores:
Opciones que se
consideran
respuestas posibles
al enunciado. Son
respuestas
incorrectas
25. Tipos de análisis de items
Se puede comprobar estadísticamente, el grado en
que un item es un buen medidor del rasgo de
interés.
Índice de dificultad: cuantificar el grado de
dificultad (pruebas de rendimiento/ ejecución
máxima)
Índice de discriminación: es la amplitud con la
que el reactivo mide lo que debe medir
26. Procedimiento para obtener el índice de
dificultad y el índice de discriminación
1. Elaborar matriz de calificaciones de cada uno
de los examinados:
Items/
sujetos
1 2 3 4 5 Total
1 1 1 1 1 0 4
2 0 1 1 1 0 3
3 1 1 1 0 0 3
4 1 0 0 1 0 2
27. Procedimiento para obtener el índice de
dificultad y el índice de discriminación
2. Dividir a los examinados en tres grupos según
sus calificaciones en la prueba como un todo:
Up= un grupo superior formado por el 27% que
obtuvo las calificaciones mas altas
Lp= un grupo inferior compuesto por el 27% que
tuvo las calificaciones mas bajas
y el 46% restante incluido en el grupo intermedio
28. INDICE DE DIFICULTAD DEL ITEM
• Se entiende como la proporción de personas que
responden correctamente a un reactivo de una
prueba.
• Símbolo “p”
p= Up+Lp
U+L
# total de
personas en
los grupos
superior e
inferior
29. INDICE DE DISCRIMINACION DEL ITEM
• Capacidad del test para diferenciar entre sujetos
que puntúan alto de aquellos que puntúan bajo
en la variable medida. Es decir, si un sujeto
contiene un nivel alto en la variable debe
puntuar alto y si tiene un nivel bajo en la
variable puntúa bajo
• Símbolo “D”
D= Up-Lp
U
30. Ejemplo:
• Suponga que 50 personas presentan una prueba
• Los grupos superior e inferior pueden formarse
con el 27%
.27x50=14
U=14
L=14
31. Ejemplo:
• Analizar Reactivo A:
12 personas del grupo superior y 7 del grupo
inferior pasan el reactivo:
Up=12
Lp=7
33. Interpretación
Muy fácil Por encima de 0.75
Fácil Entre 0.55-0.74
Normal Entre 0.45-0.54
Difícil Entre 0.25-0.44
Muy difícil Por debajo de 0.25
Dificultad
Discriminación
Muy bien Igual o mayor de 0.4
Bien Entre 0.3 y 0.39
Poco Entre 0.20 y 0.29
Limite, debe
mejorar
0.10 y 0.19
Carece de
utilidad
Menor de 0.10
34. CONCLUSIONES
• El índice mas importante es el poder
discriminativo de los reactivos.
• Si el test y el item miden el mismo constructo lo
esperable es que los sujetos con alta puntuación
en el test tiendan a responder correctamente ( o
en la misma dirección) al ítem
35. 5. ESTRUCTURA DE LA FORMA FINAL DE
LA PRUEBA
• Implica preparar la o las formas finales de la
prueba
• Los resultados del análisis de reactivos se
utilizan para seleccionar reactivos que
proporcionen mejor discriminación, tengan la
dificultad apropiada y no posean ambigüedades
ni alternativas deficientes
• Después de efectuar los cambios pertinentes se
imprime la prueba.
36. 6. ESTANDARIZACION
• Toda prueba estandarizada tiene instrucciones
estandar de aplicación y calificación que deben
seguirse estrictamente, sin dejar lugar a
interpretación personal
• La estandarización incluye aplicar la prueba a
una muestra grande de personas (muestra de
estandarización) seleccionada como
representante de la población meta a la que esta
destinada la prueba.
37. 6. ESTANDARIZACION
• Su principal propósito es determinar la distribución
de puntuaciones crudas en la muestra de
estandarización. Las calificaciones crudas obtenidas
se transforman en calificaciones derivadas
(normas).
• Los principales tipos de normas son equivalentes de
edad, grado, percentiles y calificaciones estándar.
• La mayoría de los manuales de pruebas contienen
tablas de normas con puntuaciones crudas y
calificaciones convertidas
38. 7. ANALISIS TECNICO DE LA PRUEBA
• Antes de que una prueba pueda utilizarse con
seguridad debe obtenerse información acerca de:
CONFIABILIDAD VALIDEZ
39. Bibliografía
• Aragón, L. Evaluación psicológica. México:
Manual Moderno. 2011.
• Aiken, L. Tests Psicológicos y Evaluación. 11ª
Ed. Prentice Hall Mexico, 2003 (capítulo 2 y 4)