CONSTRUCCION DE PRUEBAS
PSICOLOGICAS
Zelenia M. Eguigure
Psicometría
• Conjunto de técnicas, métodos y teorías
implicados en la medición de variables
psicológica; estudia las propiedades métricas
exigibles en las mediciones psicológicas y
establece las bases para que éstas se realicen de
manera adecuada. Origen en 1904.
Teoría Clásica de las pruebas
Diseño de instrumentos presenta importantes
problemas:
• No existe una sola aproximación a la medición de un
constructo que sea universalmente aceptada
• Las medidas psicológicas se basan en muestras
limitadas de la conducta
• La medida obtenida siempre tiene error
• Falta de escalas con origen y unidades de medida bien
definidas
• Los constructos psicológicos no pueden definirse
aisladamente en términos de definiciones
operacionales únicamente
Teoría Clásica de las pruebas
A nivel empírico, si el instrumento está bien
construido, esperaríamos que la puntuación
obtenida por el sujeto reflejara lo mejor posible su
puntuación verdadera y el error de medición fuer
acercano a cero.
Confiabilidad
• Exactitud
• Precisión
• Estabilidad de la medida
• Consistencia interna
X=V+e
Fuentes de error en la medición
• Selección de los reactivos
• Aplicación de la prueba
• Calificación
Aleatorios
No sistemáticos
Fuentes de error en la medición
• Seguir procedimiento
• Obtener coeficiente de confiablidad
Sistemáticos
Estabilidad de la medida
• Se refiere que al medir un atributo psicológico
las medidas obtenidas sean estables en el tiempo
• Test retest (r de Pearson)
• Formas Equivalente de prueba
Consistencia Interna
• Reactivos de un instrumento consistentes entre
sí en la forma en que evalúan el atributo
• División por mitades (Spearman-Brown)
• Consistencia interna de los reactivos
individuales (Alfa de Cronbach)
Validez
• Un instrumento de medición es valido si hace
aquello para lo que fue concebido a la validez de
una prueba concierne a lo que esta mide , du
eficacia y lo que podemos inferir de los puntajes
obtenidos en la prueba.
• Validez de constructo (validar teoría subyacente)
• Validez de criterio (predicción criterio externo)
• Validez de contenido (reactivos muestra
representativa)
Aspectos complementarios validez de
contenido
En la construcción de un instrumento
• No incluya aspectos irrelevantes de la conducta
de interés
• Contenga todos los aspectos importantes que
definen el dominio conductual
Clasificación de las pruebas
psicológicas
• Interpretación
• Forma de comparación
• Finalidad
• Modo de aplicación
• Área de comportamiento que miden
Conceptos claves
• Normalización
• Estandarización
• Baremación
Normas de puntación
• Puntuaciones derivadas
Típicas
Decatipos
Eneatipos
Percentiles
Edades escalares
CONSIDERACIONES
• Una prueba es sólo uno de entre varios métodos
posibles de obtención de la información
deseada.
• Existen pruebas publicadas disponibles en la
mayoría de los campos de la actividad
psicológica
ETAPAS EN LA CONSTRUCCION DE UNA
PRUEBA
1. Especificaciones
de la finalidad
2. Definición
del rasgo
3. Elaboración
de reactivos
4. Comprobación
y análisis de los
reactivos
5. Estructura de
la forma final
de la prueba
6. Estandarización
7. Análisis
técnico de la
prueba
1. FINALIDAD DE LA PRUEBA
• Determinar el contenido de la prueba y
• Su formato
¿para que fines servirá la prueba?
¿Qué grupos de sujetos serán
sometidos al examen?
 Respuesta libre
 Velocidad /poder
 Máxima/típica
 Papel y lápiz /ejecución
 Colectiva /individual
 Estructurada / proyectivas
2. DEFINICION DEL RASGO
• En el caso de las pruebas psicológicas deberá de
definir de modo tan explicito como sea posible el
rasgo que se medirá.
• A continuación tendrá que indicar las conductas
a través de las cuales se manifestará el rasgo, es
decir que describirá las conductas observables,
las habilidades o las aptitudes que sean
indicadoras del rasgo que se medirá
3. ELABORACION DE REACTIVOS
• En la construcción de cualquier prueba existen
una serie de reglas que facilitan la redacción de
los items (Navas, 2001):
Escribir en forma clara, precisa y simple
Expresar una única idea por item
Evitar expresiones del tipo “ninguna es valida” o
“todas son validas”
¿Qué es un item?
• Es la unidad básica que configura el material o
contenido de un instrumento de medición
• Comprende la pregunta y la respuesta. La
pregunta es una situación problema a la que el
sujeto ha de dar una sola respuesta.
¿Por qué son importantes?
Porque el test tiene como finalidad medir una
variable cuyos resultados sirven de apoyo para
obtener conclusiones
Ejemplo:
Reactivo Rasgo que valora Test
“actúa de manera
nerviosa e inestable”
Estabilidad emocional perfil e inventario de
personalidad
La letra que sigue es:
xgwhviuj
Razonamiento Psicología Industrial de
Venezuela (PIV)
“me pongo nervioso (a)
y preocupado (a)
cuando tengo que salir
de casa para hacer un
viaje corto
Miedos Inventario multifasico
de la personalidad de
Minessota (MMPI-2)
4. ANALSIS DE LOS REACTIVOS
Es el estudio de los items para conocer sus
propiedades estadísticas y como se relacionan
con las propiedades estadísticas del test.
Esta relación es directamente proporcional, ya
que existe una relación directa entre los estudios
estadísticos de los items y los estudios del
puntaje total.
ANALISIS DE LOS RECTIVOS
• Son tres los indicadores que se utilizan para
describir las características psicométricas de los
reactivos de un test objetivo:
Su nivel de dificultad
Su poder de discriminación
 funcionamiento de sus distractores
Partes de un item /Pruebas de
conocimiento, habilidades
Enunciado:
Frase en forma
afirmativa que
presenta la situación
que debe ser
respondida o
resuelta
Clave:
La opción que se
considera responde
adecuadamente el
enunciado. Es la
respuesta correcta
Distractores:
Opciones que se
consideran
respuestas posibles
al enunciado. Son
respuestas
incorrectas
Tipos de análisis de items
Se puede comprobar estadísticamente, el grado en
que un item es un buen medidor del rasgo de
interés.
Índice de dificultad: cuantificar el grado de
dificultad (pruebas de rendimiento/ ejecución
máxima)
Índice de discriminación: es la amplitud con la
que el reactivo mide lo que debe medir
Procedimiento para obtener el índice de
dificultad y el índice de discriminación
1. Elaborar matriz de calificaciones de cada uno
de los examinados:
Items/
sujetos
1 2 3 4 5 Total
1 1 1 1 1 0 4
2 0 1 1 1 0 3
3 1 1 1 0 0 3
4 1 0 0 1 0 2
Procedimiento para obtener el índice de
dificultad y el índice de discriminación
2. Dividir a los examinados en tres grupos según
sus calificaciones en la prueba como un todo:
Up= un grupo superior formado por el 27% que
obtuvo las calificaciones mas altas
Lp= un grupo inferior compuesto por el 27% que
tuvo las calificaciones mas bajas
y el 46% restante incluido en el grupo intermedio
INDICE DE DIFICULTAD DEL ITEM
• Se entiende como la proporción de personas que
responden correctamente a un reactivo de una
prueba.
• Símbolo “p”
p= Up+Lp
U+L
# total de
personas en
los grupos
superior e
inferior
INDICE DE DISCRIMINACION DEL ITEM
• Capacidad del test para diferenciar entre sujetos
que puntúan alto de aquellos que puntúan bajo
en la variable medida. Es decir, si un sujeto
contiene un nivel alto en la variable debe
puntuar alto y si tiene un nivel bajo en la
variable puntúa bajo
• Símbolo “D”
D= Up-Lp
U
Ejemplo:
• Suponga que 50 personas presentan una prueba
• Los grupos superior e inferior pueden formarse
con el 27%
.27x50=14
U=14
L=14
Ejemplo:
• Analizar Reactivo A:
12 personas del grupo superior y 7 del grupo
inferior pasan el reactivo:
Up=12
Lp=7
Ejemplo:
• Aplicar formula
p=12+7 =19/28= 0.68
14+14
D= 12-7 = 5/14= 0.36
14
Interpretación
Muy fácil Por encima de 0.75
Fácil Entre 0.55-0.74
Normal Entre 0.45-0.54
Difícil Entre 0.25-0.44
Muy difícil Por debajo de 0.25
Dificultad
Discriminación
Muy bien Igual o mayor de 0.4
Bien Entre 0.3 y 0.39
Poco Entre 0.20 y 0.29
Limite, debe
mejorar
0.10 y 0.19
Carece de
utilidad
Menor de 0.10
CONCLUSIONES
• El índice mas importante es el poder
discriminativo de los reactivos.
• Si el test y el item miden el mismo constructo lo
esperable es que los sujetos con alta puntuación
en el test tiendan a responder correctamente ( o
en la misma dirección) al ítem
5. ESTRUCTURA DE LA FORMA FINAL DE
LA PRUEBA
• Implica preparar la o las formas finales de la
prueba
• Los resultados del análisis de reactivos se
utilizan para seleccionar reactivos que
proporcionen mejor discriminación, tengan la
dificultad apropiada y no posean ambigüedades
ni alternativas deficientes
• Después de efectuar los cambios pertinentes se
imprime la prueba.
6. ESTANDARIZACION
• Toda prueba estandarizada tiene instrucciones
estandar de aplicación y calificación que deben
seguirse estrictamente, sin dejar lugar a
interpretación personal
• La estandarización incluye aplicar la prueba a
una muestra grande de personas (muestra de
estandarización) seleccionada como
representante de la población meta a la que esta
destinada la prueba.
6. ESTANDARIZACION
• Su principal propósito es determinar la distribución
de puntuaciones crudas en la muestra de
estandarización. Las calificaciones crudas obtenidas
se transforman en calificaciones derivadas
(normas).
• Los principales tipos de normas son equivalentes de
edad, grado, percentiles y calificaciones estándar.
• La mayoría de los manuales de pruebas contienen
tablas de normas con puntuaciones crudas y
calificaciones convertidas
7. ANALISIS TECNICO DE LA PRUEBA
• Antes de que una prueba pueda utilizarse con
seguridad debe obtenerse información acerca de:
CONFIABILIDAD VALIDEZ
Bibliografía
• Aragón, L. Evaluación psicológica. México:
Manual Moderno. 2011.
• Aiken, L. Tests Psicológicos y Evaluación. 11ª
Ed. Prentice Hall Mexico, 2003 (capítulo 2 y 4)

construccion-de-pruebas-psicologicas.pdf

  • 1.
  • 2.
    Psicometría • Conjunto detécnicas, métodos y teorías implicados en la medición de variables psicológica; estudia las propiedades métricas exigibles en las mediciones psicológicas y establece las bases para que éstas se realicen de manera adecuada. Origen en 1904.
  • 3.
    Teoría Clásica delas pruebas Diseño de instrumentos presenta importantes problemas: • No existe una sola aproximación a la medición de un constructo que sea universalmente aceptada • Las medidas psicológicas se basan en muestras limitadas de la conducta • La medida obtenida siempre tiene error • Falta de escalas con origen y unidades de medida bien definidas • Los constructos psicológicos no pueden definirse aisladamente en términos de definiciones operacionales únicamente
  • 4.
    Teoría Clásica delas pruebas A nivel empírico, si el instrumento está bien construido, esperaríamos que la puntuación obtenida por el sujeto reflejara lo mejor posible su puntuación verdadera y el error de medición fuer acercano a cero.
  • 5.
    Confiabilidad • Exactitud • Precisión •Estabilidad de la medida • Consistencia interna X=V+e
  • 6.
    Fuentes de erroren la medición • Selección de los reactivos • Aplicación de la prueba • Calificación Aleatorios No sistemáticos
  • 7.
    Fuentes de erroren la medición • Seguir procedimiento • Obtener coeficiente de confiablidad Sistemáticos
  • 8.
    Estabilidad de lamedida • Se refiere que al medir un atributo psicológico las medidas obtenidas sean estables en el tiempo • Test retest (r de Pearson) • Formas Equivalente de prueba
  • 9.
    Consistencia Interna • Reactivosde un instrumento consistentes entre sí en la forma en que evalúan el atributo • División por mitades (Spearman-Brown) • Consistencia interna de los reactivos individuales (Alfa de Cronbach)
  • 10.
    Validez • Un instrumentode medición es valido si hace aquello para lo que fue concebido a la validez de una prueba concierne a lo que esta mide , du eficacia y lo que podemos inferir de los puntajes obtenidos en la prueba. • Validez de constructo (validar teoría subyacente) • Validez de criterio (predicción criterio externo) • Validez de contenido (reactivos muestra representativa)
  • 11.
    Aspectos complementarios validezde contenido En la construcción de un instrumento • No incluya aspectos irrelevantes de la conducta de interés • Contenga todos los aspectos importantes que definen el dominio conductual
  • 12.
    Clasificación de laspruebas psicológicas • Interpretación • Forma de comparación • Finalidad • Modo de aplicación • Área de comportamiento que miden
  • 13.
    Conceptos claves • Normalización •Estandarización • Baremación
  • 14.
    Normas de puntación •Puntuaciones derivadas Típicas Decatipos Eneatipos Percentiles Edades escalares
  • 15.
    CONSIDERACIONES • Una pruebaes sólo uno de entre varios métodos posibles de obtención de la información deseada. • Existen pruebas publicadas disponibles en la mayoría de los campos de la actividad psicológica
  • 16.
    ETAPAS EN LACONSTRUCCION DE UNA PRUEBA 1. Especificaciones de la finalidad 2. Definición del rasgo 3. Elaboración de reactivos 4. Comprobación y análisis de los reactivos 5. Estructura de la forma final de la prueba 6. Estandarización 7. Análisis técnico de la prueba
  • 17.
    1. FINALIDAD DELA PRUEBA • Determinar el contenido de la prueba y • Su formato ¿para que fines servirá la prueba? ¿Qué grupos de sujetos serán sometidos al examen?  Respuesta libre  Velocidad /poder  Máxima/típica  Papel y lápiz /ejecución  Colectiva /individual  Estructurada / proyectivas
  • 18.
    2. DEFINICION DELRASGO • En el caso de las pruebas psicológicas deberá de definir de modo tan explicito como sea posible el rasgo que se medirá. • A continuación tendrá que indicar las conductas a través de las cuales se manifestará el rasgo, es decir que describirá las conductas observables, las habilidades o las aptitudes que sean indicadoras del rasgo que se medirá
  • 19.
    3. ELABORACION DEREACTIVOS • En la construcción de cualquier prueba existen una serie de reglas que facilitan la redacción de los items (Navas, 2001): Escribir en forma clara, precisa y simple Expresar una única idea por item Evitar expresiones del tipo “ninguna es valida” o “todas son validas”
  • 20.
    ¿Qué es unitem? • Es la unidad básica que configura el material o contenido de un instrumento de medición • Comprende la pregunta y la respuesta. La pregunta es una situación problema a la que el sujeto ha de dar una sola respuesta. ¿Por qué son importantes? Porque el test tiene como finalidad medir una variable cuyos resultados sirven de apoyo para obtener conclusiones
  • 21.
    Ejemplo: Reactivo Rasgo quevalora Test “actúa de manera nerviosa e inestable” Estabilidad emocional perfil e inventario de personalidad La letra que sigue es: xgwhviuj Razonamiento Psicología Industrial de Venezuela (PIV) “me pongo nervioso (a) y preocupado (a) cuando tengo que salir de casa para hacer un viaje corto Miedos Inventario multifasico de la personalidad de Minessota (MMPI-2)
  • 22.
    4. ANALSIS DELOS REACTIVOS Es el estudio de los items para conocer sus propiedades estadísticas y como se relacionan con las propiedades estadísticas del test. Esta relación es directamente proporcional, ya que existe una relación directa entre los estudios estadísticos de los items y los estudios del puntaje total.
  • 23.
    ANALISIS DE LOSRECTIVOS • Son tres los indicadores que se utilizan para describir las características psicométricas de los reactivos de un test objetivo: Su nivel de dificultad Su poder de discriminación  funcionamiento de sus distractores
  • 24.
    Partes de unitem /Pruebas de conocimiento, habilidades Enunciado: Frase en forma afirmativa que presenta la situación que debe ser respondida o resuelta Clave: La opción que se considera responde adecuadamente el enunciado. Es la respuesta correcta Distractores: Opciones que se consideran respuestas posibles al enunciado. Son respuestas incorrectas
  • 25.
    Tipos de análisisde items Se puede comprobar estadísticamente, el grado en que un item es un buen medidor del rasgo de interés. Índice de dificultad: cuantificar el grado de dificultad (pruebas de rendimiento/ ejecución máxima) Índice de discriminación: es la amplitud con la que el reactivo mide lo que debe medir
  • 26.
    Procedimiento para obtenerel índice de dificultad y el índice de discriminación 1. Elaborar matriz de calificaciones de cada uno de los examinados: Items/ sujetos 1 2 3 4 5 Total 1 1 1 1 1 0 4 2 0 1 1 1 0 3 3 1 1 1 0 0 3 4 1 0 0 1 0 2
  • 27.
    Procedimiento para obtenerel índice de dificultad y el índice de discriminación 2. Dividir a los examinados en tres grupos según sus calificaciones en la prueba como un todo: Up= un grupo superior formado por el 27% que obtuvo las calificaciones mas altas Lp= un grupo inferior compuesto por el 27% que tuvo las calificaciones mas bajas y el 46% restante incluido en el grupo intermedio
  • 28.
    INDICE DE DIFICULTADDEL ITEM • Se entiende como la proporción de personas que responden correctamente a un reactivo de una prueba. • Símbolo “p” p= Up+Lp U+L # total de personas en los grupos superior e inferior
  • 29.
    INDICE DE DISCRIMINACIONDEL ITEM • Capacidad del test para diferenciar entre sujetos que puntúan alto de aquellos que puntúan bajo en la variable medida. Es decir, si un sujeto contiene un nivel alto en la variable debe puntuar alto y si tiene un nivel bajo en la variable puntúa bajo • Símbolo “D” D= Up-Lp U
  • 30.
    Ejemplo: • Suponga que50 personas presentan una prueba • Los grupos superior e inferior pueden formarse con el 27% .27x50=14 U=14 L=14
  • 31.
    Ejemplo: • Analizar ReactivoA: 12 personas del grupo superior y 7 del grupo inferior pasan el reactivo: Up=12 Lp=7
  • 32.
    Ejemplo: • Aplicar formula p=12+7=19/28= 0.68 14+14 D= 12-7 = 5/14= 0.36 14
  • 33.
    Interpretación Muy fácil Porencima de 0.75 Fácil Entre 0.55-0.74 Normal Entre 0.45-0.54 Difícil Entre 0.25-0.44 Muy difícil Por debajo de 0.25 Dificultad Discriminación Muy bien Igual o mayor de 0.4 Bien Entre 0.3 y 0.39 Poco Entre 0.20 y 0.29 Limite, debe mejorar 0.10 y 0.19 Carece de utilidad Menor de 0.10
  • 34.
    CONCLUSIONES • El índicemas importante es el poder discriminativo de los reactivos. • Si el test y el item miden el mismo constructo lo esperable es que los sujetos con alta puntuación en el test tiendan a responder correctamente ( o en la misma dirección) al ítem
  • 35.
    5. ESTRUCTURA DELA FORMA FINAL DE LA PRUEBA • Implica preparar la o las formas finales de la prueba • Los resultados del análisis de reactivos se utilizan para seleccionar reactivos que proporcionen mejor discriminación, tengan la dificultad apropiada y no posean ambigüedades ni alternativas deficientes • Después de efectuar los cambios pertinentes se imprime la prueba.
  • 36.
    6. ESTANDARIZACION • Todaprueba estandarizada tiene instrucciones estandar de aplicación y calificación que deben seguirse estrictamente, sin dejar lugar a interpretación personal • La estandarización incluye aplicar la prueba a una muestra grande de personas (muestra de estandarización) seleccionada como representante de la población meta a la que esta destinada la prueba.
  • 37.
    6. ESTANDARIZACION • Suprincipal propósito es determinar la distribución de puntuaciones crudas en la muestra de estandarización. Las calificaciones crudas obtenidas se transforman en calificaciones derivadas (normas). • Los principales tipos de normas son equivalentes de edad, grado, percentiles y calificaciones estándar. • La mayoría de los manuales de pruebas contienen tablas de normas con puntuaciones crudas y calificaciones convertidas
  • 38.
    7. ANALISIS TECNICODE LA PRUEBA • Antes de que una prueba pueda utilizarse con seguridad debe obtenerse información acerca de: CONFIABILIDAD VALIDEZ
  • 39.
    Bibliografía • Aragón, L.Evaluación psicológica. México: Manual Moderno. 2011. • Aiken, L. Tests Psicológicos y Evaluación. 11ª Ed. Prentice Hall Mexico, 2003 (capítulo 2 y 4)