1. TRES DEFINICIONES DE TEST (1)
El término test es una de las palabras más comunes que todos creemos comprender y por
ende, raramente tomamos el tiempo necesario para definirla de manera precisa. Definiremos un
test como un procedimiento sistemático para medir una muestra de conducta. Esta definición se
puede entender mejor tomando en consideración las implicaciones de los diversos componentes de
ella.
La frase “procedimiento sistemático” indica que una prueba se construye, se administra y
se califica, según reglas preestablecidas. Los reactivos se seleccionan sistemáticamente para que
se ajusten a las especificaciones de la prueba; se administran los mismos reactivos u otros
equivalentes a todas las personas y las instrucciones y límites de tiempo son iguales para todos los
que se someten a dichos tests, el uso de reglas predeterminadas para la evaluación (calificación) de
las respuestas asegura un acuerdo entre diferentes personas que tengan que Calificar la prueba.
La utilización de procedimientos estándar sirve para reducir al mínimo la influencia
posible de variables personales y situacionales irrelevantes, sobre las calificaciones del test. Por
ejemplo, las instrucciones sobre cómo responder cuando no se tenga seguridad respecto a la
respuesta apropiada hacen disminuir las diferencias individuales en las conductas de adivinación.
Otra razón para usar los procedimientos estándar es que permiten que las calificaciones dadas a
distintas personas se puedan comparar directamente. Si dos individuos responden a diferentes
reactivos o tienen distintas cantidades de tiempo para terminar las mismas pruebas, no será posible
comparar sus resultados. Así pues, el uso de procedimientos estándar permite las comparaciones
directas entre los individuos.
Un segundo término crucial es el de conducta. En el sentido más estricto un test mide sólo
la conducta registrada por la prueba, esto es, las respuestas dadas por una persona a los reactivos
de la prueba. Así, no medimos directamente a la persona, sino que inferimos sus características
(rasgos) a partir de sus respuestas dadas a los reactivos del test. Si las conductas que muestran
reflejan de modo adecuado el constructo que se mide, la prueba proporcionará información útil. Si
la conducta no refleja adecuadamente la característica subyacente, las inferencias que se hagan
resultarán erróneas.
En tercer lugar, un test contiene solamente una muestra de todos los reactivos posibles.
Ningún test es tan completo como para incluir todos los reactivos posibles que se pueden
desarrollar con el fin de medir la variable psicológica en cuestión, es decir, que puedan medir el
dominio conductual (un dominio conductual es la agrupación hipotética de todos los reactivos
posibles que cubren un área particular). Se nos ocurren excepciones, tales como las de un test de
adición que cubra todas las combinaciones posibles de dos números de un sólo dígito, pero estas
excepciones suelen ser raras y en general, triviales. Así, se puede considerar que cualquier test
dado es la mejor muestra de todos los reactivos posibles.
Puesto que el test contiene sólo una muestra de todos los reactivos posibles, se plantean
dos problemas.
En primer lugar, debemos asegurarnos de que los reactivos incluidos en la prueba sean una
muestra representativa de todos los reactivos posibles.
El segundo problema consiste en saber si una persona obtendría la misma calificación al responder
a una muestra diferente de reactivos extraída del mismo “dominio”.
En otras palabras, ¿obtendría la misma calificación en una forma equivalente de la prueba? El
primero es el problema de la validez, el segundo es el de la confiabilidad.
www.scribd.com/doc/20929213/4º-PP-EFICIENCIA