1. Tipo de evaluaciones
Exámenes orales
En la tabla 1.1 se enuncian las ventajas y limitaciones principales de
los exámenes orales. Cabe notar que ellos pueden dar una imagen completa de
la rpofundidad y alcance de los conocimientos del alumno. Empero, para
lograrlo se debe destinar el tiempo suficiente al exámen, y es necesario
preparar detenidamente las preguntas con anticipación con el fin de obtener
una muestra adecuada de las áreas que cubren. En ciertas esferas de estudio
-especialmente en elocución, lengua extranjera y teatro- el aprendizaje
puede ser evaluado eficazmente con los exámenes orales. La limitación más
significativa del exámen oral es que lleva demasiado tiempo administrarlo en
las clases típicas de 25 a 40 alumnos, cuando cada exámen absorbe de media
hora a una hora de duración.
Por otra parte, cuando no se hace demasiado hincapié en la medición, la
interrogación oral es extremadamente valiosa como recurso educativo y como
medio para estimular la participación del alumno en la discusión de la
clase.
- Condiciones de exámen
Las condiciones del exámen afectan la confiabilidad, pues un ambiente
deficiente, donde intervengan algunos factores como mala iluminación,
ventilación o calor, puede influir en la confiabilidad al aumentar el error
humano.
- Objetividad de los puntajes
Si bien una prueba puede ser en sí misma confiable, el error o
subjetividad en la calificación reduce su confiabilidad. Cuanto más objetiva
sea una prueba, tanto más confiable serán los puntajes, ya que la objetividad
en una prueba o test elimina la opinión personal o juicio del que evalúa.
Las pruebas objetivas tienen los puntajes más objetivos, y por tanto, la mayor
confiabilidad; no obstante algunas otras formas de tests o pruebas mejorarán
cuando se preparen algunas claves de puntajes precisas y se sigan
cuidadosamente.
UTILIDAD
La utilidad es la tercera cualidad deseable de las pruebas o los tests.
Para que una prueba tenga un grado de aplicabilidad alto, debe ser:
- fácil de administrar
- fácil de calificar
- económica (tanto al tiempo del docente como al material
utilizado)
- debe tener un buen formato
- normas significativas
La aplicabilidad de una prueba realizada por un docente puede asegurarse
observando las siguientes reglas:
1- La prueba o test debe ser escrita a máquina y reproducida para que
cada alumno tenga una copia. Las copias deben estar escritas en letra clara
y grande, en papel de buena calidad, y los estencils siempre deben controlarse
antes de ser reproducidos
2- Las instrucciones para el alumno deben acompañar cada parte de la
prueba. Estas instrucciones debes ser explícitas, indicar el modo de
responder, y simples para que todos las entiendan.
3- La prueba debe ser diseñada como para que se adapte a los lim1ites de
tiempo de la hora de clase. Con frecuencia, los docentes elaboran las pruebas
demasiado largas o demasiado cortas. La prueba que es demasiado larga frusta
al alumno; la que es demasiado corta puede ofrecer una muestra inadecuada del
aprendizaje.
4- La prueba debe planearse para que pueda calificarse rapidamente. En
2. los grados superiores de la escuela primaria y en la secundaria, se pueden
usar hojas para la respuesta, y las claves preparadas y las grillas para
corregir o calificar facilitarán la tarea.
5- Al planear la prueba se debe cuidar que sea económica en cuanto al
tiempo requerido para su construcción, reproducción y calificación. La
docencia requiere mucho tiempo, y aunqeu la evaluación del aprendizaje es un
elemento esencial en la enseñanza, no debe tornarse tan absorbente como para
restar tiempo que se necesita para planear las clases.
6- Las normas para la adecuación de los alumnos deben establecerse en
virtud de los resultados de las pruebas. Los docentes que registraron las
actuaciones de los grupos anteriores en las pruebas específicas o los ítems
de ellas tiene una escala para comparar la actuación de las clases presentes.
Esas comparaciones son preferibles al juicio subjetivo del docente para
determinar la calidad de la actuación en una prueba realizada en clase.
EVALUACION DE LOS DISTINTOS TIPOS DE PRUEBA
Durante todo el análisis de los diversos tipos de pruebas, hemos señalado
que cada funciona mejor para ciertos tipos de objetivos educacionales y que la
elección de una forma incorrecta para servir los objetivos fijados
disminuirá, en el mejor caso, la validez o invalidará totalmente la
medición. Por lo tanto, la selección del instrumento de medición, así como
la evaluación de los resultados, debe relacionarse directamente con los
objetivos educacionales.
En la lista siguiente, repasamos los principales tipos de test con
referencia a las categorías de objetivos educacionales que generalmente miden
mejor. La enumeración que sigue debe tomarse sólo como una guía general,
porque, por algún motivo muy específico o especial, algún docente puede no
adherirse a ella.
1. Las pruebas objetivas funcionan mejor en los niveles del conocimiento,
la comprensión y la aplicación del área cognoscitiva, dentro de los cuales
el tipo de pruebas para completar está restringido al primer nivel y el de
la selección múltiple cuenta con la mayor versatilidad y cubre un extenso
grado de amplitud. Las ventajas especiales de la forma objetiva son que
permite un muestreo evaluativo de un extenso dominio de contenido y que puede
depurarse mediante un análisis de los ítems para volverse a usar con los
mismos grupos o con otros.
2. Los exámenes de actuación son de mayor utilidad en las categorías
de aplicación, análisis y síntesis del área cognoscitiva y en los campos
de habilidad motriz del área psicomotriz. Para que tengan validez deben
basarse en un esmerado análisis de la tarea o el producto. Estos exámenes
tienen la ventaja especial de permitir la evaluación de la actuación del
alumno en situaciones que se asemejan estrechamente o que se relacionan con la
actuación en la vida real.
3. Los exámenes o pruebas de ensayo o redacción son sumamente útiles
para evaluar las cuatro categorías superiores del área cognoscitiva. En
especial, sirven para evaluar las categorías de síntesis y evaluación, y
también diversos niveles del área afectiva. Un problema especial de exámen
de ensayo o redacción es su falta de confiabilidad debida a la calificación
inconsistente -problema que puede vencerse parcialmente usando el sistema de
calificación por puntos o porcentajes.
4. Los exámenes orales funcionen esencialmente en los mismos dominios de
medición que los exámenes de ensayo o redacción, pero tienen especial
importancia en áreas tematicas tales como elocución, idioma extranjero y
dramatizaciones. Sin el registro escrito como el que se provee para el
exámen de ensayo, los exámenes orales pueden adolecer de una falta de
confiabilidad aún mayor. No obstante, el planteamiento cuidadoso y las
respuestas registradas pueden contribuir a aliviar el problema.
Validez de las formas de las pruebas
De las tres características de los instrumentos de medición, la validez
3. es la más importante; por lo tanto, reseñaremos brevemente la validez de
cada forma de prueba en las siguientes páginas.
Pruebas objetivas
La ventaja principal de las pruebas objetivas es que pueden depurarse y
es posible volver a usar los ítems, de manera que las pruebas elaboradas
por el docente que estén bien construídas pueden resultar muy válidas.
Además, la adaptación de estas pruebas a los objetivos del docente quizá
los haga más valiosos para sus fines de lo que sería posible con los
instrumentos estandarizados.
El mejor medio para determinar la validez de las pruebas objetivas es
comparando su contenido con la tabla de especificaciones y con el esquema del
curso. A veces también resulta provechoso que los colegas examinen la
prueba y presenten sugerencias para mejorarla. También los alumnos pueden
hacer sugerencias valiosas, especialmente cuando ayudan a identificar los
ítems ambiguos o difíciles de entender. Como los alumnos a menudo escriben
comentarios a continuación de los ítems que les resultan confusos, es
conveniente encargarse de revisar o descartar los ítems sobre los cuales
varios alumnos hicieron comentarios.
Otro paso importante en la evaluación de las pruebas objetivas es el
análisis de los ítems, mediante un control de la validez interna, que
determina el porcentaje de alumnos del grupo superior y el procentaje de
alumnos del grupo inferior que respondió cada ítem correctamente. Además
de indicar el aporte de cada ítem en la validez total, un análisis de este
tipo también informa de la dificultad de cada ítem y la discriminación de
cada alumno entre los buenos y los malos. Si el porcentaje de alumnos buenos
que responde correctamente un ítem es más alto que el de los malos alumnos,
el ítem demuestra un discriminación positiva.
Como el análisis de los ítems insume tiempo, no debe relizarse en pruebas
preparadas descuidadamente. Además, para que sea útil, probablemente no
debe haber menos de 100 hojas de exámenes. Cuando los alumnos que rinden el
exámen son menos de 100 se puede acumular el número necesario de exámenes
a través de varias aplicaciones durante un período de tiempo.
Para las pruebas elaboradas por el docente, el siguiente procedimiento
simple ofrece una muestra adecuada para determinar la calidad y dificultad de
los ítems.
1. Seleccione del 20 al 30 por ciento de los exámenes superiores (los
mejores) y del 20 al 30 por ciento de los inferiores.
2. Trabajando con un grupo a la vez, ubique las hojas en una mesa grande
y superpóngalas (traslápelas), de manera que solo sea visible la
columna de las respuestas en cada hoja.
3. Cuente el número de respuestas correctas en cada ítem y conviértalo
en porcentajes, los cuales se anotan en la hoja de registro. Por
ejemplo, si de 20 alumnos del grupo superior 18 respondieron el ítem
correctamente, debe figurar el 90% en la hoja de registro de ese ítem.
4. Después de contar las respuestas correctas en todos los ítems del
grupo superior e inferior, el valor del ítem puede determinarse
calculando el porcentaje de los dos grupos que respondieron
correctamente. Por ejemplo, cuando de 40 alumnos, 32 acertaron en un
ítem, el nivel de dificultad es del 80 por ciento.
5. Calcule la discriminación de cada ítem usando la siguiente formula:
S - I
D= ------
N
en donde:
D= índice del poder discriminativo del ítem.
S= número de alumnos del grupo superior que respondieron al
ítem correctamente.
I= número de alumnos del nivel inferior que respondieron al
ítem correctamente.
N= número de alumnos de cada grupo.
4. El índice de discriminación variará de +1,00 a-1,00, y sólo los
ítems que tienen puntajes positivos serán conservados o retenidos. Un
índice de discriminación superior a +0,40 es el deseable.
Los ítems demasiado fáciles, que todos los alumnos respondieron
correctamente, deben descartarse, si bien algunos pueden retenerse para
usarlos al comienzo de futuras pruebas con el fin de establecer una buena
relación psicológica con los alumnos que temen los exámenes objetivos.
Otros ítems que deben descartarse son los que no distinguen entre los buenos
y los malos o los que tienen discriminación negativa, es decir, aquellos en
que los peores alumnos obtienen más altos que los mejores.
En el caso de los ítems con respuesta de selección múltiple, el
análisis debe incluir un registro del número de alumnos que eligieron cada
alternativa para así obtener una evidencia referente a la verosimilitud de
las elecciones incorrectas. Los ítems que discriminan adecuadamente pero
que tienen factores de distracción endebles a menudo pueden volverse a
escribir y reservarse para el futuro. Cuando los ítems se escriben por
separado en tarjetas para fichar, la información del análisis de los mismos
debe registrarse en las tarjetas para consultarlas en el futuro.
Pruebas de ensayo o redacción
Las pruebas de ensayo no pueden depurarse ni estandarizarse como las
pruebas objetivas, pero es posible evaluarlas para determinar si cumplen con
la función de medición para la cual fueron diseñadas. Estas pruebas
constituyen la medida más válida de algunos objetivos, tales como la
habilidad del alumno para expresarse, la aplicación del conocimiento en la
solución de problemas, y el análisis de relaciones de causa y efecto. Una
vez administrada la prueba, las preguntas pueden volver a examinarse para
determinar si realmente midieron objetivos como los mencionados arriba o si
midieron sólo las clases de conocimiento que se podrían medir mejor
objetivamente.
Aunque es una buena medida incluir en una prueba de ensayo varias
preguntas del tipo de respuesta reducida, así como del de respuesta amplia,
para aprovechar la muestra de la prueba y del grado de confiabilidad, si las
preguntas no están preparadas con cuidado, dicha medida puede concentrar la
medición en los objetivos de comportamiento, que se adaptan mejor a la
medición del tipo objetivo.
Si se construyó un esquema y se compara la prueba terminada con los
objetivos y el contenido enumerado en el esquema, la medición probablemente
se limitará en especial a las áreas más adecuadas para las pruebas de
ensayo. Aquí también es provechoso someter una prueba de ensayo a la
evaluación crítica de los propios colegas para asgurarse de que las
preguntas estén formuladas con claridad, de manera que se pueda esperar que
los alumnos ajusten sus respuestas a las áreas fijadas.
Pruebas de actuación
Los dos elementos más valiosos de comparación cuando evaluamos las
pruebas de actuación son el análisis de la tarea y la tabla de
especificaciones. La comparación de las pruebas terminadas con esos dos
esquemas contribuirá a asegurar validez, así como a impedir que se
sobrecarguen las pruebas con los ítems que midan sólo uno o dos aspectos
del trabajo o uno o dos de los objetivos de actuación.
Como la medición de la actuación de refiere primordialmente a cómo un
alumno aplica sus conocimientos en el desempeño de una tarea práctica, la
indicación fundamental de la validez del instrumento de medición será
predictiva, a través de un seguimiento de los alumnos y una correlación del
éxito en la tarea con las notas de la clase.
Exámenes orales
Si un exámen oral es tan largo como para necesitar un esquema, el exámen
terminado puede comparase con el esquema. Por lo contrario, el exámen
probablemente acentúe los fines pedagógicos más que los de medición, y
puede evaluarse en función de su relativa eficiencia pedagógica y no de la
medición que resulta.
5. Confiabilidad de las formas de la prueba
Aunque la confiabilidad de una prueba es menos importante que su validez,
es de importancia suficiente como para hacer aquí una breve revisión. Como
señaláramos anteriormente, las formas de pruebas diferentes varían en
cuanto a la consistencia o confiabilidad. Generalmente pueden clasificarse
en orden de confiabilidad como sigue:
1. Pruebas objetivas
2. Pruebas de actuación
3. Pruebas de ensayo
4. Pruebas orales
Así, la más confiable es la prueba objetiva, y la menos confiable es la
prueba oral. Sin embargo, este hecho no le debe impedir al docente
seleccionar una forma menos confiable si se adecua mejor a sus objetivos, ya
que tan sólo le indica que debe tomar recaudos adicionales para garantizar
el nivel de confiabilidad posible más alto en cualquier forma de prueba que
elija.
6. Confiabilidad de las formas de la prueba
Aunque la confiabilidad de una prueba es menos importante que su validez,
es de importancia suficiente como para hacer aquí una breve revisión. Como
señaláramos anteriormente, las formas de pruebas diferentes varían en
cuanto a la consistencia o confiabilidad. Generalmente pueden clasificarse
en orden de confiabilidad como sigue:
1. Pruebas objetivas
2. Pruebas de actuación
3. Pruebas de ensayo
4. Pruebas orales
Así, la más confiable es la prueba objetiva, y la menos confiable es la
prueba oral. Sin embargo, este hecho no le debe impedir al docente
seleccionar una forma menos confiable si se adecua mejor a sus objetivos, ya
que tan sólo le indica que debe tomar recaudos adicionales para garantizar
el nivel de confiabilidad posible más alto en cualquier forma de prueba que
elija.