2. Validez y confiabilidad de un instrumento de evaluación
educacional
La validez se refiere al grado de precisión con que un instrumento
evalúa lo que pretende evaluar. No se debe decir, simplemente,
que una medición es “válida” o que no lo es, porque la validez de
las evaluaciones educativas nunca es absoluta, sino relativa. Unas
evaluaciones son más válidas que otras, pero ninguna de las que el
educador aplica a sus estudiantes es válida por completo
La confiabilidad es el grado de precisión con que un instrumento
evalúa lo que declara que va a evaluar.
La confiabilidad tiene directa relación con las competencias que se
quieren evaluar, las que deben estar en concordancia con los
niveles de exigencia establecidos en la asignatura, la que a su vez
corresponde al nivel más específico de concreción del curriculum.
3. CRITERIOS PARA OBTENER LA VALIDEZ
1. Evaluar lo que corresponde
Se debe asegurar que un examen incluya solamente los factores
que se relacionan con las competencias de aprendizaje que se
quieren validar.
En este sentido, hay un factores que pueden resultar importantes
para el proceso pedagógico, como la asistencia, la disciplina, la
atención en clases, la actitud y las relaciones interpersonales,
pero que sin embargo no pueden ser tomados directamente
como elementos integrantes de una calificación.
Situación similar ocurre con respecto a temas como la ortografía
y la caligrafía del sujeto evaluado, que si bien es cierto, son parte
de su formación intelectual y académica, no necesariamente
pueden constituir indicadores de referencia para adjudicar
puntajes, a menos que, por ejemplo, por causas de una mala
redacción, no se logre entender cuál es la respuesta que se
entrega ante una determinada pregunta.
4. 2. Evitar la deducción de la respuesta correcta
Para que un instrumento de evaluación cumpla
con su rol de evaluar claramente, debe evitar
aquellos factores externos, como por ejemplo,
los que se encuentran en formulaciones
confusas de las preguntas o reactivos.
Si las respuestas dadas a un determinado ítem
se estructuran con referencia a factores ajenos
a la materia tratada en el curso como, por
ejemplo, cuando existe una “clave” gramatical
que revela la respuesta para una pregunta o un
examen determinado, entonces dicho ítem no
evalúa lo que pretende evaluar
5. 3. Utilizar un lenguaje preciso y directo
Se trata de que las respuestas entregadas den cuenta de los
aprendizajes de quién responde y no de otros factores. Por ello, el
lenguaje que se utiliza debe ser claro y preciso.
El vocabulario del ítem debe ser comprensible para todos los
estudiantes examinados
Definir un problema específico que exige una respuesta exacta
No hacer uso de dominios de memorización repetitiva
Privilegiar aprendizajes relevantes
Evitar el uso de trucos y trampas
Diferenciar el hecho de la opinión
6. 4. Establecer apropiados niveles de dificultad
De lo que se trata es que dichas preguntas y actividades solamente
puedan ser respondidas por los estudiantes que hayan logrado
asimilar más los contenidos de enseñanza, de tal modo que
podamos confiar que una calificación refleja realmente un juicio de
valor acertado sobre las competencias de aprendizajes de quién ha
vivenciado el proceso de enseñanza.
Los procesos pedagógicos deben desarrollar en los estudiantes
competencias, que se expresan como capacidades a nivel
cognitivo, procedimental y actitudinal.
Los niveles de dificultad que debe poseer un instrumento de
evaluación deben ser coherentes con los niveles de profundización
de los procesos de enseñanza y aprendizaje logrados en el aula. Es
decir, debe haber una correspondencia de continuidad entre lo que
se desarrolla y lo que se solicita
7. 5. Gestionar adecuadamente la acción evaluativa
Es conveniente asegurar que el tiempo disponible es suficiente para
desarrollar la evaluación. No todos los estudiantes tienen el mismo ritmo de
respuesta o redacción, por ello es preciso que no sea la falta de tiempo una
variable decisiva, ya que ello afectará la validez del proceso.
Generalmente, las instrucciones orales que se dan antes de comenzar un
examen deben hacerse a la totalidad de los estudiantes que se examinan,
dando lugar a breves preguntas sobre la manera de proceder antes del
comienzo de aquél. De esta manera, todos los estudiantes trabajan en
condiciones iguales. Si después se les da a algunos explicaciones privadas
para “aclarar un punto”, éstos tendrán una ventaja que, indudablemente, los
otros no poseen.
El evaluador debe estar seguro que las condiciones físicas del aula sean
propicias para lograr los óptimos resultados que cada estudiante es capaz
de brindar. Hasta donde sea posible, la luz, la temperatura y el espacio
deben ser adecuados para proporcionar un ambiente favorable.
8. Criterios para optimizar la confiabilidad de un
instrumento evaluativo
1. Estabilidad de un instrumento evaluativo
La estabilidad significa la aspiración a una línea de continuidad
en los resultados de las evaluaciones cuando un mismo
instrumento se aplica repetidamente a un mismo grupo.
Desde una perspectiva cuantitativa, la estabilidad descansa en la
ilusión estadística de resultados constantes, por ejemplo, en el
uso de test de entradas y uso de test posteriores (re-test), donde
se afirma que “si un examen da resultados confiables, entonces
se espera que la persona que tuvo el puntaje más alto en la
primera aplicación de una prueba, lo tendrá en todas las
aplicaciones posteriores de la misma, o sea, el que logró el
segundo rango en todas las aplicaciones, y así por el estilo con
todas las posiciones de rango. Nuestra meta es lograr un
coeficiente de correlación que sea lo más alto posible. Donde el
coeficiente es alto, la confiabilidad también es alta
9. 2. Claridad
Se refiere a la precisión con que deben construirse el instrumento.
El primer ámbito de claridad y precisión está referido al lenguaje
con que se plantean las preguntas y las actividades solicitadas a los
estudiantes, de tal manera que el sujeto que es evaluado tenga
plena certeza sobre qué es lo que tiene que responder y cuál es la
competencia específica que se le solicita, tal como se ha revisado
en puntos anteriores.
El segundo ámbito de claridad tiene que ver con el puntaje otorgado
a cada pregunta o actividad, en términos ponderativos dentro del
evento evaluativo. Esto debe hacerse no sólo en términos
generales, sino también específicos, lo que quiere decir, que quién
responde, debe saber qué es lo que debe cumplir para llegar al
máximo puntaje otorgado a cada pregunta
10. 3. Apertura
Las pautas de corrección, que se hacen mención en el punto
anterior, son fundamentales, sin embargo, ello no implica, sobre
todo cuando utilizamos instrumentos evaluativos de corte
cualitativo, que sólo podamos tomar como elementos legítimos
aquellos que son concordantes con lo que tenemos en dicha pauta,
porque, por ejemplo, ¿qué pasa si un estudiante a través de
Internet complementa los contenidos de una determinada materia y
los integra a su respuesta? ¿deberíamos declarar nula esa parte de
la respuesta?
Por ello, un docente, que actué con criterios dialécticos, debiera
siempre considerar el elemento de apertura al mundo, de tal
manera que les otorgue a sus estudiantes la posibilidad de ampliar
sus conocimientos más allá de lo que él esta entregando, y ello
debiera reflejarse en la evaluación, dando validez a respuestas que
justamente den cuenta, fundamentadamente de ese fenómeno
11. 4. Diversidad
Las capacidades de los sujetos son distintas, por ello, no todos los
instrumentos de evaluación resultan propicios para todos los
sujetos evaluados. Algunos tienen mayor capacidad de redacción
que otros.
Un instrumento que combine diversos tipos de ítem, puede resultar
más adecuado que uno que sólo utiliza un tipo. La diversidad con
que se construye se evalúa, en este sentido, también puede ser un
factor importante de confiabilidad para validar los diversos tipos de
aprendizaje .