El documento analiza la evolución de la evaluación educativa desde las primeras pruebas individuales hasta los sistemas de evaluación estandarizada actuales. Señala que si bien los estándares pueden ser útiles para mejorar la calidad educativa, también conllevan riesgos como la estandarización excesiva o la falta de consideración de contextos culturales. Concluye enfatizando la necesidad de un enfoque crítico sobre los desafíos de los sistemas de evaluación por estándares.
Evaluar por estándares o la estandarización de la educación
1. Evaluar
por
estándares
o
la
estandarización
de
la
educación.
“Los educadores viven una presión casi implacable para demostrar su
eficacia. Desafortunadamente, el principal indicador con el cual la mayoría
de las comunidades evalúa el éxito del cuerpo docente de una escuela es
el desempeño de los estudiantes en pruebas estandarizadas.1”
La
evaluación
ha
recorrido
un
largo
camino
desde
aquella
primera
idea
de
valorar
lo
que
cada
alumno
era
capaz
de
demostrar
que
había
aprendido
y
que
podía
ser
observado
por
otros,
con
frecuencia,
por
medio
de
escalas
de
distinto
tipo
o
pruebas
de
lápiz
y
papel,
hasta
la
idea
de
una
evaluación
general
de
los
sistemas
educativos
que
hoy
domina
a
nivel
global,
y
que
busca
conocer
la
eficiencia
de
las
instituciones
escolares,
los
sistemas
educativos
o
los
curricula
escolares
como
medio
para
sentar
las
bases
del
progreso
y
el
desarrollo
de
los
países
en
la
sociedad
del
conocimiento.
También,
es
bien
conocido
que,
ese
dilatado
camino,
estuvo
lleno
de
teorías,
visiones
e
interpretaciones
diversas
acerca
de
lo
que
es
“evaluación”.
La
evaluación
estandarizada
individualizada
se
inicia
en
los
primeros
años
del
siglo
pasado
cuando
Alfred
Binet
publicó
el
primer
test
de
inteligencia,
creado
para
identificar
a
los
alumnos
que
tenían
dificultades
de
aprendizaje,
posteriormente
en
1967
Michel
Scriven
hace
una
gran
aportación
con
la
distinción
entre
“evaluación
sumativa,”
lo
que
un
alumno
o
un
sistema
es
capaz
de
producir
al
final
de
una
aplicación
o
desarrollo
de
un
programa
determinado,
y
“evaluación
formativa,”
centrada
en
recoger
información,
analizarla
y
valorarla
para
tomar
las
oportunas
decisiones
a
lo
largo
de
un
proceso,
con
el
fin
de
introducir
las
mejoras
necesarias.
Podríamos
decir
pues
que
la
evaluación,
a
lo
largo
de
ese
tiempo,
se
ha
convertido
en
una
herramienta
cada
vez
más
imprescindible
para
alcanzar
la
mejora
y
la
calidad
de
la
educación.
También
es
importante
señalar
que,
en
la
última
década
del
siglo
pasado,
se
produjo
un
amplio
debate
sobre
la
educación
del
siglo
XXI
y,
en
consecuencia,
la
incorporación
a
los
sistemas
educativos
de
nuevos
planteamientos
tales
como
las
competencias
y
la
evaluación
por
estándares,
como
referente
y
medio
de
alcanzar
la
equiparación
y
comparabilidad
de
los
sistemas
educativos.
Estamos
pues
ante
un
contexto
de
profundas
transformaciones
producidas
como
efecto
de
la
globalización,
sin
olvidar,
los
importantes
avances
habidos
en
los
diferentes
ámbitos
del
saber,
especialmente
en
las
neurociencias
y
las
tecnologías
de
la
información
y
la
comunicación.
Todo
lo
cual
genera
una
honda
preocupación
ante
un
futuro
incierto
y
cambiante
que
nos
exige
un
esfuerzo
notable
para
dar
la
respuesta
educativa
que
la
sociedad
del
siglo
XXI
nos
exige
y
necesita
para
un
mundo
interdependiente.
1
Tomado y traducido de Educational Leadership, volumen 56, número 6, marzo de
1999, con autorización de ASCD (editores). El autor es profesor emérito de UCLA.W.
Citado por James Popham en “Por qué las pruebas estandarizadas no miden la calidad
educativa.” PREAL, 1999.
2. Como
respuesta
a
esas
preocupaciones
creció
la
necesidad
de
profundizar
en
el
conocimiento,
tanto
de
la
idoneidad
y
adecuación
de
los
curricula
escolares,
como
de
los
mecanismos
que
permitan
valorar
del
modo
más
objetivo
posible
los
resultados
académicos
de
los
sistemas
educativos.
Para
ello,
se
desarrolló
un
movimiento
a
nivel
internacional
de
evaluación
por
estándares,
como
respuesta
a
la
necesidad
de
superar
las
valoraciones
e
interpretaciones
particulares
de
los
resultados
escolares
y
para
el
establecimiento
de
escalas
y
modelos
valorativos
que
permitieran
hacer
comparaciones
de
los
resultados
escolares
obtenidos
a
todos
los
niveles:
regional,
nacional
e
internacional.
En
este
contexto
general,
queremos
centrar
esta
breve
reflexión
en
lo
que
está
significando
el
avance
de
las
reformas
educativas
basadas
en
competencias
y
estándares
de
rendimiento
escolar
que,
con
frecuencia,
están
más
preocupadas
por
responder
a
las
demandas
del
mercado
que
en
la
intención
de
dar
respuesta
a
un
derecho
fundamental.
Aunque
a
los
reformadores
se
les
suele
olvidar
lo
que
Sarason2
explica
tan
bien
en
su
ya
clásico
libro
sobre
el
fracaso
de
las
reformas
educativas,
y
más
aún
no
tienen
en
cuenta
lo
que
significan
estas
reformas,
pues
“a
fin
de
cuentas,
el
factor
determinante
de
cualquier
reforma
educativa
es
lo
que
los
profesores
saben,
creen,
son
capaces
de
hacer
y
están
dispuestos
a
hacer
con
ella”,
tal
y
como
afirma
Darling
Hammond
(2001,
p,
281).
Sin
embargo,
no
cabe
ninguna
duda
que
es
conveniente
y
necesario
que
existan
referentes
básicos
para
identificar
cuando
un
sistema
educativo
está
logrando
sus
propósitos
y
en
qué
medida
los
consigue.
Suponiendo,
claro
está,
que
los
propósitos
sean
justos
y
necesarios
para
cada
contexto
y
que
exista
coherencia
entre
lo
que
se
pretende
conseguir
y
los
procedimientos
utilizados
para
su
evaluación.
Todo
ello
con
la
finalidad
de
conocer
y
medir
los
resultados
y
efectos
que
producen
los
sistemas
educativos,
para
de
ese
modo
poder
aumentar
su
calidad
y
equidad.
“Yo
mantengo
-‐como
dice
Darling
Hammond
(2001,
277)-‐
que
los
estándares
referidos
al
aprendizaje
de
los
alumnos
tendrían
más
utilidad
si
se
emplearan
a
modo
de
señales
(y
no
como
camisas
de
fuerza)
para
desarrollar
el
currículum,
los
sistemas
de
evaluación
y
también
las
actividades
de
formación
del
profesorado,
así
como
para
canalizar
y
movilizar
los
recursos
del
sistema,
en
lugar
de
para
penalizar
a
alumnos
y
centros.”
Y
la
misma
autora,
citando
a
Gutiérrez
Christin,
“mantiene
que
los
estándares
externos
y
comunes
deberían
ocupar
un
50%
del
tiempo
lectivo
del
currículum,
dejando
el
50%
restante
para
que
los
profesores
desarrollen
una
enseñanza
basada
en
los
intereses
y
experiencias
de
los
alumnos,
tomando
en
cuenta
así
sus
necesidades
específicas
de
aprendizaje”
(2001,
298).
Aunque
no
entremos
en
el
análisis
de
conceptos,
funciones
y
utilidades
o
usos
de
las
evaluaciones
estandarizadas,
por
razones
obvias
de
espacio,
sin
embargo
parece
necesario
concluir
con
una
breve
alusión
a
algunos
de
los
límites
y
riesgos
que
pueden
acechar
a
estas
evaluaciones:
• Las
evaluaciones
estandarizadas
no
miden
la
calidad
de
los
sistemas
2
Sarason,
S.
(2003).
El
predecible
fracaso
de
la
reforma
educativa.
3. educativos.
En
este
sentido
Poham3
afirma:
“Pero
evaluar
la
calidad
educativa
mediante
el
uso
de
instrumentos
de
evaluación
erróneos
es
una
subversión
de
la
sensatez.
Aunque
los
educadores
necesitan
producir
evidencia
válida
respecto
a
su
eficacia,
las
pruebas
estandarizadas
de
logros
son
herramientas
equivocadas
para
esa
tarea.”
• Las
evaluaciones
estandarizadas
no
evalúan
aspectos
esenciales
de
la
educación
tales
como
el
desarrollo
de
las
emociones,
los
sentimientos,
las
actitudes
y
los
valores
éticos
y
morales.
Pues
aunque
incluyan
tareas
o
ítems
que
hagan
referencia
a
estas
cualidades
humanas,
es
bien
sabido
que
realmente
lo
que
miden
es
lo
que
piensa
el
alumnado
sobre
ellas
y
lo
que
entienden
que
deben
responder.
Pero
ello
no
garantiza
cuales
serán
las
actitudes,
los
valores,
las
emociones,
etc.,
que
pondrán
en
juego
en
su
vida
personal,
profesional
o
en
sus
relaciones
sociales.
• Existen
importantes
dificultades
teóricas,
técnicas,
metodológicas
y
de
aplicación
no
siempre
bien
resueltas.
“Más
aún,
hay
estudios
que
muestran
que
la
evaluación
puede
actuar
como
"motor"
o
"palanca"
de
los
cambios
curriculares,
a
condición
de
que
se
produzca
un
alineamiento
(alignment
)
entre
los
resultados
esperados
del
aprendizaje
del
alumno
tal
como
aparecen
reflejados
en
el
curriculum
y
lo
que
se
evalúa
mediante
las
pruebas
de
rendimiento
(Barnes,
Clark
y
Stephens,
2000;
Webb,
1997).”4
• Pero
el
gran
riesgo
de
la
evaluación
estandarizada
es
que
influya
en
la
estandarización
(homogeneización)
de
la
educación
sin
respetar
culturas
y
contextos,
por
ello
resulta
imprescindible
hacer
un
análisis
crítico
sobre
los
retos que deben afrontar los sistemas de evaluación por estándares, que según
Linn, L. y Herman, L.5 han de considerar, entre otros, los siguientes aspectos:
construir un consenso estatal y local, proporcionar estándares fuertes, alinear los
estándares con la evaluación y la enseñanza, asegurar mediciones precisas,
definir el progreso, establecer las implicancias (stakes), incluir a todos los
estudiantes, etc.
3
Popham, W. J. (1999). ¿ Por qué las pruebas estandarizadas no miden la calidad
educativa. Biblioteca PREAL.
4
Citado por
Coll, C., & Martín, E. (2006). Vigencia del debate curricular. Aprendizajes básicos,
competencias y estándares. Actas de la II Reunión del Comité Intergubernamental del Proyecto
Regional de Educación para América Latina y el Caribe (PRELAC). UNESCO-OREALC. Oficina
Regional de Educación para América Latina y el Caribe. Santiago de Chile, 11-13.
5
Linn, R., & Herman, J. (1997). La evaluación impulsada por estándares: problemas técnicos y
políticos en la medición del progreso de la escuela y los estudiantes. Grupo de Trabajo sobre
Estándares y Evaluación. PREAL.