1. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA
Desde los Test hasta la Investigación Evaluativa Actual
(Síntesis)
Ricardo Alfonso Pinto García
Jesús Mauricio Vargas
Evaluación para la Integración de Recursos Educativos
Universidad de la Sabana
Maestría en Informática Educativa
Bogotá D.C.
Abril de 2014
2. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 2
Desde los Test hasta la Investigación Evaluativa actual. Un siglo, el XX, de Intenso
Desarrollo de la Evaluación en Educación
(Síntesis)
Introducción
El título de este documento corresponde al artículo escrito por Tomás Escudero (Escudero,
2003) en la Revista Electrónica de Investigación y Evaluación Educativa (RELIEVE), en el que
se describen las diferentes transformaciones que históricamente ha tenido el concepto de
evaluación, y que ahora tomamos como punto de partida para trazar una línea de tiempo, que
permita una síntesis de dichas transformaciones, analizando los diferentes planteamientos
formulados a través de la historia por reconocidos investigadores, y mostrando con alguna
aproximación, el impacto que en la educación actual han tenido.
El autor del artículo, para lograr una mejor distribución en el tiempo del impacto que el tema
de evaluación ha tenido sobre la educación, aborda los planteamientos de otros investigadores,
tales como Flor Cabrera (Cabrera, 1986)de la Universidad de Barcelona, quien toma tres grandes
épocas de la evaluación: Las precedentes (antes del siglo XX), la del nacimiento o época de
Tyler (1950 a 1960) y la posterior o de desarrollo (desde 1960). Así mismo, se permite incluir
dentro de los anteriores rangos de tiempo otros planteamientos como los del inglés Michel
Scriven y Daniel Stufflebeam(Stufflebeam D. , 2002)quienes prefieren dividir la historia de la
evaluación en seis épocas así: La de la reforma (1800 - 1900); la del testing (1900 - 1930); la de
Tyler (1930 - 1945); la de la inocencia (1946 - 1956); la de la expansión (1957 - 1972); y la de la
profesionalización (desde 1973). Pero también toma en cuenta a YvonnaLincoln y a
EgonGuba(Guba & Lyncoln, 2002)quienes destacan cuatro generaciones para la evaluación, a
saber: La primera es la de la medición (hasta 1925), la segunda generación o de la descripción, la
tercera o la del juicio y valoración y la última o la del enfoque paradigmático constructivista.
3. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 3
Como se trata de hacer un recuento histórico de los distintos enfoques que ha tenido la
práctica evaluativa en la educación, se muestran a continuación algunos de ellos.
1. Los precedentes
En la época del imperio chino hace más de tres mil años, la evaluación se usaba para valorar
y seleccionar a los altos funcionarios (Coffman, 1971). Pero el tratado más importante de la
antigüedad que introduce conceptos y planteamientos evaluadores, es el Tetrabiblos que se
atribuye a Claudio Ptolomeo en el año 50(McReynold, 1981).
En el Medioevo (Siglos V a siglo XV) se introducen los exámenes orales en presencia de
tribunales, para estudiantes aventajados de instituciones educativas y en el Renacimiento (siglos
XV a XVI) se siguen usando para estudiantes seleccionados previamente, aplicando el
procedimiento de observación para aplicar una evaluación que a todas luces era ventajosa y con
buenos resultados (Rodriguez & otros, 1995)
Los exámenes escritos comienzan a usarse en el siglo XVIII, para comprobar los méritos
individuales, a medida que aumentan los estudiantes y las instituciones educativas.
Para el siglo XIX se establecen los sistemas nacionales de educación y surge un sistema de
evaluación para temas específicos, con el fin de satisfacer las exigencias de la sociedad
jerarquizada y burocratizada. En 1845 en las escuelas de Boston, se comienzan a usar las pruebas
escritas tipo test, pero que responden más a una práctica rutinaria que a la aplicación de
evaluaciones con sustentos teóricos y fiables. Ya en 1987 aparece en Philadelphia un estudio
realizado por Joseph M. Rice,de un análisis comparativo en escuelas americanas sobre el valor
de la instrucción en el uso de la ortografía, mediante el uso de test (Mateo, 1993).
2. Los test
4. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 4
A finales del siglo XIX y principios del XX, la evaluación se verá condicionada a diversos
factores como el de las corrientes filosóficas, las teorías evolucionistas, el desarrollo de métodos
estadísticos y de la sociedad industrial, que conllevan a una actividad evaluativa llamada
"testing" cuyas características principales son: Medición, detección de diferencias individuales y
olvido de los objetivos educativos.
Uno de los trabajos más significativos a comienzos del siglo XX, que aplica este tipo de
evaluación es la obra del psicólogo norteamericano Edward Thorndike, que desarrolla la ley del
efecto(Gordon & R., 1989) y el aprendizaje por ensayo y error. Posteriormente luego de la
Primera Guerra Mundial (1920 a 1930), las pruebas y test sicológicos llegan a su auge que miden
multiplicidad de destrezas escolares con objetivos explícitos basados en la medida de la
inteligencia.
Este tipo de pruebas comenzaron a dejar de ser usadas a mitad del siglo XX, terminando así
la época denominada por Guba y Lincoln (1989) como la generación de la medida.
3. La gran reforma tyleriana
Antes de la revolución educativa promovida por el educador norteamericano Ralph Tyler en
1949, en Francia en los años veinte, comienza el acercamiento a la evaluación educativa, cuya
propuesta se cimentaba enformular criterios con objetivos claros, diversificación en las formas
de evaluar, unificación en los criterios de evaluación y valoración con procedimientos diversos.
Tyler acoge estos postulados y plantea una evaluación científica para mejorar la calidad de la
educación (Thiler, 1950). Su obra se sintetiza en exponer la idea del currículo en donde integra la
evaluación educativa, como medio para mirar cómo se han alcanzado los objetivos educativos
establecidos. Indica que una buena evaluación debe tener objetivos claros, determinación de las
situaciones donde se manifiestan las conductas, instrumentos apropiados de evaluación,
5. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 5
interpretación de las pruebas y fiabilidad y objetividad de las medidas tomadas. Para Tyler la
evaluación es un medio para informar sobre la eficacia del programa educativo y del
profesor.Según Guba y Lincoln, esta es la segunda generación de la evaluación.
Luego de la Segunda Guerra Mundial, se inicia la etapa de la inocencia, que según
Stufflebeam es la de la irresponsabilidad social, porque a pesar de tener tecnología que podía
apoyar los procesos educativos, y hay gran producción de materiales e instrumentos de
evaluación, la mejora en la enseñanza es casi nula por la carencia de planes coherentes de acción.
4. Desarrollo en los años sesenta
En este periodo se acogen algunos de los postulados de Tyler, y en los Estados Unidos en
1964 se aplica la evaluación no solo a los alumnos, si no a los programas y a la práctica
educativa mediante el Acta de Educación Primaria y Secundaria (ESEA).
A finales de los años sesenta y motivado por la recesión económica en el que se medía todo
gasto e inversión gubernamental, en los estados Unidos, aparece la era de la Accountability o
rendición de cuentas. Como resultado de esta tipo de evaluación de rendimiento de colegios
estatales y niveles en la calidad educativa, se desarrolla la "investigación evaluativa" como
metodología conceptual de la evaluación. Cronbach(Cronbach, 1963) analiza el concepto
sugiriendo lo siguiente: Asociar la evaluación a la toma de decisiones, mejorar los programas
evaluándolo mientras está en desarrollo, que los estudios evaluativos sen de tipo comparativo,
defender los estudios más analíticos, la evaluación no puede limitarse a unos pocos
instrumentos.
Posteriormente Michael Scrivenen 1967 (Scriven, 1967) aporta muchas consideraciones
sobre la evaluación educativa, indicando que debe separarse la metodología evaluativa de las
6. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 6
funciones evaluativas, la evaluación debe adoptarse en forma sumativa y formativa y clarifica los
conceptos de evaluación intrínseca y extrínseca.
Apartir de estos postulados y prácticas se desarrolla un nuevo concepto de evaluación, y es
la valoración del juicio como contenido de intrínseco en la evaluación, y que según Guba y
Lincoln se está ante la tercera generación de la evaluación.
A finales de los sesenta, algunos especialistas abordan el concepto de evaluación criterial,
tomado los postulados de Scriven y Cronbach, en cuanto que es el tipo de evaluación suministra
información real del sujeto respecto de los objetivos de enseñanza. En esta época se observa la
evaluación más orientada a los individuos y a la toma de decisiones sobre el instrumento y el
programa, bases de la investigación evaluativa.
5. Desde los años setenta.
En esta época aparece una explosión de modelos evaluativos, pero que se pueden reunir en
dos grandes grupos: Cuantitativos y cualitativos. En una primera época se destacan dos modelos
que son incluyentes, el que sigue la propuesta de Tyler o modelo de consecución de metas y el
modelo que sigue a Hammond(Hammond, 1983) o modelo de discrepancia. En una segunda
época se destacan los modelos alternativos que aparecen en la segunda mitad de los setenta
(1975), con sus principales expositores Stake, Guba y Lincoln, que desatacan la relación entre lo
evaluado con el evaluador.
Se destacan algunas características de todos los modelos de estos años, que diferencian entre
el mérito de la evaluación y el valor de la misma. Así mismo, se obtienen diferentes conceptos de
evaluación centrados en las decisiones, en los diferentes criterios, en la pluralidad de los
procesos, de los objetos, de la audiencia de las metodologías y de la apertura a los diferentes
7. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 7
contextos. Esta época también se ha denominado época de la profesionalización cuyos
exponentes son varios autores (Stufflebeam & Shinkfield, 1987).
6. Cuarta generación según Guba y Lincoln
La alternativa evaluadora que presentan Guba y Lincoln, a finales de los ochenta, también
fue llamada la cuarta generación, en la que pretenden superar las deficiencias de generaciones
anteriores. Sin embargo, esta alternativa los autores la denominan respondente y constructivista
porque integra el enfoque de Robert Stake (1975) que basa su accionar en las necesidades de los
clientes o estudiantes (stakeholders) y por otro lado, el constructivismo desarrollado bajo el
enfoque de Bertrand Russell.
Guba y Lincoln indican que el evaluador es responsable de algunas tareas que desarrolla
para la construcción del proceso educativo, con lo cual debe: Identificar a los implicados, resaltar
las preocupaciones de ellos, proporcionar una metodología en un contexto, preparar una agenda
de negociación sobre temas difíciles, ser mediador en la negociación y socializar la evaluación.
Ofrecen tres enfoques para juzgar la calidad de la evaluación: Paralelo (criterios de
confianza paralelos a los criterios comunes, que son: validez, fiabilidad y objetividad, sumados a
los nuevos que son: credibilidad, transferencia dependencia y confirmación), Proceso
hermenéutico (juzgar la calidad a partir del análisis del propio proceso) y autenticidad (incluyen
los siguientes criterios: Imparcialidad, autenticidad educativa, táctica y catalítica).
Finalmente, Guba y Lincoln definen los rasgos de la evaluación de cuarta generación: Es un
proceso sociopolítico, colaborativo, de enseñanza/aprendizaje, continuo y divergente, emergente,
impredecible y que crea realidad.
8. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 8
7. El nuevo impulso alrededor de Stufflebeam
Daniel Stufflebeam es un educador norteamericano que propuso el modelo CIPP (por sus
siglas en inglés, Context, Input, Process, Product), usado desde 1975 a 1988, que parte de
recomendaciones del Comité de Estándares para la Evaluación Educacional de USA, en el que
cualquier trabajo de investigación evaluativa debe ser: Útil, factible, apropiada y adecuada,
segura y precisa.
Stufflebeamdice que para evaluar la educación, se deben tomar los siguientes criterios
básicos: Las necesidades educativas, la equidad, la factibilidad y la excelencia, que aunado a las
siguientes recomendaciones en la investigación educativa, permiten cumplir con el objetivo: Que
los planes de evaluación cumplan con requerimientos de utilidad, factibilidad, legitimidad y
precisión; las entidades educativas deben examinarse acorde con principios de la sociedad; esas
entidades deben valorarse por el mérito y por el valor; la evaluación en general deben
relacionarse con sus deberes y responsabilidades; los estudios de evaluación debe incluir a los
profesores; esos estudios deben dar directrices para su mejora; se debe promover la
autoevaluación; y otras como evaluar el producto, apoyar la comunicación y la inclusión.
Por último, Stufflebeam en 1998 reconoce situaciones contradictorias entre lo que teoriza
con la realidad que se desarrolla en las instituciones, pero no acepta la rendición porque
considera que hay suficiente espacio para que otros modelos sean aplicados.
9. SÍNTESIS DEL ARTÍCULO DE INVESTIGACIÓN EVALUATIVA 9
Bibliografía
Cabrera, F. (1986). Proyecto docente sobre técnicas de medición y evaluación educativas.
Coffman, W. E. (1971). Essay examinations. Educational Measurement .
Cronbach, J. L. (1963). Teachers College record. Chicago.
Escudero, E. T. (2003). Desed los test hasta la investigación evaluativa actual. Un siglo, el XX, de intenso
desarrollo de la evaluación en educación. Revista Electrónica de Investigación y Evaluación Educativa, 9
(1), 11 - 43.
Gordon, B., & R., E. (1989). Teorías del Aprendizaje. Mexico D.F.: Hilgard.
Guba, E., & Lyncoln, Y. (2002). Paradigmas en competencia en la investigación cualitativa. Por los
rincones. Antología de métodos cualitativos .
Hammond, R. L. (1983). Evaluation at the local level. Educational evaluation: Theory and practice .
Mateo, J. (1993). La evaluación en el aula universitaria. Zaragoza: ICE - Universidad de Zaragoza.
McReynold, P. (1981). Advances in Psychological Assessment.San Francisco: Jossey Bass.
Rodriguez, T., & otros, y. (1995). Evaluación de los aprendizajes.Oviedo: ICE - Universidad de Oviedo.
Scriven, M. (1967). The methodology of evaluation. Perspectives of curriculum evaluation , 39 - 83.
Stufflebeam, D. (2002). Evaluación Sistémica: Guía teórica y práctica . Malaga, España: Paidos Iberica.
Stufflebeam, D. L., & Shinkfield, A. J. (1987). Evaluación sistemática. Guía teórica y práctica.Barcelona:
Paidos.
Thiler, R. (1950). Basic principles of Curriculum and Instruction. University of Chicago Press .