Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de
  inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
  http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm


                                                                Revista ELectrónica de Investigación
                                                                      y EValuación Educativa




    DESDE LOS TESTS HASTA LA INVESTIGACIÓN EVA-
   LUATIVA ACTUAL. UN SIGLO, EL XX, DE INTENSO DE-
     SARROLLO DE LA EVALUACIÓN EN EDUCACIÓN
  (From tests to current evaluative research. One century, the XXth, of in-
               tense development of evaluation in education)

                                                            por
    Articles record                                                                                     Ficha artículo
                                               Tomás Escudero Escorza
    About authors                                                                                      Sobre los autores
                                                (tescuder@posta.unizar.es)
    HTML format                                                                                        Formato HTML


                         Abstract                                                       Resumen
 This article presents a review and state of art about devel-
                                                                 Este artículo presenta una revisión crítica del desarrollo
 opment in educational evaluation in the XXth century. The
                                                                 histórico que ha tenido el ámbito de la evaluación educa-
 main theoretical proposals are commented
                                                                 tiva durante todo el siglo XX. Se analizan los principales
                                                                 propuestas teóricas planteadas.

                        Keywords                                                     Descriptores
 Evaluation, Evaluation Research, Evaluation Methods;           Evaluación, Investigación evaluativa, Métodos de Evalua-
 Formative Evaluation Summative Evaluation, Testing,            ción, Evaluación Formativa, Evaluación Sumativa, Test,
 Program Evaluation                                             Evaluación de Programas




Introducción                                                         El análisis la vamos a llevar a cabo basándo-
                                                                   nos en tres planteamientos que podríamos ta-
  En cualquier disciplina, la aproximación histó-                  char de clásicos en la reciente literatura sobre
rica suele ser una vía fundamental para compren-                   el tema y que usamos indistintamente, aunque
der su concepción, estatus, funciones, ámbito,                     no tenemos la pretensión de ofrecer un plan-
etc. Este hecho es especialmente evidente en el                    teamiento de síntesis, sino de utilización cabal
caso de la evaluación, pues se trata de una disci-                 de todos ellos, puesto que los tres plantea-
plina que ha sufrido profundas transformaciones                    mientos inciden sobre los mismos momentos y
conceptuales y funcionales a lo largo de la histo-                 movimientos claves.
ria y, sobre todo, a lo largo del siglo XX, en el
que principalmente ubicamos nuestro análisis. En                     Un planteamiento, quizás el más utilizado en
este sentido, la aproximación diacrónica al con-                   nuestro contexto (Mateo y otros, 1993; Her-
cepto resulta imprescindible.                                      nández, 1993), es el que ofrecen Madaus, Scri-


  Revista ELectrónica de Investigación y EValuación Educativa              [ www.uv.es/RELIEVE ]               pag. 11
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ven, Stufflebeam y otros autores, que en sus tra-             los procedimientos que se empleaban en la
bajos suelen establecer seis épocas, empezando                China imperial, hace más de tres mil años, para
su análisis desde el siglo XIX (Stufflebeam y                 seleccionar a los altos funcionarios. Otros auto-
Shinkfield, 1987; Madaus y otros, 1991). Nos                  res como Sundbery (1977) hablan de pasajes
hablan de: a) época de la reforma (1800-1900),                evaluadores en la Biblia, mientras Blanco
b) época de la eficiencia y del «testing» (1900-              (1994) se refiere a los exámenes de los profe-
1930), c) época de Tyler (1930-1945), d) época                sores griegos y romanos. Pero según McRey-
de la inocencia (1946-1956), e) época de la ex-               nold (1975), el tratado más importante de eva-
pansión (1957-1972) y f) época de la profesiona-              luación de la antigüedad es el Tetrabiblos, que
lización (desde 1973), que enlaza con la situa-               se atribuye a Ptolomeo. También Cicerón y
ción actual.                                                  San Agustín introducen en sus escritos concep-
                                                              tos y planteamientos evaluadores.
  Otros autores como Cabrera (1986) y Salvador
(1992) citan tres grandes épocas, tomando como                  En la Edad Media se introducen los exáme-
punto de referencia central la figura de Tyler en             nes en los medios universitarios con carácter
el segundo cuarto del Siglo XX. A la época de                 más formal. Hay que recordar los famosos
Tyler se le denomina de nacimiento, a las ante-               exámenes orales públicos en presencia de tri-
riores de precedentes o antecedentes y a la poste-            bunal, aunque sólo llegaban a los mismos los
rior de desarrollo.                                           que contaban con el visto bueno de sus profe-
                                                              sores, con lo que la posibilidad de fracaso era
  Guba y sus colaboradores, sobre todo Yvonna                 prácticamente inexistente. En el Renacimiento
Lyncoln, destacan distintas generaciones. Ahora               se siguen utilizando procedimientos selectivos
estaríamos en la cuarta (Guba y Lincoln, 1989),               y Huarte de San Juan, en su Examen de inge-
que según ellos se apoya en el enfoque paradig-               nios para las ciencias, defiende la observación
mático constructivista y en las necesidades de los            como procedimiento básico de la evaluación
«stakeholders» (demandantes e implicados en la                (Rodríguez y otros, 1995).
evaluación), como base para determinar la in-
formación que se necesita. La primera genera-                   En el siglo XVIII, a medida que aumenta la
ción es la de la medición, que llega hasta el pri-            demanda y el acceso a la educación, se acentúa
mer tercio de este siglo, la segunda es la de la              la necesidad de comprobación de los méritos
descripción y la tercera la del juicio o valoración.          individuales y las instituciones educativas van
                                                              elaborando e introduciendo normas sobre la
  Tras el análisis histórico, como complemento y              utilización de exámenes escritos (Gil, 1992).
como revisión de síntesis del mismo, ofrecemos
un sucinto resumen de los enfoques evaluativos                  Entrado el siglo XIX se establecen los siste-
más relevantes, de los distintos modelos y plan-              mas nacionales de educación y aparecen los
teamientos que, con mayor o menor fuerza, vie-                diplomas de graduación, tras la superación de
nen a nuestra mente cuando intentamos acotar lo               exámenes (exámenes del Estado). Según Max
que es hoy en día la investigación evaluativa en              Weber (Barbier, 1993), surge un sistema de
educación                                                     exámenes de comprobación de una preparación
                                                              específica, para satisfacer las necesidades de
1. Precedentes: Antes de los «tests» y de la                  una nueva sociedad jerárquica y burocratizada.
medición                                                      En los Estados Unidos, en 1845, Horace Mann
                                                              comienza a utilizar las primeras técnicas eva-
  Desde la antigüedad se han venido creando y                 luativas del tipo «tests» escritos, que se extien-
usando procedimientos instructivos en los que                 den a las escuelas de Boston, y que inician el
los profesores utilizaban referentes implícitos,              camino hacia referentes más objetivos y explí-
sin una teoría explícita de evaluación, para valo-            citos con relación a determinadas destrezas
rar y, sobre todo, diferenciar y seleccionar a es-            lecto-escritoras. Sin embargo, no se trata toda-
tudiantes. Dubois (1970) y Coffman (1971) citan


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 12
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

vía de una evaluación sustentada en un enfoque                  c) El desarrollo de los métodos estadísticos
teórico, sino más bien, algo que responde a prác-               que favorecía decisivamente la orientación
ticas en buena medida rutinarias y con frecuencia               métrica de la época (Nunnally, 1978).
basadas en instrumentos poco fiables.
                                                                d) El desarrollo de la sociedad industrial
  Al final del siglo XIX, en 1897, aparece un tra-              que potenciaba la necesidad de encontrar
bajo de J. M. Rice, que se suele señalar como la                unos mecanismos de acreditación y selec-
primera investigación evaluativa en educación                   ción de alumnos, según sus conocimientos.
(Mateo y otros, 1993). Se trataba de un análisis
comparativo en escuelas americanas sobre el                     Consecuentemente con este estado de cosas,
valor de la instrucción en el estudio de la ortogra-          en este periodo entre finales del siglo XIX y
fía, utilizando como criterio las puntuaciones                principios del XX, se desarrolla una actividad
obtenidas en los tests.                                       evaluativa intensa conocida como «testing»,
                                                              que se define por características como las si-
2. Los tests psicométricos                                    guientes:

   En el contexto anterior, a finales del siglo XIX,            • Medición y evaluación resultaban términos
se despierta un gran interés por la medición cien-              intercambiables. En la práctica sólo se
tífica de las conductas humanas. Esto es algo que               hablaba de medición.
se enmarca en el movimiento renovador de la
metodología de las ciencias humanas, al asumir                  • El objetivo era detectar y establecer dife-
el positivismo de las ciencias físico-naturales. En             rencias individuales, dentro del modelo del
este sentido, la evaluación recibe las mismas                   rasgo y atributo que caracterizaba las elabo-
influencias que otras disciplinas pedagógicas                   raciones psicológicas de la época (Fernández
relacionadas con procesos de medición, como la                  Ballesteros, 1981), es decir, el hallazgo de
pedagogía experimental y la diferencial (Cabrera,               puntuaciones diferenciales, para determinar
1986).                                                          la posición relativa del sujeto dentro de la
                                                                norma grupal.
  La actividad evaluativa se verá condicionada
de forma decisiva por diversos factores que con-                • Los tests de rendimiento, sinónimo de eva-
fluyen en dicho momento, tales como:                            luación educativa, se elaboraban para esta-
                                                                blecer discriminaciones individuales, olvi-
 a) El florecimiento de las corrientes filosófi-                dándose en gran medida la representatividad
 cas positivistas y empíricas, que apoyaban a la                y congruencia con los objetivos educativos.
 observación, la experimentación, los datos y                   En palabras de Guba y Lincoln (1982), la
 los hechos como fuentes del conocimiento                       evaluación y la medida tenían poca relación
 verdadero. Aparece la exigencia del rigor cien-                con los programas escolares. Los tests in-
 tífico y de la objetividad en la medida de la                  formaban algo sobre los alumnos, pero no de
 conducta humana (Planchard, 1960) y se po-                     los programas con los que se les había for-
 tencian las pruebas escritas como medio para                   mado.
 combatir la subjetividad de los exámenes ora-
 les (Ahman y Cook, 1967).                                      En el campo educativo destacan algunos ins-
                                                              trumentos de aquella época, como las escalas
 b) La influencia de las teorías evolucionistas               de escritura de Ayres y Freeman, de redacción
 y los trabajos de Darwin, Galton y Cattel, apo-              de Hillegas, de ortografía de Buckingan, de
 yando la medición de las características de los              cálculo de Wood, de lectura de Thorndike y
 individuos y las diferencias entre ellos.                    McCall y de aritmética de Wood y McCall
                                                              (Planchard, 1960; Ahman y Cook, 1967; Ebel,
                                                              1977).



Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 13
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

  Sin embargo, fue en los tests psicológicos don-             ten textos y publicaciones que utilizan de ma-
de los esfuerzos tuvieron mayor impacto, siendo               nera indisoluble evaluación y medida (Gron-
probablemente la obra de Thorndike (1904) la de               lund, 1985).
mayor influencia en los comienzos del siglo XX.
En Francia destacan los trabajos de Alfred Binet,             3. El nacimiento de la verdadera evalua-
después revisados por Terman en la Universidad                ción educativa: La gran reforma
de Stanford, sobre tests de capacidades cogniti-              «tyleriana»
vas. Ahora hablamos del Stanford-Binet, uno de
los tests más conocidos en la historia de la psi-               Antes de que llegara la revolución promovida
cometría.                                                     por Ralph W. Tyler, en Francia se inicia en los
                                                              años veinte una corriente independiente cono-
  Años más tarde, con las necesidades de reclu-               cida como docimología (Pieron, 1968 y 1969;
tamiento en la Primera Guerra Mundial, Arthur                 Bonboir, 1972), que supone un primer acerca-
Otis dirige un equipo que construye tests colecti-            miento a la verdadera evaluación educativa. Se
vos de inteligencia general (Alfa para lectoescri-            criticaba, sobre todo, el divorcio entre lo ense-
tores y Beta para analfabetos) e inventarios de               ñado y las metas de la instrucción. La evalua-
personalidad (Phillips, 1974).                                ción se dejaba, en último término, en manos de
                                                              una interpretación totalmente personal del pro-
  Tras la contienda, los tests psicológicos se po-            fesor. Como solución se proponía: a) elabora-
nen al servicio de fines sociales. La década entre            ción de taxonomías para formular objetivos, b)
1920 y 1930 marca el punto más alto del «tes-                 diversificación de fuentes de información,
ting», pues se idean multitud de tests estandari-             exámenes, expedientes académicos, técnicas de
zados para medir toda clase de destrezas escola-              repesca y tests, c) unificación de criterios de
res con referentes objetivos externos y explícitos,           corrección a partir del acuerdo entre los correc-
basados en procedimientos de medida de la inte-               tores de las pruebas y d) revisión de los juicios
ligencia, para utilizar con grandes colectivos de             de valoración mediante procedimientos tales
estudiantes.                                                  como la doble corrección, o la media de distin-
  Estas aplicaciones estandarizadas se acogen                 tos correctores. Como puede verse, se trata de
muy bien en los ámbitos educativos y McCall                   criterios en buena medida vigentes actualmente
(1920) propone que los profesores construyan                  y, en algún caso, incluso avanzados.
sus propias pruebas objetivas, para no tener que                Pero quien es tradicionalmente considerado
confiar exclusivamente en las propuestas por                  como el padre de la evaluación educativa es
especialistas externos.                                       Tyler (Joint Committee, 1981), por ser el pri-
  Este movimiento estuvo vigente en paralelo al               mero en dar una visión metódica de la misma,
proceso de perfeccionamiento de los tests psico-              superando desde el conductismo, muy en boga
lógicos con el desarrollo de la estadística y del             en el momento, la mera evaluación psicológica.
análisis factorial. El fervor por el «testing» de-            Entre 1932 y 1940, en su famoso Eight-Year
creció a partir de los años cuarenta e, incluso,              Study of Secondary Education para la Progres-
empezaron a surgir algunos movimientos hiper-                 sive Education Association, publicado dos años
críticos con estas prácticas.                                 después (Smith y Tyler, 1942), plantea la nece-
                                                              sidad de una evaluación científica que sirva
  Guba y Lincoln (1989) se refieren a esta eva-               para perfeccionar la calidad de la educación.
luación como a la primera generación, que puede               La obra de síntesis la publica unos años des-
legítimamente ser denominada como la genera-                  pués (Tyler, 1950), exponiendo de manera cla-
ción de la medida. El papel del evaluador era                 ra su idea de «curriculum», e integrando en él
técnico, como proveedor de instrumentos de me-                su método sistemático de evaluación educativa,
dición. Según estos autores, esta primera genera-             como el proceso surgido para determinar en
ción permanece todavía viva, pues todavía exis-               qué medida han sido alcanzados los objetivos


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 14
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

previamente establecidos (véase también Tyler,                ción es más amplia que el hacer explícito este
1967 y 1969).                                                 cambio a los propios alumnos, padres y profe-
                                                              sores; es también un medio para informar sobre
  El «currículum» viene delimitado por las cua-               la eficacia del programa educacional y también
tro cuestiones siguientes:                                    de educación continua del profesor. Se trata,
                                                              según Guba y Lincoln (1989), de la segunda
 a) ¿Qué objetivos se desean conseguir?
                                                              generación de la evaluación. Desgraciadamen-
 b) ¿Con qué actividades se pueden alcanzar?                  te, esta visión evaluativa global no fue
                                                              suficientemente apreciada, ni explotada, por
 c) ¿Cómo pueden organizarse eficazmente                      aquellos que utilizaron sus trabajos (Bloom y
 estas experiencias?                                          otros, 1975; Guba y Lincoln, 1982).
 d) ¿Cómo se puede comprobar si se alcanzan                     A pesar de lo anterior y de que las reformas
 los objetivos?                                               tylerianas no siempre se aplicaron de inmedia-
                                                              to, las ideas de Tyler fueron muy bien acogidas
  Y la buena evaluación precisa de las siguientes             por los especialistas en desarrollo curricular y
condiciones:                                                  por los profesores. Su esquema era racional y
 a) Propuesta clara de objetivos.                             se apoyaba en una tecnología clara, fácil de
                                                              entender y aplicar (Guba y Lincoln, 1982;
 b) Determinación de las situaciones en las                   House, 1989) y encajaba perfectamente en la
 que se deben manifestar las conductas espera-                racionalidad del análisis de la tarea que comen-
 das.                                                         zaba a usarse con éxito en ámbitos educativos
                                                              militares (Gagné, 1971). En España, los plan-
 c) Elección de instrumentos apropiados de                    teamientos de Tyler se extendieron con la Ley
 evaluación.                                                  General de Educación de 1970.
 d) Interpretación de los resultados de las                     Tras la Segunda Guerra Mundial se produce
 pruebas.                                                     un periodo de expansión y optimismo que Stuf-
                                                              flebeam y Shinkfield (1987) no han dudado en
 e) Determinación de la fiabilidad y objetivi-
                                                              calificar de «irresponsabilidad social», por el
 dad de las medidas.
                                                              gran despilfarro consumista tras una época de
  Esta evaluación ya no es una simple medición,               recesión. Se trata de la etapa conocida como la
porque supone un juicio de valor sobre la infor-              de la inocencia (Madaus y otros, 1991). Se
mación recogida. Se alude, aunque sin desarro-                extienden mucho las instituciones y servicios
llar, a la toma de decisiones sobre los aciertos o            educativos de todo tipo, se producen cantidad
fracasos de la programación, en función de los                de tests estandarizados, se avanza en la tecno-
resultados de los alumnos, algo que retomarán                 logía de la medición y en los principios estadís-
otros importantes evaluadores como Cronbach y                 ticos del diseño experimental (Gulliksen, 1950;
Sufflebeam unos años después.                                 Lindquist, 1953; Walberg y Haertel, 1990) y
                                                              aparecen las famosas taxonomías de los objeti-
  Para Tyler, la referencia central en la evalua-             vos educativos (Bloom y otros, 1956; Krath-
ción son los objetivos preestablecidos, que deben             wohl y otros, 1964). Sin embargo, en esta épo-
ser cuidadosamente definidos en términos de                   ca, la aportación de la evaluación a la mejora
conducta (Mager, 1962), teniendo en cuenta que                de la enseñanza es escasa debido a la carencia
deben marcar el desarrollo individual del alum-               de planes coherentes de acción. Se escribe mu-
no, pero dentro de un proceso socializador.                   cho de evaluación, pero con escasa influencia
                                                              en el perfeccionamiento de la labor instruccio-
  El objeto del proceso evaluativo es determinar              nal. El verdadero desarrollo de las propuestas
el cambio ocurrido en los alumnos, pero su fun-


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 15
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

tylerianas vino después (Taba, 1962; Popham y                   nos. Para ello, es necesario interaccionar con
Baker, 1970; Fernández de Castro, 1973).                        ellos de manera más frecuente y más infor-
                                                                mal.
  Ralph W. Tyler murió el 18 de febrero de
1994, superados los noventa años de vida, tras                  Medio siglo después de que Tyler
siete décadas de fructíferas aportaciones y servi-            revolucionara el mundo de la evaluación
cios a la evaluación, a la investigación y a la edu-          educativa, se observa la fortaleza, coherencia y
cación en general. Unos meses antes, en abril de              vigencia de su pensamiento. Como acabamos
1993, Pamela Perfumo, una estudiante graduada                 de ver, sus ideas básicas, convenientemente
de la Universidad de Stanford, entrevistó a Tyler             actualizadas, se entroncan fácilmente en las
con el propósito de conocer su pensamiento acer-              corrientes más actuales de la evaluación
ca del actual desarrollo de la evaluación y de los            educativa.
temas controvertidos alrededor de la misma. Esta              4. El desarrollo de los sesenta
entrevista, convenientemente preparada, fue
presentada el 16 de abril de 1993 en la Conferen-               Los años sesenta traerán nuevos aires a la
cia de la AERA que tuvo lugar en Atlanta.                     evaluación educativa, entre otras cosas porque
Horowitz (1995) analiza el contenido y el signi-              se empezó a prestar interés por algunas de las
ficado de la citada entrevista, destacando, entre             llamadas de atención de Tyler, relacionadas
otros, los siguientes aspectos en el pensamiento              con la eficacia de los programas y el valor in-
de Tyler al final de sus días:                                trínseco de la evaluación para la mejora de la
                                                              educación.
 a) Necesidad de analizar cuidadosamente los
 propósitos de la evaluación, antes de ponerse a                En esa época surge un cierto conflicto entre
 evaluar. Los actuales planteamientos de eva-                 la sociedad americana y su sistema educativo,
 luaciones múltiples y alternativas deben ajus-               sobre todo porque los rusos iban por delante en
 tarse a este principio                                       la carrera especial, tras el lanzamiento del
                                                              Sputnik por la URSS en 1957. Aparece un cier-
 b) El propósito más importante en la evalua-                 to desencanto con la escuela pública y crece la
 ción de los alumnos es guiar su aprendizaje,                 presión por la rendición de cuentas (MacDo-
 esto es, ayudarles a que aprendan. Para ello es              nald, 1976; Stenhouse, 1984). En 1958 se pro-
 necesaria una evaluación comprensiva de to-                  mulga una nueva ley de defensa educativa que
 dos los aspectos significativos de su rendi-                 proporciona muchos programas y medios para
 miento; no basta con asegurarse que hacen re-                evaluarlos. En 1964 se establece el Acta de
 gularmente el trabajo diario.                                educación primaria y secundaria (ESEA) y se
                                                              crea el National Study Comitte on Evaluation,
 c) El «portfolio» es un instrumento valioso de               creándose una nueva evaluación no sólo de
 evaluación, pero depende de su contenido. En                 alumnos, sino orientada a incidir en los pro-
 todo caso, hay que ser cauteloso ante la pre-                gramas y en la práctica educativa global (Ma-
 ponderancia de un solo procedimiento de eva-                 teo y otros, 1993; Rodríguez y otros, 1995).
 luación, incluyendo el «portfolio», por su in-
 capacidad de abarcar todo el espectro de as-                   Para mejorar la situación y retomar la hege-
 pectos evaluables.                                           monía científica y educativa, fueron muchos
                                                              los millones de dólares que desde los fondos
 d) La verdadera evaluación debe ser idiosin-                 públicos se destinaron a subvencionar nuevos
 crásica, adecuada a las peculiaridades del                   programas educativos e iniciativas del personal
 alumno y el centro. En rigor, la comparación                 de las escuelas públicas americanas encamina-
 de centros no es posible.                                    das a mejorar la calidad de la enseñanza. (Po-
                                                              pham, 1983; Rutman y Mowbray, 1983; Weiss,
 e) Los profesores deben rendir cuentas de su                 1983). Este movimiento se vio también poten-
 acción educativa ante los padres de los alum-                ciado por el desarrollo de nuevos medios
                                                              tecnológicos (audiovisuales, ordenadores...) y

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 16
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

nológicos (audiovisuales, ordenadores...) y el de             este movimiento de rendición de cuentas, de
la enseñanza programada, cuyas posibilidades                  responsabilidad escolar, diera lugar a una olea-
educativas despertaron el interés entre los profe-            da de protestas por parte del personal docente.
sionales de la educación (Rosenthal, 1976).
                                                                Otra dimensión de la responsabilidad escolar
   De la misma forma que la proliferación de                  nos la ofrece Popham (1980), cuando se refiere
programas sociales en la década anterior había                al movimiento de descentralización escolar
impulsado la evaluación de programas en el área               durante los últimos años sesenta y principios de
social, los años sesenta serán fructíferos en de-             los setenta. Los grandes distritos escolares se
manda de evaluación en el ámbito de la educa-                 dividieron en áreas geográficas más pequeñas,
ción. Esta nueva dinámica en la que entra la eva-             y, por consiguiente, con un control ciudadano
luación, hace que, aunque ésta se centraba en los             más directo sobre lo que ocurría en las escue-
alumnos como sujeto que aprende, y el objeto de               las.
valoración era el rendimiento de los mismos, sus
funciones, su enfoque y su última interpretación                Como consecuencia de estos focos de in-
variará según el tipo de decisión buscada.                    fluencia, se amplió considerablemente el fe-
                                                              nómeno de la evaluación educativa. El sujeto
  Buena parte de culpa de este fuerte ímpetu eva-             directo de la evaluación siguió siendo el alum-
luador americano se debió a la ya citada aproba-              no, pero también todos aquellos factores que
ción de la «Elementary and Secondary Act»                     confluyen en el proceso educativo (el programa
(ESEA) en 1965 (Berk, 1981; Rutman, 1984).                    educativo en un sentido amplio, profesor, me-
Con esta ley se puso en marcha el primer pro-                 dios, contenidos, experiencias de aprendizaje,
grama significativo para la organización de la                organización, etc.), así como el propio produc-
educación en el ámbito federal de los Estados                 to educativo.
Unidos, y se estipuló que cada uno de los pro-
yectos realizados con el apoyo económico fede-                  Como resultado de estas nuevas necesidades
ral debía ser anualmente evaluado, a fin de justi-            de la evaluación, se inicia durante esta época
ficar subvenciones futuras.                                   un periodo de reflexión y de ensayos teóricos
                                                              con ánimo de clarificar la multidimensionali-
  Junto al desencanto de la escuela pública, cabe             dad del proceso evaluativo. Estas reflexiones
señalar la recesión económica que caracteriza los             teóricas enriquecerán decisivamente el ámbito
finales años sesenta, y, sobre todo, la década de             conceptual y metodológico de la evaluación, lo
los setenta. Ello hizo que la población civil, co-            que unido a la tremenda expansión de la eva-
mo contribuyentes, y los propios legisladores se              luación de programas ocurrida durante estos
preocupasen por la eficacia y el rendimiento del              años, dará lugar al nacimiento de esa nueva
dinero que se empleaba en la mejora del sistema               modalidad de investigación aplicada que hoy
escolar. A finales de los años sesenta, y como                denominamos como investigación evaluativa.
consecuencia de lo anterior, entra en escena un
nuevo movimiento, la era de la «Accountability»,                Como hitos de la época hay que destacar dos
de la rendición de cuentas (Popham, 1980 y                    ensayos por su decisiva influencia: el artículo
1983; Rutman y Mowbray, 1983), que se asocia                  de Cronbach (1963), Course improvement
fundamentalmente a la responsabilidad del per-                through evaluation, y el de Scriven (1967), The
sonal docente en el logro de objetivos educativos             methodology of evaluation. La riqueza de ideas
establecidos. De hecho, en el año 1973, la legis-             evaluativas expuestas en estos trabajos nos
lación de muchos estados americanos instituyó la              obligan a que, aunque brevemente, nos refira-
obligación de controlar el logro de los objetivos             mos a ellas.
educativos y la adopción de medidas correctivas
                                                                Del análisis que Cronbach del concepto, fun-
en caso negativo (MacDonald, 1976; Wilson y
                                                              ciones y metodología de la evaluación, entresa-
otros, 1978). Es comprensible que, planteado así,
                                                              camos las sugerencias siguientes:


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 17
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

 a) Asociar el concepto de evaluación a la                      tudios de seguimientos, esto es, el camino
 toma de decisiones. Distingue el autor tres ti-                posterior seguido por los estudiantes que han
 pos de decisiones educativas a las cuales la                   participado en el programa.
 evaluación sirve: a) sobre el perfeccionamien-
 to del programa y de la instrucción, b) sobre                  f) Desde esta óptica, las técnicas de eva-
 los alumnos (necesidades y méritos finales) y                  luación no pueden limitarse a los tests de
 c) acerca de la regulación administrativa sobre                rendimiento. Los cuestionarios, las entrevis-
 la calidad del sistema, profesores, organiza-                  tas, la observación sistemática y no sistemá-
 ción, etc. De esta forma, Cronbach abre el                     tica, las pruebas de ensayo, según el autor,
 campo conceptual y funcional de la evaluación                  ocupan un lugar importante en la evaluación,
 educativa mucho más allá del marco concep-                     en contraste al casi exclusivo uso que se
 tual dado por Tyler, aunque en su línea de su-                 hacía de los tests como técnicas de recogida
 gerencias.                                                     de información.

 b) La evaluación que se usa para mejorar un                    Si estas reflexiones de Cronbach fueron im-
 programa mientras éste se está aplicando,                    pactantes, no lo fueron menos las del ensayo de
 contribuye más al desarrollo de la educación                 Scriven (1967). Sus fecundas distinciones ter-
 que la evaluación usada para estimar el valor                minológicas ampliaron enormemente el campo
 del producto de un programa ya concluido.                    semántico de la evaluación, a la vez que clari-
                                                              ficaron el quehacer evaluativo. Destacamos a
 c) Poner en cuestión la necesidad de que los                 continuación las aportaciones más significati-
 estudios evaluativos sean de tipo comparativo.               vas:
 Entre las objeciones a este tipo de estudios, el
 autor destaca el hecho de que, con frecuencia,                 a) Se establece de forma tajante la diferen-
 las diferencias entre las puntuaciones prome-                  cia entre la evaluación como actividad me-
 dio entre-grupos son menores que las intra-                    todológica, lo que el autor llama meta de la
 grupos, así como otras referentes a las dificul-               evaluación, y las funciones de la evaluación
 tades técnicas que en el marco educativo pre-                  en un contexto particular. Así, la evaluación
 sentan los diseños comparativos. Cronbach                      como actividad metodológica es esencial-
 aboga por unos criterios de comparación de ti-                 mente igual, sea lo que fuera lo que estemos
 po absoluto, reclamando la necesidad de una                    evaluando. El objetivo de la evaluación es
 evaluación con referencia al criterio, al defen-               invariante, supone en definitiva el proceso
 der la valoración con relación a unos objetivos                por el cual estimamos el valor de algo que se
 bien definidos y no la comparación con otros                   evalúa, mientras que las funciones de la eva-
 grupos.                                                        luación pueden ser enormemente variadas.
                                                                Estas funciones se relacionan con el uso que
 d) Se ponen en cuestión los estudios a gran                    se hace de la información recogida.
 escala, puesto que las diferencias entre los tra-
 tamientos pueden ser muy grandes e impedir                     b) Scriven señala dos funciones distintas
 discernir con claridad las causas de los resul-                que puede adoptar la evaluación: la for-
 tados. Se defienden los estudios más analíti-                  mativa y la sumativa. Propone el término de
 cos, bien controlados, que pueden usarse para                  evaluación formativa para calificar aquel
 comparar versiones alternativas de un progra-                  proceso de evaluación al servicio de un pro-
 ma.                                                            grama en desarrollo, con objeto de mejorar-
                                                                lo, y el término de evaluación sumativa para
 e) Metodológicamente Cronbach propone                          aquel proceso orientado a comprobar la efi-
 que la evaluación debe incluir: 1) estudios de                 cacia del programa y tomar decisiones sobre
 proceso –hechos que tienen lugar en el aula–;                  su continuidad.
 2) medidas de rendimiento y actitudes –
 cambios observados en los alumnos– y 3) es-


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 18
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

 c) Otra importante contribución de Scriven                   no sólo analiza y describe la realidad, además,
 es la crítica al énfasis que la evaluación da a la           la valora, la juzga con relación a distintos crite-
 consecución de objetivos previamente estable-                rios.
 cidos, porque si los objetivos carecen de valor,
 no tiene ningún interés saber hasta qué punto                  Durante estos años sesenta aparecen muchas
 se han conseguido. Resalta la necesidad de que               otras aportaciones que va perfilando una nueva
 la evaluación debe incluir tanto la evaluación               concepción evaluativa, que terminará de des-
 de los propios objetivos como el determinar el               arrollarse y, sobre todo, de extenderse en las
 grado en que éstos han sido alcanzados (Scri-                décadas posteriores. Se percibe que el núcleo
 ven, 1973 y 1974).                                           conceptual de la evaluación lo constituye la
                                                              valoración del cambio ocurrido en el alumno
 d) Clarificadora es también la distinción que                como efecto de una situación educativa siste-
 hace Scriven entre evaluación intrínseca y eva-              mática, siendo unos objetivos bien formulados
 luación extrínseca, como dos formas diferen-                 el mejor criterio para valorar este cambio. Así
 tes de valorar un elemento de la enseñanza. En               mismo, se comienza a prestar atención no sólo
 una evaluación intrínseca se valora el elemen-               a los resultados pretendidos, sino también a los
 to por sí mismo, mientras que en la evaluación               efectos laterales o no pretendidos, e incluso a
 extrínseca se valora el elemento por los efec-               resultados o efectos a largo plazo (Cronbach,
 tos que produce en los alumnos. Esta distin-                 1963; Glaser, 1963; Scriven, 1967; Stake,
 ción resulta muy importante a la hora de con-                1967).
 siderar el criterio a utilizar, pues en la evalua-
 ción intrínseca el criterio no se formula en                   A pesar de las voces críticas con la operativi-
 términos de objetivos operativos, mientras que               zación de objetivos (Eisner, 1967 y 1969; At-
 sí se hace en la evaluación extrínseca .                     kin, 1968), no sólo por la estructura de valor
                                                              que en ello subyace, sino también por centrar la
 e) Scriven adopta una posición contraria a                   valoración del aprendizaje en los productos
 Cronbach, defendiendo el carácter comparati-                 más fácilmente mensurables, a veces los más
 vo que deben presentar los estudios de evalua-               bajos en las taxonomías del dominio cognosci-
 ción. Admite con Cronbach los problemas téc-                 tivo, y de que se prestaba escasa atención a los
 nicos que los estudios comparativos entrañan y               objetivos del dominio afectivo, que presentan
 la dificultad de explicar las diferencias entre              mayor dificultad de tratamiento operativo, el
 programas, pero Scriven considera que la eva-                modelo evaluativo de Tyler se enriquecería
 luación como opuesta a la mera descripción                   mucho en estos años, con trabajos sobre los
 implica emitir un juicio sobre la superioridad o             objetivos educativos que continuarían y perfec-
 inferioridad de lo que se evalúa con respecto a              cionarían el camino emprendido en 1956 por
 sus competidores o alternativas.                             Bloom y colaboradores (Mager, 1962 y 1973;
                                                              Lindvall, 1964; Krathwohl y otros, 1964; Gla-
  Estas dos aportaciones comentadas influyeron                ser, 1965; Popham, 1970; Bloom y otros, 1971;
decisivamente en la comunidad de evaluadores,                 Gagné 1971). Entre otras cosas aparecieron
incidiendo no sólo en estudios en la línea de la              nuevas ideas sobre la evaluación de la interac-
investigación evaluativa, a la que se referían pre-           ción en el aula y sobre sus efectos en los logros
ferentemente, sino también en la evaluación                   de los alumnos (Baker, 1969).
orientada al sujeto, en la línea de evaluación co-
mo «assessment» (Mateo, 1986). Estamos ante la                  Stake (1967) propuso su modelo de evalua-
tercera generación de la evaluación que, según                ción, The countenance model, que sigue la lí-
Guba y Lincoln (1989), se caracteriza por intro-              nea de Tyler, pero es más completo al conside-
ducir la valoración, el juicio, como un contenido             rar las discrepancias entre lo observado y lo
intrínseco en la evaluación. Ahora el evaluador               esperado en los «antecedentes» y «transaccio-
                                                              nes», y posibilitar algunas bases para elaborar


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 19
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

hipótesis acerca de las causas y los fallos en los            señala para los primeros, además de los cono-
resultados finales. En sus sucesivas propuestas,              cidos objetivos de describir la ejecución del
Stake se irá distanciando de sus posiciones ini-              sujeto y tomar decisiones sobre si domina o no
ciales.                                                       domina un contenido, otro objetivo como es el
                                                              de valorar la eficacia de un programa.
  Metfessell y Michael (1967) presentaron tam-
bién un modelo de evaluación de la efectividad                  Desde finales de los sesenta los especialistas
de un programa educativo en el cual, aún si-                  se pronunciarán decisivamente a favor de la
guiendo el modelo básico de Tyler, proponían la               evaluación criterial, en cuanto que es el tipo de
utilización de una lista comprensiva de criterios             evaluación que suministra una información real
diversos que los evaluadores podrían tener en                 y descriptiva del estatus del sujeto o sujetos
cuenta en el momento de la valoración y, por                  respecto a los objetivos de enseñanza previstos,
consiguiente, no centrarse meramente en los co-               así como la valoración de ese estatus por com-
nocimientos intelectuales alcanzados por los                  paración con un estándar o criterio de realiza-
alumnos.                                                      ciones deseables, siendo irrelevantes, al efecto
                                                              de contraste, los resultados obtenidos por otros
   Suchman (1967) profundiza en la convicción                 sujetos o grupo de sujetos (Popham, 1970 y
de que la evaluación debe basarse en datos obje-              1983; Mager, 1973; Carreño, 1977; Gronlund,
tivos que sean analizados con metodología cien-               1985).
tífica, matizando que la investigación científica
es preferentemente teórica y, en cambio, la inves-              En las prácticas evaluativas de esta década de
tigación evaluativa es siempre aplicada. Su prin-             los sesenta se observan dos niveles de actua-
cipal propósito es descubrir la efectividad, éxito            ción. Un nivel podemos calificarlo como la
o fracaso de un programa al compararlo con los                evaluación orientada hacia los individuos,
objetivos propuestos y, así, trazar las líneas de su          fundamentalmente alumnos y profesores. El
posible redefinición. Esta investigación evaluati-            otro nivel, es el de la evaluación orientada a la
va para Suchman debe tener en cuenta: a) la na-               toma de decisiones sobre el «instrumento» o
turaleza del destinatario del objetivo y la del pro-          «tratamiento» o «programa» educativo. Este
pio objetivo, b) el tiempo necesario para que se              último nivel, impulsado también por la evalua-
realice el cambio propuesto, c) el conocimiento               ción de programas en el ámbito social, será la
de si los resultados esperados son dispersos o                base para la consolidación en el terreno educa-
concentrados y d) los métodos que han de em-                  tivo de la evaluación de programas y de la in-
plearse para alcanzar los objetivos. Suchman,                 vestigación evaluativa.
además, defiende la utilización de evaluadores
externos para evitar todo tipo de tergiversación              5. Desde los años setenta: La consolida-
de los profesores muy implicados en los procesos              ción de la investigación evaluativa
instruccionales.
                                                                Si con algo se podría caracterizar las aporta-
  El énfasis en los objetivos y su medida traerá              ciones teóricas que nos ofrecen los especialis-
también la necesidad de una nueva orientación a               tas durante los años setenta es con la prolifera-
la evaluación, la denominada evaluación de refe-              ción de toda clase de modelos evaluativos que
rencia criterial. La distinción introducida por               inundan el mercado bibliográfico, modelos de
Glaser (1963) entre mediciones referidas a nor-               evaluación que expresan la propia óptica del
mas y criterios tendrá eco al final de la década de           autor que los propone sobre qué es y cómo de-
los sesenta, precisamente como resultado de las               be conducirse un proceso evaluativo. Se trata,
nuevas exigencias que a la evaluación educativa               por tanto, de una época caracterizada por la
se le planteaban. Así, por ejemplo, cuando Ham-               pluralidad conceptual y metodológica. Guba y
bleton (1985) estudia las diferencias entre tests             Lincoln (1982) nos hablan de más de cuarenta
referidos al criterio y tests referidos a la norma,           modelos propuestos en estos años, y Mateo


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 20
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

(1986) se refiere a la eclosión de modelos. Estos             Metas”. Además de los ya citados de Stake y
enriquecerán considerablemente el vocabulario                 Metfessell y Michael, que corresponden a los
evaluativo, sin embargo, compartimos la idea de               últimos años sesenta, en esta época destacan la
Popham (1980) de que algunos son demasiado                    propuesta de Hammond (1983) y el Modelo de
complicados y otros utilizan una jerga bastante               Discrepancia de Provus (1971). Para estos au-
confusa.                                                      tores los objetivos propuestos siguen siendo el
                                                              criterio fundamental de valoración, pero enfati-
  Algunos autores como Guba y Lincoln (1982),                 zan la necesidad de aportar datos sobre la con-
Pérez (1983) y en alguna medida House (1989),                 gruencia o discrepancia entre las pautas de ins-
tienden a clasificar estos modelos en dos grandes             trucción diseñadas y la ejecución de las mismas
grupos, cuantitativos y cualitativos, pero nosotros           en la realidad del aula.
pensamos con Nevo (1983) y Cabrera (1986) que
la situación es mucho más rica en matices.                      Otros modelos consideran el proceso de eva-
                                                              luación al servicio de las instancias que deben
  Es cierto que esas dos tendencias se observan               tomar decisiones. Ejemplos notables de ellos
hoy en las propuestas evaluativas, y que algunos              son: probablemente el más famoso y utilizado
modelos pueden ser representativos de ellas, pero             de todos, el C.I.P.P. (contexto, input, proceso y
los diferentes modelos, considerados particular-              producto), propuesto por Stufflebeam y colabo-
mente, se diferencian más por destacar o enfati-              radores (1971) y el C.E.S. (toma sus siglas del
zar alguno o algunos de los componentes del                   Centro de la Universidad de California para el
proceso evaluativo y por la particular interpreta-            Estudio de la Evaluación) dirigido por Alkin
ción que a este proceso le dan. Es desde esta                 (1969). La aportación conceptual y metodoló-
perspectiva, a nuestro entender, como los dife-               gica de estos modelos es valorada positivamen-
rentes modelos deben ser vistos, y valorar así sus            te entre la comunidad de evaluadores (Popham,
respectivas aportaciones en los terrenos concep-              1980; Guba y Lincoln, 1982; House, 1989).
tual y metodológico (Worthen y Sanders, 1973;                 Estos autores van más allá de la evaluación
Stufflebeam y Shinkfield, 1987; Arnal y otros,                centrada en resultados finales, puesto que en
1992; Scriven, 1994).                                         sus propuestas suponen diferentes tipos de eva-
                                                              luación, según las necesidades de las decisio-
  También son varios los autores (Lewy, 1976;
                                                              nes a las que sirven.
Popham, 1980; Cronbach, 1982; Anderson y
Ball, 1983; De la Orden, 1985) los que conside-                 Una segunda época en la proliferación de
ran los modelos no como excluyentes, sino más                 modelos es la representada por los modelos
bien como complementarios y que el estudio de                 alternativos, que con diferentes concepciones
los mismos (al menos aquellos que han resultado               de la evaluación y de la metodología a seguir
ser más prácticos) llevará al evaluador a adoptar             comienzan a aparecer en la segunda mitad de
una visión más amplia y comprensiva de su tra-                esta década de los setenta. Entre ellos destacan
bajo. Nosotros, en algún momento nos hemos                    la Evaluación Responsable de Stake (1975 y
atrevido a hablar de enfoques modélicos, más                  1976), a la que se adhieren Guba y Lincoln
que de modelos, puesto que es cada evaluador el               (1982), la Evaluación Democrática de Mac-
que termina construyendo su propio modelo en                  Donald (1976), la Evaluación Iluminativa de
cada investigación evaluativa, en función del tipo            Parlett y Hamilton (1977) y la Evaluación co-
de trabajo y las circunstancias (Escudero, 1993).             mo crítica artística de Eisner (1985).
  En este movimiento de propuestas de modelos                   En líneas generales, este segundo grupo de
de evaluación cabe distinguir dos épocas con                  modelos evaluativos enfatiza el papel de la
marcadas diferencias conceptuales y metodológi-               audiencia de la evaluación y de la relación del
cas. En una primera época, las propuestas seguí-              evaluador con ella. La audiencia prioritaria de
an la línea expuesta por Tyler en su planteamien-             la evaluación en estos modelos no es quien
to, que ha venido a llamarse de “Consecución de


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 21
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

debe tomar las decisiones, como en los modelos                  tados a la toma de decisiones: la evaluación
orientados a la toma de decisiones, ni el respon-               como el proceso de determinar, obtener y
sable de elaborar los currículos u objetivos, como              proporcionar información relevante para
en los modelos de consecución de metas. La au-                  juzgar decisiones alternativas, defendida por
diencia prioritaria son los propios participantes               Alkin (1969), Stufflebeam y otros (1971),
del programa. La relación entre el evaluador y la               MacDonald (1976) y Cronbach (1982).
audiencia en palabras de Guba y Lincoln (1982)
debe ser «transaccional y fenomenológica». Se                     Además, el concepto de evaluación de Scri-
trata de modelos que propugnan una evaluación                   ven (1967), como el proceso de estimar el
de tipo etnográfica, de aquí que la metodología                 valor o el mérito de algo, es retomado por
que consideran más adecuada es la propia de la                  Cronbach (1982), Guba y Lincoln (1982), y
antropología social (Parlett y Hamilton, 1977;                  House (1989), con objeto de señalar las dife-
Guba y Lincoln, 1982; Pérez 1983).                              rencias que comportarían los juicios valora-
                                                                tivos en caso de estimar el mérito (se vincu-
  Este resumen de modelos de la época de eclo-                  laría a características intrínsecas de lo que se
sión es suficiente para aproximarnos al amplio                  evalúa) o el valor (se vincularía al uso y
abanico conceptual teórico y metodológico que                   aplicación que tendría para un contexto de-
hoy se relaciona con la evaluación. Ello explica                terminado).
que cuando Nevo (1983 y 1989) pretende realizar
una conceptualización de la evaluación, a partir                b) Diferentes criterios. De las definiciones
de la revisión de la literatura especializada, aten-            apuntadas anteriormente se desprende que el
diendo a los tópicos ¿qué es la evaluación? ¿qué                criterio a utilizar para la valoración de la in-
funciones tiene? ¿cuál es el objeto de evalua-                  formación también cambia. Desde la óptica
ción?... no encuentra una única respuesta a estas               de la consecución de metas, una buena y
cuestiones. Es fácilmente comprensible que las                  operativa definición de los objetivos consti-
exigencias que plantea la evaluación de progra-                 tuye el criterio fundamental. Desde la pers-
mas de una parte, y la evaluación para la toma de               pectiva de las decisiones y situados dentro
decisiones sobre los individuos de otra, conducen               de un contexto político, Stufflebeam y cola-
a una gran variedad de esquemas evaluativos                     boradores, Alkin y MacDonald llegan a su-
reales utilizados por profesores, directores, ins-              gerir incluso la no valoración de la informa-
pectores y administradores públicos. Pero tam-                  ción por parte del evaluador, siendo el que
bién es cierto que bajo esta diversidad subyacen                toma las decisiones el responsable de su va-
diferentes concepciones teóricas y metodológicas                loración.
sobre la evaluación. Diferentes concepciones que
                                                                  Las definiciones de evaluación que acentú-
han dado lugar a una apertura y pluralidad con-
                                                                an la determinación del «mérito» como obje-
ceptual en el ámbito de la evaluación en varios
                                                                tivo de la evaluación, utilizan criterios es-
sentidos (Cabrera, 1986). A continuación desta-
                                                                tándares sobre los que los expertos o profe-
camos los puntos mas sobresalientes de esta plu-
                                                                sionales están de acuerdo. Se trata de mode-
ralidad conceptual.
                                                                los relacionados con la acreditación y el en-
 a) Diferentes conceptos de evaluación. Por                     juiciamiento profesional (Popham, 1980).
 una parte existe la clásica definición dada por
                                                                 Los autores (Stake, 1975; Parlett y Hamil-
 Tyler: la evaluación como el proceso de de-
                                                                ton, 1977; Guba y Lincoln, 1982; House,
 terminar el grado de congruencia entre las
                                                                1983) que acentúan el proceso de evaluación
 realizaciones y los objetivos previamente es-
                                                                al servicio de determinar el «valor» más que
 tablecidos, a la que corresponden los modelos
                                                                el «mérito» de la entidad u objeto evaluado,
 orientados hacia la consecución de metas.
                                                                abogan por que el criterio de valoración fun-
 Contrasta esta definición con aquella más am-
                                                                damental sean las necesidades contextuales
 plia que se propugna desde los modelos orien-
                                                                en las que ésta se inserta. Así, Guba y Lin-


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 22
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

 coln (1982) refieren los términos de la compa-                 g) Diferencias en el papel jugado por el
 ración valorativa; de un lado, las característi-               evaluador, lo que ha venido a llamarse eva-
 cas del objeto evaluado y, de otro, las necesi-                luación interna vs. evaluación externa. No
 dades, expectativas y valores del grupo a los                  obstante, una relación directa entre el eva-
 que les afecta o con los que se relaciona el ob-               luador y las diferentes audiencias de la eva-
 jeto evaluado.                                                 luación es reconocida por la mayoría de los
                                                                autores (Nevo, 1983; Weiss, 1983; Rutman,
 c) Pluralidad de procesos evaluativos de-                      1984).
 pendiendo de la percepción teórica que sobre
 la evaluación se mantenga. Los modelos de                      h) Pluralidad de audiencia de la evalua-
 evaluación citados y otros más que pueden en-                  ción y, por consiguiente, pluralidad en los
 contrarse en la bibliografía, representan dife-                informes de evaluación. Desde informes na-
 rentes propuestas para conducir una evalua-                    rrativos, informales, hasta informes muy es-
 ción.                                                          tructurados (Anderson y Ball, 1983).
 d) Pluralidad de objetos de evaluación. Co-                    i) Pluralidad metodológica. Las cuestiones
 mo dice Nevo (1983 y 1989), existen dos con-                   metodológicas surgen desde la dimensión de
 clusiones importantes que se obtienen de la                    la evaluación como investigación evaluativa,
 revisión de la bibliografía sobre la evaluación.               que viene definida en gran medida por la di-
 Por un lado, cualquier cosa puede ser objeto                   versidad metodológica.
 de evaluación y ésta no debería limitarse a es-
 tudiantes y profesores y, por otro, una clara                    El anterior resumen recoge las aportaciones
 identificación del objeto de evaluación es una               a la evaluación en los años setenta y ochenta, la
 importante parte en cualquier diseño de eva-                 época que se ha denominado época de la pro-
 luación.                                                     fesionalización (Stufflebeam y Skinkfield,
                                                              1987; Madaus y otros, 1991; Hernández, 1993;
 e) Apertura, reconocida en general por todos                 Mateo y otros, 1993), en la que además de los
 los autores, de la información necesaria en un               innumerables modelos de los setenta, se pro-
 proceso evaluativo para dar cabida no sólo a                 fundizó en los planteamientos teóricos y prác-
 los resultados pretendidos, sino a los efectos               ticos y se consolidó la evaluación como inves-
 posibles de un programa educativo, sea pre-                  tigación evaluativa en los términos antes defi-
 tendido o no. Incluso Scriven (1973 y 1974)                  nida. En este contexto, lógicamente, aparecen
 propone una evaluación en la que no se tenga                 muchas nuevas revistas especializadas como
 en cuenta los objetivos pretendidos, sino valo-              Educational Evaluation and Policy Analysis,
 rar todos los efectos posibles. Apertura tam-                Studies in Evaluation, Evaluation Review, New
 bién respecto a la recogida de información no                Directions for Program Evaluation, Evaluation
 sólo del producto final, sino también sobre el               and Program Planning, Evaluation News,..., se
 proceso educativo. Y apertura en la considera-               fundan asociaciones científicas relacionadas
 ción de diferentes resultados de corto y largo               con el desarrollo de la evaluación y las univer-
 alcance. Por último, apertura también en con-                sidades empiezan a ofrecer cursos y programas
 siderar no sólo resultados de tipo cognitivo,                de investigación evaluativa, no sólo en post-
 sino también afectivos (Anderson y Ball,                     grados y programas de doctorado, sino también
 1983).                                                       en planes de estudio para titulaciones de primer
                                                              y segundo ciclos.
 f) Pluralidad también reconocida de las fun-
 ciones de la evaluación en el ámbito educati-                6. La cuarta generación según Guba y
 vo, recogiéndose la propuesta de Scriven entre               Lincoln
 evaluación formativa y sumativa, y añadiéndo-
 se otras de tipo socio-político y administrati-                A finales de los ochenta, tras todo este
 vas (Nevo, 1983).                                            desarrollo antes descrito, Guba y Lincoln
                                                              (1989) ofrecen una alternativa evaluadora, que
Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 23
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ofrecen una alternativa evaluadora, que denomi-                 b) Para llevar a cabo lo anterior se necesita
nan cuarta generación, pretendiendo superar lo                  una postura de descubrimiento más que de
que según estos autores son deficiencias de las                 verificación, típica del positivismo.
tres generaciones anteriores, tales como una vi-
sión gestora de la evaluación, una escasa aten-                 c) No se tienen en cuenta suficientemente
ción al pluralismo de valores y un excesivo ape-                los factores contextuales.
go al paradigma positivista. La alternativa de
                                                                d) No se proporcionan medios para valora-
Guba y Lincoln la denominan respondente y
                                                                ciones caso por caso.
constructivista, integrando de alguna manera el
enfoque respondente propuesto en primer lugar                   e) La supuesta neutralidad de la metodolo-
por Stake (1975), y la epistemología postmoder-                 gía convencional es de dudosa utilidad
na del constructivismo (Russell y Willinsky,                    cuando se buscan juicios de valor acerca de
1997). Las demandas, las preocupaciones y los                   un objeto social.
asuntos de los implicados o responsables (stake-
holders) sirven como foco organizativo de la                    Partiendo de estas premisas, el evaluador es
evaluación (como base para determinar qué in-                 responsable de determinadas tareas, que reali-
formación se necesita), que se lleva a cabo dentro            zará secuencialmente o en paralelo, constru-
de los planteamientos metodológicos del para-                 yendo un proceso ordenado y sistemático de
digma constructivista.                                        trabajo. Las responsabilidades básicas del eva-
                                                              luador de la cuarta generación son las siguien-
  La utilización de las demandas, preocupaciones              tes:
y asuntos de los implicados es necesaria, según
Guba y Lincoln, porque:                                         1) Identificar todos los implicados con
                                                                riesgo en la evaluación.
 a) Son grupos de riesgo ante la evaluación y
 sus problemas deben ser convenientemente                       2) Resaltar para cada grupo de implicados
 contemplados, de manera que se sientan pro-                    sus construcciones acerca de lo evaluado y
 tegidos ante tal riesgo.                                       sus demandas y preocupaciones al respecto.

 b) Los resultados pueden ser utilizados en su                  3) Proporcionar un contexto y una metodo-
 contra en diferentes sentidos, sobre todo si es-               logía hermenéutica para poder tener en cuen-
 tán al margen del proceso.                                     ta, comprender y criticar las diferentes cons-
                                                                trucciones, demandas y preocupaciones.
 c) Son potenciales usuarios de la informa-
 ción resultante de la evaluación.                              4) Generar el máximo acuerdo posible
                                                                acerca de dichas construcciones, demandas y
 d) Pueden ampliar y mejorar el rango de la                     preocupaciones.
 evaluación.
                                                                5) Preparar una agenda para la negociación
 e) Se produce una interacción positiva entre                   acerca de temas no consensuados.
 los distintos implicados.
                                                                6) Recoger y proporcionar la información
   El cambio paradigmático lo justifican estos                  necesaria para la negociación.
autores porque:
                                                                7) Formar y hacer de mediador para un
 a) La metodología convencional no contem-                      «forum» de implicados para la negociación.
 pla la necesidad de identificar las demandas,
 preocupaciones y asuntos de los implicados.                    8) Desarrollar y elaborar informes para ca-
                                                                da grupo de implicados sobre los distintos
                                                                acuerdos y resoluciones acerca de los intere-



Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 24
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

 ses propios y de los de otros grupos (Stake,                     •Consecución de facilidades y acceso a la
 1986; Zeller, 1987).                                             información (Lincoln y Guba, 1985).
 9) Reciclar la evaluación siempre que queden                    3) Identificación de las audiencias (Guba y
 asuntos pendientes de resolución.                              Lincoln, 1982).
  La propuesta de Guba y Lincoln (1989) se ex-                    •Agentes.
tiende bastante en la explicación de la naturaleza
y características del paradigma constructivista en                •Beneficiarios.
contraposición con las del positivista.
                                                                  •Victimas.
  Cuando se habla de los pasos o fases de la eva-
                                                                 4) Desarrollo de construcciones conjuntas
luación en esta cuarta generación, sus proponen-
                                                                dentro de cada grupo o audiencia (Glaser y
tes citan doce pasos o fases, con diferentes subfa-
                                                                Strauss, 1967; Glaser, 1978; Lincoln y Gu-
ses en cada una de estas. Estos pasos son los si-
                                                                ba, 1985).
guientes:
                                                                 5) Contraste y desarrollo de las construc-
   1) Establecimiento de un contrato con un pa-
                                                                ciones conjuntas de las audiencias.
 trocinador o cliente.
                                                                  •Documentos y registros.
   •Identificación del cliente o patrocinador
   de la evaluación.                                              •Observación.
   •Identificación del objeto de la evaluación.                   •Literatura profesional.
   •Propósito de la evaluación (Guba y Lin-                       •Círculos de otras audiencias.
   coln, 1982).
                                                                  •Construcción ética del evaluador.
   •Acuerdo con el cliente por el tipo de eva-
   luación.                                                      6) Clasificación de las demandas, preocu-
                                                                paciones y asuntos resueltos.
   •Identificación de audiencias.
                                                                 7) Establecimiento de prioridades en los
   •Breve descripción de la metodología a                       temas no resueltos.
   usar.
                                                                 8) Recogida de información.
   •Garantía de acceso a registros y documen-
   tos.                                                          9) Preparación de la agenda para la nego-
                                                                ciación.
   •Acuerdo por garantizar la confidenciali-
   dad y anonimato hasta donde sea posible.                     10) Desarrollo de la negociación.

   •Descripción del tipo de informe a elabo-                    11) Informes (Zeller, 1987; Licoln y Guba,
   rar.                                                         1988).

   •Listado de especificaciones técnicas.                       12) Reciclado/revisión.

  2) Organización para reciclar la investiga-                   Para juzgar la calidad de la evaluación, se
 ción.                                                        nos ofrecen tres enfoques que se denominan
                                                              paralelo, el ligado al proceso hermenéutico y
   •Selección y entrenamiento del equipo eva-                 el de autenticidad.
   luador.



Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 25
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

  Los criterios paralelos, de confianza, se deno-               b) La evaluación es un proceso conjunto de
minan así porque intentan ser paralelos a los cri-              colaboración.
terios de rigor utilizados muchos años dentro del
paradigma convencional. Estos criterios han sido                c) la evaluación es un proceso de enseñan-
validez interna y externa, fiabilidad y objetivi-               za/aprendizaje.
dad. Sin embargo, los criterios deban ser acordes
                                                                d) La evaluación es un proceso continuo,
con el paradigma fundamentador (Morgan,
                                                                recursivo y altamente divergente.
1983). En el caso de la cuarta generación los
criterios que se ofrecen son los de credibilidad,               e) La evaluación es un proceso emergente.
transferencia, dependencia y confirmación (Lin-
coln y Guba, 1986).                                             f) La evaluación es un proceso con resul-
                                                                tados impredecibles.
  El criterio de credibilidad es paralelo al de va-
lidez interna, de forma que la idea de isomorfis-               g) La evaluación es un proceso que crea
mo entre los hallazgos y la realidad se reemplaza               realidad.
por el isomorfismo entre las realidades construi-
das de las audiencias y las reconstrucciones del                En esta evaluación, se retienen las caracterís-
evaluador atribuidas a ellas. Para conseguir esto             ticas del evaluador fruto de las tres primeras
existen varias técnicas, entre las que destacan las           generaciones, esto es, la de técnico, la de ana-
siguientes: a) el compromiso prolongado, b) la                lista y la de juez, pero estas deben ampliarse
observación persistente, c) el contraste con cole-            con destrezas para recoger e interpretar datos
gas, d) el análisis de casos negativos (Kidder,               cualitativos (Patton, 1980), con la de historia-
1981), e) la subjetividad progresiva y f) el con-             dor e iluminador, con la de mediador de jui-
trol de los miembros. La transferencia puede                  cios, así como un papel más activo como eva-
verse como paralela a la validez externa, la de-              luador en un contexto socio-político concreto.
pendencia es paralela al criterio de fiabilidad y la            Russell y Willinsky (1997) defienden las po-
confirmación puede verse como paralela a la                   tencialidades del planteamiento de la cuarta
objetividad.                                                  generación para desarrollar formulaciones al-
  Otra manera de juzgar la calidad de la evalua-              ternativas de práctica evaluadora entre los im-
ción es el análisis dentro del propio proceso, algo           plicados, incrementando la probabilidad de que
que encaja con el paradigma hermenéutico, a                   la evaluación sirva para mejorar la enseñanza
través de un proceso dialéctico.                              escolar. Esto requiere por parte del profesorado
                                                              el reconocimiento de otras posiciones, además
  Pero estos dos tipos de criterios, aunque útiles,           de la suya, la implicación de todos desde el
no son del todo satisfactorios para Guba y Lin-               principio del proceso y, por otra parte, el desa-
coln, que defienden con más ahínco los criterios              rrollo de aproximaciones más pragmáticas de
que denominan de autenticidad, también de base                la conceptualización de Guba y Lincoln, adap-
constructivista. Estos criterios incluyen los si-             tadas a las distintas realidades escolares.
guientes: a) imparcialidad, justicia, b) autentici-
dad ontológica, c) autenticidad educativa, d) au-             7. El nuevo impulso alrededor de Stuf-
tenticidad catalítica y e) autenticidad táctica               flebeam
(Lincoln y Guba, 1986).
                                                                Para terminar este recorrido analítico-
  Este análisis de la cuarta generación de pode-              histórico desde los primeros intentos de medi-
mos terminarlo con los rasgos con los que defi-               ción educativa hasta la actual investigación
nen Guba y Lincoln a la evaluación:                           evaluativa en educación, queremos recoger las
                                                              recomendaciones que más recientemente nos
 a) La evaluación es un proceso sociopolítico.                viene ofreciendo una de las figuras señeras de
                                                              este campo en la segunda mitad del siglo XX.


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 26
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Nos estamos refiriendo a Daniel L. Stufflebeam,                 Para evaluar la educación en una sociedad
proponente del modelo CIPP (el más utilizado) a               moderna, Stufflebeam (1994) nos dice que se
finales de los sesenta, desde 1975 a 1988 presi-              deben tomar algunos criterios básicos de refe-
dente del «Joint Committee on Standars for Edu-               rencia como los siguientes:
cational Evaluation» y actual director del «Eva-
luation Center» de la Western Michigan Univer-                  • Las necesidades educativas. Es necesario
sity (sede del Joint Committee) y del CREATE                    preguntarse si la educación que se propor-
(Center for Research on Educational Accounta-                   ciona cubre las necesidades de los estudian-
bility and Teacher Evaluation), centro auspiciado               tes y de sus familias en todos los terrenos a
y financiado por el Departamento de Educación                   la vista de los derechos básicos, en este caso,
del gobierno americano.                                         dentro de una sociedad democrática (Nowa-
                                                                kowski y otros, 1985).
  Recogiendo estas recomendaciones (Stuffle-
beam, 1994, 1998, 1999, 2000 y 2001), en las                    • La equidad. Hay que preguntarse si el sis-
que se han ido integrando ideas de diversos eva-                tema es justo y equitativo a la hora de pro-
luadores también notables, no sólo ofrecemos                    porcionar servicios educativos, el acceso a
una de las últimas aportaciones a la actual con-                los mismos, la consecución de metas, el de-
cepción de la investigación evaluativa en educa-                sarrollo de aspiraciones y la cobertura para
ción, sino que completamos en buena medida la                   todos los sectores de la comunidad (Kella-
visión del panorama actual, rico y plural, tras                 gan, 1982).
analizar la cuarta generación de Guba y Lincoln.
                                                                • La factibilidad. Hay que cuestionar la efi-
  Se parte de los cuatro principios del Joint                   ciencia en la utilización y distribución de re-
Committee (1981 y 1988), esto es, de la idea de                 cursos, la adecuación y viabilidad de las
que cualquier buen trabajo de investigación eva-                normas legales, el compromiso y participa-
luativa debe ser: a) útil, esto es, proporcionar                ción de los implicados y todo lo que hace
información a tiempo e influir, b) factible, esto               que el esfuerzo educativo produzca el
es, debe suponer un esfuerzo razonable y debe                   máximo de frutos posibles.
ser políticamente viable, c) apropiada, adecua-
                                                                • La excelencia como objetivo permanente
da, legítima, esto es, ética y justa con los impli-
                                                                de búsqueda. La mejora de la calidad, a par-
cados, y d) segura y precisa a la hora de ofrecer
                                                                tir del análisis de las prácticas pasadas y pre-
información y juicios sobre el objeto de la eva-
                                                                sentes es uno de los fundamentos de la in-
luación. Además, la evaluación se ve como una
                                                                vestigación evaluativa.
«transdisciplina», pues es aplicable a muchas
disciplinas diferentes y a muchos objetos diver-                Tomando el referente de estos criterios y sus
sos (Scriven, 1994).                                          derivaciones, Stufflebeam sumariza una serie
                                                              de recomendaciones para llevar a cabo buenas
  Stufflebeam invoca a la responsabilidad del
                                                              investigaciones evaluativas y mejorar el siste-
evaluador, que debe actuar de acuerdo a princi-
                                                              ma educativo. Estas recomendaciones son las
pios aceptados por la sociedad y a criterios de
                                                              siguientes:
profesionalidad, emitir juicios sobre la calidad y
el valor educativo del objeto evaluado y debe                   1) Los planes de evaluación deben satisfa-
asistir a los implicados en la interpretación y                 cer los cuatro requerimientos de utilidad,
utilización de su información y sus juicios. Sin                factibilidad, legitimidad y precisión (Joint
embargo, es también su deber, y su derecho, estar               Committee, 1981 y 1988).
al margen de la lucha y la responsabilidad políti-
ca por la toma de decisiones y por las decisiones               2) Las     entidades     educativas deben
tomadas.                                                        examinarse por su integración y servicio a
                                                                los principios de la sociedad democrática,
                                                                equidad, bienestar, etc.

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 27
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

 3) Las entidades educativas deben ser valo-                    9) La evaluación del contexto (necesida-
 radas tanto por su mérito (valor intrínseco, ca-               des, oportunidades, problemas en un área,...)
 lidad respecto a criterios generales) como por                 debe emplearse de manera prospectiva, para
 su valor (valor extrínseco, calidad y servicio                 localizar bien las metas y objetivos y definir
 para un contexto particular) (Guba y Lincoln,                  prioridades. Asimismo, la evaluación del
 1982; Scriven, 1991), como por su significa-                   contexto debe utilizarse retrospectivamente,
 ción en la realidad del contexto en el que se                  para juzgar bien el valor de los servicios y
 ubica. Scriven (1998) nos señala que usando                    resultados educativos, en relación con las
 otras denominaciones habituales, mérito tiene                  necesidades de los estudiantes (Madaus y
 bastante equivalencia con el término calidad,                  otros, 1991; Scriven, 1991)
 valor con el de relación coste-eficacia y signi-
 ficación con el de importancia. En todo caso,                  10) La evaluación de las entradas (inputs)
 los tres conceptos son dependientes del con-                   debe emplearse de manera prospectiva, para
 texto, sobre todo significación, de manera que                 asegurar el uso de un rango adecuado de en-
 entender la diferencia entre dependencia del                   foques según las necesidades y los planes.
 contexto y arbitrariedad es parte de la com-
                                                                11) La evaluación del proceso debe usarse
 prensión de la lógica de la evaluación.
                                                                de manera prospectiva para mejorar el plan
 4) La evaluación de profesores, instituciones                  de trabajo, pero también de manera retros-
 educativas, programas, etc, debe relacionarse                  pectiva para juzgar hasta qué punto la cali-
 siempre con el conjunto de sus deberes, res-                   dad del proceso determina el por qué los re-
 ponsabilidades y obligaciones profesionales o                  sultados son de un nivel u otro (Stufflebean
 institucionales, etc. Quizás uno de los retos                  y Shinkfield, 1987).
 que deben abordar los sistemas educativos es
                                                                12) La evaluación del producto es el medio
 la definición más clara y precisa de estos de-
                                                                para identificar los resultados buscados y no
 beres y responsabilidades. Sin ello, la eva-
                                                                buscados en los participantes o afectados por
 luación es problemática, incluso en el terreno
                                                                el objeto evaluado. Se necesita una valora-
 formativo (Scriven, 1991a).
                                                                ción prospectiva de los resultados para
 5) Los estudios evaluativos deben ser capa-                    orientar el proceso y detectar zonas de nece-
 ces de valorar hasta qué medida los profesores                 sidades. Se necesita una evaluación retros-
 y las instituciones educativas son responsables                pectiva del producto para poder juzgar en
 y rinden cuentas del cumplimiento de sus de-                   conjunto el mérito y el valor del objeto eva-
 beres y obligaciones profesionales (Scriven,                   luado (Scriven, 1991; Webster y Edwards,
 1994).                                                         1993; Webster y otros, 1994).

 6) Los estudios evaluativos deben proporcio-                   13) Los estudios evaluativos se deben apo-
 nar direcciones para la mejora, porque no bas-                 yar en la comunicación y en la inclusión sus-
 ta con emitir un juicio sobre el mérito o el va-               tantiva y funcional de los implicados (stake-
 lor de algo.                                                   holders) con las cuestiones claves, criterios,
                                                                hallazgos e implicaciones de la evaluación,
 7) Recogiendo los puntos anteriores, todo es-                  así como en la promoción de la aceptación y
 tudio evaluativo debe tener un componente                      el uso de sus resultados (Chelimsky, 1998).
 formativo y otro sumativo.                                     Más aún, los estudios evaluativos deben
                                                                conceptualizarse          y         utilizarse
 8) Se debe promover la autoevaluación pro-                     sistemáticamente como parte del proceso de
 fesional, proporcionando a los educadores las                  mejora educativa a largo plazo (Alkin y
 destrezas para ello y favoreciendo actitudes                   otros, 1979; Joint Committee, 1988; Stronge
 positivas hacia ella (Madaus y otros, 1991)                    y Helm, 1991; Keefe, 1994) y de
                                                                fundamento para la acción contra las
                                                                discriminaciones sociales (Mertens, 1999).
Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 28
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

 (Mertens, 1999). La evaluación para el desa-                 lógico desde el que se parte, pero apareciendo
 rrollo (empowerment evaluation), que defien-                 claros y contundentes algunos elementos co-
 de Fetterman (1994), es un procedimiento, de                 munes a todas las perspectivas como la contex-
 base democrática, de participación de los im-                tualización, el servicio a la sociedad, la diver-
 plicados en el programa evaluado, para pro-                  sidad metodológica, la atención, respeto y par-
 mover la autonomía de los mismos en la reso-                 ticipación de los implicados, etc., así como una
 lución de sus problemas. Weiss (1998) nos                    mayor profesionalización de los evaluadores y
 alerta de que la evaluación participativa in-                una mayor institucionalización de los estudios
 crementa la probabilidad de que se utilicen los              (Worthen y Sanders, 1991).
 resultados de la evaluación, pero también la de
 que sea conservadora en su concepción, pues                    El propio Stufflebeam (1998) reconoce el
 es difícil pensar que los responsables de una                conflicto de los planteamientos del Joint Com-
 organización pongan en cuestión el fundamen-                 mittee on Standards for Educational Evalua-
 to y el sistema de poder de la misma. Gene-                  tion con las posiciones de la corriente evalua-
 ralmente su interés es el cambio de cosas pe-                dora denominada postmodernista, representada,
 queñas.                                                      además de por Guba y Lincoln, por otros reco-
                                                              nocidos evaluadores como Mabry, Stake y
 14) Los estudios evaluativos deben emplear                   Walker, pero no acepta que existan razones
 múltiples perspectivas, múltiples medidas de                 para actitudes de escepticismo y frustración
 resultados, y métodos tanto cuantitativos co-                con las prácticas evaluadoras actuales, porque
 mo cualitativos para recoger y analizar la in-               existen muchos ámbitos de aproximación y el
 formación. La pluralidad y complejidad del                   desarrollo de estándares de evaluación es
 fenómeno educativo hace necesario emplear                    perfectamente compatible con la atención a los
 enfoques múltiples y multidimensionales en                   diversos implicados, valores, contextos socia-
 los estudios evaluativos (Scriven, 1991)                     les y métodos. Stufflebeam defiende una mayor
                                                              colaboración en la mejora de las evaluaciones,
 15) Los estudios evaluativos deben ser evalua-               estableciendo los estándares de manera partici-
 dos, incluyendo metaevaluaciones formativas                  pativa, pues cree que es posible la aproxima-
 para mejorar su calidad y su uso y metaeva-                  ción de planteamientos, con contribuciones
 luaciones sumativas para ayudar a los usuarios               importantes desde todos los puntos de vista.
 en la interpretación de sus hallazgos y propor-
 cionar sugerencias para mejorar futuras eva-                   Weiss (1998) también toma posiciones pare-
 luaciones (Joint Committee, 1981 y 1988; Ma-                 cidas cuando nos dice que las ideas constructi-
 daus y otros, 1991; Scriven, 1991; Stuffle-                  vistas deben hacernos pensar más cuidadosa-
 beam, 2001).                                                 mente al usar los resultados de las evaluacio-
                                                              nes, sintetizarlas y establecer generalizaciones,
  Estas quince recomendaciones proporcionan                   pero duda que todo haya que interpretarlo en
elementos esenciales para un enfoque de los es-               términos exclusivamente individuales, pues
tudios evaluativos que Stufflebeam denomina                   existen muchos elementos comunes entre las
objetivista y que se basa en la teoría ética de que           personas, los programas y las instituciones.
la bondad moral es objetiva e independiente de
los sentimientos personales o meramente huma-                 8. Para concluir: síntesis de enfoques
nos.                                                          modélicos y metodológicos de la evalua-
  Sin entrar en el debate sobre estas valoraciones            ción y la última perspectiva de Scriven
finales de Stufflebeam, ni en análisis comparati-               Tras este análisis del desarrollo de la evalua-
vos con otras propuestas, por ejemplo con las de              ción a lo largo del Siglo XX, parece oportuno,
Guba y Lincoln (1989), nos resulta evidente que               a modo de síntesis y de conclusión, recoger y
las concepciones de la investigación evaluativa               resaltar los que son considerados los principa-
son diversas, dependiendo del origen epistemo-


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 29
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

les modelos, planteamientos metodológicos, di-                como «persuasiones» mientras que House
seños, perspectivas y visiones de la evaluación               (1983) se refiere a «metáforas».
en la actualidad. Su análisis, de manera compac-
ta, es un complemento necesario para una visión                 Norris (1993) apunta que el concepto de mo-
como la histórica que, por su linealidad, tiene el            delo se utiliza con cierta ligereza al referirse a
riesgo de ofrecer una imagen disciplinar artifi-              concepción, enfoque o incluso método de eva-
ciosamente fraccionada.                                       luación. De Miguel (1989), por su parte, piensa
                                                              que muchos de los llamados modelos solamen-
  Hemos visto que en la década de los setenta y               te son descripciones de procesos o aproxima-
en sus alrededores se produce una especie de                  ciones a programas de evaluación. Darling-
eclosión de propuestas evaluativas, que tradicio-             Hammond y otros (1989) utilizan el término
nalmente han venido siendo denominadas como                   «modelo» por costumbre, pero indican que no
modelos (Castillo y Gento, 1995) y en algunos                 lo hacen en el sentido preciso que tiene el tér-
casos como diseños (Arnal y otros, 1992) de in-               mino en las ciencias sociales, esto es, apoyán-
vestigación evaluativa. Sabemos que existieron                dose en una estructura de supuestos interrela-
varias decenas de estas propuestas, pero muy                  cionales fundamentada teóricamente. Final-
concentradas en el tiempo, en la década citada.               mente diremos que el propio autor del modelo
De hecho, el asunto de los propuestos modelos                 CIPP, solamente utiliza esta denominación de
para la evaluación parece un tema prácticamente               manera sistemática para referirse a su propio
cerrado desde hace cuatro lustros. Ya no surgen               modelo (Stufflebeam y Shinkfield, 1987), utili-
nuevos modelos o propuestas, salvo alguna ex-                 zando los términos de enfoque, método, etc., al
cepción como vemos más adelante.                              referirse a los otros. Para nosotros, quizás sea
                                                              el término enfoque evaluativo el más apropia-
  A pesar de lo dicho, se sigue hablando de mo-               do, aunque aceptemos seguir hablando de mo-
delos, métodos y diseños en la literatura especia-            delos y diseños por simple tradición académi-
lizada, sobre todo buscando su clasificación de               ca.
acuerdo con diversos criterios, origen paradigmá-
tico, propósito, metodología, etc. También en las               Nuestra idea es que a la hora de plantearnos
clasificaciones, no sólo en los modelos, existe               una investigación evaluativa, no contamos to-
diversidad, lo que prueba que, además de dina-                davía con unos pocos modelos bien fundamen-
mismo académico en el terreno de la investiga-                tados, definidos, estructurados y completos,
ción evaluativa, todavía existe cierta debilidad              entre los que elegir uno de ellos, pero sí tene-
teórica al respecto.                                          mos distintos enfoques modélicos y un amplio
                                                              soporte teórico y empírico, que permiten al
  Nosotros ya hemos señalado con anterioridad                 evaluador ir respondiendo de manera bastante
(Escudero, 1993), que coincidimos con Nevo                    adecuada a las distintas cuestiones que le va
(1983 y 1989) en la apreciación de que muchos                 planteando el proceso de investigación, ayu-
de los acercamientos a la conceptualización de la             dándole a configurar un plan global, un orga-
evaluación (por ejemplo, el modelo respondiente,              nigrama coherente, un «modelo» científica-
el libre de metas, el de discrepancias, etc.) se les          mente robusto para llevar a cabo su evaluación
ha denominado indebidamente como modelos a                    (Escudero, 1993). ¿Cuáles son las cuestiones
pesar de que ninguno de ellos tenga el grado de               que hay que responder en este proceso de cons-
complejidad y de globalidad que debería acarrear              trucción modélica? Apoyándonos en las apor-
el citado concepto. Lo que un texto clásico en                taciones de diferentes autores (Worthen y San-
evaluación (Worthen y Sanders, 1973) denomina                 ders, 1973; Nevo, 1989; Kogan, 1989; Smith y
como «modelos contemporáneos de evaluación»                   Haver, 1990), deben responderse y delimitar su
(a los conocidos planteamientos de Tyler, Scri-               respuesta al construir un modelo de investiga-
ven, Stake, Provus, Stufflebeam, etc), el propio              ción evaluativa, los aspectos siguientes:
Stake (1981) dice que sería mejor denominarlo


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 30
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

   1) Objeto de la investigación evaluativa.                                    13) Evaluación de la propia investigación
                                                                               evaluativa / metaevaluación.
   2) Propósito, objetivos.
                                                                             Para definir estos elementos hay que buscar,
   3) Audiencias/implicados/clientela.                                     lógicamente, el apoyo de los diferentes enfo-
                                                                           ques modélicos, métodos, procedimientos, etc.,
   4) Énfasis/aspectos prioritarios o preferentes.
                                                                           que la investigación evaluativa ha desarrollado,
   5) Criterios de mérito o valor.                                         sobre todo en las últimas décadas.

   6) Información a recoger.                                                 Volviendo a los denominados modelos de los
                                                                           setenta y a sus clasificaciones, podemos reco-
   7) Métodos de recogida de información.                                  ger algunas de las aparecidas en la última dé-
                                                                           cada en nuestro entorno académico, apoyándo-
   8) Métodos de análisis.                                                 se en distintos autores. Así, por ejemplo, Arnal
   9) Agentes del proceso.                                                 y otros (1992) ofrecen una clasificación de lo
                                                                           que denominan diseños de la investigación
   10)    Secuenciación del proceso.                                       evaluativa, revisando las de diversos autores
                                                                           (Patton, 1980; Guba y Lincoln, 1982; Pérez,
   11)    Informes/utilización de resultados.                              1983; Stufflebeam y Shinkfield, 1987). Esta
                                                                           clasificación es la siguiente :
   12)    Límites de la evaluación.




                                   Tabla 1- Tipos de diseños de investigación educativa
                       Patton          Guba y Lincoln           Pérez             Stufflebeam y                Autores
   Perspectiva
                       (1980)             (1982)               (1983)            Shinkfield (1987)            creadores
                      Objetivos          Objetivos            Objetivos             Objetivos        Tyler (1950)
  Empírico-                                                                                          Rivlin (1971)
                   Análisis sistemas                       Análisis sistemas
  analítica                                                                                          Rossi y otros (1979)
                                                                                     Método
                                                                                                     Suchman (1967)
                                                                                    científico
                        CIPP                CIPP                CIPP                                 Stufflebeam (1966)

  Susceptibles     Crítica artística   Crítica artística   Crítica artística                         Eisner (1971)
  de comple-
  mentariedad         Adversario                                                  Contrapuesto       Wolf (1974)

                        UTOS               UTOS            Cronbach (1982)
                     Respondente        Respondente          Respondente           Respondente       Stake (1975
                     Iluminativo                             Iluminativo           Iluminativo       Parlett y Hamilton (1977)
  Humanístico-
  interpretativa
                      Sin metas           Sin metas                                 Sin metas        Scriven (1967)
                                                             Democrático                             MacDonald (1976)



 Por su parte, Castillo y Gento (1995) ofrecen                             humanísticos y holísticos (mixtos). Una sínte-
una clasificación de «métodos de evaluación»                               sis de estas clasificaciones es la siguiente:
dentro de cada uno de los modelos (paradigmas),
que ellos denominan conductivista-eficientistas,


Revista ELectrónica de Investigación y EValuación Educativa                      [ www.uv.es/RELIEVE ]                    pag. 31
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm




                             Tabla 2- Modelo conductista-eficientista
                Método/             Finalidad      Paradigma domi-   Contenido de            Rol del
                  autor             evaluativa           nante        evaluación           evaluador
            Consecución         Medición logro     Cuantitativo    Resultados           Técnico externo
            objetivos           objetivos
            Tyler (1940)

            CIPP                Información        Mixto            C (contexto)        Técnico externo
            Stufflebeam         para toma                           I (input)
            (1967)              decisiones                          P (proceso)
                                                                    P (producto)
            Figura              Valoración         Mixto            Antecedentes,       Técnico externo
            (countenance)       resultados y                        transacciones,
            Stake (1967)        proceso                             resultados
            CSE                 Información para   Mixto            Centrados en        Técnico externo
            Alkin (1969)        determinación de                    logros de
                                decisiones                          necesidades
            Planificación       Valoración         Mixto            U (unidades de      Técnico externo
            educativa           proceso y                               evaluación)
            Cronbach            producto                            T (tratamiento)
            (1982)                                                  O (operaciones)




                                         Tabla 3- Modelo humanístico
                Método/              Finalidad     Paradigma domi-    Contenido de            Rol del
                  autor             evaluativa           nante         evaluación           evaluador
            Atención al         Análisis de        Mixto           Todos los            Evaluador externo
            cliente             necesidades del                    efectos del          de     necesidades
            Scriven (1973)      cliente                            programa             del
                                                                                        cliente
            Contraposición      Opiniones para     Mixto            Cualquier aspecto   Árbitro externo
            Owens (1973),       decisión                            del programa        del debate
            Wolf (1974)         consensuada
            Crítica artística   Interpretación     Cualitativo      •   Contexto        Provocador
            Eisner (1981)       crítica de la                       •   Procesos        externo de
                                acción educativa                        emergentes      interpretaciones
                                                                    •   Relaciones de
                                                                        procesos
                                                                    •   Impacto en
                                                                        contexto




Revista ELectrónica de Investigación y EValuación Educativa         [ www.uv.es/RELIEVE ]              pag. 32
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm




                                          Tabla 4- Modelo holístico
                Método/             Finalidad    Paradigma domi-   Contenido de           Rol del
                 autor             evaluativa          nante        evaluación          evaluador
            Evaluación         Valoración de     Cualitativo     Resultado de       Promotor externo
            respondente        respuesta a                       debate total       de la interpreta-
            Stake (1976)       necesidades de                    sobre programa     ción
                               participantes                                        por los implicados
            Evaluación         Interpretación    Cualitativo       Elementos que    Promotor externo
            holística          educativa para                      configuran la    de la interpreta-
            MacDonald          mejorarla                           acción educativa ción
            (1976)                                                                  por los implicados
            Evaluación         Iluminación y     Cualitativo       Sistema de       Promotor externo
            iluminativa        comprensión de                      enseñanza y me- de la interpreta-
            Parlett y Hamil-   los componentes                     dio              ción
            ton                del programa                        de aprendizaje   por los implicados
            (1977)



  También Scriven (1994) ofrece una clasifica-                 mente el objetivo perseguido, es el criterio de
ción de los «modelos anteriores», previamente a                evaluación.
introducir su perspectiva transdisciplinar que                   A diferencia de Tyler, Stufflebeam ofrece
luego comentamos. Este autor identifica seis vi-               una perspectiva más amplia de los contenidos a
siones o enfoques alternativos en la fase «explo-              evaluar. Estos son las cuatro dimensiones que
siva» de los modelos, además de algunas más                    identifican su modelo, contexto (C) donde tiene
que denomina «exóticas» y que se mueven entre                  lugar el programa o está la institución, inputs
los modelos de jurisprudencia y de experto. A                  (I) elementos y recursos de partida, proceso (P)
continuación comentamos sucintamente estas                     que hay que seguir hacia la meta y producto
visiones y los «modelos» que se adscriben a                    (P) que se obtiene. Además, se deja constancia
ellas.                                                         de que el objetivo primordial de la investiga-
  La visión fuerte hacia la toma de decisiones                 ción evaluativa es la mejora, la toma de deci-
(Visión A) concibe al evaluador investigando                   siones para la mejora de todas y cada una de
con el objetivo de llegar a conclusiones evaluati-             las cuatro dimensiones antes citadas.
vas que le ayuden al que debe tomar decisiones.                  Scriven (1994) nos dice que Stufflebeam ha
Los que apoyan este enfoque se preocupan de si                 seguido desarrollando su perspectiva desde que
el programa alcanza sus objetivos, pero van más                desarrolló el CIPP. Sin embargo, uno de sus
allá, cuestionándose si tales objetivos cubren las             colaboradores en tal empresa, Guba, tomó
necesidades que deben cubrir. Esta posición es                 posteriormente una dirección diferente, tal
mantenida, aunque no la hiciera explícita, por                 como hemos visto al analizar la cuarta genera-
Ralph Tyler y extensamente elaborada en el mo-                 ción de la evaluación (Guba y Lincoln, 1989).
delo CIPP (Stufflebeam y otros, 1971).
                                                                 La visión débil hacia la toma de decisiones
  Según el planteamiento tyleriano, las decisio-               (Visión B) concibe al evaluador proporcionan-
nes acerca de un programa deben basarse en el                  do información relevante para la toma de deci-
grado de coincidencia entre los objetivos y los                siones, pero no le obliga a emitir conclusiones
resultados. El cambio de los alumnos, habitual-                evaluativas o críticas a los objetivos de los
                                                               programas. El representante teórico más genui-

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 33
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

no es Marv Alkin (1969), que define a la evalua-              poralización prevista. Este modelo es muy cer-
ción como un proceso factual de recogida y ge-                cano al control de programas en sentido con-
neración de información al servicio del que toma              vencional; es una especie de simulación de una
las decisiones, pero es éste el que tiene que tomar           evaluación.
las conclusiones evaluativas. Esta posición es
lógicamente popular entre los que piensan que la                La visión de la descripción fértil, rica, com-
verdadera ciencia no debe o no puede entrar en                pleta (Visión D) es la que entiende la evalua-
cuestiones de juicios de valor. El modelo de Al-              ción como una tarea etnográfica o periodística,
kin se conoce como CES (Centro para el Estudio                en la que el evaluador informa de lo que ve sin
de la Evaluación), planteando las siguientes fa-              intentar emitir afirmaciones valorativas o infe-
ses: valoración de las necesidades y fijación del             rir conclusiones evaluativas, ni siquiera en el
problema, planificación del programa, evalua-                 marco de los valores del cliente como en la
ción de la instrumentalización, evaluación de                 visión relativista. Esta visión ha sido defendida
progresos y evaluación de resultados.                         por Robert Stake y muchos de los teóricos bri-
                                                              tánicos. Se trata de una especie de versión na-
  La visión relativista (Visión C) también man-               turalista de la visión B, tiene algo de sabor re-
tiene la distancia de las conclusiones evaluativas,           lativista y a veces parece precursora de la vi-
pero usando el marco de valores de los clientes,              sión de la cuarta generación. Se centra en la
sin un juicio por parte del evaluador acerca de               observación, en lo observable, más que en la
esos valores o alguna referencia a otros. Esta                inferencia. Recientemente se le ha denominado
visión y la anterior han sido el camino que ha                como visión de la descripción sólida, fuerte,
permitido integrarse sin problemas en el «carro»              para evitar el término rica, que parece más
de la investigación evaluativa a muchos científi-             evaluativa.
cos sociales. De hecho, uno de los textos más
utilizados de evaluación en el ámbito de las cien-              Stake, en su primera etapa, es tayleriano en
cias sociales (Rossi y Freeman, 1993), toma pre-              cuanto a concepción evaluativa centrada en los
ferentemente esta perspectiva .                               objetivos planteados, proponiendo el método
                                                              de evaluación de la figura (Stake, 1967), como
  Las visiones B y C son las posiciones de los                rostro o imagen total de la evaluación. Esta gira
científicos entroncados con una concepción libre              en torno a los tres componentes, antecedentes,
de valores de la ciencia. En cambio, los que par-             transacciones y resultados, elaborando dos
ticipan de la visión A proceden de un paradigma               matrices de datos, una de descripción y otra de
diferente, probablemente debido a su conexión                 juicio. En la primera se recogen de un lado las
académica con la historia, la filosofía de la edu-            intenciones y de otro las observaciones y, en la
cación, la educación comparada y la administra-               segunda, las normas, lo que se aprueba y los
ción educativa.                                               juicios, lo que se cree que debe ser.
  Hace unos años Alkin (1991) revisó sus plan-                  A mitad de los setenta, Stake se aleja de la
teamientos de dos décadas atrás, pero siguió sin              tradición tayleriana de preocupación por los
incluir los términos de mérito, valor o valía; ter-           objetivos y revisa su método de evaluación
mina definiendo un Sistema de Información para                hacia un planteamiento que él califica como
la Gestión (Management Information System-                    «respondente» (Stake, 1975 y 1975a), asu-
MIS) para uso del que toma decisiones, pero no                miendo que los objetivos del programa pueden
ofrece valoraciones al respecto                               modificarse sobre la marcha, con la finalidad
                                                              de ofrecer una visión completa y holística del
  Pero la forma más simple de la visión relativis-            programa y responder a los problemas y cues-
ta (Visión C) es la desarrollada en el «modelo de             tiones reales que plantean los implicados. Se-
discrepancia» de evaluación de Malcolm Provus                 gún Stufflebeam y Shinkfield (1987), este mo-
(1971). Las discrepancias son las divergencias                delo hizo de Stake el líder de una nueva escue-
con la secuencia de tareas proyectadas y la tem-


Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 34
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

la de evaluación, que exige un método pluralista,               • Unidades (U) que son sometidas a evalua-
flexible, interactivo, holístico, subjetivo y orien-            ción, individuos o grupos participantes.
tado al servicio. Este modelo sugiere la «atención
al cliente» propuesta por Scriven (1973), valo-                 • Tratamiento (T) de la evaluación.
rando sus necesidades y expectativas.
                                                                • Operaciones (O) que lleva a cabo el eva-
  De manera gráfica, Stake (1975a) propone las                  luador para la recogida y análisis de datos,
fases del método a modo de las horas de un reloj,               así como para la elaboración de conclusio-
poniendo la primera en las doce horas y siguien-                nes.
do las siguientes fases, el sentido de las agujas
                                                                • Contexto en el que tiene lugar el programa
del reloj. Estas fases son las siguientes: 1) Hablar
                                                                y su evaluación.
con los clientes, responsables y audiencias, 2)
Alcance del programa, 3) Panorama de activida-                  En una investigación evaluativa concreta se
des, 4) Propósitos e intereses, 5) Cuestiones y               pueden dar varias unidades, varios tratamientos
problemas, 6) Datos para investigar los proble-               y varias operaciones, en definitiva varios (uto),
mas, 7) Observadores, jueces e instrumentos, 8)               dentro de un universo UTO de situaciones
Antecedentes, transacciones y resultados, 9) De-              admisibles.
sarrollo de temas, descripciones y estudio de
casos, 10) Validación (confirmación), 11) Es-                   Ernie House (1989), un teórico y un práctico
quema para la audiencia y 12) Reunión de infor-               de la evaluación bastante independiente de
mes formales. El evaluador puede seguir las fa-               corrientes en boga, también marcó el entronque
ses también en sentido contrario del reloj o en               social de los programas, pero se distinguía so-
cualquier otro orden.                                         bre todo por su énfasis de las dimensiones más
                                                              éticas y argumentales de la evaluación, quizás
  En el método respondente el evaluador ha de                 motivado por la ausencia de estas facetas en los
entrevistar a los implicados para conocer sus                 planteamientos de Cronbach y sus colaborado-
puntos de vista y buscar la confluencia de las                res.
diversas perspectivas. El evaluador deberá inter-
pretar las opiniones y diferencias de puntos de                 La visión constructivista de la cuarta gene-
vista (Stecher y Davis, 1990) y presentar una                 ración (Visión F) es la última de estas seis vi-
amplia gama de opiniones o juicios, en lugar de               siones que describe Scriven (1994), siendo
presentar sus conclusiones personales.                        mantenida por Guba y Lincoln (1989) y segui-
                                                              da por muchos evaluadores americanos y britá-
  La visión del proceso social (Visión E) que                 nicos. Ya hemos visto anteriormente que esta
cristalizó hace algo más de dos décadas alrededor             visión rechaza una evaluación orientada a la
de un grupo de la Universidad de Stanford, diri-              búsqueda de calidad, mérito, valor, etc., y favo-
gido por Lee J. Cronbach (1980), resta importan-              rece la idea de que ello es el resultado de la
cia a la orientación sumativa de la evaluación                construcción por individuos y la negociación
(decisiones externas sobre los programas y ren-               de grupos. Esto significa, según Scriven, que el
dición de cuentas), enfatizando la comprensión,               conocimiento científico de todo tipo es sospe-
la planificación y la mejora de los programas                 choso, discutible y no objetivo. Lo mismo le
sociales a los que sirve. Sus posiciones quedaban             ocurre a todo trabajo análitico como el análisis
claramente establecidas en noventa y cinco tesis              filosófico, incluido el suyo. Scriven apunta que
que han tenido una enorme difusión entre los                  el propio Guba ha sido siempre consciente de
evaluadores y los usuarios de la evaluación.                  las potenciales «autocontradicciones» de su
                                                              posición.
  En cuanto a los contenidos de la evaluación,
Cronbach (1983) propone que se planifiquen y                    De esta revisión de Scriven quedan al margen
controlen los siguientes elementos:                           algunas posiciones evaluativas tradicionalmen-
                                                              te recogidas y tratadas por los analistas. Así por

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 35
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ejemplo, Schuman (1967) ofrece un diseño eva-                 distinta de la aludida visión A y radicalmente
luativo basado en el método científico o, al me-              diferente de las restantes.
nos, en alguna variación o adaptación del mismo.
Owens (1973) y Wolf (1974 y 1975) proponen                      En la perspectiva transdisciplinar, la investi-
un método de contraposición o discusión que                   gación evaluativa tiene dos componentes: el
sobre un programa llevan a cabo dos grupos de                 conjunto de campos de aplicación de la evalua-
evaluadores, partidarios y adversarios, para pro-             ción y el contenido de la propia disciplina. Al-
porcionar información pertinente a quienes to-                go parecido a lo que ocurre a disciplinas como
man decisiones. Eisner (1971, 1975 y 1981)                    la estadística y la medición. En definitiva, la
plantea la evaluación en términos similares al                investigación evaluativa es una disciplina que
proceso de crítica artística.                                 incluye sus propios contenidos y los de otras
                                                              muchas disciplinas; su preocupación por el
  El propio Scriven (1967 y 1973) proponía hace               análisis y mejora se extiende a muchas disci-
años centrar la evaluación en la atención al clien-           plinas, es transdisciplinar.
te y no tanto en las metas previstas, puesto que
frecuentemente los logros no previstos son más                  Esta visión es objetivista como la A y defien-
importantes que los que figuran en la planifica-              de que el evaluador determine el mérito o el
ción del programa. Por ello, se suele denominar a             valor del programa, del personal o de los pro-
su enfoque como evaluación sin metas. El eva-                 ductos investigados. En tal sentido, se debe
luador determina el valor o mérito del programa               establecer de manera explícita y defender la
para informar a los usuarios; se trata algo así               lógica utilizada en la inferencia de conclusio-
como de un intermediario informativo (Scriven,                nes evaluativas a partir de las premisas defini-
1980).                                                        cionales y factuales. Así mismo, se deben per-
                                                              seguir las falacias argumentales de la doctrina
  La evaluación iluminativa (Parlett y Hamilton,              libre de valores (Evaluation Thesaurus, 1991).
1977) tiene un enfoque holístico, descriptivo e
interpretativo, con la pretensión de iluminar so-               En segundo lugar, la perspectia transdisci-
bre un complejo rango de cuestiones que se dan                plinar se orienta hacia el consumidor, más que
de manera interactiva (Fernández, 1991). La eva-              hacia el gestor o intermediario. No se trata de
luación democrática de MacDonald (1971 y                      una orientación exclusiva hacia el consumidor,
1976), también denominada holística, supone la                pero sí la consideración primera del consumi-
participación colaborativa de los implicados,                 dor como justificación del programa, y que el
siendo el contraste de opiniones de los implica-              bien común es la primacía de la evaluación. A
dos el elemento evaluativo primordial.                        partir de aquí, también se produce información
                                                              valiosa para el gestor que decide y se pueden
  Scriven (1994) analiza las seis visiones críti-             analizar los productos de un programa o insti-
camente y se muestra más cercano a la visión A,               tución a la vista de sus objetivos. Esta posición
la visión fuerte sobre la toma de decisiones, re-             no sólo ve legitimidad en la emisión de conclu-
presentada fundamentalmente por el modelo                     siones evaluativas por parte del investigador,
CIPP de Stufflebeam y sus planteamientos, pues                sino que ve necesidad de hacerlo en la gran
dice que es la más cercana de todas a la visión               mayoría de las ocasiones.
del sentido común, que es la que tienen los eva-
luadores trabajando con sus programas, de la                    Se trata también de una visión generalizada,
misma manera que los médicos trabajan con los                 no justamente una visión general, que incluye
pacientes, haciéndolo lo mejor posible, indepen-              la generalización de conceptos en el ámbito del
dientemente del tipo y del estado general del                 conocimiento y la práctica. Desde esta perspec-
paciente. Scriven quiere extender esta visión con             tiva, la investigación evaluativa es mucho más
una visión o modelo que denomina transdiscipli-               que la evaluación de programas e incide en
nar y que él califica como significativamente                 procesos, instituciones y otros muchos más



Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 36
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

objetos. De manera más detallada, esta visión                 sentido estricto. Pensamos que esta orientación
generalizada significa que:                                   debe integrarse dentro de una orientación a los
                                                              implicados, donde existen distintos tipos y dis-
 a) Los campos distintivos de aplicación de la                tintas audiencias y, por supuesto, una muy im-
 disciplina son los programas, el personal, los               portante, son los usuarios en el sentido de Scri-
 rendimientos, los productos, los proyectos, la               ven, pero nos parece que la investigación eva-
 gestión, y la metaevaluación de todo ello.                   luativa hoy en día tiene una orientación priori-
                                                              taria más plural que la defendida por este au-
 b) Las investigaciones evaluativas inciden en
                                                              tor.
 todo tipo de disciplinas y en las prácticas que
 resultan de ellas.                                           Referencias bibliográficas
 c) Las investigaciones evaluativas se mueven                 Ahman, S. J. y Cook, M. D. (1967). Evaluating
 desde niveles muy prácticos hasta el nivel                    Pupil Growth. Principles of Tests Measure-
 conceptual.                                                   ment. Boston, Ma.: Allyn and Bacon
                                                              Alkin, M. (1969). Evaluation theory develop-
 d) Los distintos campos de la investigación                   ment. Evaluation Comment, 2, 1, 2-7.
 evaluativa tienen muchos niveles de interco-
                                                              Alkin, M. (1991). Evaluation theory develop-
 nexión y solapamiento. La evaluación de pro-
                                                               ment: II. En M. McLaughlin, y Phillips (Eds.),
 gramas, de personal, de centros, etc., tienen
                                                               Evaluation and education at quarter century
 muchos puntos en común.
                                                               (pp.91-112). Chicago: NSSE/ University of
  El cuarto elemento distintivo de la visión                   Chicago .
transdisciplinar de la evaluación es que se trata             Anderson, S. B. y Ball, S. (1983). The profes-
de una visión técnica. La evaluación no sólo ne-               sion and practice of program evaluation. San
cesita el apoyo técnico de otras muchas discipli-              Francisco, Ca: Jossey-Bass.
nas, sino que, además, tiene su propia metodolo-              Arnal, J.; Del Rincon, D. y Latorre, A. (1992).
gía. La lógica de la síntesis de resultados, las               Investigación educativa. Fundamentos y Me-
consecuencias, etc., y la correcta ubicación en el             todología. Barcelona: Labor
proceso de muchas técnicas auxiliares en las que,             Atkin, J. M. (1968). Behavioral Objectives in
probablemente, no es necesario ser un gran espe-               curriculum design: A cautionary note. The
cialista, pero sí tener un conocimiento cabal.                 Science Teacher, 35, 27-30.
                                                              Baker, L. R. (1969). Curriculum evaluation.
  Esta perspectiva transdisciplinar de la investi-             Review of Educational Research, 39, 339-358.
gación evaluativa de Scriven (1994), coincide en              Barbier, J. M. (1993). La evaluación en los
gran medida con los planteamientos que de la                   procesos de formación. Barcelona: Paidos.
misma hemos defendido en otros momentos (Es-
                                                              Berk, A. R. (Ed.) (1981). Educational evalua-
cudero, 1996). Nosotros no tenemos unas posi-
                                                               tion methodology: The state of the art. Balti-
ciones contrarias a las otras visiones en la misma
                                                               more: The Hopkins University Press.
medida que las tiene Scriven y, de hecho, consi-
                                                              Blanco, F. (1994). La evaluación en la educa-
deramos desde una posición pragmática, que
                                                               ción secundaria. Salamanca: Amasú Edicio-
todas las visiones tienen puntos fuertes y que en
                                                               nes.
todo caso, aportan algo útil para la comprensión
conceptual y el desarrollo de la investigación                Bloom, B. S., Engelhaut, M.D., Furst, E.J.,
evaluativa. Sin embargo, sí que pensamos que                   Hill, W.H. y Krathwohl, D.R. (1956). Taxo-
esta moderna visión de Scriven es sólida y cohe-               nomy of educational objectives Handbook I;
rente y ampliamente aceptada en la actualidad.                 Cognitive domain. New York: Davis, McKay.
                                                              Bloom, B. S., Hastings, J. Th. y Madaus, F.
   Una crítica que podría hacerse a este plantea-              (1971). Handbook on formative and summati-
miento de Scriven está en el excesivo énfasis                  ve evaluation of student learning. New York:
relativo de la orientación al cliente, al usuario en           McGraw-Hill.

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 37
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Bloom, B.S., Hastings, T. y Madaus G. (1975).                 De Miguel, M. (1989). Modelos de investiga-
 Evaluación del aprendizaje. Buenos Aires: Tro-                ción sobre organizaciones educativas. Revista
 quel.                                                         de Investigación Educativa, 7, 13, 21-56.
Bonboir, A. (1972). La Docimologie. Paris: PUF.               Dubois, P. H. (1970). A History of Psychologi-
Cabrera, F. (1986). Proyecto docente sobre técni-              cal Testing. Boston: Allyn Bacon.
 cas de medición y evaluación educativas. Barce-              Ebel, R. L. (1977). Fundamentos de la medi-
 lona: Universidad de Barcelona.                               ción educacional. Buenos Aires: Guadalupe.
Carreño, H. F. (1977). Enfoques y principios                  Eisner, E. W. (1967). Educational objectives:
 teóricos de la evaluación. Mexico: Trillas.                   Help or hindrance?. The School Review, 75,
Castillo, S. y Gento, S. (1995). Modelos de eva-               250-260.
 luación de programas educativos. En A.Medina                 Eisner, E. W. (1969, Instructional and expres-
 y L. M. Willar (Coord.), Evaluación de progra-                sive educational objectives: their formulation
 mas educativos, centros y profesores (pp.25-69).              and use in curriculum. En J. Popham (Ed.),
 Madrid: Editorial Universitas, S. A..                         Instructional objectives (pp. 1-18). Chicago:
Chelimsky, E. (1998). The role of experience in                AERA.
 formulating theories of evaluation practice.                 Eisner, E. (1971). Emerging models for educa-
 American Journal of Evaluation 19, 1, 35-55.                  tional evaluation. School Review, 2.
Coffman, W. E. (1971). Essay examinations. En                 Eisner, E. W. (1975). The perceptive eye: To-
 R.L. Thorndike (Ed.) Educational Measurement.                 ward the reformation of educational evalua-
 Washington , DC: American Council on Educa-                   tion. Stanford, Ca: Stanford Evaluation Con-
 tion.                                                         sortion.
Cronbach, L. J. (1963). Course improvement                    Eisner, E. W. (1981). The methodology of qua-
 through evaluation. Teachers College Record,                  litative evaluation: the case of educational
 64, 672-683.                                                  connoisseurship and educational criticism.
Cronbach, L. J. (1982). Designing evaluations of               Stanford, Ca: Stanford University .
 educational and social programs. Chicago: Jos-               Eisner, W. E. (1985). The art of educational
 sey-Bass.                                                     evaluation. London: The Falmer Press.
Cronbach, L. J., Hambron, S.R., Dornbusch,                    Escudero, T. (1993). Enfoques modélicos en la
 S.M., Hess, R.D., Hornick, R.C., Phillips, D.C.,              evaluación de la enseñanza universitaria, Ac-
 Walker, D.F. y Weiner, S.S. (1980). Towards                   tas de las III Jornadas Nacionales de Didáctica
 reform in program evaluation: Aims, methods                   Universitaria «Evaluación y Desarrollo Profe-
 and institutional arrangements. San Francisco:                sional» (pp. 5-59). Las Palmas: Servicio de
 Jossey-Bass.                                                  Publicaciones, Universidad de Las Palmas.
Cronbach, L. J. y Suppes, P. (1969). Research for             Escudero, T. (1996). Proyecto docente e inves-
 tomorrow's schools: Disciplined inquiry for                   tigador. Zaragoza: Universidad de Zaragoza.
 education. New York: MacMillan.                              Fernández Ballesteros, R. (1981). Perspectivas
Darling-Hammond, L., Wise, AE, & Pease, SR                     históricas de la evaluación conductual. En R.
 (1989). Teacher evaluation in the organizational              Fernández, y J.A.I Carrobles. (Ed.), Evalua-
 context: A review of the literature. En E. R.                 ción conductual. Madrid: Ediciones Pirámide.
 House (Ed.) New directions in educational eva-               Fernández de Castro, J. (1973). La enseñanza
 luation (pp.203-253). London: The Falmer Pre-                 programada. Madrid: CSIC.
 ss.                                                          Fernández, J. (1991). La evaluación de la cali-
De la Orden, A. (1985). Investigación evaluativo.              dad docente. En A. Medina (Coord.), Teoría y
 En Arturo De la Orden. (Ed.), Investigación                   métodos de evaluación. Madrid: Cincel.
 educativa. Diccionario de Ciencias de la Educa-              Fetterman, D. M. (1994). Empowerment
 ción (pp.133-137). Madrid: Anaya.                             evaluation. Evaluation Practice, 15, 1, 1-15.
                                                              Gagne, R. M. (1971). Las condiciones del
                                                               aprendizaje. Madrid: Aguilar.

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 38
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Gil, E. (1992). El sistema educativo de la Com-               Joint Committee on Standards for Educational
 pañía de Jesús. La «Ratio Studiorum». Madrid:                 Evaluation (1988). The personnel evaluation
 UPCO.                                                         standards. Newbury Park, CA.: Sage.
Glaser, B. G. (1978). Theoretical sensitivity. Mill           Keefe, J. (1994). School evaluation using the
 Valley, Ca: Sociology Press.                                  CASE-IMS model and improvement process.
Glaser, B. G. y Strauss, A. L. (1967). The disco-              Studies in Educational Evaluation, 20,1, 55-
 very of grounded theory. Chicago: Aldine.                     67.
Glaser, R. (1963). Instructional technology and               Kellaghan, T. (1982). La evaluación educativa.
 the measurement of learning outcomes: some                    Bogotá: Universidad Pontificia Javierana.
 questions. American Psychologists, 18, 519-                  Kidder, L. H. (1981). Qualitative research and
 521.                                                          quasi-experimental frameworks. En M. B.
Glaser, R. (Dir.) (1965). Teaching machines and                Brewer y B. E. Collins, (Eds.), Scientific in-
 programmed learning. Washington: National                     quiry and the social sciences. San Francisco:
 Education Association.                                        Jossey-Bass.
Gronlund, N. E. (1985). Measurement and eva-                  Kogan, M. (Ed.) (1989). Evaluating higher
 luation in teaching. New York: MacMillan,                     education. London: Jessica Kingsley Publis-
Guba, G. E. y Lincoln, Y. S. (1982). Effective                 hers.
 evaluation. San Francisco: Jossey Bass Publis-               Krathwohl, R. D., Blomm, B.S. y Masia, B.B.
 hers.                                                         (1964). Taxonomy of educational objectives.
Guba, E. G. y Lincoln, Y. S. (1989). Fourth Ge-                Handbook II: Affective domain. New Cork:
 neration Evaluation. Newbury Park, Ca.: Sage                  Davis McKay.
 Publications                                                 Lewy, A. (Ed.) (1976). Manual de evaluación
Gullicksen, H. (1950). Theory of mental tests.                 formativa del currículo. Bogotá : Volun-
 New York: Wiley                                               tad/Unesco.
Hambleton, R. K. (1985). Criterion-referenced                 Lincoln, y. S. y Guba, E. G. (1985). Naturalis-
 measurement.En Encyclopedia of Educational                    tic inquiry. Beverly Hills, CA: Sage.
 Research. New York: McMillan.                                Lincoln, y. S. y Guba, E. G. (1986). But is it
Hammond, R. L. (1983). Evaluation at the local                 rigorous? Trustworthiness and authenticity in
 level. En B. R. Worthen y J. R. Sanders, Educa-               naturalistic evaluation. en D. D. Williams
 tional Evaluation: Theory and Practice. Wort-                 (Ed.), Naturalistic evaluation. San Francisco:
 hington, Ohio: Charles A. Jones Publishing                    Jossey-Bass.
 Company.                                                     Lincoln, y. S. y Guba, E. G. (1988). Criteria for
Hernández, F. (1993). Proyecto docente e inves-                assessing naturalistic inquiries as products.
 tigador. Murcia.                                              Paper presented at the American Educational
Horowitz, R. (1995). A 75-year legacy on as-                   Research Association, New Orleans, LA.
 sessment: Reflections from an interview with                 Lindquist, E. F. (1953). Design and Analysis of
 Ralph W. Tyler. The Journal of Educational Re-                Experiments in Psychology and Education.
 search, 89, 2, 68-75.                                         Boston, Ma.: Houghton Mifflin Company.
House, E. R. (1983). How we think about evalua-               Lindvall, C. M., (Ed.) (1964). Defining educa-
 tion. En House, E. R., Philosophy of evaluation.              tional objectives. Pittsburg: University of
 San Francisco, Ca.: Jossey-Bass                               Pittsburgh Press.
House, E. R. (1989). Evaluating with validity.                Macdonald, B. (1971). The evaluation of the
 Newbury Park, Ca.: Sage.                                      Humanities Curriculum Project: a holistic ap-
Joint Committee on Standards for Educational                   proach. Theory into Practice, 10, 3, 163-169.
 Evaluation (1981, Standards for evaluations of               Macdonald, B. (1976). Evaluation and the con-
 educational programs, projects, and materials.                trol of education. En D. Tawney (Ed.), Curri-
 New York.: McGraw-Hill.                                       culum evaluation today: trends and implica-
                                                               tions, 125-136. London: McMillan.

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 39
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Madaus, G. F. y otros (1991). Evaluation Mo-                   School of Education , University of East An-
 dels. Viewpoints on Educational and Human                     glia .
 Services Evaluation. Hingham , Mass.: Kluwer-                Nowalowski, Jeri, Mary Anne Bunda, Russell
 Nijhoff Publishing.                                           Working (1985). A Handbook of Educational
Mager, R. F. (1962). Preparing instructional ob-               Variables. Boston: Kluwer-Nijhoff .
 jective. Palo Alto, CA.: Fearon.                             Nunnally, J. C. (1978). Psychometric Theory.
Mager, R. F. (1973). Análisis de metas. México:                New York: McGraw Hill.
 Trillas.                                                     Owens, T. R. (1973). Educational evaluation
Mann, H., (1845). Boston Grammar and Writing                   by adversery proceedings. En E.R. House
 Schools. Common School Journal, October, 7,                   (Comp.), School Evaluation: The Politics and
 19.                                                           Process. Berkeley: McCutchan.
Martínez de Toda, M. J. (1991). Metaevaluación                Parlett, M. y Hamilton , d. (1977). Evaluation
 de necesidades educativas: Hacia un sistema de                as illumination: A new approach to the study
 normas. Tesis doctoral. Madrid: Universidad                   of innovative programmes. En Hamilton D. y
 Complutense.                                                  otros (Eds.), Beyond the numbers game. Lon-
Mateo, J. (1986). Proyecto docente e investiga-                don: MacMillan.
 dor. Barcelona: Universidad de Barcelona.                    Patton, M. Q. (1980). Qualitative Evaluation
Mateo, J. y otros (1993). La evaluación en el aula             methods. Beverly Hills, Ca.: Sage
 universitaria. Zaragoza: ICE-Universidad de Za-              Pérez, A. (1983). Modelos contemporáneos de
 ragoza.                                                       evaluación. En J. Gimeno y A. Pérez, La en-
Mccall, W. A. (1920). A new kind of school                     señanza: su teoría y su práctica (pp. 426-449).
 examination. Journal of Educational Research,                 Madrid: Akal
 January.                                                     Phillips, R. C. (1974). Evaluation in education.
McReynold, P. (1975). Advances in Psychologi-                  Columbus, Ohio: Merril.
 cal Assessment, vol. III.San Francisco: Jossey-              Pieron, H. (1968). Vocabulaire de la psycholo-
 Bass.                                                         gie. Paris: PUF.
Mertens, D. M. (1999). Inclusive evaluation:                  Pieron, H. (1969). Examens et Docimologie.
 Implications of transformative theory for eva-                PUF, Paris.
 luation. American Journal of Evaluation, 20, 1,              Planchard, E. (1960). La investigación
 1-14.                                                         pedagógica. Madrid: Ediciones Fas.
Metfessel, N. S. y Michael, W. B. (1967). A pa-               Popham, W. J. (1970). Establishing instructio-
 radigm involving multiple criterion measures                  nal goals. Englewood Cliffs, N. J.: Prentice
 for the evaluation of effectiveness of school                 Hall.
 programs. Educational and Psychological Mea-                 Popham, W. J. (1980). Problemas y técnicas de
 surement, 27, 931-943.                                        la evaluación educativa. Madrid: Anaya.
Morgan, G. (1983). Beyond method. Beverly                     Popham, W. J. (1983). Evaluación basada en
 Hills, Ca: Sage.                                              criterios. Madrid: Magisterio Español, S. A..
Nevo, D. (1983). The conceptualization of                     Popham, W. y Baker, E. L. (1970). Systematic
 educational evaluation: An analytical review of               Instruction. Englewood Cliffs, NJ.: Prentice
 the literature. Review of Educational Research,               Hall.
 53, 1, 117-128.                                              Provus, M. (1971). Discrepancy evaluation.
Nevo, D. (1989). The conceptualization of                      For educational program improvement and
 educational evaluation: An analytical review of               assessment. Berkeley, Ca.: McCutchan Pu-
 the literature. En E. R. House (Ed.), New                     blishing Co.
 directions in educational evaluation. London :               Rivlin, A. M. (1971). Systematic thinking for
 The Falmer Press, 15-29.                                      social action. Washington, D.C.: Brookings
Norris, N. (1993). Understanding educational                   Institute.
 evaluation. London : Kogan Page/CARE,

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 40
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Rodríguez, T. y otros (1995). Evaluación de los               Smith, E. R. y Tyler, R. W. (1942). Appraising
 aprendizajes. Aula Abierta Monografías 25.                    and recording student progress. New York:
 Oviedo: ICE-Universidad de Oviedo.                            Harper & Row,.
Rosenthal, J. E. (1976). Evaluation history. En S.            Smith, N. L. y Haver, d. M. (1990). The appli-
 B. Anderson, y otros (Eds.), Encyclopedia of                  cability of selected evaluation models to evol-
 Educational Evaluation. San Francisco: Jossey                 ving investigative designs. Studies in Educa-
 Bass Publishers.                                              tional Evaluation, 16, 3, 489-500.
Rossi, P. H. y Freeman, H. (1993). Evaluation: A              Stacher, B. M. y Davis, W. A. (1990). How to
 Systematic Approach. Beverly Hills , Ca.: Sage.               Focus on Evaluation. Newbury Park, Ca.: Sa-
Rossi, P. H. y otros (1979). Evaluation: A syste-              ge.
 matic approach. Beverly Hills , Ca.: Sage.                   Stake, R. E. (1967). The countenance of educa-
Russell, N. y Willinsky, J. (1997). Fourth genera-             tional evaluation. Teacher College Record, 68,
 tion educational evaluation: The impact of a                  523-540.
 post-modern paradigm on school based evalua-                 Stake, R. E. (1975a). Program evaluation: par-
 tion. Studies in Educational Evaluation, 23, 3,               ticularly responsive evaluation. Occasional
 187-199.                                                      Paper, 5. University of Western Michigan.
Rutman, L. (Ed.) (1984). Evaluation research                  Stake, R. E. (1975b). Evaluating the arts in
 methods: A base guide. Beverly Hills, Ca.: Sa-                education: A responsive approach. Ohio: Me-
 ge.                                                           rril .
Rutman, L. y Mowbray, G. (1983). Understan-                   Stake, R. E. (1976). A theoretical stament of
 ding program evaluation. Beverly Hills, Ca.:                  responsive evaluation. Studies in Educational
 Sage.                                                         Evaluation, 2 , 19-22.
Salvador, L. (1992). Proyecto docente., Univer-               Stake, R. E. (1981). Setting standars for educa-
 sidad de Cantabria.                                           tional evaluators. Evaluation News, 22, 148-
Scriven, M. (1967). The methodology of evalua-                 152.
 tion. En Perspectives of Curriculum Evaluation,              Stake, R. E. (1986). Quieting reform. Urbana:
 (pp. 39-83). AERA Monograph 1. Chicago :                      University of Illinois Press.
 Rand McNally and Company.                                    Stenhouse, L. (1984). Investigación y desarro-
Scriven, M. (1973). Goal-free evaluation. En E.                llo del curriculum. Madrid: Morata.
 R. House (Ed.), School evaluation: The politics              Stronge, J. H. y Helm, V. M. (1991). Evalua-
 and process,(pp. 319-328). Berkeley, CA.:                     ting professional support personnel in educa-
 McCutchan.                                                    tional settings. Newbury Park, Ca: Sage.
Scriven, M. (1974). Prose and cons about goal-                Stufflebeam, D. L. (1966). A depth study of the
 free evaluation. Evaluation Comment, 3, 1-4.                  evaluation requeriment. Theory into Practice,
Scriven, M. (1980). The logic of evaluation. In-               5, 3, 121-134.
 verness , Ca.: Edgepress                                     Stufflebeam, D. L. (1994). Introduction: Re-
Scriven, M. (1991, Evaluation Thesaurus. New-                  commendations for improving evaluations in
 bury Park , Ca.: Sage                                         U. S. public schools. Studies in Educational
Scriven, M. (1991a). Duties of the teacher. Ka-                Evaluation, 20, 1, 3-21.
 lamazoo, Mi.: Center for Research on Educatio-               Stufflebeam, D. L. (1998). Conflicts between
 nal Accountability and Teacher Evaluation.                    standards-based and postmodernist evalua-
Scriven, M. (1994). Evaluation as a discipline.                tions: Toward rapprochement. Journal of Per-
 Studies in Educational Evaluation, 20, 1, 147-                sonnel Evaluation in Education, 12, 3, 287-
 166.                                                          296.
Scriven, M. (1998). Minimalist theory: The least              Stufflebeam, D. L. (1999). Using profesional
 theory that practice require. American Journal                standards to legally and ethically release eva-
 of Evaluation 19, 1, 57-70.                                   luation findings. Studies in Educational
                                                               Evaluation, 25, 4, 325-334.

Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 41
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Stufflebeam, D. L. (2000). Guidelines for deve-               Walberg, H. J. y Haertel, G. D. (Ed.) (1990).
 loping evaluation checklists. Consultado en                   The International Encyclopedia of Educatio-
 www.wmich.edu/evalctr/checklists/ el 15 de Di-                nal Evaluation. Oxford: Pergamon Press.
 ciembre de 2002.                                             Webster, W. J. y Edwards, M. E. (1993). An
Stufflebeam, D. L. (2001). The metaevaluation                  accountability system for school improve-
 imperative. American Journal of Evaluation, 22,               ment, Paper presented at the annual meeting
 2, 183-209.                                                   (April) of the AERA. Atlanta, GA.
Stufflebeam, D. L., Foley, WJ, Gephart, WJ,                   Webster, W. J., Mendro, R.L. y Almaguer,
 Guba, EG, Hammond, RL, Merriman, HO &                         T.O. (1994). Effectiveness indices: A «value
 Provus, MM (1971). Educational Evaluation                     added» approach to measuring school effect.
 and Decision-making, Itasca, Illinois : F. E.                 Studies in Educational Evaluation, 20, 1, 113-
 Peacock Publishing.                                           137.
Stufflebeam, D. L. y Shinkfield, A. J. (1987).                Weiss, C. H. (1983). Investigación evaluativa.
 Evaluación sistemática. Guía teórica y práctica.              Métodos para determinar la eficiencia de los
 Barcelona: Paidos/MEC.                                        programas de acción. México: Trillas,.
Suchman, E. A. (1967). Evaluative Research:                   Weiss, C. H. (1998). Have we learned anything
 Principles and Practice in Public Service and                 new about the use of evaluation?. American
 Social Action Programs. New York : Russell                    Journal of Evaluation, 19, 1, 21-33.
 Sage Foundation.                                             Wilson, A. R. J. (1978). La evaluación de los
Sunberg, N. D. (1977). Assessment of person.                   objetivos. En J. A. R. Wilson (Ed.), Funda-
 Englewood Cliffs, N.J.: Prentice Hall.                        mentos psicológicos del aprendizaje y la en-
Taba, H. (1962). Curriculum development. Theo-                 señanza (pp. 549-578). Madrid: Anaya..
 ry and practice. New York: Harcourt Brace .                  Wolf, R. L. (1974). The citizen as jurist: A new
Thorndike, E. L,. (1904). An Introduction to the               model of educational evaluation. Citizen Ac-
 Theory of Mental and Social Measurements.                     tion in Education, 4.
 New York: Teacher College Press, Columbia                    Wolf, R. L. (1975). Trial by jury: a new eva-
 University .                                                  luation method. Phi Delta Kappa, 57, 185-
Tyler, R. W. (1950). Basic principles of curricu-              187.
 lum and instruction. Chicago: University of                  Worthen, B. R. y Sanders, J. R. (1973). Educa-
 Chicago Press .                                               tional Evaluation: Theory and Practice. Wort-
Tyler, R. W. (1967). Changing concepts of edu-                 hington, Ohio: Charles a. Jones Publishing
 cational evaluation. En R. E. Stack (Comp.),                  Company.
 Perspectives of curriculum evaluation. AERA                  Worthen, B. R. y Sanders, J. R. (1991). The
 Monograph Series Curriculum Evaluation, 1.                    changing face of educational evaluation,
 Chicago: Rand McNally,.                                       Theory into Practice, XXX, 1, 3-12.
Tyler, R. W., (Ed.) (1969). Educational evalua-               Zeller, N. C. (1987). A rethoric for naturalistic
 tion: New roles, new means. Chicago: Universi-                inquiry. Ph. D. dissertation, Indiana Universi-
 ty of Chicago Press .                                         ty.



                          ABOUT THE AUTHORS / SOBRE LOS AUTORES

   Tomás Escudero Escorza (tescuder@posta.unizar.es). Catedrático del área de Métodos de Inves-
   tigación y Diagnóstico en Educación de la Universidad de Zaragoza. Es miembro de la Comisión
   de Coordinación Técnica del Plan de Calidad de las Universidades. Tiene un gran número de traba-
   jos y publicaciones sobre evaluación educativa, particularmente sobre evaluación institucional.



Revista ELectrónica de Investigación y EValuación Educativa        [ www.uv.es/RELIEVE ]            pag. 42
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de
inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm




                           ARTICLE RECORD / FICHA DEL ARTÍCULO

                              Escudero, Tomás (2003).           Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de
                              intenso desarrollo de la evaluación en educación. Revista ELectrónica de Investigación y EVa-
Reference /
                              luación Educativa (RELIEVE), v. 9, n. 1.
Referencia                     http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm. Consultado en (poner fe-
                              cha).
                              Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intenso
Title / Título                desarrollo de la evaluación en educación. [ From tests to current evaluative research.
                              One century, the XXth, of intense development of evaluation in education]
Authors / Autores             Tomás Escudero Escorza
Review /                      Revista ELectrónica de Investigación y EValuación Educativa (RELIEVE), v. 9, n. 1
Revista
ISSN                          1134-4032
Publication date /
                               2003 (Reception Date: 2003 January 10; Publication Date: 2003 Febr. 27 )
Fecha de publicación
                               This article presents a review and state of art about development in educational
                              evaluation in the XXth century. The main theoretical proposals are commented.
Abstract /
                              Este artículo presenta una revisión crítica del desarrollo histórico que ha tenido el ám-
Resumen
                              bito de la evaluación educativa durante todo el siglo XX. Se analizan los principales
                              propuestas teóricas planteadas..
                              Evaluation, Evaluation Research, Evaluation Methods; Formative Evaluation Sum-
Keywords                      mative Evaluation, Testing, Program Evaluation.
Descriptores                  Evaluación, Investigación evaluativa, Métodos de Evaluación, Evaluación Formativa,
                              Evaluación Sumativa, Test, Evaluación de Programas
Institution /                 Universidad de Zaragoza (España)
Institución
Publication site /
                              http://www.uv.es/RELIEVE
Dirección
Language / Idioma              Español (Title, abstract and keywords in english)




             Revista ELectrónica de Investigación y EValuación Educativa
                                                     (RELIEVE)
                                              [ ISSN: 1134-4032 ]

 © Copyright 2002, RELIEVE. Reproduction and distribution of this articles it is authorized if the content is no
 modified and their origin is indicated (RELIEVE Journal, volume, number and electronic address of the document). /
 © Copyright 2002, RELIEVE. Se autoriza la reproducción y distribución de este artículo siempre que no se modifi-
 que el contenido y se indique su origen (RELIEVE, volumen, número y dirección electrónica del documento).




Revista ELectrónica de Investigación y EValuación Educativa                       [ www.uv.es/RELIEVE ]                         pag. 43

Evaluación 3

  • 1.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Revista ELectrónica de Investigación y EValuación Educativa DESDE LOS TESTS HASTA LA INVESTIGACIÓN EVA- LUATIVA ACTUAL. UN SIGLO, EL XX, DE INTENSO DE- SARROLLO DE LA EVALUACIÓN EN EDUCACIÓN (From tests to current evaluative research. One century, the XXth, of in- tense development of evaluation in education) por Articles record Ficha artículo Tomás Escudero Escorza About authors Sobre los autores (tescuder@posta.unizar.es) HTML format Formato HTML Abstract Resumen This article presents a review and state of art about devel- Este artículo presenta una revisión crítica del desarrollo opment in educational evaluation in the XXth century. The histórico que ha tenido el ámbito de la evaluación educa- main theoretical proposals are commented tiva durante todo el siglo XX. Se analizan los principales propuestas teóricas planteadas. Keywords Descriptores Evaluation, Evaluation Research, Evaluation Methods; Evaluación, Investigación evaluativa, Métodos de Evalua- Formative Evaluation Summative Evaluation, Testing, ción, Evaluación Formativa, Evaluación Sumativa, Test, Program Evaluation Evaluación de Programas Introducción El análisis la vamos a llevar a cabo basándo- nos en tres planteamientos que podríamos ta- En cualquier disciplina, la aproximación histó- char de clásicos en la reciente literatura sobre rica suele ser una vía fundamental para compren- el tema y que usamos indistintamente, aunque der su concepción, estatus, funciones, ámbito, no tenemos la pretensión de ofrecer un plan- etc. Este hecho es especialmente evidente en el teamiento de síntesis, sino de utilización cabal caso de la evaluación, pues se trata de una disci- de todos ellos, puesto que los tres plantea- plina que ha sufrido profundas transformaciones mientos inciden sobre los mismos momentos y conceptuales y funcionales a lo largo de la histo- movimientos claves. ria y, sobre todo, a lo largo del siglo XX, en el que principalmente ubicamos nuestro análisis. En Un planteamiento, quizás el más utilizado en este sentido, la aproximación diacrónica al con- nuestro contexto (Mateo y otros, 1993; Her- cepto resulta imprescindible. nández, 1993), es el que ofrecen Madaus, Scri- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 11
  • 2.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm ven, Stufflebeam y otros autores, que en sus tra- los procedimientos que se empleaban en la bajos suelen establecer seis épocas, empezando China imperial, hace más de tres mil años, para su análisis desde el siglo XIX (Stufflebeam y seleccionar a los altos funcionarios. Otros auto- Shinkfield, 1987; Madaus y otros, 1991). Nos res como Sundbery (1977) hablan de pasajes hablan de: a) época de la reforma (1800-1900), evaluadores en la Biblia, mientras Blanco b) época de la eficiencia y del «testing» (1900- (1994) se refiere a los exámenes de los profe- 1930), c) época de Tyler (1930-1945), d) época sores griegos y romanos. Pero según McRey- de la inocencia (1946-1956), e) época de la ex- nold (1975), el tratado más importante de eva- pansión (1957-1972) y f) época de la profesiona- luación de la antigüedad es el Tetrabiblos, que lización (desde 1973), que enlaza con la situa- se atribuye a Ptolomeo. También Cicerón y ción actual. San Agustín introducen en sus escritos concep- tos y planteamientos evaluadores. Otros autores como Cabrera (1986) y Salvador (1992) citan tres grandes épocas, tomando como En la Edad Media se introducen los exáme- punto de referencia central la figura de Tyler en nes en los medios universitarios con carácter el segundo cuarto del Siglo XX. A la época de más formal. Hay que recordar los famosos Tyler se le denomina de nacimiento, a las ante- exámenes orales públicos en presencia de tri- riores de precedentes o antecedentes y a la poste- bunal, aunque sólo llegaban a los mismos los rior de desarrollo. que contaban con el visto bueno de sus profe- sores, con lo que la posibilidad de fracaso era Guba y sus colaboradores, sobre todo Yvonna prácticamente inexistente. En el Renacimiento Lyncoln, destacan distintas generaciones. Ahora se siguen utilizando procedimientos selectivos estaríamos en la cuarta (Guba y Lincoln, 1989), y Huarte de San Juan, en su Examen de inge- que según ellos se apoya en el enfoque paradig- nios para las ciencias, defiende la observación mático constructivista y en las necesidades de los como procedimiento básico de la evaluación «stakeholders» (demandantes e implicados en la (Rodríguez y otros, 1995). evaluación), como base para determinar la in- formación que se necesita. La primera genera- En el siglo XVIII, a medida que aumenta la ción es la de la medición, que llega hasta el pri- demanda y el acceso a la educación, se acentúa mer tercio de este siglo, la segunda es la de la la necesidad de comprobación de los méritos descripción y la tercera la del juicio o valoración. individuales y las instituciones educativas van elaborando e introduciendo normas sobre la Tras el análisis histórico, como complemento y utilización de exámenes escritos (Gil, 1992). como revisión de síntesis del mismo, ofrecemos un sucinto resumen de los enfoques evaluativos Entrado el siglo XIX se establecen los siste- más relevantes, de los distintos modelos y plan- mas nacionales de educación y aparecen los teamientos que, con mayor o menor fuerza, vie- diplomas de graduación, tras la superación de nen a nuestra mente cuando intentamos acotar lo exámenes (exámenes del Estado). Según Max que es hoy en día la investigación evaluativa en Weber (Barbier, 1993), surge un sistema de educación exámenes de comprobación de una preparación específica, para satisfacer las necesidades de 1. Precedentes: Antes de los «tests» y de la una nueva sociedad jerárquica y burocratizada. medición En los Estados Unidos, en 1845, Horace Mann comienza a utilizar las primeras técnicas eva- Desde la antigüedad se han venido creando y luativas del tipo «tests» escritos, que se extien- usando procedimientos instructivos en los que den a las escuelas de Boston, y que inician el los profesores utilizaban referentes implícitos, camino hacia referentes más objetivos y explí- sin una teoría explícita de evaluación, para valo- citos con relación a determinadas destrezas rar y, sobre todo, diferenciar y seleccionar a es- lecto-escritoras. Sin embargo, no se trata toda- tudiantes. Dubois (1970) y Coffman (1971) citan Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 12
  • 3.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm vía de una evaluación sustentada en un enfoque c) El desarrollo de los métodos estadísticos teórico, sino más bien, algo que responde a prác- que favorecía decisivamente la orientación ticas en buena medida rutinarias y con frecuencia métrica de la época (Nunnally, 1978). basadas en instrumentos poco fiables. d) El desarrollo de la sociedad industrial Al final del siglo XIX, en 1897, aparece un tra- que potenciaba la necesidad de encontrar bajo de J. M. Rice, que se suele señalar como la unos mecanismos de acreditación y selec- primera investigación evaluativa en educación ción de alumnos, según sus conocimientos. (Mateo y otros, 1993). Se trataba de un análisis comparativo en escuelas americanas sobre el Consecuentemente con este estado de cosas, valor de la instrucción en el estudio de la ortogra- en este periodo entre finales del siglo XIX y fía, utilizando como criterio las puntuaciones principios del XX, se desarrolla una actividad obtenidas en los tests. evaluativa intensa conocida como «testing», que se define por características como las si- 2. Los tests psicométricos guientes: En el contexto anterior, a finales del siglo XIX, • Medición y evaluación resultaban términos se despierta un gran interés por la medición cien- intercambiables. En la práctica sólo se tífica de las conductas humanas. Esto es algo que hablaba de medición. se enmarca en el movimiento renovador de la metodología de las ciencias humanas, al asumir • El objetivo era detectar y establecer dife- el positivismo de las ciencias físico-naturales. En rencias individuales, dentro del modelo del este sentido, la evaluación recibe las mismas rasgo y atributo que caracterizaba las elabo- influencias que otras disciplinas pedagógicas raciones psicológicas de la época (Fernández relacionadas con procesos de medición, como la Ballesteros, 1981), es decir, el hallazgo de pedagogía experimental y la diferencial (Cabrera, puntuaciones diferenciales, para determinar 1986). la posición relativa del sujeto dentro de la norma grupal. La actividad evaluativa se verá condicionada de forma decisiva por diversos factores que con- • Los tests de rendimiento, sinónimo de eva- fluyen en dicho momento, tales como: luación educativa, se elaboraban para esta- blecer discriminaciones individuales, olvi- a) El florecimiento de las corrientes filosófi- dándose en gran medida la representatividad cas positivistas y empíricas, que apoyaban a la y congruencia con los objetivos educativos. observación, la experimentación, los datos y En palabras de Guba y Lincoln (1982), la los hechos como fuentes del conocimiento evaluación y la medida tenían poca relación verdadero. Aparece la exigencia del rigor cien- con los programas escolares. Los tests in- tífico y de la objetividad en la medida de la formaban algo sobre los alumnos, pero no de conducta humana (Planchard, 1960) y se po- los programas con los que se les había for- tencian las pruebas escritas como medio para mado. combatir la subjetividad de los exámenes ora- les (Ahman y Cook, 1967). En el campo educativo destacan algunos ins- trumentos de aquella época, como las escalas b) La influencia de las teorías evolucionistas de escritura de Ayres y Freeman, de redacción y los trabajos de Darwin, Galton y Cattel, apo- de Hillegas, de ortografía de Buckingan, de yando la medición de las características de los cálculo de Wood, de lectura de Thorndike y individuos y las diferencias entre ellos. McCall y de aritmética de Wood y McCall (Planchard, 1960; Ahman y Cook, 1967; Ebel, 1977). Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 13
  • 4.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Sin embargo, fue en los tests psicológicos don- ten textos y publicaciones que utilizan de ma- de los esfuerzos tuvieron mayor impacto, siendo nera indisoluble evaluación y medida (Gron- probablemente la obra de Thorndike (1904) la de lund, 1985). mayor influencia en los comienzos del siglo XX. En Francia destacan los trabajos de Alfred Binet, 3. El nacimiento de la verdadera evalua- después revisados por Terman en la Universidad ción educativa: La gran reforma de Stanford, sobre tests de capacidades cogniti- «tyleriana» vas. Ahora hablamos del Stanford-Binet, uno de los tests más conocidos en la historia de la psi- Antes de que llegara la revolución promovida cometría. por Ralph W. Tyler, en Francia se inicia en los años veinte una corriente independiente cono- Años más tarde, con las necesidades de reclu- cida como docimología (Pieron, 1968 y 1969; tamiento en la Primera Guerra Mundial, Arthur Bonboir, 1972), que supone un primer acerca- Otis dirige un equipo que construye tests colecti- miento a la verdadera evaluación educativa. Se vos de inteligencia general (Alfa para lectoescri- criticaba, sobre todo, el divorcio entre lo ense- tores y Beta para analfabetos) e inventarios de ñado y las metas de la instrucción. La evalua- personalidad (Phillips, 1974). ción se dejaba, en último término, en manos de una interpretación totalmente personal del pro- Tras la contienda, los tests psicológicos se po- fesor. Como solución se proponía: a) elabora- nen al servicio de fines sociales. La década entre ción de taxonomías para formular objetivos, b) 1920 y 1930 marca el punto más alto del «tes- diversificación de fuentes de información, ting», pues se idean multitud de tests estandari- exámenes, expedientes académicos, técnicas de zados para medir toda clase de destrezas escola- repesca y tests, c) unificación de criterios de res con referentes objetivos externos y explícitos, corrección a partir del acuerdo entre los correc- basados en procedimientos de medida de la inte- tores de las pruebas y d) revisión de los juicios ligencia, para utilizar con grandes colectivos de de valoración mediante procedimientos tales estudiantes. como la doble corrección, o la media de distin- Estas aplicaciones estandarizadas se acogen tos correctores. Como puede verse, se trata de muy bien en los ámbitos educativos y McCall criterios en buena medida vigentes actualmente (1920) propone que los profesores construyan y, en algún caso, incluso avanzados. sus propias pruebas objetivas, para no tener que Pero quien es tradicionalmente considerado confiar exclusivamente en las propuestas por como el padre de la evaluación educativa es especialistas externos. Tyler (Joint Committee, 1981), por ser el pri- Este movimiento estuvo vigente en paralelo al mero en dar una visión metódica de la misma, proceso de perfeccionamiento de los tests psico- superando desde el conductismo, muy en boga lógicos con el desarrollo de la estadística y del en el momento, la mera evaluación psicológica. análisis factorial. El fervor por el «testing» de- Entre 1932 y 1940, en su famoso Eight-Year creció a partir de los años cuarenta e, incluso, Study of Secondary Education para la Progres- empezaron a surgir algunos movimientos hiper- sive Education Association, publicado dos años críticos con estas prácticas. después (Smith y Tyler, 1942), plantea la nece- sidad de una evaluación científica que sirva Guba y Lincoln (1989) se refieren a esta eva- para perfeccionar la calidad de la educación. luación como a la primera generación, que puede La obra de síntesis la publica unos años des- legítimamente ser denominada como la genera- pués (Tyler, 1950), exponiendo de manera cla- ción de la medida. El papel del evaluador era ra su idea de «curriculum», e integrando en él técnico, como proveedor de instrumentos de me- su método sistemático de evaluación educativa, dición. Según estos autores, esta primera genera- como el proceso surgido para determinar en ción permanece todavía viva, pues todavía exis- qué medida han sido alcanzados los objetivos Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 14
  • 5.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm previamente establecidos (véase también Tyler, ción es más amplia que el hacer explícito este 1967 y 1969). cambio a los propios alumnos, padres y profe- sores; es también un medio para informar sobre El «currículum» viene delimitado por las cua- la eficacia del programa educacional y también tro cuestiones siguientes: de educación continua del profesor. Se trata, según Guba y Lincoln (1989), de la segunda a) ¿Qué objetivos se desean conseguir? generación de la evaluación. Desgraciadamen- b) ¿Con qué actividades se pueden alcanzar? te, esta visión evaluativa global no fue suficientemente apreciada, ni explotada, por c) ¿Cómo pueden organizarse eficazmente aquellos que utilizaron sus trabajos (Bloom y estas experiencias? otros, 1975; Guba y Lincoln, 1982). d) ¿Cómo se puede comprobar si se alcanzan A pesar de lo anterior y de que las reformas los objetivos? tylerianas no siempre se aplicaron de inmedia- to, las ideas de Tyler fueron muy bien acogidas Y la buena evaluación precisa de las siguientes por los especialistas en desarrollo curricular y condiciones: por los profesores. Su esquema era racional y a) Propuesta clara de objetivos. se apoyaba en una tecnología clara, fácil de entender y aplicar (Guba y Lincoln, 1982; b) Determinación de las situaciones en las House, 1989) y encajaba perfectamente en la que se deben manifestar las conductas espera- racionalidad del análisis de la tarea que comen- das. zaba a usarse con éxito en ámbitos educativos militares (Gagné, 1971). En España, los plan- c) Elección de instrumentos apropiados de teamientos de Tyler se extendieron con la Ley evaluación. General de Educación de 1970. d) Interpretación de los resultados de las Tras la Segunda Guerra Mundial se produce pruebas. un periodo de expansión y optimismo que Stuf- flebeam y Shinkfield (1987) no han dudado en e) Determinación de la fiabilidad y objetivi- calificar de «irresponsabilidad social», por el dad de las medidas. gran despilfarro consumista tras una época de Esta evaluación ya no es una simple medición, recesión. Se trata de la etapa conocida como la porque supone un juicio de valor sobre la infor- de la inocencia (Madaus y otros, 1991). Se mación recogida. Se alude, aunque sin desarro- extienden mucho las instituciones y servicios llar, a la toma de decisiones sobre los aciertos o educativos de todo tipo, se producen cantidad fracasos de la programación, en función de los de tests estandarizados, se avanza en la tecno- resultados de los alumnos, algo que retomarán logía de la medición y en los principios estadís- otros importantes evaluadores como Cronbach y ticos del diseño experimental (Gulliksen, 1950; Sufflebeam unos años después. Lindquist, 1953; Walberg y Haertel, 1990) y aparecen las famosas taxonomías de los objeti- Para Tyler, la referencia central en la evalua- vos educativos (Bloom y otros, 1956; Krath- ción son los objetivos preestablecidos, que deben wohl y otros, 1964). Sin embargo, en esta épo- ser cuidadosamente definidos en términos de ca, la aportación de la evaluación a la mejora conducta (Mager, 1962), teniendo en cuenta que de la enseñanza es escasa debido a la carencia deben marcar el desarrollo individual del alum- de planes coherentes de acción. Se escribe mu- no, pero dentro de un proceso socializador. cho de evaluación, pero con escasa influencia en el perfeccionamiento de la labor instruccio- El objeto del proceso evaluativo es determinar nal. El verdadero desarrollo de las propuestas el cambio ocurrido en los alumnos, pero su fun- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 15
  • 6.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm tylerianas vino después (Taba, 1962; Popham y nos. Para ello, es necesario interaccionar con Baker, 1970; Fernández de Castro, 1973). ellos de manera más frecuente y más infor- mal. Ralph W. Tyler murió el 18 de febrero de 1994, superados los noventa años de vida, tras Medio siglo después de que Tyler siete décadas de fructíferas aportaciones y servi- revolucionara el mundo de la evaluación cios a la evaluación, a la investigación y a la edu- educativa, se observa la fortaleza, coherencia y cación en general. Unos meses antes, en abril de vigencia de su pensamiento. Como acabamos 1993, Pamela Perfumo, una estudiante graduada de ver, sus ideas básicas, convenientemente de la Universidad de Stanford, entrevistó a Tyler actualizadas, se entroncan fácilmente en las con el propósito de conocer su pensamiento acer- corrientes más actuales de la evaluación ca del actual desarrollo de la evaluación y de los educativa. temas controvertidos alrededor de la misma. Esta 4. El desarrollo de los sesenta entrevista, convenientemente preparada, fue presentada el 16 de abril de 1993 en la Conferen- Los años sesenta traerán nuevos aires a la cia de la AERA que tuvo lugar en Atlanta. evaluación educativa, entre otras cosas porque Horowitz (1995) analiza el contenido y el signi- se empezó a prestar interés por algunas de las ficado de la citada entrevista, destacando, entre llamadas de atención de Tyler, relacionadas otros, los siguientes aspectos en el pensamiento con la eficacia de los programas y el valor in- de Tyler al final de sus días: trínseco de la evaluación para la mejora de la educación. a) Necesidad de analizar cuidadosamente los propósitos de la evaluación, antes de ponerse a En esa época surge un cierto conflicto entre evaluar. Los actuales planteamientos de eva- la sociedad americana y su sistema educativo, luaciones múltiples y alternativas deben ajus- sobre todo porque los rusos iban por delante en tarse a este principio la carrera especial, tras el lanzamiento del Sputnik por la URSS en 1957. Aparece un cier- b) El propósito más importante en la evalua- to desencanto con la escuela pública y crece la ción de los alumnos es guiar su aprendizaje, presión por la rendición de cuentas (MacDo- esto es, ayudarles a que aprendan. Para ello es nald, 1976; Stenhouse, 1984). En 1958 se pro- necesaria una evaluación comprensiva de to- mulga una nueva ley de defensa educativa que dos los aspectos significativos de su rendi- proporciona muchos programas y medios para miento; no basta con asegurarse que hacen re- evaluarlos. En 1964 se establece el Acta de gularmente el trabajo diario. educación primaria y secundaria (ESEA) y se crea el National Study Comitte on Evaluation, c) El «portfolio» es un instrumento valioso de creándose una nueva evaluación no sólo de evaluación, pero depende de su contenido. En alumnos, sino orientada a incidir en los pro- todo caso, hay que ser cauteloso ante la pre- gramas y en la práctica educativa global (Ma- ponderancia de un solo procedimiento de eva- teo y otros, 1993; Rodríguez y otros, 1995). luación, incluyendo el «portfolio», por su in- capacidad de abarcar todo el espectro de as- Para mejorar la situación y retomar la hege- pectos evaluables. monía científica y educativa, fueron muchos los millones de dólares que desde los fondos d) La verdadera evaluación debe ser idiosin- públicos se destinaron a subvencionar nuevos crásica, adecuada a las peculiaridades del programas educativos e iniciativas del personal alumno y el centro. En rigor, la comparación de las escuelas públicas americanas encamina- de centros no es posible. das a mejorar la calidad de la enseñanza. (Po- pham, 1983; Rutman y Mowbray, 1983; Weiss, e) Los profesores deben rendir cuentas de su 1983). Este movimiento se vio también poten- acción educativa ante los padres de los alum- ciado por el desarrollo de nuevos medios tecnológicos (audiovisuales, ordenadores...) y Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 16
  • 7.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm nológicos (audiovisuales, ordenadores...) y el de este movimiento de rendición de cuentas, de la enseñanza programada, cuyas posibilidades responsabilidad escolar, diera lugar a una olea- educativas despertaron el interés entre los profe- da de protestas por parte del personal docente. sionales de la educación (Rosenthal, 1976). Otra dimensión de la responsabilidad escolar De la misma forma que la proliferación de nos la ofrece Popham (1980), cuando se refiere programas sociales en la década anterior había al movimiento de descentralización escolar impulsado la evaluación de programas en el área durante los últimos años sesenta y principios de social, los años sesenta serán fructíferos en de- los setenta. Los grandes distritos escolares se manda de evaluación en el ámbito de la educa- dividieron en áreas geográficas más pequeñas, ción. Esta nueva dinámica en la que entra la eva- y, por consiguiente, con un control ciudadano luación, hace que, aunque ésta se centraba en los más directo sobre lo que ocurría en las escue- alumnos como sujeto que aprende, y el objeto de las. valoración era el rendimiento de los mismos, sus funciones, su enfoque y su última interpretación Como consecuencia de estos focos de in- variará según el tipo de decisión buscada. fluencia, se amplió considerablemente el fe- nómeno de la evaluación educativa. El sujeto Buena parte de culpa de este fuerte ímpetu eva- directo de la evaluación siguió siendo el alum- luador americano se debió a la ya citada aproba- no, pero también todos aquellos factores que ción de la «Elementary and Secondary Act» confluyen en el proceso educativo (el programa (ESEA) en 1965 (Berk, 1981; Rutman, 1984). educativo en un sentido amplio, profesor, me- Con esta ley se puso en marcha el primer pro- dios, contenidos, experiencias de aprendizaje, grama significativo para la organización de la organización, etc.), así como el propio produc- educación en el ámbito federal de los Estados to educativo. Unidos, y se estipuló que cada uno de los pro- yectos realizados con el apoyo económico fede- Como resultado de estas nuevas necesidades ral debía ser anualmente evaluado, a fin de justi- de la evaluación, se inicia durante esta época ficar subvenciones futuras. un periodo de reflexión y de ensayos teóricos con ánimo de clarificar la multidimensionali- Junto al desencanto de la escuela pública, cabe dad del proceso evaluativo. Estas reflexiones señalar la recesión económica que caracteriza los teóricas enriquecerán decisivamente el ámbito finales años sesenta, y, sobre todo, la década de conceptual y metodológico de la evaluación, lo los setenta. Ello hizo que la población civil, co- que unido a la tremenda expansión de la eva- mo contribuyentes, y los propios legisladores se luación de programas ocurrida durante estos preocupasen por la eficacia y el rendimiento del años, dará lugar al nacimiento de esa nueva dinero que se empleaba en la mejora del sistema modalidad de investigación aplicada que hoy escolar. A finales de los años sesenta, y como denominamos como investigación evaluativa. consecuencia de lo anterior, entra en escena un nuevo movimiento, la era de la «Accountability», Como hitos de la época hay que destacar dos de la rendición de cuentas (Popham, 1980 y ensayos por su decisiva influencia: el artículo 1983; Rutman y Mowbray, 1983), que se asocia de Cronbach (1963), Course improvement fundamentalmente a la responsabilidad del per- through evaluation, y el de Scriven (1967), The sonal docente en el logro de objetivos educativos methodology of evaluation. La riqueza de ideas establecidos. De hecho, en el año 1973, la legis- evaluativas expuestas en estos trabajos nos lación de muchos estados americanos instituyó la obligan a que, aunque brevemente, nos refira- obligación de controlar el logro de los objetivos mos a ellas. educativos y la adopción de medidas correctivas Del análisis que Cronbach del concepto, fun- en caso negativo (MacDonald, 1976; Wilson y ciones y metodología de la evaluación, entresa- otros, 1978). Es comprensible que, planteado así, camos las sugerencias siguientes: Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 17
  • 8.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm a) Asociar el concepto de evaluación a la tudios de seguimientos, esto es, el camino toma de decisiones. Distingue el autor tres ti- posterior seguido por los estudiantes que han pos de decisiones educativas a las cuales la participado en el programa. evaluación sirve: a) sobre el perfeccionamien- to del programa y de la instrucción, b) sobre f) Desde esta óptica, las técnicas de eva- los alumnos (necesidades y méritos finales) y luación no pueden limitarse a los tests de c) acerca de la regulación administrativa sobre rendimiento. Los cuestionarios, las entrevis- la calidad del sistema, profesores, organiza- tas, la observación sistemática y no sistemá- ción, etc. De esta forma, Cronbach abre el tica, las pruebas de ensayo, según el autor, campo conceptual y funcional de la evaluación ocupan un lugar importante en la evaluación, educativa mucho más allá del marco concep- en contraste al casi exclusivo uso que se tual dado por Tyler, aunque en su línea de su- hacía de los tests como técnicas de recogida gerencias. de información. b) La evaluación que se usa para mejorar un Si estas reflexiones de Cronbach fueron im- programa mientras éste se está aplicando, pactantes, no lo fueron menos las del ensayo de contribuye más al desarrollo de la educación Scriven (1967). Sus fecundas distinciones ter- que la evaluación usada para estimar el valor minológicas ampliaron enormemente el campo del producto de un programa ya concluido. semántico de la evaluación, a la vez que clari- ficaron el quehacer evaluativo. Destacamos a c) Poner en cuestión la necesidad de que los continuación las aportaciones más significati- estudios evaluativos sean de tipo comparativo. vas: Entre las objeciones a este tipo de estudios, el autor destaca el hecho de que, con frecuencia, a) Se establece de forma tajante la diferen- las diferencias entre las puntuaciones prome- cia entre la evaluación como actividad me- dio entre-grupos son menores que las intra- todológica, lo que el autor llama meta de la grupos, así como otras referentes a las dificul- evaluación, y las funciones de la evaluación tades técnicas que en el marco educativo pre- en un contexto particular. Así, la evaluación sentan los diseños comparativos. Cronbach como actividad metodológica es esencial- aboga por unos criterios de comparación de ti- mente igual, sea lo que fuera lo que estemos po absoluto, reclamando la necesidad de una evaluando. El objetivo de la evaluación es evaluación con referencia al criterio, al defen- invariante, supone en definitiva el proceso der la valoración con relación a unos objetivos por el cual estimamos el valor de algo que se bien definidos y no la comparación con otros evalúa, mientras que las funciones de la eva- grupos. luación pueden ser enormemente variadas. Estas funciones se relacionan con el uso que d) Se ponen en cuestión los estudios a gran se hace de la información recogida. escala, puesto que las diferencias entre los tra- tamientos pueden ser muy grandes e impedir b) Scriven señala dos funciones distintas discernir con claridad las causas de los resul- que puede adoptar la evaluación: la for- tados. Se defienden los estudios más analíti- mativa y la sumativa. Propone el término de cos, bien controlados, que pueden usarse para evaluación formativa para calificar aquel comparar versiones alternativas de un progra- proceso de evaluación al servicio de un pro- ma. grama en desarrollo, con objeto de mejorar- lo, y el término de evaluación sumativa para e) Metodológicamente Cronbach propone aquel proceso orientado a comprobar la efi- que la evaluación debe incluir: 1) estudios de cacia del programa y tomar decisiones sobre proceso –hechos que tienen lugar en el aula–; su continuidad. 2) medidas de rendimiento y actitudes – cambios observados en los alumnos– y 3) es- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 18
  • 9.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm c) Otra importante contribución de Scriven no sólo analiza y describe la realidad, además, es la crítica al énfasis que la evaluación da a la la valora, la juzga con relación a distintos crite- consecución de objetivos previamente estable- rios. cidos, porque si los objetivos carecen de valor, no tiene ningún interés saber hasta qué punto Durante estos años sesenta aparecen muchas se han conseguido. Resalta la necesidad de que otras aportaciones que va perfilando una nueva la evaluación debe incluir tanto la evaluación concepción evaluativa, que terminará de des- de los propios objetivos como el determinar el arrollarse y, sobre todo, de extenderse en las grado en que éstos han sido alcanzados (Scri- décadas posteriores. Se percibe que el núcleo ven, 1973 y 1974). conceptual de la evaluación lo constituye la valoración del cambio ocurrido en el alumno d) Clarificadora es también la distinción que como efecto de una situación educativa siste- hace Scriven entre evaluación intrínseca y eva- mática, siendo unos objetivos bien formulados luación extrínseca, como dos formas diferen- el mejor criterio para valorar este cambio. Así tes de valorar un elemento de la enseñanza. En mismo, se comienza a prestar atención no sólo una evaluación intrínseca se valora el elemen- a los resultados pretendidos, sino también a los to por sí mismo, mientras que en la evaluación efectos laterales o no pretendidos, e incluso a extrínseca se valora el elemento por los efec- resultados o efectos a largo plazo (Cronbach, tos que produce en los alumnos. Esta distin- 1963; Glaser, 1963; Scriven, 1967; Stake, ción resulta muy importante a la hora de con- 1967). siderar el criterio a utilizar, pues en la evalua- ción intrínseca el criterio no se formula en A pesar de las voces críticas con la operativi- términos de objetivos operativos, mientras que zación de objetivos (Eisner, 1967 y 1969; At- sí se hace en la evaluación extrínseca . kin, 1968), no sólo por la estructura de valor que en ello subyace, sino también por centrar la e) Scriven adopta una posición contraria a valoración del aprendizaje en los productos Cronbach, defendiendo el carácter comparati- más fácilmente mensurables, a veces los más vo que deben presentar los estudios de evalua- bajos en las taxonomías del dominio cognosci- ción. Admite con Cronbach los problemas téc- tivo, y de que se prestaba escasa atención a los nicos que los estudios comparativos entrañan y objetivos del dominio afectivo, que presentan la dificultad de explicar las diferencias entre mayor dificultad de tratamiento operativo, el programas, pero Scriven considera que la eva- modelo evaluativo de Tyler se enriquecería luación como opuesta a la mera descripción mucho en estos años, con trabajos sobre los implica emitir un juicio sobre la superioridad o objetivos educativos que continuarían y perfec- inferioridad de lo que se evalúa con respecto a cionarían el camino emprendido en 1956 por sus competidores o alternativas. Bloom y colaboradores (Mager, 1962 y 1973; Lindvall, 1964; Krathwohl y otros, 1964; Gla- Estas dos aportaciones comentadas influyeron ser, 1965; Popham, 1970; Bloom y otros, 1971; decisivamente en la comunidad de evaluadores, Gagné 1971). Entre otras cosas aparecieron incidiendo no sólo en estudios en la línea de la nuevas ideas sobre la evaluación de la interac- investigación evaluativa, a la que se referían pre- ción en el aula y sobre sus efectos en los logros ferentemente, sino también en la evaluación de los alumnos (Baker, 1969). orientada al sujeto, en la línea de evaluación co- mo «assessment» (Mateo, 1986). Estamos ante la Stake (1967) propuso su modelo de evalua- tercera generación de la evaluación que, según ción, The countenance model, que sigue la lí- Guba y Lincoln (1989), se caracteriza por intro- nea de Tyler, pero es más completo al conside- ducir la valoración, el juicio, como un contenido rar las discrepancias entre lo observado y lo intrínseco en la evaluación. Ahora el evaluador esperado en los «antecedentes» y «transaccio- nes», y posibilitar algunas bases para elaborar Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 19
  • 10.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm hipótesis acerca de las causas y los fallos en los señala para los primeros, además de los cono- resultados finales. En sus sucesivas propuestas, cidos objetivos de describir la ejecución del Stake se irá distanciando de sus posiciones ini- sujeto y tomar decisiones sobre si domina o no ciales. domina un contenido, otro objetivo como es el de valorar la eficacia de un programa. Metfessell y Michael (1967) presentaron tam- bién un modelo de evaluación de la efectividad Desde finales de los sesenta los especialistas de un programa educativo en el cual, aún si- se pronunciarán decisivamente a favor de la guiendo el modelo básico de Tyler, proponían la evaluación criterial, en cuanto que es el tipo de utilización de una lista comprensiva de criterios evaluación que suministra una información real diversos que los evaluadores podrían tener en y descriptiva del estatus del sujeto o sujetos cuenta en el momento de la valoración y, por respecto a los objetivos de enseñanza previstos, consiguiente, no centrarse meramente en los co- así como la valoración de ese estatus por com- nocimientos intelectuales alcanzados por los paración con un estándar o criterio de realiza- alumnos. ciones deseables, siendo irrelevantes, al efecto de contraste, los resultados obtenidos por otros Suchman (1967) profundiza en la convicción sujetos o grupo de sujetos (Popham, 1970 y de que la evaluación debe basarse en datos obje- 1983; Mager, 1973; Carreño, 1977; Gronlund, tivos que sean analizados con metodología cien- 1985). tífica, matizando que la investigación científica es preferentemente teórica y, en cambio, la inves- En las prácticas evaluativas de esta década de tigación evaluativa es siempre aplicada. Su prin- los sesenta se observan dos niveles de actua- cipal propósito es descubrir la efectividad, éxito ción. Un nivel podemos calificarlo como la o fracaso de un programa al compararlo con los evaluación orientada hacia los individuos, objetivos propuestos y, así, trazar las líneas de su fundamentalmente alumnos y profesores. El posible redefinición. Esta investigación evaluati- otro nivel, es el de la evaluación orientada a la va para Suchman debe tener en cuenta: a) la na- toma de decisiones sobre el «instrumento» o turaleza del destinatario del objetivo y la del pro- «tratamiento» o «programa» educativo. Este pio objetivo, b) el tiempo necesario para que se último nivel, impulsado también por la evalua- realice el cambio propuesto, c) el conocimiento ción de programas en el ámbito social, será la de si los resultados esperados son dispersos o base para la consolidación en el terreno educa- concentrados y d) los métodos que han de em- tivo de la evaluación de programas y de la in- plearse para alcanzar los objetivos. Suchman, vestigación evaluativa. además, defiende la utilización de evaluadores externos para evitar todo tipo de tergiversación 5. Desde los años setenta: La consolida- de los profesores muy implicados en los procesos ción de la investigación evaluativa instruccionales. Si con algo se podría caracterizar las aporta- El énfasis en los objetivos y su medida traerá ciones teóricas que nos ofrecen los especialis- también la necesidad de una nueva orientación a tas durante los años setenta es con la prolifera- la evaluación, la denominada evaluación de refe- ción de toda clase de modelos evaluativos que rencia criterial. La distinción introducida por inundan el mercado bibliográfico, modelos de Glaser (1963) entre mediciones referidas a nor- evaluación que expresan la propia óptica del mas y criterios tendrá eco al final de la década de autor que los propone sobre qué es y cómo de- los sesenta, precisamente como resultado de las be conducirse un proceso evaluativo. Se trata, nuevas exigencias que a la evaluación educativa por tanto, de una época caracterizada por la se le planteaban. Así, por ejemplo, cuando Ham- pluralidad conceptual y metodológica. Guba y bleton (1985) estudia las diferencias entre tests Lincoln (1982) nos hablan de más de cuarenta referidos al criterio y tests referidos a la norma, modelos propuestos en estos años, y Mateo Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 20
  • 11.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm (1986) se refiere a la eclosión de modelos. Estos Metas”. Además de los ya citados de Stake y enriquecerán considerablemente el vocabulario Metfessell y Michael, que corresponden a los evaluativo, sin embargo, compartimos la idea de últimos años sesenta, en esta época destacan la Popham (1980) de que algunos son demasiado propuesta de Hammond (1983) y el Modelo de complicados y otros utilizan una jerga bastante Discrepancia de Provus (1971). Para estos au- confusa. tores los objetivos propuestos siguen siendo el criterio fundamental de valoración, pero enfati- Algunos autores como Guba y Lincoln (1982), zan la necesidad de aportar datos sobre la con- Pérez (1983) y en alguna medida House (1989), gruencia o discrepancia entre las pautas de ins- tienden a clasificar estos modelos en dos grandes trucción diseñadas y la ejecución de las mismas grupos, cuantitativos y cualitativos, pero nosotros en la realidad del aula. pensamos con Nevo (1983) y Cabrera (1986) que la situación es mucho más rica en matices. Otros modelos consideran el proceso de eva- luación al servicio de las instancias que deben Es cierto que esas dos tendencias se observan tomar decisiones. Ejemplos notables de ellos hoy en las propuestas evaluativas, y que algunos son: probablemente el más famoso y utilizado modelos pueden ser representativos de ellas, pero de todos, el C.I.P.P. (contexto, input, proceso y los diferentes modelos, considerados particular- producto), propuesto por Stufflebeam y colabo- mente, se diferencian más por destacar o enfati- radores (1971) y el C.E.S. (toma sus siglas del zar alguno o algunos de los componentes del Centro de la Universidad de California para el proceso evaluativo y por la particular interpreta- Estudio de la Evaluación) dirigido por Alkin ción que a este proceso le dan. Es desde esta (1969). La aportación conceptual y metodoló- perspectiva, a nuestro entender, como los dife- gica de estos modelos es valorada positivamen- rentes modelos deben ser vistos, y valorar así sus te entre la comunidad de evaluadores (Popham, respectivas aportaciones en los terrenos concep- 1980; Guba y Lincoln, 1982; House, 1989). tual y metodológico (Worthen y Sanders, 1973; Estos autores van más allá de la evaluación Stufflebeam y Shinkfield, 1987; Arnal y otros, centrada en resultados finales, puesto que en 1992; Scriven, 1994). sus propuestas suponen diferentes tipos de eva- luación, según las necesidades de las decisio- También son varios los autores (Lewy, 1976; nes a las que sirven. Popham, 1980; Cronbach, 1982; Anderson y Ball, 1983; De la Orden, 1985) los que conside- Una segunda época en la proliferación de ran los modelos no como excluyentes, sino más modelos es la representada por los modelos bien como complementarios y que el estudio de alternativos, que con diferentes concepciones los mismos (al menos aquellos que han resultado de la evaluación y de la metodología a seguir ser más prácticos) llevará al evaluador a adoptar comienzan a aparecer en la segunda mitad de una visión más amplia y comprensiva de su tra- esta década de los setenta. Entre ellos destacan bajo. Nosotros, en algún momento nos hemos la Evaluación Responsable de Stake (1975 y atrevido a hablar de enfoques modélicos, más 1976), a la que se adhieren Guba y Lincoln que de modelos, puesto que es cada evaluador el (1982), la Evaluación Democrática de Mac- que termina construyendo su propio modelo en Donald (1976), la Evaluación Iluminativa de cada investigación evaluativa, en función del tipo Parlett y Hamilton (1977) y la Evaluación co- de trabajo y las circunstancias (Escudero, 1993). mo crítica artística de Eisner (1985). En este movimiento de propuestas de modelos En líneas generales, este segundo grupo de de evaluación cabe distinguir dos épocas con modelos evaluativos enfatiza el papel de la marcadas diferencias conceptuales y metodológi- audiencia de la evaluación y de la relación del cas. En una primera época, las propuestas seguí- evaluador con ella. La audiencia prioritaria de an la línea expuesta por Tyler en su planteamien- la evaluación en estos modelos no es quien to, que ha venido a llamarse de “Consecución de Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 21
  • 12.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm debe tomar las decisiones, como en los modelos tados a la toma de decisiones: la evaluación orientados a la toma de decisiones, ni el respon- como el proceso de determinar, obtener y sable de elaborar los currículos u objetivos, como proporcionar información relevante para en los modelos de consecución de metas. La au- juzgar decisiones alternativas, defendida por diencia prioritaria son los propios participantes Alkin (1969), Stufflebeam y otros (1971), del programa. La relación entre el evaluador y la MacDonald (1976) y Cronbach (1982). audiencia en palabras de Guba y Lincoln (1982) debe ser «transaccional y fenomenológica». Se Además, el concepto de evaluación de Scri- trata de modelos que propugnan una evaluación ven (1967), como el proceso de estimar el de tipo etnográfica, de aquí que la metodología valor o el mérito de algo, es retomado por que consideran más adecuada es la propia de la Cronbach (1982), Guba y Lincoln (1982), y antropología social (Parlett y Hamilton, 1977; House (1989), con objeto de señalar las dife- Guba y Lincoln, 1982; Pérez 1983). rencias que comportarían los juicios valora- tivos en caso de estimar el mérito (se vincu- Este resumen de modelos de la época de eclo- laría a características intrínsecas de lo que se sión es suficiente para aproximarnos al amplio evalúa) o el valor (se vincularía al uso y abanico conceptual teórico y metodológico que aplicación que tendría para un contexto de- hoy se relaciona con la evaluación. Ello explica terminado). que cuando Nevo (1983 y 1989) pretende realizar una conceptualización de la evaluación, a partir b) Diferentes criterios. De las definiciones de la revisión de la literatura especializada, aten- apuntadas anteriormente se desprende que el diendo a los tópicos ¿qué es la evaluación? ¿qué criterio a utilizar para la valoración de la in- funciones tiene? ¿cuál es el objeto de evalua- formación también cambia. Desde la óptica ción?... no encuentra una única respuesta a estas de la consecución de metas, una buena y cuestiones. Es fácilmente comprensible que las operativa definición de los objetivos consti- exigencias que plantea la evaluación de progra- tuye el criterio fundamental. Desde la pers- mas de una parte, y la evaluación para la toma de pectiva de las decisiones y situados dentro decisiones sobre los individuos de otra, conducen de un contexto político, Stufflebeam y cola- a una gran variedad de esquemas evaluativos boradores, Alkin y MacDonald llegan a su- reales utilizados por profesores, directores, ins- gerir incluso la no valoración de la informa- pectores y administradores públicos. Pero tam- ción por parte del evaluador, siendo el que bién es cierto que bajo esta diversidad subyacen toma las decisiones el responsable de su va- diferentes concepciones teóricas y metodológicas loración. sobre la evaluación. Diferentes concepciones que Las definiciones de evaluación que acentú- han dado lugar a una apertura y pluralidad con- an la determinación del «mérito» como obje- ceptual en el ámbito de la evaluación en varios tivo de la evaluación, utilizan criterios es- sentidos (Cabrera, 1986). A continuación desta- tándares sobre los que los expertos o profe- camos los puntos mas sobresalientes de esta plu- sionales están de acuerdo. Se trata de mode- ralidad conceptual. los relacionados con la acreditación y el en- a) Diferentes conceptos de evaluación. Por juiciamiento profesional (Popham, 1980). una parte existe la clásica definición dada por Los autores (Stake, 1975; Parlett y Hamil- Tyler: la evaluación como el proceso de de- ton, 1977; Guba y Lincoln, 1982; House, terminar el grado de congruencia entre las 1983) que acentúan el proceso de evaluación realizaciones y los objetivos previamente es- al servicio de determinar el «valor» más que tablecidos, a la que corresponden los modelos el «mérito» de la entidad u objeto evaluado, orientados hacia la consecución de metas. abogan por que el criterio de valoración fun- Contrasta esta definición con aquella más am- damental sean las necesidades contextuales plia que se propugna desde los modelos orien- en las que ésta se inserta. Así, Guba y Lin- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 22
  • 13.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm coln (1982) refieren los términos de la compa- g) Diferencias en el papel jugado por el ración valorativa; de un lado, las característi- evaluador, lo que ha venido a llamarse eva- cas del objeto evaluado y, de otro, las necesi- luación interna vs. evaluación externa. No dades, expectativas y valores del grupo a los obstante, una relación directa entre el eva- que les afecta o con los que se relaciona el ob- luador y las diferentes audiencias de la eva- jeto evaluado. luación es reconocida por la mayoría de los autores (Nevo, 1983; Weiss, 1983; Rutman, c) Pluralidad de procesos evaluativos de- 1984). pendiendo de la percepción teórica que sobre la evaluación se mantenga. Los modelos de h) Pluralidad de audiencia de la evalua- evaluación citados y otros más que pueden en- ción y, por consiguiente, pluralidad en los contrarse en la bibliografía, representan dife- informes de evaluación. Desde informes na- rentes propuestas para conducir una evalua- rrativos, informales, hasta informes muy es- ción. tructurados (Anderson y Ball, 1983). d) Pluralidad de objetos de evaluación. Co- i) Pluralidad metodológica. Las cuestiones mo dice Nevo (1983 y 1989), existen dos con- metodológicas surgen desde la dimensión de clusiones importantes que se obtienen de la la evaluación como investigación evaluativa, revisión de la bibliografía sobre la evaluación. que viene definida en gran medida por la di- Por un lado, cualquier cosa puede ser objeto versidad metodológica. de evaluación y ésta no debería limitarse a es- tudiantes y profesores y, por otro, una clara El anterior resumen recoge las aportaciones identificación del objeto de evaluación es una a la evaluación en los años setenta y ochenta, la importante parte en cualquier diseño de eva- época que se ha denominado época de la pro- luación. fesionalización (Stufflebeam y Skinkfield, 1987; Madaus y otros, 1991; Hernández, 1993; e) Apertura, reconocida en general por todos Mateo y otros, 1993), en la que además de los los autores, de la información necesaria en un innumerables modelos de los setenta, se pro- proceso evaluativo para dar cabida no sólo a fundizó en los planteamientos teóricos y prác- los resultados pretendidos, sino a los efectos ticos y se consolidó la evaluación como inves- posibles de un programa educativo, sea pre- tigación evaluativa en los términos antes defi- tendido o no. Incluso Scriven (1973 y 1974) nida. En este contexto, lógicamente, aparecen propone una evaluación en la que no se tenga muchas nuevas revistas especializadas como en cuenta los objetivos pretendidos, sino valo- Educational Evaluation and Policy Analysis, rar todos los efectos posibles. Apertura tam- Studies in Evaluation, Evaluation Review, New bién respecto a la recogida de información no Directions for Program Evaluation, Evaluation sólo del producto final, sino también sobre el and Program Planning, Evaluation News,..., se proceso educativo. Y apertura en la considera- fundan asociaciones científicas relacionadas ción de diferentes resultados de corto y largo con el desarrollo de la evaluación y las univer- alcance. Por último, apertura también en con- sidades empiezan a ofrecer cursos y programas siderar no sólo resultados de tipo cognitivo, de investigación evaluativa, no sólo en post- sino también afectivos (Anderson y Ball, grados y programas de doctorado, sino también 1983). en planes de estudio para titulaciones de primer y segundo ciclos. f) Pluralidad también reconocida de las fun- ciones de la evaluación en el ámbito educati- 6. La cuarta generación según Guba y vo, recogiéndose la propuesta de Scriven entre Lincoln evaluación formativa y sumativa, y añadiéndo- se otras de tipo socio-político y administrati- A finales de los ochenta, tras todo este vas (Nevo, 1983). desarrollo antes descrito, Guba y Lincoln (1989) ofrecen una alternativa evaluadora, que Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 23
  • 14.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm ofrecen una alternativa evaluadora, que denomi- b) Para llevar a cabo lo anterior se necesita nan cuarta generación, pretendiendo superar lo una postura de descubrimiento más que de que según estos autores son deficiencias de las verificación, típica del positivismo. tres generaciones anteriores, tales como una vi- sión gestora de la evaluación, una escasa aten- c) No se tienen en cuenta suficientemente ción al pluralismo de valores y un excesivo ape- los factores contextuales. go al paradigma positivista. La alternativa de d) No se proporcionan medios para valora- Guba y Lincoln la denominan respondente y ciones caso por caso. constructivista, integrando de alguna manera el enfoque respondente propuesto en primer lugar e) La supuesta neutralidad de la metodolo- por Stake (1975), y la epistemología postmoder- gía convencional es de dudosa utilidad na del constructivismo (Russell y Willinsky, cuando se buscan juicios de valor acerca de 1997). Las demandas, las preocupaciones y los un objeto social. asuntos de los implicados o responsables (stake- holders) sirven como foco organizativo de la Partiendo de estas premisas, el evaluador es evaluación (como base para determinar qué in- responsable de determinadas tareas, que reali- formación se necesita), que se lleva a cabo dentro zará secuencialmente o en paralelo, constru- de los planteamientos metodológicos del para- yendo un proceso ordenado y sistemático de digma constructivista. trabajo. Las responsabilidades básicas del eva- luador de la cuarta generación son las siguien- La utilización de las demandas, preocupaciones tes: y asuntos de los implicados es necesaria, según Guba y Lincoln, porque: 1) Identificar todos los implicados con riesgo en la evaluación. a) Son grupos de riesgo ante la evaluación y sus problemas deben ser convenientemente 2) Resaltar para cada grupo de implicados contemplados, de manera que se sientan pro- sus construcciones acerca de lo evaluado y tegidos ante tal riesgo. sus demandas y preocupaciones al respecto. b) Los resultados pueden ser utilizados en su 3) Proporcionar un contexto y una metodo- contra en diferentes sentidos, sobre todo si es- logía hermenéutica para poder tener en cuen- tán al margen del proceso. ta, comprender y criticar las diferentes cons- trucciones, demandas y preocupaciones. c) Son potenciales usuarios de la informa- ción resultante de la evaluación. 4) Generar el máximo acuerdo posible acerca de dichas construcciones, demandas y d) Pueden ampliar y mejorar el rango de la preocupaciones. evaluación. 5) Preparar una agenda para la negociación e) Se produce una interacción positiva entre acerca de temas no consensuados. los distintos implicados. 6) Recoger y proporcionar la información El cambio paradigmático lo justifican estos necesaria para la negociación. autores porque: 7) Formar y hacer de mediador para un a) La metodología convencional no contem- «forum» de implicados para la negociación. pla la necesidad de identificar las demandas, preocupaciones y asuntos de los implicados. 8) Desarrollar y elaborar informes para ca- da grupo de implicados sobre los distintos acuerdos y resoluciones acerca de los intere- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 24
  • 15.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm ses propios y de los de otros grupos (Stake, •Consecución de facilidades y acceso a la 1986; Zeller, 1987). información (Lincoln y Guba, 1985). 9) Reciclar la evaluación siempre que queden 3) Identificación de las audiencias (Guba y asuntos pendientes de resolución. Lincoln, 1982). La propuesta de Guba y Lincoln (1989) se ex- •Agentes. tiende bastante en la explicación de la naturaleza y características del paradigma constructivista en •Beneficiarios. contraposición con las del positivista. •Victimas. Cuando se habla de los pasos o fases de la eva- 4) Desarrollo de construcciones conjuntas luación en esta cuarta generación, sus proponen- dentro de cada grupo o audiencia (Glaser y tes citan doce pasos o fases, con diferentes subfa- Strauss, 1967; Glaser, 1978; Lincoln y Gu- ses en cada una de estas. Estos pasos son los si- ba, 1985). guientes: 5) Contraste y desarrollo de las construc- 1) Establecimiento de un contrato con un pa- ciones conjuntas de las audiencias. trocinador o cliente. •Documentos y registros. •Identificación del cliente o patrocinador de la evaluación. •Observación. •Identificación del objeto de la evaluación. •Literatura profesional. •Propósito de la evaluación (Guba y Lin- •Círculos de otras audiencias. coln, 1982). •Construcción ética del evaluador. •Acuerdo con el cliente por el tipo de eva- luación. 6) Clasificación de las demandas, preocu- paciones y asuntos resueltos. •Identificación de audiencias. 7) Establecimiento de prioridades en los •Breve descripción de la metodología a temas no resueltos. usar. 8) Recogida de información. •Garantía de acceso a registros y documen- tos. 9) Preparación de la agenda para la nego- ciación. •Acuerdo por garantizar la confidenciali- dad y anonimato hasta donde sea posible. 10) Desarrollo de la negociación. •Descripción del tipo de informe a elabo- 11) Informes (Zeller, 1987; Licoln y Guba, rar. 1988). •Listado de especificaciones técnicas. 12) Reciclado/revisión. 2) Organización para reciclar la investiga- Para juzgar la calidad de la evaluación, se ción. nos ofrecen tres enfoques que se denominan paralelo, el ligado al proceso hermenéutico y •Selección y entrenamiento del equipo eva- el de autenticidad. luador. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 25
  • 16.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Los criterios paralelos, de confianza, se deno- b) La evaluación es un proceso conjunto de minan así porque intentan ser paralelos a los cri- colaboración. terios de rigor utilizados muchos años dentro del paradigma convencional. Estos criterios han sido c) la evaluación es un proceso de enseñan- validez interna y externa, fiabilidad y objetivi- za/aprendizaje. dad. Sin embargo, los criterios deban ser acordes d) La evaluación es un proceso continuo, con el paradigma fundamentador (Morgan, recursivo y altamente divergente. 1983). En el caso de la cuarta generación los criterios que se ofrecen son los de credibilidad, e) La evaluación es un proceso emergente. transferencia, dependencia y confirmación (Lin- coln y Guba, 1986). f) La evaluación es un proceso con resul- tados impredecibles. El criterio de credibilidad es paralelo al de va- lidez interna, de forma que la idea de isomorfis- g) La evaluación es un proceso que crea mo entre los hallazgos y la realidad se reemplaza realidad. por el isomorfismo entre las realidades construi- das de las audiencias y las reconstrucciones del En esta evaluación, se retienen las caracterís- evaluador atribuidas a ellas. Para conseguir esto ticas del evaluador fruto de las tres primeras existen varias técnicas, entre las que destacan las generaciones, esto es, la de técnico, la de ana- siguientes: a) el compromiso prolongado, b) la lista y la de juez, pero estas deben ampliarse observación persistente, c) el contraste con cole- con destrezas para recoger e interpretar datos gas, d) el análisis de casos negativos (Kidder, cualitativos (Patton, 1980), con la de historia- 1981), e) la subjetividad progresiva y f) el con- dor e iluminador, con la de mediador de jui- trol de los miembros. La transferencia puede cios, así como un papel más activo como eva- verse como paralela a la validez externa, la de- luador en un contexto socio-político concreto. pendencia es paralela al criterio de fiabilidad y la Russell y Willinsky (1997) defienden las po- confirmación puede verse como paralela a la tencialidades del planteamiento de la cuarta objetividad. generación para desarrollar formulaciones al- Otra manera de juzgar la calidad de la evalua- ternativas de práctica evaluadora entre los im- ción es el análisis dentro del propio proceso, algo plicados, incrementando la probabilidad de que que encaja con el paradigma hermenéutico, a la evaluación sirva para mejorar la enseñanza través de un proceso dialéctico. escolar. Esto requiere por parte del profesorado el reconocimiento de otras posiciones, además Pero estos dos tipos de criterios, aunque útiles, de la suya, la implicación de todos desde el no son del todo satisfactorios para Guba y Lin- principio del proceso y, por otra parte, el desa- coln, que defienden con más ahínco los criterios rrollo de aproximaciones más pragmáticas de que denominan de autenticidad, también de base la conceptualización de Guba y Lincoln, adap- constructivista. Estos criterios incluyen los si- tadas a las distintas realidades escolares. guientes: a) imparcialidad, justicia, b) autentici- dad ontológica, c) autenticidad educativa, d) au- 7. El nuevo impulso alrededor de Stuf- tenticidad catalítica y e) autenticidad táctica flebeam (Lincoln y Guba, 1986). Para terminar este recorrido analítico- Este análisis de la cuarta generación de pode- histórico desde los primeros intentos de medi- mos terminarlo con los rasgos con los que defi- ción educativa hasta la actual investigación nen Guba y Lincoln a la evaluación: evaluativa en educación, queremos recoger las recomendaciones que más recientemente nos a) La evaluación es un proceso sociopolítico. viene ofreciendo una de las figuras señeras de este campo en la segunda mitad del siglo XX. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 26
  • 17.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Nos estamos refiriendo a Daniel L. Stufflebeam, Para evaluar la educación en una sociedad proponente del modelo CIPP (el más utilizado) a moderna, Stufflebeam (1994) nos dice que se finales de los sesenta, desde 1975 a 1988 presi- deben tomar algunos criterios básicos de refe- dente del «Joint Committee on Standars for Edu- rencia como los siguientes: cational Evaluation» y actual director del «Eva- luation Center» de la Western Michigan Univer- • Las necesidades educativas. Es necesario sity (sede del Joint Committee) y del CREATE preguntarse si la educación que se propor- (Center for Research on Educational Accounta- ciona cubre las necesidades de los estudian- bility and Teacher Evaluation), centro auspiciado tes y de sus familias en todos los terrenos a y financiado por el Departamento de Educación la vista de los derechos básicos, en este caso, del gobierno americano. dentro de una sociedad democrática (Nowa- kowski y otros, 1985). Recogiendo estas recomendaciones (Stuffle- beam, 1994, 1998, 1999, 2000 y 2001), en las • La equidad. Hay que preguntarse si el sis- que se han ido integrando ideas de diversos eva- tema es justo y equitativo a la hora de pro- luadores también notables, no sólo ofrecemos porcionar servicios educativos, el acceso a una de las últimas aportaciones a la actual con- los mismos, la consecución de metas, el de- cepción de la investigación evaluativa en educa- sarrollo de aspiraciones y la cobertura para ción, sino que completamos en buena medida la todos los sectores de la comunidad (Kella- visión del panorama actual, rico y plural, tras gan, 1982). analizar la cuarta generación de Guba y Lincoln. • La factibilidad. Hay que cuestionar la efi- Se parte de los cuatro principios del Joint ciencia en la utilización y distribución de re- Committee (1981 y 1988), esto es, de la idea de cursos, la adecuación y viabilidad de las que cualquier buen trabajo de investigación eva- normas legales, el compromiso y participa- luativa debe ser: a) útil, esto es, proporcionar ción de los implicados y todo lo que hace información a tiempo e influir, b) factible, esto que el esfuerzo educativo produzca el es, debe suponer un esfuerzo razonable y debe máximo de frutos posibles. ser políticamente viable, c) apropiada, adecua- • La excelencia como objetivo permanente da, legítima, esto es, ética y justa con los impli- de búsqueda. La mejora de la calidad, a par- cados, y d) segura y precisa a la hora de ofrecer tir del análisis de las prácticas pasadas y pre- información y juicios sobre el objeto de la eva- sentes es uno de los fundamentos de la in- luación. Además, la evaluación se ve como una vestigación evaluativa. «transdisciplina», pues es aplicable a muchas disciplinas diferentes y a muchos objetos diver- Tomando el referente de estos criterios y sus sos (Scriven, 1994). derivaciones, Stufflebeam sumariza una serie de recomendaciones para llevar a cabo buenas Stufflebeam invoca a la responsabilidad del investigaciones evaluativas y mejorar el siste- evaluador, que debe actuar de acuerdo a princi- ma educativo. Estas recomendaciones son las pios aceptados por la sociedad y a criterios de siguientes: profesionalidad, emitir juicios sobre la calidad y el valor educativo del objeto evaluado y debe 1) Los planes de evaluación deben satisfa- asistir a los implicados en la interpretación y cer los cuatro requerimientos de utilidad, utilización de su información y sus juicios. Sin factibilidad, legitimidad y precisión (Joint embargo, es también su deber, y su derecho, estar Committee, 1981 y 1988). al margen de la lucha y la responsabilidad políti- ca por la toma de decisiones y por las decisiones 2) Las entidades educativas deben tomadas. examinarse por su integración y servicio a los principios de la sociedad democrática, equidad, bienestar, etc. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 27
  • 18.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm 3) Las entidades educativas deben ser valo- 9) La evaluación del contexto (necesida- radas tanto por su mérito (valor intrínseco, ca- des, oportunidades, problemas en un área,...) lidad respecto a criterios generales) como por debe emplearse de manera prospectiva, para su valor (valor extrínseco, calidad y servicio localizar bien las metas y objetivos y definir para un contexto particular) (Guba y Lincoln, prioridades. Asimismo, la evaluación del 1982; Scriven, 1991), como por su significa- contexto debe utilizarse retrospectivamente, ción en la realidad del contexto en el que se para juzgar bien el valor de los servicios y ubica. Scriven (1998) nos señala que usando resultados educativos, en relación con las otras denominaciones habituales, mérito tiene necesidades de los estudiantes (Madaus y bastante equivalencia con el término calidad, otros, 1991; Scriven, 1991) valor con el de relación coste-eficacia y signi- ficación con el de importancia. En todo caso, 10) La evaluación de las entradas (inputs) los tres conceptos son dependientes del con- debe emplearse de manera prospectiva, para texto, sobre todo significación, de manera que asegurar el uso de un rango adecuado de en- entender la diferencia entre dependencia del foques según las necesidades y los planes. contexto y arbitrariedad es parte de la com- 11) La evaluación del proceso debe usarse prensión de la lógica de la evaluación. de manera prospectiva para mejorar el plan 4) La evaluación de profesores, instituciones de trabajo, pero también de manera retros- educativas, programas, etc, debe relacionarse pectiva para juzgar hasta qué punto la cali- siempre con el conjunto de sus deberes, res- dad del proceso determina el por qué los re- ponsabilidades y obligaciones profesionales o sultados son de un nivel u otro (Stufflebean institucionales, etc. Quizás uno de los retos y Shinkfield, 1987). que deben abordar los sistemas educativos es 12) La evaluación del producto es el medio la definición más clara y precisa de estos de- para identificar los resultados buscados y no beres y responsabilidades. Sin ello, la eva- buscados en los participantes o afectados por luación es problemática, incluso en el terreno el objeto evaluado. Se necesita una valora- formativo (Scriven, 1991a). ción prospectiva de los resultados para 5) Los estudios evaluativos deben ser capa- orientar el proceso y detectar zonas de nece- ces de valorar hasta qué medida los profesores sidades. Se necesita una evaluación retros- y las instituciones educativas son responsables pectiva del producto para poder juzgar en y rinden cuentas del cumplimiento de sus de- conjunto el mérito y el valor del objeto eva- beres y obligaciones profesionales (Scriven, luado (Scriven, 1991; Webster y Edwards, 1994). 1993; Webster y otros, 1994). 6) Los estudios evaluativos deben proporcio- 13) Los estudios evaluativos se deben apo- nar direcciones para la mejora, porque no bas- yar en la comunicación y en la inclusión sus- ta con emitir un juicio sobre el mérito o el va- tantiva y funcional de los implicados (stake- lor de algo. holders) con las cuestiones claves, criterios, hallazgos e implicaciones de la evaluación, 7) Recogiendo los puntos anteriores, todo es- así como en la promoción de la aceptación y tudio evaluativo debe tener un componente el uso de sus resultados (Chelimsky, 1998). formativo y otro sumativo. Más aún, los estudios evaluativos deben conceptualizarse y utilizarse 8) Se debe promover la autoevaluación pro- sistemáticamente como parte del proceso de fesional, proporcionando a los educadores las mejora educativa a largo plazo (Alkin y destrezas para ello y favoreciendo actitudes otros, 1979; Joint Committee, 1988; Stronge positivas hacia ella (Madaus y otros, 1991) y Helm, 1991; Keefe, 1994) y de fundamento para la acción contra las discriminaciones sociales (Mertens, 1999). Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 28
  • 19.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm (Mertens, 1999). La evaluación para el desa- lógico desde el que se parte, pero apareciendo rrollo (empowerment evaluation), que defien- claros y contundentes algunos elementos co- de Fetterman (1994), es un procedimiento, de munes a todas las perspectivas como la contex- base democrática, de participación de los im- tualización, el servicio a la sociedad, la diver- plicados en el programa evaluado, para pro- sidad metodológica, la atención, respeto y par- mover la autonomía de los mismos en la reso- ticipación de los implicados, etc., así como una lución de sus problemas. Weiss (1998) nos mayor profesionalización de los evaluadores y alerta de que la evaluación participativa in- una mayor institucionalización de los estudios crementa la probabilidad de que se utilicen los (Worthen y Sanders, 1991). resultados de la evaluación, pero también la de que sea conservadora en su concepción, pues El propio Stufflebeam (1998) reconoce el es difícil pensar que los responsables de una conflicto de los planteamientos del Joint Com- organización pongan en cuestión el fundamen- mittee on Standards for Educational Evalua- to y el sistema de poder de la misma. Gene- tion con las posiciones de la corriente evalua- ralmente su interés es el cambio de cosas pe- dora denominada postmodernista, representada, queñas. además de por Guba y Lincoln, por otros reco- nocidos evaluadores como Mabry, Stake y 14) Los estudios evaluativos deben emplear Walker, pero no acepta que existan razones múltiples perspectivas, múltiples medidas de para actitudes de escepticismo y frustración resultados, y métodos tanto cuantitativos co- con las prácticas evaluadoras actuales, porque mo cualitativos para recoger y analizar la in- existen muchos ámbitos de aproximación y el formación. La pluralidad y complejidad del desarrollo de estándares de evaluación es fenómeno educativo hace necesario emplear perfectamente compatible con la atención a los enfoques múltiples y multidimensionales en diversos implicados, valores, contextos socia- los estudios evaluativos (Scriven, 1991) les y métodos. Stufflebeam defiende una mayor colaboración en la mejora de las evaluaciones, 15) Los estudios evaluativos deben ser evalua- estableciendo los estándares de manera partici- dos, incluyendo metaevaluaciones formativas pativa, pues cree que es posible la aproxima- para mejorar su calidad y su uso y metaeva- ción de planteamientos, con contribuciones luaciones sumativas para ayudar a los usuarios importantes desde todos los puntos de vista. en la interpretación de sus hallazgos y propor- cionar sugerencias para mejorar futuras eva- Weiss (1998) también toma posiciones pare- luaciones (Joint Committee, 1981 y 1988; Ma- cidas cuando nos dice que las ideas constructi- daus y otros, 1991; Scriven, 1991; Stuffle- vistas deben hacernos pensar más cuidadosa- beam, 2001). mente al usar los resultados de las evaluacio- nes, sintetizarlas y establecer generalizaciones, Estas quince recomendaciones proporcionan pero duda que todo haya que interpretarlo en elementos esenciales para un enfoque de los es- términos exclusivamente individuales, pues tudios evaluativos que Stufflebeam denomina existen muchos elementos comunes entre las objetivista y que se basa en la teoría ética de que personas, los programas y las instituciones. la bondad moral es objetiva e independiente de los sentimientos personales o meramente huma- 8. Para concluir: síntesis de enfoques nos. modélicos y metodológicos de la evalua- Sin entrar en el debate sobre estas valoraciones ción y la última perspectiva de Scriven finales de Stufflebeam, ni en análisis comparati- Tras este análisis del desarrollo de la evalua- vos con otras propuestas, por ejemplo con las de ción a lo largo del Siglo XX, parece oportuno, Guba y Lincoln (1989), nos resulta evidente que a modo de síntesis y de conclusión, recoger y las concepciones de la investigación evaluativa resaltar los que son considerados los principa- son diversas, dependiendo del origen epistemo- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 29
  • 20.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm les modelos, planteamientos metodológicos, di- como «persuasiones» mientras que House seños, perspectivas y visiones de la evaluación (1983) se refiere a «metáforas». en la actualidad. Su análisis, de manera compac- ta, es un complemento necesario para una visión Norris (1993) apunta que el concepto de mo- como la histórica que, por su linealidad, tiene el delo se utiliza con cierta ligereza al referirse a riesgo de ofrecer una imagen disciplinar artifi- concepción, enfoque o incluso método de eva- ciosamente fraccionada. luación. De Miguel (1989), por su parte, piensa que muchos de los llamados modelos solamen- Hemos visto que en la década de los setenta y te son descripciones de procesos o aproxima- en sus alrededores se produce una especie de ciones a programas de evaluación. Darling- eclosión de propuestas evaluativas, que tradicio- Hammond y otros (1989) utilizan el término nalmente han venido siendo denominadas como «modelo» por costumbre, pero indican que no modelos (Castillo y Gento, 1995) y en algunos lo hacen en el sentido preciso que tiene el tér- casos como diseños (Arnal y otros, 1992) de in- mino en las ciencias sociales, esto es, apoyán- vestigación evaluativa. Sabemos que existieron dose en una estructura de supuestos interrela- varias decenas de estas propuestas, pero muy cionales fundamentada teóricamente. Final- concentradas en el tiempo, en la década citada. mente diremos que el propio autor del modelo De hecho, el asunto de los propuestos modelos CIPP, solamente utiliza esta denominación de para la evaluación parece un tema prácticamente manera sistemática para referirse a su propio cerrado desde hace cuatro lustros. Ya no surgen modelo (Stufflebeam y Shinkfield, 1987), utili- nuevos modelos o propuestas, salvo alguna ex- zando los términos de enfoque, método, etc., al cepción como vemos más adelante. referirse a los otros. Para nosotros, quizás sea el término enfoque evaluativo el más apropia- A pesar de lo dicho, se sigue hablando de mo- do, aunque aceptemos seguir hablando de mo- delos, métodos y diseños en la literatura especia- delos y diseños por simple tradición académi- lizada, sobre todo buscando su clasificación de ca. acuerdo con diversos criterios, origen paradigmá- tico, propósito, metodología, etc. También en las Nuestra idea es que a la hora de plantearnos clasificaciones, no sólo en los modelos, existe una investigación evaluativa, no contamos to- diversidad, lo que prueba que, además de dina- davía con unos pocos modelos bien fundamen- mismo académico en el terreno de la investiga- tados, definidos, estructurados y completos, ción evaluativa, todavía existe cierta debilidad entre los que elegir uno de ellos, pero sí tene- teórica al respecto. mos distintos enfoques modélicos y un amplio soporte teórico y empírico, que permiten al Nosotros ya hemos señalado con anterioridad evaluador ir respondiendo de manera bastante (Escudero, 1993), que coincidimos con Nevo adecuada a las distintas cuestiones que le va (1983 y 1989) en la apreciación de que muchos planteando el proceso de investigación, ayu- de los acercamientos a la conceptualización de la dándole a configurar un plan global, un orga- evaluación (por ejemplo, el modelo respondiente, nigrama coherente, un «modelo» científica- el libre de metas, el de discrepancias, etc.) se les mente robusto para llevar a cabo su evaluación ha denominado indebidamente como modelos a (Escudero, 1993). ¿Cuáles son las cuestiones pesar de que ninguno de ellos tenga el grado de que hay que responder en este proceso de cons- complejidad y de globalidad que debería acarrear trucción modélica? Apoyándonos en las apor- el citado concepto. Lo que un texto clásico en taciones de diferentes autores (Worthen y San- evaluación (Worthen y Sanders, 1973) denomina ders, 1973; Nevo, 1989; Kogan, 1989; Smith y como «modelos contemporáneos de evaluación» Haver, 1990), deben responderse y delimitar su (a los conocidos planteamientos de Tyler, Scri- respuesta al construir un modelo de investiga- ven, Stake, Provus, Stufflebeam, etc), el propio ción evaluativa, los aspectos siguientes: Stake (1981) dice que sería mejor denominarlo Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 30
  • 21.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm 1) Objeto de la investigación evaluativa. 13) Evaluación de la propia investigación evaluativa / metaevaluación. 2) Propósito, objetivos. Para definir estos elementos hay que buscar, 3) Audiencias/implicados/clientela. lógicamente, el apoyo de los diferentes enfo- ques modélicos, métodos, procedimientos, etc., 4) Énfasis/aspectos prioritarios o preferentes. que la investigación evaluativa ha desarrollado, 5) Criterios de mérito o valor. sobre todo en las últimas décadas. 6) Información a recoger. Volviendo a los denominados modelos de los setenta y a sus clasificaciones, podemos reco- 7) Métodos de recogida de información. ger algunas de las aparecidas en la última dé- cada en nuestro entorno académico, apoyándo- 8) Métodos de análisis. se en distintos autores. Así, por ejemplo, Arnal 9) Agentes del proceso. y otros (1992) ofrecen una clasificación de lo que denominan diseños de la investigación 10) Secuenciación del proceso. evaluativa, revisando las de diversos autores (Patton, 1980; Guba y Lincoln, 1982; Pérez, 11) Informes/utilización de resultados. 1983; Stufflebeam y Shinkfield, 1987). Esta clasificación es la siguiente : 12) Límites de la evaluación. Tabla 1- Tipos de diseños de investigación educativa Patton Guba y Lincoln Pérez Stufflebeam y Autores Perspectiva (1980) (1982) (1983) Shinkfield (1987) creadores Objetivos Objetivos Objetivos Objetivos Tyler (1950) Empírico- Rivlin (1971) Análisis sistemas Análisis sistemas analítica Rossi y otros (1979) Método Suchman (1967) científico CIPP CIPP CIPP Stufflebeam (1966) Susceptibles Crítica artística Crítica artística Crítica artística Eisner (1971) de comple- mentariedad Adversario Contrapuesto Wolf (1974) UTOS UTOS Cronbach (1982) Respondente Respondente Respondente Respondente Stake (1975 Iluminativo Iluminativo Iluminativo Parlett y Hamilton (1977) Humanístico- interpretativa Sin metas Sin metas Sin metas Scriven (1967) Democrático MacDonald (1976) Por su parte, Castillo y Gento (1995) ofrecen humanísticos y holísticos (mixtos). Una sínte- una clasificación de «métodos de evaluación» sis de estas clasificaciones es la siguiente: dentro de cada uno de los modelos (paradigmas), que ellos denominan conductivista-eficientistas, Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 31
  • 22.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Tabla 2- Modelo conductista-eficientista Método/ Finalidad Paradigma domi- Contenido de Rol del autor evaluativa nante evaluación evaluador Consecución Medición logro Cuantitativo Resultados Técnico externo objetivos objetivos Tyler (1940) CIPP Información Mixto C (contexto) Técnico externo Stufflebeam para toma I (input) (1967) decisiones P (proceso) P (producto) Figura Valoración Mixto Antecedentes, Técnico externo (countenance) resultados y transacciones, Stake (1967) proceso resultados CSE Información para Mixto Centrados en Técnico externo Alkin (1969) determinación de logros de decisiones necesidades Planificación Valoración Mixto U (unidades de Técnico externo educativa proceso y evaluación) Cronbach producto T (tratamiento) (1982) O (operaciones) Tabla 3- Modelo humanístico Método/ Finalidad Paradigma domi- Contenido de Rol del autor evaluativa nante evaluación evaluador Atención al Análisis de Mixto Todos los Evaluador externo cliente necesidades del efectos del de necesidades Scriven (1973) cliente programa del cliente Contraposición Opiniones para Mixto Cualquier aspecto Árbitro externo Owens (1973), decisión del programa del debate Wolf (1974) consensuada Crítica artística Interpretación Cualitativo • Contexto Provocador Eisner (1981) crítica de la • Procesos externo de acción educativa emergentes interpretaciones • Relaciones de procesos • Impacto en contexto Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 32
  • 23.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Tabla 4- Modelo holístico Método/ Finalidad Paradigma domi- Contenido de Rol del autor evaluativa nante evaluación evaluador Evaluación Valoración de Cualitativo Resultado de Promotor externo respondente respuesta a debate total de la interpreta- Stake (1976) necesidades de sobre programa ción participantes por los implicados Evaluación Interpretación Cualitativo Elementos que Promotor externo holística educativa para configuran la de la interpreta- MacDonald mejorarla acción educativa ción (1976) por los implicados Evaluación Iluminación y Cualitativo Sistema de Promotor externo iluminativa comprensión de enseñanza y me- de la interpreta- Parlett y Hamil- los componentes dio ción ton del programa de aprendizaje por los implicados (1977) También Scriven (1994) ofrece una clasifica- mente el objetivo perseguido, es el criterio de ción de los «modelos anteriores», previamente a evaluación. introducir su perspectiva transdisciplinar que A diferencia de Tyler, Stufflebeam ofrece luego comentamos. Este autor identifica seis vi- una perspectiva más amplia de los contenidos a siones o enfoques alternativos en la fase «explo- evaluar. Estos son las cuatro dimensiones que siva» de los modelos, además de algunas más identifican su modelo, contexto (C) donde tiene que denomina «exóticas» y que se mueven entre lugar el programa o está la institución, inputs los modelos de jurisprudencia y de experto. A (I) elementos y recursos de partida, proceso (P) continuación comentamos sucintamente estas que hay que seguir hacia la meta y producto visiones y los «modelos» que se adscriben a (P) que se obtiene. Además, se deja constancia ellas. de que el objetivo primordial de la investiga- La visión fuerte hacia la toma de decisiones ción evaluativa es la mejora, la toma de deci- (Visión A) concibe al evaluador investigando siones para la mejora de todas y cada una de con el objetivo de llegar a conclusiones evaluati- las cuatro dimensiones antes citadas. vas que le ayuden al que debe tomar decisiones. Scriven (1994) nos dice que Stufflebeam ha Los que apoyan este enfoque se preocupan de si seguido desarrollando su perspectiva desde que el programa alcanza sus objetivos, pero van más desarrolló el CIPP. Sin embargo, uno de sus allá, cuestionándose si tales objetivos cubren las colaboradores en tal empresa, Guba, tomó necesidades que deben cubrir. Esta posición es posteriormente una dirección diferente, tal mantenida, aunque no la hiciera explícita, por como hemos visto al analizar la cuarta genera- Ralph Tyler y extensamente elaborada en el mo- ción de la evaluación (Guba y Lincoln, 1989). delo CIPP (Stufflebeam y otros, 1971). La visión débil hacia la toma de decisiones Según el planteamiento tyleriano, las decisio- (Visión B) concibe al evaluador proporcionan- nes acerca de un programa deben basarse en el do información relevante para la toma de deci- grado de coincidencia entre los objetivos y los siones, pero no le obliga a emitir conclusiones resultados. El cambio de los alumnos, habitual- evaluativas o críticas a los objetivos de los programas. El representante teórico más genui- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 33
  • 24.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm no es Marv Alkin (1969), que define a la evalua- poralización prevista. Este modelo es muy cer- ción como un proceso factual de recogida y ge- cano al control de programas en sentido con- neración de información al servicio del que toma vencional; es una especie de simulación de una las decisiones, pero es éste el que tiene que tomar evaluación. las conclusiones evaluativas. Esta posición es lógicamente popular entre los que piensan que la La visión de la descripción fértil, rica, com- verdadera ciencia no debe o no puede entrar en pleta (Visión D) es la que entiende la evalua- cuestiones de juicios de valor. El modelo de Al- ción como una tarea etnográfica o periodística, kin se conoce como CES (Centro para el Estudio en la que el evaluador informa de lo que ve sin de la Evaluación), planteando las siguientes fa- intentar emitir afirmaciones valorativas o infe- ses: valoración de las necesidades y fijación del rir conclusiones evaluativas, ni siquiera en el problema, planificación del programa, evalua- marco de los valores del cliente como en la ción de la instrumentalización, evaluación de visión relativista. Esta visión ha sido defendida progresos y evaluación de resultados. por Robert Stake y muchos de los teóricos bri- tánicos. Se trata de una especie de versión na- La visión relativista (Visión C) también man- turalista de la visión B, tiene algo de sabor re- tiene la distancia de las conclusiones evaluativas, lativista y a veces parece precursora de la vi- pero usando el marco de valores de los clientes, sión de la cuarta generación. Se centra en la sin un juicio por parte del evaluador acerca de observación, en lo observable, más que en la esos valores o alguna referencia a otros. Esta inferencia. Recientemente se le ha denominado visión y la anterior han sido el camino que ha como visión de la descripción sólida, fuerte, permitido integrarse sin problemas en el «carro» para evitar el término rica, que parece más de la investigación evaluativa a muchos científi- evaluativa. cos sociales. De hecho, uno de los textos más utilizados de evaluación en el ámbito de las cien- Stake, en su primera etapa, es tayleriano en cias sociales (Rossi y Freeman, 1993), toma pre- cuanto a concepción evaluativa centrada en los ferentemente esta perspectiva . objetivos planteados, proponiendo el método de evaluación de la figura (Stake, 1967), como Las visiones B y C son las posiciones de los rostro o imagen total de la evaluación. Esta gira científicos entroncados con una concepción libre en torno a los tres componentes, antecedentes, de valores de la ciencia. En cambio, los que par- transacciones y resultados, elaborando dos ticipan de la visión A proceden de un paradigma matrices de datos, una de descripción y otra de diferente, probablemente debido a su conexión juicio. En la primera se recogen de un lado las académica con la historia, la filosofía de la edu- intenciones y de otro las observaciones y, en la cación, la educación comparada y la administra- segunda, las normas, lo que se aprueba y los ción educativa. juicios, lo que se cree que debe ser. Hace unos años Alkin (1991) revisó sus plan- A mitad de los setenta, Stake se aleja de la teamientos de dos décadas atrás, pero siguió sin tradición tayleriana de preocupación por los incluir los términos de mérito, valor o valía; ter- objetivos y revisa su método de evaluación mina definiendo un Sistema de Información para hacia un planteamiento que él califica como la Gestión (Management Information System- «respondente» (Stake, 1975 y 1975a), asu- MIS) para uso del que toma decisiones, pero no miendo que los objetivos del programa pueden ofrece valoraciones al respecto modificarse sobre la marcha, con la finalidad de ofrecer una visión completa y holística del Pero la forma más simple de la visión relativis- programa y responder a los problemas y cues- ta (Visión C) es la desarrollada en el «modelo de tiones reales que plantean los implicados. Se- discrepancia» de evaluación de Malcolm Provus gún Stufflebeam y Shinkfield (1987), este mo- (1971). Las discrepancias son las divergencias delo hizo de Stake el líder de una nueva escue- con la secuencia de tareas proyectadas y la tem- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 34
  • 25.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm la de evaluación, que exige un método pluralista, • Unidades (U) que son sometidas a evalua- flexible, interactivo, holístico, subjetivo y orien- ción, individuos o grupos participantes. tado al servicio. Este modelo sugiere la «atención al cliente» propuesta por Scriven (1973), valo- • Tratamiento (T) de la evaluación. rando sus necesidades y expectativas. • Operaciones (O) que lleva a cabo el eva- De manera gráfica, Stake (1975a) propone las luador para la recogida y análisis de datos, fases del método a modo de las horas de un reloj, así como para la elaboración de conclusio- poniendo la primera en las doce horas y siguien- nes. do las siguientes fases, el sentido de las agujas • Contexto en el que tiene lugar el programa del reloj. Estas fases son las siguientes: 1) Hablar y su evaluación. con los clientes, responsables y audiencias, 2) Alcance del programa, 3) Panorama de activida- En una investigación evaluativa concreta se des, 4) Propósitos e intereses, 5) Cuestiones y pueden dar varias unidades, varios tratamientos problemas, 6) Datos para investigar los proble- y varias operaciones, en definitiva varios (uto), mas, 7) Observadores, jueces e instrumentos, 8) dentro de un universo UTO de situaciones Antecedentes, transacciones y resultados, 9) De- admisibles. sarrollo de temas, descripciones y estudio de casos, 10) Validación (confirmación), 11) Es- Ernie House (1989), un teórico y un práctico quema para la audiencia y 12) Reunión de infor- de la evaluación bastante independiente de mes formales. El evaluador puede seguir las fa- corrientes en boga, también marcó el entronque ses también en sentido contrario del reloj o en social de los programas, pero se distinguía so- cualquier otro orden. bre todo por su énfasis de las dimensiones más éticas y argumentales de la evaluación, quizás En el método respondente el evaluador ha de motivado por la ausencia de estas facetas en los entrevistar a los implicados para conocer sus planteamientos de Cronbach y sus colaborado- puntos de vista y buscar la confluencia de las res. diversas perspectivas. El evaluador deberá inter- pretar las opiniones y diferencias de puntos de La visión constructivista de la cuarta gene- vista (Stecher y Davis, 1990) y presentar una ración (Visión F) es la última de estas seis vi- amplia gama de opiniones o juicios, en lugar de siones que describe Scriven (1994), siendo presentar sus conclusiones personales. mantenida por Guba y Lincoln (1989) y segui- da por muchos evaluadores americanos y britá- La visión del proceso social (Visión E) que nicos. Ya hemos visto anteriormente que esta cristalizó hace algo más de dos décadas alrededor visión rechaza una evaluación orientada a la de un grupo de la Universidad de Stanford, diri- búsqueda de calidad, mérito, valor, etc., y favo- gido por Lee J. Cronbach (1980), resta importan- rece la idea de que ello es el resultado de la cia a la orientación sumativa de la evaluación construcción por individuos y la negociación (decisiones externas sobre los programas y ren- de grupos. Esto significa, según Scriven, que el dición de cuentas), enfatizando la comprensión, conocimiento científico de todo tipo es sospe- la planificación y la mejora de los programas choso, discutible y no objetivo. Lo mismo le sociales a los que sirve. Sus posiciones quedaban ocurre a todo trabajo análitico como el análisis claramente establecidas en noventa y cinco tesis filosófico, incluido el suyo. Scriven apunta que que han tenido una enorme difusión entre los el propio Guba ha sido siempre consciente de evaluadores y los usuarios de la evaluación. las potenciales «autocontradicciones» de su posición. En cuanto a los contenidos de la evaluación, Cronbach (1983) propone que se planifiquen y De esta revisión de Scriven quedan al margen controlen los siguientes elementos: algunas posiciones evaluativas tradicionalmen- te recogidas y tratadas por los analistas. Así por Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 35
  • 26.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm ejemplo, Schuman (1967) ofrece un diseño eva- distinta de la aludida visión A y radicalmente luativo basado en el método científico o, al me- diferente de las restantes. nos, en alguna variación o adaptación del mismo. Owens (1973) y Wolf (1974 y 1975) proponen En la perspectiva transdisciplinar, la investi- un método de contraposición o discusión que gación evaluativa tiene dos componentes: el sobre un programa llevan a cabo dos grupos de conjunto de campos de aplicación de la evalua- evaluadores, partidarios y adversarios, para pro- ción y el contenido de la propia disciplina. Al- porcionar información pertinente a quienes to- go parecido a lo que ocurre a disciplinas como man decisiones. Eisner (1971, 1975 y 1981) la estadística y la medición. En definitiva, la plantea la evaluación en términos similares al investigación evaluativa es una disciplina que proceso de crítica artística. incluye sus propios contenidos y los de otras muchas disciplinas; su preocupación por el El propio Scriven (1967 y 1973) proponía hace análisis y mejora se extiende a muchas disci- años centrar la evaluación en la atención al clien- plinas, es transdisciplinar. te y no tanto en las metas previstas, puesto que frecuentemente los logros no previstos son más Esta visión es objetivista como la A y defien- importantes que los que figuran en la planifica- de que el evaluador determine el mérito o el ción del programa. Por ello, se suele denominar a valor del programa, del personal o de los pro- su enfoque como evaluación sin metas. El eva- ductos investigados. En tal sentido, se debe luador determina el valor o mérito del programa establecer de manera explícita y defender la para informar a los usuarios; se trata algo así lógica utilizada en la inferencia de conclusio- como de un intermediario informativo (Scriven, nes evaluativas a partir de las premisas defini- 1980). cionales y factuales. Así mismo, se deben per- seguir las falacias argumentales de la doctrina La evaluación iluminativa (Parlett y Hamilton, libre de valores (Evaluation Thesaurus, 1991). 1977) tiene un enfoque holístico, descriptivo e interpretativo, con la pretensión de iluminar so- En segundo lugar, la perspectia transdisci- bre un complejo rango de cuestiones que se dan plinar se orienta hacia el consumidor, más que de manera interactiva (Fernández, 1991). La eva- hacia el gestor o intermediario. No se trata de luación democrática de MacDonald (1971 y una orientación exclusiva hacia el consumidor, 1976), también denominada holística, supone la pero sí la consideración primera del consumi- participación colaborativa de los implicados, dor como justificación del programa, y que el siendo el contraste de opiniones de los implica- bien común es la primacía de la evaluación. A dos el elemento evaluativo primordial. partir de aquí, también se produce información valiosa para el gestor que decide y se pueden Scriven (1994) analiza las seis visiones críti- analizar los productos de un programa o insti- camente y se muestra más cercano a la visión A, tución a la vista de sus objetivos. Esta posición la visión fuerte sobre la toma de decisiones, re- no sólo ve legitimidad en la emisión de conclu- presentada fundamentalmente por el modelo siones evaluativas por parte del investigador, CIPP de Stufflebeam y sus planteamientos, pues sino que ve necesidad de hacerlo en la gran dice que es la más cercana de todas a la visión mayoría de las ocasiones. del sentido común, que es la que tienen los eva- luadores trabajando con sus programas, de la Se trata también de una visión generalizada, misma manera que los médicos trabajan con los no justamente una visión general, que incluye pacientes, haciéndolo lo mejor posible, indepen- la generalización de conceptos en el ámbito del dientemente del tipo y del estado general del conocimiento y la práctica. Desde esta perspec- paciente. Scriven quiere extender esta visión con tiva, la investigación evaluativa es mucho más una visión o modelo que denomina transdiscipli- que la evaluación de programas e incide en nar y que él califica como significativamente procesos, instituciones y otros muchos más Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 36
  • 27.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm objetos. De manera más detallada, esta visión sentido estricto. Pensamos que esta orientación generalizada significa que: debe integrarse dentro de una orientación a los implicados, donde existen distintos tipos y dis- a) Los campos distintivos de aplicación de la tintas audiencias y, por supuesto, una muy im- disciplina son los programas, el personal, los portante, son los usuarios en el sentido de Scri- rendimientos, los productos, los proyectos, la ven, pero nos parece que la investigación eva- gestión, y la metaevaluación de todo ello. luativa hoy en día tiene una orientación priori- taria más plural que la defendida por este au- b) Las investigaciones evaluativas inciden en tor. todo tipo de disciplinas y en las prácticas que resultan de ellas. Referencias bibliográficas c) Las investigaciones evaluativas se mueven Ahman, S. J. y Cook, M. D. (1967). Evaluating desde niveles muy prácticos hasta el nivel Pupil Growth. Principles of Tests Measure- conceptual. ment. Boston, Ma.: Allyn and Bacon Alkin, M. (1969). Evaluation theory develop- d) Los distintos campos de la investigación ment. Evaluation Comment, 2, 1, 2-7. evaluativa tienen muchos niveles de interco- Alkin, M. (1991). Evaluation theory develop- nexión y solapamiento. La evaluación de pro- ment: II. En M. McLaughlin, y Phillips (Eds.), gramas, de personal, de centros, etc., tienen Evaluation and education at quarter century muchos puntos en común. (pp.91-112). Chicago: NSSE/ University of El cuarto elemento distintivo de la visión Chicago . transdisciplinar de la evaluación es que se trata Anderson, S. B. y Ball, S. (1983). The profes- de una visión técnica. La evaluación no sólo ne- sion and practice of program evaluation. San cesita el apoyo técnico de otras muchas discipli- Francisco, Ca: Jossey-Bass. nas, sino que, además, tiene su propia metodolo- Arnal, J.; Del Rincon, D. y Latorre, A. (1992). gía. La lógica de la síntesis de resultados, las Investigación educativa. Fundamentos y Me- consecuencias, etc., y la correcta ubicación en el todología. Barcelona: Labor proceso de muchas técnicas auxiliares en las que, Atkin, J. M. (1968). Behavioral Objectives in probablemente, no es necesario ser un gran espe- curriculum design: A cautionary note. The cialista, pero sí tener un conocimiento cabal. Science Teacher, 35, 27-30. Baker, L. R. (1969). Curriculum evaluation. Esta perspectiva transdisciplinar de la investi- Review of Educational Research, 39, 339-358. gación evaluativa de Scriven (1994), coincide en Barbier, J. M. (1993). La evaluación en los gran medida con los planteamientos que de la procesos de formación. Barcelona: Paidos. misma hemos defendido en otros momentos (Es- Berk, A. R. (Ed.) (1981). Educational evalua- cudero, 1996). Nosotros no tenemos unas posi- tion methodology: The state of the art. Balti- ciones contrarias a las otras visiones en la misma more: The Hopkins University Press. medida que las tiene Scriven y, de hecho, consi- Blanco, F. (1994). La evaluación en la educa- deramos desde una posición pragmática, que ción secundaria. Salamanca: Amasú Edicio- todas las visiones tienen puntos fuertes y que en nes. todo caso, aportan algo útil para la comprensión conceptual y el desarrollo de la investigación Bloom, B. S., Engelhaut, M.D., Furst, E.J., evaluativa. Sin embargo, sí que pensamos que Hill, W.H. y Krathwohl, D.R. (1956). Taxo- esta moderna visión de Scriven es sólida y cohe- nomy of educational objectives Handbook I; rente y ampliamente aceptada en la actualidad. Cognitive domain. New York: Davis, McKay. Bloom, B. S., Hastings, J. Th. y Madaus, F. Una crítica que podría hacerse a este plantea- (1971). Handbook on formative and summati- miento de Scriven está en el excesivo énfasis ve evaluation of student learning. New York: relativo de la orientación al cliente, al usuario en McGraw-Hill. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 37
  • 28.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Bloom, B.S., Hastings, T. y Madaus G. (1975). De Miguel, M. (1989). Modelos de investiga- Evaluación del aprendizaje. Buenos Aires: Tro- ción sobre organizaciones educativas. Revista quel. de Investigación Educativa, 7, 13, 21-56. Bonboir, A. (1972). La Docimologie. Paris: PUF. Dubois, P. H. (1970). A History of Psychologi- Cabrera, F. (1986). Proyecto docente sobre técni- cal Testing. Boston: Allyn Bacon. cas de medición y evaluación educativas. Barce- Ebel, R. L. (1977). Fundamentos de la medi- lona: Universidad de Barcelona. ción educacional. Buenos Aires: Guadalupe. Carreño, H. F. (1977). Enfoques y principios Eisner, E. W. (1967). Educational objectives: teóricos de la evaluación. Mexico: Trillas. Help or hindrance?. The School Review, 75, Castillo, S. y Gento, S. (1995). Modelos de eva- 250-260. luación de programas educativos. En A.Medina Eisner, E. W. (1969, Instructional and expres- y L. M. Willar (Coord.), Evaluación de progra- sive educational objectives: their formulation mas educativos, centros y profesores (pp.25-69). and use in curriculum. En J. Popham (Ed.), Madrid: Editorial Universitas, S. A.. Instructional objectives (pp. 1-18). Chicago: Chelimsky, E. (1998). The role of experience in AERA. formulating theories of evaluation practice. Eisner, E. (1971). Emerging models for educa- American Journal of Evaluation 19, 1, 35-55. tional evaluation. School Review, 2. Coffman, W. E. (1971). Essay examinations. En Eisner, E. W. (1975). The perceptive eye: To- R.L. Thorndike (Ed.) Educational Measurement. ward the reformation of educational evalua- Washington , DC: American Council on Educa- tion. Stanford, Ca: Stanford Evaluation Con- tion. sortion. Cronbach, L. J. (1963). Course improvement Eisner, E. W. (1981). The methodology of qua- through evaluation. Teachers College Record, litative evaluation: the case of educational 64, 672-683. connoisseurship and educational criticism. Cronbach, L. J. (1982). Designing evaluations of Stanford, Ca: Stanford University . educational and social programs. Chicago: Jos- Eisner, W. E. (1985). The art of educational sey-Bass. evaluation. London: The Falmer Press. Cronbach, L. J., Hambron, S.R., Dornbusch, Escudero, T. (1993). Enfoques modélicos en la S.M., Hess, R.D., Hornick, R.C., Phillips, D.C., evaluación de la enseñanza universitaria, Ac- Walker, D.F. y Weiner, S.S. (1980). Towards tas de las III Jornadas Nacionales de Didáctica reform in program evaluation: Aims, methods Universitaria «Evaluación y Desarrollo Profe- and institutional arrangements. San Francisco: sional» (pp. 5-59). Las Palmas: Servicio de Jossey-Bass. Publicaciones, Universidad de Las Palmas. Cronbach, L. J. y Suppes, P. (1969). Research for Escudero, T. (1996). Proyecto docente e inves- tomorrow's schools: Disciplined inquiry for tigador. Zaragoza: Universidad de Zaragoza. education. New York: MacMillan. Fernández Ballesteros, R. (1981). Perspectivas Darling-Hammond, L., Wise, AE, & Pease, SR históricas de la evaluación conductual. En R. (1989). Teacher evaluation in the organizational Fernández, y J.A.I Carrobles. (Ed.), Evalua- context: A review of the literature. En E. R. ción conductual. Madrid: Ediciones Pirámide. House (Ed.) New directions in educational eva- Fernández de Castro, J. (1973). La enseñanza luation (pp.203-253). London: The Falmer Pre- programada. Madrid: CSIC. ss. Fernández, J. (1991). La evaluación de la cali- De la Orden, A. (1985). Investigación evaluativo. dad docente. En A. Medina (Coord.), Teoría y En Arturo De la Orden. (Ed.), Investigación métodos de evaluación. Madrid: Cincel. educativa. Diccionario de Ciencias de la Educa- Fetterman, D. M. (1994). Empowerment ción (pp.133-137). Madrid: Anaya. evaluation. Evaluation Practice, 15, 1, 1-15. Gagne, R. M. (1971). Las condiciones del aprendizaje. Madrid: Aguilar. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 38
  • 29.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Gil, E. (1992). El sistema educativo de la Com- Joint Committee on Standards for Educational pañía de Jesús. La «Ratio Studiorum». Madrid: Evaluation (1988). The personnel evaluation UPCO. standards. Newbury Park, CA.: Sage. Glaser, B. G. (1978). Theoretical sensitivity. Mill Keefe, J. (1994). School evaluation using the Valley, Ca: Sociology Press. CASE-IMS model and improvement process. Glaser, B. G. y Strauss, A. L. (1967). The disco- Studies in Educational Evaluation, 20,1, 55- very of grounded theory. Chicago: Aldine. 67. Glaser, R. (1963). Instructional technology and Kellaghan, T. (1982). La evaluación educativa. the measurement of learning outcomes: some Bogotá: Universidad Pontificia Javierana. questions. American Psychologists, 18, 519- Kidder, L. H. (1981). Qualitative research and 521. quasi-experimental frameworks. En M. B. Glaser, R. (Dir.) (1965). Teaching machines and Brewer y B. E. Collins, (Eds.), Scientific in- programmed learning. Washington: National quiry and the social sciences. San Francisco: Education Association. Jossey-Bass. Gronlund, N. E. (1985). Measurement and eva- Kogan, M. (Ed.) (1989). Evaluating higher luation in teaching. New York: MacMillan, education. London: Jessica Kingsley Publis- Guba, G. E. y Lincoln, Y. S. (1982). Effective hers. evaluation. San Francisco: Jossey Bass Publis- Krathwohl, R. D., Blomm, B.S. y Masia, B.B. hers. (1964). Taxonomy of educational objectives. Guba, E. G. y Lincoln, Y. S. (1989). Fourth Ge- Handbook II: Affective domain. New Cork: neration Evaluation. Newbury Park, Ca.: Sage Davis McKay. Publications Lewy, A. (Ed.) (1976). Manual de evaluación Gullicksen, H. (1950). Theory of mental tests. formativa del currículo. Bogotá : Volun- New York: Wiley tad/Unesco. Hambleton, R. K. (1985). Criterion-referenced Lincoln, y. S. y Guba, E. G. (1985). Naturalis- measurement.En Encyclopedia of Educational tic inquiry. Beverly Hills, CA: Sage. Research. New York: McMillan. Lincoln, y. S. y Guba, E. G. (1986). But is it Hammond, R. L. (1983). Evaluation at the local rigorous? Trustworthiness and authenticity in level. En B. R. Worthen y J. R. Sanders, Educa- naturalistic evaluation. en D. D. Williams tional Evaluation: Theory and Practice. Wort- (Ed.), Naturalistic evaluation. San Francisco: hington, Ohio: Charles A. Jones Publishing Jossey-Bass. Company. Lincoln, y. S. y Guba, E. G. (1988). Criteria for Hernández, F. (1993). Proyecto docente e inves- assessing naturalistic inquiries as products. tigador. Murcia. Paper presented at the American Educational Horowitz, R. (1995). A 75-year legacy on as- Research Association, New Orleans, LA. sessment: Reflections from an interview with Lindquist, E. F. (1953). Design and Analysis of Ralph W. Tyler. The Journal of Educational Re- Experiments in Psychology and Education. search, 89, 2, 68-75. Boston, Ma.: Houghton Mifflin Company. House, E. R. (1983). How we think about evalua- Lindvall, C. M., (Ed.) (1964). Defining educa- tion. En House, E. R., Philosophy of evaluation. tional objectives. Pittsburg: University of San Francisco, Ca.: Jossey-Bass Pittsburgh Press. House, E. R. (1989). Evaluating with validity. Macdonald, B. (1971). The evaluation of the Newbury Park, Ca.: Sage. Humanities Curriculum Project: a holistic ap- Joint Committee on Standards for Educational proach. Theory into Practice, 10, 3, 163-169. Evaluation (1981, Standards for evaluations of Macdonald, B. (1976). Evaluation and the con- educational programs, projects, and materials. trol of education. En D. Tawney (Ed.), Curri- New York.: McGraw-Hill. culum evaluation today: trends and implica- tions, 125-136. London: McMillan. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 39
  • 30.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Madaus, G. F. y otros (1991). Evaluation Mo- School of Education , University of East An- dels. Viewpoints on Educational and Human glia . Services Evaluation. Hingham , Mass.: Kluwer- Nowalowski, Jeri, Mary Anne Bunda, Russell Nijhoff Publishing. Working (1985). A Handbook of Educational Mager, R. F. (1962). Preparing instructional ob- Variables. Boston: Kluwer-Nijhoff . jective. Palo Alto, CA.: Fearon. Nunnally, J. C. (1978). Psychometric Theory. Mager, R. F. (1973). Análisis de metas. México: New York: McGraw Hill. Trillas. Owens, T. R. (1973). Educational evaluation Mann, H., (1845). Boston Grammar and Writing by adversery proceedings. En E.R. House Schools. Common School Journal, October, 7, (Comp.), School Evaluation: The Politics and 19. Process. Berkeley: McCutchan. Martínez de Toda, M. J. (1991). Metaevaluación Parlett, M. y Hamilton , d. (1977). Evaluation de necesidades educativas: Hacia un sistema de as illumination: A new approach to the study normas. Tesis doctoral. Madrid: Universidad of innovative programmes. En Hamilton D. y Complutense. otros (Eds.), Beyond the numbers game. Lon- Mateo, J. (1986). Proyecto docente e investiga- don: MacMillan. dor. Barcelona: Universidad de Barcelona. Patton, M. Q. (1980). Qualitative Evaluation Mateo, J. y otros (1993). La evaluación en el aula methods. Beverly Hills, Ca.: Sage universitaria. Zaragoza: ICE-Universidad de Za- Pérez, A. (1983). Modelos contemporáneos de ragoza. evaluación. En J. Gimeno y A. Pérez, La en- Mccall, W. A. (1920). A new kind of school señanza: su teoría y su práctica (pp. 426-449). examination. Journal of Educational Research, Madrid: Akal January. Phillips, R. C. (1974). Evaluation in education. McReynold, P. (1975). Advances in Psychologi- Columbus, Ohio: Merril. cal Assessment, vol. III.San Francisco: Jossey- Pieron, H. (1968). Vocabulaire de la psycholo- Bass. gie. Paris: PUF. Mertens, D. M. (1999). Inclusive evaluation: Pieron, H. (1969). Examens et Docimologie. Implications of transformative theory for eva- PUF, Paris. luation. American Journal of Evaluation, 20, 1, Planchard, E. (1960). La investigación 1-14. pedagógica. Madrid: Ediciones Fas. Metfessel, N. S. y Michael, W. B. (1967). A pa- Popham, W. J. (1970). Establishing instructio- radigm involving multiple criterion measures nal goals. Englewood Cliffs, N. J.: Prentice for the evaluation of effectiveness of school Hall. programs. Educational and Psychological Mea- Popham, W. J. (1980). Problemas y técnicas de surement, 27, 931-943. la evaluación educativa. Madrid: Anaya. Morgan, G. (1983). Beyond method. Beverly Popham, W. J. (1983). Evaluación basada en Hills, Ca: Sage. criterios. Madrid: Magisterio Español, S. A.. Nevo, D. (1983). The conceptualization of Popham, W. y Baker, E. L. (1970). Systematic educational evaluation: An analytical review of Instruction. Englewood Cliffs, NJ.: Prentice the literature. Review of Educational Research, Hall. 53, 1, 117-128. Provus, M. (1971). Discrepancy evaluation. Nevo, D. (1989). The conceptualization of For educational program improvement and educational evaluation: An analytical review of assessment. Berkeley, Ca.: McCutchan Pu- the literature. En E. R. House (Ed.), New blishing Co. directions in educational evaluation. London : Rivlin, A. M. (1971). Systematic thinking for The Falmer Press, 15-29. social action. Washington, D.C.: Brookings Norris, N. (1993). Understanding educational Institute. evaluation. London : Kogan Page/CARE, Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 40
  • 31.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Rodríguez, T. y otros (1995). Evaluación de los Smith, E. R. y Tyler, R. W. (1942). Appraising aprendizajes. Aula Abierta Monografías 25. and recording student progress. New York: Oviedo: ICE-Universidad de Oviedo. Harper & Row,. Rosenthal, J. E. (1976). Evaluation history. En S. Smith, N. L. y Haver, d. M. (1990). The appli- B. Anderson, y otros (Eds.), Encyclopedia of cability of selected evaluation models to evol- Educational Evaluation. San Francisco: Jossey ving investigative designs. Studies in Educa- Bass Publishers. tional Evaluation, 16, 3, 489-500. Rossi, P. H. y Freeman, H. (1993). Evaluation: A Stacher, B. M. y Davis, W. A. (1990). How to Systematic Approach. Beverly Hills , Ca.: Sage. Focus on Evaluation. Newbury Park, Ca.: Sa- Rossi, P. H. y otros (1979). Evaluation: A syste- ge. matic approach. Beverly Hills , Ca.: Sage. Stake, R. E. (1967). The countenance of educa- Russell, N. y Willinsky, J. (1997). Fourth genera- tional evaluation. Teacher College Record, 68, tion educational evaluation: The impact of a 523-540. post-modern paradigm on school based evalua- Stake, R. E. (1975a). Program evaluation: par- tion. Studies in Educational Evaluation, 23, 3, ticularly responsive evaluation. Occasional 187-199. Paper, 5. University of Western Michigan. Rutman, L. (Ed.) (1984). Evaluation research Stake, R. E. (1975b). Evaluating the arts in methods: A base guide. Beverly Hills, Ca.: Sa- education: A responsive approach. Ohio: Me- ge. rril . Rutman, L. y Mowbray, G. (1983). Understan- Stake, R. E. (1976). A theoretical stament of ding program evaluation. Beverly Hills, Ca.: responsive evaluation. Studies in Educational Sage. Evaluation, 2 , 19-22. Salvador, L. (1992). Proyecto docente., Univer- Stake, R. E. (1981). Setting standars for educa- sidad de Cantabria. tional evaluators. Evaluation News, 22, 148- Scriven, M. (1967). The methodology of evalua- 152. tion. En Perspectives of Curriculum Evaluation, Stake, R. E. (1986). Quieting reform. Urbana: (pp. 39-83). AERA Monograph 1. Chicago : University of Illinois Press. Rand McNally and Company. Stenhouse, L. (1984). Investigación y desarro- Scriven, M. (1973). Goal-free evaluation. En E. llo del curriculum. Madrid: Morata. R. House (Ed.), School evaluation: The politics Stronge, J. H. y Helm, V. M. (1991). Evalua- and process,(pp. 319-328). Berkeley, CA.: ting professional support personnel in educa- McCutchan. tional settings. Newbury Park, Ca: Sage. Scriven, M. (1974). Prose and cons about goal- Stufflebeam, D. L. (1966). A depth study of the free evaluation. Evaluation Comment, 3, 1-4. evaluation requeriment. Theory into Practice, Scriven, M. (1980). The logic of evaluation. In- 5, 3, 121-134. verness , Ca.: Edgepress Stufflebeam, D. L. (1994). Introduction: Re- Scriven, M. (1991, Evaluation Thesaurus. New- commendations for improving evaluations in bury Park , Ca.: Sage U. S. public schools. Studies in Educational Scriven, M. (1991a). Duties of the teacher. Ka- Evaluation, 20, 1, 3-21. lamazoo, Mi.: Center for Research on Educatio- Stufflebeam, D. L. (1998). Conflicts between nal Accountability and Teacher Evaluation. standards-based and postmodernist evalua- Scriven, M. (1994). Evaluation as a discipline. tions: Toward rapprochement. Journal of Per- Studies in Educational Evaluation, 20, 1, 147- sonnel Evaluation in Education, 12, 3, 287- 166. 296. Scriven, M. (1998). Minimalist theory: The least Stufflebeam, D. L. (1999). Using profesional theory that practice require. American Journal standards to legally and ethically release eva- of Evaluation 19, 1, 57-70. luation findings. Studies in Educational Evaluation, 25, 4, 325-334. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 41
  • 32.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Stufflebeam, D. L. (2000). Guidelines for deve- Walberg, H. J. y Haertel, G. D. (Ed.) (1990). loping evaluation checklists. Consultado en The International Encyclopedia of Educatio- www.wmich.edu/evalctr/checklists/ el 15 de Di- nal Evaluation. Oxford: Pergamon Press. ciembre de 2002. Webster, W. J. y Edwards, M. E. (1993). An Stufflebeam, D. L. (2001). The metaevaluation accountability system for school improve- imperative. American Journal of Evaluation, 22, ment, Paper presented at the annual meeting 2, 183-209. (April) of the AERA. Atlanta, GA. Stufflebeam, D. L., Foley, WJ, Gephart, WJ, Webster, W. J., Mendro, R.L. y Almaguer, Guba, EG, Hammond, RL, Merriman, HO & T.O. (1994). Effectiveness indices: A «value Provus, MM (1971). Educational Evaluation added» approach to measuring school effect. and Decision-making, Itasca, Illinois : F. E. Studies in Educational Evaluation, 20, 1, 113- Peacock Publishing. 137. Stufflebeam, D. L. y Shinkfield, A. J. (1987). Weiss, C. H. (1983). Investigación evaluativa. Evaluación sistemática. Guía teórica y práctica. Métodos para determinar la eficiencia de los Barcelona: Paidos/MEC. programas de acción. México: Trillas,. Suchman, E. A. (1967). Evaluative Research: Weiss, C. H. (1998). Have we learned anything Principles and Practice in Public Service and new about the use of evaluation?. American Social Action Programs. New York : Russell Journal of Evaluation, 19, 1, 21-33. Sage Foundation. Wilson, A. R. J. (1978). La evaluación de los Sunberg, N. D. (1977). Assessment of person. objetivos. En J. A. R. Wilson (Ed.), Funda- Englewood Cliffs, N.J.: Prentice Hall. mentos psicológicos del aprendizaje y la en- Taba, H. (1962). Curriculum development. Theo- señanza (pp. 549-578). Madrid: Anaya.. ry and practice. New York: Harcourt Brace . Wolf, R. L. (1974). The citizen as jurist: A new Thorndike, E. L,. (1904). An Introduction to the model of educational evaluation. Citizen Ac- Theory of Mental and Social Measurements. tion in Education, 4. New York: Teacher College Press, Columbia Wolf, R. L. (1975). Trial by jury: a new eva- University . luation method. Phi Delta Kappa, 57, 185- Tyler, R. W. (1950). Basic principles of curricu- 187. lum and instruction. Chicago: University of Worthen, B. R. y Sanders, J. R. (1973). Educa- Chicago Press . tional Evaluation: Theory and Practice. Wort- Tyler, R. W. (1967). Changing concepts of edu- hington, Ohio: Charles a. Jones Publishing cational evaluation. En R. E. Stack (Comp.), Company. Perspectives of curriculum evaluation. AERA Worthen, B. R. y Sanders, J. R. (1991). The Monograph Series Curriculum Evaluation, 1. changing face of educational evaluation, Chicago: Rand McNally,. Theory into Practice, XXX, 1, 3-12. Tyler, R. W., (Ed.) (1969). Educational evalua- Zeller, N. C. (1987). A rethoric for naturalistic tion: New roles, new means. Chicago: Universi- inquiry. Ph. D. dissertation, Indiana Universi- ty of Chicago Press . ty. ABOUT THE AUTHORS / SOBRE LOS AUTORES Tomás Escudero Escorza (tescuder@posta.unizar.es). Catedrático del área de Métodos de Inves- tigación y Diagnóstico en Educación de la Universidad de Zaragoza. Es miembro de la Comisión de Coordinación Técnica del Plan de Calidad de las Universidades. Tiene un gran número de traba- jos y publicaciones sobre evaluación educativa, particularmente sobre evaluación institucional. Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 42
  • 33.
    Escudero Escorza, T.(2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm ARTICLE RECORD / FICHA DEL ARTÍCULO Escudero, Tomás (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intenso desarrollo de la evaluación en educación. Revista ELectrónica de Investigación y EVa- Reference / luación Educativa (RELIEVE), v. 9, n. 1. Referencia http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm. Consultado en (poner fe- cha). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intenso Title / Título desarrollo de la evaluación en educación. [ From tests to current evaluative research. One century, the XXth, of intense development of evaluation in education] Authors / Autores Tomás Escudero Escorza Review / Revista ELectrónica de Investigación y EValuación Educativa (RELIEVE), v. 9, n. 1 Revista ISSN 1134-4032 Publication date / 2003 (Reception Date: 2003 January 10; Publication Date: 2003 Febr. 27 ) Fecha de publicación This article presents a review and state of art about development in educational evaluation in the XXth century. The main theoretical proposals are commented. Abstract / Este artículo presenta una revisión crítica del desarrollo histórico que ha tenido el ám- Resumen bito de la evaluación educativa durante todo el siglo XX. Se analizan los principales propuestas teóricas planteadas.. Evaluation, Evaluation Research, Evaluation Methods; Formative Evaluation Sum- Keywords mative Evaluation, Testing, Program Evaluation. Descriptores Evaluación, Investigación evaluativa, Métodos de Evaluación, Evaluación Formativa, Evaluación Sumativa, Test, Evaluación de Programas Institution / Universidad de Zaragoza (España) Institución Publication site / http://www.uv.es/RELIEVE Dirección Language / Idioma Español (Title, abstract and keywords in english) Revista ELectrónica de Investigación y EValuación Educativa (RELIEVE) [ ISSN: 1134-4032 ] © Copyright 2002, RELIEVE. Reproduction and distribution of this articles it is authorized if the content is no modified and their origin is indicated (RELIEVE Journal, volume, number and electronic address of the document). / © Copyright 2002, RELIEVE. Se autoriza la reproducción y distribución de este artículo siempre que no se modifi- que el contenido y se indique su origen (RELIEVE, volumen, número y dirección electrónica del documento). Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 43