Diseño Universal de Aprendizaje en Nuevos Escenarios JS2 Ccesa007.pdf
Tema III- Los criterios para evaluar- Leidys Pláceres (1).docx_20230807_003305_0000.pdf
1. Universidad de Oriente
Núcleo de Sucre
Departamento de Psicología e Investigación Educativa
Evaluación educativa
Unidad III:
Criterios para evaluar la calidad
de la pruebas
Profesora: Realizado por:
María Román Leidys Pláceres
C.I:25.100.493
Cumaná, Agosto del 2023
¿QUÉ SON LOS CRITERIOS PARA EVALUAR LA CALIDAD DE LAS PRUEBAS?
Los criterios para evaluar la calidad de las pruebas son indicadores o estándares utilizados para
determinar si una prueba es válida, confiable, objetiva y relevante en términos de medir lo que se
pretende evaluar. Es decir, estos criterios sirven para determinar si una prueba es adecuada y
confiable para medir lo que se pretende evaluar, y así poder tomar decisiones basadas en resultados
precisos y válidos.
Aspectos
Representati
vidad
Objetividad Validez
Nivel de
dificultad
Poder de
discriminacón
Adecuación
al tiempo
Adecuación a
lo enseñado
Confiabilidad
Definición
La
representativ
idad en los
criterios para
evaluar la
calidad de
las pruebas
se refiere a
la capacidad
de una
muestra
para
representar
adecuadame
nte a la
población a
la que se
desea
generalizar
los
resultados
La
objetividad
en los
criterios para
evaluar la
calidad de
las pruebas
se refiere a
la
imparcialidad
y ausencia
de sesgos en
el proceso
de
evaluación.
Implica que
los
resultados
obtenidos no
están
influenciados
por
La validez se
refiere a la
capacidad
de una
prueba para
medir de
manera
precisa y
confiable lo
que se
espera que
mida.
Dentro de
los criterios
para evaluar
la calidad de
las pruebas,
la validez es
uno de los
El nivel de
dificultad de
una prueba
se refiere a la
complejidad y
la dificultad
de las
preguntas en
relación con
el nivel de
conocimiento
que está
siendo
Es la
capacidad de
las preguntas
para
diferenciar
entre los
participantes
con diferentes
niveles de
conocimiento
o habilidades.
Cuanto mayor
sea el poder
de
discriminación,
más efectiva
La
adecuación al
tiempo se
refiere a la
capacidad de
una prueba
de medir la
habilidad o
conocimiento
de una
persona en el
tiempo que
se ha
designado
para tomar la
prueba. Una
prueba
adecuada al
La adecuación
a lo enseñado
se refiere a la
relación entre
la información
enseñada y la
prueba. Es
decir, la
prueba debe
medir las
habilidades y
conocimientos
específicos
La
confiabilidad
se refiere a la
consistencia y
precisión de
una prueba.
Una prueba
confiable
debe producir
resultados
consistentes
cuando se
aplica a un
grupo de
2. de las
pruebas. En
otras
palabras,
una muestra
es
representativ
a cuando
sus
característic
as son
similares a
las de la
población de
interés, lo
que aumenta
la validez y
fiabilidad de
las
conclusiones
obtenidas a
partir de las
pruebas.
p
opiniones
personales,
intereses o
prejuicios del
evaluador. La
objetividad
se logra a
través de la
estandarizaci
ón de los
procedimient
os de
evaluación,
el uso de
criterios
claros y
transparente
s, y la
aplicación
consistente
de las
pruebas a
todos los
participantes
uno de los
más
importantes,
ya que una
prueba que
no es válida
no
proporcionar
á
información
precisa y
confiable
sobre la
capacidad
de un
individuo en
una
determinada
área.
evaluado.
Esto afecta la
calidad de la
prueba ya
que si las
preguntas
son
demasiado
fáciles, no
será capaz
de medir de
manera
adecuada el
nivel de
conocimiento.
será la
pregunta para
distinguir entre
los que tienen
un buen
desempeño y
los que no. Se
calcula
mediante el
análisis de la
correlación
entre las
respuestas de
los
participantes y
su rendimiento
general.
tiempo debe
ser capaz de
medir el nivel
de
conocimiento
de una
persona sin
exceder el
tiempo
asignado. La
adecuación al
tiempo puede
variar según
el nivel de
dificultad de
la prueba y
las
habilidades
requeridas.
p
que se
enseñaron en
el curso o
programa de
estudio.
Significa que
los
contenidos,
habilidades y
objetivos
evaluados
están
alineados con
lo que se ha
enseñado.
g p
estudiantes
similares en
múltiples
ocasiones. La
confiabilidad
de una
prueba
depende de
varios
factores,
como la
calidad de las
preguntas y la
técnica de
escala.
Característic
as
Muestra
aleatoria: La
muestra
seleccionada
debe ser
elegida de
manera
aleatoria
para evitar
sesgos y
asegurar
que todos
los
individuos
tengan igual
oportunidad
de ser
incluidos.
Tamaño de
muestra
adecuado:
La muestra
debe ser lo
suficienteme
nte grande
como para
garantizar
que las
conclusiones
obtenidas
sean
generalizabl
es a la
población de
interés.
Diversidad:
La muestra
debe incluir
a individuos
con
diferentes
característic
as y perfiles
para reflejar
la
heterogeneid
ad de la
población.
Representac
ión
equitativa:
La muestra
debe
representar
proporcional
mente a los
diferentes
grupos o
subgrupos
presentes en
la población.
-Ser
transparente:
la
información y
los
resultados
deben ser
claros y
transparente
s.
-Ser neutral:
el
investigador
debe
mantenerse
imparcial y
no permitir
que sus
propias
opiniones
influyan en
los
resultados.
-Deben tener
Medibilidad:
Los criterios
deben ser
cuantificable
s y basados
en datos
concretos y
verificables.
-Ser
Imparcial:
Los criterios
deben ser
imparciales,
sin influencia
de opiniones
personales o
sesgos.
-Ser
Verificable:
Los criterios
deben poder
ser
corroborados
y
respaldados
por evidencia
objetiva.
-Validez de
contenido: el
contenido de
la prueba
debe estar
relacionado
con el
objetivo de la
prueba y con
la teoría que
la soporta.
-Validez de
diseño: la
prueba debe
tener un
diseño válido
y coherente.
-Validez de
procedimient
o: el
procedimient
o de
aplicación de
la prueba
debe ser
claro y
consistente.
-Validez de
interpretació
n: los
resultados
de la prueba
deben ser
interpretados
de forma
válida y
consistente.
-Validez de
score: los
resultados
de la prueba
deben
reflejar el
score de una
manera
válida y
confiable.
-La alta
dependencia:
el nivel de
dificultad
debe ser
altamente
dependiente
del nivel de
conocimiento
o habilidad
del
participantes.
-La
estabilidad: el
nivel de
dificultad
debe ser
estable a lo
largo de un
intervalo de
tiempo.
-Justo: todos
los
participantes
deben tener
una
probabilidad
razonable de
responder
correctament
e.
-Causada por
la tarea: el
nivel de
dificultad
debe ser
causado por
la tarea en sí,
no por
factores
externos.
-Sensibilidad:
la capacidad
de la prueba
de detectar
diferencias
entre
personas con
distintos
niveles de
conocimiento
o habilidades.
-Especificidad:
la capacidad
de la prueba
de detectar
personas con
un nivel bajo
de
conocimiento
o habilidades.
-Confiable:
debe ser
consistente en
la medida del
conocimiento
o las
habilidades de
una persona.
-Válido: debe
medir lo que
pretende
medir.
-La duración
del tiempo: la
prueba debe
tener una
duración
apropiada,
con base en
la cantidad de
preguntas y
la
complejidad
de las
mismas.
-La
coherencia: la
prueba debe
estar
estructurada
de manera
que no se
produzcan
conflictos de
tiempo.
-Distribución
del tiempo:
Debe
distribuirse de
manera
equitativa y
entre las
diferentes
secciones o
partes de la
prueba, para
que los
participantes
tengan el
mismo tiempo
para
responder
preguntas
similares.
-La
flexibilidad: la
prueba debe
ser flexible en
su
administració
n y en la
distribución
del tiempo.
-La claridad:
la prueba
debe ser
clara y
entendible.
- La
pertinencia:
las preguntas
deben tener
una relación
directa con el
contenido
enseñado.
- La
coherencia:
las preguntas
deben medir
la misma
cantidad y
nivel de
conocimiento.
- La
transparencia:
los
estudiantes
deben ser
capaces de
comprender
las preguntas
y saber qué se
les pide.
- La
consistencia:
las preguntas
deben medir
el mismo
contenido en
diferentes
ocasiones.
- La
relevancia: las
preguntas
deben ser
relevantes y
relacionadas
con la
experiencia.
Algunas
característica
s de la
confiabilidad
en las
pruebas son:
-La
confiabilidad
de la
administració
n: el proceso
de
administració
n de la
prueba debe
ser
consistente y
controlado.
-La
confiabilidad
de las
respuestas:
las
respuestas de
la prueba
deberían ser
claras y
fáciles de
entender.
-
Independiente
de la forma
en que se
pregunte: la
prueba debe
ser
consistente
aunque se
modifique la
forma en que
se presentan
las preguntas.
-
Independiente
del tipo de
participantes:
la prueba
debe ser
consistente
aunque los
participantes
cambien.
Un ejemplo
de
representativ
idad en los
criterios para
evaluar la
calidad de
las pruebas
podría ser un
estudio que
evalúa la
Un
ejemplo
de
objetivid
ad en
las
pruebas
sería un
examen
de
opción
múltiple
en el
cual
todas
las
pregunta
s tienen
una
única
respuest
a
correcta
Un ejemplo
de una
Si se
3. BIBLIOGRAFIA
Ejemplos
efectividad
de un nuevo
tratamiento
médico para
una
enfermedad
determinada
. Para
garantizar la
representativ
idad de la
muestra, se
podría seguir
un proceso
de selección
aleatoria,
incluir a
individuos
con
diferentes
edades,
géneros y
antecedente
s médicos, y
asegurarse
de que el
tamaño de la
muestra sea
lo
suficienteme
nte grande
para
garantizar la
generalizaci
ón de los
resultados.
correcta.
Este tipo
de
prueba
es
objetivo
porque
la
respuest
a
correcta
se
puede
evaluar
de
manera
consiste
nte y no
depende
de la
interpret
ación
subjetiva
del
examina
dor.
Cualquie
r
examina
dor que
califique
las
respuest
as
tendría
que
llegar a
la
misma
conclusi
ón sobre
cuáles
son las
respuest
as
correcta
s, lo que
garantiz
a la
objetivid
ad en
los
resultad
os.
Por ejemplo,
si una
prueba de
matemáticas
se
correlaciona
positivament
e con los
resultados
de una
prueba de
matemáticas
estandarizad
a, se podría
decir que la
prueba tiene
una alta
validez de
criterio.
Un ejemplo
de nivel de
dificultad es
una prueba
de
matemáticas
para
estudiantes
de primaria.
Esta prueba
debe tener un
nivel de
dificultad
apropiado
para el nivel
de
conocimiento
de los
estudiantes.
Los
problemas
deberían ser
fáciles de
comprender y
resolver.
Un ejemplo de
una prueba
con un alto
poder de
discriminación
es una prueba
de
conocimientos
generales,
como el SAT o
el ACT. Estas
pruebas
tienen
preguntas con
diferentes
niveles de
dificultad, y
miden el
conocimiento
de los
estudiantes en
una amplia
gama de
temas.
prueba que
no es
adecuada al
tiempo es un
examen de
matemáticas
que incluye
problemas
que requieren
una solución
a múltiples
pasos y se
asignan sólo
30 minutos
para
responder la
prueba. Esta
prueba no es
adecuada al
tiempo
porque las
preguntas
son
demasiado
complejas
para la
cantidad de
tiempo
asignada.
Un ejemplo de
adecuación a
lo enseñado
es un examen
de ciencias
sociales que
pida a los
estudiantes
responder
preguntas
sobre la
historia del
país que están
estudiando.
Los
estudiantes
deben poder
aplicar su
conocimiento
de la historia
del país a las
preguntas de
la prueba, y
las preguntas
deben reflejar
el contenido
enseñado.
Si se
administra
una prueba
de lectura y
comentarios
en inglés a un
grupo de
estudiantes y
se obtienen
resultados
similares
cuando se
vuelve a
aplicar la
prueba en
una segunda
ocasión. Esto
indicaría que
la evaluación
es confiable
en términos
de medir las
habilidades
de lectura y
análisis de los
estudiantes
de manera
consistente.
https://psikipedia.com/libro/evaluacion/criterios-de-calidad-de-los-instrumentos-de-evaluacion-
psicologica.
Reidl-Martínez LM. Confiabilidad en la medición. Inv. Educ. Med. 2013. [Internet] 2(6)
[Consultado 1 Nov 2022]; 107-111. Disponible en:
https://www.redalyc.org/pdf/3497/349733227007.pdf
Ristán A, Pedraza NY. La objetividad en las pruebas estandarizadas. Rev. Iberoam. Eval. Educ.
[Internet]. 2017 [Consultado 1 Nov 2022]; 10(1):11- 31. Disponible en:
https://doi.org/10.15366/riee2017.10.1.00.
Ventura, JL. La importancia de reportar la validez y confiabilidad en los instrumentos de
medición: Comentarios a Arancibia et al. Rev. méd. Chile. [Internet] 2017 [Consultado 1 Nov
2022] 145 (7) Di ibl htt // i l l/ i l h ? i t i tt t& id S0034