1. Teoría de la Medición y la Evaluación
Propiedades Psicométricas
Msc. Martha Torres Narvaez
2. 1. Las variables, conceptos o atributos a medir (contenidos en el planteamiento e
hipótesis o directrices del estudio).
2. Las definiciones operacionales. La manera como hemos operacionalizado las
variables es crucial para determinar el método para medirlas, lo cual a su vez, resulta
fundamental para realizar las inferencias de los datos.
3. La características de la muestra.
4. Los recursos disponibles (de tiempo, apoyo institucional, económicos, etcétera).
3. Medición
Medición: “proceso que vincula conceptos abstractos con
indicadores empíricos el cual se realiza mediante un plan
explícito y organizado para clasificar (y con frecuencia
cuantificar) los datos disponibles (los indicadores), en
términos del concepto que el investigador tiene en mente
(Carmines y Zeller, 1991).”
En este proceso, el instrumento de medición o de recolección
de datos es fundamental para clasificar los datos observados y
obtenidos.
“La disonancia cognitiva, la satisfacción, el clima
organizacional, la cultura fiscal y la credibilidad”
4. Instrumentos de medición
Los registros del instrumento de medición representan valores
visibles de conceptos abstractos.
La función de la medición es establecer una correspondencia
entre el "mundo real" y el "mundo conceptual" (Bostwick y
Kyte, 2005).
Instrumento de medición “recurso que utiliza el investigador
para registrar información o datos sobre las variables”
5. Tipos de instrumentos
• Evaluativos: utilizados para
medir la magnitud del cambio
en el tiempo, en una dimensión
o categoría de interés.
Ejemplo los usados para
evaluar/medir la evolución de
una enfermedad o el resultado
de un tratamiento, de un
desenlace específico: una escala
de dolor que sirve para evaluar
los cambios después del uso de
analgésicos. Su utilidad
depende de la validez de
constructo, de la confiabilidad y
de la sensibilidad al cambio.
6. Tipos de instrumentos
• Discriminativos: describen
un estado o condición
subyacente para el cual no
existe un patrón de
referencia. Por ejemplo,
diferenciar a los individuos
según la presencia-ausencia
de la condición medida o
según la magnitud de
presencia del aspecto
evaluado. La utilidad de
estas escalas depende de la
validez de constructo que
tengan.
7. Tipos de instrumentos
• Predictivos: escalas que intentan
predecir la pertenencia del sujeto
evaluado a una o varias
categorías definidas. Tratan de
clasificar a los sujetos en las
categorías de interés de acuerdo
con un criterio externo disponible
(patrón de oro o desenlace
específico). Ejemplo las pruebas
para diagnóstico y los
cuestionarios o entrevistas
estructurados que buscan
predecir algún desenlace. Su
utilidad depende de la validez de
criterio (exactitud en la
clasificación de los sujetos)
9. Validez y Confiabilidad
o El instrumento de recolección de datos representa la variable
elegida por el investigador.
o Toda medición o instrumento de recolección de datos debe
reunir tres requisitos esenciales: confiabilidad, validez y
objetividad.
o “La confiabilidad de un instrumento de medición se refiere al
grado en que su aplicación repetida al mismo sujeto u objeto
produce resultados consistentes y coherentes”.
o Validez: grado en que un instrumento realmente
mide la variable que pretende medir.
11. REPRODUCIBILIDAD
La reproducibilidad de un instrumento de medición se
refiere al grado en que su aplicación repetida al mismo
individuo u objeto produce resultados consistentes.
R. INTRA EVALUADOR:
R. INTER EVALUADOR
R. PRUEBA - REPRUEBA
Se obtienen los mismos datos al repetirse la evaluación o la prueba?
12. REPRODUCIBILIDAD
Test-retest: un mismo instrumento es aplicado
dos o más veces a un mismo grupo de personas
después de un cierto periodo de tiempo (un
intervalo entre siete y 30 días).
Si la correlación entre los resultados de las
diferentes aplicaciones es altamente positiva, el
instrumento se considera confiable.
La evaluación se hace utilizando coeficiente de
correlación Pearson o Spearman.
13. Cómo saber si un instrumento de
medición o prueba es reproducible?
• Coeficiente de correlación intraclase ICC (datos
contínuos) o Kappa de Cohen (datos categóricos)
Reproducibilidad
es nula
Reproducibilidad
es perfecta
• 0,81-1,00 reproducibilidad
casi perfecta.
• 0,61-0,80 alta
reproducibilidad.
• 0,41-0,60 moderada,
• 0.21-0.40 baja,
• 0,00-0,20 leve, pobre
14. CONSISTENCIA INTERNA
Mide si los distintos ítems producen resultados similares
en el supuesto general.
Pertenecen todos los ítems del instrumento de evaluación
(cuestionarios) al constructo que se está evaluando?
15. Cómo saber si un instrumento de medición tiene
buena consistencia interna?
• Coeficiente alfa >.9 es excelente
• Coeficiente alfa >.8 es bueno
• Coeficiente alfa >.7 es aceptable
• Coeficiente alfa >.6 es cuestionable
• Coeficiente alfa >.5 es pobre
• Coeficiente alfa <.4 es inaceptable
• Coeficiente de alfa de Cronbach
0 1
Inaceptable Excelente
16. NIVEL DE ACUERDO
Analiza la diferencia entre los datos para dos o más
aplicaciones del instrumento.
Reliability, unreliability, reproducibility,
repetibility, agreement, concordance, internal
consistency
17. • Límites de acuerdo de Bland y Altman
(acuerdo perfecto cerca a 0)
Cómo saber si un instrumento de medición tiene
buen nivel de acuerdo?
18.
19. VALIDEZ
• Se refiere al grado en que un instrumento
realmente mide la variable que pretende
medir.
Apariencia
Contenido
Criterio
Constructo
20. Validez de apariencia
Validez de apariencia: Se obtiene mediante la
evaluación del instrumento por un grupo de
jueces (expertos) que dicen sí en su concepto el
instrumento en apariencia mide las cualidades
deseadas.
El análisis de la validez aparente se realiza
teniendo en cuenta los criterios de extensión y
claridad.
21. Validez de contenido
Validez de contenido: los expertos evalúan
si las dimensiones o dominios considerados
en el instrumento, son pertinentes para
evaluar el constructo.
Se establece el análisis de la pertinencia,
relevancia, coherencia y suficiencia de los
ítems con las categorías establecidas.
22. Validez de contenido
Se analiza el IVC (índice de validez de contenido) con
los siguientes parámetros:
• IVC mayor de 0,80 se mantiene el indicador.
• IVC menor de 0,80 en todos los criterios, se
descartaba el indicador.
• IVC menor de 0,80 en uno o dos de los criterios, se
hacían las correcciones y ajustes del indicador.
23. Validez de contenido
Se refiere al grado en que un
instrumento refleja el contenido de lo
que pretende medir sin omisiones, ni
desequilibrios del contenido.
El grado en que la medición
representa el concepto medido.
Ejemplo: Una evaluación de calidad
de vida no tendrá validez de
contenido si solo incluye la
condición social.
24. Validez de criterio
Establece la validez de un instrumento de
medición al comparar sus resultados con los de
algún criterio externo (otro instrumento) que
pretende medir lo mismo.
El criterio de comparación es el instrumento
considerado «Gold standard» para medir el
constructo de interés.
Cuanto más se relacionen los resultados del
instrumento de medición con el Gold standar, la
validez de criterio será mayor.
25. Validez de criterio
Tipos de validez de criterio:
• Validez Concurrente: se expresa como una
alta correlación entre el nuevo instrumento y
el patrón de referencia – “gold standard”.
• Validez Predictiva: se expresa en la
correlación positiva entre el resultado del
instrumento y un desenlace que ocurrirá en el
futuro.
26. Validez de constructo
La validez de
constructo define si
una prueba o
experimento está a la
altura de sus
pretensiones o no.
Se refiere a si un instrumento o
prueba mide el constructo
correctamente
Qué es un constructo?
Es un fenómeno intangible que a través de un
determinado proceso de construcción teórica se
convierte en una variable que puede ser medida
y estudiada.
27. Validez de constructo
Incluye tres etapas
1. Se establece y especifica la relación teórica
entre los conceptos (sobre la base de la revisión
de la literatura).
2. Se correlacionan los conceptos y se analiza
cuidadosamente la correlación. Integra la validez
de contenido y de criterio.
3. Emplea como método estadístico el análisis
factorial.
28. Características Instrumento de Medición
• Sensibilidad al cambio: propiedad del
instrumento que permite detectar las
variaciones o cambios que se presentan en
el fenómeno medido. Así, un instrumento
para medir dolor debe reflejar la
disminución del dolor con menor puntaje
(efecto de la intervención) o el aumento
del dolor con mayor puntaje en el
instrumento utilizado.
29. Características Instrumento de Medición
• Adecuada amplitud de rango: capacidad
del instrumento para medir todas las
dimensiones o características estrechamente
relacionadas con el fenómeno de estudio. Por
ejemplo, una escala de calidad de vida debe
incluir todas las dimensiones relevantes como
funcionalidades física, emocional y social,
ejecución de su papel en la vida, dolor, entre
otros.
30. Relación entre la confiabilidad y la
validez
Tirador 1: sus disparos no impactan en el centro del blanco y se encuentran
diseminados por todo el blanco.
Tirador 2: tampoco impactan en el centro del blanco, aunque sus disparos se
encuentran cercanos entre si, fue confiable y mantuvo un patrón
Tirador 3: los disparos se encuentran cercanos entre si e impactan el centro del
blanco.
31. Factores que afectan la confiabilidad y la
validez de un instrumento
• Improvisaciones.
• Utilización de instrumentos que han sido desarrollados
en el extranjero que no han sido validados en nuestro
contexto.
• Un lenguaje complejo para los participantes.
• No considerar las diferencias de género, edad y
conocimiento durante la aplicación del instrumento.
• Condiciones en las que se aplica el instrumento de
medición (tiempo, ambiente, subordinación).
• Falta de estandarización en la aplicación del instrumento
32. Otras consideraciones sobre los
instrumentos de medición
• Utilidad y practicidad en la vida real. Si una
escala es tan costosa que solamente se puede
aplicar en centros asistenciales muy específicos y
exclusivos, será poco útil en el medio general.
Tendrá poca utilidad aunque sea fácil de adquirir
pero difícil de aplicar o si es muy dispendiosa o
requiere un entrenamiento muy complejo para su
aplicación.
33. BIBLIOGRAFÍA
Sampieri R, Fernandez-Collado C, Baptista P. Metodología
de la Investigación. Cuarta Edición, 2006. Capítulo 9.
Video Conceptos de psicometría:
https://www.youtube.com/watch?v=FDYP0yPxJhQ
Video: Validez y confiabilidad
https://www.youtube.com/watch?v=E4205yhbYpY