McCraw, Thomas K. - Joseph Schumpeter. Innovación y destrucción creativa [201...
Validez y confiabilidad
1. UNIVERSIDAD YACAMBU
INSTITUTO DE INVESTIGACIÓN Y POSTGRADO
MAESTRÍA EN FINANZAS Y NEGOCIO
DISEÑOS CUANTITATIVOS DE INVESTIGACIÓN
INTEGRANTES
JOSÉ ÁNGEL PINTO
MARCO BAREÑO BARQUISIMETO, NOVIEMBRE DE 2014
2. CONTENIDO
2.1. Medición: ¿En qué consiste?
2.2 Validez. Definición
2.2.1 De contenido
2.2.2 De criterio
2.2.3 De constructo
2.3 Confiabilidad. Definición
2.3.1 Test-retest
3. CONTENIDO
2.3.2 Formas paralelas
2.3.3 Split-halves
2.3.4 Coeficiente Alfa de Cronbach
2.3.5 Coeficiente KR-20
4. Es un proceso básico de la
ciencia que consiste
en comparar un patrón
seleccionado con el objeto o
fenómeno cuya magnitud física
se desea medir para ver
cuántas veces el patrón está
contenido en esa magnitud.
Stevens (1959; citado por
Mattessich, 2002, 56)
establece que la medición
“es la asignación de
numerales a objetos o
hechos de acuerdo a
reglas”. El término numeral
es distinto a número. El
primero es una propiedad o
cualidad del objeto, el
segundo es una cifra.
Dávila (2009, 6, citando a
Galtung, 1965) afirma que
“la medición es un proceso
de clasificación de
unidades de análisis según
alguna característica
elegida”.
5. ¿Qué características
deseamos que prediga?
Tiempo Peso Longitud Psicoeducativas
Es necesario probar
empíricamente que el
instrumento es VÁLIDO
en todos los casos
CRITERIO
La exactitud con que pueden
hacerse mediciones significativas
y adecuadas con un
instrumento, en el sentido que
mide realmente el rasgo que
pretende medir (Ruiz; 2003)
Grado en que un instrumento realmente mide
la variable que pretende medir
(Hernández, Fernandez y Baptista; 1998)
6. TIPOS DE VALIDEZ
La validez de constructo
define si una prueba o
experimento está a la altura
de sus pretensiones o no. Se
refiere a si la definición
operacional de una variable
La validez de
criterio evalúa si una
prueba refleja un cierto
conjunto de habilidades o no.
La validez de constructo
define si una prueba o
experimento está a la altura
de sus pretensiones o no. Se
refiere a si la definición
operacional de una
variable ...
Validez de Contenido
Validez de criterio
Validez Constructo
7. EVIDENCIA RELACIONADA CON EL CONTENIDO
No puede ser expresada
cuantitativamente (Ruiz; 2003)
Método: Validez de Contenido
Técnica: Juicio de Expertos
Ítems Congruencia Claridad Tendenciosidad Observaciones
Si No Si No Si No
1
2
4
5
6
7
8
9
10
11
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
_____________________________
_____________________________
_____________________________
_____________________________
_____________________________
_____________________________
_____________________________
_____________________________
_____________________________
_________________________
9. EVIDENCIA RELACIONADA CON EL CONSTRUCTO
Ruiz (1988) desarrolló la
escala AC 2000 que mide
auto concepto de alumnos de
6to. grado Método: Validez de Constructo
Técnica: Análisis Factorial
Con la Técnica Análisis Factorial
comprobó que las dimensiones
(Autoconcepto: social, personal y
escolar) tenían soporte
empírico en los datos
Ite
m
Factor
1
A.
Social
Item Factor
2
A.
Escolar
Item Factor 3
A.
Persona
l
10. CONFIABILIDAD
Se refiere al grado en que su aplicación
repetida al mismo sujeto u objeto produce
iguales resultados. Silva (2009)
Se refiere a la consistencia de los resultados.
En el análisis de la confiabilidad se busca que
los resultados de un cuestionario concuerden
con los resultados del cuestionario en otra
ocasión. Menéndez (2009)
Reproducibilidad
Estabilidad y
Predictibilidad
Seguridad
Precisión
Consistencia
Interna u
Homogeneidad
La confiabilidad es la "capacidad de un ítem
de desempeñar una función requerida, en
condiciones establecidas durante un período de
tiempo determinado".
Grupo heterogéneo: Confiablidad alta
Grupo homogéneo: Confiabilidad baja
11. TEST - RETEST
MÉTODO TÉCNICA PROPÓSITO
Test/retest Coeficiente correlación
de Pearson
Consistencia en el
tiempo de los
puntajes
Test – retest: Consiste r en aplicar
repetidas veces el mismo cuestionario a
las mismas personas
12. TEST - RETEST
Características
Debilidades
•Debe calcular la confiabilidad del
instrumento ANTES de la
aplicación definitiva del mismo.
•Coeficiente de Correlación de
Pearson altamente positivo =
Instrumento confiable.
•El periodo de tiempo (corto –
largo) entre las mediciones
puede confundir el coeficiente de
confiabilidad.
13. FORMAS PARALELAS
VENTAJAS DESVENTAJAS
La dificultad de este
procedimiento radica en
conseguir que dos instrumentos
sean realmente "paralelos",
dada la dificultad que supone
realizar dos pruebas que midan
exactamente lo mismo, pero con
diferentes ítems. No obstante,
en condiciones ideales en las
que se pueda garantizar el
paralelismo de ambas formas,
este es el método más
recomendable.
FORMAS PARALELAS
Este procedimiento es el que se deriva
naturalmente del modelo. Requiere que se
utilicen dos pruebas o instrumentos
paralelos, esto es, que midan lo mismo de
forma diferente (por ejemplo, dos tests que
con diferentes preguntas midan un
determinado rasgo). Después se
comparan los dos tests, calculando el
coeficiente de correlación de Pearson.
Esta correlación será, como hemos visto
en el apartado anterior, el coeficiente de
fiabilidad. Si la correlación es alta, se
considera que hay una buena fiabilidad. Al
valor obtenido también se le conoce como
coeficiente de equivalencia, en la medida
en que supone un indicador del grado de
equivalencia entre las dos formas
paralelas de un test.
14. METODO SPLIT -HALVES
Pasos:
1. Dividir los itemes de la prueba en dos partes iguales.
2. Correlacionar las puntuaciones totales de las dos mitades.
3. Multiplicar el coeficiente obtenido por 2 y dividir el término
1 más la correlación de las dos mitades.
También conocido como método de seccionamiento en dos mitades, este
método sólo requiere una aplicación del test. Tras obtener las puntuaciones
obtenidas por los sujetos en cada una de las dos mitades en que se habrá
dividido, se procede a calcular la correlación entre las dos puntuaciones. El
resultado obtenido será un indicador de la covariación entre ambas mitades, es
decir, de la consistencia interna del test. La principal dificultad de este sistema
es asegurarse de que ambas mitades sean efectivamente paralelas. Un
sistema habitual es dividir el test entre los ítems pares y los impares; no es
recomendable dividirlo sin más por la mitad, dado que muchos tests muestran
un incremento gradual de la dificultad de sus ítems.
15. DESCRIPCIÓN DE LOS MÉTODOS
Técnica: Alfa de Cronbach
Características:
Requiere sólo una aplicación del instrumento de medición.
Produce valores que oscilan entre cero (0) y uno (1).
No es necesario dividir en mitades los ítems del instrumento.
Se aplica la medición y se calcula el coeficiente.
PROCEDIMIENTO:
Correlación a través de la
varianza de cada ítem asociado por
variables y la varianza de las puntuaciones
totales.
APLICABLE EN :
Escalas de Estimación, Escala de
Lickert, cuestionario de preguntas
cerradas con opciones policotómicas , test
de aptitud verbal, test de aptitud no
verbal , test psicológico.
K= Número de Ítems.
S2= Varianza de los puntajes de cada
ítems.
S2T= Varianza de los puntajes totales
16. DESCRIPCIÓN DE LOS MÉTODOS
Técnica: Kuder – Richardson KR - 20
Permite calcular la confiabilidad con una sola aplicación del
instrumento.
No requiere el diseño de pruebas paralelas.
Es aplicable sólo en instrumentos con ítems dicotómicos,
que puedan ser codificados con 1 – 0 (correcto – incorrecto,
presente – ausente, a favor – en contra, etc.) .
PROCEDIMIENTO: Correlación a través de
proporciones de aciertos y desaciertos y varianza
del total de aciertos.
APLICABLE EN: Lista de Cotejo y cuestionarios de
preguntas cerradas con opciones de respuestas
dicotómicas (SI- NO)
K= Número de Ítems.
Σp.q= sumatoria de
proporciones de aciertos por
desaciertos.
S2 T= Varianza del total de
aciertos.
17. CONFIABILIDAD
Importante: se sugiere repetir la validación del instrumento
puesto que es recomendable que el resultado sea mayor o igual
a 0,81
FUENTE: RUIZ (2002).
RANGOS MAGNITUD
0,81 A 1,00 Muy Alta
0,61 A 0,80 Alta
0,41 A 0,60 Moderada
0,21 A 0,40 Baja
0,01 A 0,20 Muy Baja