Validez y confiabilidad jaimes y zarate 2014

MEDICIÓN:
VALIDEZ Y CONFIABILIDAD
UNIVERSIDAD YACAMBÚ
VICERECTORADO DE ESTUDIOS A DISTANCIA
PROGRAMA MAESTRÌA EN CIENCIAS AMBIENTALES
DISEÑOS CUANTITATIVOS DE INVESTIGACIÓN
Prof. Leonardo Castillo
Participantes:
Lcda. Luisauris Jaimes
Lcdo. Álvaro Zarate
%

1. Medición: ¿En qué consiste?
2. Validez. Definición
2.1. De contenido
2.2. De criterio
2.3. De constructo
3. Confiabilidad. Definición
3.1. Test-retest
3.2. Formas paralelas
3.3. Split-halves
3.4. Coeficiente Alfa de Cronbach
3.5. Coeficiente KR-20
CONTENIDO

1. Medición
Jaimes y Zárate 2014
De acuerdo con la definición clásica del término, ampliamente difundida.
Medir significa “asignar números a objetos y eventos de acuerdo con
reglas ”(Stevens, 1951).
Sin embargo, como señalan Carmines y zeller (1979) esta definición es más
apropiada para las ciencias físicas que para las ciencias sociales, ya que
varios de los fenómenos que son medidos en éstas no pueden
caracterizarse como objetos o eventos, puesto que son demasiado
abstractos para ello la disonancia cognitiva, la alienación, el producto
nacional bruto y la credibilidad son conceptos tan abstractos para ser
considerados “cosas que pueden verse a tocarse ” (definición de objeto)
o solamente como “resultado, consecuencia o producto” ( definición de
evento)” Carmines Y Zeller, 1979, p.10”

2. Validez
De acuerdo con Hernández, Fernández y Baptista (1998), “la validez en
términos generales, se refiere al grado en que un instrumento realmente
mide la variable que pretende medir” (pág.243).
Tamayo y Tamayo (1998) considera que validar es “determinar cualitativa
y/o cuantitativamente un dato” (224). Esta investigación requirió de un
tratamiento científico con el fin de obtener un resultado que pudiera ser
apreciado por la comunidad científica como tal.

2. Validez
La validez es un concepto del cual pueden tenerse diferentes tipos de
evidencia (Wiersman, 1999; Grondlun, 1990):
1- Evidencia relacionada con el contenido.
2- Evidencia relacionada con el criterio.
3- Evidencia relacionada con el constructo.

2.1. Validez de Contenido
La validez de contenido se refiere al grado en que un instrumento refleja
un dominio específico de contenido de lo que se mide. Es el grado en que
la medición representa al concepto medido (Bohrnstedt, 1976).
Por ejemplo, una prueba de operaciones aritméticas no tendría validez de
contenido si incluyera solo operaciones de suma y excluya de resta,
multiplicación o división (Carmines y Zeller, 1988).
Un instrumento de medición debe contener representados a todos los
ítems del dominio de contenido de las variables a medir. Este hecho se
ilustra en la figura 1

2.2. Validez de Criterio
La validez de criterio de un instrumento de medición comparándola con
algún criterio externo. Este criterio es un estándar con el que se juzga la
validez del instrumento (Wiersma, 1999). Cuanto mas se relacionen los
resultados del instrumento de medición con el criterio, la validez el
criterio será mayor.
Por ejemplo, una investigador valida un examen sobre manejo de aviones
mostrando la exactitud con la que el examen predice que tan bien un
grupo de pilotos opera un aeroplano

Figura 1. Ilustración de un instrumento de
medición con validez de contenido versus
uno que carece de ella:

Si el criterio se fija en el presente, se habla de validez concurrente (los
resultados del instrumento se correlacionan con el criterio en el mismo
momento o punto de tiempo ). Por ejemplo, un cuestionario para detectar
las preferencias del electorado por los distintos partidos contendientes,
puede validarse aplicándolo tres o cuatro días antes de la elección y sus
resultados compararlos con los resultados finales de la elección.
Si el criterio se fija en el futuro, se habla de validez predictiva. Por
ejemplo, una prueba para determinar la capacidad administrativa de altos
ejecutivos se puede validar comparando sus resultados con el futuro
desempeño de los ejecutivos medidos.

2.3. Validez de Constructo
Un constructo es una variable medida y que tiene lugar dentro de una
teoría o un esquema teórico.
La validez de constructo es probablemente la mas importante, sobretodo
desde una perspectiva científica, y se relaciona con el grado en el que
una medición, se relaciona de manera consistente con otras mediciones,
de acuerdo con hipótesis derivadas teóricamente y que conciernen a los
conceptos (o constructos) que se están midiendo.

La validez de constructo incluye tres
etapas.
1
•Se establece y especifica la relación teórica
entre los conceptos (sobre la base del marco
teórico).
2
•Se correlacionan ambos conceptos y se
analiza cuidadosamente la correlación
3
•Se interpreta la evidencia empírica de acuerdo
con el nivel en que clarifica la validez de
constructo de una medición en particular.

El proceso de validación de un constructo está vinculado con la teoría. No
es posible llevar a cabo la validación de constructo, a menos que exista un
marco teórico que soporte . la variable en relación con otras variables.
Desde luego, no es necesaria una teoría sumamente desarrollada, pero sí
investigaciones que hayan demostrado que los conceptos están
relacionados.
Entre más e elaborado y comprobado se encuentre el marco teórico que
apoya la hipótesis, la validación de constructo pueda arrojar mayor luz sobre
la validez de un instrumento de medición. Y mayor confianza tenemos en la
validez de constructo de una medición, cuando sus resultados se
correlacionan significativamente con un mayor número de mediciones de
variables que teóricamente y de acuerdo con estudios antecedentes están
relacionadas. Esto se representa en la figura 2

Instrumento Mide Constructo “A”
Teoría (Investigaciones hechas) encontraron que “A” se relaciona
positivamente con “B”,”C” Y “D”. Y negativamente con “W”.
Si el instrumento mide “A” sus resultados deben relacionarse
positivamente con los resultados obtenidos en las mediciones de
“B”, “C” Y “D”; Y relacionarse negativamente con los resultados de
“W”.
Figura 2.
Presentación gráfica
de un instrumento con
validez de constructo.
EL INSTRUMENTO PARECE REALMENTE MEDIR “A”
-
+
B
+ C
+ D
W
A

Validez total = validez de contenido + validez de
criterio + validez de constructo
Así, la validez de un instrumento de medición se evalúa sobre la base de tres
tipos de evidencia. Entre mayor evidencia mayor validez dado que la Validez
total = validez de contenido + validez de criterio + validez de constructo

3. Confiabilidad
¿Qué es la Confiabilidad?
En el caso de medir la masa corporal de un grupo de sujetos, en un estudio en el cual
la variable independiente es la masa corporal, se espera que al pesar un sujeto la
primera vez, dicho valor sea igual al ser pesado dos, tres y más veces, en idénticas
circunstancias. Si en la primera medición el valor es de 65 Kg y en una segunda
medición el valor es de 68 kg, se puede decir que esa medición no es confiable.

3. Confiabilidad
Una definición sería entonces, el grado en que el proceso de medición elimina los
errores. Una operacionalización será;
¿Qué es la Confiabilidad?
Como se puede apreciar, obtener una medición confiable es eliminar los factores de
error en el proceso. Si se elimina el factor error en la ecuación E-1, la confiabilidad sería
igual a 1 puesto que los valores del numerador y el denominador quedan iguales.

3. Confiabilidad
¿Qué procedimientos existen para determinar o medir el grado
de confiabilidad?
Método Test – Retest:
una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos
veces al mismo grupo y correlacionar las puntuaciones obtenidas. Este método tiene
la desventaja de que los puntajes pueden verse afectados por el recuerdo, la
práctica, etc. Este procedimiento no es adecuado para aplicarlo a pruebas de
conocimientos sino para la medición de aptitudes físicas y atléticas, tests de
personalidad y motores.
El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad porque
denota la coherencia de las puntuaciones en el tiempo. Para un desarrollo adecuado y
confiable deben variar entre 0,80 y 0,95. Se usa la correlación por el método de los
puntajes directos (Correlación r de Pearson):

3. Confiabilidad

Cómo calcular el Coeficiente de Correlación de Pearson:
http://www.youtube.com/watch?v=DXFJicXBv5k
3. Confiabilidad

Método de formas paralelas:
Se utiliza cuando se preparan dos versiones del mismo test; los ítems son distintos en
cada test pero con ambos se pretende medir lo mismo. En este caso el coeficiente de
confiabilidad es la correlación entre las dos formas paralelas, respondidas por los
mismos sujetos.
• Puede interpretarse como un coeficiente o indicador de equivalencia entre los dos
tests: si la correlación es alta, las dos formas del mismo test dan resultados
parecidos, ordenan a los sujetos de manera parecida, ambas formas son
intercambiables. Si la correlación entre las dos formas es baja, la conclusión más
razonable no es que los sujetos han cambiado, sino que las dos formas no están
equilibradas en sus contenidos y de alguna manera miden cosas distintas o con
énfasis distintos.
3. Confiabilidad

Método de formas paralelas:
• Una confirmación adicional de que las dos formas son realmente paralelas es
comprobar si la correlación media inter-ítem dentro de cada forma es de magnitud
similar, lo mismo que la correlación de los ítems de una forma con los de la otra
versión.
• Este tipo de fiabilidad, o prueba de equivalencia, es necesario siempre que se
disponga de dos o más versiones del mismo test, y su uso queda en la práctica
restringido a esta circunstancia no frecuente.
3. Confiabilidad
• Una vez se han administrado las dos formas paralelas se dispondrá de una tabla de
datos con N sujetos por 2 variables, la puntuación en la forma A y en la forma B para
cada sujeto. Se procede entonces a calcular el coeficiente de correlación de Pearson.

3. Confiabilidad
Método de división por mitades o Split – Halves:
Este método computa el coeficiente de correlación entre los puntajes de las dos
mitades del test o cuestionario aplicado. Esto supone que las dos test mitades son
paralelos, tienen igual longitud y varianza entre sí. Se estima a través del
coeficiente de confiabilidad de Spearman-Brown:
Se establece la correlación entre los dos puntajes de las dos mitades del test a
través del método de los puntajes directos, Correlación r de Pearson, por lo
general se forma un test con las preguntas pares y otro con los impares :

3. Confiabilidad
Método de división por mitades o Split – Halves:
Estimación del test completo (Spearman-Brown) con la fórmula:
Se interpreta la prueba de
Split – Halves como
coeficiente de consistencia
interna, ya que una sola
prueba contiene las dos
formas equivalentes y su
énfasis lo pone en las
puntuaciones de los sujetos,
no en los ítems.

3. Confiabilidad
Coeficiente Alfa de Cronbach:
Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítems es común
emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de
respuestas policotómicas, como las escalas tipo Likert; la cual puede tomar valores
entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa confiabilidad total. El
coeficiente α de Cronbach puede ser calculado por medio de dos formas:
a) Mediante la varianza de los ítems y la varianza del puntaje total
Cuanto menor sea la variabilidad de respuesta, es decir, que haya homogeneidad
en las respuestas dentro de cada ítem, mayor será el Alfa de Cronbach.

3. Confiabilidad
Coeficiente Alfa de Cronbach:
b) Mediante la matriz de correlación de los ítems.
Cuanto mayor sea la correlación lineal entre ítems, mayor será el alfa de Cronbach.
Cómo calcular el Coeficiente Alfa de Cronbach:
http://www.youtube.com/watch?v=6x0_LUnXR1E

3. Confiabilidad
Método de Kuder - Richarson 20:
Permite obtener la confiabilidad a partir de los datos obtenidos en una sola
aplicación del test.
Coeficiente de consistencia interna. Puede ser usada en cuestionarios de ítems
dicotómicos y cuando existen alternativas dicotómicas con respuestas correctas e
incorrectas, puedan codificarse como 1 ó 0 (Correcto – incorrecto, presente –
ausente, a favor – en contra, etc.)
2
2
.
*
1 st
qpst
k
k
rtt



n
xx
st
i 







2__
2
K=número de ítems del instrumento.
p=personas que responden afirmativamente a
cada ítem.
q=personas que responden negativamente a
caca ítem.
St2= varianza total del instrumento
xi=Puntaje total de cada encuestado.

3. Confiabilidad
Matriz de datos de instrumento de 6 ítems aplicado a 15 unidades de estudio
PREGUNTAS o ÍTEMS
PUNTAJE TOTAL
(xi)
(xi-X)2
ENCUESTADO P1 P2 P3 P4 P5 P6
E01 1 1 0 0 0 0 2 1,96
E02 1 1 0 1 0 0 3 0,16
E03 1 0 1 1 0 0 3 0,16
E04 0 1 1 0 1 0 3 0,16
E05 0 1 1 1 0 0 3 0,16
E06 1 0 1 1 1 0 4 0,36
E07 1 1 1 1 1 1 6 6,76
E08 1 0 0 0 0 0 1 5,76
E09 1 0 1 1 1 1 5 2,56
E10 1 1 0 0 0 0 2 1,96
E11 1 0 1 1 1 0 4 0,36
E12 1 1 1 0 0 0 3 0,16
E13 1 1 1 1 0 0 4 0,36
E14 0 1 1 1 0 0 3 0,16
E15 1 1 1 1 1 0 5 2,56
TOTAL 12 10 11 10 6 2 51 23,60
MEDIA 0,80 0,67 0,73 0,67 0,40 0,13 3,40
p 0,80 0,67 0,73 0,67 0,40 0,13
q 0,20 0,33 0,27 0,33 0,60 0,87
p.q 0,16 0,22 0,20 0,22 0,24 0,12 1,16
4.315/51
__
x
57,115/6,232
st
2
2
.
*
1 st
qpst
k
k
rtt



57,1
16,157,1
*
16
6 

ttr
rtt=0,31
Calculo del KR20: http://www.youtube.com/watch?v=rgKeg5VBKog

3. Confiabilidad
Interpretación del Coeficiente de Confiabilidad
El coeficiente de confiabilidad es un coeficiente de correlación, teóricamente
significa la correlación del test consigo mismo. Sus valores oscilan entre 0 y 1. Entre
las escalas empleadas se tienen la mostradas en el cuadro siguiente.
Tomado de: Palella y Martins (2010).

3. Confiabilidad
Tomado de: Palella y Martins (2010).

Referencias Bibliográficas
Hernández, S. Fernández, C. y Baptista, P. (2010). Metodología de la Investigación.
(5ª Edición). Caracas. Venezuela. McGraw-Hill/Interamericana.
Palella, S. y Martins, F. (2010). Metodología de la Investigación Cuantitativa. (3ra.
Edición). Caracas: FEDUPEL.
Arias, F. (2006). El Proyecto de Investigación. Introducción a la metodología científica.
(5ª ed.). Caracas: Episteme C. A.
Méndez, C. (1999). Metodología. (2ª ed.). Colombia: McGraw-Hill Interamericana S. A.
Tamayo y Tamayo, M. (2004) El proceso de la investigación científica. México: Limusa
Universidad Pedagógica Experimental Libertador-UPEL. (2006). Manual de trabajos
de grado de especialización y maestría y tesis doctorales. (4ª ed.). Caracas: Fedupel.

Validez y confiabilidad jaimes y zarate 2014

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Validez y confiabilidad jaimes y zarate 2014

Similar a Validez y confiabilidad jaimes y zarate 2014 (20)

Último

Último (20)

Validez y confiabilidad jaimes y zarate 2014