Este documento resume los conceptos clave de medición, validez y confiabilidad en investigación cuantitativa. Explica que la medición consiste en asignar números a objetos o hechos según unas reglas. Define la validez de contenido, criterio y constructo, y los métodos para evaluar la confiabilidad como test-retest, formas paralelas, split-halves, alfa de Cronbach y KR-20. Concluye que los instrumentos deben cumplir con validez, confiabilidad y objetividad.
Movimientos Precursores de La Independencia en Venezuela
Diseños cuantitativos de investigación
1. UNIVERSIDAD YACAMBÚ
VICERRECTORADO DE INVESTIGACIÓN Y POSTGRADO
INSTITUTO DE INVESTIGACIÓN Y POSTGRADO
CATEDRA: DISEÑOS CUANTITATIVOS DE INVESTIGACIÓN
Realizado por
Ing. Asdrúbal Miranda
Ing. Edgar Betanco
Maturín, Noviembre 2014.
Prof.: Leonardo Castillos
2. Contenido
Medición: ¿en qué consiste?
Validez. Definición
Validez de contenido
Validez de criterio
Validez de constructo
Confiabilidad. Definición
Test-retest
Formas paralelas
Split-halves
Coeficiente Alfa de Cronbach
Coeficiente KR-20
3. Es el proceso de vincular conceptos abstractos con indicadores empíricos,
el cual se realiza mediante un plan explicito y organizado para clasificar (y
con frecuencia cuantificar) los datos disponibles (los indicadores), en
términos del concepto que el investigador tiene en mente.
Carmines y Zeller (1991). Medir consiste en asignar números a objetos o hechos de acuerdo con unas reglas.
Stevens (1951)
De acuerdo a la postura de Carmines y Zeller , su concepción incluye
dos consideraciones:
Desde el punto de vista empírico cuyo centro de atención es la
respuesta observable (una respuesta marcada en un cuestionario, una
respuesta dada a un entrevistador, entre otras.)
Desde una perspectiva teórica, donde el interés se sitúa en el
concepto subyacente no observable que se representa mediante la
respuesta.
4. Grado en que un instrumento realmente mide la variable que pretende medir. Hernández Sampieri.
Grado en que un instrumento realmente mide lo que el investigador pretende Thorndike .
Un instrumento puede ser fiable pero no
valido; pero si es valido ha de ser fiable.
5. La validación de contenido se define como una serie de actividades que se desarrollan después que se ha creado una
forma inicial del cuestionario o instrumento y que busca determinar si los ítems incluidos en el cuestionario son
adecuados.
Un estudio de validez de contenido busca determinar si los ítems de un cuestionario representan adecuadamente el
dominio o constructo que se quiere medir. Esta búsqueda de evidencias es prioritaria sobre todo al inicio del proceso
de construcción del cuestionario.
Se puede observar en tres momentos del proceso:
En la determinación de los diversos aspectos que se van a incluir en el cuestionario de forma que éstos
representen el universo de contenido.
En la asignación de importancia a estos diferentes aspectos del universo de contenido.
En la selección de los ítems que concuerden con estos aspectos.
6. La validez de constructo, hace referencia a la recogida de evidencias empíricas que garanticen la existencia de
un constructo psicológico en las condiciones exigibles a cualquier otro modelo o teoría científica. Por todo ello,
la validez de constructo se presenta como una condición indispensable a la hora de valorar la eficacia de un
instrumento de evaluación sobre una variable psicológica determinada.
Para Messick (1980; p.1015) «la validez de constructo es el concepto unificador que integra las
consideraciones de validez de contenido y de criterio en un marco común para probar hipótesis acerca de
relaciones teóricamente relevantes».
Asimismo, Cronbach (1984; p.126) refiere que «la meta final de la validación es la explicación y comprensión,
y por tanto, esto nos lleva a considerar que toda validación es validación de constructo». Los procedimientos
metodológicos más utilizados en la validez de constructos psicológicos han sido el análisis factorial y la matriz
multirrasgo- multimétodo. Ambos sistemas son indicadores respectivos de las denominadas "validez factorial"
y "validez convergente-discriminante"
7. Validez de criterio Se refiere al grado de eficacia con que se puede predecir o
pronosticar una variable de interés (criterio) a partir de las puntuaciones en un
test.
Un criterio es una variable distinta del test que se toma como referencia, que
se sabe que es un indicador de aquello que el test pretende medir o que se
sabe que debe presentar una relación determinada con lo que el test pretende
medir.
La elección del criterio es el aspecto crítico en este procedimiento de determinación de la validez, ya que es
muy difícil obtener buenos criterios.
Un mismo test puede tener más de un tipo de validez, es decir puede estar validado con respecto a varios
criterios y los diferentes coeficientes de validez que resultan pueden tener valores diferentes.
8. Un instrumento de medición tiene un grado alto de confiabilidad si es afectado mínimamente por elementos
que representan el error de medición aleatorio. En este sentido, la confiabilidad tiene un matiz plenamente
empírico, sin embargo, dicho instrumento para una aceptación científica completa, requiere de la validez, la
cual tiene una relación muy fuerte con la teoría, ya que con la validez surge la pregunta siguiente: ¿con qué
propósito se busca la validez? Por lo tanto, un indicador o un instrumento con validez deben reflejar lo que se
supone el concepto teórico plantea explicar. Con la validez, lo que se busca evitar, es reflejar un fenómeno
diferente, o evitar un error de medición no aleatorio.
9. MÉTODO TÉCNICA PROPÓSITO
Test/retest
Coeficiente r correlación de
Pearson
Consistencia en el tiempo de los
puntajes
Formas Equivalentes
Coeficiente r correlación de
Pearson
Estabilidad temporal,
consistencia de las repuestas
División por Dos Mitades
Pearson/Spearman –Brown.
Rólon Guttman
Homogeneidad de los itemes al
medir el constructo
Analisis de Homogeneidad de los
Itemes
KR 20
Coeficiente de confiabilidad
como consistencia interna para
itemes dicotómicos
Alfa de Cronbach
Homogeneidad de los itemes
con escala tipo Lickert
Tipos de Confiabilidad
10. Test-retest
Con este método el coeficiente de fiabilidad se calcula pasando el mismo test
dos veces a los mismos sujetos. Se pueden pasar inmediatamente, o dejando
un intervalo de tiempo entre el test y el retest. Después se calcula la
correlación de Pearson entre las puntuaciones de ambas aplicaciones, y el
resultado obtenido será el coeficiente de fiabilidad.
Se considera un caso específico de formas paralelas,
dado que evidentemente un test es paralelo a sí mismo.
Al resultado obtenido se le denomina coeficiente de
estabilidad, al servir de indicador de hasta qué punto
son estables las mediciones realizadas durante la
primera aplicación del test. Las diferencias en los
resultados se atribuyen al grado de consistencia interna
o muestreo de los ítems de la prueba en el caso de pasar
el retest de forma inmediata, y se le suman las
fluctuaciones en el tiempo en el caso del intervalo
temporal.
11. Este procedimiento es el que se deriva naturalmente del modelo. Requiere que se utilicen dos pruebas o
instrumentos paralelos, esto es, que midan lo mismo de forma diferente (por ejemplo, dos tests que con
diferentes preguntas midan un determinado rasgo). Después se comparan los dos tests, calculando el
coeficiente de correlación de Pearson. Esta correlación será, como hemos visto en el apartado anterior, el
coeficiente de fiabilidad. Si la correlación es alta, se considera que hay una buena fiabilidad. Al valor
obtenido también se le conoce como coeficiente de equivalencia, en la medida en que supone un indicador
del grado de equivalencia entre las dos formas paralelas de un test. La dificultad de este procedimiento
radica en conseguir que dos instrumentos sean realmente "paralelos", dada la dificultad que supone realizar
dos pruebas que midan exactamente lo mismo, pero con diferentes ítems. No obstante, en condiciones
ideales en las que se pueda garantizar el paralelismo de ambas formas, este es el método más recomendable.
12. Split-halves
Este método trata las dos mitades de una medida
como formas alternas. Proporciona una solución
simple para el problema que enfrenta el método
paralelo-formas . A diferencia de los anteriores, este
método sólo requiere una aplicación del test. Tras
obtener las puntuaciones obtenidas por los sujetos en
cada una de las dos mitades en que se habrá dividido,
se procede a calcular la correlación entre las dos
puntuaciones.
El resultado obtenido será un indicador de la covariación entre
ambas mitades, es decir, de la consistencia interna del test. La
principal dificultad de este sistema es asegurarse de que ambas
mitades sean efectivamente paralelas. Un sistema habitual es
dividir el test entre los ítems pares y los impares; no es
recomendable dividirlo sin más por la mitad, dado que muchos
tests muestran un incremento gradual de la dificultad de sus
ítems.
13. Coeficiente Alfa de Cronbach
El Alfa de Cronbach es un coeficiente que sirve para medir la fiabilidad de una escala de medida, y cuya
denominación Alfa fue realizada por Cronbach en 1951, aunque sus orígenes se encuentran en los trabajos de Hoyt
(1941) y de Guttman (1945). El alfa de Cronbach no deja de ser una media ponderada de las correlaciones entre las
variables (o ítems) que forman parte de la escala.
Puede calcularse de dos formas: a partir de las varianzas
(alpha de Cronbach) o de las correlaciones de los ítems
(Alpha de Cronbach estandarizado). Hay que advertir
que ambas fórmulas son versiones de la misma y que
pueden deducirse la una de la otra. El alpha de
Cronbach y el alpha de Cronbach estandarizados,
coinciden cuando se estandarizan las variables
originales (items)
14. Coeficiente KR-20
Para el año 1937 Kuder y Richardson, desarrollaron el conocido KR20, se denominó de esta forma porque
fue la fórmula número 20 presentada por el famoso artículo de los autores.
El Método KR20 representa un coeficiente de consistencia interna del instrumento, que proporciona la media
de todos los coeficientes de división por mitades para todas las posibles divisiones del instrumento en dos
partes (Magnusson, 1995).
La fórmula KR-20 tan solo es una variante de alfa especialmente orientada a items dicotómicamente
valorados (específicamente, valorados con los valores 0 y 1). (Bolívar, 1997)
Características:
Permite calcular la confiabilidad con una sola aplicación del
instrumento.
No requiere el diseño de pruebas paralelas.
Es aplicable sólo en instrumentos con ítems dicotómicos, en los cuales sólo existen respuestas
correctas e incorrectas.
15. Conclusiones
Un instrumento de recolección de datos es, en principio, cualquier recurso de que se vale el investigador para
acercarse a los fenómenos y extraer de ellos información.
Los instrumentos de investigación son recursos que se utilizan para registrar la información que se quiere
obtener ó medir.
Los requisitos que debe reunir un instrumento de medición son: Validez, Confiabilidad y Objetividad.
La objetividad es el grado en que el instrumento es permeable a la influencia de los sesgos y tendencias de
los investigadores.
La validez se refiere a si los instrumentos utilizados en la investigación miden o recogen los datos que se
suponen midan o recojan.
La validez puede ser de contenido, de criterio ó de constructo La confiabilidad de un instrumento de
medición se refiere al grado en que su aplicación repetida produce resultados coherentes y consistentes.
Los métodos para estimar la confiabilidad son: Test-Retest , Formas paralelas, Mitades compartidas,
Coeficiente Alfa de Cronbach, Coeficiente KR-20.
16. Bibliografía
Arias, Fidias (2004). El Proyecto de Investigación. Introducción a la Metodología Científica. Editorial
Episteme, CA.
Hernández, Fernández y Baptista (2001). Metodología de la Investigación. Editorial Mc Graw Hill.
México.
Carr, W. y S. Kemmis (1988). Teoría Crítica de la Enseñanza. Barcelona. Martínez Roca.
Sierra, R (1994) Técnicas de investigación Social. Teoría y ejercicios. Madrid. Paraninfo.
Hernandez Sampieri, R.; Fernández Collado, C. y Baptista Lucio, P. (2006) Metodología de la.
Investigación. Cuarta Edición. México: Mc. Graw-Hill/Interamericana Editores S-A. de C.V Validez y
confiabilidad.
Bisquerra, R. (1989). Método de investigación educativa, guía práctica. Ediciones Ceac, Barcelona –
España.