Confiabilidad y Validez

Diseños Cuantitativos
deInvestigación.
Participantes:
• Marielsy Molina
• Yanira Rodríguez
Confiabilidad y Validez
Agosto, 2014

Índice:
Introducción.
Medición. Definición
Validez. Definición
Tipos:
* De contenido
* De criterio
* De constructo
Confiabilidad. Definición
* Test-retest
* Formas paralelas
* Split-halves
* Coeficiente Alfa de Cronbach
* Coeficiente KR-20
Conclusión.

Introducción.
Todo investigador bien sea cualitativo o cuantitativo debe
tener en cuenta que la medición o instrumento de recolección de
los datos debe reunir dos requisitos esenciales: confiabilidad y
validez, ya que mediante ellos se analizan los resultados y se
juzga su calidad, y además permiten otorgarle a los instrumentos
y a la información recabada, exactitud y consistencia necesarias
para efectuar las generalizaciones de los hallazgos.
En consecuencia, el objetivo de la siguiente presentación, es
exponer en forma clara, los diferentes aspectos referentes a la
medición, confiabilidad y validez .

Medición.
Es “el proceso de vincular conceptos abstractos con indicadores empíricos”, el cual se realiza mediante un plan
explícito y organizado para clasificar (y con frecuencia cuantificar) los datos disponibles (los indicadores), en
términos del concepto que el investigador tiene en mente (Carmines y Zeller, 1991). En este proceso, el instrumento
de medición o de recolección de datos tiene un papel central. Sin él, no hay observaciones clasificadas.
Instrumento de medición: es el recurso que utiliza el investigador para registrar información o datos sobre las
variables que tiene en mente.
En toda investigación cuantitativa se aplica un instrumento para medir las variables contenidas en las hipótesis (y
cuando no hay hipótesis simplemente para medir las variables de interés). Esa medición es efectiva cuando el
instrumento de recolección de datos en realidad representa a las variables que se tienen en mente. Si no es así, la
medición es deficiente; por tanto, la investigación no es digna de tomarse en cuenta. Desde luego, no hay medición
perfecta. Es casi imposible que represente confiabilidad variables tales como la inteligencia emocional, la motivación,
el nivel socioeconómico,el liderazgo democrático, el abuso sexual infantil y otras más; pero es un hecho que hay que
tratar de acercarse lo más posible a la representación fiel de las variables a observar, mediante el instrumento de
medición que desarrollemos. Se trata de un precepto básico del enfoque cuantitativo. Al medir estandarizamos y
cuantificamos los datos (Bostwick y Kyte, 2005; Babbie, 2009).
ConfiabilidadyValidez

CONFIABILIDAD: Grado en
que un instrumento
produce resultados
consistentes y coherentes
coherentes.
VALIDEZ: Grado en que un
instrumento realmente
mide la variable que
pretende medir
REQUISITOS QUE DEBE CUMPLIR UN
INSTRUMENTO DE MEDICION:
Confiabilidad: Grado en que un instrumento produce resultados consistentes y coherentes.
La validez: Se refiere al grado en que un instrumento realmente mide la variable que pretende medir.
La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia (Gronlund, 1990; Streiner y Norman, 2008; Wiersma y Jurs, 2008; y Babbie,
2009): 1) evidencia relacionada con el contenido,2) evidencia relacionada con el criterio y 3) evidencia relacionada con el constructo.
La Validez
puede tener
distintos tipos
de evidencia:
Relacionada con el
contenido
Relacionada con el
Criterio
Relacionada con el
Constructo

TiposdeValidez
2. Evidencia relacionada con el criterio: La validez de criterio establece la
validez de un instrumento de medición al comparar sus resultados con los de
algún criterio externo que pretende medir lo mismo.
Este criterio es un estándar con el que se juzga la validez del instrumento
(Wiersma y Jurs, 2008).Cuanto más se relacionen los resultados del
instrumento de medición con el criterio, la validez de criterio será mayor.
Si el criterio se fija en el presente de manera paralela, se habla de validez
concurrente (los resultados del instrumento se correlacionan con el criterio en
el mismo momento o punto de tiempo).
Si el criterio se fija en el futuro, se habla de validez predictiva.
El principio de la validez de criterio es sencillo: si diferentes instrumentos o
criterios miden el mismo concepto o variable, deben arrojar resultados
similares. Bostwick y Kyte (2005) lo expresan de la siguiente forma:
Si hay validez de criterio, las puntuaciones obtenidas por ciertos
individuos en un instrumento deben
estar correlacionadas y predecir las puntuaciones de estas mismas
personas logradas en otro criterio.
La pregunta que se responde con la validez de criterio es: ¿en qué grado el
instrumento comparado con otros criterios externos mide lo mismo?, o ¿qué
tan cercanamente las puntuaciones del instrumento se relacionan con otro(s)
resultado(s) sobre el mismo concepto?
La validez total
La validez de un instrumento de medición se evalúa sobre la base de todos los tipos de
evidencia. Cuanta mayor evidencia de validez de contenido, de validez de criterio y de validez
de constructo tenga un instrumento de medición, éste se acercará más a representar la(s)
variable(s) que pretende medir.
Validez total = validez de contenido + validez de criterio + validez de constructo

Confiabilidad.
Para Ruiz Bolívar “Es una característica técnica
que determina la utilidad de los resultados de
un instrumento de medición en su grado de
reproducibilidad”.
Esta se refiere al hecho de que
los resultados obtenidos con
el instrumento en una
determinada ocasión, bajo
ciertas condiciones, deberían
similares si volviéramos a
medir el mismo rasgo en
condiciones idénticas.
Este aspecto de la exactitud con que un
instrumento mide lo que se pretende
medir es lo que se denomina la
confiabilidad de la medida. En este
sentido, el término confiabilidad es
equivalente a los de estabilidad y
predictibilidad. Esta es la acepción que
más comúnmente se le da a este
término.

La relación entre la confiabilidad y lavalidez
Un instrumento de medición puede ser confiable, pero no
necesariamente válido (un aparato, por ejemplo, quizá sea
consistente en los resultados que produce, pero puede no medir
lo que pretende). Por ello es requisito que el instrumento de
medición demuestre ser conf able y válido. De no ser así, los
resultados de la investigación no deben tomarse en serio.

Validez Características Básicas
Convergente
• Se refiere a que dos o más escalas que tratan de medir el mismo concepto deben
converger hacia una misma puntuación.
• La comparación se ha de realizar en el mismo lapso temporal.
Discriminante
• Se refiere al hecho de que una escala solo cuantifica las características del concepto
que trata de medir y no cualquier otra característica de cualquier otro concepto.
Factorial
• Se refiere al hecho de que la estructura de relaciones entre ítems y sus
correspondientes conceptos o factores se mantiene en sucesivos análisis.
• Requiere la existencia de validez convergente y discriminante.
Concurrente
• Se refiere a la capacidad de la escala para predecir otras variables -criterios-,
contrastándose simultáneamente los datos recogidos del concepto bajo análisis y
de la variable criterio.
• Normalmente, la evaluación de la validez concurrente se lleva a cabo incluyendo
las medidas de las variables criterio en el mismo cuestionario donde se recogen
los datos de la escala bajo estudio, por tanto, en el mismo momento del tiempo.
CaracterísticasBásicas.

Validez Características Básicas
Predictiva Simple
• Se refiere a la capacidad de la escala para pronosticar e! valor futuro de otras variables (por
ejemplo, intención de compra). Por tanto, los datos de la escala bajo estudio y de los criterios se
recogen en momentos diferentes del tiempo.
• Para tener validez predictiva es necesario tenerla también de construcción: si algo no se puede
medir con precisión, difícilmente se podrán hacer predicciones válidas.
Predictiva Pragmática
o
relacionada con
Criterios
Se refiere al hecho de que una escala de medida sea capaz de predecir otras variables (criterios)- Estas
pueden ser cualquier tipo de variable obtenida con otras escalas y que¡ pueden ser estimadas con la escala
bajo estudio.
La validez de criterio establece la validez de un instrumento de medición comparándola con algún criterio
externo. Este criterio es un estándar con el que se juzga la validez del instrumento (Wiersma, 1986).
La validez de criterio es más sencilla de estimar, lo único que hace el investigador es correlacionar su
mediación con el criterio, y este coeficiente se toma como coeficiente de validez (Bohmstedt, 1976).
Entre más se relacionen loa resultados del instrumento de medición con el criterio, la validez del criterio
será mayor.
Si el criterio se fija en el presente, se habla de validez concurrente (los resultados del instrumento se
correlacionan con el criterio en el mismo momento o punto del tiempo). Por ejemplo, un cuestionario para
detectar las preferencias del electorado por los distintos partidos contendientes, puede validarse
aplicándolo tres o cuatro días antes de la elección y sus resultados compararlos con los resultados finales
de la elección. Si el criterio se fija en el futuro, se habla de validez predictiva. Por ejemplo, una prueba para
determinar la capacidad administrativa de altos ejecutivos se puede validar comparando sus resultados con
el futuro desempeño de los ejecutivos medidos.

¿Cómo se sabe si un instrumento de medición es confiable y
válido?

Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medición. Todos utilizan procedimientos y fórmulas
que producen coeficientes de fiabilidad. La mayoría de éstos pueden oscilar entre cero y uno, donde un coeficiente de cero significa nula
confiabilidad y uno representa un máximo de confiabilidad (fiabilidad total, perfecta). Cuanto más se acerque el coeficiente a cero (0),
mayor error habrá en la medición.
100% de la confiabilidad no hay error.
Cálculo de la confiabilidad o fiabilidad
NULA MUY BAJA BAJA REGULAR ACEPTABLE ELEVADA TOTAL
0 1
0% de la información esta
contaminada de error.

1) medida de estabilidad (confiabilidad por test-retest), 2) método de formas
alternativas o paralelas, 3)método de mitades partidas (split-halves) y 4)
medidas de consistencia interna.
Los procedimientos más utilizados para determinar la
confiabilidad mediante un coeficiente son:
Resultados
de la
prueba A,
momento 1
Resultados
de la
prueba A,
momento 2
Coeficiente
de
correlación
1. Medida de estabilidad (confiabilidad por test-retest). En este procedimiento un mismo
instrumento de medición se aplica dos o más veces a un mismo grupo de personas, después de
cierto periodo. Si la correlación entre los resultados de las diferentes aplicaciones es altamente
positiva, el instrumento se considera confiable. Se trata de una especie de diseño panel. Desde
luego, el periodo entre las mediciones es un factor a considerar. Si el periodo es largo y la variable
susceptible de cambios, ello suele confundir la interpretación del coeficiente de fiabilidad obtenido
por este procedimiento. Y si el periodo es corto las personas pueden recordar cómo respondieron en
la primera aplicación del instrumento, para aparecer como más consistentes de lo que en realidad
son (Bohrnstedt, 1976).
El proceso de cálculo con dos aplicaciones se representa a continuación
Momento de estabilidad.

Coeficiente de correlación
Resultados de la prueba A1 Resultados de la prueba A2
2. Método de formas alternativas o paralelas. En este esquema no se administra el mismo
instrumento de medición, sino dos o más versiones equivalentes de éste. Las versiones
(casi siempre dos) son similares en contenido, instrucciones, duración y otras
características, y se administran a un mismo grupo de personas simultáneamente o dentro
de un periodo relativamente corto. El instrumento es confiable si la correlación entre los
resultados de ambas administraciones es positiva de manera significativa. Los patrones de
respuesta deben variar poco entre las aplicaciones. Una variación de este método es el de
las formas alternas prueba-posprueba (Creswell, 2005), cuya diferencia reside en que el
tiempo que transcurre entre la administración de las versiones es mucho más largo, que
es el caso de algunos experimentos. El método se representa en la figura

.
Método de mitades partidas (split-halves). Los procedimientos anteriores
(medida de estabilidad y método de formas alternas) requieren cuando menos
dos administraciones de la medición en el mismo grupo de individuos. En
cambio, el método de mitades partidas necesita sólo una aplicación de la
medición. Específicamente el conjunto total de ítems o reactivos se divide en
dos mitades equivalentes y se comparan las puntuaciones o los resultados de
ambas. Si el instrumento es confiable, las puntuaciones de las dos mitades
deben estar muy correlacionadas. Un individuo con baja puntuación en una
mitad tenderá a mostrar también una baja puntuación en la otra mitad.
Resultados de la mitad de la
prueba A
Resultados de la otra
mitad de la prueba A
Coeficiente de
correlación
El procedimiento se diagrama en la figura a continuación

Medidas de coherencia o consistencia interna. Éstos son coeficientes que estiman la confiabilidad:
a) el alfa de Cronbach (desarrollado por J. L. Cronbach) y b) los coefi cientes KR-20 y KR-21 de Kuder y
Richardson (1937). El método de cálculo en ambos casos requiere una sola administración del
instrumento de medición. Su ventaja reside en que no es necesario dividir en dos mitades a los ítems del
instrumento, simplemente se aplica la medición y se calcula el coeficiente. La mayoría de los programas
estadísticos como SPSS y Minitab los determinan y solamente deben interpretarse.
Respecto a la interpretación de los distintos coeficientes mencionados cabe señalar que no hay una regla
que indique: a partir de este valor no hay fiabilidad del instrumento. Más bien, el investigador calcula su
valor, lo reporta y lo somete a escrutinio de los usuarios del estudio u otros investigadores.
Sin embargo; a manera más o menos general se puede decir que si se obtiene 0.25 en la correlación o
coeficiente, esto indica baja confiabilidad; si el resultado es 0.50, la fiabilidad es media o regular. En
cambio, si supera el 0.75 es aceptable, y si es mayor a 0.90 es elevada, para tomar muy en cuenta.

Factoresquepuedenalterarlavalidezyconfiabilidad
↘ La improvisación.
↘ Aplicación de instrumentos no validados ni adaptados a la
realidad del país.
↘ Adopción de instrumentos que ya están fuera de contexto.
↘ Los instrumentos no sean empáticos con los sujetos
(lenguaje, diferencias culturales, etc.)
↘ Condiciones bajo las cuales se aplica el instrumento.

Aspectos a considerar…
 La validez de contenido se obtiene contrastando los
diferentes ítems del instrumento.
 La validez de criterio se obtiene comparando los
resultados contra los resultados de un criterio
externo.
 La validez de constructo se determina mediante el
análisis de factores.
 No existen mediciones perfectas, pero el error debe
reducirse a su mínima expresión.
 La confiabilidad se determina aplicando un
coeficiente, varían entre 0 y 1, donde 0 = confiabilidad
nula y 1 = confiabilidad total.
 Coeficientes de confiabilidad más comunes: la medida
de estabilidad, método de formas alternas, método de
mitades partidas, t de student, coeficiente alfa de
Cronbach y coeficiente KR-20.

“La ciencia se preocupa constantemente para ser
objetiva, por tratar de llegar a serlo, sin que se
pueda plantear nunca que se haya arribado a la
total objetividad. De otro modo estaríamos
negando su propio carácter falible, pretendiendo
tener un conocimiento absoluto, con lo cual
caeríamos en el dogmatismo.”
(Sabino, 2002:24)

Conclusión.
En definitiva para cualquier tipo de investigación, se hace necesario el logro de una interpretación
imparcial y precisa de los acontecimientos, así como también el establecimiento de conexiones sólidas
entre lo que se conoce de antes y lo que se está por conocer o descubrir, lo cual amerita la aplicación de
herramientas como el adecuado instrumento de medición que debe contener dos propiedades
fundamentales: confiabilidad y la validez. Con la Confiabilidad lo que se busca es que cualquier
procedimiento de medición genere los mismos resultados en eventos repetidos. En la medición de cualquier
fenómeno siempre se encuentra una cierta cantidad de error aleatorio. Es imposible que cualquier medición
esté libre de error. Por lo tanto, en cualquier procedimiento de medición existe cierto grado de no
confiabilidad, sin embargo, lo que se trata de alcanzar, es que en distintos procesos de medición se
encuentre consistencia en la misma. Entre más consistentes sean los resultados en repeticiones de la
medición, más alta será la confiabilidad del proceso de medición (Carmines & Zeller, 1979).
La otra propiedad se identifica como validez, es decir, si de lo que se trata es de medir
un concepto abstracto, lo que se necesita es que la medición mida lo que está buscando
medir. La confiabilidad se enfoca a propiedades particulares de los indicadores específicos,
en cambio, la validez se enfoca a la importante relación, entre el indicador y el constructo.
Esta última relación enfatiza la importancia de que el concepto teórico esté bien
representado en su medición, de otra manera, las inferencias que pueden hacerse pueden
ser equivocadas, si dicha representación no es adecuada. Al igual que la confiabilidad tiene
cierto grado de error, también es imposible alcanzar la validez perfecta en un indicador

Bibliografía.
 Hernández S., Roberto (2010). Metodología de la investigación. 5ta
Edición. México.
 Mendoza, J. & J. B. Garza. (2009) Medición en el proceso de
investigación científica: Evaluación de validez de contenido y
confiabilidad. Documento en línea. Disponible en: :
http://www.web.facpya.uanl.mx/rev_in/Revistas/6.1/A2.pdf . Revisado
en 29/07/14
 Ruis. C. Confiabilidad, Programa Interinstitucional Doctorado en
Educación.
 Sabino , C. (2002). El proceso de Investigación. Editorial Panapo. Caracas.

Confiabilidad y Validez

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (6)

Similar a Confiabilidad y Validez

Similar a Confiabilidad y Validez (20)

Último

Último (20)

Confiabilidad y Validez