Este documento describe las escalas de medición y tipos de datos estadísticos. Explica que existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La escala nominal solo provee etiquetas sin significado numérico, mientras que la escala de razón permite el uso de estadísticos complejos como la media aritmética. También describe los tipos de variables cualitativas y cuantitativas, y cómo la clasificación de variables y datos determina qué análisis estadísticos son posibles.
5. Variables
¿Qué es una variable?
Cualquier factor que puede
cambiar en un experimento o
investigación científica es una
variable, si es posible manipularla
directamente es independiente, y si
varía de acuerdo a los cambios en
la variable independiente, se llama
variable dependiente.
6. Variables
En estadística
Se denomina variable estadística a
cualquier cosa que medimos, esta
medición es un proceso que
definiremos posteriormente.
Existen diferentes tipos de variables y
formas de clasificarlas, a continuación
veremos una de las formas más usuales
de clasificarlas.
7. Tipos de variables
Son variables que toman como
valores cantidades numéricas, ya sea
producto de una medición o un
conteo.
Estas variables no toman como valor
ningún número, sino frases
descriptivas del lenguaje natural
llamadas categorías.
8. Tipos de variables
Algunos ejemplos de valores numéricos son: el
peso de una persona, su edad, la longitud de un
tornillo, la temperatura ambiente, el flujo de agua
o aceite, número de piezas en un empaque, entre
otros. Es posible efectuar operaciones aritméticas
con estos valores.
Algunos ejemplos de valores categóricos son: género
de una persona, color de un objeto, textura de una
pieza de tela, entre otros. Aunque generalmente se
les asignan números, masculino = 1, femenino = 2,
estos valores no retienen sus propiedades
aritméticas.
9. Clasificación de variables cualitativas
Estos valores tampoco tiene un significado
numérico, aunque cuando se les asignan
números debido a que pueden ordenarse
pueden generar algo de confusión: Nivel de
servicio bueno = 1, regular = 2, malo = 3; sabor
de un platillo bueno = 4, aceptable = 3, regular
= 2, malo = 1
Son valores sin ningún significado numérico,
como simples etiquetas que describen alguna
característica del individuo sin ningún orden:
Color de un objeto, estado civil de una
persona, país de origen de un fruto, entre
otros. Suelen emplearse números para
representarlos.
10. Clasificación de variables cuantitativas
Los valores de una variable continua se obtienen
mediante una medición, por lo que se consideran
infinitos y no numerables, ya que puede tomar
cualquier valor decimal que sea necesario. Para
facilitar el procesamiento estadístico suelen
redondearse a un número arbitrario de decimales.
Estos valores tiene un claro significado numérico y
se obtiene mediante un conteo, pueden ser finitos
y numerables (como el número de piezas
defectuosas en una muestra de 30) o numerables
pero infinitos (como el número de ensayos
necesarios para obtener 100 piezas defectuosas).
11. Medición en estadística
Para la estadística, la medición es un proceso
mediante el cuál se asignan números a
objetos, o propiedades de los objetos,
eventos u observaciones con base en un
conjunto de reglas prestablecido.
En algunos casos los números se asignarán
solamente como etiquetas y en otros como
valores aritméticos.
Los instrumentos de medición de magnitudes objetivas como temperatura,
distancia o peso deben ser cuidadosamente calibrados para obtener valores
confiables.
12. Niveles de medición
Una vez que conocemos los tipos de
variables que existen y los valores que
pueden tomar, es conveniente prestar
atención a la forma en que se obtienen.
En cuanto asignamos un número como
valor de una variable, se dice que estamos
empleando una escala de medición.
La medición es una versión formalizada de una observación, se le
considera una forma de describir el mundo que nos rodea.
13. Niveles de medición
Dependiendo de la escala de medición
que se utilice, se dice que el valor de la
variable tiene mayor o menor cantidad de
información y, por lo tanto, es posible
realizar diferentes operaciones con ellas.
La asignación de números a los posibles valores de una variable
se lleva a cabo de acuerdo con determinadas reglas. Estas reglas,
en ocasiones, son puramente arbitrarias.
14. Niveles de medición
Se han establecido cuatro niveles o escalas
de medición: nominal, ordinal, de intervalo
y de razón o cociente. Tal como se
enunciaron, es el nivel de medición que
tienen, es decir, la cantidad de información
que contienen acerca de la variable.
La escala más débil es la nominal, seguida de la ordinal, luego la
de intervalo y finalmente la de razón, que es la más fuerte.
15. Nivel de medición: escala nominal
Una escala nominal es una escala de medición
en la que se han asignado números a los
valores de la variable pero carecen de todas
sus propiedades aritméticas, realizando una
función exclusivamente de etiqueta.
El valor de la variable proporciona poca
información acerca del individuo
Evidentemente, en variables nominales, la media aritmética carece de sentido:
“El estado civil promedio es 21/6 = 3.5, lo cuál significa entre divorciado y viudo.”
16. Nivel de medición: escala nominal
El análisis estadístico de variables categóricas
o nominales no hace uso de la media
aritmética para sintetizar la información, sino
únicamente de la moda, ya que incluso la
mediana puede arrojar un resultado no entero
que carecería de significado.
En ocasiones pueden usarse porcentajes o proporciones para presentar este tipo
de variables y las gráficas más comunes son la de barras y la circular.
17. Nivel de medición: escala ordinal
En esta escala los números asignados indican un
orden, pero no retienen sus propiedades
aritméticas por lo que, nuevamente, el uso de la
media aritmética producirá resultados con
significados equívocos. Al igual que en la
nominal esta escala es considerada débil porque
los valores de la variable contienen poca
información acerca del individuo.
Si promediamos los valores de la escala Likert y obtenemos 3.5, ¿significa que es
“aceptable casi bueno”? No tiene sentido.
18. Nivel de medición: escala ordinal
El análisis estadístico de datos ordinales es
similar al de datos nominales, se emplea la
moda, porcentajes y proporciones. La mediana
también puede producir resultados decimales
que serían difíciles de interpretar. Se elaboran
gráficos de barras y circulares principalmente.
La razón principal para no emplear media aritmética ni mediana es que los valores
numéricos no nos permiten establecer que la distancia entre Excelente y Bueno sea
la misma que la distancia entre Regular y Malo.
19. Nivel de medición: escala de intervalo
En forma similar a la escala nominal, los valores
en la escala de intervalo indican una mayor o
menor cantidad de un atributo específico. La
diferencia principal es que en las escalas de
intervalo, distancias numéricas iguales indican
diferencias iguales en la cantidad de la dimensión
subyacente.
El ejemplo típico en la escala de intervalo es la temperatura en grados
Centígrados o Fahrenheit; una diferencia de dos grados, digamos entre 20° y 22°,
es la misma que entre 40° y 42°, lo que no ocurre con la escala ordinal.
20. Nivel de medición: escala de intervalo
En numerosas investigaciones sociales y/o modelos
de evaluación del desempeño se emplean escalas
que, por su diseños, son ordinales, como la conocida
escala Likert. Sin embargo, frecuentemente se
encuentra información en la que estas escalas
ordinales son tratadas como si fueran escalas de
intervalo, lo que da lugar a frecuentes e
interminables cuestionamientos metodológicos.
El tratamiento estadístico en escalas de intervalo permite el uso de media
aritmética y mediana como estadísticos para el análisis de datos, por lo que es
posible utilizar otro tipo de gráficos.
21. Nivel de medición: escala de razón
La escala de razón es muy parecida a la escala de intervalo;
existe un orden en los valores, una diferencia de cierta
cantidad de unidades en diferentes puntos de la escala
implica la misma diferencia en la magnitud subyacente. Por
ejemplo: El tiempo de reacción al disparo de salida en una
carrera de 100 m planos es, en promedio, de 120
milisegundos (ms); si dos corredores reaccionan a los 110 y
115 ms respectivamente, es la misma diferencia que entre
120 y 125 ms.
La diferencia entre estas dos escalas es que, en la escala de razón existe un valor
cero absoluto, que indica la completa ausencia de la magnitud implicada; en el
ejemplo, existe un tiempo de reacción de cero ms, aunque es difícil que suceda.
22. Nivel de medición: escala de razón
Al existir un valor cero absoluto, implica que 200 ms de
tiempo de reacción es el doble de tiempo que 100 ms. Esto
no sucede con las escalas de intervalo; 40 °C no es el doble
que 20 °C.
La escala de razón es la que contiene mayor información, y
permite el uso de media aritmética, mediana, moda, y
cualquier otro estadístico sin ningún problema. Admite
tratamientos matemáticos sofisticados.
En resumen la escala nominal sólo provee información acerca de si dos individuos son
iguales o diferentes; la ordinal nos permite aclarar si un individuo posee mayor o menor
cantidad del atributo que otro; la de intervalo nos permite afirmar a qué “distancia” se
encuentra un individuo de otro; y la de razón añade el cero absoluto.
23. Tipos de datos
Los datos son, sencillamente, los valores
que las variables toman al realizar un
censo o un muestreo.
Por lo tanto los datos se clasifican igual
que las variables: cualitativos y
cuantitativos con las subdivisiones ya
mencionadas.
La clasificación de los datos nos permite decidir el tipo de análisis estadístico que es
posible realizar.