Panorama Sociodemográfico de México 2020: GUANAJUATO
Tipos de variables y escalas de medición en estadística
1.
2. Es una característica que al ser medida en diferentes individuos es susceptible de adoptar
diferentes valores.
Existen diferentes tipos de variables:
Variable Cualitativa
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que
se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos
atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores
posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores.
Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: También llamada variable cuasi cuantitativa. La
variable puede tomar distintos valores ordenados siguiendo una escala
establecida, aunque no es necesario que el intervalo entre mediciones sea
uniforme, por ejemplo:
Leve, moderado, grave.
Medallas de una prueba deportiva: oro, plata, bronce.
El grado de satisfacción de algo: Mucho, poco, nada. Bueno, regular, malo.
3. Variable cualitativa nominal: En esta
variable los valores no pueden ser
sometidos a un criterio de orden como por
ejemplo:
• Los colores o el lugar de residencia.
• El estado civil, con las siguientes
modalidades: soltero, casado, separado,
divorciado y viudo.
• Profesión, Maestro, Doctor, Ingeniero,
entre otras.
Variables Cuantitativas
Son las variables que se expresan
mediante cantidades numéricas. Las
variables cuantitativas además pueden ser:
Variable discreta: Es la variable que
presenta separaciones o interrupciones en
la escala de valores que puede tomar.
Estas separaciones o interrupciones
indican la ausencia de valores entre los
distintos valores específicos que la variable
pueda asumir. Ejemplo: El número de hijos
(1, 2, 3, 4, 5).
Variable continua: Es la variable que
puede adquirir cualquier valor dentro de un
intervalo especificado de valores. Por
ejemplo la masa (2.3 kg, 2.4 kg, 2.5 kg, ...)
o la altura (1.64 m, 1.65 m, 1.66 m, ...), que
solamente está limitado por la precisión del
aparato medidor, en teoría permiten que
siempre exista un valor entre dos variables.
4. Es la colección de datos que corresponde a las características de la totalidad de
individuos, objetos, cosas o valores en un proceso de investigación.
Para su estudio, en general se clasifican en Poblaciones Finitas y Poblaciones Infinitas.
Poblaciones Finitas: Constan de un número determinado de elementos, susceptible a
ser contado. Ejemplo: Los empleados de una fábrica, elementos de un lote de
producción, etc.
Poblaciones Infinitas: Tienen un número indeterminado de elementos, los cuales no
pueden ser contados. Ejemplo: Los números naturales.
Así también las poblaciones pueden ser clasificadas en Reales e Hipotéticas, las reales
son aquellas concretas, que ya existen. Ejemplo: Los aspirantes a un puesto de trabajo,
los vendedores de una empresa. Mientras que las hipotéticas, son las formas
imaginables en que se podría presentar un suceso. Ejemplo: Estimaciones de la
población económicamente activa dentro de diez años.
5. Una muestra es una porción representativa de una determinada
población. Cuando no se puede realizar un censo, se recurre al
muestreo, que es la herramienta que se utiliza para determinar
qué porción de la realidad se estudiará. Existen distintos tipos
de técnicas para conformar una muestra, entre ellas:
Muestreo de conveniencia o por selección
intencionada: aquí la muestra similar al universo objetivo es
seleccionada a partir de métodos no aleatorios. La
representatividad de dicha muestra es determinada por el
investigador de manera subjetiva. Por funcionar de esta
manera, las muestras suelen tener sesgos, por lo que lo ideal
es recurrir a esta técnica cuando no quede ninguna otra
alternativa.
6. Muestreo aleatorio: en este todos los elementos que lo componen tienen
exactamente la misma posibilidad de ser elegidos. Estos elementos son
seleccionados de forma azarosa por medio de números aleatorios. Existen
distintas formas de realizar el muestreo aleatorio, entre ellas:
1. Muestreo aleatorio simple: este método es muy simple y se
caracteriza por la extracción de los individuos de una lista de forma
azarosa. Cuando el universo es muy numeroso y complejo, no
suele resultar eficaz.
2. Muestreo sistemático: en este caso, el primer individuo se extrae
al azar y a partir de este se elije, a intervalos constantes, el resto.
Este método resulta más sencillo que el muestreo aleatorio simple
y además no precisa de un listado elaborado para seleccionar a
los individuos. Si bien el muestreo sistemático es aplicable a la
mayoría de los casos, se debe tener en cuenta que la
característica que se esté estudiando no posea una periodicidad
igual a la del muestreo.
7. 3. Muestreo aleatorio estratificado: para realizar este
muestreo se debe dividir a la población en grupos de
acuerdo a un carácter específico y luego, cada uno de
estos grupos es muestreado aleatoriamente,
obteniendo así una parte que sea proporcional a la
muestra. Estos muestreo son útiles cuando la
característica que determina la división de la población
está relacionada con la variable que quiera estudiarse.
4. Muestreo aleatorio por conglomerados: aquí, la
población es dividida en grupos que posean
características similares entre ellos. Luego de realizar
esto, algunos grupos son analizados completamente
dejando de lado al resto.
5. Muestreo mixto: en este caso se utilizan al menos
dos de los métodos mencionados anteriormente. Esto
ocurre cuando la población a estudiar es sumamente
compleja, por lo que la aplicación de un solo método
resultaría difícil o resultaría ineficiente.
8. Un parámetro estadístico es un número que resume la ingente cantidad de datos que pueden
derivarse del estudio de una variable estadística. El cálculo de este número está bien definido,
usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.
Existen principalmente tres tipos de parámetros estadísticos:
Parámetros de Posición
Permiten identificar el valor en torno al cual se agrupan mayoritariamente los datos, es decir, cuyo
valor es representativo de todos ellos. Pueden ser de dos tipos:
•Medidas de tendencia central: media, mediana y moda.
•Medidas de posición no central: cuartiles, deciles y perceptiles.
Este tipo de parámetros no tiene por qué coincidir con un valor exacto de la variable, y no deben
usarse con carácter general para hacer pronósticos. La elección de un parámetro u otro, dependerá
de cada caso particular y de la distribución que siga la variable, pero podemos concluir que en el
caso de que los datos sigan una distribución normal, la media aritmética es el parámetro más
representativo, mientras que si presenta cierta asimetría conviene más utilizar la mediana. La moda
sólo es adecuada en el caso de variables cualitativas.
9. Parámetros de Dispersión
Las medidas de posición resumen la distribución de datos, pero resultan insuficientes y simplifican
excesivamente la información. Estas medidas adquieren verdadero significado cuando van
acompañadas de otras que informen sobre la heterogeneidad de los datos. Estas medidas se
conocen como parámetros de dispersión y miden en qué medida los datos se agrupan entorno a un
valor central.
Hay medidas de dispersión absolutas, entre las cuales se encuentran la varianza, la desviación
típica o el recorrido y medidas de dispersión relativas, como el coeficiente de variación. Las medidas
absolutas tienen que ir acompañadas de un parámetro de posición, normalmente la media, y no
permiten comparaciones entre distintas muestras. Las medidas relativas suelen ser a dimensionales
por lo que permiten la comparación entre distintas muestras
Parámetros de Forma
Las variables aleatorias continuas presentan frecuentemente una pauta de variabilidad que se
caracteriza por el hecho de que los datos tienden a acumularse en torno a un valor central, que
coincide con la media, decreciendo su frecuencia de forma aproximadamente simétrica a medida
que se alejan por ambos lados de dicho valor. Los histogramas de estas variables continuas tienen
forma de campana de Gauss, que es el modelo matemático de la distribución normal, siendo la
distribución que con más frecuencia aparece en multitud fenómenos reales.
10. Una vez que ha sido definida la variable
estadística que va a ser analizada, nos
encontramos con el problema de cómo medirla.
En muchas oportunidades este asunto no
presenta ninguna dificultad, pues la variable
considerada ya tiene una unidad de medida
perfectamente definida. Tal es el caso por
ejemplo, de una longitud, en donde ya existen
varias unidades de medición universalmente
aceptadas, como pudieran ser el metro, la
pulgada, el milímetro, etc. En otros casos sin
embargo, la situación no es tan clara, pues no
existe tal unidad de medida, y se hace
necesario definir una escala de medición. Por
ejemplo, si la población estudiada es el
conjunto de clientes de una empresa de
servicios , y lo que se quiere estudiar es el
nivel de satisfacción de cada uno de ellos por
el servicio prestado, inmediatamente nos
preguntaremos: ¿ cómo medir ese nivel de
satisfacción ?.La selección de una escala de
medición adecuada es una decisión importante
en cualquier investigación, pues de ella
dependerá la metodología estadística a seguir,
y las conclusiones de la investigación. En
1948, el científico S.S. Stevens propuso una
clasificación lógica para los tipos de medición,
con la que no todos los estadísticos
concuerdan, pero que es la más divulgada y
conocida. Stevens señaló que si no existieran
mediciones el mundo sería caótico, y no
existiría ciencia estadística, y si las mediciones
fuesen totalmente exactas, habría una
demanda mucho más reducida para emplear la
Estadística. Stevens reconoce cuatro tipos de
escalas de medición: nominal, ordinal , de
intervalos, y de razón.
11. Las escalas nominales
se emplean para medir variables
cualitativas nominales, y se utilizan como
medidas de identidad. Una escala de este
tipo tendría que ser
necesariamente usada para representar
los distintos valores de variables como sexo
, religión , etc.
La escala ordinal
refleja orden o jerarquía entre los distintos
niveles de la variable, y se disponen de la
más alta a la más baja , o viceversa. El
ejemplo clásico de este tipo de escala es el
empleado para evaluar la dureza de los
minerales. Esta propiedad se define como el
grado de resistencia a la abrasión, y en esta
escala el número 1 corresponde a un
material muy suave y fácil de desmenuzar
como el talco, mientras que el número 10 en
el extremo opuesto de la escala,
corresponde al diamante, que puede rayar a
todos los demás , y no puede ser rayado por
ninguno.
La escala de intervalos
es para variables cuantitativas, y por lo
tanto proporciona valores numéricos .En
este tipo de escala hay que seleccionar una
unidad de medida , y la medición expresa el
número de unidades que posee el elemento
medido.
La escala de razón o de cociente
es también para variables cuantitativas, y se
diferencia de la de intervalos en que en ella
el cero no es arbitrario, y corresponde
realmente a una total ausencia de la
propiedad estudiada.
En una escala de razón, lo mismo que
en una de intervalos, a iguales diferencias
entre los números asignados corresponden
iguales diferencias de intensidad de la
variable en estudio, pero ahora si es posible
hacer comparaciones de razón entre los
elementos, y decir que en un elemento “A”
el valor de la variable es tres veces o cuatro
veces el valor de otro elemento "B”.
El peso y la estatura son ejemplos claros de
una escala de razón, pues una persona que
pese 90 Kg, pesa el triple que un niño
que pese 30 Kg.
12. Sumatoria
Se emplea para representar la suma de
muchos o infinitos sumandos.
Razón
La Razón es el cociente entre dos números, en
el que ninguno o sólo algunos elementos del
numerador están incluidos en el denominador.
El rango es de 0 a infinito.
Ejemplos:
En el año 2002, según el Centro Nacional de
Epidemiología se declararon los siguientes
casos de legionelosis:
1. Legionelosis adquirida en la
comunidad/legionelosis
nosocomiales= 372/29= 12,8. Por cada caso
de legionelosis nosocomial hay 12,8 casos
comunitarios.
2. Defunciones por legionelosis adquirida
en la comunidad/defunciones por
legionelosis nosocomiales= 9/5= 1,8. Por
cada defunción por legionelosis nosocomial hay
1,8 defunciones por legionelosis adquirida en la
comunidad.
Proporción
La proporción es una razón en la cual los
elementos del numerador están incluidos en el
denominador. Se utiliza como estimación de la
probabilidad de un evento. El rango es de 0 a 1,
o de 0 a 100%.
Ejemplos (tomando los datos de la tabla de
arriba):
1. Casos de legionelosis comunitarias en
relación al total del año 2002= 372/401= 0,93*
100= 93%. El 93% de las legionelosis
declaradas en España en 2002 fueron
adquiridas en la comunidad.
2. Defunciones por legionelosis
comunitarias en relación al total de las
defunciones por legionelosis del año
2002= 9/14= 0,64* 100= 64%. El 64% de las
defunciones por legionelosis declaradas en
España en 2002 fueron por legionella adquirida
en la comunidad.
13. Tasa
La tasa es un tipo especial de razón o de
proporción que incluye una medida de tiempo
en el denominador. Está asociado con la
rapidez de cambio de un fenómeno por unidad
de una variable (tiempo, temperatura, presión).
Los componentes de una tasa son el
numerador, el denominador, el tiempo
específico en el que el hecho ocurre, y
usualmente un multiplicador, potencia de 10,
que convierte una fracción o decimal en un
número entero.
Según el Instituto Nacional de Estadística, en el
año 2002 se encontraba censada en España
una población de 41.837.894 personas.
Ejemplos (ver datos de la tabla):
1. Tasa de legionelosis en el año 2002 en
España= 401/41.837.894 =0,96*10-5
(*100.000)= 0,96 personas padecieron
legionelosis en el año 2002 en España por cada
100.000 habitantes.
2. Tasa de mortalidad por legionelosis en
España en 2002= 14/41.837.894= 3,3*10-7
(*100.000)= 0,033 personas fallecieron por
legionelosis en España en 2002 por cada
100.000 habitantes.
Frecuencia
Es el número de veces que el valor de una
variable se repite. Se distinguen dos tipos
principales de frecuencia:
Frecuencia absoluta
La frecuencia absoluta es el número de veces
que se repite un hecho en un experimento o un
estudio. Se suele representar de la siguiente
forma: ni .
Frecuencia relativa
Es el resultado de la división entre el valor de la
frecuencia absoluta (ni) y el tamaño de la
muestra (N). Se suele representar de esta
forma: fi . Puede aparecer de forma decimal,
como fracción o como un porcentaje.