2. VARIABLES
Definición de variable: Se pueden definir como todo aquello que se va a medir, controlar y estudiar en una investigación o
estudio. La capacidad de poder medir, controlar o estudiar una variable viene dado por el hecho de que ella varía, y esa variación se puede observar,
medir y estudiar.
Por lo tanto, es importante, antes de iniciar una investigación, que se sepa cuáles son las variables que se desean medir y la
manera en que se hará. Es decir, las variables deben ser susceptibles de medición.
De este modo una variable es todo aquello que puede asumir diferentes valores, desde el punto de vista cuantitativo o cualitativo.
Las variables pueden ser definidas conceptual y operacionalmente.
La definición conceptual es de índole teórica, mientras que la operacional da las bases de medición y la definición de los indicadores.
Existen tres tipos de variables, la variable dependiente, independiente e interviniente.
3. Tipos De Variables
Variable cualitativa
Las variables cualitativas se refieren
a características o
cualidades que no pueden ser
medidas con números. Podemos
distinguir dos tipos:
Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante
un número, por tanto se pueden realizar operaciones
aritméticas con ella. Podemos distinguir dos tipos:
Variable cualitativa
nominal
Una variable cualitativa
nominal presenta modalidad
es no
numéricas que no admiten
un criterio de orden.
Ejemplo: El estado civil, con
las siguientes modalidades:
soltero, casado, separado,
divorciado y viudo.
Variable cualitativa ordinal o
variable cuasi cuantitativa
Una variable cualitativa
ordinal presenta modalidades
no numéricas, en las que existe
un orden.
Ejemplos: La nota en un
examen: suspenso, aprobado,
notable, sobresaliente.
Puesto conseguido en una
prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba
deportiva: oro, plata, bronce.
Variable discreta
Una variable discreta es
aquella que solo puede tomar
un número finito de valores
entre dos valores cualesquiera
de una característica.
Ejemplo:
El número de hermanos de 5
amigos: 2, 1, 0, 1, 3.
Variable continua
Una variable continua es
aquella que puede tomar un
número infinito de valores
entre dos valores
cualesquiera de una
característica.
Ejemplos:
La altura de los 5 amigos:
1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la
altura con dos decimales,
pero también se podría dar
con tres decimales.
4. Población y Muestra
Población:
Es la colección de datos que
corresponde a las características de la
totalidad de individuos, objetos, cosas o
valores en un proceso de investigación.
Para su estudio, en general se clasifican
en Poblaciones Finitas y Poblaciones
Infinitas.
Poblaciones Finitas:
Constan de un número
determinado de elementos,
susceptible a ser contado.
Ejemplo: Los empleados de
una fábrica, elementos de un
lote de producción, etc.
Poblaciones Infinitas:
Tienen un número
indeterminado de
elementos, los cuales no
pueden ser contados.
Ejemplo: Los números
naturales.
Así también las poblaciones pueden
ser clasificadas en:
reales son aquellas concretas, que
ya existen.
Ejemplo: Los aspirantes a un
puesto de trabajo, los vendedores
de una empresa.
hipotéticas, son las formas
imaginables
Ejemplo: Estimaciones de la
población económicamente activa
dentro de diez años.
Muestra:
“Es una parte representativa de
la población que es
seleccionada para ser
estudiada, ya que la población
es demasiado grande para ser
estudiada en su totalidad” Allen
Western.
5. Parámetros Estadísticos
Un parámetro estadístico es un número que se obtiene a partir de los datos de
una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una
tabla o por una gráfica.
Tipos de parámetros estadísticos
Medidas de centralización
Nos indican en torno a qué valor (centro) se
distribuyen los datos.
La medidas de centralización son:
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa
la mitad superior de la distribución y la inferior, es
decir divide la serie de datos en dos partes iguales.
Moda
La moda es el valor que más se repite en una
distribución.
Medidas de posición
Las medidas de posición dividen un
conjunto de datos en grupos con el
mismo número de individuos.
Para calcular las medidas de
posición es necesario que
los datos estén ordenados de menor
a mayor.
La medidas de posición son:
Cuartiles
Los cuartiles dividen la serie de
datos en cuatro partes iguales.
Deciles
Los deciles dividen la serie de datos
en diez partes iguales.
Percentiles
Los percentiles dividen la serie de
datos en cien partes iguales.
Medidas de dispersión
Las medidas de dispersión nos informan sobre
cuanto se alejan del centro los valores de la
distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y
el menor de los datos de una distribución
estadística.
Desviación media
La desviación media es la media aritmética de
los valores absolutos de
las desviaciones respecto a la media.
Varianza
La varianza es la media aritmética del cuadrado
de las desviaciones respecto a la media.
Desviación típica
La desviación típica es la raíz cuadrada de
la varianza.
7. Escalas de medidas
Para realizar un correcto análisis de los datos es fundamental conocer de antemano el tipo de
medida de la variable, ya que para cada una de ellas se utiliza diferentes estadísticos. La
clasificación más convencional de las escalas de medida las divide en cuatro grupos
denominados Nominal, Ordinal, Intervalo y Razón.
NOMINAL
Son variables numéricas cuyos
valores representan una categoría
o identifican un grupo de
pertenencia. Este tipo de variables
sólo nos permite establecer
relaciones de igualdad/desigualdad
entre los elementos de la variable.
La asignación de los valores se
realiza en forma aleatoria por lo
que NO cuenta con un orden
lógico. Un ejemplo de este tipo de
variables es el Género ya que
nosotros podemos asignarle un
valor a los hombres y otro diferente
a las mujeres y por más machistas
o feministas que seamos no
podríamos establecer que uno es
mayor que el otro.
ORDINAL
Son variables numéricas cuyos
valores representan una
categoría o identifican un grupo
de pertenencia contando con un
orden lógico. Este tipo de
variables nos permite establecer
relaciones de
igualdad/desigualdad y a su vez,
podemos identificar si una
categoría es mayor o menor que
otra. Un ejemplo de variable
ordinal es el nivel de educación,
ya que se puede establecer que
una persona con título de
Postgrado tiene un nivel de
educación superior al de una
persona con título de bachiller.
En las variables ordinales no se
puede determinar la distancia
entre sus categorías, ya que no
es cuantificable o medible
INTERVALO
Son variables numéricas cuyos valores
representan magnitudes y la distancia
entre los números de su escala es igual.
Con este tipo de variables podemos
realizar comparaciones de
igualdad/desigualdad, establecer un
orden dentro de sus valores y medir la
distancia existente entre cada valor de
la escala. Las variables de intervalo
carecen de un cero absoluto, por lo que
operaciones como la multiplicación y la
división no son realizables. Un ejemplo
de este tipo de variables es la
temperatura, ya que podemos decir que
la distancia entre 10 y 12 grados es la
misma que la existente entre 15 y 17
grados. Lo que no podemos establecer
es que una temperatura de 10 grados
equivale a la mitad de una temperatura
de 20 grados.
RAZÓN
Las variables de razón poseen las
mismas características de las variables
de intervalo, con la diferencia que
cuentan con un cero absoluto; es decir,
el valor cero (0) representa la ausencia
total de medida, por lo que se puede
realizar cualquier operación Aritmética
(Suma, Resta, Multiplicación y División)
y Lógica (Comparación y ordenamiento).
Este tipo de variables permiten el nivel
más alto de medición. Las variables
altura, peso, distancia o el salario, son
algunos ejemplos de este tipo de escala
de medida.
Debido a la similitud existente entre las
escalas de intervalo y de razón, SPSS
las ha reunido en un nuevo tipo de
medida exclusivo del programa, al cual
denomina Escala..
8. Ejemplos
Análisis Descriptivo de acuerdo al nivel de Medida
No todos los procedimientos estadísticos son realmente útiles para la totalidad de los
niveles de medida. Cada uno de los tipos de medida posee ciertas características, las cuales
debemos tener en cuenta en el momento de realizar un análisis descriptivo. En la tabla [5-
2], encontrarás algunos de los procedimientos que resultan ventajosos en
los análisis descriptivos de los diferentes niveles de medida. Es necesario aclarar que
esta tablaes sólo una muestra de las medidas que se pueden emplear; en algunos textos de
estadística aparecen tablas más amplias y detalladas de los procedimientos.
Tabla 5-2
Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los
mismos procedimientos de análisis, por lo que se agrupan como variables categóricas. A
partir de este punto cuando nos refiramos a las variables categóricas debemos recordar que
se alude a las variables de tipo Nominal yOrdinal.
Es importante resaltar que para los análisis descriptivos no hay una gran diferencia entre
estos dos tipos de variables, pero si existe diferencia en los análisis de Inferencia. Antes de
conocer como se efectúan estos procedimientos en SPSS, es necesario exponer las razones
por las que ciertos procedimientos no son de utilidad en algunos de los niveles de medida.
Variables Categóricas
Para las variables que representan categorías o grupos de pertenencia, los principales
procedimientos estadísticos, que se pueden utilizar en su análisis descriptivo son
las frecuencias (Recuento), el Porcentaje, laModa, en algunos casos la mediana y los
gráficos más favorables son el de Sectores y el de Barras.
Para comprender mejor la razón de estos procedimientos vamos a realizar el análisis de la
variable Género, la cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en donde el valor
uno (1) representa al género Femenino y el valor Dos (2) al género Masculino. Las
frecuencias y sus respectivos porcentajes para esta variable serían los expuestos en
la tabla [5-3]. Ahora si hallamos las principales medidas de tendencia central, obtenemos
los resultados expuestos en la tabla [5-4].
Figura 5-4
Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos
indica que en promedio los encuestados cuenta con un género de (1.2). Este resultado no
posee una interpretación aplicable a la información de la variable, por lo que esta medida
no es de utilidad en el análisis descriptivo.
Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al
género Femenino, pero si en vez de 10 valores tuviéramos únicamente dos (1 y 2), la
mediana sería de (1.5), cuya interpretación no es aplicable a la información de la variable.
La mediana se puede utilizar cuando estamos trabajando con variables que contienen un
elevado número de categorías y su interpretación se debe manejar como un factor
informativo para el investigador y no como una medida representativa en el reporte.
Por último encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que
la categoría con mayor frecuencia dentro de la variable es la correspondiente al género
Femenino. Las medidas de dispersión y distribución no son aplicables a este tipo de
variables ya que sus ecuaciones nos permiten determinar como se comportan los datos
respecto a un punto central o media. Si hallamos la desviación estándar para los datos
delejemplo, obtendríamos un valor de 0.42164, que nos indicaría que el promedio del
género presenta una variación de ±0.42, cuyo resultado no sería aplicable a la interpretación
de la variable.
9. Sumatoria razón, Proporción, Tasa
y Frecuencia
La sumatoria o sumatorio (llamada también notación sigma) es una
operación matemática que se emplea para calcular la suma de muchos o
infinitos sumandos.
La operación sumatoria se expresa con la letra griega sigma mayúscula Σ,
y se representa así
Expresión que se lee: "sumatoria de Xi, donde i toma los valores desde 1
hasta n".
i es el valor inicial, llamado límite inferior.
n es el valor final, llamado límite superior.
Pero necesariamente debe cumplirse que:
i ≤ n
Si la sumatoria abarca la totalidad de los valores, entonces no se anotan
sus límites y su expresión se puede simplificar:
Ahora, veamos un ejemplo:
Si se quiere expresar la suma de los cinco primeros números naturales se
puede hacer de esta forma:
RAZON
Es un cociente en el que el numerador no está
incluido en el denominador. A menudo las
cantidades se miden en las mismas unidades,
pero no es esencial. El rango oscila entre 0 e
infinito.
Ejemplos
Cociente entre el número de casos de TBC en
varones y mujeres en 2005:
Razón= 135/53= 2,55
Cociente entre los casos de TBC ocurridos en
individuos con edades superiores a 55 y el grupo
de individuos con edades inferiores a 55 :
Razón=95/93=1,02
10. PROPORCION
Es un cociente en el que el numerador está
incluido en el denominador. Una proporción
no es más que la expresión de la probabilidad
de que un suceso ocurra.
El rango esta comprendido entre 0 y 1 o bien
en términos porcentuales de 0% a 100%, y no
tiene dimensión
.
Ejemplos
Cociente entre el número de casos ocurridos
en varones y el total de casos en el año 2005.
135/188=0,72 El 72% de los casos han
ocurrido en varones.
Cociente entre el número de casos ocurrido
en individuos con más de 65 años y el total de
casos en el año 2005.
77/188=0,41 El 41% de los casos se han
detectado en personas mayores de 65 años.
TASA
La tasa es una forma especial de proporción
o de razón que tiene en cuenta el tiempo. Es
una medida que relaciona el cambio de una
magnitud por unidad de cambio en otra
magnitud (por regla general, tiempo). La
utilización de las tasas es esencial para
comparar experiencias entre poblaciones en
diferentes tiempos, diferentes lugares o entre
diferentes tipos de personas. Su rango oscila
entre 0 e infinito y su medida es tiempo-¹.
Ejemplos
Cociente entre el número de casos de TBC
en varones durante el años 2005 y la
población estimada de varones en el año
2005:
135/516.329=0,000261 La tasa es de 26,1
casos de TBC por cada 100.000 habitantes
varones en 1 año (2005).
Cociente entre los casos de defunción por
TBC y la población estimada en el año 2005:
8/1076635=0,000007 La tasa de
mortalidad es de 0,7 por 100.000 habitantes
en 1 año.
11. • Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor
en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se
representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma
mayúscula) que se lee suma o sumatoria.
• Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
La suma de las frecuencias relativas es igual a 1.
• Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado.
Se representa por Fi.
• Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada
de un determinado valor y el número total de datos. Se puede expresar en tantos
por ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de
menor a mayor, en la segunda hacemos el recuento y en la tercera
anotamos la frecuencia absoluta.
x i R e c u e n t o f i F i n i N i
2 7 I 1 1 0 . 0 3 2 0 . 0 3 2
2 8 I I 2 3 0 . 0 6 5 0 . 0 9 7
2 9 6 9 0 . 1 9 4 0 . 2 9 0
3 0 7 1 6 0 . 2 2 6 0 . 0 5 1 6
3 1 8 2 4 0 . 2 5 8 0 . 7 7 4
3 2 I I I 3 2 7 0 . 0 9 7 0 . 8 7 1
3 3 I I I 3 3 0 0 . 0 9 7 0 . 9 6 8
3 4 I 1 3 1 0 . 0 3 2 1
3 1 1