El documento define diferentes tipos de variables estadísticas (cualitativas y cuantitativas), parámetros estadísticos (de centralización y dispersión), escalas de medición (nominal, ordinal, de intervalo y de razón), y conceptos como población, muestra, frecuencia y razón. Explica que una variable estadística describe características de individuos de una población y que los parámetros estadísticos sintetizan información sobre la población.
2. Una variable estadística es cada una de las características o cualidades que poseen los
individuos de una población.
Tipos de variables
• Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números. Podemos distinguir dos tipos:
Variable cualitativa nominal
Una variable cualitativa nominal presenta modalidades no numéricas que no admiten
un criterio de orden. Ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal o variable cuasi cuantitativa
Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe
un orden. Ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
3. • Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se
pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable discreta es aquella que solo puede tomar un número finito de valores
entre dos valores cualesquiera de una característica. Ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continúa
Una variable continua es aquella que puede tomar un número infinito de valores
entre dos valores cualesquiera de una característica. Ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con
tres decimales.
4. La población es un conjunto de individuos de la misma clase, limitada por el estudio. Según
Tamayo y Tamayo, (1997), ¨La población se define como la totalidad del fenómeno a estudiar
donde las unidades de población posee una característica común la cual se estudia y da
origen a los datos de la investigación¨(P.114)
Entonces, una población es el conjunto de todas las cosas que concuerdan con una serie
determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos los
elementos de una población.
Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una
población determinada, nos referimos a este grupo de elementos como muestra. Por
supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la población en
su conjunto. La exactitud de la información recolectada depende en gran manera de la forma
en que fue seleccionada la muestra.
Cuando no es posible medir cada uno de los individuos de una población, se toma una
muestra representativa de la misma.
La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja
las características que definen la población de la que fue extraída, lo cual nos indica que es
representativa. Por lo tanto, la validez de la generalización depende de la validez y tamaño
de la muestra.
5. Un parámetro estadístico es un número que se obtiene a partir de los datos de una
distribución estadística. Los parámetros estadísticos sirven para sintetizar la
información dada por una tabla o por una gráfica.
• Parámetros de centralización. Son datos que representan de forma global a toda la
población. Por ejemplo, si hacemos un examen en la clase y queremos tener una
idea global del resultado de dicho examen, ¿cómo lo podríamos hacer? Parece
lógico que sumando todas las notas y dividiendo el resultado por el número de
alumnos, es decir, lo que todos conocemos como calculando la media.
• Parámetros de Dispersión En este apartado se estudia la distribución de los valores
de la serie, analizando si estos se encuentran más o menos concentrados, o
dispersos alrededor del valor central.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las
siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el valor más elevado y el valor más bajo.
6. 2.- Varianza: promedia la distancia existente entre los valores de la serie y la media. Se
calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamaño de la muestra
Parámetros de Posición
Permiten identificar el valor en torno al cual se agrupan mayoritariamente los datos, es
decir, cuyo valor es representativo de todos ellos. Pueden ser de dos tipos:
Medidas de tendencia central: media, mediana y moda.
Medidas de posición no central: cuartiles, deciles y perceptibles.
Este tipo de parámetros no tiene por qué coincidir con un valor exacto de la variable, y
no deben usarse con carácter general para hacer pronósticos. La elección de un
parámetro u otro, dependerá de cada caso particular y de la distribución que siga la
variable, pero podemos concluir que en el caso de que los datos sigan una distribución
normal, la media aritmética es el parámetro más representativo, mientras que si
presenta cierta asimetría conviene más utilizar la mediana. La moda sólo es adecuada
en el caso de variables cualitativas.
7. Escalas de medición son una sucesión de medidas que permiten organizar datos
en orden jerárquico. Las escalas de medición, pueden ser clasificadas de acuerdo
a una degradación de las características de las variables. Estas escalas son:
nominales, ordinales, intercalares o racionales. Según pasa de una escala a otra el
atributo o la cualidad aumenta. Las escalas de medición ofrecen información sobre
la clasificación de variables discretas o continuas. Toda vez que dicha clasificación
8. • ESCALA NOMINAL.
No poseen propiedades cuantitativas y sirven únicamente para identificar las clases. Los
datos empleados con las escalas nominales constan generalmente de la frecuencia de
los valores o de la tabulación de número de casos en cada clase, según la variable que
se está estudiando. El nivel nominal permite mencionar similitudes y diferencias entre los
casos particulares. Los datos evaluados en una escala nominal se llaman también
"observaciones cualitativas", debido a que describen la calidad de una persona o cosa
estudiada, u "observaciones categóricas" porque los valores se agrupan en categorías.
Por lo regular, los datos nominales o cualitativos se describen en términos de porcentaje
o proporciones. Para exhibir este tipo de información se usan con mayor frecuencia
tablas de contingencia y gráficas de barras.
• ESCALA ORDINAL
Las clases en las escalas ordinales no solo se diferencian unas de otras (característica
que define a las escalas nominales) sino que mantiene una especie de relación entre sí.
También permite asignar un lugar específico a cada objeto de un mismo conjunto, de
acuerdo con la intensidad, fuerza, etc.; presentes en el momento de la medición. Una
característica importante de la escala ordinal es el hecho de que, aunque hay orden
entre las categorías, la diferencia entre dos categorías adyacentes no es la misma en
toda la extensión de la escala. Algunas escalas consisten en calificaciones de múltiples
factores que se agregan después para llegar a un índice general.
9. • ESCALA DE INTERVALO.
Refleja distancias equivalentes entre los objetos y en la propia escala. Es decir, el
uso de ésta escala permite indicar exactamente la separación entre 2 puntos, lo
cual, de acuerdo al principio de isomorfismos, se traduce en la certeza de que los
objetos así medidos están igualmente separados a la distancia o magnitud
expresada en la escala.
• ESCALA DE RAZÓN.
Constituye el nivel óptimo de medición, posee un cero verdadero como origen,
también denominada escala de proporciones. La existencia de un cero, natural y
absoluto, significa la posibilidad de que el objeto estudiado carezca de propiedad
medida, además de permitir todas las operaciones aritméticas y el uso de números
representada cantidades reales de la propiedad medida.
Con esto notamos que esta escala no puede ser usada en los fenómenos
psicológicos, pues no se puede hablar de cero inteligencia o cero aprendizaje, etc.
10. Sumatoria
El sumatorio o sumatoria no es más que una operación de suma repetida desde “n” veces
(siendo n el número de sumandos) hasta infinito. Tiene muchas aplicaciones, tanto en
estadística (para hallar la media, etc.) como en las series de números e incluso en integrales.
Se representa con la letra griega Σ, y se puede definir de la siguiente manera:
La variable i se llama índice de la suma, que nos indica cual es el primer valor inicial (desde
el cual se comienza), mientras que n es el límite superior, que es hasta donde va a llegar
dicha suma. Además, se tiene que cumplir que m≤n.
11. Razón
Es la relación entre dos fenómenos independientes, el rango es de cero a infinito
positivo.
Donde k es alguna base de 10 ( se usan con mayor frecuencia 1 y 100) y tanto c
como d se refiere a la frecuencia en el que ocurre algún evento. En el caso de la
razón el numerador no es parte del denominador.
Por ejemplo: en un hospital existen mil pacientes y un total de cincuenta médicos, por
lo cual se tiene una razón de 1000/50 = 20, en otras palabras el hospital por cada
médico existen 20 pacientes 1:20.
Proporción
Es el cociente del número de veces que se presenta un valor o característica con
respecto al total de la muestra de la variable en estudio. Por ejemplo: en un estudio
médico sobre el Alzheimer se examinaron 280 mujeres y 220 hombres, entonces se
puede notar que:
Proporción (mujeres) = 280/500 = 0,56
Proporción (hombres) = 220/500 = 0,44
12. Es importante aclarar que las proporciones, se relacionan con las frecuencias relativas
simples; su rango, va desde cero hasta uno (ambos inclusive), en otras palabras, el
campo de existencia de las proporciones se encuentra en el intervalo [0,1] y la sumatoria
de las proporciones es igual a uno.
La fórmula general de proporciones (Pi) es:
Pi= xi
N
Tasa
La tasa es un tipo especial de razón o de proporción que incluye una medida de tiempo
en el denominador. Está asociado con la rapidez de cambio de un fenómeno por unidad
de una variable (tiempo, temperatura, presión). Los componentes de una tasa son el
numerador, el denominador, el tiempo específico en el que el hecho ocurre, y
usualmente un multiplicador, potencia de 10, que convierte una fracción o decimal en un
número entero.
13. Frecuencia en Estadística
En Estadística, frecuencia es el número de veces que el valor de una variable se
repite. Se distinguen dos tipos principales de frecuencia: relativa y absoluta.
Frecuencia absoluta
La frecuencia absoluta
Es el número de veces que se repite un hecho en un experimento o un estudio. Se
suele representar de la siguiente forma: ni .
Frecuencia relativa
Es el resultado de la división entre el valor de la frecuencia absoluta (ni) y el tamaño de
la muestra (N). Se suele representar de esta forma: fi . Puede aparecer de forma
decimal, como fracción o como un porcentaje.
Ejemplo
Durante el mes de julio, en una ciudad se
han registrado las siguientes temperaturas
máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31,
31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.