2. Definición de Variable
Una variable estadística es el conjunto de
valores que puede tomar cierta característica
de la población sobre la que se realiza el
estudio estadístico. Estas variables pueden
ser: la edad, el peso, las notas de un examen,
etc.
3. Tipos de Variables
• Las variables estadísticas se pueden
clasificar por diferentes criterios. Según su
medición existen dos tipos de variables:
Variables cualitativas
Son las variables que expresan distintas
cualidades, características o modalidad.
Cada modalidad que se presenta se
denomina atributo o categoría y la
medición consiste en una clasificación de
dichos atributos. Las variables cualitativas
pueden ser dicotómicas cuando sólo
pueden tomar dos valores posibles como
sí y no, hombre y mujer o son politómicas
cuando pueden adquirir tres o
más valores. Dentro de ellas podemos
distinguir:
Variable cualitativa ordinal: También
llamada variable cuasi cuantitativa. La
variable puede tomar
distintos valores ordenados siguiendo una
escala establecida, aunque no es
necesario que el intervalo entre
mediciones sea uniforme, por ejemplo:
leve, moderado, grave.
Medallas de una prueba deportiva: oro,
plata, bronce.
El grado de satisfacción de algo: Mucho,
poco, nada. Bueno, regular, malo.
Variable cualitativa nominal: En esta
variable los valores no pueden ser
sometidos a un criterio de orden como
por ejemplo:
Los colores o el lugar de residencia.
El estado civil, con las siguientes
modalidades: soltero, casado, separado,
divorciado y viudo.
Profesión, Maestro, Doctor, Ingeniero,
entre otras.
4. Ejemplo de variables
Ejemplo 1
Se desea realizar una estudio
estadístico con algunas personas de
la ciudad de Medellín, acerca de lo
viable o no del horario del pico y
placa para los automóviles.
La Población es el conjunto de
estudio más grande, para este
caso las personas de la Ciudad de
Medellín.
La Muestra es el conjunto de estudio
más pequeño que la población, para
este caso algunas personas de la
Ciudad de Medellín. La Variables es
el horario del pico y placa para los
automóviles, la cual vendría hacer
una Variable Cualitativa Ordinal.
Ejemplo 2
La Institución Educativa Escuela
Normal Superior del bajo Cauca, se
llevará a cabo un estudio estadístico
con los estudiantes del grado sexto,
para saber su deporte favorito.
La Población para este caso son: los
estudiantes de la Institución
Educativa Escuela Normal Superior
del bajo Cauca.
La Muestra son los estudiantes
del grado sexto de la Institución
Educativa Escuela Normal Superior
del bajo Cauca. La Variables vendría
siendo el deporte favorito la cual es
una Variable Cualitativa Nominal.
5. Población
Población estadística, en estadística, también
llamada universo o colectivo, es el conjunto de
elementos de referencia sobre el que se
realizan las observaciones.
6. Ejemplo de
Población Ejemplo 2
En la Institución Educativa Escuela Normal
Superior del bajo Cauca su Rectora Fanny,
realiza una encuesta en los grados 10º y 11º
para saber en que estado se encuentran los
pupitres.
La Población es: la Institución Educativa
Escuela Normal Superior del bajo Cauca.
Ejemplo 1
Un salón de 30 estudiantes, se
le pregunta a 12 alumnos
sobre su edad.
La Población son: los 30
estudiantes.
7. Muestra
En estadística una muestra estadística (también llamada muestra
complicada o simplificada muestra) es un subconjunto de casos o individuos de
una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de
la población, para lo cual deben ser representativas de la misma. Para cumplir esta
característica la inclusión de sujetos en la muestra debe seguir una técnica de
muestreo. En tales casos, puede obtenerse una información similar a la de un
estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la
elección de una muestra, más abajo).
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de
toda la población porque el manejo de un menor número de datos provoca
también menos errores en su manipulación. En cualquier caso, el conjunto de
individuos de la muestra son los sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la
población, pero suficiente para que la estimación de los parámetros determinados
tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea
idóneo es preciso recurrir a su cálculo.
8. Ejemplos de Muestra
Ejemplo 1
En la Institución Educativa
Escuela Normal Superior del
bajo Cauca, se llevará a cabo un
estudio estadístico con los
estudiantes del grado sexto, para
saber su deporte favorito.
La Muestra son los estudiantes
del grado sexto de la Institución
Educativa Escuela Normal
Superior del bajo Cauca.
Ejemplo 2
En la Institución Educativa
Escuela Normal Superior del bajo
Cauca su Rectora Fanny, realiza una
encuesta en los grados 10º y 11º
para saber en que estado se
encuentran los pupitres.
La Muestra son los estudiantes de
los grados 10º y once de la Institución
Educativa Escuela Normal Superior
del bajo Cauca.
9. Parámetro Estadístico
Parámetro Estadístico
Un parámetro estadístico es
un número que se obtiene a
partir de los datos de una
distribución estadística.
Los parámetros estadísticos
sirven para sintetizar la
información dada por una tabla o
por una gráfica.
Tipos
Parámetros de dispersión. Son
datos que informan de la
concentración o dispersión de los
datos respecto de los parámetros
de centralización.
Por ejemplo el recorrido, la
desviación media, la varianza y la
desviación típica.
Parámetros de centralización. Son
datos que representan de forma
global a toda la población. Entre
ellos vamos a estudiar la media
aritmética, la moda y la mediana.
10. Ejemplo de Parámetros Estadísticos
Si estas observando un grupo de personas, digamos 50 personas, debes caracterizar tu
grupo
como? haciendo observaciones de cada elemento para esto, hay parámetros numéricos
y parámetros binarios quieres saber que promedio de estatura tiene tu grupo
debes medir a las 50 personas, y obtener por tanto 50 observaciones (parámetro numérico,
estatura, cm o m) con esos datos puedes calcular los parámetros de tendencia central:
el promedio (media), la mediana y la moda
lo mismo puedes hacer para otras características: peso, edad, etc.
Quieres saber que característica predomina mas en tu grupo, color de pelo, color de ojos,
color de piel, complexión, es decir, que vas a evaluar a cada elemento y obtendrás una
observación de cada parámetro, y por tanto tendrás 50 observaciones de cada parámetro
cuando tienes la información, debes asignarle un valor a cada condición: ojos cafés (1), ojos
azules (2), ojos verdes (3) para el parámetro color de ojos, pelo negro (1), pelo rubio (2), pelo
rojizo (3), pelo castaño (4) para el parámetro color de pelo, y así para cada característica
al transformar tus valores cualitativos (color) a cuantitativos (1,2,3,...n) puedes ver que valor
predomina y puedes ahora si caracterizar a tu grupo .
11. Escalas de medición
Todos los datos son generados por una de
las cuatro escalas de medición: nominal,
ordinal, de intervalo o de razón.
A continuación se definen cada una de estas
escalas de medición.
12. Tipos de escalas de medición
ejemplos
Escala nominal
Una escala de medición es
nominal si los datos son
etiquetas o categorías que
se usan para definir un
atributo de un elemento.
Los datos nominales pueden
ser numéricos o no
numéricos.
Ejemplo
El sexo de una persona es
un dato nominal no
numérico. El numero de
seguro social de una
persona es un dato nominal
numérico.
13. Escala Ordinal
Escala ordinal
Una escala de medición
es ordinal si los datos
pueden usarse para
jerarquizar u ordenar
las observaciones. Los
datos ordinales pueden
ser numéricos o no
numéricos.
Ejemplo
Las medidas pequeño,
mediano y grande para
dar el tamaño de un
objeto son datos
ordinales no numéricos
14. Escala de intervalo, escala de razón.
Escala de intervalo
Una escala de medición es de intervalo si
los datos tienen las propiedades de los
datos ordinales y los intervalos entre
observaciones se expresan en términos de
una unidad de medición fija. Los datos de
intervalo tienen que ser numéricos.
Ejemplo
Las mediciones de temperatura son datos
de intervalo. Suponga que la temperatura
en un lugar es de 21°C y en otro es de 4°C.
Estos lugares se pueden jerarquizar de
acuerdo con lo calurosos que son: el
primero es más caliente que el segundo.
La unidad fija de medición, 1°C , permite
decir cuán más caliente es el primer
lugar: 17°C .
Escala de razón
Una escala de medición es de razón si los
datos tienen las propiedades
de los datos de intervalo y el cociente (o
razón) entre dos medidas tiene sentido.
Los datos de razón tienen que ser
numéricos.
Ejemplo
Variables como la distancia, la altura, el
peso y el tiempo se miden con una escala
de razón.
15. Sumatoria Razón, Proporción
RAZON
Es un cociente en el que el numerador no
está incluido en el denominador. A menudo
las cantidades se miden en las mismas
unidades, pero no es esencial. El rango oscila
entre 0 e infinito.
Ejemplo
Cociente entre el número de casos de TBC en
varones y mujeres en 2005:
Razón=135/53=2,55
Cociente entre los casos de TBC ocurridos en
individuos con edades superiores a 55 y el
grupo de individuos con edades inferiores a
55 :
Razón=95/93=1,02
PROPORCION
Es un cociente en el que el numerador está
incluido en el denominador. Una proporción
no es más que la expresión de la
probabilidad de que un suceso ocurra.
El rango esta comprendido entre 0 y 1 o bien
en términos porcentuales de 0% a 100%, y
no tiene dimensión.
Ejemplo
Cociente entre el número de casos ocurridos
en varones y el total de casos en el año 2005.
135/188=0,72
El 72% de los casos han ocurrido en varones.
Cociente entre el número de casos ocurrido
en individuos con más de 65 años y el total
de casos en el año 2005.
77/188=0,41 El 41% de los casos se han
detectado en personas mayores de 65 años.
16. Tasa y frecuencia
TASA
La tasa es una forma especial de proporción o
de razón que tiene en cuenta el tiempo. Es una
medida que relaciona el cambio de una
magnitud por unidad de cambio en otra
magnitud (por regla general, tiempo). La
utilización de las tasas es esencial para
comparar experiencias entre poblaciones en
diferentes tiempos, diferentes lugares o entre
diferentes tipos de personas. Su rango oscila
entre 0 e infinito y su medida es tiempo.
Ejemplo
Cociente entre el número de casos de TBC en
varones durante el años 2005 y la población
estimada de varones en el año 2005:
135/516.329=0,000261 La tasa es de 26,1
casos de TBC por cada 100.000 habitantes
varones en 1 año (2005).
Cociente entre los casos de defunción por TBC y
la población estimada en el año 2005:
8/1076635=0,000007
La tasa de mortalidad es de 0,7 por 100.000
habitantes en 1 año.
Frecuencia
En estadística, la frecuencia
(o frecuencia absoluta) de un evento x, es
el número de veces ni que dicho evento se
repite durante un experimento o muestra
estadística. Comúnmente, la distribución
de la frecuencia suele visualizarse con el
uso de histogramas.
17. Ejemplo de frecuencia
Supongamos que las calificaciones de un estudiante de
secundaria fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11,
13. Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la
división 3/18 ( 3 de las veces que aparece de las 18 notas que
aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7,
porque hay 7 valores menores o iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38,
porque corresponde a la división 7/18 (frecuencia absoluta
acumulada dividida entre el número total de muestras).
18. Ejemplo General
REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS PARA DATOS AGRUPADOS EN
INTERVALOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos es necesario
agruparlos, a estos grupos se los llama intervalos o clases. Un intervalo es una serie de números incluidos
entre dos extremos, así por ejemplo, el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45, siendo
40 el límite inferior, 45 el límite superior, 39,5 límite real inferior (límite inferior disminuido en 5 décimas) y
40,5 el límite real superior (límite superior aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos agrupados en intervalos son:
1) Calcule el Recorrido Verdadero (Rv).- También se llama rango o amplitud total. Es la diferencia entre el valor
mayor y el menor de los datos.
2) Seleccione el Número Aproximado de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya
que un número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para calcular
la amplitud de los intervalos el valor del número de intervalos se ofrecerá como dato del ejercicio.
3) Calcule la Amplitud del Intervalo (i).- Se obtiene dividiendo el Recorrido Verdadero (Rv)entre el Número
Aproximado de Intervalos de Clase (ni):
Se procede a calcular la Amplitud la Aproximada del Intervalo (≈)
i ≈ Rv / ni
Pudiendo resultar el valor de i de diferentes formas, esto quiere decir que no sea exacto o un numero
expresado decimales, que sea entero par o un entero impar. Para efectos de nuestro curso estableceremos
un criterio para poder decidir el valor de la amplitud del intervalo definitivo el cual nos permita construir
los intervalos de clases. Por ejemplo:
Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se tiene:
•
19. Ejemplo General
Calculando el Rango se obtiene:
Rv = Vmax – Vmin = 41 -20 = 21 (si la variable es discreta)
Rv = Vmax – Vmin + S = 41 -20 + 1 = 22 (si la variable es continua)
Siendo Vmax el valor máximo de los valores reportados, Vmin el valor mínimo de los valores reportados y S la
sensibilidad del conjunto de los datos.
Para este ejemplo supondremos que Número Aproximado de Intervalos de Clase (ni) es seis, (ni= 6)
Calculando, se obtiene:
i ≈ Rv / ni ≈ 22 / 6 ≈ 3,67
•
Para determinar el valor final de la amplitud del intervalo aplicaremos e siguiente criterio (que
llamaremos Regla de Oro):
1. Si el valor calculado de i es un numero decimal, tomaremos el número impar más cercano a él.
2. Si el valor calculado de i es un numero entero par, tomaremos el menor número impar cercano a él.
3. Si el valor calculado de i es un numero entero impar, entonces el valor de i es igual al mismo valor
calculado.
Aplicando la Regla de Oro para el ejemplo, al valor calculado de i, tenemos que es un numero decimal y al
aplicar el primer criterio, se obtiene que: i = 3
4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase, comenzando por el Xmín del
rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
6) Calcule el Punto Medio para cada Clase (Xi).- Es el valor del Punto Medio de cada clase, se obtiene sumando
los límites superior (Lim. Sup) e inferior (Lim. Inf.) del intervalo y dividiendo ésta suma entre 2
Xi = (Lim. Sup. + Lim. Inf. ) / 2•