Este documento presenta conceptos básicos de estadística como población, muestra, variables cualitativas y cuantitativas, estadística descriptiva y tablas de frecuencias. Explica cómo construir tablas de frecuencias para datos agrupados y no agrupados, incluyendo frecuencias absolutas, relativas y acumuladas. Ilustra estos conceptos con un ejemplo de datos sobre árboles plantados.
1. 1
La Estadística
1. Definición
2. Población y muestra
3. Variable y tipos de variables
4. Estadística descriptiva
5. Tabla de frecuencias
5.1.Tabla de frecuencias datos no agrupados
5.2.Tabla de frecuencias datos agrupados
Prof. Manuel Alonzo Torres
2. 2
Estadística:
Ciencia que proporciona técnicas para tratar gran volumen de datos para extraer y mostrar
la información que subyace en ellos. Permite obtener información de un colectivo muy
amplio de datos a partir de un conjunto relativamente pequeño de datos procedentes de
él, gracias a ello se formulan modelos matemáticos que representen la repuesta obtenida
en alguna característica de interés al ser influenciada por diferentes factores. Con esta
información en la mano se puede tomar decisiones cuando exista un marco de
incertidumbre.
En Estadística se estudian fenómenos aleatorios, que son aquellos cuyo resultado no es
previsible aunque se repitan en idénticas condiciones.
Colectivo o Población: es el conjunto todos los individuos a los que va dirigido el estudio
estadístico.
Muestra: es el subconjunto de datos elegidos del colectivo que realmente se analizan.
Variable estadística: es cada una de las características que se miden de cada uno de los
individuos que forman la muestra.
Las variables estadísticas pueden ser cualitativas y cuantitativas.
Se dice que una variable estadística es cualitativa cuando los valores que puede tomar son
atributos. Variables cuantitativas son aquellas que pueden tomar valores numéricos.
Las variables cualitativas pueden ser:
Nominales o categóricas: los valores no admiten ordenación, por ejemplo, el color, o la
marca de bebida preferida, o el partido político elegido, o el lugar de procedencia, etc.
Ordinales: los valores de este tipo de variables admiten ordenación, aunque sean
cualitativas, por ejemplo, el estado de salud de pacientes de un hospital: Muy grave,
Grave, Leve. También son ordinales las variables que miden el grado de satisfacción
conseguido por algún servicio: Muy mal, Mal, Regular, Bien, Muy bien.
Las variables cuantitativas pueden ser:
Discretas: aquellas que solo pueden tomar valores aislados, y dados dos consecutivos no
puede haber valores intermedios, frecuentemente van asociadas a procesos de conteo: Nº
de ramas de un árbol, Nº de puestas en nidos, Nº de miembros por familia, etc.
Continuas: aquellas variables numéricas que, si se poseyesen instrumentos con infinita
precisión, su valor podría ser expresado con infinitas cifras decimales, dados dos valores,
por próximos que estén, siempre sería posible encontrar valores intermedios entre ambos.
La mayoría de las variables que implican una medición son de este tipo: la temperatura
de la atmósfera, la velocidad del vuelo de un ave, la altura que alcanza un árbol, son
ejemplos de variables cuantitativas Continuas.
A veces, cuando las variables son numéricas, es necesario conocer su escala de medida:
Decimos que una variable numérica está medida en escala por intervalos cuando no hay
un cero absoluto origen de las medidas, por ejemplo: la hora de llegada de un tren a una
estación, si se toma como cero las 24 horas del día anterior y ha llegado un tren a las 0h
3. 3
10 min. y otro a las 0h 20 min., sabemos que el segundo llegó 10 minutos después que el
primero, pero no podemos decir que el segundo haya tardado el doble que el primero en
llegar, pues no se ha adoptado un cero absoluto común a todos los recorridos. Un ejemplo
clásico de este tipo de variable es la temperatura: si el aire hoy está a 10ºC y ayer estaba
a 20ºC, no podemos decir que la temperatura hoy sea el doble de la de ayer, pues el cero
en la escala de medida se ha tomado de modo arbitrario, para comprobarlo, basta con
expresar ambas temperaturas en grados Fahrenheit.
Una variable estadística está medida en escala por ratios cuando existe un cero absoluto,
entonces podemos considerar diferencias entre las medidas y también proporciones. La
mayoría de los fenómenos físicos que consideremos están medidos en este tipo de escala,
por ejemplo, la temperatura absoluta, en grados Kelvin es una variable medida en escala
por ratios, también el peso, la longitud, o la masa lo son.
Estadística descriptiva:
Es la parte de la estadística que proporciona técnicas para extraer y mostrar la información
que subyace en conjuntos de muy numerosos datos.
Cuando se acomete un estudio científico, es habitual medir gran cantidad de parámetros
sobre cada uno de los individuos elegidos, la estadística descriptiva univariante permite
estudiar los datos correspondientes a cada característica sin considerar la influencia de las
demás.
Tablas de frecuencias
Como resultado del estudio estadístico se posee una serie de estadillos o cuestionarios,
uno por cada individuo considerado en el que se recogen todas las medidas realizadas a
cada individuo. La tabla siguiente es un ejemplo de uno de estos estadillos , en él se han
anotado seis características de árboles de un vivero después de un año de haber sido
plantadas, la tabla recoge las medidas correspondientes a los diez primeros.
Árbol nº Replantado Grado de
afección
Nº de
ramas
primarias
Diámetro
(cm)
Altura (cm)
1 N MG 1 3,9 160,4
2 S NA 0 4,3 203,7
3 N M 2 3,9 160,5
4 N G 1 2,5 146,3
5 N M 3 3,9 123,0
6 S NA 4 4,2 184,4
7 N L 2 4,5 153,0
8 N L 1 5,3 186,0
9 S MG 0 2,5 169,8
10 S M 2 2,9 168,8
Códigos: S: Si
N: No
NA: No Afectado
L: Leve
M: Medio
G: Grave
MG: Muy Grave
el primer paso para sintetizar la información es tabular los datos. Consideraremos
distintos tipos de agrupaciones de datos:
4. 4
Tablas de frecuencias de datos en agrupamiento discreto:
Realizamos este tipo de agrupamiento cuando el número de posibles respuestas a la
variable en estudio es reducido. Las variables cualitativas se prestan muy bien a este
sistema de agrupamiento
Para construir una tabla de frecuencias de agrupamiento discreto se anotan en una
columna cada uno de los distintos valores que tome la variable y en la columna siguiente
su frecuencia o número de veces que se repite.
La tabla de frecuencia de la variable Replantado es:
Replantado frecuencia
S 4
N 6
Total: 10
La tabla de frecuencia de la variable X = Grado de afección es:
Grado de
afección
xi
frecuencia
ni
frecuencia
relativa
fi
NA 2 0.2
L 2 0.2
M 3 0.3
G 1 0.1
MG 2 0.2
Total 10 1.0
La frecuencia relativa es la frecuencia absoluta dividida entre el número de observaciones,
indica la proporción de datos que muestran un determinado valor de la variable. Se puede
expresar también en %.
La tabla de frecuencia de la variable X=Número de ramas primarias es.
Nº ramas
primarias
xi
frecuencia
ni
frecuencia
relativa
fi
Frecuencia
acumulada
Ni
Frecuencia
acumulada
relativa
Fi
0 2 0.2 2 0.2
1 3 0.3 5 0.5
2 3 0.3 8 0.8
3 1 0.1 9 0.9
4 1 0.1 10 1.0
Total 10 1.0
La frecuencia acumulada es el número de datos que presentan un valor menor o igual que
uno dado de la variable. La frecuencia acumulada relativa es la proporción de datos
menores o iguales a uno dado.
Tablas de frecuencias de datos agrupados en clases:
Cuando tenemos una variable continua, o cuando, siendo discreta, el número de valores
diferentes es muy grande, se agrupan los datos en clases o intervalos.
El número de intervalos o clases I a considerar es una cuestión importante y no hay un
criterio fijo para establecerlo. La fórmula de Sturges es una de las que se pueden utilizar
5. 5
para determinarlo, según ella, I es el exponente de la primera potencia de dos cuyo
resultado supera al número de datos, con un mínimo de 4 clases.
Para el ejemplo que estamos comentando, con 10 datos, como 24
>10, se toma I=4.
Para determinar la amplitud de cada clase se divide el rango o diferencia entre el mayor
y el menor de los valores observados entre el número de clases I.
Para la variable diámetro, la amplitud es:
5.3 2.5 2.8
0.7
4 4
R
a
I
Si el cociente no es exacto se puede redondear por exceso, aunque eso hará que la última
clase termine en un valor superior al máximo observado.
Para evitar dudas, se consideran todos los intervalos cerrados por la derecha y abiertos
por la izquierda, salvo el primero que se considera cerrado por ambos extremos.
Cada clase o intervalo se identifica con una cifra llamada marca de clase, que es la media
entre ambos extremos.
La tabla de frecuencias de la variable diámetro es:
Clases Marcas
de clase
xi
frecuencia
ni
frecuencia
relativa
fi
frecuencia
acumulada
Ni
frecuencia
acumulada
relativa
Fi
[2.5 ; 3.2] 2.85 3 0.3 3 0.3
(3.2 ; 3.9] 3.55 3 0.3 6 0.6
(3.9 ; 4.6] 4.25 3 0.3 9 0.9
(4.6 ; 5.3] 4.95 1 0.1 10 1.0
Confeccionar tablas de frecuencia por intervalos con Excel es una opción práctica para
este tipo de datos.