2. Pasos a seguir en un estudio estadístico
Analizar la característica a estudiar de la población.
Elegir una muestra representativa de la población.
Recogida de datos de la variable en la muestra.
Ordenar los datos obtenidos en la muestra.
Construir la tabla de frecuencias correspondiente.
Dibujar los gráficos estadísticos adecuados.
Calcular las medidas de centralización y dispersión.
Extraer conclusiones de esos datos para la población.
3. Conceptos básicos
Definiciones:
Estadística.- Es la parte de las matemáticas que se ocupa de recoger, organizar y analizar
grandes cantidades de datos para estudiar sus características y obtener conclusiones.
Población.- Conjunto de elementos al que se les aplica el estudio.
Muestra.- Es un subconjunto de la población que utilizaremos para realizar dicho estudio.
Individuo.- Cada uno de los elementos de la población.
Variable estadística.- Propiedad o característica de la población que estamos interesados en
estudiar. La representaremos por xi.
Clasificación: Según el tipo de valores que puede tomar la variable estadística, podemos clasificarla
en:
Cuantitativa: Si toma valores numéricos.
Cuantitativa discreta: Si los valores numéricos son enteros.
Cuantitativa continua: Si los valores numéricos son decimales.
Cualitativa: Si la variable no toma valores numéricos.
Ejemplo: Queremos estudiar las siguientes características de la población de Ourense. (Sexo, altura,
edad y color del pelo). Elegimos 100 números de teléfono de la guía de Ourense de forma aleatoria, y
le preguntamos a cada uno su sexo, altura, edad y color del pelo, Anotando en nuestra libreta los
resultados obtenidos.
Contestad a las siguientes preguntas:
¿Cuál es la población, la muestra y el individuo?.
¿Cuáles son las variables estadísticas y de que tipo son?.
¿Qué valores pueden tomar las distintas variables estadísticas?.
4. Frecuencias
Es una tabla en la que se colocan los datos estadísticos obtenidos, una vez
ordenados, para su análisis posterior. En ella indicaremos los valores de la
variable y sus frecuencias.
Definiciones:
Frecuencia absoluta (n ).- Es el número de veces que toma el valor x .
i i
Frecuencia relativa (f ).- Es el cociente entre la frecuencia absoluta ( n )
i i
y el total de datos (N). fi Representa el tanto por uno. fi=ni/N.
Frecuencia absoluta acumulada (Ni).- Es el número de veces que toma
el valor xi y todos los anteriores a él (cuando los datos están ordenados).
Frecuencia relativa acumulada (Fi).- Es el cociente entre la frecuencia
Fi=Ni/N
absoluta acumulada (Ni) y el total de datos (N).
%.- Número de veces que aparece el valor de la variable en 100 .
Observaciones:
El porcentaje se obtiene multiplicando por 100 la frecuencia relativa.
En las variables cualitativas no se calculan las frecuencias acumuladas.
5. Ejemplo de Tabla de frecuencias
Ejemplo para variables discretas: Lanzamos un dado 120 veces.
Después de anotar los resultados obtenidos y ordenarlos en forma
creciente, construimos la tabla de frecuencias siguiente:
Tabla de frecuencias
xi ni fi Ni Fi %
1 18 0,15 18 0,15 15
2 21 0,18 39 0,33 18
3 24 0,20 63 0,53 20
4 16 0,13 79 0,66 13
5 19 0,16 98 0,82 16
6 22 0,18 120 1,00 18
N= 120 1 100
Nota: Observa que los valores obtenidos en la última fila son los totales de
cada una de las columnas. Las frecuencias relativas suman 1 y los
porcentajes suman 100.
6. Ejemplo de tabla de frecuencias
Ejemplo para variables continuas: Los pesos, en kilogramos, de 30 cajas de fruta vienen dados por los
siguientes valores:
32´5, 30´6, 38´7, 35´2, 29, 23´8, 36´4, 41, 39´5, 42, 28´1, 20´7, 43, 35´7, 29,
33, 28´5, 45, 37´5, 27, 30´4, 42, 43, 38´6, 29, 38, 42´4, 25, 36´5, 34.
Pasos a seguir para construir la tabla de frecuencias:
Calcular el recorrido R = Valor mayor – valor menor = 45 – 20´7 = 24´3
Decidir cuantas clases (intervalos) queremos hacer, entre 5 y 10. (en este ejemplo hacemos 5 clases).
Hallar el ancho de la clase, dividiendo el recorrido entre el número de clases = 24´3 / 5 = 4,86, redondeando
siempre por exceso al entero más próximo. Ancho de clase = 5.
Tomamos como extremo izquierdo de la 1ª clase el valor más pequeño de la variable, consideraremos cada
clase cerrada por un extremo izquierdo y abierta por el extremo derecho.
Determinamos la marca de clase (representante de cada clase), tomando el valor intermedio de cada una.
Calcularemos la frecuencia absoluta de cada clase contando cuantos datos hay en cada una de ellas.
Aplicación al ejemplo dado:
Frecuencias
Clases Marcas = xi ni fi Ni Fi %
[20, 25) 22´5 2 0,07 2 0,07 7
[25, 30) 27´5 7 0,23 9 0,30 23
[30, 35) 32,5 5 0,17 14 0,47 17
[35, 40) 37,5 9 0,30 23 0,77 30
[40, 45] 42,5 7 0,23 30 1,00 23
30 1 100
7. Tipos de gráficos (I)
Resultados al lanzar un dado Resultado al lanzar un dado
25 18% 15%
Porcentaje obtenido
20
15 18%
16%
10
5
0 13% 20%
1 2 3 4 5 6
valores obtenidos 1 2 3 4 5 6
Gráfico de barras Diagrama de sectores
Temperaturas en una semana Temperaturas en una semana
30 30
25 25
Temperatura
Temperatura
20 20
15 15
10 10
5 5
0 0
Lun. mar. Miér. Jue. Vier. Sáb. Dom. Lun. mar. Miér. Jue. Vier. Sáb. Dom.
Máximas Mínimas
Diagramas evolutivo Diagrama comparativo
8. Tipos de gráficos (II)
Pictograma Histograma
Cartograma Pirámide de Población
9. Ejercicios
1.- El número de alumnos por clase el 15 aulas de un Instituto vienen dados por los siguientes datos:
20, 18, 25, 24, 25, 20, 18, 22, 24, 22, 22, 24, 18, 22, 20.
a) Indica de que tipo es la variable..
b) Ordénalos y construye la tabla de frecuencias.
c) Dibuja un diagrama de barras y un diagrama de sectores.
d) Calcula las medidas de centralización y dispersión correspondientes.
2.- Anotados los colores de 20 coches que circulan por una calle, hemos obtenido los siguientes:
B, N, A, B, N, V, A, N, B, A, N, V, B, N, N, R, R, B, R, V.
Siendo las letras los siguientes colores (B=Blanco; R=Rojo; A=Azul; V=Verde; N= Negro)
a) Indica de que tipo es la variable.
b) Construye la tabla de frecuencias (sin las acumuladas)
c) Dibuja un diagrama de barras y un diagrama de sectores.
d) Calcula la moda.
3.- El peso, en gramos, de 40 huevos de una caja son los siguientes:
50´5, 53´2, 51, 58´7, 55´6, 62, 60´5, 69´8, 65, 54´3, 58, 59´6, 61, 67, 68´7, 54, 57´6, 61, 66, 63,
68, 59´6, 61, 60´7, 66, 57´2, 63, 57´5, 51, 66´8, 55´7, 59´8, 62, 52, 64´3, 67, 54´5, 55, 62´6, 66
a) Indica de que tipo es la variable.
b) Ordénalos y calcula el recorrido.
c) Construye las clases e indica las marcas de clase.
d) Construye la tabla de frecuencias con las marcas de clase.
c) Dibuja un histograma o diagrama de rectángulos..
d) Calcula las medidas de centralización y dispersión correspondientes.
10. Medidas de centralización
Las medidas de centralización son:
Media.- Es el cociente entre la suma de todos los datos y el número de ellos. Se
_
representa por x .
Formula: x = x1 ∗ n1 + x 2 ∗ n2 + ...... + x p ∗ n p
_
N
Mediana.- Es el valor de la variable que ocupa el lugar central, cuando los datos
_ están ordenados. Se representa por Me.
x
Para calcular la mediana se divide el total de datos (N) entre 2, se mira en la
frecuencia absoluta acumulada (Ni) el primer valor igual o mayor que encontremos,
el valor xi correspondiente es la mediana.
Moda.- Es el valor de la variable que más se repite. Se representa por Mo.
Ejemplo: Las edades de 11 personas son: 6, 9, 5, 15, 7, 6, 9, 9, 7, 7, 9.
_
5 *1 + 6 * 2 + 7 * 3 + 9 * 4 + 15 *1 89
Media: x= = = 8´1
11 11
Mediana: Ordenamos los datos: 5, 6, 6, 7, 7, 7, 9, 9, 9, 9, 15. El que ocupa el lugar
central es el 7. Me=7
Si hay dos que ocupan el lugar central se halla su media.
Moda: El que más se repite es el 9: Mo=9
11. Medidas de dispersión
Recorrido.- Es la diferencia entre el valor mayor de la variable y el valor
más pequeño. Se representa por R.
Fórmula:
R= xM - xm
Desviación media.- Es la media aritmética de las desviaciones, en valor
absoluto, respecto de la media. Se representa por: D M
_ _ _
x1 − x * n1 + x2 − x * n2 + ...... + x p − x * n p
Fórmula DM =
N
Varianza.- Es la media aritmética de los cuadrados de las desviaciones al
cuadrado respecto de la media. Se representa por: σ2
_ _ _
( x1 − x) * n1 + ( x 2 − x) * n2 + ....... + ( x p − x) 2 * n p
2 2
Fórmula: σ =
2
N
Desviación típica.- Es la raíz cuadrada positiva de la varianza. Se
representa por: σ
Fórmula: σ = σ 2
12. Cálculo de las medidas de centralización y dispersión
Ejemplo. Consideremos las notas de los exámenes de 40 alumnos dados por
las dos primeras columnas de la siguiente tabla: xi = nota. ni = frecuencia
Tabla de frecuencias Cálculos
xi ni fi Ni Fi % xi*ni |xi-x| |xi-x|*ni (xi-x)2*ni
2 2 0,05 2 0,05 5 4 3 6 18
3 5 0,13 7 0,18 13 15 2 10 20
4 6 0,15 13 0,33 15 24 1 6 6
5 10 0,25 23 0,58 25 50 0 0 0
6 12 0,30 35 0,88 30 72 1 12 12
7 5 0,13 40 1,00 13 35 2 10 20
N= 40 1 100 200 44 76
200 / 40
Moda = 6
Mediana = 5 44 / 40
Media = 5
Desviación media = 1,10 76 / 40
Varianza = 1,90
Desviación típica = 1,38