1. ESTADÍSTICA MATEMÁTICA
Juan Carlos Ballabriga
Departamento de Matemáticas
IES Benjamín de Tudela
2. Estadística para qué
• Un sondeo de opinión
• El control de calidad de un artículo
• Un estudio para conocer la efectividad de un
medicamento
• Calcular la composición futura de una
población…
.... esto es estadística
3. Tipos de Estadística
• La Estadística descriptiva:
– Trata del recuento, ordenación y clasificación de los
datos obtenidos de las observaciones:
• Construcción de tablas, gráficos y cálculo de parámetros.
• La Estadística inferencial:
– Utiliza los resultados de la estadística descriptiva y se
apoya en el cálculo de probabilidades para la obtención
de conclusiones sobre una población a partir de los
resultados obtenidos de una muestra.
5. Nociones básicas
Población: Conjunto de elementos que se quiere estudiar.
• Votantes de una ciudad, comunidad, país
• Televisores fabricados en una fábrica.
•Alumnos de primero de bachillerato…
Muestra: Cualquier subconjunto de una población. El número de
elementos de una muestra se llama tamaño.
6. Población No representativa
muestra
Con sesgo
Representativa Sin sesgo
7. Tipos de muestreo
Probabilístico: sabemos la probabilidad de que un
individuo sea elegido en la muestra
Muestreo aleatorio simple (m.a.s.): Todos tienen las mismas
posibilidades de ser elegidos
Muestreo aleatorio estratificado: Se divide la población en
estratos y se hace un m.a.s. en cada uno
Muestreo sistemático: Se selecciona el primer individuo al azar
y los siguientes estableciendo una pauta
Muestreo no probabilístico: no se sabe la probabilidad
de que un individuo sea elegido
8. Variable estadística: Cada uno de los rasgos o características que
se quiere estudiar de los elementos de la población, susceptible o no
de medida.
Ejemplos:
• Color del pelo: negro, castaño, rubio o pelirrojo
• Sexo: hombre o mujer
• Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5
• Alturas de alumnos:178, 169, 172, 183, …
•Nº de suspensos en determinada asignatura: 0, 1, 2, 3,…
•Gastos en vacaciones de una familia: 1000€,1500€,..
9. Variables cualitativas y cuantitativas
Población: Alumnos de bachillerato de una localidad determinada
•Sexo
Cualitativas •Modelo de zapatillas deportivas
•Barrio de la localidad en que vive
(modalidad) •Deporte preferido
•Número de hermanos
•Núm.de suspensos en la 1ª evaluación
Variables Discretas •Núm de libros leídos trimestralmente
(Recuentos) •Num. de llamadas telefónicas diarias
Cuantitativas
(números) •Tiempo diario delante del televisor
•Tiempo de estudio
Continuas
•Altura
(Cualquier •Peso
cantidad en •Tiempo empleado en llamadas
un intervalo)
10. Frecuencias
Frecuencia absoluta: Nº de veces que aparece un
determinado valor de la variable fi
Si sumamos todas las frecuencias obtenemos el º de datos
N f1 f 2 f 3 f r
Frecuencia relativa: fi
ni
N
Frecuencia absoluta acumulada: Acumula las
frecuencias absolutas hasta determinado valor de la
variable, Fi
Frecuencia relativa acumulada: Acumula las
frecuencias relativas hasta determinado valor de la
variable Ni
11. Tabla de frecuencias
Población : Alumnos de
Bachillerato
Variable: Preferencias musicales Tipo: Cualitativa
Tamaño de la muestra 120
fi Fi ni Ni
Clásica 1 1 0,00833333 0,00833333
Rock 36 37 0,3 0,30833333
Pop 49 86 0,40833333 0,71666667
Jazz 4 90 0,03333333 0,75
Flamenco 2 92 0,01666667 0,76666667
Techno 28 120 0,23333333 1
N 120
12. Variables cualitativas: Representación gráfica
50
45 1
40
35 Clásica
30 2 28 36 Rock
25 Pop
20 4 Jazz
15 Flamenco
10 49 Techno
5
0
Clásica Rock Pop Jazz Flamenco Techno
Diagrama de Barras Diagrama de Sectores
13. Variable discreta
Ejemplo: Un profesor tiene anotadas en su cuaderno las
notas de 30 alumnos de un clase:
5 3 4 1 2 8 9
8 7 6 6 7 9 8
7 7 1 0 1 5 9
9 8 0 8 8 8 9
5 7
Lo primero que tenemos que hacer es contar los datos
19. Parámetros estadísticos
Centralización:
Media aritmética: La suma de todos los valores dividido por el
número de datos
X
Moda: Valor que más se repite. Si hay más de una, se llama
bimodal, trimodal,…
Mo
Mediana: La mediana de una colección de datos ordenados de
menor a mayor es el valor que está en medio, es decir que la mitad
de los datos son mayores que él y la otra mitad son menores que
él, si hay un número impar de datos; si el número de datos es par, la
mediana es la media aritmética entre los dos valores centrales.
Me
20. Cálculo de parámetros
La media aritmética cuando tenemos la tabla de frecuencias
se calcula así
x x x3 xN x1 f1 x2 f 2 xr f r
X 1 2
x f
i i
N f1 f 2 xr f i
xi fi x i* f i Fi
0 2 0 2
1 3 3 5
2 1 2 6
3 1 3 7
4 1 4 8
5 3 15 11
6 2 12 13
7 5 35 18
8 7 56 25
9 5 45 30
30 175
Media 5,83
21. La moda y mediana
La moda por simple observación: Mo = 8
xi fi x i* f i Fi
0 2 0 2
1
2
3
1
3
2
5
6
La mediana: Es el valor que
3 1 3 7
4 1 4 8 ocupa el sitio “central”. Se puede
5 3 15 11
6 2 12 13 plantear de la siguiente manera
7 5 35 18
8 7 56 25
9 5 45 30 Si N impar Me x N 1
30 175
2
xN xN
1
Si N par Me 2 2
2
N
N 30 como es par 15 buscamoslos valores que ocupen
2
N N
las posiciones 15 y 16, es decir Me 7
2 2
22. Dispersión
Rango: Diferencia entre el mayor y el menor valor de la
variable
Rango: V max V min
Desviación Media D.M. D.M .
x X f
i i
f
x X
2 i
fi
Varianza: 2
i
f i
Desviación típica:
23. Dispersión
Coeficiente de variación:
C.V .
Sin unidades X
No depende de la variable
Permite comparar poblaciones y variables distintas
Ejemplo 1 Ejemplo 2
Desv. Coeficiente
Media Típica variación
Clase A Clase B
Variable Notas 7 2 0,28571429
Nota media 7,4 6,5
Desv. Típica 2,8 2,5 Variable Ingresos 1500 145 0,09666667
25. Los gráficos
DIAGRAMA DE BARRAS Y
POLÍGONO DE FRECUENCIAS DIAGRAMA Y POLÍGONO DE FRECUENCIAS
8 ACUMULADO
35
7
30
6
25
5
20
4
15
3
10
2
5
1
0
0 0 1 2 3 4 5 6 7 8 9
0 1 2 3 4 5 6 7 8 9
Valores de la variable
Valores de la variable
26. Variable continua: Agrupación de datos
Si la variable es continua, o discreta con un número de datos muy grande, es aconsejable
agrupar los datos en CLASES.
¿Cuál es el número idóneo de clases?
El número clases debe ser aproximadamente igual a la raíz cuadrada positiva del número de
datos.
¿Cómo escoger las clases?
Es aconsejable que los límites de clase (tanto el superior como el inferior) sean números
“redondos”, como múltiplos de 5, 10, …
Se debe procurar que todas las clases tengan la misma amplitud o tamaño.
Los intervalos se deben construir de modo que el límite superior de una clase coincida con el
límite inferior de la siguiente.
Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la
derecha.
27. Variable continua
Ejemplo
Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados de una
fábrica, obteniéndose las resultados:
Puntuaciones Núm. de trabajadores
[38-44) 7
[44-50) 8
[50-56) 15
[56-62) 25
[62-68) 18
[68-74) 9
[74-80) 6
29. Gráficos: Histograma
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
30
25
20
15
10
5
0
[38,44) [44,50) [50,56) [56,62) [62,68) [68,74) [74,80)
Valores de la variable
30. HISTOGRAMA Y POLÍGONO DE FRECUENCIAS ACUMULADO
100
90
80
70
60
50
40
30
20
10
0
[38,44) [44,50) [50,56) [56,62) [62,68) [68,74) [74,80)
Valores de la variable
31. Parámetros en variable continua
Cuando estamos trabajando con variable continua algunas de las fórmulas
utilizadas se deben “ajustar” para que sean más fiables
f i f i 1
Mo Li 1 ai
Moda f i f i 1 f i f i 1
N
Fi 1
Mediana Me Li 1 2 ai
fi
rN
Fi 1
Percentiles Pr Li 1 100 ai
fi
32.
33. Del anterior test sobre satisfacción en el trabajo a 88 empleados de una fábrica,
cuyos resultados son:
Puntuaciones Núm. de trabajadores
[38-44) 7
[44-50) 8
[50-56) 15
[56-62) 25
[62-68) 18
[68-74) 9
[74-80) 6
Calcular: a) El cuartil primero.
b) Los percentiles de orden 40 y 90
34. Q1 deja la cuarta parte de la distribución a su izquierda :N/4=22
Clases fi Fi
[38-44) 7 7
[44-50) 8 15 <22
[50-56) 15 30 >22 Clase del primer
[56-62) 25 55 cuartil: [50-56)
[62-68) 18 73
[68-74) 9 82
[74-80) 6 88
Aplicando la fórmula:
Li-1 = 50
ai = 6 22 15
N/4 = 22
Q1 50 6 52.8
15
Fi-1 = 15
fi = 15
35. P40 deja el 40% de los datos a su izquierda :88.40/100=35.2
Clases fi Fi
[38-44) 7 7
[44-50) 8 15
[50-56) 15 30 < 35.2
[56-62) 25 55 > 35.2 Clase de P40:
[62-68) 18 73 [56-62)
[68-74) 9 82
[74-80) 6 88
Aplicando la fórmula:
Li-1 = 56
ai = 6 35.2 30
40.N/100 = 35.2 P40 56 6 57.25
Fi-1 = 30 25
fi = 25
36. P90 deja el 90% de los datos a su izquierda :88.90/100=79.2
Clases fi Fi Clase de P90:
[38-44) 7 7 [68-74)
[44-50) 8 15
9 6.2
[50-56) 15 30
6 x
[56-62) 25 55
[62-68) 18 73 < 79.2 9
[68-74) 9 82 > 79.2 6.2
[74-80) 6 88
x
Aplicando la fórmula:
68 6 74
Li-1 = 68
ai = 6
79.2 73
90.N/100 = 79.2 P90 68 6 72.13
Fi-1 = 73 9
fi = 9