Este documento presenta la información sobre un proyecto de aula de matemáticas sobre medidas de tendencia central y dispersión. El proyecto es realizado por 7 estudiantes y su profesor, e incluye conceptos como población, variable, muestra, dato, media, mediana, moda, desviación estándar y varianza. Explica cómo calcular estas medidas y cómo representan la tendencia y variabilidad de los datos.
Medidas de tendencia central y dispersión en matemáticas
1. PROYECTO DE AULA.
MATEMÁTICAS.
MEDIDAS DE TENDENCIA CENTRAL Y DE
DISPERSIÓN
• Integrantes:
• Janina Cañizares.
Zumbana.
• Belén Aguirre.
• Juan Díaz.
• José Parra.
• Vladimir Plazarte.
• Elías Ramos.
Profesor:
Ing. Byron
2.
La Estadística es la ciencia que trata de los métodos y procedimientos para
recoger, clasificar, resumir, hallar regularidades y analizar datos, así como de
realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma
de decisiones y en su caso formular predicciones.
Población: es el conjunto de elementos, individuos o entes sujetos a estudio
y de los cuales queremos obtener un resultado.
Variable: es la característica que estamos midiendo.
Existen dos tipos de variables:
Variable cualitativa: Es aquella que expresa un atributo o característica,
ejemplo: Rubio, moreno, etc.
Variable cuantitativa: Es aquella que podemos expresar numéricamente:
edad, peso, etc.
Muestra: Conjunto de elementos que forman parte de población . La muestra
representa a esta población.
Dato: Cada uno de los individuos, cosas, entes abstractos que integran una
población o universo determinado. Dicho de otra forma, cada valor observado
de la variable.
3. Medidas de tendencia central
Medidas de Posición: son aquellos valores numéricos que nos permiten
o bien dar alguna medida de tendencia central, dividiendo el
recorrido de la variable en dos, o bien fragmentar la cantidad de
datos en partes iguales. Las más usuales son la media, la mediana, la
moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser de
dos tipos: de tendencia central o de tipismo.
Medidas de Dispersión: se llaman medidas de dispersión aquellas que
permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentración de los
datos en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas. Las más usuales son el
desvío estándar y la varianza.
4. Dado un conjunto de observaciones
la media se representa mediante
y se obtiene dividiendo la suma de todos los datos
por el número de ellos, es decir:
5. Media aritmética (I)
La media aritmética de un conjunto de datos es el cociente entre la suma
de todos los datos y el número de estos.
Ejemplo: las notas de Juan el año pasado fueron:
5, 6, 4, 7, 8, 4, 6
La nota media de Juan es:
Hay 7 datos
que suman 40
5 + 6 + 4 + 7 + 8 + 4 + 6 40
=
= 5,7
Nota media =
7
7
6. Media aritmética (II)
Cálculo de la media aritmética cuando los datos se repiten.
1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2º. El resultado se divide por el total de datos.
Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia Notas x
absoluta F. absoluta
3
5
15
5
8
40
6
10
60
7
2
14
Total
25
129
Datos por frecuencias
Media =
129
= 5,1
25
Total de datos
7. La mediana, a diferencia de la media no busca el valor central del recorrido de la variable
según la cantidad de observaciones, sino que busca determinar el valor que tiene
aquella observación que divide la cantidad de observaciones en dos mitades iguales.
Por lo tanto es necesario atender a la ordenación de los datos, y debido a ello, este
cálculo depende de la posición relativa de los valores obtenidos. Es necesario, antes
que nada, ordenar los datos de menor a mayor (o viceversa).
en caso que N sea impar
8. La mediana
La mediana de un conjunto de datos es un valor del mismo tal que el número de
datos menores que él es igual al número de datos mayores que él.
Ejemplo:
Los pesos, en kilogramos, de 7 jugadores de un
equipo de fútbol son: 72, 65, 71, 56, 59, 63, 72
1º. Ordenamos los
56, 59, 63, 65, 71, 72, 72
datos:
2º. El dato que queda en el centro es
La mediana vale 65.
65.
Caso:
Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: 63 + 65
= 64
2
9. La moda, es aquel dato, ó valor de la variable
que más se repite; es decir, aquel valor de la
variable (que puede no ser un único valor)
con una frecuencia mayor.
10. La moda
La moda de un conjunto de datos es el dato que más se repite.
Ejemplo.
Una zapatería ha vendido en una semana los zapatos
que se reflejan en la tabla:
Nº de calzado
Nº de personas
38
16
El número de zapato más
vendido, el dato con mayor
frecuencia absoluta, es el 41.
39
21
40
30
41
35
42
29
43
18
44
10
45
7
Lo compran 35 personas
La moda es 41.
11. El desvío estándar
Es posible identificar conjuntos de datos que a pesar de ser muy
distintos en términos de valores absolutos, poseen la misma media.
Una medida diferencial para identificar esos conjuntos de datos es
la concentración o dispersión alrededor de la media.
Una manera de evitar que los distintos signos se compensen es
elevarlas al cuadrado, de manera que todas las desviaciones sean
positivas. La raíz cuadrada del promedio de estas cantidades recibe
el nombre de desvío estándar, o desviación típica y es representada
por la siguiente fórmula:
12. A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a
su media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende
entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la
media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más
“homogéneo” que si el valor de la desviación estándar fuera más grande. O sea que a menor
dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad.
La Varianza
El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La
suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media
aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de
cualquier otro valor que no sea la media aritmética.
Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado.
Precisamente la manera de simbolizarla es.
Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza
13. 8 cms.
Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos
tienen la misma base).
¿Existe alguna variación respecto de su altura entre estos rectángulos?
¿Cuál es el promedio de la altura de estos rectángulos?
8+8+8+8+8+8+8+8+8
9
=
72
=8
9
14. 10 cms
6 cms
8 cms.
El quinto rectángulo y el octavo rectángulo en un acto de rebeldía
cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10
centímetros, y el octavo rectángulo, de color azul, mide 6 centímetros?
¿Cuál es el nuevo promedio de estos 9 rectángulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9
=
72
=8
9
... ¡el mismo promedio! Pero... ¿ha habido variación?
15. 10 cms
6 cms
8 cms.
El rectángulo rojo tiene +2 centímetros sobre el promedio, y el
rectángulo azul tiene –2 centímetros bajo el promedio. Los otros
rectángulos tienen cero diferencia respecto del promedio.
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0+0+0+0+2+0+0–2+0 =0
Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variación.
16. 10 cms
6 cms
8 cms.
Una forma de eliminar los signos menos de aquellas diferencias que
sean negativas, esto es de aquellos mediciones que estén bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectángulos, es decir lo
dividimos por el número de rectángulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 =
9
8
9
= 0,89
17. 10 cms
6 cms
8 cms.
Se dice entonces que la varianza fue de 0,89
Observemos que las unidades involucradas en el cálculo de la varianza
están al cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados.
De manera que se define
0,89 = 0,943
La raíz cuadrada de la varianza se llama desviación estándar
18. 10 cms
6 cms
8 cms.
Que la desviación estándar haya sido de 0,943 significa que en promedio la
altura de los rectángulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centímetros.
Es claro que esta situación es “en promedio”, puesto que sabemos que
los causantes de la variación fueron los rectángulos quinto y octavo.
Esta variación hace repartir la “culpa” a todos los demás rectángulos
que se “portaron bien”.
La desviación estándar mide la dispersión de los datos respecto del
promedio
19. 10 cms
8 cms.
8 cms.8 cms.
8 cms.
8 cms.
7 cms.
6 cms
4 cms
¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?
En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
= 7,44
9
Luego debemos calcular la varianza
20. 10 cms
8 cms.
8 cms.
8 cms.
8 cms.
7 cms.
4 cms
0,56
-3,44
0,56
0,56
2,56
0,56 -0,44
8 cms.
6 cms
-1,44
0,56
7,44
Promedio
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224
=
9
9
Este es el valor de la varianza
= 2,469
21. 10 cms
8 cms.
8 cms.
8 cms.
8 cms.
4 cms
7 cms.
8 cms.
6 cms
7,44
Promedio
Si la varianza fue de 2,469, entonces la desviación estándar es de...
2, 469 = 1,57
Lo que significa que, en promedio, los rectángulos se desviaron más o
menos (más arriba o más abajo) en 1,57 centímetros.
22. Para entender la varianza necesariamente debe saber:
•Sumar
•Restar
•Multiplicar
•Dividir
•Potencia de orden 2
•Raíz cuadrada
Y es claro que esto no es suficiente (salvo que queramos que aprenda de
memoria los cálculos). Necesitamos estimular su imaginación para que
“vea” la variabilidad existente en la naturaleza.
Entregue una lista de fenómenos en que un mismo atributo tenga
variabilidad si se mide este atributo a un número de individuos u objetos.