2. Medidas de tendencia central
Definición: valor que se encuentra en el
centro o a la mitad de un conjunto de datos.
Nos proporcionan una idea de en torno a qué
valor (centro) se distribuyen los datos en
función de sus frecuencias.
Entre las medidas de tendencia central
estudiaremos la moda, la mediana y la media
aritmética.
3. Moda
Denominamos moda de un conjunto de datos al valor
que ocurre con mayor frecuencia.
Algunas observaciones:
Cuando dos valores ocurren con la misma frecuencia y
ésta es la más alta, ambos valores son modas, por lo
que el conjunto de datos es bimodal.
Cuando más de dos valores ocurren con la misma
frecuencia y ésta es la más alta, todos los valores son
modas, por lo que el conjunto de datos es multimodal.
Cuando ningún valor se repite, se dice que no hay
moda.
Cuando los datos viene agrupados en intervalos, en
lugar de moda, hablamos de intervalo modal.
4. Mediana
• Llamamos mediana de un conjunto de datos al valor que
está en medio de los valores originales de los datos, luego
de ordenarlos en forma creciente (o decreciente).
• Si el número de datos es par, se calcula promediando los
dos datos centrales.
• En el caso de distribuciones con datos agrupados, se puede
obtener la mediana observando las frecuencias
acumuladas.
• Ejemplo: Las edades de un grupo de amigos son:
17, 19, 18, 20, 19 y 17.
Ordenamos los datos: 17, 17, 18, 19, 19, 20.
Como el número de datos es par, promediamos:
(18+19):2=18,5.
5. Media aritmética
Llamamos media aritmética de un conjunto de puntajes
al valor que se obtiene sumando dichos puntajes y
dividendo el resultado entre el número de puntajes. Es lo
que normalmente llamamos “promedio”. La
denotaremos .
Para calcular la media en distribuciones con datos
agrupados, multiplicamos cada puntaje por su frecuencia
y luego sumamos estos productos. Finalmente dividimos
el resultado obtenido entre la suma de las frecuencias.
Para calcular la media en distribuciones con datos
agrupados en intervalos asignamos a cada intervalo su
valor central (marca de clase). Por ejemplo, si el
intervalo tiene extremos 140 y 145, la marca de clase
sería el resultado de (140+145):2.
6. Ejemplo con datos agrupados:
Se considera el número de integrantes del núcleo familiar de 40
personas:
Vamos a hallar la media, la moda y la mediana. Para ello
elaboraremos la siguiente tabla:
N° de
integrantes
Frecuencia
1 4
2 20
3 9
4 6
5 0
6 1
7. N° personas Frecuencia Frecuencia
acumulada
1 4 4 4
2 20 24 40
3 9 33 27
4 6 39 24
5 0 39 0
6 1 40 6
40 101
• La moda es 2, ya que es el valor con mayor frecuencia.
• La media se obtiene con la fórmula:
En este caso:
• Para hallar la mediana, como tenemos 40 datos tendríamos que buscar en la
columna el valor mayor a 20, que es 24 y corresponde a 2. Por lo tanto M=2.
8. Medidas de dispersión
• Nos indican cómo se alejan los datos respecto de la media
aritmética.
• El rango (llamado también recorrido) de un conjunto de
datos es la diferencia entre el valor máximo y el valor
mínimo.
• La desviación estándar de una muestra (llamada también
desviación típica) nos proporciona información acerca de la
dispersión de los datos respecto del valor de la media.
• Cuanto mayor es la desviación estándar, más dispersos
están los datos con respecto a la media.
• Se calcula con la fórmula .
A continuación mostraremos el procedimiento para
calcular la desviación estándar.
9. Procedimiento para el cálculo de la
desviación estándar:
1. Calcular la media .
2. Restar la media de cada valor individual obteniendo una lista de
desviaciones de la forma .
3. Elevar al cuadrado los valores anteriores:
4. Sumar los valores del paso 3. Obtenemos .
5. Dividir el resultado obtenido en el paso anterior entre el número
total de valores menos 1, es decir .
6. Calculamos la raíz cuadrada del resultado anterior y obtenemos
así
Observación:
El valor obtenido en el paso 5 se llama varianza.
10. Ejemplo:
Se considera el conjunto de datos: 5, 7, 4, 5
Paso 1:
Pasos 2-3:
Paso 4:
Paso 5:
Paso 6:
11. Coeficiente de variación
• El coeficiente de variación (CV) de un
conjunto de datos muestrales, describe la
desviación estándar relativa a la media. Se
calcula con la fórmula:
12. Sesgo
• Una distribución de datos se dice que es simétrica si hay
una simetría axial entre las mitades izquierda y derecha del
histograma. En este caso coinciden la moda, la media y la
mediana.
• Una distribución de datos está sesgada si no es simétrica.
• Las posiciones de la media, la moda y la mediana pueden
proporcionarnos información acerca del sesgo de una
distribución.
13. Desviación estándar en una distribución “aproximadamente
normal”:
• Aproximadamente el 68% de
los datos están dentro de
una desviación estándar de
la media.
• Aproximadamente el 95% de
todos los valores están
dentro de dos desviaciones
estándar de la media.
• Aproximadamente el 99,7%
de los valores están dentro
de tres desviaciones
estándar de la media.
Esta regla es denominada con frecuencia “regla empírica”.
14. Trabajando con GeoGebra
• Volvamos al ejemplo de los integrantes del
núcleo familiar:
• Vamos a graficar y hallar la media, la mediana y la
desviación estándar empleando GeoGebra.
N° de
integrantes
Frecuencia
1 4
2 20
3 9
4 6
5 0
6 1
15. • Abre la “Hoja de cálculo” e inserta los datos de la tabla:
• Selecciona una columna y el ícono “Análisis una variable” y luego elige
“Datos con frecuencias”
16. • Va a aparecer una nueva columna en la que vas a insertar las frecuencias.
Para ello selecciona la columna en la tabla y luego presiona la “manito”
para cargar dicha columna.
• Después presiona “Analiza” y obtendrás el gráfico.
17. • Ahora selecciona “Muestra estadísticas”
• Puedes cambiar el tipo de gráfico.
• Para trabajar con datos no agrupados, procede del mismo modo,
usando solo la columna de los datos. También se puede trabajar
con datos agrupados en intervalos.