Clasificaciones, modalidades y tendencias de investigación educativa.
Medidas de Tendencia Central
1. MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y
DE DISPERSIÓN
Profesor:
Pedro Beltrán
Alumna:
Matiguán Rosalba
C.I. 1733145
República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación Superior
Instituto Universitario Politécnico Santiago Mariño
Materia: Estadistica I
Carrera: Ingeniería de Sistemas (47)
Sección “XV”
2. Concepto e importancia de las
medidas de tendencia central
Las medidas de tendencia central son medidas
estadísticas que pretenden resumir en un solo valor a
un conjunto de valores. Representan un centro en
torno al cual se encuentra ubicado el conjunto de los
datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda.
3. Concepto e importancia de las
medidas de tendencia central
Media aritmética o promedio aritmético:
La media aritmética, o brevemente la media, de un conjunto de n
números 𝑋1, 𝑋2, 𝑋3, … , 𝑋 𝑛 que se denota así: 𝑋 (se lee “X barra”)
y está definida como:
𝑋 =
𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋 𝑛
𝑛
=
𝑗=1
𝑛
𝑋𝑗
𝑛
Aunque es un valor fácil de calcular, debemos tener en cuenta
que si hay valores extremos o aberrantes (outliers), la media no
será una medida representativa del centro de
la distribución de datos
4. Concepto e importancia de las
medidas de tendencia central
Ejemplo:
La media aritmética de los números 8, 3, 5, 12 y 10 es:
𝑋 =
8 + 3 + 5 + 12 + 10
5
=
38
5
= 7,6
5. Concepto e importancia de las
medidas de tendencia central
Mediana:
La mediana es el valor que se encuentra exactamente a la mitad
de un conjunto de datos previamente ordenados. Se consideran
dos casos:
• Si el número de datos (n) es impar, la mediana es el valor de
en medio.
• Si el número de datos (n) es par, la mediana es el promedio
de las dos observaciones de en medio.
Al contrario de la media, a la mediana no la afectan valores
extremos o aberrantes, ya que sólo considera la posición del valor
central.
6. Concepto e importancia de las
medidas de tendencia central
Ejemplos:
La mediana es el valor que se encuentra exactamente a la mitad de
un conjunto de datos previamente ordenados. Se consideran dos
casos:
• La mediana del conjunto de números 3, 4, 5, 6, 8, 8, 8 es 6.
• La mediana del conjunto de números 5, 5, 7, 9, 11, 12, 15, 18 es :
(9+11)
2
= 10.
7. Concepto e importancia de las
medidas de tendencia central
Moda:
La moda de un conjunto de números es el valor que se presenta
con más frecuencia; es decir, es el valor más frecuente. Puede no
haber moda con lo cual se dice que la distribución de datos es
amodal. Cuando existe si existen dos modas es bimodal, si hay
más de dos modas, se denomina multimodal. La distribución que
sólo tiene una moda se le llama unimodal.
8. Concepto e importancia de las
medidas de tendencia central
Moda:
• La moda del conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12 y 18 es 9
y es unimodal.
• El conjunto 3, 5, 8, 10, 12, 15 y 16 no tiene moda, por lo tanto
es amodal o uniforme.
• El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7 y 9 tiene dos modas, 4 y 7,
por lo que se le llama bimodal.
9. Concepto e importancia de las
medidas de tendencia central
Sesgo o Asimetría:
El sesgo describe cómo es la distribución de los datos, ya que
indica hacia dónde tienden a concentrarse éstos. Una distribución
puede ser:
• Simétrica, si la mayor concentración de datos se localiza en el
centro de la distribución.
• Sesgada a la izquierda o asimetría negativa si la mayoría de los
datos están concentrados a la derecha.
• Sesgada a la derecha o asimetría positiva si la mayor
concentración de datos está a la izquierda de la distribución.
10. Concepto e importancia de las
medidas de tendencia central
Sesgo izquierdo
(Simetría negativa)
Simétrica Sesgo derecho
(Simetría positiva)
11. Tipos de promedios:
matemáticos y estadísticos
En matemática, "promedio" se refiere a un cálculo
específico, mientras que "media" puede ser sinónimo
de "promedio" o referirse a un tipo de cálculo
totalmente distinto.
Para entender la diferencia entre la media y el
promedio, se debe que entender cómo se calcula la
media en estadística.
12. Tipos de promedios:
matemáticos y estadísticos
En estadística, una distribución es el conjunto de todos los
valores posibles para los términos que representan eventos
definidos. Las distribuciones se componen de las variables.
• Una variable aleatoria discreta es al azar porque el
resultado no se conoce de antemano y discreta ya que el
valor es preciso y aislado. Ej: resultados de pruebas.
• Una variable aleatoria continua se diferencia de una
variable aleatoria discreta en que el valor de la primera
puede caer en cualquier lugar dentro de un intervalo o
período ininterrumpido y sin límites. Ej: temperatura.
13. Tipos de promedios:
matemáticos y estadísticos
Media de variables aleatorias discretas
La media estadística de una distribución de variables aleatorias
discretas es la suma todos los valores y divide el resultado por el
número de valores de la distribución. Este valor es el promedio
matemático de todos los términos en la distribución.
Media de variables aleatorias continuas
La mayor diferencia entre la media y el promedio. La media de una
distribución de variables aleatorias continuas se obtiene integrando
el producto de la variable con su probabilidad como se define por la
distribución, una diferencia significativa con la búsqueda de la media
de una distribución de variables aleatorias discretas, que no
requiere factor de probabilidad. También se llama "valor esperado".
14. Tipos de promedios:
matemáticos y estadísticos
Media geométrica
Una media matemática aparte de la media aritmética es la "media
geométrica“ o G, que es la raíz n-ésima del producto de los números
del conjunto. En caso de raíces pares, el producto no deber ser
menor que cero. Y si da cero, no es concluyente.
𝐺 = 𝒏
𝑋1 𝑋2 𝑋3 … 𝑋 𝑛
Media armónica
Otra media matemática es la "media armónica“ H, que se obtiene de
manera similar que la aritmética siendo la principal diferencia que el
cálculo es invertido:
𝐻 =
𝑛
1
𝑋1
+
1
𝑋2
+
1
𝑋3
+ ⋯ +
1
𝑋 𝑛
15. Cálculo y aplicación de la media
aritmética, promedio geométrico,
la moda y la mediana
Ejemplo:
Se tienen trece alumnos que tardaron en graduarse de
TSU, respectivamente, los años que aparecen en la
lista siguiente ordenados de menor a mayor:
3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 7, 20, 30
Calcular la media, mediana y moda y analizar qué
representa cada una de éstas en el caso dado.
16. Cálculo y aplicación de la media
aritmética, promedio geométrico,
la moda y la mediana
Para calcular la media, se suman todos los datos y se
divide entre el número de estos:
𝑋 = (3+3+3+3+3+3+4+4+4+4+7+20+30)/13 = 7
A primer vista, se podría interpretar que el promedio
de tiempo de estudio de los estudiantes es de siete
años pero en este caso la media sola no representa la
tendencia general de los datos.
17. Cálculo y aplicación de la media
aritmética, promedio geométrico,
la moda y la mediana
Para la mediana, al ser una cantidad de datos impares,
la mediana es el que queda en la mitad:
3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 7, 20, 30
En este caso la mediana es 4.
Siguiendo con la moda, se nota que la moda es 3 por
ser el valor que más se repite.
La mediana y la moda son valores más representativos
de la muestra. Al menos 50% de los estudiantes
terminaron sus estudios en 4 años o menos.
18. Cálculo y aplicación de la media
aritmética, promedio geométrico,
la moda y la mediana
La media (promedio) geométrica indica la tendencia
central de una distribución utilizando el producto de
sus valores en vez de la suma. Siempre es menor que
la media aritmética.
Supóngase que alguien invierte un capital por cinco
años y sus ganancias cada año fueron 90%, 10%, 20%,
30% , -90% respectivamente, cuál sería la ganancia
promedio durante ese periodo.
19. Cálculo y aplicación de la media
aritmética, promedio geométrico,
la moda y la mediana
primero se añade uno a cada porcentaje para evitar
cálculos con porcentajes negativos y al resultado se le
resta uno:
Calculando la media aritmética se tiene:
𝑋 = (1,9+1,1+1,2+1,3+0,1)/5 =
1,12 – 1 = 0,12 = 12%
Utilizando la media geométrica se tiene:
𝐺 =
5
1,9∗1,1∗1,2∗1,3∗0,1 =
0,799 − 1 = −0,2008 = −20,08%
20. Cálculo y aplicación de la media
aritmética, promedio geométrico,
la moda y la mediana
Estos resultados son muy distintos entre sí, pero en
este caso el valor de la media geométrica es el real.
Las ganancias de las inversiones no son
independientes entre sí, ya que si por ejemplo se
pierde el 100% del capital no es posible percibir
ganancias en un año. Por esta razón la media
geométrica es más precisa que la aritmética en este
tipo de casos.
21. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Es importante también analizar cuán cercanos o
lejanos están los datos respecto, por ejemplo, al valor
medio. Para determinar esto se recurre a las llamadas
medidas de dispersión o de variabilidad; de ellas, las
medidas más importantes son el rango, la varianza
y la desviación estándar.
De esta manera, si dos grupos de datos tienen el
mismo centro, este centro es más descriptivo para el
grupo que presente menor variabilidad.
22. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Rango
El rango, a veces también denominado recorrido, es la medida de
dispersión más fácil de determinar, ya que sólo depende de dos valores.
Se calcula de esta manera:
R = 𝑋 𝑚𝑎𝑥 − 𝑋 𝑚𝑖𝑛
• R es el rango o recorrido.
• X máx es el valor máximo del arreglo ordenado.
• X mín es el valor mínimo del arreglo ordenado.
Algunas desventajas que presenta el rango son:
• Ignora la distribución de los datos, es decir, no considera si es
unimodal o multimodal, o cuál es el sesgo.
• Los valores aberrantes influyen en el valor del rango.
23. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Varianza
La varianza es la medida de dispersión más importante, pues muestra cuán
alejados o cuán cercanos están los datos respecto a la media. Si un dato
está cerca de la media al elevar esa distancia al cuadrado se hará más
pequeña y si está lejos, la distancia al cuadrado entre ese dato y la media se
hará mayor. De esta manera se hace más evidente si una distribución tiene
una dispersión alta o baja. La varianza poblacional es:
𝜎2
=
𝑖=1
𝑛
(𝑋𝑖 − 𝜇)2
𝑁
donde:
𝜎2
es la varianza poblacional.
𝑋𝑖 es el valor i es el conjunto de datos.
𝜇 es la media poblacional.
𝑁 es el tamaño de la población
24. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Varianza
Para la muestra la varianza se calcula así:
𝑠2
=
𝑖=1
𝑛
(𝑋𝑖 − 𝑋)2
𝑛 − 1
donde:
𝑠2 es la varianza muestral.
𝑋𝑖 es el valor i es el conjunto de datos.
𝑋es la media muestral.
𝑛 es el tamaño de la muestra
25. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Desviación Estándar
La desviación estándar es la medida de dispersión más utilizada, ya que el
resultado se expresa en las mismas unidades que los datos originales. La
desviación estándar es la raíz cuadrada de la varianza.
Para calcular la desviación estándar de la población se utiliza:.
𝜎 = 𝑖=1
𝑛
(𝑋𝑖 − 𝜇)2
𝑁
=
donde:
σ es la desviación estándar.
𝑋𝑖 es el valor i es el conjunto de datos.
𝜇 es la media poblacional.
𝑁 es el tamaño de la población
26. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Desviación Estándar
En el caso de una muestra se usa:
𝑠 = 𝑖=1
𝑛 (𝑋𝑖 − 𝑋)2
𝑛 − 1
=
donde:
𝑠 es la desviación estándar muestral.
𝑋𝑖 es el valor i es el conjunto de datos.
𝑋es la media muestral.
𝑛 es el tamaño de la muestra
27. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Ejemplo:
Se entrevistó a 20 jóvenes para conocer qué cantidad (en litros) de
refresco de cola beben al día. Los resultados son éstos:
0.33, 1.65, 0.99, 1.32, 1.32, 0, 1.65, 0.33, 1.65, 0.66, 0.99, 0.66, 1.65,
0.33, 0.33, 1.32, 0.99, 0.66, 0.66, 0.
Describir la distribución de los datos, analizando tanto las medidas
de tendencia central como las de dispersión.
28. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Primero se reordenan los datos:
0 0 0,33 0,33 0,33 0,33 0,66 0,66 0,66 0,66 0,99 0,99 0,99 1,32 1,32
1,32 1,65 1,65 1,65 1,65
Se busca la media:
𝑋 = (0+ 0+ 0,33+ 0,33+ 0,33+ 0,33+ 0,66+ 0,66+ 0,66+ 0,66+ 0,99+
0.99+ 0,99+ 1,32+ 1,32+1,32+ 1,65+ 1,65+ 1,65+ 1,65)/20 = 0,8745
La mediana se determina de esta forma por ser el número de datos par:
mediana= (0,66+ 0,99)/2 = 0,825
La modas son: 0,33 0,66 1,65 con cuatro ocurrencias c/u así que es una
distribución multimodal
29. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
El rango e calcula de esta forma:
R = 𝑋 𝑚𝑎𝑥 − 𝑋 𝑚𝑖𝑛
Donde el máximo es 1,65 y el mínimo 0
R = 1,65 − 0 = 1,65
0 0 0,33 0,33 0,33 0,33 0,66 0,66 0,66 0,66 0,99 0,99 0,99 1,32 1,32
1,32 1,65 1,65 1,65 1,65
Se calcula la varianza muestral:
𝑠2 =
𝑉
20−1
donde
V = 2(0 − 0,8745)2 +4(0,33 − 0,8745)2 +4(0,66 − 0,8745)2
+3(0,99 − 0,8745)2 +3 (1,32 − 0,8745)2 +4(1,65 − 0,8745)2
30. Cálculo a partir de series simples
y agrupadas de las medidas de
dispersión
Luego de calcular, se tiene
V = 5,9404
Entonces se sustituye en la fórmula:
𝑠2 =
5,9404
19
= 0,3126
Finalmente, la desviación estándar muestral es la raíz cuadrada de la varianza:
𝑠 = 0,3126 = 0,5591
En conclusión:
• La cantidad media de refresco que bebe una persona es 0.8745 litros.
• La mitad de las personas (50%) beben menos (o más) de 0.8250 litros.
• Las cantidades típicas de refresco consumidas son 0.33, 0,66 y 1,65 litros.
• La dispersión del consumo de refresco con respecto a la cantidad media es
de +/ − 0.5591 litros.
• La diferencia entre la persona que más consume refresco y la que menos es
de 1.65 litros.
• La muestra es de 20 personas.
31. Cálculo y aplicación a partir de
series numéricas las medidas de
posición
Las medidas de posición dividen un conjunto de datos en grupos con el
mismo número de individuos. Para calcular las medidas de posición es
necesario que los datos estén ordenados de menor a mayor. La medidas
de posición son cuartiles, deciles, percentiles. A los cuartiles, deciles,
percentiles y otros valores obtenidos dividiendo al conjunto de datos en
partes iguales se les llama en conjunto cuantiles
Cuartiles:
En un conjunto de datos en el que éstos se hallan ordenados de acuerdo
con su magnitud, el valor de en medio (o la media aritmética de los dos
valores de en medio), que divide al conjunto en dos partes iguales, es la
mediana. Continuando con esta idea se puede pensar en aquellos
valores que dividen al conjunto de datos en cuatro partes iguales. Estos
valores, denotados 𝑄1, 𝑄2 y 𝑄3 son el primero, segundo y tercer
cuartiles, respectivamente; el valor 𝑄2 coincide con la mediana.
32. Cálculo y aplicación a partir de
series numéricas las medidas de
posición
Nótese que entre dos cuartiles consecutivos se encuentra un 25% de los
datos. Además, por debajo de 𝑄1, se encuentra un 25% de los datos y
por encima un 75%, mientras por debajo del cuartil 𝑄3 , se encuentra un
75% de los datos y por encima de él existe un 25% de los datos.
33. Cálculo y aplicación a partir de
series numéricas las medidas de
posición
Deciles:
Los Deciles son los valores que dividen a los datos ordenados (de forma
creciente) en diez partes iguales. Existen nueve deciles que se denotarán
por 𝐷1, 𝐷2 , 𝐷3, ... , 𝐷9 . Entre dos deciles consecutivos se encuentra un
10% de los datos. El quinto decil coincide con la mediana.
Percentiles
Los percentiles son aquellos valores que dividen a los datos ordenados
de forma creciente, en cien partes iguales. Existen noventa y nueve
percentiles que se denotan por 𝑃1, 𝑃2 , 𝑃3, ... , 𝑃99. Entre dos percentiles
consecutivos se encuentra el 1% de los datos. Así, por ejemplo, entre los
percentiles 𝑃10 y 𝑃20 se encuentran 10% de los datos.
Para denotar un percentil cualquiera se usa 𝑃ℎ , donde h = 1, 2, 3, ... , 99.
34. Cálculo y aplicación a partir de
series numéricas las medidas de
posición
El percentil 𝑃ℎ de una colección de datos que previamente han sido
ordenados (de forma creciente), es un valor tal que como máximo el h%
de los datos son menores que él, y también como máximo un (100-h)%
de los datos son mayores que él.
Como en el caso de la mediana, si dos valores consecutivos del conjunto
de datos cumplen con la definición anterior, se conviene en tomar como
percentil al promedio de ellos dos.
Ejemplo:
Suponga que los pesos de ocho personas (en Kg) son:
52, 97, 108, 63, 90, 74, 86, 73.
Hallar los percentiles: 𝑃20 , 𝑃50 , 𝑃80 .
35. Cálculo y aplicación a partir de
series numéricas las medidas de
posición
En primer lugar se deben ordenar de forma creciente los datos :
52 63 73 74 86 90 97 108
El 𝑃20 es el valor tal que el 20% de los datos, es decir el 20% de 8 = 1,6
datos como máximo son menores que él, y también como máximo el
80% de 8 = 6,4 datos son mayores que él.
El valor 63 cumple con estas condiciones. Por tanto, 𝑃20 = 63 Kg
Ahora, en el cálculo de 𝑃50 se observa que existen dos valores 74 y 86,
que cumplen con la definición.
De esta manera, 𝑃50 = (74 + 86) / 2 = 80 Kg este valor coincide con la
mediana, el decil 𝐷5 y el cuartil 𝑄2
36. Cálculo y aplicación a partir de
series numéricas las medidas de
posición
52 63 73 74 86 90 97 108
Para estos datos, 𝑃80 tiene como máximo 6,4 datos por debajo de él y a
lo sumo 1,6 datos por encima.
El valor 97 satisface esto, así 𝑃80 = 97 Kg.
Nótese que ni el valor 90 ni 108 cumple con las condiciones. Por
ejemplo, el valor 90 tiene cinco datos por debajo que cumple con lo que
se exige pero por encima tiene a dos datos (el 25% de los datos), lo que
no satisface los requerimientos para ser percentil 80.
37. Videos de youtube:
Medidas de tendencia central │ ejercicios
http://www.youtube.com/watch?v=3cbXctmjdzM
Estadistica - Medidas de Dispersion
http://www.youtube.com/watch?v=dZH-PWhgrY0
Cuartiles, deciles y percentiles Definición e interpretaciones
http://www.youtube.com/watch?v=8XN2ip2TJXU