Este documento explica conceptos estadísticos como la mediana, la moda, la media geométrica y el rango. La mediana parte una distribución en dos partes iguales. La moda es el valor que más se repite. La media geométrica es el promedio de valores positivos multiplicados. El rango mide la diferencia entre el valor máximo y mínimo.
1. CIUDAD UNIVERSITARIA “DR.
JACOBO BUCARAM ORTIZ”
FACULTAD DE CIENCIAS AGRARIAS
LA MEDIANA, LA MODA, LA
MEDIA GEOMÉTRICA, EL
RANGO
LECTIVO:
2022-2023
DOCENTE:
PhD. JOAQUÍN MORÁN BAJAÑA
2. LA MEDIANA
La mediana es un estadístico de
posición central que parte la
distribución en dos, es decir, deja la
misma cantidad de valores a un lado
que a otro.
La mediana, junto con la media y
la varianza es un estadístico muy
ilustrativo de una distribución. Al
contrario que la media que puede
estar desplazada hacia un lado o a
otro, según la distribución, la
mediana siempre se sitúa en el
centro de esta. Dicho sea paso, a la
forma de la distribución se le conoce
como curtosis. Con la curtosis
podemos ver hacia dónde está
desplaza la distribución.
3. ¿QUÉ ES LA MEDIANA?
La mediana es un conjunto, es un
valor que se encuentra a la mitad
de los otros valores, es decir,
que al ordenar los número de
menor a mayor, éste se
encuentra justamente en medio
entre los que están por arriba.
4. ALGUNAS CARACTERÍSTICAS DE LA MEDIANA SON:
Las operaciones para calcular el
valor son muy sencillas de
realizar.
La medida no depende de los
valores de las variables,
solamente de su orden.
Generalmente, los valores son
enteros.
Se puede calcular aunque los
números que se encuentren
arriba y abajo no tengan límites.
5. FÓRMULA DE LA MEDIANA
La fórmula no nos dará el valor
de la mediana, lo que nos dará
es la posición en la que está
dentro del conjunto de datos.
Debemos tener en cuenta, en
este sentido, si el número total
de datos u observaciones que
tenemos (n) es par o impar. De
tal forma que la fórmula de la
mediana es:
Cuando el número de
observaciones es par:
Mediana = (n+1) / 2 → Media de
las observaciones
Cuando el número de
observaciones es impar:
Mediana = (n+1) / 2 → Valor de
la observación
6. EJEMPLO DE CÁLCULO DE LA MEDIANA
Imaginemos que tenemos los
siguientes datos:
2,4,12,6,8,14,16,10,18.
En primer lugar los ordenamos
de menor a mayor con lo que
tendríamos lo siguiente:
2,4,6,8,10,12,14,16,18.
Pues bien, el valor de la mediana,
como indica la fórmula, es aquel
que deje la misma cantidad de
valores tanto a un lado como a
otro. ¿Cuántas observaciones
tenemos? 9 observaciones.
Calculamos la posición con la
fórmula de la mediana
correspondiente.
Mediana = 9+1 / 2 = 5
7. EJEMPLO DE CÁLCULO DE LA MEDIANA
Mediana = 9+1 / 2 = 5
¿Qué quiere decir este 5? Nos
dice que el valor de la mediana,
se encuentra en la observación
cuya posición es la quinta.
Por lo tanto la mediana de esta
sería de datos sería el número
10, ya que está en la posición
quinta. Además, podemos
comprobar como tanto a la
izquierda del 5 hay 4 valores (2,
4, 6 y 8) y a la derecha del 10
hay otros 4 valores (12, 14, 16 y
18).
8. LA MODA
La moda estadística es aquel
valor que, dentro de un conjunto
de datos, se repite el mayor
número de veces.
La determinación de la moda
estadística en un conjunto de
datos que no están agrupados no
requiere ningún tipo de cálculo,
sino tan solo el conteo de las
variables. Otra forma de
determinar la moda en datos no
agrupados consiste en verificar
cuál es el valor de mayor
frecuencia en una tabla
La moda estadística es aplicable
tanto para datos de
información cualitativa como cuan
titativa.
9. TIPOS DE MODA ESTADÍSTICA
La moda estadística se clasifica
de la siguiente manera:
Moda unimodal: tipo de moda
estadística en la cual un único
valor se repite el mayor número
de veces dentro de un conjunto
de datos.
Moda bimodal: tipo de moda
estadística en la que 2 valores
diferentes presentan el mismo
número máximo de repeticiones,
dentro de un conjunto de datos.
Moda multimodal: tipo de moda
estadística en la que 3 o más
valores diferentes presentan el
mismo número máximo de
repeticiones dentro de un
conjunto de datos.
10. MODA ESTADÍSTICA EN DATOS AGRUPADOS
Cuando los datos de un conjunto
se encuentran agrupados en
intervalos, la moda estadística
corresponde al punto medio del
intervalo que presenta la mayor
frecuencia.
Teniendo en cuenta lo anterior,
el primer paso para calcular la
moda en datos agrupados
consiste en determinar cuál es el
intervalo de mayor frecuencia en
la tabla que contiene la
información agrupada.
11. POSTERIORMENTE SE REALIZA EL CÁLCULO DE LA
MODA APLICANDO LA SIGUIENTE FÓRMULA:
Las variables que involucran la
ecuación anterior son:
Li: límite inferior del intervalo donde
está ubicada la moda.
fi-1: frecuencia absoluta del
intervalo anterior donde está
ubicada la moda.
fi: frecuencia absoluta del intervalo
donde está ubicada la moda.
fi+1: frecuencia absoluta del
intervalo siguiente donde está
ubicada la moda.
Ai: amplitud del intervalo donde está
la moda.
12. EJEMPLO MODA EN DATOS AGRUPADOS
Cuánto es el peso en kilos de los
consumidores de panes. Luego
de realizar la pregunta a 20
consumidores, el conjunto de
datos es el siguiente:
13. Para este cálculo de la moda
estadística aplicamos los
siguientes pasos:
Se ubica el intervalo donde se
encuentra la mayor frecuencia
absoluta, en este caso en el
intervalo [80 – 90] con frecuencia
8.
Se aplica la fórmula para calcular
la moda en datos agrupados:
Obtenemos así que la moda
estadística es de 87.
14. LA MEDIA GEOMETRICA
La media geométrica es un tipo
de media que se calcula como la
raíz del producto de un conjunto
de números estrictamente
positivos.
La media geométrica se calcula
como un producto conjunto. Es
decir, que todos los valores se
multiplican entre sí. De modo
que si uno de ellos fuera cero, el
producto total sería cero. Por
ello, debemos siempre tener en
cuenta que a la hora de calcular
la media geométrica necesitamos
números que sean únicamente
positivos.
15. FÓRMULA DE LA MEDIA GEOMÉTRICA
La fórmula de la media geométrica
es la siguiente:
Donde:
N: Se trata del número total de
observaciones. Por ejemplo, si
tenemos el crecimiento de los
beneficios de una empresa durante
4 periodos, N será 4.
x: La variable X es sobre la que
calculamos la media geométrica.
Siguiendo el ejemplo anterior, el
crecimiento de los beneficios estará
expresado en porcentaje y será la
variable X.
i: Representa la posición de cada
observación. En este ejemplo,
podríamos ponerle un número cada
periodo. Un 1, al periodo 1, un 2 al
periodo 2, etc. De manera que x1 es
el crecimiento de los beneficios en el
periodo 1, x2 el crecimiento de los
beneficios en el periodo 2, x3 el
crecimiento de los beneficios en el
16. La media geométrica (MG) de un
conjunto de números
estrictamente positivos (X1,
X2,…,XN) es la raíz N-ésima del
producto de los N elementos.
Todos los elementos del
conjunto tienen que ser mayores
que cero. Si algún elemento
fuese cero (Xi=0), entonces la MG
sería 0 aunque todos los demás
valores estuviesen alejados del
cero.
17. La media geométrica es útil para
calcular medias de porcentajes,
tantos por uno, puntuaciones o
índices. Tiene la ventaja de que
no es tan sensible como
la media a los valores extremos.
18. EJEMPLO
En una empresa quieren saber
la proporción media de
mujeres en los diferentes
departamentos. Para ello, se
recoge el porcentaje de mujeres
en los cinco principales
departamentos.
Como es la media de
porcentajes, calculamos la media
geométrica que es más
representativa.
20. EJEMPLO
Una parroquia sufre un proceso rápido de
envejecimiento de su población. El primer
año aumentan los mayores de 65 años un
10%, el segundo año, un 20%, el tercer
año un 30% y el cuarto año, un 40%.
Si la población de inicial es de 100
mayores de 65 años, ¿cuál será un mejor
indicador para caracterizar ese
envejecimiento: la media aritmética o
la media geométrica?
21. SOLUCIÓN
Sabemos que para llegar a la
cifra final al cabo de los cuatro
años, debemos acumular
sucesivamente los porcentajes
anuales:
Tras el cuarto año, en la aldea
hay 240 personas con más de 65
años.
Si calculamos la media
aritmética de los porcentajes de
incremento anual, obtendremos:
Si esta media aritmética la
acumulamos a los cuatro años:
El resultado obtenido excede a la
realidad.
Pero si hubiésemos empleado la
media geométrica de los
incrementos anuales:
22. Llegamos a un porcentaje anual
obtenido con la media
geométrica del 24,02%.
Calculamos la población final a
partir de este último indicador,
acumulándolo a los cuatro años.
Obtenemos el resultado final exacto. Por
lo que resulta más representativa,
trabajando con porcentajes, la media
geométrica que la aritmética:
23. EL RANGO
El rango es un valor numérico
que indica la diferencia entre el
valor máximo y el mínimo de una
población o muestra estadística.
El rango suele ser utilizado para
obtener la dispersión total. Es
decir, si tenemos una muestra
con dos observaciones: 10 y 100
euros, el rango será de 90 euros.
24. FÓRMULA DEL RANGO
Para calcular el rango de una
muestra o población estadística
utilizaremos la siguiente fórmula:
Donde
R es el rango.
Máx es el valor máximo de la
muestra o población.
Mín es el valor mínimo de la muestra
o población estadística.
x es la variable sobre la que se
pretende calcular esta medida.
Para ello, no es necesario
ordenar los valores de mayor a
menor o viceversa. Si sabemos
cual son los números con mayor
y menor valor, tan sólo
tendremos que aplicar la
fórmula.
25. EJEMPLO DE RANGO EN
ESTADÍSTICA
Supongamos que tenemos
una empresa que produce
extracto o zumo de frutas para
luego venderlos a las principales
marcas de jugos y bebidas. Esta
empresa encarga a un
economista que realice un
estudio sobre la evolución de las
ventas (últimos 4 años) para,
posteriormente, ofrecer consejos
que mejoren los resultados
empresariales. Entre otras
muchas métricas, se pide que se
calcule el rango de producción
de zumo. A continuación se
26. Mes 25 46.136
Mes 26 18.007
Mes 27 36.339
Mes 28 27.696
Mes 29 47.413
Mes 30 47.636
Mes 31 20.978
Mes 32 49.079
Mes 33 40.668
Mes 34 45.932
Mes 35 40.454
Mes 36 46.132
Mes 13 29.581
Mes 14 44.320
Mes 15 35.264
Mes 16 10.124
Mes 17 43.520
Mes 18 26.360
Mes 19 19.534
Mes 20 30.755
Mes 21 37.327
Mes 22 15.832
Mes 23 33.919
Mes 24 29.498
27. Mes 37 35.054
Mes 38 11.906
Mes 39 22.532
Mes 40 43.045
Mes 41 45.074
Mes 42 16.505
Mes 43 27.336
Mes 44 37.831
Mes 45 29.757
Mes 46 37.765
Mes 47 22.237
Mes 48 38.601
MÁXIMO 49.079
MÍNIMO 10.124
RANGO 38.955
28. El mes que más zumo (kg)
produjo la empresa (MÁXIMO)
fue el mes 32 con 49.079 kg de
zumo producidos. Por su parte,
el momento que menos
producción hubo tuvo lugar en el
mes 16 con 10.124 Kg
producidos. Por tanto, el rango
estadístico que es la diferencia
(49.079-10.124) se sitúa en
38.955.
29. Esto quiere decir, que durante
los últimos 4 años la variación
máxima que ha habido ha sido
de 38.955 Kg producidos.
Gráficamente podemos verlo del
siguiente modo:
30. ASIMETRÍA Y CURTOSIS
La asimetría y curtosis informan
sobre la forma de la distribución
de una variable. Estas medidas
permiten saber las características
de su asimetría y homogeneidad
sin necesidad de representarlos
gráficamente.
La asimetría es la medida que
indica la simetría de la
distribución de
una variable respecto a la media
aritmética, sin necesidad de
hacer la representación gráfica.
Los coeficientes de asimetría
indican si hay el mismo número
de elementos a izquierda y
derecha de la media.
31. Existen tres tipos de curva de
distribución según su asimetría:
Asimetría negativa: la cola de la
distribución se alarga para valores
inferiores a la media.
Simétrica: hay el mismo número de
elementos a izquierda y derecha de
la media. En este caso, coinciden
la media, la mediana y la moda. La
distribución se adapta a la forma de
la campana de Gauss, o distribución
normal.
Asimetría positiva: la cola de la
distribución se alarga (a la derecha)
para valores superiores a la media.
32. EXISTEN TRES COEFICIENTES
DE ASIMETRÍA:
Coeficiente de asimetría de
Fisher
El coeficiente de asimetría de
Fisher CAF evalúa la proximidad
de los datos a su media x.
Cuanto mayor sea la suma ∑(xi–
x)3, mayor será la asimetría. Sea
el conjunto X=(x1, x2,…, xN),
entonces la fórmula de la
asimetría de Fisher es:
Cuando los datos están
agrupados o agrupados en
intervalos, la fórmula
del coeficiente de asimetría de
Fisher se convierte en:
33. Si CAF<0: la distribución tiene
una asimetría negativa y se
alarga a valores menores que
la media.
Si CAF=0: la distribución
es simétrica.
Si CAF>0: la distribución tiene
una asimetría positiva y se alarga
a valores mayores que la media
34. COEFICIENTE DE ASIMETRÍA DE
PEARSON
El coeficiente de asimetría de
Pearson CAP mide la diferencia
entre la media y
la moda respecto a
la dispersión del conjunto X=(x1,
x2,…, xN).
Este procedimiento, menos
usado, lo emplearemos
solamente en distribuciones
unimodales y poco asimétricas.
Si CAP<0: la distribución tiene
una asimetría negativa, puesto
que la media es menor que
la moda.
Si CAP=0: la distribución
es simétrica.
Si CAP>0: la distribución tiene
una asimetría positiva, ya que
la media es mayor que la moda.
35. COEFICIENTE DE ASIMETRÍA DE
BOWLEY
El coeficiente de asimetría de
Bowley CAB toma como referencia
los cuartiles para determinar si la
distribución es simétrica o no.
Para aplicar este coeficiente, se
supone que el comportamiento
de la distribución en los
extremos es similar. Sea el
conjunto X=(x1, x2,…, xN), la
asimetría de Bowley es:
Esta fórmula viene de:
Recordemos que la mediana (Me)
es lo mismo que el
segundo cuartil (Q2).
Por lo que la fórmula
del coeficiente de asimetría de
Bowley también se puede escribir
así:
36. •Si CAB<0: la distribución tiene
una asimetría negativa, puesto que la
distancia de la mediana al primer cuartil es
mayor que al tercero.
•Si CAB=0: la distribución es simétrica, ya
que el primer y tercer cuartil están a la
misma distancia de la mediana.
•Si CAB>0: la distribución tiene
una asimetría positiva, ya que la distancia
de la mediana al tercer cuartil es mayor
que al primero.
37. CURTOSIS
La curtosis (o apuntamiento) es
una medida de forma que mide
cuán escarpada o achatada está
una curva o distribución.
Este coeficiente indica la
cantidad de datos que hay
cercanos a la media, de manera
que a mayor grado de curtosis,
más escarpada (o apuntada) será
la forma de la curva.
38. La curtosis se mide promediando
la cuarta potencia de la
diferencia entre cada elemento
del conjunto y la media, dividido
entre la desviación típica elevado
también a la cuarta potencia. Sea
el conjunto X=(x1, x2,…, xN),
entonces el coeficiente
de curtosis será:
En la fórmula se resta 3 porque
es la curtosis de una distribución
Normal. Entonces la curtosis
valdrá 0 para la Normal,
tomándose a ésta como
referencia.
Cuando los datos están
agrupados o agrupados en
intervalos, la fórmula
del coeficiente de curtosis se
convierte en: