1. Material Recopilado y organizado por Ing. Fernanda T Alvarez
Medidas de Posición:
Cuantiles
Las Medidas de Posición, también
conocidas como Otras Medidas de
Dispersión, son otras medidas o
métodos que resultan ser más prácticos
para precisar ciertas situaciones en las
que se busca describir la variación o
dispersión en un conjunto de datos
Los cuantiles son valores de la distribución
que la dividen en partes iguales, es decir, en
intervalos, que comprenden el mismo
número de valores. Los más usados son los
cuartiles, los deciles y los percentiles.
PERCENTILES: son 99 valores que
dividen en cien partes iguales el conjunto de
datos ordenados. Ejemplo, el percentil de
orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%
CUARTILES: Son los tres valores que
dividen al conjunto de datos ordenados en
cuatro partes iguales, son un caso particular
de los percentiles:
- El primer cuartil Q1 es el menor valor que
es mayor que una cuarta parte de los datos
- El segundo cuartil Q2 (la mediana), es el
menor valor que es mayor que la mitad de
los datos
- El tercer cuartil Q3 es el menor valor que es
mayor que tres cuartas partes de los datos
DECILES: son los nueve valores que
dividen al conjunto de datos ordenados
en diez partes iguales, son también un
caso particular de los percentiles.
Ejemplo:
Dada la siguiente distribución en el
número de hijos (Xi) de cien familias,
calcular sus cuartiles.
n°hijos xi fi fa
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Σfi=100
Solución: Para buscar la ubicación de un
cuartil hay que tomar en cuenta lo
siguiente:
Frecuencia acumulada (fa) 14, 1era
fila significa que acá están los datos
del 1 al 14, fa= 24, 2da fila significa
que acá están los datos del 15 al 24,
fa=39, 3era fila significa que acá están
los datos del 25 al 39 y así
sucesivamente
1er Cuartil: n/4=100/4=25 se ubica en la
3era fila, Q1 =2 lo que significa que el 25%
de las familias tiene 2 hijos o menos
2do Cuartil: 2n/4=(2*100)/4=50 se
ubica en la 3ra fila, Q2 (la mediana) lo que
significa que el 50% de las familias tiene 3
hijos o menos
3er Cuartil: 3n/4=(2*100)/4=75 se ubica
en la 4ta fila, Q3 lo que significa que el 75%
de las familias tiene 4 hijos o menos
CUARTILES
Si se desea calcular cada cuartil
individualmente, mediante fórmula se
tiene lo siguiente, ver tabla 1 y tabla 2
dependiendo si se trata de datos
agrupados y no agrupados
El primer cuartil Q1, es
el menor valor que es mayor que una
cuarta parte de los datos; es decir,
aquel valor de la variable que supera
25% de las observaciones
El segundo cuartil Q2, (coincide, es
idéntico o similar a la mediana, Q2 =
Md), es el menor valor que es mayor
que la mitad de los datos, es decir el
50% de las observaciones
El tercer cuartil Q3, es el menor valor
que es mayor que tres cuartas partes
de los datos, es decir aquel valor de la
variable que supera al 75% las
observaciones.
EJEMPLO: Determinación del
primer cuartil, el séptimo decil y el 30
percentil, de la siguiente tabla:
Salarios
(Intervalos
de Clases)
Marca
de clase,
Xi
N° de
Empleados,
fi
fa
200-299 249,5 85 85
300-399 349,5 90 175
400-499 449,5 120 295
500-599 549,5 70 365
600-699 649,5 62 427
700-800 750 36 463
a) Cálculo del primer cuartil
Como son datos agrupados, se utiliza
la fórmula
Siendo, La posición del primer
cuartil
115,75 Se ubica en la 2da fila (color
amarillo) con fa de 175 es decir los
datos que van del dato 86 al 175, se
tiene entonces que:
Li= Límite inferior= 300
fi= 90
Ic= 399-300=99
Q1=333,83 dólares
Interpretación: significa que el 25%
de los salarios están con valores
menores o iguales 333,83 dólares, en
realidad entre 200 y 333,83 dólares
b) Cálculo del séptimo decil
Como son datos agrupados, se utiliza
la fórmula
Tema 4
Medidas de Posición: Cuartiles, deciles y percentiles
2. 2
Siendo, La posición del séptimo
decil
324,1 Se ubica en la 4ta fila con fa de
365 es decir los datos que van del dato
296 al 365, se tiene entonces que:
Li= Límite inferior= 500
fi= 70
Ic= 599-500=99
D7=541,96
Interpretación: significa que el 70%
de los salarios están con valores por
debajo de 541,96 es decir comprendidos
entre 200 y 541,96 dólares
Cálculo del percentil 30
Posición:
138,9 Se ubica en la 2da fila (color
amarillo) con fa de 175 es decir los datos
que van del dato 86 al 175, se tiene
entonces que:
Li= Límite inferior= 300
fi= 90
Ic= 399-300=99
P30=359,29 dólares
Interpretación: significa que el 30%
de los salarios de los empleados están
por debajo de 359,29 $ es decir
comprendidos entre 200 y 359,29
dólares
Enlace
https://youtu.be/jiceVfALmV0
Tabla 1: Cuantiles Para Datos No Agrupados
:Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
Cuantil Definición Posición si n
es par:
n es impar: Valor de k
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo
cuartil es precisamente la mediana. El primer cuartil, es el valor en el
cual o por debajo del cual queda un cuarto (25%) de todos los valores
de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por
debajo del cual quedan las tres cuartas partes (75%) de los datos.
k= 1,2,3
DECILES
Los deciles son ciertos números que dividen la sucesión de datos
ordenados en diez partes porcentualmente iguales. Son los nueve
valores que dividen al conjunto de datos ordenados en diez partes
iguales, son también un caso particular de los percentiles. Los deciles
se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
k= 1,2,3,... 9
PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para
propósitos de ubicación o clasificación de las personas cuando
atienden características tales como peso, estatura, etc.
Los percentiles dividen la sucesión de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados.
k= 1,2,3,... 99
Tabla 2: Cuantiles Para Datos Agrupados
CUANTIL
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Valor de k
CUARTILES k= 1,2,3
DECILES k= 1,2,3,... 9
PERCENTILES k= 1,2,3,... 99
3. 3
Medidas de dispersión
Las medidas de dispersión nos
permiten conocer si los valores en
general están cerca o alejados de los
valores centrales, muestran la
variabilidad de una distribución
de datos, indicando por medio de un
número si las diferentes puntuaciones
de una variable están muy alejadas de
la medida de tendencia central.
Video 1: Medidas de dispersión para
datos no agrupados:
https://youtu.be/KsVQygSlf4k
RANGO
Es la diferencia entre el valor máximo y
el mínimo en nuestros datos, esta
medida de dispersión aunque es la más
fácil de obtener, en lo general es muy
poco usada.
Datos agrupados Hay dos formas para
determinar el rango para datos
agrupados:
1) Rango = punto medio de la clase más
alta – punto medio de la más baja
2) Rango = límite superior de la clase
más alta – límite inferior de la más baja.
EJEMPLO:
En {4, 6, 9, 3, 7} el menor valor es 3, y
el mayor es 9, entonces el rango es 9-3
igual a 6.
Rango puede significar también todos
los valores de resultado de una función.
DESVIACIÓN MEDIA
La desviación media o desviación
promedio es abreviada por MD. Mide la
desviación promedio de valores con
respecto a la media del grupo, sin tomar
en cuenta el signo de la desviación.
EJEMPLO:
Vamos a utilizar tablas, ya que así el
procedimiento para calcular la
desviación media te sirve para cuando
tengas muchos datos y para cuando
tengas pocos.
En primer lugar, ordenamos los datos en
una tabla con la frecuencia absoluta de
cada uno de ellos, dejando la última fila
para la suma total de elementos de
datos:
Vamos a empezar calculando la media,
ya que la necesitamos para obtener las
desviaciones. Añadimos una tercera
columna para escribir el resultado de
multiplicar cada dato por su frecuencia
absoluta. En la última fila sumamos los
resultados:
Ya tenemos los datos que necesitamos
para calcular la media, según la
fórmula, que son la suma de las
multiplicaciones de cada dato por su
frecuencia absoluta y el número total de
datos:
La suma de las multiplicaciones de los
datos por la frecuencia absoluta es 25 y
lo tenemos en la última fila de la tercera
columna. El número total de datos es 5
y lo tenemos al final de la segunda
columna: La media es 5.
Una vez tenemos la media, ya podemos
calcular la distancia o la desviación de
cada dato, como el valor absoluta de la
diferencia entre cada dato con la media:
Para ello, añadimos una cuarta columna
donde iremos escribiendo la distancia
de cada dato:
Por ejemplo, para el dato 1, la distancia
sería:
Tema 5
Medidas de dispersión: Desviación Media, Varianza,
desviación estándar, coeficiente de variación
4. 4
Lo hacemos igual para el resto de datos
y los vamos escribiendo en la columna.
En la última fila, realizamos la suma de
todas las distancias:
Ya tenemos los datos que necesitamos
para calcular la desviación media, según
la fórmula, que son la suma de las
distancias de cada dato y el número
total de datos:
La suma de las distancias es 12 y lo
tenemos en la última fila de la cuarta
columna. El número total de datos es 5,
que lo tenemos al final de la segunda
columna por lo tanto la desviación
media es 2,4
DESVIACIÓN ESTÁNDAR
La desviación estándar o desviación
típica (σ) es una medida de
centralización o dispersión para
variables de razón (ratio o cociente) y
de intervalo, de gran utilidad en la
estadística descriptiva.
Se define como la raíz cuadrada de la
varianza. Junto con este valor, la
desviación típica es una medida
(cuadrática) que informa de la media de
distancias que tienen los datos respecto
de su media aritmética, expresada en las
mismas unidades que la variable.
Para datos agrupados se
calcula mediante:
√
∑ ̅
Dónde:
Xi=Marca de clase
̅ Media
frecuencia de clase
Desviación estándar
Número de datos
Para datos no agrupados
se calcula mediante:
√
∑ ̅
Dónde:
Xi=Marca de clase
̅ Media
frecuencia de clase
Desviación estándar
Número de datos
EJEMPLO:
Tú y tus amigos han medido las alturas
de sus perros (en milímetros):
Las alturas (de los hombros) son:
600mm, 470mm, 170mm, 430mm y
300mm.Calcula la media, la varianza y
la desviación estándar. Respuesta:
̅
Así que la altura media es 394 mm.
Vamos a dibujar esto en el gráfico:
Ahora calculamos la diferencia de cada
altura con la media:
Para calcular la varianza, toma cada
diferencia, elévala al cuadrado, y haz la
media:
∑ ̅
Así que la varianza es 21704.
Y la desviación estándar es la raíz de la
varianza, así que:
Desviación estándar: √
y lo bueno de la
desviación estándar es que es útil:
Interpretación: Las alturas están a
distancia menores a la desviación
estándar (147mm) de la media:
Así que usando la desviación estándar
tenemos una manera "estándar" de saber
qué es normal, o extra grande o extra
pequeño.
VARIANZA
Es una medida estadística que mide la
dispersión de los valores respecto a un
valor central (media), es decir, es el
cuadrado de las desviaciones.
∑ ̅
∑
Te puede ayudar:
Video 2: Medidas de dispersión para
datos agrupados: varianza, desviación
estándar, CV, desviación media
https://youtu.be/VjCeoPLmbhI
BIBLIOGRAFIA:
Anderson, David R., Dennis J. Sweeney, Thomas A. Williams. ESTADISTICA PARA ADMINISTRACION Y
ECONOMIA. Editorial SM Math Learning. 8ava Edición. México
Kazmier, L ESTADÍSTICA APLICADA A ADMINISTRACIÓN Y ECONOMÍA. SERIE SCHAUM. McGraw Hill.
4ta Edición. México
http://www.disfrutalasmatematicas.com/datos/desviacion-estandar.html
https://ekuatio.com/medidas-de-dispersion-recorrido-desviacion-media-varianza-y-desviacion-tipica/
http://www.disfrutalasmatematicas.com/definiciones/rango-estadistica-.html
https://prezi.com/obxa6mstewuk/medidas-de-dispersion-para-datos-agrupados/