1. UNIDAD II
Repaso Estadística Descriptiva
Medidas Características de una Distribución
Gestión de Calidad
José Germán Correa Ramos
Ingeniero Civil Industrial (MBA-UTFSM)
Profesor de Matemáticas y Física
2. 2.4 Medidas características de una distribución
a) Medidas de Centralización
Media aritmética
Supongamos que tenemos una muestra de tamaño N , donde la variable estadística
x toma los valores x1,x2,...,xN . Se define la media aritmética x, o simplemente
media, de la muestra como:
Es decir, la media se calcula sencillamente sumando los distintos valores de x y
dividiendo por el número.
de datos. En el caso de que los diferentes valores de x aparezcan repetidos,
tomando entonces los valores x1,x2,...,xk, con frecuencias absolutas n1,n2,...,nk, la
media se determina como :
Pudiéndose expresar también en función de las frecuencias relativas mediante:
3. La Mediana
Una medida de centralización importante es la mediana Me. Se define esta como una
medida central tal que, con los datos ordenados de menor a mayor, el 50% de los datos
son inferiores a su valor y el 50% de los datos tienen valores superiores. Es decir, la
mediana divide en dos partes iguales la distribución de Frecuencias o, grecamente,
divide el histograma en dos partes de áreas iguales.
Es importante indicar que:
Si el número es Impar, la mediana constituirá la observación media del arreglo
ordenado.
Si el número es Par, la mediana será el promedio de los valores medios.
4. Si lo verbalizado anteriormente lo transformamos en formula sería:
Mediana para Datos No Agrupados
Para una Población: M= X(N+1)/2 en un arreglo Ordenado, en donde N= Número
de Observaciones Población
Para una Muestra: m =X(n+1)/2 en un arreglo ordenado , en donde n= Número de
Observaciones Muestra
Veamos un pequeño ejemplo, suponiendo que analizamos una población:
Si x =1, 4, 6, 7, 9, N= 5 es impar, por lo tanto, la mediana se ubicara en la posición
X(5+1)/2=X3 = 6
Por otro lado, Si x =1, 4, 6, 7, N= 4 es Par, por lo tanto la mediana se ubicara
X(4+1)/2=X5/2=(4+6)/2=5
5. Mediana para Datos Agrupados
Supongamos ahora que tenemos una muestra de una variable continua cuyos
valores están agrupados en intervalos de clase. En este caso pueden ocurrir dos
situaciones. En primer lugar, si N/2 coincide con la frecuencia absoluta acumulada Nj
de un intervalo (aj, aj+1) (con marca de clase cj), la mediana será sencillamente el
extremo superior aj+1 de ese intervalo. En el caso general de que ninguna frecuencia
absoluta acumulada coincida con N/2 será necesario interpolar en el polígono de
frecuencias acumuladas. Supongamos que el valor N/2 se encuentra entre las
frecuencias Nj−1 y Nj, correspondientes a los intervalos (aj−1, aj) y (aj, aj+1)
respectivamente, la mediana se situaría en algún lugar del intervalo superior (aj, aj+1)
6. Si verbalizamos o explicamos del punto de vista empírico la determinación de la
Mediana, para Datos Agrupados, esta se formaliza de la siguiente forma:
Para una Población
𝑀𝑒 = 𝐿 +
𝑁
2 − 𝐹
𝑓
𝑊
Para una Muestra
𝑚𝑒 = 𝐿 +
𝑛
2 − 𝐹
𝑓
𝑊
Donde:
N= Número de Observaciones en la Población o Muestra
L: es el Límite Inferior de la clase mediana
f: frecuencia absoluta
W: Ancho de la Clase.
F: es la suma de las frecuencias hasta la clase mediana (Sin Incluir)
7. La Moda (Mo)
La Moda Datos No Agrupados
Se define la moda Mo de una muestra como aquel valor de la variable que tiene una
frecuencia máxima. Es decir el valor que con más frecuencias se representa en un
conjunto de datos.
En otras palabras, es el valor que más se repite. Hay que indicar que puede suceder
que la moda no sea única, es decir que aparezcan varios máximos en la distribución
de frecuencias. En ese caso diremos que tenemos una distribución bimodal, trimodal,
etc. Evidentemente, en el caso de una variable discreta que no toma valores
repetidos, la moda no tiene sentido. Cuando sí existen valores repetidos su cálculo es
directo ya que puede leerse directamente de la tabla de distribución de frecuencias.
8. La Moda Datos Agrupados
𝑀0 = 𝐿 +
𝑑1
𝑑1 + 𝑑2
𝑊
Donde
L= Limite inferior a la clase modal.
W=Ancho de la Clase
d1 y d2 : Diferencias entre la densidad de frecuencias absolutas de la clase modal
y la clase precedente o siguiente
9. c) Medidas de Dispersión
Las medidas de centralización vistas anteriormente reducen la información recogida
de la muestra a un solo valor. Sin embargo, dicho valor central, o medio, será más o
menos representativo de los valores de la muestra dependiendo de la dispersión
que las medidas individuales tengan respecto a dicho centro. Para analizar la
representatividad de las medidas de centralización se definen las llamadas medidas
de dispersión. Estas nos indicaran la variabilidad de los datos en torno a su valor
promedio, es decir si se encuentran muy o poco esparcidos en torno a su centro.
Se pueden definir entonces, diversas medidas de desviación o dispersión, siendo
éstas fundamentales para la descripción estadísticas de la muestra.
10. Las Medidas de Dispersión que ocuparemos para esta asignatura son dos:
Varianza
Varianza para Datos No Agrupados
Para una población
𝜎2 =
σ(𝑋−𝜇)2
𝑁
Para una Muestra
𝑆2
=
σ(𝑋−𝜇)2
𝑁−1
11. Varianza para Datos Agrupados
Para una población
𝜎2
=
σ 𝑓(𝑋−𝜇)2
𝑁
Para una Muestra
𝑆2
=
σ 𝑓(𝑋−𝜇)2
𝑁−1
14. Asimetría y curtosis
Se dice que una distribución de medidas es simétrica cuando valores de la variable
equidistantes, a uno y otro lado, del valor central tienen la misma frecuencia. Es decir, en
este caso tendremos simetría en el histograma (o en el diagrama de barras) alrededor de
una vertical trazada por el punto central. En el caso de una distribución perfectamente
simétrica los valores de media aritmética, mediana y moda coinciden
(x = Me = Mo).