Este documento describe diferentes medidas estadísticas para resumir conjuntos de datos, incluyendo medidas de tendencia central (media, mediana, moda), medidas de dispersión (desviación media, varianza, desviación estándar), y medidas de forma (curtosis, asimetría). Explica cómo calcular cada medida en Excel y cómo interpretar los resultados.
1. Medidas de tendencia central
Medidas de dispersión
Medidas de forma
Estadística Descriptiva en Excel
2. Medidas de tendencia central
Son valores numéricos que tienden a localizar un
punto central de un conjunto de datos y
generalmente este valor numérico representa la
variación entres estos.
3. Medidas de tendencia central
Media
• Es el punto de
equilibrio para la
serie de datos
agrupados en
intervalos y es
sensible a las
observaciones
extremas.
Mediana
• Es el valor que
divide la
distribución de
frecuencias
agrupadas por
intervalos en dos
mitades. Es decir
el 50% de los
valores a la
izquierda y el
50% de los
valores a la
derecha
Moda
• En una
distribución de
frecuencias es el
valor central del
intervalo que
tiene mayor
frecuencia.
4. La forma más sencilla para obtener la media en Excel se seleccionan
los datos, se presiona la pestaña de Autosuma y se selecciona
Promedio
6. Para obtener la mediana en Excel por medio de la
fórmula, se escribe:
=mediana(la columna y fila de inicio : la columna y
fila final)
En el ejemplo es:
=Mediana(A1:A20)
8. Para obtener la moda por medio del icono Insertar
función:
Se da clic sobre el icono, se abre el cuadro de
diálogo, se elige MODA se ingresan la columna y
fila de inicio con la columna y fila final.
11. Al pedir a un paquete estadístico que obtenga
el valor de la moda y existan más de una
moda el primer valor que dará será la moda
más alta, o la más baja. Sin embargo no
todos los paquetes estadísticos marcan
cuando existe más de una moda. En Excel es
recomendable repetir la moda más de una
vez para comprobar que sólo exista una.
15. Las medidas de dispersión indican que
tan distantes se encuentran los valores
con respecto al promedio.
Cuando los datos se encuentren juntos
o cercanos menor será la dispersión.
Cuando los datos se encuentren
separados o lejanos mayor será la
dispersión.
16. Desviación Media
Es la medida de dispersión que mide la
desviación promedio de valores con respecto a la
media en la serie de datos, sin tomar en cuenta
el signo de las desviaciones.
Se toma el valor absoluto, ya que si se tomará la
suma de las desviaciones con respecto a la
media el valor obtenido sería cero.
Su ecuación es:
_
D. M. = Xi - X
n
17. Varianza o variancia
Para su calculo interviene la
desviación, promedio de valores obtenidos a
partir de la media, para eliminar el signo
negativo, se eleva al cuadrado y dividiendo entre
n – 1 para la muestra y entre N para la población.
Se define como la media aritmética de los
cuadrados de las desviaciones de los valores de
la variable a la media aritmética, es decir, el
momento de segundo orden respecto a la media
aritmética.
Se define mediante la expresión:Poblacion
al
Muestral
18. Propiedades de la varianza
Nunca será negativa.
Es igual al momento de segundo orden respecto
al origen menos el de primer orden elevado al
cuadrado.
Si en la distribución de frecuencias sumamos a
todos los valores de la variable una CONSTANTE
la varianza no varía (un cambio de origen en la
variable no afecta a la varianza)
Al multiplicar los valores de una distribución de
frecuencias por una constante k, la varianza
queda multiplicada por el cuadro de la constante.
19. Para obtener la varianza en
Excel
Al utilizar el
icono Insertar
Función y elegir
VAR aparece
este cuadro de
diálogo
Fórmula de la
Varianza
Fórmuladela
Varianza
22. Para obtener la desviación estándar
en Excel
Fórmula de la Desviación
Estándar
FórmuladelaDesviación
Estándar
Al utilizar el
icono Insertar
Función y elegir
DESVEST
aparece este
cuadro de diálogo
24. Lectura de la varianza y de la
desviación estándar
Columna A Columna B Columna C Columna D
Promedio 7,6 7,75 8 9
Mediana 8 8 8,5 9
Moda 10 9 9 10
Asimetría -0,05884389 -0,381498 -0,65753749 -1,96132017
Curtosis -1,36706656 -0,93032128 -0,76447059 5,37535014
Desviación estándar 1,788854382 1,551739262 1,622214211 1,213953957
Varianza 3,2 2,407894737 2,631578947 1,473684211
25. Intervalos de la Desviación
Estándar de la columna A
INTERVALOS LIMITE INFERIOR LIMITE SUPERIOR
7.6 ± (1) 1.7 5,811145618 9,388854382
7.6 ± (2) 1.7 4,022291236 11,17770876
7.6 ± (3) 1.7 2,233436854 12,96656315
El valor de la varianza de la Columna A es de 3.2,
corresponde a la tercer desviación estándar a la
izquierda.
27. Las medidas de forma sirven para
conocer el grado de aproximación
de una distribución a la distribución
normal.
28. Curtosis
La curtosis se define como la cualidad de
apuntamiento. Por ello también se conoce como
medida de apuntamiento.
El coeficiente de curtosis indica si la distribución
es más achatada o puntiaguda que la normal.
Compara las alturas relativas de la ordenada
máxima de la distribución con las de la curva
normal.
Su ecuación es:
_
β= f(Xi – X)4
nS4
30. En una distribución normal a través de la
característica del coeficiente de curtosis
se puede determinar si es semejante a
la curva normal de Gauss, fig (a), si se
presenta un apuntamiento muy alto, fig
(b), o si se presenta una zona casi
horizontal en su punto máximo fig
(c), aquí el apuntamiento es casi nulo.
31. Para obtener la curtosis en
Excel:
Al utilizar el
icono Insertar
Función y elegir
CURTOSIS
aparece este
cuadro de diálogo
Fórmula de la Curtosis
Fórmuladela
Curtosis
32. Lectura de la curtosis
El valor de la curtosis
para la columna A es
de -1.36, lo que
corresponde a una
curva platicúrtica.
33. Asimetría
Es la que indica en qué grado se aparta la
distribución de la simetría.
Cuando una distribución es simétrica, las tres
medidas de tendencia central son iguales. En
cambio para la asimetría, la media y mediana se
cargan hacia los valores extremos.
La medida más usada para cuantificar la
asimetría en una distribución de frecuencia es el
coeficiente de asimetría y tiene por ecuación:
_
= f(Xi – X)3
nS3
35. Asimetría positiva(fig. a): se dice que la
distribución esta segada a la derecha ya que
tiene una cola prolongada del lado derecho y una
cola mucho más corta del lado izquierdo.
Asimetría negativa (fig. b): tiene una cola
prolongada del lado izquierdo y una cola mucho
más corta del lado derecho.
Distribución simétrica (fig. c): cuando la media se
toma como origen, es la representación gráfica
de una distribución de frecuencias cuyo eje de
simetría es la media o .
36. Para obtener el coeficiente de
asimetría en Excel:
Al utilizar el
icono Insertar
Función y elegir
COEFICIENTE.A
SIMETRIA
aparece este
cuadro de diálogo
Fórmula de la
Asimetría
Fórmuladela
Asimetría
37. Lectura de la Asimetría
La columna A presenta
sesgo negativo porque
el coeficiente de
asimetría es de -
0.05884