1. ANÁLISIS UNIVARIADO
Medidas Definición Fórmula Interpretación
Medidas de
tendencia
central
Se puede definir como aquel
valor que representa de x=
∑x i
forma clara el “centro de n
Promedio gravedad” de la distribución.
Se define como aquel valor Se compara con el
N / 2 − Nd
de la variable que deja a su Md = Li +
I
promedio para ver
derecha y a su izquierda nc
exactamente el mismo si están próximas.
número de individuos. En
otras palabras, es aquella
Si se encuentran
medida de tendencia alejadas indica
central que divide la serie de asimetría en la
datos en dos mitades o
Mediana partes iguales. distribución
La moda es aquel valor de
la variable que más veces se
repite en la serie estadística;
es decir, que tiene una
mayor frecuencia simple.
Dicha medida se puede
calcular para todo tipo de
variable y también en
cualquier escala de medida.
Según la moda, las
distribuciones de las
variables se pueden
clasificar en unimodales y
Moda multimodales1.
Medidas de
variabilidad
Es el valor extremo Se utiliza para
más grande de la serie compararlo con el
menor valor,
obtener el rango y
observar la
variabilidad de la
Máximo variable.
Es el valor extremo Se utiliza para
más pequeño de la compararlo con el
serie mayor valor,
obtener el rango y
observar la
variabilidad de la
Mínimo variable.
Rango Esta medida de dispersión se Rango = xn - xi Esta medida de
define como la distancia dispersión es la que
entre el valor más pequeño menos información
y el más grande de la proporciona sobre la
variable una vez han sido mayor o menor
ordenados; es decir, entre agrupación de los
los valores extremos de la valores de la variable
serie alrededor de las
medidas de tendencia
2. central, ya que sólo
indica el “campo de
variabilidad” de dicha
variable.
Esta medida de dispersión se Se utiliza como
define como la media
aritmética en valor absoluto medida de
de todas las diferencias
DM =
∑| x i −x| dispersión de los
entre cada valor de la
Desviación variable y su media n datos.
media aritmética.
Se define como la media
aritmética de las Sx =
2 ∑( x i − x) Se analiza
desviaciones al cuadrado n −1 respecto al valor
entre cada valor de la de la media.
variable y la media
aritmética. Corresponde
pues, a la media cuadrática
de todas las desviaciones de
cada valor de la variable
con respecto a su media
aritmética1,3.
Varianza
La desviación típica o Se analiza
estándar se define como la
Sx = Sx
2
Desviación raíz cuadrada de la respecto al valor
estándar varianza. de la media.
Este coeficiente se define S El coeficiente de
como el porcentaje que la CV= x 100 variación es una
desviación estándar x medida de la
representa de la media dispersión relativa;
aritmética. Además de no tener
unidades de medida,
permite realizar
comparaciones entre
variables y/o muestras
diferentes1. Esta dado
Coeficiente de en porcentaje.
variación
El error estándar de s2 S Entre más cercano
una estadística es la SE =
n =
a 0, hay menos
n
desviación estándar de error, pero
su distribución de depende de la
Error típico o muestreo. media de los datos
estándar tomados.
Es una medida de n (x −x j )
4
Leptocurtica: Si
Kj =∑
ij
apuntalamiento de la CK> 0
i =1 ns 4
distribución de j
Platicúrtica: Si
probabilidad. CK< 0
Mesocúrtica: Si
CK = 0
Curtosis = K
Coeficiente de Representa la simetría xij − x j
3
Asimétrica
1
asimetría de los datos respecto a A j = ∑ positiva: con cola
n s
su centro. j a la derecha
Asimétrica
negativa: con cola
3. a la izquierda
Simétrica: cercana
a 0.
Medidas de
posición
relativa
Aunque está definida como
una medida de tendencia
central, también se
interpreta como una medida
de posición, pues, divide la
distribución de la variable en
dos partes iguales. La
mediana es el percentil 50.
Mediana
Los cuartiles dividen la
distribución en cuatro partes
Q1=1/4(n+1)
iguales. Así, el primer quartil
(Q1) deja por debajo de él
una cuarta parte de
individuos y tres cuartas
partes por encima, es decir Q3=3/4(n+1)
es el percentil 25, mientras
que el tercer cuartil (Q 3) deja
por debajo de este valor las
tres cuartas partes de
individuos y una cuarta parte
por encima, es decir es el
Cuartiles percentil 751
Es dividir la distribución de la
variable en diez partes
iguales en el número de
Deciles individuos.
En este caso será dividir la
distribución de la variable en
100 partes; así, el centil 78
(C78) es aquel valor de la
variable que deja el 78/100
individuos por debajo de él y
22/100 individuos por
Centiles encima.
El 100p-ésimo percentil, es 1. P3=3(n+1)/100,
asignar a un valor de la P10=10(n+1)/100,
variable el porcentaje de P25=25(n+1)/100,
individuos que deja por P50=50(n+1)/100,
debajo de él. En la práctica, 1. P75=75(n+1)/100,
todas las anteriores medidas P90=90(n+1)/100.
se resumen en ésta. Así, el
percentil k(P1) es el valor de
la variable que deja el k/100
de los individuos por debajo
de él y el (100-k)/100 por
Percentiles encima.
El gráfico de caja, conocido
con el nombre de box plot o
box and whisker plot es una
representación basada en
un rectángulo, la caja, en
cuyos extremos se añaden
unas líneas o bigotes. Esta
gráfica informa sobre la
tendencia central, forma y
asimetría y existencia de
Box-Plot valores atípicos1,3.