2. Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
3. Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
4. 3. Medidas de dispersión (5/11)
Cuartiles (idea intuitiva)
Son los valores que dividen la muestra en 4 grupos, cada uno con el 25% de los datos
(aproximadamente)
25% 25% 25% 25% 25% 25% 25% 25%
min Q1 Q2 Q3 max min Q1 Q2 Q3 max
Rango intercuartílico Probabilidades y Estadística I
5. 3. Medidas de dispersión (6/11)
Datos
Cuartiles (definición formal) explícitos
Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenada
de menor a mayor.
i
x ( j ) si j = (n + 1)
4
Qi =
x ( j ) + x ( j +1) si j < i (n + 1) < j + 1
2 4
Datos
implícitos
Sea X una variable estadística y F(x) su función acumulativa de frecuencias
relativas. Se define Qi como la solución de la siguiente ecuación funcional
F(x) = i/4
Probabilidades y Estadística I
6. 3. Medidas de dispersión (7/11)
Percentiles (definición intuitiva)
Son los valores que dividen la muestra en 100 grupos, cada uno con el 1% de los datos
(aproximadamente)
min P25 P50 P75 max
Q1 Q2 Q3
Probabilidades y Estadística I
7. 3. Medidas de dispersión (8/11)
Datos
Percentiles (definición formal) explícitos
Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenada
de menor a mayor.
i
x( j=
) si j (n + 1)
100
Pi =
x ( j ) + x ( j +1) si j < i (n + 1) < j + 1
2 100
Datos
implícitos
Sea X una variable estadística y F(x) su función acumulativa de frecuencias
relativas. Se define Qi como la solución de la siguiente ecuación funcional
F(x) = i/100
Probabilidades y Estadística I
8. 3. Medidas de dispersión (9/11)
Datos
Varianza (definición formal) explícitos
Sea x1, x2, ...., xn una serie de datos
( x1 − x ) 2 + ( x2 − x ) 2 + .... + ( xn − x ) 2
σ =
2
n
Datos
implícitos
Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de
modalidades. Sea {f1,f2,.…,fk} su distribución de frecuencias relativas.
k
Var X = ∑ f i ( x' i − x )
2
i =1
Probabilidades y Estadística I
9. 3. Medidas de dispersión (10/11)
Desviación típica (definición formal)
k
σ =+ ∑ f i (x' i − x )
2
i =1 Detectar
datos
atípicos
( x − 2σ , x + 2σ ) contiene el 75% de los datos
( x − 3σ , x + 3σ ) contiene el 89% de los datos
Probabilidades y Estadística I
10. 3. Medidas de dispersión (11/11)
Varianza (propiedades)
Es un operador cuadrático (Teorema de Pitágoras)
Var (aX+b)= a2Var(X)
COMPARACIÓN DE DISPERSIONES (Coeficiente de variación)
σ
CV =
x
Probabilidades y Estadística I
11. Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
12. 4. Medidas de forma (1/6)
Una forma de valorar cuantitativamente la forma del perfil de una distribución de
frecuencias
¿qué valores de una distribución pueden considerarse atípicos?
Gráfico Criterio Medida
Simetría Coeficiente
de Fisher
Apuntamiento Curtosis
Probabilidades y Estadística I
13. 4. Medidas de forma (2/6)
Momento centrado en el origen (definición formal)
Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el
origen de orden r, y se representa por ar, a la siguiente expresión algebraica:
x1 + x 2r + .... + x nr
r
ar =
n
Momento centrado en la media (definición formal)
Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el
origen de orden r, y se representa por ar, a la siguiente expresión algebraica:
(x1 − x ) r + (x 2 − x ) r + .... + (x n − x ) r
mr =
n
Probabilidades y Estadística I
14. 4. Medidas de forma (3/6)
Momentos (propiedades)
a1= x
m1= 0
m2 = Var (X)
2
n
n
∑=i 1 x i
xi ∑
2
Var (X) = m2 = a2 – a12 Var(X) i 1 −
==
n n
Probabilidades y Estadística I
15. 4. Medidas de forma (4/6)
Coef. de Fisher (definición formal)
n
m3 ∑ (x i − x)3
γ= = i =1
σ nσ 3
1 3
γ1 < 0 γ1 =0 γ1 > 0
Probabilidades y Estadística I
16. 4. Medidas de forma (5/6)
Curtosis (definición formal)
n
m4 ∑ (x i − x) 4
γ2
= −3
= i =1
−3
σ4 nσ 4
γ2 < 0 γ2 =0 γ2 > 0
Probabilidades y Estadística I
17. 4. Medidas de forma (6/6)
Datos atípicos
No atípico Atípico
Probabilidades y Estadística I
18. Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
19. 5. Medidas de relación (1/4)
Una forma de valorar cuantitativamente la relación lineal entre dos variables
Eliminar información redundante. Establecer causalidades
Probabilidades y Estadística I
20. 5. Medidas de relación (2/5)
Momento centrado en el origen (definición formal)
Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la
variable estadística bidimensional (X, Y).
x1 y1 + x2 y2 + .... + xn yn
r h r h r h
arh =
n
Momento centrado en la media (definición formal)
Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la
variable estadística bidimensional (X, Y).
(x1 − X )r (y1 − Y )h + (x2 − X )r (y2 − Y )h + .... + (xn − X )r (yn − Y )h
mr ,h =
n
Probabilidades y Estadística I
21. 5. Medidas de relación (3/5)
Momentos bid. (interrelaciones)
COVARIANZA
Probabilidades y Estadística I
22. 5. Medidas de relación (4/5)
Covarianza
Cov (X, Y) = m11
DEPENDE DE LA MAGNITUD
Probabilidades y Estadística I
23. 5. Medidas de relación (5/5)
Coeficiente de correlación (covarianza normalizada)
cov( X ,Y )
ρ x ,y = −1 ≤ ρ x ,y ≤ 1
σ xσ y
Y Y Y Y
X X X X
ρ x ,y = −1 −1 < ρ x ,y < 0 ρ x ,y = 0
Y
Y
X X
0 < ρ x ,y < 1 ρ x ,y = 1
Probabilidades y Estadística I