TALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdf
Unidad 4 Dispersión, Sesgo y Apuntamiento.pptx
1. Medidas de dispersión, variación o variabilidad.
Las medidas de dispersión o también llamadas medidas de variación, son aquellas que
indican que tan alejados o dispersos se encuentran los datos, con respecto a sí mismos o
con respecto a la media del conjunto de datos.
Es decir, son valores numéricos que indican o describen la forma en que las
observaciones están dispersas o diseminadas, con respecto al valor central.
Son importantes debido a que dos muestras de observaciones con el mismo valor central
pueden tener una variabilidad muy distinta.
Tema
2.
Estadística
Descriptiva
2. Medidas de dispersión, variación o
variabilidad.
ESTAS MEDIDAS SON:
Rango.
Varianza.
Desviación Típica.
Coeficiente de variación.
Desviación Media Absoluta y Coeficiente de Desviación Media Absoluta
Desviación Mediana Absoluta y Coeficiente de Desviación Mediana
Absoluta
Recorrido intercuartil, Desviación Cuartil y Coeficiente de desviación
cuartil.
Recorrido interdecil, Desviación Decil y Coeficiente de desviación decil.
Tema
4.
MEDIDAS
DE
DISPERSION
3. Medidas de dispersión: Rango
Rango (amplitud o recorrido):
Está determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la mayor y
menor observación.
Es una medida de dispersión absoluta, ya que
depende solamente de los datos y permite
conocer la máxima dispersión.
Tema
2.
Estadística
Descriptiva
4. Medidas de dispersión: Rango
Casi no se emplea debido a que depende únicamente de dos valores.
No proporciona una medida de variabilidad de las observaciones con respecto al
centro de la distribución.
Notación: R
Ventajas:
Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo
de la dispersión).
Fácil de calcular.
Desventajas:
No es una MD con respecto al centro de la distribución.
Solo emplea dos valores en su cálculo.
No se puede calcular en distribuciones de límite de clase abierto.
Tema
2.
Estadística
Descriptiva
5. Medidas de dispersión: Varianza
Es un valor numérico que mide el grado de dispersión absoluta porque depende
de la posición de los datos x1,x2,…,xn con respecto a la media.
Es el promedio al cuadrado de las desviaciones de cada observación con
respecto a la media.
Si la varianza de un conjunto de observaciones es grande se dice que los datos
tiene una mayor variabilidad que un conjunto de datos que tenga un varianza
menor.
Notación: s2, 2, var(X)
Tema
2.
Estadística
Descriptiva
2
1
2
2
1
2
2
x
n
x
s
n
x
x
s
n
i
i
n
i
i
Para datos NO
agrupados:
6. Para datos agrupados en una distribución de frecuencias:
Medidas de dispersión: Varianza
2
1
2
2
1
2
2
x
N
n
x
s
N
n
x
x
s
k
i
i
i
k
i
i
i
1. Siempre es mayor o igual a cero y menor que infinito.
2. La varianza de una constante es cero.
3. Es útil cuando se compara la variabilidad de dos o más conjuntos de datos.
4. Utiliza toda la información disponible.
)
n
(
datos
de
total
número
el
Es
n
datos
de
conjunto
del
media
la
Es
x
intervalo
ésimo
-
i
del
clase
de
marca
la
de
valor
el
Es
Xi
intervalo
ésimo
-
i
del
frecuencia
la
de
valor
el
Es
Varianza
-
2
fi
fi
7. Propiedades, Ventajas y Desventajas de la
Varianza
Ventajas:
Es útil cuando se compara la variabilidad de dos o más
conjuntos de datos.
Utiliza toda la información disponible.
Desventajas:
No proporciona ayuda inmediata cuando se estudia la
dispersión de un solo conjunto de datos.
Difícil de interpretar por tener sus unidades elevadas al
cuadrado.
Tema
2.
Estadística
Descriptiva
8. Desviación típica: es la raíz cuadrada de la varianza, y se
conoce también como desviación estándar.
Es la raíz cuadrada de la varianza.
Notación: s, .
N
X
X
s
N
j
j
1
2
Medidas de dispersión: Desviación Típica
2
s
s
N
ni
X
X
s
N
j
j
1
2
Para datos NO
agrupados:
Para datos
agrupados:
9. Ventajas y Desventajas de la Desviación
Típica
Ventajas:
Esta expresada en las mismas unidades que la variable en estudio.
Utiliza todas las observaciones en su cálculo.
Fácil de interpretar.
Desventajas:
No tiene.
Tema
2.
Estadística
Descriptiva
10. Medidas de dispersión: Coeficiente de Variación
Es una medida de dispersión relativa que permite comparar el
nivel de dispersión de dos muestras de variables estadísticas
diferentes.
El coeficiente de variación también llamado
coeficiente de dispersión, es una medida de variación
relativa, se presenta en forma de porcentaje y su
valor se obtiene mediante:
No tiene dimensiones.
Notación: CV
%
100
x
s
CV
Tema
4.
MEDIDAS
DE
DISPERSION
Su valor es útil y se emplea para comparar la variación que
existe entre diferentes distribuciones de frecuencia.
11. Medidas de dispersión: Desviación media Absoluta
datos no agrupados
Desviación media Absoluta: está definida para
una serie de N números x1, x2, …xN así:
N
X
X
X
D
N
j
j
1
.
.
Desviación media Absoluta datos agrupados
ni
N
X
X
X
D
N
j
j
1
.
.
Absoluta
Frecuencia
ni
datos
de
total
número
el
Es
n
datos
de
conjunto
del
media
la
Es
dato
ésimo
-
i
del
valor
el
Es
i
12. Medidas de dispersión: Desviación mediana
Desviación media Absoluta: está definida para
una serie de N números x1, x2, …xN así:
Desviación media Absoluta datos agrupados
N
ni
Me
X
Me
D
N
j
j *
.
.
1
Absoluta
Frecuencia
ni
datos
de
total
número
el
Es
n
datos
de
conjunto
del
mediana
la
Es
dato
ésimo
-
i
del
valor
el
Es
Me
i
N
Me
X
Me
D
N
j
j
1
.
.
13. MEDIDAS DE POSICIÓN: RECORRIDO INTERCUARTILICO
Está definida por la diferencia entre la tercera y la primera
cuartila:
RIQ = Q3 – Q1
Entre estas dos cuartilas se encuentra el 50% restante.
Si la desviación cuartílica es pequeña, significa que el 50% de las
desviaciones se concentra en una zona pequeña y por lo tanto la
dispersión es baja.
La DESVIACION CUARTIL, Se obtiene mediante el calculo del
recorrido intercuartilico dividido entre 2.
COEFICIENTE DE DESVIACION CUARTIL
100
*
1
3
1
3
Q
Q
Q
Q
CDQ
14. MEDIDAS DE POSICIÓN: RECORRIDO INTERDECIL
Está definida por la diferencia entre el noveno (D9 ) y el primer
(D1 )
RID = D9 – D1
Entre estas dos DECILES se encuentra el 80% restante.
Si la desviación DECIL es pequeña, significa que el 80% de las
desviaciones se concentra en una zona pequeña y por lo tanto la
dispersión es baja.
La DESVIACION DECIL, Se obtiene mediante el calculo del
recorrido interdecil dividido entre 2.
COEFICIENTE DE DESVIACION DECIL
100
*
1
9
1
9
D
D
D
D
CDD
15. Son medidas numéricas que permiten determinar el sesgo
que tiene curva de los datos, por lo tanto, sirven para
corroborar lo que los gráficos muestran.
Medidas de Asimetría o de Deformación
16. ASIMETRIA
-Asimetría (-)
La curva presenta alargamiento a la izquierda,
hay asimetría negativa. X < Me < Mo
Tema
2.
Estadística
Descriptiva
- Asimetría (+) La curva presenta alargamiento a la derecha,
hay asimetría positiva. Mo < Me < X
- Simétría
La curva tiene forma de una campana, se denomina
normal , ya que el promedio se ubica en el centro. En
este caso, X = Me = Mo
17. Medidas de Sesgo: Asimetría
Las fórmulas utilizadas para calcular el grado de Asimetría
1er. Coeficiente de Asimetría de Pearson:
Fácil de calcular e interpretar.
Cálculo:
s
Mo
X
ASP
o Interpretación:
ASP
= 0, X=Mo Simétrica
> 0, X>Mo Asimétrica Positiva
< 0, X<Mo Asimétrica Negativa
Tema
2.
Estadística
Descriptiva
18. Medidas de Sesgo: Asimetría
Las fórmulas utilizadas para calcular el grado de Asimetría
2do. Coeficiente de Asimetría de Pearson:
Fácil de calcular e interpretar.
Cálculo:
s
Me
X
ASP
3
o Interpretación:
ASP
= 0, X=Me Simétrica
> 0, X>Me Asimétrica Positiva
< 0, X<Me Asimétrica Negativa
Tema
2.
Estadística
Descriptiva
19. Medidas de Sesgo: Asimetría
3er. Coeficiente de Asimetría de Pearson:
De debe calcular el momento (m₃)
No es de fácil cálculo, pero si su
interpretación.
Tema
2.
Estadística
Descriptiva
N
ni
x
x
m
N
X
x
m
k
i
i
n
i
i
1
3
3
1
3
3
Datos NO agrupados
Datos Agrupados
20. Medidas de Sesgo: Asimetría
3er. Coeficiente de Asimetría de Pearson:
Tema
2.
Estadística
Descriptiva
3
3
s
m
AS
o Interpretación:
AS
= 0, Simétrica
> 0, Asimétrica Positiva
< 0, Asimétrica Negativa
21. Medidas de Sesgo: Asimetría
Coeficiente de Asimetría de Bowley:
Tema
2.
Estadística
Descriptiva
1
3
2
1
3 2
Q
Q
Q
Q
Q
AS
o Interpretación:
AS
= 0, Simétrica
> 0, Asimétrica Positiva
< 0, Asimétrica Negativa
El signo nos indicará hacia que lado se presenta la deformación o alargamiento
de la distribución y el valor será el grado de asimetría, entre más grande sea
este valor, más grande será la asimetría.
22. Ambas distribuciones tiene como media aritmética 4 y desviación
estándar 4.6. Cuando una curva está equilibrada con relación a su
eje vertical, se dice que es simétrica; cuando no observa esta
situación, se dice que es asimétrica.
En una distribución simétrica tienen igual valor la media y la
mediana, cuando es unimodal también coinciden con la moda.
La asimetría se califica por la dirección de la cola de la curva;
cuando ésta se encuentra a la derecha la asimetría es positiva,
cuando está a la izquierda la asimetría es negativa.
Gráfica A (simétrica)
0
1
2
3
4
5
6
7
a b c d e f g
Gráfica B (asimétrica)
0
2
4
6
8
10
a b c d e f g
23. MOMENTO 4to.
N
ni
x
x
m
N
X
x
m
k
i
i
n
i
i
1
4
4
1
4
4
24. KURTOSIS O ESTADIGRAFO DE APUNTAMIENTO
La Kurtosis mide la picudez de la curva.
Es el grado de agudeza en la cima de la curva
que las representa.
Los siguiente valores indican la magnitud de la picudez
de la curva:
AP > 3 Cuando la curva es leptocúrtica o alargada.
AP < 3 Cuando la curva es platicúrtica o achatada
AP = 3 Cuando la curva es normal
2
2
4
Kurtosis
m
m
K 4
4
to
Apuntamien
S
m
AP