Este documento describe diferentes medidas de dispersión como la desviación típica, varianza, coeficiente de variación y rango. Explica que las medidas de dispersión cuantifican cuán alejados están los valores de una variable de su media y son útiles para comparar la variabilidad entre muestras. También define cada medida de dispersión, sus propiedades y usos.
Las Medidas de Dispersión nos resumen la información de la “muestra” o serie de datos, dándonos así información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos.
Presentación que analiza la varianza de las medias y su importancia en la toma de decisiones, se comparan resultados mediante el uso de Stata y SPSS, para ello se trabaja de manera manual los cálculos, llegando al final a utilizar el software existente para verificar los resultados.
Distribución de probabilidad continua o distribución Normal, cálculo de la puntuación Z y determinación del valor de probabilidad según la tabla de distribución Z.
Las Medidas de Dispersión nos resumen la información de la “muestra” o serie de datos, dándonos así información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos.
Presentación que analiza la varianza de las medias y su importancia en la toma de decisiones, se comparan resultados mediante el uso de Stata y SPSS, para ello se trabaja de manera manual los cálculos, llegando al final a utilizar el software existente para verificar los resultados.
Distribución de probabilidad continua o distribución Normal, cálculo de la puntuación Z y determinación del valor de probabilidad según la tabla de distribución Z.
Medidas de dispersión: Concepto. Características y usos.
Rango. Desviaciones típicas. Varianza y coeficiente de variación. Concepto. Características y utilidad estadística
También llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
MEDIDAS DE DISPERSIÓN: CONCEPTO. CARACTERÍSTICAS Y USOS. RANGO. DESVIACIONES TÍPICAS. VARIANZA Y COEFICIENTE DE VARIACIÓN. CONCEPTO. CARACTERÍSTICAS Y UTILIDAD ESTADÍSTICA.
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
Medidas De Dispersion
1. REPUBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA EDUCACION SUPERIOR
INSTITUTO UNIVERSITARIO POLITECNICO
“SANTIAGO MARIÑO”
SEDE BARCELONA
‘’MEDIDAS DE DISPERSION’’
PROFESOR:
PEDRO BELTRAN
BACHILLER:
NANCY FIGUERA C.I 22.866.667
2. MEDIDAS DE DISPERSIÓN
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un número si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese
valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la madia.
Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
La Dispersión permite analizar cómo se dispersan los valores de una variable de
tipo intervalo/razón de menor a mayor y la forma gráfica que estos valores presentan. Si
se conoce la media de una población hay distintas posibles formas de distribuir los
valores, e posible que todos estén alrededor de la media o podrán estar sesgados hacia
un lado.
Entonces los Estadísticos de Dispersión o Medidas de Dispersión describen como se
dispersan los datos de una variable a lo largo de su distribución.
3. CARACTERÍSTICAS DE MEDIDAS DE DISPERSIÓN
• Las medidas de dispersión nos sirven para cuantificar la separación
de los valores de una distribución.
• Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o menor
separación de los valores de la muestra, respecto de las medidas de
centralización que hayamos calculado.
• Al calcular una medida de centralización como es la media aritmética,
resulta necesario acompañarla de otra medida que indique el grado de
dispersión, del resto de valores de la distribución, respecto de esta
media.
• A estas cantidades o coeficientes, les llamamos: MEDIDAS DE
DISPERSIÓN, pudiendo ser absolutas o relativas
4. USOS DE LAS MEDIDAS DE DISPERSIÓN
Tanto las unas como las otras, son medidas que se toman para tener la
posibilidad de establecer comparaciones de diferentes muestras, para las
cuales son conocidas ya medidas que se tienen como típicas en su clase.
Por ejemplo: Si se conoce el valor promedio de los aprobados en las
universidades venezolanas, y al estudiar una muestra de los resultados de
los exámenes de alguna Universidad en particular, se encuentra un
promedio mayor, o menor, del ya establecido; se podrá juzgar el rendimiento
de dicha institución.
5. MEDIDAS DE DISPERSIÓN
a) Medidasdedispersiónabsolutas:
Recorrido
Recorridointercuartílico.
Varianza
Desviacióntípica
Desviación media respecto de lamediana
b) Medidasdedispersiónrelativas
CoeficientedevariacióndePEARSON
Indice devariación respecto dela mediana
6. • RECORRIDO: Se define como la diferencia entre el mayor y menor valor de
las variables de una distribución:
• RECORRIDO INTERCUARTÍLICO: Se define como la diferencia entre el
tercer y el primer cuartil:
13 CCRi
• DESVIACIÓN MEDIA RESPECTO DE LA MEDIANA: Es la media aritmética
de los valores absolutos de las desviaciones de los valores de la variable
con respecto de la mediana.
n
nMex
D
ii
Me
7. • RANGO: Es la medida de variabilidad más fácil de calcular. Para datos
finitos o sin agrupar, el rango se define como la diferencia entre el valor
más alto (Xn ó Xmax.) y el más bajo(X1 o X min) en un conjunto de datos.
Es la diferencia entre el valor máximo y el mínimo en nuestros datos, esta
medida de dispersión aunque es la más fácil de obtener, en lo general es
muy poco usada.
Rango para datos no agrupados;
R= Xmáx.- Xmín= Xn-X1
• Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de primer año, a
saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las
edades, se tiene que:
• R = (Xn-X1 ) = 34-18 = 16 años
8. • DESVIACIÓN TÍPICA: La desviación típica o standard, es la raíz
cuadrada, con signo positivo, de la varianza. Se representa por S, y tiene
la siguiente expresión:
N
nXx
SS
ii
2
2 )(
Si operamos, podemos obtener la siguiente expresión, que es mucho más
sencilla de operar, y obtenemos menos error de redondeo:
2
22
2
)(
X
n
nx
n
nXx
S iiii
9. PROPIEDADES DE LA DESVIACIÓN TÍPICA
• A su vez la desviación típica, también tiene una serie de propiedades
que se deducen fácilmente de las de la varianza (ya que la desviación
típica es la raíz cuadrada de la varianza):
•
• 1ª.- La desviación típica es siempre un valor no negativo S será
siempre 0 por definición. Cuando S = 0 X = xi (para todo i).
• 2ª.- Es la medida de dispersión óptima por ser la más pequeña.
• 3ª.- Si a todos los valores de la variable se le suma una misma
constante la desviación típica no varía.
• 4ª.- Si a todos los valores de la variable se multiplican por una misma
constante, la desviación típica queda multiplicada por el valor absoluto
de dicha constante.
10. • VARIANZA: Es la media aritmética de los cuadrados de las
desviaciones de los valores de la variable con respecto de la media de
la distribución. Responde a la expresión
n
nXx
S
ii
2
2 )(
Su problema son las unidades ya que minutos al cuadrado no existen, y si
hablamos de longitud m x m nos daría metros al cuadrado o sea superficie. El
valor de la varianza no lo podemos tomar, pues, como la cantidad que resulta,
en las unidades que nos proporcionan los datos. Para hacernos una idea
aproximada, nunca exacta, hay que obtener la raíz cuadrada, y así esta nueva
medida.
11. CARACTERISTICAS DE LA VARIANZA
• Si a todos los valores de la variable se les suma un número la varianza no
varía.
• Si todos los valores de la variable se multiplican por un número la varianza
queda multiplicada por el cuadrado de dicho número.
• Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas varianzas se puede calcular la varianza total.
• Si todas las muestras tienen el mismo tamaño.
• Si las muestra tienen distinto tamaño.
UTILIDAD DE LA VARIANZA:
sirve para identificar a la media de las desviaciones cuadráticas de una
variable de carácter aleatorio, considerando el valor medio de ésta.
12. CARACTERISTICAS DEL COEFICIENTE DE VARIACION
• El coeficiente de variación no posee unidades.
• El coeficiente de variación es típicamente menor que uno. Sin embargo, en
ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.
• Para su mejor interpretación se expresa como porcentaje.
• Depende de la desviación típica, también llamada "desviación estándar", y en
mayor medida de la media aritmética, dado que cuando ésta es 0 o muy
próxima a este valor el C.V. pierde significado, ya que puede dar valores muy
grandes, que no necesariamente implican dispersión de datos.
• El coeficiente de variación es común en varios campos de la probabilidad
aplicada, como teoría de renovación y teoría de colas. En estos campos la
distribución exponencial es a menudo más importante que la distribución
normal.
utilidad del coeficiente de variación: El coeficiente de variación permite
comparar la dispersión entre dos poblaciones distintas e incluso, comparar la
variación
13. OBSERVACIONES SOBRE LA VARIANZA
• 1 La varianza, al igual que la media, es un índice muy sensible
a las puntuaciones extremas.
• 2 En los casos que no se pueda hallar la media tampoco será
posible hallar la varianza.
• 3 La varianza no viene expresada en las mismas unidades que
los datos, ya que las desviaciones están elevadas al cuadrado.
14. PROPIEDADES DE LA VARIANZA
1ª.-Es siempre un valor no negativo, que puede ser igual o distinta de 0. Será
0 solamente cuando: xxi
2ª.-La varianza es la medida de dispersión cuadrática optima por ser la menor
de todas.
3ª.-Si a todos los valores de la variable se le suma una constante la varianza
no se modifica. Veámoslo:
n
nXx
S
ii
2
2 )(
Si a xi le sumamos una constante xi’ = xi + k tendremos sabiendo
que:
kxx '
)
2
222
2
)()]'()[()''(
S
n
nXx
n
nkXkx
n
nXx
S iiiiii
15. 4ª.- Si todos los valores de la variable se multiplican por una constante la
varianza queda multiplicada por el cuadrado de dicha constante. Veámoslo:
Si a xi’ = xi · k tendremos sabiendo que: kXX ·'
)
N
nXxk
N
nkXkx
N
nXx
S iiiiii
222
2
)]([)]'·()·[()''(
22
2222
·
)()(
Sk
n
Xxk
n
nXxk iii
5º.-Si en una distribución obtenemos una serie de subconjuntos disjuntos, la
varianza de la distribución inicial se relaciona con la varianza de cada uno de
los subconjuntos mediante la expresión
n
SN
S
ii
x
2
2
Siendo
Ni el nº de elementos del subconjunto (i)
S2i la varianza del subconjunto (i)
16. COEFICIENTE DE VARIACIÓN DE PEARSON
El coeficiente de variación de PEARSON es una de las más significativas y
lo podemos definir, como el cociente entre la desviación típica y la media
aritmética de una distribución.
Es necesario tener en cuenta que al efectuar el cociente eliminamos las
unidades por tanto V es adimensional:
X
S
Vx
Cuando Vx < Vy significa que X es más representativa que Y, o que la
media de X representa mejor a su distribución, que la media de Y a la suya.
• Por convención se considera que la dispersión es óptima si Vx es igual
o menor que 0,3.
• El coeficiente de variación no se ve influido si multiplicamos todos los
valores de la variable por una constante.
xx V
Xk
Sk
Xk
Sk
V
17. BIBLIOGRAFÍA
• Estadística Básica con R y R-Commander, capítulo 2 sobre "Análisis Exploratorio
de Datos Unidimensional, Distribución de frecuencias, medidas de posición, medidas
de dispersión, diagramas" (publicado en OCW-UCA)
• Fisher, R. A. (1919). «The Correlation Between Relatives on the Supposition
of Mendelian Inheritance» Transactions of the Royal Society of
Edinburgh Vol. 52, 02, pp 399-433.
• Gema Fernández-Avilés Calderón