1. Instituto Universitario Politécnico Santiago Mariño
Escuela: Electrónica
Sede: Barcelona- Estado Anzoátegui
Medidas de Dispersión
PROFESOR: ALUMNO:
Carlos Hernández Marcos Rodríguez 26346784
Barcelona, Diciembre del 2015.
2. Medidas de dispersión
También llamadas medidas de variabilidad, muestran la variabilidad de una
distribución, indicando por medio de un número si las diferentes puntuaciones de
una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor
será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se
sabe si todos los casos son parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviación media) y otra es tomando las
desviaciones al cuadrado (varianza).
Características
En secciones anteriores se ha discutido sobre tres medidas descriptivas del
centro. Sin embargo, estas medidas no son suficientes para caracterizar la
distribución, puesto que otro aspecto que debe se tomar en cuenta es la
variabilidad de las observaciones.
Con el propósito de medir la dispersión o variabilidad, se discutirán en este
apartado las medidas de: Amplitud (llamada también rango o recorrido),
Desviación media, Varianza, Desviación Estándar (también llamada desviación
típica) y Coeficiente de Variación.
Usos de las Medidas de Dispersión
Tanto las unas como las otras, son medidas que se toman para tener la posibilidad
de establecer comparaciones de diferentes muestras, para las cuales son
conocidas ya medidas que se tienen como típicas en su clase. Por ejemplo: Si se
conoce el valor promedio de los aprobados en las universidades venezolanas, y al estudiar
una muestra de los resultados de los exámenes de alguna Universidad en
particular, se encuentra un promedio mayor, o menor, del ya establecido; se podrá
juzgar el rendimiento de dicha institución.
3. Rango
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar,
el rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el mas
bajo(X1óXmin)enun conjunto dedatos.
Rangoparadatosnoagrupados;
R =Xmáx.-Xmín= Xn-X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, asaber: 18,23, 27,34 y
25., para calcular la media aritmética (promedio delas edades, se tiene que:
y
R =Xn-X1) =34-18=16años
Desviación típica
Es sin duda la medida de dispersión más importante, ya que además sirve como
medida previa al cálculo de otros valores estadísticos.
La desviación típica se define como la raíz cuadrada de la media de los cuadrados
de las desviaciones con respecto a la media de la distribución. Es decir,
N
xx
S
2
4. Para datos sin agrupar, o bien:
N
xx
S
2
Cálculo de la desviacióntípica para datos no agrupadosen clases
Veamos la fórmula anterior aplicada a un caso concreto.
Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.
x xx xx 2
5 -5,2 27,04
8 -2,2 4,84
10 -0,2 0,04
12 1,8 3,24
16 5,8 33,64
Primero hallamos x = 10,2
Luego S = 71,376,13
5. Cálculo de la desviacióntípica para datos agrupados en clases y
agrupados por frecuencias
Método largo: Se aplica la siguiente fórmula
N
fx
S
2
Donde xxx m y f es la frecuencia absoluta de cada intervalo.
Método abreviado o corto: La fórmula a utilizar es:
22
N
fd
N
fd
IS
Donde:
I: amplitud de la clase
D: distancia en clases desde cada una en concreto a la clase que contiene a la
media supuesta A.
Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así:
Clases f
150 – 155
155 – 160
160 – 165
3
6
12
6. 165 – 170
170 – 175
175 – 180
180 – 185
185 – 190
190 – 195
195 – 200
18
25
17
10
7
4
1
103
Resp: S = 9,56
Varianza
La varianza (que suele representarse como ) de una variable aleatoria es una
medida de dispersión definida como la esperanza del cuadrado de la desviación
de dicha variable respecto a su media.
Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable
mide una distancia en metros, la varianza se expresa en metros al cuadrado. La
desviación estándar es la raíz cuadrada de la varianza, es una medida de
dispersión alternativa expresada en las mismas unidades de los datos de la
variable objeto de estudio. La varianza tiene como valor mínimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atípicos y no se aconseja su uso cuando las distribuciones de las variables
aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras
medidas de dispersión más robustas.
El término varianza fue acuñado por Ronald Fisher en un artículo publicado en
enero de 1919 con el título The Correlation Between Relatives on the Supposition
of Mendelian Inheritance.1
7. Características
Cabe destacar que las medidas de dispersión (también identificadas con el
nombre de medidas de variabilidad) se encargan de expresar la variabilidad de
una distribución por medio de un número, en los casos en que las diferentes
puntuaciones de la variable están muy alejadas de la media. A mayor valor de la
medida de dispersión, mayor variabilidad. En cambio, a menor valor, más
homogeneidad.
Lo que hace la varianza es establecer la variabilidad de la variable aleatoria. Es
importante tener en cuenta que, en ciertos casos, es preferible emplear otras
medidas de dispersión ante las características de las distribuciones.
Coeficiente de variación
En estadística, cuando se desea hacer referencia a la relación entre el tamaño de
la media y la variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media
aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad
que la desviación típica o estándar. Por otro lado presenta problemas ya que a
diferencia de la desviación típica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos y su media dé,
por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor
heterogeneidad de los valores de la variable; y a menor C.V., mayor
homogeneidad en los valores de la variable. Suele representarse por medio de las
siglas C.V.
Se calcula:
Donde es la desviación típica, y es la Media. Se puede dar en porcentaje
calculando:
8. Los coeficientes de variación tienen las siguientes
características:
Puesto que tanto la desviación estándar como la media se miden en las
unidades originales, el CV es una medida independiente de las unidades de
medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para
comparar la variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos previos,
el CV es muy usado para evaluar la precisión de un experimento,
comparando en CV del experimento en cuestión con los valores del mismo
en experiencias anteriores.