2. Br. Juan Carlos Meneses C.I. 19.682.511
La Dispersión permite analizar cómo se dispersan los valores de una variable de tipo
intervalo/razón de menor a mayor y la forma gráfica que estos valores presentan. Si se
conoce la media en una población hay distintas posibles formas de distribuir los
valores, es posible que todos estén alrededor de la media o podrían estar sesgados
hacia un lado. Estudiar la dispersión es revisar el eje horizontal y observar donde están
alojados los datos.
Muestran la variabilidad de una distribución, indicando por medio de un número si las
diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor
sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a
la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Entonces los Estadísticos de Dispersión o Medidas de Dispersión describen como se
dispersan los datos de una variable a lo largo de su distribución. Las Medidas de
Dispersión son: el Rango, la Desviación Estándar y la Varianza.
3. Br. Juan Carlos Meneses C.I. 19.682.511
Las estadísticas básicas nos permiten tener una visión del comportamiento de una serie
de sucesos o eventos a los que denominamos "variables", así tenemos varias
herramientas estadísticas como lo son la Media, la Mediana y la Moda. Pero estas
Medidas no son suficientes, necesitamos conocer la variabilidad de los datos, es decir,
cuán parecidos son los datos reales en comparación a las Medidas de Tendencia Central,
para esto contamos con esta nueva herramienta: las Medidas de Dispersión, que no son
otra cosa que indicadores de variabilidad y cuya importancia reside en la necesidad de
tomar decisiones, basadas en estadísticas básicas.
Si tenemos una producción de franelas y sabemos que
semanalmente se producen un promedio de 500 franelas,
podríamos decir que todos los días se producen 100 franelas, pero
nada nos garantiza eso porque podrían producirse en sólo dos días
250 franelas y el promedio semanal nos daría idéntico, así si
adicionalmente tenemos una Desviación Estándar de 5 franelas,
tendremos entonces una mejor comprensión del proceso, pues este
último número nos indica que semanalmente se producen entre
495 y 505 franelas, es decir, que diariamente sí se deben producir
aproximadamente 100 franelas .
4. Br. Juan Carlos Meneses C.I. 19.682.511
El Rango es una Medida de Dispersión que indica cómo los datos de una
variable se distribuyen de menor a mayor, es decir la distancia entre el valor
mínimo y máximo, es fácil de calcular porque solo deberá restar el valor
máximo menos el valor mínimo. El Rango se ve afectado cuando exista
valores muy aislados del grupo, la información que suministra no dice nada
de la distribución de puntuaciones
Por ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide tres
veces al día y que cierto día los registros de dos pacientes muestran:
Paciente 1: 73 77 74
Paciente 2: 64 90 73
¿Cuál es el rango en pulsaciones para cada paciente?
Para calcular el rango de los datos es necesario identificar el valor más grande y el valor
más pequeño del conjunto de datos de cada uno de los pacientes.
Para el Paciente 2:
A = 90 - 64 = 26
Para el Paciente 1:
A = 77 - 73 = 4
5. Br. Juan Carlos Meneses C.I. 19.682.511
El rango es una medida de dispersión cuya ventaja es la facilidad con que se calcula.
Tiene en cambio las siguientes desventajas:
En su cálculo sólo intervienen dos elementos del conjunto.
Al aumentar el número de observaciones, puede esperarse que aumente la variabilidad.
Puesto que la amplitud no tiene en cuenta el tamaño del conjunto, no es una medida
adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que
éstos sean del mismo tamaño.
Otro ejemplo, estas dos series:
Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18
Ambas series tienen rango 16, pero están desigualmente agrupadas, pues mientras la
primera tiene una mayor concentración en el centro, la segunda se distribuye
uniformemente a lo largo de todo el recorrido.
EL USO DE ESTA MEDIDA DE DISPERSIÓN, SERÁ BASTANTE RESTRINGIDO
6. Br. Juan Carlos Meneses C.I. 19.682.511
Para presentar la desviación estándar o típica, que es por mucho la medida
generalmente más útil de la dispersión, obsérvese que la dispersión de un conjunto de
datos es pequeña si los valores se agrupan en forma cerrada en torno a su media y es
grande si los valores se dispersan ampliamente en torno a su media. Por tanto,
parecería razonable medir la dispersión de un conjunto de datos en términos de las
cantidades en las cuales difieren los valores individuales de su media. Si se tiene un
conjunto de números, que constituyen una población con una media µ, las diferencias
entre ellos se denominan las desviaciones de la media y esto sugiere que se podría
usar el promedio de estas desviaciones como medida de dispersión en la población. A
menos que las X sean todas iguales, algunas de las desviaciones serán positivas y otras
negativas, la suma de todas las desviaciones de la media y en consecuencia también su
promedio es siempre cero.
7. Br. Juan Carlos Meneses C.I. 19.682.511
En realidad, si se suman las desviaciones de la media como si fueran todas positivas o
cero y las dividiéramos entre N, se obtendría la media estadística que se
denomina desviación media y se representa por:
Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a
encontrar dificultades teóricas en problemas de inferencia y rara vez se usa.
Un método alternativo consiste en trabajar con los cuadrados de las desviaciones de la
media, ya que también esto eliminará el efecto de los signos. Los cuadrados de números
reales no pueden ser negativos y pueden tomar el valor de cero.
Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raíz
cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen
cuadradas), se obtiene la Desviación estándar de la población.
8. Br. Juan Carlos Meneses C.I. 19.682.511
Ésta medida de variación se representa por medio de sigma minúscula ( σ) y al expresar
literalmente lo que se ha hecho aquí de manera matemática, también se conoce como
la raíz de la desviación cuadrada media. A su cuadrado de se le llama Varianza de la
población.
Quizá parezca lógico utilizar la misma fórmula con n y sustituidas por N y µ, para la
desviación estándar de una muestra; pero, esto no es realmente lo que se hace. En lugar
de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define
como desviación estándar de la muestra, que se denota con s como
Su cuadrado s2, se llama la Varianza de la muestra.
Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razón. Si se dividiera
entre n y se utilizara s2 como estimación de σ2, es decir, se utilizaría la varianza de una
muestra para determinar la varianza de la población de la cual provino, el resultado sería
demasiado pequeño y esto se corrige al dividir entre n-1 en lugar de hacerlo entre n. Si el
valor de n es muy grande no importa hacerlo entre n-1 sino que es práctico para
definir s como se hizo.
9. Br. Juan Carlos Meneses C.I. 19.682.511
1. La desviación típica será siempre un valor positivo
o cero, en el caso de que las puntuaciones sean
iguales.
2. Si a todos los valores de la variable se
les suma un número la desviación típica no varía.
3. Si todos los valores de la variable
se multiplican por un número la desviación típica queda
multiplicada por dicho número.
4. Si tenemos varias distribuciones con la
misma media y conocemos sus
respectivas desviaciones típicas se puede calcular
la desviación típica total.
5. La desviación típica, al igual que la media y la
varianza, es un índice muy sensible a las puntuaciones
extremas.
6. En los casos que no se pueda hallar la
media tampoco será posible hallar la desviación típica.
7. Cuanta más pequeña sea la desviación
típica mayor será la concentración de datos alrededor
de la media
10. Br. Juan Carlos Meneses C.I. 19.682.511
1. La varianza será siempre un valor positivo o cero, en el caso
de que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se
les suma un número la varianza no varía.
3. Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por el cuadrado de
dicho número.
4. Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas varianzas se puede calcular la varianza
total.
5. La varianza, al igual que la media, es un índice muy sensible a
las puntuaciones extremas.
6. En los casos que no se pueda hallar la media tampoco será
posible hallar la varianza.
7. La varianza no viene expresada en las mismas unidades que
los datos, ya que las desviaciones están elevadas al cuadrado.
11. Br. Juan Carlos Meneses C.I. 19.682.511
Las medidas de dispersión anteriores son todas medidas de variación absolutas. Una
medida de dispersión relativa de los datos, que toma en cuenta su magnitud, está dada
por el coeficiente de variación.
El Coeficiente de variación (CV) es una medida de la dispersión relativa de un
conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su
media aritmética y se expresa como
para una muestra y
Los coeficientes de variación tienen las siguientes características:
Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el CV es una medida independiente de las unidades de medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la
variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos previos, el CV es
muy usado para evaluar la precisión de un experimento, comparando en CV del
experimento en cuestión con los valores del mismo en experiencias anteriores.
para la población
12. Br. Juan Carlos Meneses C.I. 19.682.511
En seis sábados consecutivos un operador de taxis recibió 9, 7, 11, 10, 13 y 7 llamadas
a su sitio para su servicio. Calcule:
•Rango.
•Media.
•Desviación media.
•Desviación estándar.
•Varianza.
•Coeficiente de variación.
a) Para calcular la amplitud.
Valor máximo 13
Valor mínimo 7
R = 13 - 7 = 6
b) Para calcular la media.
13. Br. Juan Carlos Meneses C.I. 19.682.511
En seis sábados consecutivos un operador de taxis recibió 9, 7, 11, 10, 13 y 7 llamadas
a su sitio para su servicio. Calcule:
•Rango.
•Media.
•Desviación media.
•Desviación estándar.
•Varianza.
•Coeficiente de variación.
a) Para calcular el rango.
Valor máximo 13
Valor mínimo 7
R = 13 - 7 = 6
c) Para calcular la desviación media
b) Para calcular la media.
14. Br. Juan Carlos Meneses C.I. 19.682.511
d) Para calcular la desviación estándar
Se puede utilizar la siguiente tabla
9 -0.5 0.25
7 -2.5 6.25
11 1.5 2.25
10 0.5 0.25
13 3.5 12.25
7 -2.5 6.25
0.0 27.50
Al sustituir los valores se obtiene,
e) Para calcular la varianza:
f) Para calcular el coeficiente de variación:
15. Br. Juan Carlos Meneses C.I. 19.682.511
Para calcular la varianza de una tabla de frecuencias se utiliza la siguiente fórmula:
Donde,
k es el número de intervalos de clase
Xi es el valor medio de cada clase
fi es el valor de la frecuencia absoluta
Al retomar el ejemplo de la tabla de distribución de frecuencias de Precipitación pluvial
promedio anual en Baja California 1905 a 1994 en pulgadas
INTERVALOS
Punto medio de
clase (mi)
fi fAi FRi FRAi
(07.7 , 11.7] 9.7 18 18 18/90 18/90
(11.7 , 15.7] 13.7 13 31 13/90 31/90
(15.7 , 19.7] 17.7 24 55 24/90 55/90
(19.7 , 23.7] 21.7 17 72 17/90 72/90
(23.7 , 27.7] 25.7 13 85 13/90 85/90
(27.7 , 31.7] 29.7 0 85 0/90 85/90
(31.7 , 35.7] 33.7 4 89 4/90 89/90
(35.7 , 39.7] 37.7 1 90 1/90 90/90
TOTAL 90 90 90/90 90/90
16. Br. Juan Carlos Meneses C.I. 19.682.511
Calcular s2 y s.
mi fi fimi
9.7 94.09 18 174.6 1693.62
13.7 187.69 13 178.1 2439.97
17.7 313.29 24 424.8 7518.96
21.7 470.89 17 368.9 8005.13
25.7 660.49 13 334.1 8586.37
29.7 882.09 0 0 0
33.7 1135.69 4 134.8 4542.76
37.7 1421.29 1 37.7 1421.29
TOTAL ##### 90 1653.0 34208.10
http://www.cetic.edu.ve/files/ced/2005/medidas_dispersion/page_10/index.html
http://www.cca.org.mx/cca/cursos/estadistica/html/m11/medidas_dispersion.htm
http://laprofematematica.com/blog/medidas-de-dispersion/
http://www.disfrutalasmatematicas.com/datos/desviacion-estandar.html
http://colposfesz.galeon.com/est501/distfrec/meddisp/meddisp.htm