Este documento describe medidas de dispersión como el rango, la varianza y la desviación estándar. Explica que estas medidas indican cuánto se alejan los datos respecto de la media y cuantifican la variabilidad y separación de los valores. Ofrece fórmulas para calcular estas medidas y ejemplos de su cálculo para datos agrupados y no agrupados. También introduce el coeficiente de variación como una medida relativa de dispersión.
Medidas de Tendencia Central, Posición y Dispersiónreynier valor
Medidas de Tendencia Central, Posición y Dispersión, Reynieri Valor, C.I: 25.344.142 I.U.P Santiago Mariño Barcelona, Anzoategui. Asignatura: Estadistica-Saia. 10/09/2018 Profesora Amelia Vasquez.
Medidas de Tendencia Central, Posición y Dispersiónreynier valor
Medidas de Tendencia Central, Posición y Dispersión, Reynieri Valor, C.I: 25.344.142 I.U.P Santiago Mariño Barcelona, Anzoategui. Asignatura: Estadistica-Saia. 10/09/2018 Profesora Amelia Vasquez.
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas,
de arrojar un valor numérico que ofrezca información sobre el grado de
variabilidad de una variable.
En otras palabras, las medidas de dispersión son números que indican si una
variable se mueve mucho, poco, más o menos que otra. La razón de ser de este
tipo de medidas es conocer de manera resumida una característica de la
variable estudiada. En este sentido, deben acompañar a las medidas de
tendencia central. Juntas, ofrecen información de un sólo vistazo que luego
podremos utilizar para comparar y, si fuera preciso, tomar decisiones.
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas,
de arrojar un valor numérico que ofrezca información sobre el grado de
variabilidad de una variable.
En otras palabras, las medidas de dispersión son números que indican si una
variable se mueve mucho, poco, más o menos que otra. La razón de ser de este
tipo de medidas es conocer de manera resumida una característica de la
variable estudiada. En este sentido, deben acompañar a las medidas de
tendencia central. Juntas, ofrecen información de un sólo vistazo que luego
podremos utilizar para comparar y, si fuera preciso, tomar decisiones.
2. Parámetros estadísticos que indican cómo se alejan o se acercan los
datos respecto de la media aritmética.
Estas medidas deben acompañar a las medidas de tendencia central.
Juntas, ofrecen información más cercana a la realidad, que se pueden
utilizar para comparar y, si fuera preciso, tomar decisiones.
Para interpretar la información más precisa de un conjunto
de datos, muestra, o población, sacar conclusiones y tomar
decisiones.
RANGO VARIANZA
DESVIACIÓN ESTÁNDAR
O DESVIACIÓN TÍPICA
3. Las Medidas de Tendencia Central
(MTC) tienen como objetivo el
sintetizar los datos en un valor
representativo: Media, Mediana y
Moda.
En cambio, las Medidas de Dispersión (MD) son
parámetros (medidas descriptivas de toda una
población) estadísticos que indican cuánto se
alejan los datos respecto de la media
aritmética. Es decir, indican la variabilidad
de los datos.
Las MD nos dicen hasta qué punto
las MTC son representativas como
síntesis de la información.
Contraste entre MTC y MD
En cambio, las Medidas de Dispersión (MD)
son parámetros (medidas descriptivas de toda
una población) estadísticos que indican
cuánto se alejan los datos respecto de la
media aritmética. Es decir, indican la
variabilidad de los datos.
Las MD cuantifican la
separación, la dispersión, la
variabilidad de los valores de la
distribución respecto al valor
central: μ (media poblacional).
En general, mientras más cercano a 0 (cero)
sea el valor de la MD, más representativas
serán las MTC
Además permiten identificar la
homogeneidad de una muestra
o población de datos
4. El rango es un valor numérico que indica la
diferencia entre el valor máximo y el mínimo de
una población o muestra estadística.
Fórmula para calcular el rango
Se simboliza R
𝑅 = 𝑀á𝑥𝑥 − 𝑀í𝑛𝑥
Donde
• R es el rango.
• Máx es el valor máximo de la muestra o
población.
• Mín es el valor mínimo de la muestra o
población estadística.
• x es la variable sobre la que se pretende
calcular esta medida.
5.
6. La varianza es una medida de dispersión
que representa la variabilidad de una serie
de datos respecto a su media.
Formalmente se calcula como la
suma de los residuos al cuadrado
divididos entre el total de
observaciones. Su fórmula es la
siguiente:
Se simboliza
𝜎2
𝑆2
Donde:
•X → Variable sobre la que se pretenden calcular la
varianza
•xi → Observación o dato número i de la variable X. i
puede tomará valores entre 1 y n.
•N → Número de observaciones o datos.
•𝑥→ Es la media de la variable X.
𝜎2
=
1
𝑁
𝑥𝑖 − 𝑥 2
𝑁
7. La desviación típica es otra medida que ofrece
información de la dispersión respecto a la media.
Donde:
•X → Variable sobre la que se pretenden calcular la
varianza
•xi → Observación o dato número i de la variable X.
i puede tomará valores entre 1 y n.
•N → Número de observaciones o datos.
•𝑥→ Es la media de la variable X.
Su cálculo es exactamente el mismo que la
varianza, pero realizando la raíz cuadrada de
su resultado. Es decir, la desviación típica es
la raíz cuadrada de la varianza.
Se simboliza
𝜎
𝑆
𝜎2
=
1
𝑁
𝑥𝑖 − 𝑥 2
𝑁
8.
9. Ejercicio
Calcular la varianza y la desviación estándar de los siguientes datos: 2, 4, 6 y 8 sabiendo que
corresponden a una población.
Solución:
Nos indican que estos datos forman una población, por lo tanto, usaremos las fórmulas de
varianza y desviación estándar para la población, teniendo en cuenta que tenemos 4 datos,
es decir, N = 4.
Empezamos calculando la media poblacional
Ahora calculamos la varianza poblacional:
10. El valor de la varianza poblacional, es de 5.
Ahora calculamos la desviación estándar, teniendo en cuenta que es la raíz cuadrada
de la varianza.
11. Ejemplo:
Calcular la varianza y la desviación estándar de los siguientes datos: 10, 12, 13, 16, 9, 8, 12,
8, 6, 16 sabiendo que corresponden a una población.
En este caso, como tenemos muchos datos, recurriremos a una tabla para mantener el
orden. Colocaremos los valores de los elementos de la población (xi) y sumaremos los
valores.
Teniendo en cuenta que tenemos 10 datos (N = 10),
calculamos la media:
12. Con el valor de la media, vamos en busca de la varianza poblacional:
Agregamos 2 columnas más a nuestra tabla para llegar a la forma de la varianza:
13. Reemplazamos los valores en la fórmula:
La varianza tiene un valor de 10,4.
Finalmente calculamos la desviación estándar:
16. Solución:
En este caso, nos dicen que los datos pertenecen a una población de niños, por lo tanto,
usaremos las fórmulas de la población.
Primero calculamos el número de elementos de la población N:
Con ayuda de la tabla, calculamos la suma de las frecuencias fi.
17. Como segundo paso, calcularemos las marcas de clase. Recordemos que la marca de
clase xi, es el punto medio del límite inferior y el límite superior de cada intervalo. Se
calcula con la siguiente fórmula:
Agregamos una columna más a nuestra tabla para la marca de clase xi:
18. Como tercer paso, calculamos la media poblacional µ:
Agregamos una columna más a nuestra tabla, dónde colocaremos los valores de xi・fi:
19. Aplicamos la fórmula:
La media poblacional µ tiene un valor de 4 años.
Como cuarto paso, calculamos la varianza de la población:
20. Agregamos más columnas a nuestra tabla, buscando la forma de la fórmula de la
varianza:
Aplicamos la fórmula de la varianza de la población:
21. Recuerda que la varianza queda expresada en unidades al cuadrado, por ello, nos queda
en años al cuadrado.
Como último paso, calculamos la desviación estándar, recordando que es la raíz
cuadrada positiva de la varianza.
23. Ejercicio
Calcular la varianza y la desviación estándar de las edades de una población de niños
que asisten a una fiesta infantil.
24. Para calcular la varianza y la desviación estándar, empezamos calculando el
número de elementos de la población:
En la tabla, sumamos las frecuencias fi:
25. A continuación, calculamos la media poblacional partiendo de su fórmula:
En la tabla de frecuencias agregamos la columna xi · fi
26. A continuación, recordamos la fórmula de la varianza de la población:
Ahora sí, calculamos la media poblacional:
27. En la tabla, agregamos 3 columnas más, para buscar la expresión de la fórmula:
28. Usamos la fórmula:
El valor de la varianza de esta población es de 1,8 (años)2. Ten en cuenta que la varianza
queda expresada en las unidades originales elevadas al cuadrado, por ello, nos quedaría en
(años)2.
Finalmente calculamos la desviación estándar, teniendo en cuenta que es la raíz cuadrada
positiva de la varianza
29. El coeficiente de variación mide la homogeneidad de un conjunto
de datos, ya que tiene en cuenta el valor de la media aritmética,
para establecer un número relativo, que hace comparable el grado
de dispersión entre dos o más variables. El coeficiente de variación
(C.V.) es el cociente entre la media aritmética y el desvío estándar.
Si las medidas se calculan sobre una muestra, el coeficiente se
dice muestral, y si es sobre una población, poblacional
Coeficiente de variación:
X
S
X
CV
→ Desviación estándar
→ Media aritmética
30. Coeficiente de Variación
0 1
Datos menos dispersos
(más homogéneos)
Datos más dispersos
(más heterogéneos)
Homogéneo: Uniforme, semejante, similar, idéntico.
Heterogéneo: Diverso, variado, mezclado, distinto.
Observación: En la mayoría de
las distribuciones de datos el
coeficiente de variación toma
valores desde 0% al 100%.
31. Ejercicio en clase
1.- Si el conjunto de datos formado por 1, 3, 5 y 7 corresponde a una población,
calcular la varianza y la desviación estándar.
Respuesta: 𝜎2 = 5 ; 𝜎 = 2,236.
2. Calcular la varianza y desviación estándar de las edades de una población de niños
a partir de la siguiente tabla:
Respuesta: 𝜎2 = 0,6 (𝑎ñ𝑜𝑠)2 𝖠 𝜎 = 0,77 𝑎ñ𝑜𝑠
32. Ejercicio en clase
El alcalde de la municipalidad del torno , ha presentado una propuesta para incluir a
las familias de las comunidades A y B en las ferias regionales y distritales para la
venta de sus productos. A partir de los datos recopilados sobre el número de hijos de
20 familias encuestadas, de cada comunidad, se seleccionará a la comunidad que
participará en la feria regional y a la que participará en la feria distrital.
Determina la comunidad que participará en la feria regional, teniendo encuenta
que sus datos estadísticos sean los más homogéneos.
A B