SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
Taller medidas de dispersión
1. MEDIDAS DE DISPERSION
¿POR QUE SE ESTUDIA LA DISPERSION?
Un promedio como la media o la mediana solo localizan el centro de los datos. Eso es
valioso desde ese punto de vista, pero un promedio no nos dice nada acerca de la
dispersión de los datos. Por ejemplo si un guía de la selva le dice que el rio tiene una
profundidad promedio de 3 metros, ¿lo cruzaría sin información adicional? Probablemente
no. Usted querría saber algo más acerca de la variación de la profundidad. Si la
profundidad máxima es de 3,25 metros y la mínima de 2,75; en tal caso usted
probablemente lo cruzaría. Pero ¿qué sucedería si usted se entera que la profundidad del
rio va de 0,5 metros a 5,5 metros? Entonces quizás usted no se decidiría a cruzarlo. Antes
de decidirse a cruzar el rio, usted deseara tener información acerca de la profundidad
típica y sobre la variación de la profundidad del rio.
Una segunda razón para estudiar la variación de un conjunto de datos es
comparar la dispersión de los datos en dos conjuntos poblacionales o muéstrales.
Así, Un valor pequeño en la medida de dispersión indica que los datos están
estrechamente agrupados alrededor de la media, por lo tanto la media se
considera una medida representativa de los datos – se dice que la media es un
promedio confiable.
Inversamente una medida de dispersión grande indica que la media no es
confiable – la media no es representativa de los datos
2. MEDIDAS DE DISPERSION PARA DATOS EN BRUTO
Las medidas de dispersión sirven para identificar la separación o distancia de los
valores de un conjunto de datos respecto a un valor central (media).
Al calcular una medida de tendencia central como la media es necesario
acompañarla de otra medida que indique el grado de dispersión o variabilidad de
los demás valores del conjunto de datos respecto al valor medio.
A cualquier característica de la población (media, desviación media, varianza,
desviación estándar) que puede ser medida se le llama PARÁMETRO, y si la
medida se basa en datos muéstrales entonces la medida de tal característica
(media, desviación media, varianza, desviación estándar) se llama ESTADÍSTICO.
De aquí en adelante, Los parámetros se designaran con letras griegas y los
estadísticos con letras romanas.
LA DESVIACION MEDIA MUESTRAL Y PÓBLACIONAL
La desviación media DM es la media de las desviaciones (diferencia o distancia) en valor
absoluto de cada uno de los datos de la variable a la media de grupo.
La fórmula para calcular la desviación media poblacional y la desviación media maestral
son las siguientes:
Si se calculara la desviación media por la suma de las diferencias positivas y negativas
entre cada dato y la media de grupo, la respuesta seria, siempre igual a cero (0). Por esta
razón son los valores absolutos de las diferencias lo que se suma.
EJEMPLO: En una de las bodegas del INVIMA (N°1), un almacenista registra durante diez
días el número de artículos, en lotes de 100, que no cumplen el control de calidad:
12, 10, 9, 7, 12, 11, 9, 15, 7, 8.
Encuentra la desviación media e interprétala.
3. 1° PASO. Hallamos la media muestral de la distribución:
X =∑ [ Xi ] / n =
2° PASO: Hallamos el valor absoluto de la desviación de cada dato
│ - │= │ - │= │ - │= │ - │=
│ - │= │ - │= │ - │= │ - │=
│ - │= │ - │=
3° PASO: Sumamos todas las desviaciones y las promediamos para obtener la desviación
media.
Si en otra bodega del INVIMA (N°2) se hace el mismo control durante diez días a
los artículos, en lotes de 100, que no cumplen el control de calidad, y se encuentra
una media de 10 productos que no cumplen dicho control de calidad y una
desviación media de 3,2 productos que no cumplen los requisitos mínimos de
aceptación, ¿Cuál de las dos bodegas tiene productos con mejor calidad?
VARIANZA Y DESVIACION ESTANDAR.
La varianza y la desviación estándar también se basan en la desviación de la media, pero
en lugar de usar valores absolutos, elevamos al cuadrado las desviaciones, para evitar los
resultados negativos.
LA VARIANZA POBLACIONAL Y MUESTRAL.
La varianza es la media de los cuadrados de las desviaciones de cada uno de los datos de
la variable respecto al a media.
Las fórmulas para la varianza poblacional y la varianza muestral son las siguientes:
4. Como puede verse las formulas de la varianza poblacional y la varianza muestral
son ligeramente diferentes, puesto que la varianza de una muestra no es, en
términos de cálculo, completamente equivalente a la varianza de la población.
Para este caso, el denominador de la varianza muestral es n - 1. Este es llamado un
factor de corrección para que la varianza sea un estimador puntual insesgado para
la varianza de la población. De este modo, cada vez que se estima un parámetro
poblacional utilizando un estadístico de muestra se pierde un grado de libertad.
El uso principal de estadísticos como la varianza muestral es estimar parámetros
como la varianza poblacional, es decir, que la varianza de la muestra sea un valor
equivalente a la varianza de la población. En general, un estimador es un
estadístico muestral cuyo valor esperado es igual al parámetro poblacional.
EJERCICIO (RESOLVER Y ENTREGAR): En una campaña de salud pública el jefe de la misión
médica encontró nueve personas en estado de emergencia debido al dengue hemorrágico
en el Departamento de Sucre, con las sig edades: 13, 15, 22, 24, 14, 17, 19, 21, 20.
Encuentre la varianza e interprétala.
PASO 1°.Hallamos la media poblacional del conjunto de datos.
µ =∑ [ Xi ] / N =
PASO 2°.Hallamos los cuadrados de las deviaciones de cada dato
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
=
PASO 3°. Sumamos todas las desviaciones cuadradas y las promediamos:
5. Si en el Departamento de Atlántico se registró el mismo número de personas con
Dengue con un promedio de edad de 18 años y una varianza 15, 2 años cuadrados.
¿En cuál de los departamentos, las personas con Dengue tienen una edad menos
variable (Edad más homogénea, es decir, con un promedio de edad más confiable).
DESVIACION ESTANDAR POBLACIONAL Y MUESTRAL.
Por lo general, resulta difícil interpretar el significado del valor de una varianza porque las
unidades en las que se expresa son valores al cuadrado. (Ejemplo anterior años
cuadrados). En parte, por esta razón, se utiliza con mayor frecuencia la raíz cuadrada de la
varianza y se le denomina desviación estándar o típica, cuyas fórmulas para el caso de
datos poblacionales y de datos muéstrales son:
La desviación estándar es especialmente UTIL cuando se utiliza junto con la
denominada distribución normal. Aproximadamente 68% delas observaciones
estarán entre mas y menos una desviación estándar de la media y cerca del 95% de
las observaciones entre mas y menos dos desviaciones estándar de la media.
6. EJERCICIO (RESOLVER Y ENTREGAR): El gerente de un hospital registra durante 9 días del
mes de Abril, la atención especializada a pacientes con cáncer: 19, 21, 19, 17, 22,
23, 18, 15, 17.
Encuentre la desviación estándar e interprétala.
PASO 1°. Hallamos la media muestral:
X =∑ [ Xi ] / n =
PASO 2°. Hallamos el cuadrado de la desviación de cada dato:
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
= ( - )2
= ( )2
=
( - )2
= ( )2
=
PASO 3°. Hallamos la raíz cuadrada de del promedio de estos valores:
Si en el siguiente mes, toma el mismo registro y encuentra un promedio de 18
pacientes con cáncer atendidos por día con una desviación estándar de 2,1
pacientes atendidos por día. ¿En cuál mes hubo un mejor promedio de pacientes
con cáncer atendidos por día?
7. MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS
DESVIACIÓN MEDIA PONDERADA POBLACIONAL Y MUESTRAL
Cuando los valores en una serie estadística se repiten, es decir, se pueden dar en términos de
frecuencia, se calcula la desviación media ponderada sumando los productos de las deviaciones
de cada valor por el número de veces que se repita, dividida por el número total de
observaciones. Así sus fórmulas para el caso de poblaciones y de datos muéstrales serán:
EJEMPLO: A fin de organizar la contabilidad en el almacén “El surtidor N° 1”, el gerente
recolecta la información del salario quincenal de sus 65 empleados. Los datos se dan en miles.
305 305 315 295 285 285 265 275 275 255 265 295 315 255 285 285 265 275 275 315 305
295 285 275 255 265 275 285 305 255 275 275 275 285 295 265 285 295 275 255 285 275
305 295 285 275 295 255 255 265 255 285 285 275 275 275 295 285 265 285 265 265 265
265 295.
x f f.x x - µ │x - µ │ f.│ x - µ│
N = ∑ f . x = ∑ f .│ x - µ │ =
8. 1.Calclule el salario medio ponderado poblacional de los 65 empleados:
µ = ∑ [ f . x ] / N =
2.Calcule la desviacion media de los datos:
Luego, la desviacion media poblacion es:
VARIANZA POBLACIONAL Y MUESTRAL
Cuando los datos de la variable se repiten, la varianza se puede expresar para una población y
una muestra cómo sigue:
Para cálculos abreviados se usa:
EJEMPLO: Con la informacion de los salarios de los empleados del almacen “ el surtidor N° 1”
calcule la varianza por metodo largo.
305 305 315 295 285 285 265 275 275 255 265 295 315 255 285 285 265 275 275 315 305
295 285 275 255 265 275 285 305 255 275 275 275 285 295 265 285 295 275 255 285 275
305 295 285 275 295 255 255 265 255 285 285 275 275 275 295 285 265 285 265 265 265
265 295.
9. x f f.x x - µ ( x - µ )2
f.( x - µ)2
N = ∑ f . x = ∑ f .( x - µ )2
=
1.Calclulamos el salario medio ponderado de los 65 empleados ( Que ya se encontro en el
ejercicio anterior)
µ = ∑ [ f . x ] / N =
2.calculamos la varianza poblacional de los datos salario quincenal:
DESVIACIÓN ESTÁNDAR POBLACIONAL Y MUESTRAL
La desviación estándar o desviación típica es la raíz cuadrada de la varianza, por lo tanto sus
formula en términos de datos poblacionales y datos muéstrales son:
Para cálculos abreviados se usa:
10. EJERCICIO (RESOLVER Y ENTREGAR): calcule la desviacion tipica o estandar para los salarios
quincenales del almacen “ el surtidor” usando el metodo corto o formulas abreviadas.
x f f . x X2
f . X2
N = ∑ f . x = ∑( f . x2
) =
1. Calclulamos el salario medio ponderado de los 65 empleados ( ya se calculo)
µ = ∑ [ f . x ] / N =
2. La desviación típica por el método corto está dada por:
Luego, la desviación estándar poblacional es:
Si el dueño tiene varios almacenes y, decide determinar el salario promedio de los
empleados en el “SURTIDOR N° 2” y encuentra que estos tienen un promedio salarial µ
de 280 mil pesos y una desviacion estandar de 12,7 en milies de pesos ¿En cual de los
dos almacenes podria decirse que los empleados tienen un salario casi igual?
3. Ahora calcula la desviación estándar por el método largo:
¿Se tiene el mismo resultado que por el método corto? Justifique!