2. UNIDAD III : RESUMEN DE DATOS
RECOLECTADOS
2
• Medidas de resumen: tendencia central: media, mediana y
moda; de dispersión: desviación estándar, varianza,
coeficientes de variación; simetría.
3. Medidas de tendencia central: MEDIA, MEDIANA, MODA
PROMEDIO O MEDIDAS DE TENDENCIA CENTRAL
Un promedio es un valor típico o representativo de un conjunto de datos.
Como tales valores suelen situarse hacia el centro del conjunto de datos
ordenados por magnitud, los promedios se conocen como medidas de tendencia
central.
Se define varios tipos, siendo los más comunes la media aritmética, la mediana,
la moda, para datos dispersos y agrupados por intervalos.
4. MEDIAARITMETICA :
La media aritmética o simplemente media, de un conjunto
de N números X1+X 2 + X3……..+XN se denota por:
Ejemplo:
La media aritmética de los números 8, 3, 5, 12 y 10 es:
4
5. Si los números x1,…, x2,…,xk ocurren f1, f2,…, fk veces,
respectivamente (o sea, con frecuencias f1, f2,….,fk), la
media aritmética es:
5
Ejemplo:
Si 5, 8, 6 y 2 ocurren con frecuencia 3, 2, 4 y 1
respectivamente, su media aritmética es:
6. MEDIA PONDERADA.
▸ Cuando los valores por promediar tienen diferentes grados de importancia
entre sí, debe utilizarse el promedio ponderado, el cual aplica un factor de
ponderación (o importancia relativa) a cada uno de los valores que se van a
promediar.
▸ Tal vez no sea lo mismo un empleado con 10 en conocimientos, 10 en
puntualidad y 7 en presentación (promedio = 9), que otro con 10 en
conocimientos, 7 en puntualidad y 10 en presentación (promedio = 9).
6
7. LA MEDIA ARITMETICA PONDERADA
A veces asociamos con los números x1,…, x2,…,xk ciertos factores peso ( o
pesos) w1, w2,…, wk dependientes de la relevancia asignada a cada
número. En tal caso,
=
7
Ejemplo:
Si el examen final de un curso cuenta tres veces más que una evaluación parcial, y un
estudiante tiene calificación 85 en el examen final y 70 y 90 en los parciales, la
calificación media es:
9. La mediana
▸ La mediana (Md) es una medida de posición que
divide a la serie de valores en dos partes iguales
▸ Consideramos una variable discreta X cuyas observaciones en
una tabla estadística han sido ordenadas de menor a mayor.
Llamaremos mediana, M al primer valor de la variable que
deja por debajo de sí al 50 % de las observaciones.
La mediana de un conjunto de números ordenados en magnitud
es o el valor central o la media de los valores centrales.
9
10. Características básicas de la mediana
▸ 1. El valor de la mediana se afecta por el número de datos, no por la magnitud de ningún
valor extremo.
▸ 2. Es igualmente probable que cualquier observación escogida al azar sea mayor o menor
que la mediana.
▸ 3. Se puede determinar, incluso en distribuciones con intervalos abiertos.
▸ 4. La suma de los cuadrados de las desviaciones respecto a la mediana es un valor
mínimo.
▸ En los casos en que los datos contengan valores extremos, y considerando la cuarta
propiedad de la media, es mejor utilizar la mediana en lugar de la media como medida de
tendencia central.
10
11. ▸ Ordenamos los valores en orden creciente,
▸ 0 0 0 1 1 2 2
▸ El 1 será el valor que cumple la definición
de mediana.
11
12. Ejemplo:
El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8, y 10 tiene
mediana?
El conjunto de números 5, 5, 7, 9, 11, 12, 15 y 18 tiene
mediana?
12
13. LA MODA:
La moda de un conjunto de números es el valor que ocurre con mayor frecuencia,
es decir, el valor más frecuente. La moda puede no existir, e incluso no ser
única en caso de existir.
Ejemplo:
El conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12 y 18 tiene moda?
El conjunto: 3, 5, 8, 10, 12, 15, y 16?
El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, y 9 tiene moda?
Una distribución con moda única se dice unimodal
13
14. Medidas de variabilidad o dispersión
▸ Los estadísticos de tendencia central o posición nos indican donde se
sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos
indican si esas puntuaciones o valores están próximas entre sí o si por
el contrario están o muy dispersas.
14
15. Medidas de variabilidad o dispersión
1- Rango
2- desviación típica: S=
𝑥𝑖− 𝑥 2
𝑛−1
3- varianza: : 𝑆2
4- Covarianza:
5- desviación media:
15
16. RANGO
▸ El rango es un valor numérico que indica la diferencia
entre el valor máximo y el mínimo de una población
o muestra estadística
▸ El rango estadístico también se conoce como amplitud o
recorrido de medida.
▸ Así pues, el rango es una medida de dispersión junto con
la varianza, la desviación típica (o desviación estándar), la
desviación media y el coeficiente de variación
16
17. Para que sirve
▸ En estadística, el rango muestra la diferencia entre el valor
máximo y el valor mínimo de un conjunto de datos, por lo tanto, el
rango es una medida que sirve para indicar la dispersión
total de un conjunto de datos.
▸ Cuando se sabe el valor del rango de una serie de datos, se
conoce cuál es la máxima diferencia entre dos observaciones de
ese conjunto, de modo que uno se puede hacer una idea de si los
datos están muy dispersos o están muy juntos. En general,
interesa que el rango sea el mínimo posible, ya que esto significa
que hay poca dispersión y por tanto los cálculos serán más
precisos. 17
18. Desviación media
▸ La desviación media es la media aritmética de los valores
absolutos de las desviaciones respecto a la media.
▸ Informa de lo muy dispersados (o no) que están los
datos. Una desviación media elevada implica mucha
variabilidad en los datos mientras que una desviación
media igual a cero implica que todos los valores
son iguales y por lo tanto coinciden con la media
▸ Mide la desviación que existe en los datos respecto de
un valor dado
18
19. Varianza:
▸ Es la media aritmética de los cuadrados de las
desviaciones de todos los valores de la variable
estadística o marcas de clase respecto de la media,
se simboliza por la letra
▸ Es una medida de dispersión que representa la
variabilidad de una serie de datos, respecto a su media
19
20. Desviación Típica
▸ Es una medida que se utiliza para cuantificar la
variación ó dispersión de un conjunto de datos
numéricos, y permite medir que tan alejados están los
datos en relación a la media
▸ En la Desviación típica entre mayor sea el numero
de la desviación, nos indica que esos datos están
muy alejados de la media, y lo mejor para un grupo
de datos que se pueda catalogar cómo
representativos, es que la desviación sea un numero
pequeño 20
21. La covarianza
▸ mide la covariación conjunta de dos variables: Si es
positiva nos dará la información de que a valores altos
de una de las variable hay una mayor tendencia a
encontrar valores altos de la otra variable y a valores
bajos de una de las variable ,correspondientemente
valores bajos
▸ Es decir que hace la variable x cuando aumenta la
variable y
▸ Tipos: positiva y negativa. 21
22. Cuando los datos están ordenados en una tabla de frecuencias
se tiene
1. Desviación típica : S =
𝑓𝑖𝑥2 −
( 𝑓𝑖𝑥𝑖)
2
𝑓𝑖
𝑓𝑖−1
2. Varianza: 𝑆2
3. Covarianza:
4. Desviación Media:
22