El documento describe diferentes medidas estadísticas para resumir conjuntos de datos, incluyendo medidas de posición como la media, mediana y moda, y medidas de dispersión como el desvío estándar y la varianza. Explica cómo calcular cada medida y qué información proporciona sobre los datos.
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
Medidas de Posición y Dispersión
1. Medidas de Posición: son aquellos valores numéricos que nos permiten
o bien dar alguna medida de tendencia central, dividiendo el
recorrido de la variable en dos, o bien fragmentar la cantidad de
datos en partes iguales. Las más usuales son la media, la mediana, la
moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser de
dos tipos: de tendencia central o de tipismo.
Medidas de Dispersión: se llaman medidas de dispersión aquellas que
permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentración de los
datos en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas. Las más usuales son el
desvío estándar y la varianza.
Medidas de tendencia central
2. medias de los diferentes conjuntos. 3) Es posible hallar la media
de La idea de media o promedio (también llamada media
aritmética) formaliza el concepto intuitivo de punto de equilibrio
de las observaciones. Es decir, es el punto medio del recorrido de
la variable según la cantidad de valores obtenidos.
Ese valor tiene varias propiedades importantes. 1) Si se suma la
distancia de todos los valores respecto de la media, esa suma da
cero. 2) Si se toman una cantidad cualesquiera de conjuntos de
valores, cada uno con su respectiva media, la media del conjunto
general es igual a la suma de cada una de las un conjunto de
valores de una variable a partir de tomar la distancia de las
observaciones a un valor cualquiera (pertenezca o no al recorrido
de la variable) 4) si a un conjunto de observaciones de una
variable se le realiza una operación matemática usando un valor
constante, entonces la media del nuevo grupo de valores así
obtenidos es igual a la aplicación de la misma operación
matemática usando ese valor constante sobre la media original.
La Media
3. El cálculo de la Media
Dado un conjunto de observaciones
la media se representa mediante y se obtiene dividiendo la suma de todos los
datos por el número de ellos, es decir:
La interpretación de la media como centro (o punto de equilibrio) de los datos se
apoya en una propiedad que afirma que la suma de las desviaciones
de un conjunto de observaciones a su media es igual a cero; es decir, puede
probarse que
4. La media aritmética de un conjunto de datos es el cociente entre la suma
de todos los datos y el número de estos.
Ejemplo: las notas de Juan el año pasado fueron:
5, 6, 4, 7, 8, 4, 6
La nota media de Juan es:
Nota media = 7,5
7
40
7
6487465
==
++++++
que suman 40
Hay 7 datos
Media aritmética (I)
5. Cálculo de la media aritmética cuando los datos se repiten.
Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia
absoluta
Notas x
F. absoluta
3 5 15
5 8 40
6 10 60
7 2 14
Total 25 129
1,5
25
129
Media ==
Datos por frecuencias
Total de datos
1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2º. El resultado se divide por el total de datos.
Media aritmética (II)
6. Mediana
La mediana, a diferencia de la media no busca el valor central del recorrido de la variable
según la cantidad de observaciones, sino que busca determinar el valor que tiene
aquella observación que divide la cantidad de observaciones en dos mitades iguales.
Por lo tanto es necesario atender a la ordenación de los datos, y debido a ello, este
cálculo depende de la posición relativa de los valores obtenidos. Es necesario, antes
que nada, ordenar los datos de menor a mayor (o viceversa).
en caso que N sea impar
7. La mediana de un conjunto de datos es un valor del mismo tal que el número de
datos menores que él es igual al número de datos mayores que él.
Los pesos, en kilogramos, de 7 jugadores de un
equipo de fútbol son:
Ejemplo:
72, 65, 71, 56, 59, 63, 72
1º. Ordenamos los
datos:
56, 59, 63, 65, 71, 72, 72
2º. El dato que queda en el centro es
65.
La mediana vale 65.
Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es:
64
2
6563
=
+
Caso:
La mediana
8. Moda
La moda, es aquel dato, aquel valor de la
variable que más se repite; es decir, aquel
valor de la variable (que puede no ser un
único valor) con una frecuencia mayor.
9. La moda de un conjunto de datos es el dato que más se repite.
Una zapatería ha vendido en una semana los zapatos
que se reflejan en la tabla:
Ejemplo.
La moda es 41.
Nº de calzado 38 39 40 41 42 43 44 45
Nº de personas 16 21 30 35 29 18 10 7
El número de zapato más
vendido, el dato con mayor
frecuencia absoluta, es el 41.
Lo compran 35 personas
La moda
10. Cuartil, Quintiles, Deciles,
Percentiles
La mediana, como vimos, separa en dos mitades el conjunto ordenado
de observaciones. Podemos a su vez subdividir cada mitad en dos,
de tal manera que resulten cuatro partes iguales. Cada una de esas
divisiones se conoce como Cuartil y lo simbolizaremos mediante la
letra Q agregando un subíndice según a cual de los cuatro cuartiles
nos estemos refiriendo. Se llama primer cuartil (Q1) a la mediana
de la mitad que contiene los datos más pequeños. Este cuartil,
corresponde al menor valor que supera – o que deja por debajo de
él – a la cuarta parte de los datos. Se llama tercer cuartil (Q3) a la
mediana de la mitad formada por las observaciones más grandes.
El tercer cuartil es el menor valor que supera – o que deja por
debajo de él – a las tres cuartas partes de las observaciones. Con
esta terminología, la mediana es el segundo cuartil (Q2) y el cuarto
cuartil (Q4) coincide con el valor que toma el último dato, luego de
ordenados.
11. Medidas de Dispersión
El desvío estándar
Es posible identificar conjuntos de datos que a pesar de ser muy
distintos en términos de valores absolutos, poseen la misma media.
Una medida diferencial para identificar esos conjuntos de datos es
la concentración o dispersión alrededor de la media.
Una manera de evitar que los distintos signos se compensen es
elevarlas al cuadrado, de manera que todas las desviaciones sean
positivas. La raíz cuadrada del promedio de estas cantidades recibe
el nombre de desvío estándar, o desviación típica y es representada
por la siguiente fórmula:
12. A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a
su media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende
entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la
media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más
“homogéneo” que si el valor de la desviación estándar fuera más grande. O sea que a menor
dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad.
La Varianza
El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La
suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media
aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de
cualquier otro valor que no sea la media aritmética.
Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado.
Precisamente la manera de simbolizarla es.
Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza