2. MEDIDAS DE TENDENCIA
CENTRAL
Se les llama medidas de tendencia central porque
general mente la acumulación más alta de datos se
encuentra en los valores intermedios.
Las medidas de tendencia central comúnmente
empleadas son :
Media aritmética
Mediana
Moda
Media geométrica
Media armónica
Los cuantilos
3. MODA
La moda es el valor que aparece con mayor
frecuencia en la serie de datos. Así por ejemplo, de
la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la
moda es 21.
La moda es una medida muy natural para describir
un conjunto de datos; su concepto se adquiere
fácilmente : es la altura más corriente, es la
velocidad más común, etc. Además tiene la ventaja
de que no se ve afectada por la presencia de
valores altos o bajos.
La principal limitación esta en el hecho de que
requiere un número suficiente de observaciones
para que se manifieste o se defina claramente.
Otros inconvenientes son que puede darse el caso
de que una determinada serie no tenga moda o
que tenga varias modas.
4. La moda
La moda de un conjunto de datos es el dato que más se repite.
Una zapatería ha vendido en una semana los zapatos
que se reflejan en la tabla:
Ejemplo.
Nº de calzado 38 39 40 41 42 43 44 45
Nº de personas 16 21 30 35 29 18 10 7
La moda es 41.
El número de zapato más
vendido, el dato con mayor
frecuencia absoluta, es el 41.
Lo compran 35 personas
5. MEDIANA
La mediana toma en cuenta la posición de los
datos y se define como el valor central de una
serie de datos o, más específicamente, como
un valor tal que no más de la mitad de las
observaciones son menores que el y no más
de la mitad mayores.
El primer paso es ordenar los datos de acuerdo
a su magnitud, luego se determina el valor
central de la serie y esa es la mediana. Si el
número de datos es par, existirán dos valores
centrales y entonces la mediana se obtiene
sacando el promedio de ellos.
6. Media aritmética (I)
La media aritmética de un conjunto de datos es el cociente entre la suma
de todos los datos y el número de estos.
Ejemplo: las notas de Juan el año pasado fueron:
5, 6, 4, 7, 8, 4, 6
La nota media de Juan es:
Hay 7 datos
40
5 6 4 7 8 4 6
Nota media = 5,7
7
7
que suman 40
7. Media aritmética (II)
Cálculo de la media aritmética cuando los datos se repiten.
1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2º. El resultado se divide por el total de datos.
Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia
absoluta
Notas x
F. absoluta
3 5 15
5 8 40
6 10 60
7 2 14
Total 25 129
Datos por frecuencias
5,1
129
Media
25
Total de datos
8. LOS CUANTILOS
En algunas ocasiones es importante
obtener valores que dividan el conjunto
de datos en fracciones especificas. Así
como la mediana divide el conjunto de
datos en dos partes iguales, es decir, la
mitad de los valores son inferiores a la
mediana y la otra mitad son superiores.
Si cada una de estas mitades se
volviera a dividir por la mitad, el
conjunto quedaría dividido en cuatro
partes y cada parte se llamara cuartilo.
Pero el conjunto puede dividirse
también por 10 (deciles) o por 100
(percentiles) y todos se llaman
cuantilos.
Tanto la mediana, como los cuartilos y
los deciles pueden expresarse como
percentiles.
9. Así que conociendo los percentiles se puede
averiguar cualquier cuantilo.
Para el calculo de los percentiles, el conjunto de
datos debe estar ordenado, luego se aplica la
siguiente formula :
Pm = m (n+1) termino
100
Donde : Pm = Percentil m. Valor tal que un
m/100 de las observaciones son menores que el
y un 1 - m/100 son mayores.
m = Número que indica el percentil que se
quiere. Por ejemplo, si m = 43, esto quiere decir
que se quiere el percentil 43 (P43).
n = Número total de observaciones.
10. MEDIA ARITMÉTICA
La media aritmética es el promedio más comúnmente usado,
este puede ser simple o ponderado. La media aritmética
simple esta dada por la formula SX/n y que significa: la suma
de todos los valores dividida por el número de datos.
Media Aritmética Ponderada
Si los valores que toma x en una serie de datos, no todos tienen
la misma importancia, es valido asignar "pesos" o
"ponderaciones" de acuerdo a la importancia de cada dato.
En la serie del ejemplo anterior aparecen los números; pero
cada uno con diferente frecuencia. Si cada uno de estos datos
se multiplica por su respectiva frecuencia o ponderación y se
suman estos productos, se obtendrá la misma suma que si se
hubieran sumado uno por uno.
11. Media Geométrica
La media geométrica es la
raíz enésima del producto
de todos los valores de la
serie.
Media Armónica
La media armónica se
define como el recíproco
de la media aritmética de
los recíprocos de los
valores y reacomodando la
fórmula se tiene:
12. TABLAS ESTADÍSTICAS
Consideremos una
población estadística de
n individuos, descrita
según un carácter o
variable C cuyas
modalidades han sido
agrupadas en un número
k de clases, que
denotamos mediante .
Para cada una de las
clases ci,
introducimos las
siguientes magnitudes:
13. Frecuencia absoluta
de la clase ci es el número ni, de
observaciones que presentan una modalidad
perteneciente a esa clase.
Frecuencia relativa
de la clase ci es el cociente fi, entre las
frecuencias absolutas de dicha clase y el
número total de observaciones, es decir
Obsérvese que fi es el tanto por uno de
observaciones que están en la clase ci.
Multiplicado por representa el porcentaje de
la población que comprende esa clase.
Frecuencia absoluta acumulada
Ni, se calcula sobre variables cuantitativas o
cuasicuantitativas, y es el número de
elementos de la población cuya modalidad
es inferior o equivalente a la modalidad ci:
14. Frecuencia relativa acumulada
Fi, se calcula sobre variables
cuantitativas o cuasicuantitativas,
siendo el tanto por uno de los
elementos de la población que
están en alguna de las clases y que
presentan una modalidad inferior o
igual a la ci, es decir,
Como todas las modalidades son
exhaustivas e incompatibles ha de
ocurrir que o lo que es lo mismo,
Frecuencia absoluta (ni): Número
de elementos que presentan la
clase xi.
16. Llamaremos distribución de frecuencias al conjunto de
clases junto a las frecuencias correspondientes a cada
una de ellas. Una tabla estadística sirve para presentar
de forma ordenada las distribuciones de frecuencias. Su
forma general es la siguiente:
17. Modali. Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu.
C ni fi Ni Fi
c1 n1 N1 = n1
... ... ... ... ...
cj nj
... ... ... ... ...
ck nk Nk = n Fk = 1
n 1
18. MEDIDAS DE POSICIÓN
Son indicadores usados para señalar que porcentaje
de datos dentro de una distribución de frecuencias
superan estas expresiones, cuyo valor representa el
valor del dato que se encuentra en el centro de la
distribución de frecuencia, por lo que también se les
llama " Medidas de Tendencia Central ".
Pero estas medidas de posición de una distribución
de frecuencias han de cumplir determinadas
condiciones para que lean verdaderamente
representativas de la variable a la que resumen. Toda
síntesis de una distribución se considerara como
operativa si intervienen en su determinación todos y
cada uno de los valores de la distribución, siendo
única para cada distribución de frecuencias y siendo
siempre calculable y de fácil obtención. A
continuación se describen las medidas de posición
más comunes utilizadas en estadística, como lo
son:deciles,percentiles,cuartiles.
19. MEDIDAS DE DISPERSIÓN:
Rango:
Es la primera medida que vamos a estudiar, se
define como la diferencia existente entre el valor
mayor y el menor de la distribución,. Lo notaremos
como R. Realmente no es una medida muy
significativa e la mayoría de los casos, pero
indudablemente es muy fácil de calcular.
20. Desviación: Es la diferencia que se observa entre el valor
de la variable y la media aritmética. La denotaremos por
di .
Desviaciòn media.
Es la media de los valores absolutos de las
desviaciones, y la denotaremos por dm.
21. VARIANZA:
Es la media de los cuadrados de las desviaciones,
y la denotaremos por o también por
r
Aunque también es posible calcularlo como:
25. COEFICIENTE DE VARIACIÓN:
Es un estadístico de dispersión que tiene la ventaja
de que no lleva asociada ninguna unidad, por lo
que nos permitirá decir entre dos muestras, cual es
la que presenta mayor dispersión. La denotaremos
por C.V.
26. DATOS AGRUPADOS
Son datos que están organizados (formando
grupos). Podemos formar más o menos grupos,
dependiendo de que tan exacto queramos trabajar,
a cada grupo le llamamos clase. Rara vez se
emplean menos de seis clases o más de quince.
27. VENTAJAS
Facilidad y rapidez al manejo de datos.
Se notan rápidamente el valor mayor y el valor
menor de los datos
Se puede dividir fácilmente los datos en secciones.
Se puede observar si algún valor aparece mas de
una vez en el ordenamiento.
Se observa la distancia entre los valores sucesivos
de los datos.
28. DATOS NO AGRUPADOS
Son datos no agrupados cuando se
consideran y analizan todos los valores
observados tal como se obtuvieron. Es
conveniente y mas sencillo trabajar a estos
datos como no agrupados cuando la
muestra no es muy grande. De preferencia
que sea una cantidad menor de 30 datos.
También resulta conveniente trabajarlos así
cuando se quiere que el peso de cada
observación sevea reflejado en el resumen
de los datos.
29. VENTAJAS
Resulta más fácil y rápido trabajar con los datos
no agrupados.
DESVENTAJAS
Solo se puede aplicar en pequeñas cantidades
de datos, ya que en grandes cantidades
resultaría un tanto tedioso y por lo mismo
existiría más probabilidad de equivocarse.