Este documento describe conceptos básicos de estadística descriptiva como frecuencias, medidas de posición central como la media y mediana, y medidas de posición no central como cuartiles y percentiles. Explica que la estadística descriptiva caracteriza conjuntos de datos resumiendo sus propiedades para describirlas adecuadamente.
3. La estadística descriptiva es la rama de las Matemáticas que
recolecta, presenta y caracteriza un conjunto de datos (por ejemplo,
edad de una población, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) con el fin de describir
apropiadamente las diversas características de ese conjunto.
Estadística descriptiva
La razón de ser de este tipo de medidas es conocer de manera
resumida una característica de la variable estudiada.
4. FRECUENCIA ABSOLUTA (n) : Para datos no agrupados en intervalos, es el número
de veces que se presenta cada valor de la variable. Si los datos se agrupan en
intervalos, es el número de observaciones que pertenecen a dicho intervalo.
FRECUENCIA ABSOLUTA ACUMULADA (N) : Para un cierto valor de la variable, la
frecuencia absoluta acumulada nos da el número de observaciones menores o iguales
que dicho valor.
OTRAS FRECUENCIAS :
FRECUENCIA RELATIVA (r) : Cociente entre la frecuencia absoluta y el número total
de observaciones (N).
PROPORCIÓN o PORCENTAJE (p) : Frecuencia relativa multiplicada por 100 (es la
expresión de las frecuencias en %). De igual modo que se definió para las frecuencias
absolutas, se definen las FRECUENCIAS RELATIVAS ACUMULADAS (R) y los
PORCENTAJES ACUMULADOS (P).
Frecuencias
5.
6. MEDIDAS DE POSICIÓN CENTRAL
Informan sobre los valores medios de la serie de datos.
Las principales medidas de posición central son las siguientes:
a) Media aritmética: se calcula multiplicando cada valor por el número de veces que
se repite. La suma de todos estos productos se divide por el total de datos de la
muestra:
b) Media geométrica: se eleva cada valor al número de veces que se ha repetido. Se
multiplican todo estos resultados y al producto final se le calcula la raíz "n" (siendo "n"
el total de datos de la muestra).
7. Permiten conocer puntos característicos de una serie de valores, que no necesariamente
tienen que ser centrales. La intención de estas medidas es dividir el conjunto de
observaciones en grupos con el mismo número de valores.
Las principales medidas de posición no central son :
Cuartiles
Son los tres valores que dividen una serie de datos ordenada en cuatro porciones iguales.
El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El segundo (Q2) deja a
izquierda y derecha el 50% y coincide con la mediana. El tercero (Q3) deja a la derecha el
25% de valores. Los tres cuantiles son:
MEDIDAS DE POSICIÓN NO CENTRAL
8. Percentiles
Son los 99 puntos que dividen una serie de datos ordenada en 100 partes iguales, es decir, que
contienen el mismo número de elementos cada una. El percentil 50 es la mediana.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:
Donde Pi es la posición del percentil buscado en la serie ordenada de datos.
Los percentiles están pensados para conjuntos de elementos de más de cien elementos.