POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...
Conceptos de estadistica descriptiva
1. Medidas de tendencia central
Se refiere al punto medio de una distribución y se denominan medidas de oposición
Moda: valor o clase que tiene la mayor frecuencia en un conjunto de observaciones
o es el valor que se repite más en un conjunto de datos. La moda puede no existir
o no ser única en cada de que exista. Una distribución con moda única se dice
unimodal. Si los datos tienen exactamente dos modas, se dice que son datos
bimodales; si tienen más de dos modas, son multimodales.
Datos no agrupados: valor que ocurre con mayor frecuencia en un conjunto de
datos.
Datos agrupados: la moda puede deducirse de una distribución de frecuencias o de
un histograma.
Mediana: es el valor que divide al conjunto ordenado de datos, en dos subconjuntos
con la misma cantidad de elementos. La mitad de los datos son menores que la
mediana y la otra mitad son mayores. Valor que queda en la parte central de un
grupo de observaciones arregladas en orden de magnitud.
Datos no agrupados: es el valor intermedio cuando los valores de los datos se
ordenan en forma ascendente.
Datos agrupados: cuando los datos se han organizado en una distribución de
frecuencias.
Media: es el promedio de los datos. Es una medida de localización central.
Datos no agrupados: es la suma de valores de todas las observaciones divididas
entre el número de observaciones realizadas.
Datos agrupados: datos obtenidos normalmente se organizan en una distribución
de frecuencias. Es el producto de cada valor diferente por el número de veces que
ha ocurrido y sumado después los productos así obtenidos.
Suma: es el total de todos los valores de los datos.
2. Medidas de dispersión
Es una característica importante de un conjunto de datos porque intenta dar una
idea de cuán esparcidos se encuentran estos. Juzga la confiabilidad de la medida
de tendencia central, si los datos están muy dispersos la posición central es menos
representativa de lo daos, como un todo, que cuando estos se agrupan más
estrechamente alrededor de la media.
Desviación estándar o desviación típica es la raíz cuadrada de la varianza, se
mide en la misma unidad que la variable y su interpretación es en promedio los
valores se alejan de la media en unidades.
Varianza: es el promedio de las distancias al cuadrado que van de las
observaciones de la media o es el cuadrado de la desviación estándar.
Rango: es la diferencia entre el mayor y menor de los valores observados.
Máximo: es el valor máximo que toman los datos
Mínimo: es el valor mínimo que toman los datos
Media de error estándar: es la desviación estándar de las posibles proporciones
muéstrales y se mide la dispersión de la proporción muestral. Se refiere a una
estimación de la desviación estándar, derivada de una muestra particular usada
para computar la estimación.
Distribución
Sesgo: las curvas que representan un conjunto de datos pueden ser simétricas o
sesgadas. Las curvas simétricas tienen una forma tal que una línea vertical, que
pase por el punto más alto de la curva, divide al área de esta en dos partes iguales,
si los valores se concentran en un extremo se dice sesgada. Una curva tiene sesgo
positivo cuando los valores van disminuyendo lentamente hacia el extremo derecho
de la escala y sesgo negativo en caso contrario.
Curtosis: nos da una idea de la agudeza (o lo plano) de la distribución de
frecuencias. Una curva normal (es el patrón con el que se compara la curtosis de
3. otras curvas) tiene curtosis 0. Esta curva se llama mesocúrtica, si la curtosis es
mayor que 0, la curva es más empinada que la anterior y se denomina leptocúrtica.
Si la curtosis es menor que 0, es relativamente plana y se denomina platicúrtica.