Los grados de libertad son el número de datos independientes utilizados en cálculos estadísticos. Cuanto mayor sea el número de grados de libertad, más seguros podemos estar de que la muestra representa correctamente a la población. La distribución t de Student toma en cuenta la incertidumbre en la estimación de la desviación estándar de la población y generalmente es más ancha que la distribución normal para muestras pequeñas, pero se aproxima a la distribución normal a medida que aumenta el tamaño de la muestra.
1. Grados de libertad
En estadística, los grados de libertad son el número de piezas independientes de datos usados en cálculos. El número de grados de libertad es usado para medir qué tan exacta es la muestra de la población usada en la investigación para representar a la población por entero. Mientras más grados de libertad, más seguros podemos estar de que la población por entero ha sido muestreada correctamente. Los grados de libertad con frecuencia se representan en estadística con la letra griega nu.
Identificación de Valores Atípicos
El procedimiento de identificación de Valores Atípicos está diseñado para ayudar a determinar si una muestra de n observaciones numéricas contiene o no va lores atípicos. Por “valor atípico” (outlier), queremos decir una observación que no proviene de la misma distribución que el resto de la muestra. Se incluyen ambos métodos: gráficos y pruebas estadísticas formales. El procedimiento también salva una columna en la hoja de datos identificando el valor atípico en una forma que pueda ser usado en campo Selección en otra caja de diálogo de ingreso de datos.
Distribución normal en relación con t-student para muestras pequeñas
El estadístico T tiene una distribución que se denomina distribución T de Student, que está tabulada para v= 1, 2, 3, ... etc. grados de libertad como único parámetro de la misma, de la muestra con la cual se calcula la desviación standard. La distribución T tiene en cuenta la incertidumbre en la estimación de la desviación standard de la población, porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad.
La distribución T, en general, es mas ancha que la distribución normal estándar Para un número de grados de libertad pequeño (digamos menores que 30, ver grafica de arriba). Cuando los grados de libertad tienden a infinito (deslice el valor de v y observe las probabilidades acumuladas), la distribución T tiende a coincidir con la distribución normal standard. Es decir, en la medida que aumentemos el número de observaciones de la muestra, la desviación standard calculada estará mas próxima a la desviación standard de la población y entonces la distribución T correspondiente se acerca a la distribución normal standard. El uso de la distribución T presupone que la población con que estamos trabajando tiene una distribución normal.