DISTRIBUCION T -STUDENT
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE CIENCIAS MEDICAS
UNIDAD DE BIOESTADISTICA 2025
ING. MIGUEL ANGEL AGUILAR
2.
DISTRIBUCION t –Student
Aspectos importantes a considerar:
1. Se considerará una muestra grande, a una muestra mayor o igual que 30.
(Daniel, 2008, p. 149)
2. Cuando una muestra es grande, la confianza en s como una aproximación de σ es por lo
general sustancial, por lo que se justifica la utilización de la teoría de la distribución normal
para construir un intervalo de confianza para la media de la población. (Daniel, 2008, p183)
3. Cuando se tienen muestras pequeñas es imprescindible encontrar otro procedimiento para
construir un intervalo de confianza. (Daniel, 2008,p183)
4. Como resultado del trabajo de Gosset, escrito bajo el pseudónimo de “student” se dispone de
otra alternativa, conocida como distribución t de Student. (Daniel, 2008, p183)
3.
¿CUANDO UTILIZAR LADISTRIBUCION T-STUDENT?
• Criterio a seguir para utilizar la distribución t-student en intervalos de
confianza para la media de una población:
Utilizar distribución t –student para intervalos de confianza
únicamente si la muestra es menor a 30 y se desconoce la varianza
poblacional. (σ2 ) (Daniel, 2008, p188)
• Criterios a seguir para utilizar la distribución normal (distribución z)
en intervalos de confianza para la media de una población:
1. Si la muestra es mayor o igual a 30, no importando si la varianza
es poblacional o muestral. (Daniel, 2008, p188)
2. Si la muestra es menor a 30 y sí se conoce la varianza
poblacional. (σ2 ) (Daniel, 2008, p188)
4.
CARACTERISTICAS DE LADISTRIBUCION t-student
FIGURA 1. Distribución t para diferentes grados de libertad
1. Tiene una media de 0.
2. Es simétrica con respecto a la media.
3. En general, tiene una variancia mayor que 1, pero ésta tiende a 1 a medida que aumenta el tamaño de la muestra.
4. La variable t va de -∞ hasta + ∞
5. La distribución t es una familia de distribuciones, puesto que hay una distribución diferente por cada valor de la muestra de n-1
que es el divisor que se utiliza para calcular S2 . Recuérdese que n-1 representa los grados de libertad. (Ver FIGURA 1)
5.
6. Comparada conla distribución normal, la distribución t, es menos
espigada en el centro y tiene las colas mas largas. En la FIGURA 2,
se compara la distribución t – student con la distribución normal.
7. La distribución t – student se aproxima a la distribución normal
a medida que n – 1 se aproxima al infinito.
FIGURA 2
Comparación entre la distribución normal y la distribución t
6.
INTERVALOS DE CONFIANZACON DISTRIBUCION t-student
El procedimiento general para construir intervalos de confianza con
distribución t, sigue siendo el mismo que para con z:
Estimador +/- (coeficiente de confiabilidad) X (error estándar)
• Lo que es diferente es el origen del coeficiente de confiabilidad, que
se obtiene a partir de la tabla de la distribución t en lugar de la tabla
de la distribución normal estándar.
Cuando se obtienen muestras a partir de una distribución normal
cuya desviación estándar “σ” , se desconoce, el 100(1-α) por ciento
del intervalo para la media de la población µ, esta dado por:
(Daniel, 2008, p. 185)
7.
PROBLEMA 1
• Unamuestra de 16 niños de diez años de edad proporcionó un peso
medio y una desviación estándar de 73 y 10 libras, respectivamente.
Si la población sigue una distribución aproximadamente normal.
Construya un intervalo de confianza al 95% y determine lo siguiente:
a. El estimador puntual
b. La significancia
c. El coeficiente de confianza
d. El coeficiente de confiabilidad
e. El error estándar
f. El margen de error
g. Construir e interpretar el intervalo
8.
• Una muestrade 16 niños de diez años de edad proporcionó un peso
medio y una desviación estándar de 73 y 10 libras, respectivamente.
Si la población sigue una distribución aproximadamente normal.
Construya un intervalo de confianza al 95% y determine lo siguiente:
Datos del problema: n = 16 , = 73 libras y s = 10 libras
a. El estimador puntual
Como es un problema relacionado a medias, el estimador puntual será la
media de la muestra = 73 libras
b. La significancia: Como el intervalo es de 95% entonces la
significancia será del 5%. Que en proporción es 0.05.
α = 0.05
9.
• Una muestrade 16 niños de diez años de edad proporcionó un peso medio y una desviación
estándar de 73 y 10 libras, respectivamente. Si la población sigue una distribución
aproximadamente normal.
Construya un intervalo de confianza al 95% y determine lo siguiente:
c. El coeficiente de confianza:
Como α = 0.05 coeficiente de confianza = 1 – α = 0.95
Coeficiente de confianza = 0.95
d. El coeficiente de confiabilidad :
¿ El coeficiente de confiabilidad debería ser un valor (z ) o un valor(t)?
¿ Lo buscamos en distribución t o distribución z ?
Criterio a seguir:
Como el tamaño de la muestra es n = 16, es una muestra
menor de 30 y nos proporcionan la desviación estándar de
la muestra s=10. Entonces se debe emplear distribución t
10.
Resolución problema 1
Unamuestra de 16 niños de diez años de edad proporcionó un peso medio y una desviación estándar de 73 y 10
libras, respectivamente. Si la población sigue una distribución aproximadamente normal.
d. Coeficiente de confiabilidad, a través del criterio tomado anteriormente se determino que es un valor t, el que
se debe encontrar. ¿Como encontrarlo?
Los grados de libertad para encontrarlo serán n – 1 = 16-1 = 15
Como un intervalo de confianza del 95% deja 0.05 del área bajo
la curva “t”, igualmente dividida entre las dos colas, se necesita el
valor de t a la derecha del cual se encuentra el 0.025 de área.
calcular 1 – α/2 = 1 – 0.05/2 = 1 – 0.025 = 0.975
Buscar en la tabla de distribución t, t(0.975) con 15 grados de libertad.
(Recuerde que el valor que encontrara es el coeficiente de confiabilidad
para un nivel de confianza del 95%)
11.
Resolución Problema 1
Unamuestra de 16 niños de diez años de edad proporcionó un peso medio y una desviación estándar de 73 y 10
libras, respectivamente. Si la población sigue una distribución aproximadamente normal.
Construya un intervalo de confianza al 95% y determine lo siguiente:
Buscar en la tabla de distribución t, t(0.975) con 15 grados de libertad.
El valor para t(0.975) con 15 grados de libertad es de 2.1314
Este valor puede encontrarse en su tabla de distribución t
o en Excel a través de la siguiente formula:
El coeficiente de confiabilidad , es el valor de t,
(color azul en la tabla) que corresponde a 2.1314.
12.
Resolución problema 1
Unamuestra de 16 niños de diez años de edad proporcionó un peso medio y una desviación estándar de 73 y 10 libras, respectivamente. Si la población
sigue una distribución aproximadamente normal.
Construya un intervalo de confianza al 95% y determine lo siguiente:
e. El error estándar, es la relación entre la desviación y la raiz de
la muestra, se calcula así:
= 10/raíz(16) = 10/4 = 2.5
Error estándar es 2.5 libras.
Nota aclaratoria: Si en este problema nos hubieran dado el valor de N, entonces
Debe aplicarse el criterio para utilizar el factor de corrección por población finita,
Si n/N ≤ 0.05 entonces el error estándar queda como se opero anteriormente .
Si n/N > 0.05 entonces el error estándar seria
13.
Resolución de problema1
f. Margen de error (M.E)
La siguiente expresión se utiliza para calcular los intervalos de confianza en la
distribución t , pero la parte encerrada en rojo es el margen de error.
M.E = (2.1314) (2.5)
M.E = 5.33 libras
g. Construir e interpretar el intervalo:
Ahora al estimador puntual se le suma y resta el margen de error.
Recordemos que la media de la muestra es = 73 libras .
73 (+/-) 5.33 Limite inferior del intervalo 73 – 5.33 = 67.67 libras
Limite superior del intervalo 73 + 5.33 = 78.33 libras
IC: [ 67.67 78.33] libras
14.
INTERPRETACION DE LOSINTERVALOS DE CONFIANZA
• INTERPRETACION PRACTICA: Se tiene el 95% de confianza que la
media de la población µ se encuentre entre 67.67 y 78.33 libras.
• INTERPRETACION PROBABILISTICA: Al repetir el muestreo, el 95% de
las veces todos los intervalos que puedan ser construidos de esta
forma +/- (2.1314) x ( 2.5) incluirían a la media de la población.
15.
PROBLEMA PROPUESTO ALESTUDIANTE
De una muestra de 9 pacientes con enfermedad renal que fueron internados en un hospital
de enfermedades crónicas que permanecieron en el hospital durante 35 días promedio con
S2=81. Si la población sigue una distribución aproximadamente normal. Construya un intervalo
de confianza al 90% y determine lo siguiente:
a. El estimador puntual
b. La significancia
c. El coeficiente de confianza
d. El coeficiente de confiabilidad
e. El error estándar
f. El margen de error
g. Construir e interpretar el intervalo
16.
RESPUESTAS AL PROBLEMAPROPUESTO AL ESTUDIANTE
De una muestra de 9 pacientes con enfermedad renal que fueron internados en un hospital de
enfermedades crónicas que permanecieron en el hospital durante 35 días promedio, donde la S2 = 81. Si
la población sigue una distribución aproximadamente normal. Construya un intervalo de confianza al 90% y
determine lo siguiente:
a. El estimador puntual : = 35 días
b. La significancia: α = 10% = 0.10
c. El coeficiente de confianza: 0.90
d. El coeficiente de confiabilidad: (recuerde 8 grados de libertad y t(0.95) t = 1.8595
También puedes hacerlo en Excel: =INV.T( 0.95;15) = 1.8575
e. El error estándar: = 9/ raíz(9) = 9/3 = 3 días
f. El margen de error = = (1.8595) (3) = 5.58 días
g. Construir e interpretar el intervalo: 35 +/- 5.58 = [29.42 -40.58]
Interpretación Práctica: Se tiene el 90% de confianza de que la
la media de la población µ se encuentra entre 29 y 41 días
17.
PROBLEMA No. 2
•En una población del oriente del país se ha encontrado el aumento de las enfermedades coronarias en
los varones de dicha población, pudiendo ser la causa de la enfermedad los malos hábitos dietéticos.
Por lo que se desea conocer el promedio del valor de colesterol en el total de la población. Para lo cual
se acudió a una aldea del sector, evaluando los niveles séricos de colesterol total en los varones de la
aldea. Encontrando los siguientes valores de colesterol total, expresados en mg/dl:
• Asumiendo que los datos tienen una distribución casi normal, construya:
a. Intervalo de confianza de 90% para la µ de colesterol del total de la población.
b. Intervalo de confianza de 99% para la µ de colesterol del total de la población.
c. Si la aldea tiene una población de 357 varones, calcule el intervalo de confianza del 90%.
d. Comparar los intervalos de confianza de los incisos a y b. Explique cuales son mas confiables
y cuales mas precisos.
210 187 245 154 189 236 277 371 190 155 293
347 258 115 455 278 137 289 187 301 274 127
18.
Solución al problema2
Utilizando Excel o tu calculadora obtienes los siguientes valores:
= 239.77 mg/dl y S = 85.45 mg/dl (recuerda que los datos vienen de una muestra)
a. Intervalo de confianza de 90% para la µ de colesterol del total de la población.
n = 22 Nivel de confianza = 90% significancia = 10% = 0.10
Por la condiciones del problema distribución t
α = 0.10 α/2 = 0.05 1 – α/2 = 1 – 0.05 = 0.95
busco en tabla t(0.95)
con n -1 = 22 -1 = 21 grados de libertad
t = 1.7207
Error estándar: 85.45/ raíz(22) = 18.22
Construyendo el IC: 239.77 +/- (1.7207) (18.22)
239.77 +/- 31.35
IC: [ 208.42 --- 271.12] mg/dl
19.
Solución al problema2
Datos: n = 22 Nivel de confianza = 99% significancia = 1% = 0.01
= 239.77 mg/dl y S = 85.45 mg/dl (recuerde que los datos vienen de una muestra)
b. Intervalo de confianza de 99% para la µ de colesterol del total de la población.
α = 0.01 α/2 = 0.005 1 – α/2 = 1 – 0.005 = 0.995
busco en tabla t(0.995)
con n -1 = 22 -1 = 21 grados de libertad
t = 2.8314
Error estándar: 85.45/ raíz(22) = 18.22
Construyendo el IC: 239.77 +/- (2.8314) (18.22)
239.77 +/- 51.59
IC: [ 188.18 --- 291.36] mg/dl
20.
Solución al problema2
c. Si la aldea tiene una población de 357. Calcule nuevamente el intervalo de confianza de 90%.
Datos:
n = 22 & N = 357
Cuando tenemos la población, tenemos que utilizar el criterio de factor de corrección por
población finita. Si se aplica el criterio, esto modificará el valor del error estándar.
Si n/N es menor o igual a 0.05 entonces NO APLICAMOS EL FACTOR.
Si n/N es mayor a 0.05 entonces SI APLICAMOS EL FACTOR
Para este problema 22/357 = 0.06 este valor es mayor de 0.05 SI SE APLICA FACTOR
= ERROR ESTANDAR = 18.22 x RAIZ ((357-22)/(357-1)) = 17.67
El valor del error estándar que era de 18.22 se modifico a 17.67 por aplicar el factor de corrección.
El valor de t, para el 90% de confianza fue calculado en el inciso a., era de t = 1.7207
Construyendo el IC: 239.77 +/- (1.7207) (17.67)
239.77 +/- 30.40
IC: [ 209.37 --- 270.17] mg/dl
21.
Solución problema 2
IC:90% [ 208.42 --- 271.12] mg/dl Amplitud = 62.7 mg/dl
IC: 99% [ 188.18 --- 291.36] mg/dl Amplitud = 103.18 mg/dl
d. COMPARACION DE INTERVALOS (realizados en incisos a y b)
Amplitud: diferencia entre el limite superior de un intervalo y el
limite inferior
¿Qué diferencias ves entre los intervalos?
El intervalo con menos amplitud es mas preciso pero menos confiable.
El intervalo con mas amplitud es menos preciso pero mas confiable.