DISTRIBUCIÓN MUESTRAL
Una distribución muestral es la distribución de probabilidad de un estimador o estadígrafo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Es decir, si se toman todas las muestras posibles y se obtienen los diferentes valores para un estimador y su respectiva probabilidad, a esta distribución que se forma, es lo que se denomina Distribución Muestral.
2. INTRODUCCION
Para el estudio de un fenómeno, se requiere contar con información
relacionada con el mismo. Esta información adquirida bien sea
experimentalmente o, mediante la observación, esta dada por datos
obtenidos a través de un muestreo, el cual es el proceso por el que
generamos las muestras. Una muestra es una parte (un
subconjunto) de la población, y se desea que la muestra sea lo
más representativa posible de la población de la que procede. Sin
embargo, por muy cuidadosa que sea la selección de la muestra
difícilmente será una representación exacta de la población.
Si la muestra es representativa de la población, podemos esperar que los
estadísticos calculados en las muestras tengan valores semejantes a los
parámetros poblacionales, lo que seria La estimación puntual, y la
estimación consiste en asignar los valores de los estadísticos muéstrales
a los parámetros poblacionales. Los estadísticos con que obtenemos las
estimaciones se denominan estimadores.
3. DISTRIBUCIÓN MUESTRAL
Una distribución muestral es la distribución de probabilidad de un
estimador o estadígrafo que resulta de considerar todas las muestras
posibles que pueden ser tomadas de una población. Es decir, si se
toman todas las muestras posibles y se obtienen los diferentes valores
para un estimador y su respectiva probabilidad, a esta distribución que
se forma, es lo que se denomina Distribución Muestral.
La inferencia estadística trata básicamente con generalizaciones y
predicciones. Por ejemplo, podemos afirmar, con base a opiniones de
varias personas entrevistadas en Copiapó, que en las próximas
elecciones municipales el 52% de los electores votará por el candidato
A. En este caso tratamos con una muestra aleatoria de opiniones de
una población finita muy grande.
4. El objetivo principal de la estadística inferencial es la estimación,
esto es que mediante el estudio de una muestra de una
población se quiere generalizar las conclusiones al total de la
misma. Como vimos en la sección anterior, los estadísticos varían
mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estándar de un estadístico, más cercanos
serán unos de otros sus valores.
Existen dos tipos de estimaciones para parámetros; puntuales y
por intervalo. Una estimación puntual es un único valor
estadístico y se usa para estimar un parámetro. El estadístico
usado se denomina estimador.
Una estimación por intervalo es un rango, generalmente de
ancho finito, que se espera que contenga el parámetro.
5. Suponga que se tienen dos poblaciones distintas, la primera con
media µ1 y desviación estándar σ1, y la segunda con media µ2 y
desviación estándar σ2. Más aún, se elige una muestra aleatoria de
tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media
muestral para cada muestra y la diferencia entre dichas medias. La
colección de todas esas diferencias se llama distribución muestral de
las diferencias entre medias o la distribución muestral del estadístico.
6. La fórmula que se utilizará para el cálculo de probabilidad del estadístico de
diferencia de medias es
7. Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de sexto
grado en una escuela primaria se usará una muestra aleatoria de 20 niños y otra
de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una
distribución normal. El promedio de los pesos de todos los niños de sexto grado
de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras
que el promedio de los pesos de todas las niñas del sexto grado de esa escuela
es de 85 libras y su desviación estándar es de 12.247 libras. Si representa el
promedio de los pesos de 20 niños y es el promedio de los pesos de una
muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos
de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Solución:
Por lo tanto, la probabilidad de que el promedio de los
pesos de la muestra de niños sea al menos 20 libras más
grande que el de la muestra de las niñas es 0.1056.
8. Cuando el muestreo procede de dos poblaciones binomiales y se
trabaja con dos proporciones muestrales, la distribución muestral de
diferencia de proporciones es aproximadamente normal para
tamaños de muestra grande (n1p1˃5, n1q1˃5,n2p2˃5 y n2q2˃5).
Entonces p1 y p2 tienen distribuciones muestrales aproximadamente
normales, así que su diferencia p1-p2 también tiene una distribución
muestral aproximadamente normal.
9. Ejemplo 3: Se llevan a cabo dos experimentos independientes en los que se
comparan dos tipos de pintura. Se pintan 18m de especímenes con el tipo A y en cada
uno se registra el tiempo de secado en horas. Lo mismo se hace con el tipo B. Se
sabe que las desviaciones estándar de la población son ambas 1.0. Supongamos que
el tiempo medio de secado es igual para los dos tipos de pintura.
Calcular
donde y son los tiempos promedios de secado para muestras de tamaño
nA=nB=18.
De la distribución de muestreo de , sabemos que la distribución es normal con
media y varianza
La fórmula que se utilizará para el cálculo de probabilidad del
estadístico de diferencia de proporciones es:
10. Por lo tanto,
¿Qué podemos aprender del resultado anterior? La maquinaria de cálculo se
basa en la suposición de que μA=μB.
Supongamos, sin embargo, que el experimento realmente se lleva a cabo con el
propósito de realizar una inferencia con respecto a la igualdad de μA y μB, los
tiempos medios se secado de las dos poblaciones. Si los dos promedios difieren
por una hora (o más), esto claramente es una evidencia que nos conducirá a
concluir que el tiempo medio de secado de la población no es igual para los dos
tipos de pintura.
Por otro lado, supongamos que la diferencia en los dos promedios muestrales es
más pequeña que, digamos, 15 minutos. Si μA=μB,
11. ESTIMACION PUNTUAL
Una estimación puntual de un parámetro poblacional es cuando se utiliza un
único valor para estimar ese parámetro, es decir, se usa un punto en concreto
de la muestra para estimar el valor deseado.
Cuando estimamos un parámetro de forma puntual, podemos saber con
certeza, cuál es ese valor. Imaginemos una población de 30 personas de las
que seleccionamos una muestra de 20 para las que conocemos sus edades.
Estimar de forma puntual la media de edad, sería tan sencillo como sumar esos
20 datos y dividirlos entre el total de la muestra estadística.
Pensemos ahora en que queremos estimar la altura media de esa muestra. Al
contrario que antes, no tenemos el valor de la altura de cada persona. En este
caso no podríamos realizar una estimación puntual, es decir, no podríamos
hallar un valor concreto de esa altura media. En este caso tendríamos que
realizar una estimación por intervalos, es decir, podríamos acotar el valor más
alto y más bajo de las alturas de las personas con cierta seguridad o lo que en
estadística se conoce como cierto nivel de confianza.
17. La fórmula general para la T de Student es la
siguiente:
Grados de libertad: El número de grados de libertad es igual al tamaño de
la muestra (número de observaciones independientes) menos 1.
gl = df = (n – 1)
19. Ejemplo
Ejercicio 1: Se aplica una prueba de autoestima a 25 personas quienes
obtienen una calificación promedio de 62.1 con una desviación estándar
de 5.83. Se sabe que el valor correcto de la prueba debe ser mayor a 60.
¿Existe suficiente evidencia para comprobar que no hay problemas de
autoestima en el grupo seleccionado?
Paso 1. Hipótesis alternativa: la que se va a comprobar. El grupo no tiene
problemas de autoestima. Valor de prueba para determinar autoestima
mayor a 60. Hipótesis nula, lo contrario a la hipótesis alternativa.
H1 > 60;
H0 =< 60.
Paso 2. Determinar el nivel de significancia
alfa: alfa = 0.05.
Paso 3. Resultados de la evidencia
muestral: X = 62.1; s = 5.83
Paso 4. Aplicar la distribución de
probabilidad calculando T:
21. Dejando la proporción poblacional: Que es el intervalo que estamos buscando.
En el caso de que el muestreo fuera irrestricto su expresión seria la
siguiente:
22. CONCLUSION
El comportamiento probabilístico nos permitirá hacer inferencias acerca del
comportamiento de la población. A veces nos resultará útil conocer su
esperanza matemática y/o su varianza.
Estos comportamientos son el resultado de medir en un conjunto de
elementos o individuos, una o varias características a ser analizadas en una
investigación. Ahora bien, el análisis puede llevarse a cabo en base a toda o,
a una parte de la población. Si se hace uso de toda la información, decimos
que se ha hecho una investigación exhaustiva o total.
El objetivo es efectuar una generalización de los resultados de la muestra a
la población. Inferir o adivinar el comportamiento de la población a partir del
conocimiento de una muestra. Para ello es necesario conocer las
distribuciones de probabilidad de ciertas funciones de las muestras que
constituyen variables aleatorias asociadas al experimento aleatorio, selección
de una muestra al azar de una población