1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Instituto Universitario Politécnico Santiago Mariño
Ingeniería de Sistemas
5to Semestre, Sección SAIA
Barcelona, marzo 2019
Autor:
Plaza, Jesús C.I: 28.101.398
Profesor:
Beltrán Pedro
2. Introducción
La distribución de muestreo de una estadística es la distribución de esa estadística, considerada como
una variable aleatoria, cuando se deriva de una muestra aleatoria de tamaño.
Se puede considerar como la distribución de la estadística para todas las muestras posibles de la misma
población de un tamaño de muestra dado. La distribución del muestreo depende de la distribución
subyacente de la población, la estadística que se considera, el procedimiento de muestreo empleado y
el tamaño de muestra utilizado. A menudo existe un considerable interés en si la distribución muestra
puede aproximarse mediante una distribución asintótica, que corresponde al caso límite ya que el
número de muestras aleatorias de tamaño finito, tomadas de una población infinita y utilizadas para
producir la distribución, tiende a infinito. , o cuando se toma una "muestra" del mismo tamaño infinito
de esa misma población.
3. Concepto Distribución muéstrales
En estadística, la distribución muestral es lo que resulta de considerar todas las muestras posibles que
pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una
sola muestra, de acercarse al parámetro de la población. Mediante la distribución muestral se puede
estimar el error para un tamaño de muestra dado.
4. Concepto Estimación estadística
En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor
aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por
ejemplo, una estimación de la media de una determinada característica de una población de tamaño N
podría ser la media de esa misma característica para una muestra de tamaño.
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos métodos que se
usan en función de las características y propósitos del estudio:
Estimación puntual
Método de los momentos;
Método de la máxima verosimilitud;
Método de los mínimos cuadrados;
Estimación por intervalos.
Estimación bayesiana.
5. Distribución Muéstrales
El estudio de determinadas características de una población se efectúa a través de diversas muestras que
pueden extraerse de ella.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una
población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente.
También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo
nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición.
Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos
calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos
una distribución del estadístico que se llama distribución muestral.
Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también
denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones
muestrales son normales y en esto se basarán todos los resultados que alcancemos.
6. Distribución Muéstrales de Medias
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si
consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su
distribución que llamaremos distribución muestral de medias.
•Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la distribución
muestral de medias sigue también una distribución normal
•Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del
límite la distribución muestral de medias se aproxima también a la normal anterior.
9. Distribución muéstrales de medias diferencia de dos medias
Ejemplo
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria se
usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los
pesos siguen una distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa
escuela es de 100 libras y su desviación estándar
15. Estimación puntual
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el parámetro
desconocido de la población. Al valor usado se le llama estimador.
La media de la población se puede estimar puntualmente mediante la media de la muestra:
La proporción de la población se puede estimar puntualmente mediante la proporción de la muestra:
La desviación típica de la población se puede estimar puntualmente mediante la desviación típica de la
muestra, aunque hay mejores estimadores:
16. Intervalos para muestras grandes
Bajo ciertas condiciones de regularidad, es posible construir intervalos de confianza asintóticos de una
manera bastante general.
Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*, la distribución asintótica del
estimador, bajo condiciones generales de regularidad, es Normal, de media el valor verdadero del
parámetro θ y varianza igual a la cota de Cramér-Rao σ2(θ*).
Bajo las suposiciones anteriores, es posible construir un intervalo de confianza asintótico y con nivel de
confianza (1 − α) · 100 % a partir de
17. Intervalos para muestras grandes
Donde los valores de zα/2 se calculan a partir de la distribución N(0, 1) de forma que P(|Z| > zα/2) = α.
Es decir, se utiliza como estadístico pivote
El intervalo de confianza aproximado que resulta es:
22. Distribución normal
En estadística y probabilidad se llama distribución normal, distribución de Gauss, distribución
gaussiana o distribución de Laplace-Gauss, a una de las distribuciones de probabilidad de variable
continua que con más frecuencia aparece en estadística y en la teoría de probabilidades
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un
determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de
una función gaussiana
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales,
sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de
fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen,
el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de
unas pocas causas independientes.
De hecho, la estadística descriptiva sólo permite describir un fenómeno, sin explicación alguna. Para la
explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y
sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos cuadrados,
uno de los métodos de estimación más simples y antiguos.
23. Distribución t de Student
En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge
del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la
muestra es pequeña.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre
dos varianzas muestrales y para la construcción del intervalo de confianza para la diferencia entre las
partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta debe ser
estimada a partir de los datos de una muestra.
Fue desarrollada por William Sealy Gosset, bajo el seudónimo Student.
24. Estimación por intervalos de proporciones
Sea X una variable binomial de parámetros n y p (una variable binomial es el número
de éxitos en n ensayos; en cada ensayo la probabilidad de éxito (p) es la misma, por ejemplo: número de
diabéticos en 2000 personas).
Si n es grande y p no está próximo a 0 ó 1 (np ³ 5) X es aproximadamente normal con media np y
varianza npq (siendo q = 1 - p) y se puede usar el
Es decir, la misma estructura que antes
Obsérvese que para construirlo, ¡se necesita conocer p!. Si n es grande (>30) se pueden substituir p y q por sus
estimadores sin mucho error, en cualquier caso como pq £ 0,25 si se substituye pq por 0,25 se obtiene un intervalo
más conservador (más grande).
Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen 80 curaciones. Calcular el
intervalo de confianza al 95% de la eficacia del tratamiento.
26. Tamaño de la Muestra
En estadística el tamaño de la muestra se le conoce como aquel número determinado de sujetos o cosas que
componen la muestra extraída de una población, necesarios para que los datos obtenidos sean
representativos de la población.
•Espacio muestral:
El espacio muestral del que se toma una muestra concreta está formado por el conjunto de todas las posibles
muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.
Para una población finita de n individuos el espacio muestral está formado por 2^n ubconjuntos posibles
(considerando el conjunto vacío entre ellos). En la práctica a veces se usan espacios muestrales idealizados
con número infinito de puntos indexados por un conjunto variables reales.
27. Tamaño de la Muestra
Parámetro o Estadístico muestral:
Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor calculado a partir de la
muestra, como por ejemplo la media, varianza o una proporción, que describe a una población y puede ser
estimado a partir de una muestra. Un estadístico muestral es un tipo de variable aleatoria, y que como tal,
tiene una distribución de probabilidad concreta, frecuentemente caracterizada por un conjunto finito de
parámetros.
Estimación:
Una estimación estadística es cualquier técnica para conocer un valor aproximado de un parámetro referido a
la población, a partir de los estadísticos muestrales calculados a partir de los elementos de la muestra. Si se
estima el suficiente número de parámetros puede aproximarse de manera razonable la distribución de
probabilidad de la población para ciertas variables aleatorias.
28. Tamaño de la Muestra
Nivel de confianza:
El nivel de confianza de una aseveración basada en la inferencia estadística es una medida de la bondad de la
estimación realizada a partir de estadísticos muestrales. Usualmente se usan niveles de confianza
para intervalos de confianza o bien p-valores que miden la probabilidad de errores de tipo I (probabilidad de
rechazar una cierta hipótesis siendo esta correcta)
Ejemplo:
Se tiene una población de 222.222 habitantes y se quiere conocer cuántos de ellos son hombres y cuántos de
ellos son mujeres. Se conjetura que cerca del 50% son mujeres y el resto hombres, pero se quiere seleccionar
una muestra para determinar cuántos hombres y mujeres hay en la muestra y a partir de ahí inferir el
porcentaje exacto de hombres y mujeres en la población total. La descripción de una muestra, y los
resultados obtenidos sobre ella, puede ser del tipo mostrado en el siguiente ejemplo:
29. Tamaño de la Muestra
La interpretación de esos datos sería la siguiente:
1. La población a investigar tiene 222.222 habitantes y queremos saber cuántos son hombres o
mujeres.
1. Estimamos en un 50% para cada sexo y para el propósito del estudio es suficiente un 90% de
seguridad con un nivel entre 90 - 5 y 90 + 5.
2. Generamos una tabla de 270 números al azar entre 1 y 222.222 y en un censo numerado
comprobamos el género para los seleccionados.
30. Conclusión
La media de una muestra de una población que tiene una distribución normal es
un ejemplo de una estadística simple tomada de una de las poblaciones
estadísticas más simples.
Para otras estadísticas y otras poblaciones, las fórmulas son más complicadas y,
a menudo, no existen en forma cerrada. En tales casos, las distribuciones de
muestreo pueden aproximarse a través de simulaciones de Monte Carlo , métodos
bootstrap o teoría de distribución asintótica.