Este documento presenta información sobre distribución de muestras y estimación. Explica conceptos como distribución de muestras, estimación puntual, intervalos de confianza y pruebas de hipótesis. Incluye ejemplos para ilustrar cómo aplicar estos conceptos estadísticos para estimar parámetros poblacionales a partir de muestras.
Estimación de parámetros poblacionales mediante muestreo
1. Republica Bolivariana de Venezuela
Ministerio de Educación
I,U, Politécnico “Santiago Mariño”
Barcelona - Edo. Anzoátegui
Ingeniería Industrial
Distribución
muéstrales y
estimación
Bachilleres:
Jesus Martinez ci:26.346.861
Jessica Reyes ci:27.824.168
Karla Solorzano ci:27.301.489
Adrian Moreno ci: 26.520.055
Profesor :
Pedro Beltran
2. Introducción
Gracias al muestreo podemos conocer el proceso por el que generamos las muestras. Una muestra es una
parte (un subconjunto) de la población, y se desea que la muestra sea lo más representativa posible de la
población de la que procede. Sin embargo, por muy cuidadosa que sea la selección de la muestra es muy difícil
que sea una representación exacta de la población. Esto quiere decir que su tendencia central, variabilidad,
etc., aproximan las de la población, pero habrá cierta diferencia, que interesa sea lo menor posible. Un
concepto clave de muestreo es el de representatividad: Los procedimientos de muestreo tienen por objeto
generar muestras lo más representativas posible de las poblaciones dados los objetivos de la investigación y las
circunstancias que afectan al muestreo.
También se encuentro lo que se denomina como Estimación puntual que consiste en atribuir un valor (la
estimación) al parámetro poblacional. Si la muestra es representativa de la población, podemos esperar que los
estadísticos calculados en las muestras tienen valores semejantes a los parámetros poblacionales, y la
estimación consiste en asignar los valores de los estadísticos muestrales a los parámetros poblacionales. Los
estadísticos con que obtenemos las estimaciones se denominan estimadores.
Cada uno de los puntos encontrados en esta investigación tendrá un ejercicio por el cual se explicara de
manera precisa todos los pasos necesarios para poder resolver los ejercicios de la mejor manera posible
3. Distribución muéstrales y estimación
En estadística, la distribución muéstrales lo que resulta de considerar todas las
muéstrales posibles que pueden ser tomadas de una población. Su estudio permite
calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al
parámetro de la población. Mediante la distribución muéstrales se puede estimar el
error para un tamaño de muestra dado.
Distribución muéstrales de medias de, diferencia de dos medias y diferencia de dos
Porciones.
El estudio de determinadas características de una población se efectúa a través de
diversas muestras que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser
infinita o finita. Una población finita en la que se efectúa muestreo con reposición
puede considerarse infinita teóricamente. También, a efectos prácticos, una población
muy grande puede considerarse como infinita. En todo nuestro estudio vamos a
limitarnos a una población de partida infinita o a muestreo con
reposición. Consideremos todas las posibles muestras de tamaño n en una población.
Para cada muestra podemos calcular un estadístico (media, desviación típica,
proporción,...) que variará de una a otra. Así obtenemos una distribución del
estadístico que se llama distribución muéstrales.
4. DISTRIBUCIÓN MUESTRAL DE MEDIAS
Cada muestra de tamaño n que podemos extraer de una
población proporciona una media. Si consideramos cada una de
estas medias como valores de una variable aleatoria podemos
estudiar su distribución que llamaremos distribución muéstrales
de medias.
Si la población no sigue una distribución normal pero n>30,
aplicando el llamado Teorema central del límite la distribución
muéstrales de medias se aproxima también a la normal anterior.
5. Ejercicio:
Las notas de cierto examen se distribuyen según una normal de media 5,8
y desviación típica 2,4. Hallar la probabilidad de que la media de una
muestra tomada al azar de 16 estudiantes esté comprendida entre 5 y 7
La población es N(5,8;2,4), con n=16 la distribución muéstrales de medias se
distribuye N(5,8;0,6)
En la escena llamamos s a la desviación típica de la población. Compara los
gráficos de la distribución muéstrales y de la distribución de la población.
Estas distribuciones están dibujadas con una escala diferente a la N(0,1),
puedes cambiarla con el valor ESCALA.
Si x es la media de la muestra hemos de calcular la probabilidad
P(5 x 7)=P(-1.33 z 2)=
=P(z 2)-[1-P(z 1.33)] = 0,8854
6. DISTRIBUCIÓN MUESTRAL DE PROPORCIONES
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En
estos casos la variable aleatoria toma solamente dos valores diferentes (éxito
o fracaso), es decir sigue una distribución binomial y cuando la extensión de
la población es grande la distribución binomial B(n,p) se aproxima a la
normal .
Para muestras de tamaño n>30, la distribución muéstrales de proporciones
sigue una distribución normal
Para muestras de tamaño n>30, la distribución muéstrales de proporciones
sigue una distribución normal
Donde p es la proporción de uno de los valores que presenta la variable
estadística en la población y q=1-p.
7. Si tiramos una moneda no trucada 100 veces, ¿cuál es la
probabilidad de que obtengamos más de 55 caras?
En una moneda no trucada la proporción de caras es 0,5, con lo que
p=0,5 q=0,5 n=100
La distribución muéstrales de proporciones se distribuye
N(0,5;0,05)
Si llamamos p' a la proporción en la muestra hemos de calcular la
probabilidad
P(p'>0,55) = P(z>1) =
=1-P(z 1) = 1-0,8413 = 0,1587
8. Estimación puntual
Una estimación puntual de un parámetro poblacional es cuando se
utiliza un único valor para estimar ese parámetro, es decir, se usa un
punto en concreto de la muestra para estimar el valor deseado.
Cuando estimamos un parámetro de forma puntual, podemos saber con
certeza, cual es ese valor. Imaginemos una población de 30 personas de
las que seleccionamos una muestra de 20 para las que conocemos sus
edades. Estimar de forma puntual la media de edad, sería tan sencillo
como sumar esos 20 datos y dividirlos entre el total de la muestra
estadística
Ejercicio:
Un grupo de investigadores de Ecología midieron la concentración de células rojas
en la sangre de 29 lagartos (Sceloporis occidentales) capturados en el campo.
También observaron si los lagartos estaban infectados por el parásito de Malaria
Plasmodium. Los recuentos de células rojas proporcionaron los siguientes valores.
Animales infectados:
Animales no infectados:
9. A) Construye un intervalo de confianza al 99% para la
diferencia entre la concentración media de células rojas
en la sangre de animales infectados y no infectados (se
supone normalidad).
B) ¿Se podría afirmar que la malaria reduce el número de
células rojas? Razona la respuesta.
Solución:
Se trata de comparar dos poblaciones: P1, lagartos infectados
con el parásito, y P2, lagartos no infectados. Concretamente,
nos interesa comparar las medias poblacionales. En
consecuencia, buscamos
Asumimos que las varianzas poblacionales NO son conocidas. Para
verificar si pueden considerarse iguales o no, como
10. Calculamos:
Por lo tanto, consideramos
que
(caso b1)
Como
Y
(0,01 en tanto por uno)
Finalmente
operando se tiene
11. Sustituyendo en la fórmula del intervalo de
confianza, obtenemos
Si el intervalo contuviera sólo números negativos, estaríamos diciendo
que la diferencia entre el número medio de células rojas de P1 y P2 es
negativa, o equivalentemente que el número medio de células rojas de
P1 (lagartos infectados con malaria) es inferior al de P2 (lagartos no
infectados). En ese caso, se podría afirmar que la malaria reduce el
número de células rojas. Pero vemos que el intervalo contiene tanto
números negativos como positivos, con lo cual tan aceptables es que
sea mayor la media de los infectados, como la de los no infectados. En
consecuencia, NO se puede afirmar que la malaria reduzca el número
de células rojas.
12. Estimación por intervalos de la media en
muestras grandes y en muestras pequeñas
La estimación por intervalos consiste en establecer el intervalo de valores
donde es más probable se encuentre el parámetro. La obtención del
intervalo se basa en las siguientes consideraciones:
A) Si conocemos la distribución muéstrales del estimador podemos
obtener las probabilidades de ocurrencia de los estadísticos muéstrales
B) Si conociéramos el valor del parámetro poblacional, podríamos
establecer la probabilidad de que el estimador se halle dentro de los
intervalos de la distribución muéstrales.
C) El problema es que el parámetro poblacional es desconocido, y por ello
el intervalo se establece alrededor del estimador. Si repetimos el
muestreo un gran número de veces y definimos un intervalo alrededor de
cada valor del estadístico muéstrales, el parámetro se sitúa dentro de cada
intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
13. Se utiliza muestras pequeñas cuando la distribución de donde proviene la muestra
tenga un comportamiento normal, cuando los tamaños de las muestras fueran
mayores o iguales a 30.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo,
ya que también la podemos utilizar con muestras aleatorias de tamaño grande.
Para definir grados de libertad se hará referencia a la varianza muéstrales:
Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta
terminología resulta del hecho de que si bien s2 está basada en n cantidades . . . ,
éstas suman cero, así que especificar los valores de cualquier n-1 de las cantidades
determina el valor restante. Por ejemplo, si n=4 y
; y , entonces automáticamente tenemos , así que sólo tres de los cuatro valores de
están libremente determinamos 3 grados de libertad.
Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología
14. Ejemplo:
El Instituto Eléctrico Edison publica cifras del número anual de
Kilowatt-hora que gastan varios aparatos electrodomésticos. Se afirma
que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una
muestra aleatoria de 12 hogares que se incluye en un estudio indica que
las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una
desviación estándar de 11.9 kilowatt-hora, ¿esto sugiere con un nivel de
significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-
hora anualmente? Suponga que la población de kilowatt-hora
es normal.
15. Solución:
Datos:
μ= 46 kilowatt-hora
s= 11.9 kilowatt-hora
x= 42 kilowatt-hora
n = 12
α = 0.05
Prueba de hipótesis:
Ho; μ = 46 kilowatt-hora
H1; μ < 46 kilowatt-hora
3. Valores críticos
tc para 0.95 (α = 0.05)
con 11 grados de libertad
4. Regla de decisión:
Si t ≥ -1.796 No se rechaza Ho
Si t < -1.796 Se rechaza Ho
Decisión y justificación :
Como –1.16 > -1.796, por lo tanto no
se rechaza Ho y se concluye con un
nivel de significancia
del 0.05 que el número promedio
de kilowatt-hora
que g
están al año las aspiradoras no es
significativamente menor que 46.
Muestras grandes:
Prueba de dos extremos para las
medias
Es cuando el nivel de significancia
(zona de rechazo) abarca los dos
extremos o colas de la campana de
Gauss.
16. Bajo ciertas condiciones de regularidad, es posible construir intervalos de
confianza asintóticos de una manera bastante general.
Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*, la
distribución asintótica del estimador, bajo condiciones generales de regularidad,
es Normal, de media el valor verdadero del parámetro θ y varianza igual a la cota
de Cramér-Rao σ2(θ*).
Bajo las suposiciones anteriores, es posible construir un intervalo de confianza
asintótico y con nivel de confianza (1 − α) · 100 % a partir de
donde los valores de zα/2 se calculan a partir de la distribución N(0, 1) de forma
que P(|Z| > zα/2) = α.
Es decir, se utiliza como estadístico pivote
EJEMPLO El fabricante de una llanta especial para camiones afirma que la
duración media de la parte rodante de agarre es de 60,000 mi. La desviación
estándar de los millajes es de 5,000 mi. Una empresa de transportes compró 48
llantas y halló que la duración media para sus vehículos fue de 59,500 mi.
17. ¿Es la experiencia distinta de la expresada por el fabricante al nivel de significación de 0.05?
= 60,000 mi
= 5,000 mi
Datos: n = 48 llantas
= 59,500 mi
= 0.05
Las hipótesis se expresan de la siguiente manera:
H0 : = 60,000 mi La duración de las llantas es de 60,000 millas
H1 : 60,000 mi La duración de las llantas es distinta a 60,000 millas
Primero, vamos a calcular el error estándar de la media y para ello emplearemos la
expresión del error estándar:
Recurrimos a las tablas de la distribución normal y en ellas localizamos 0.475, que se ubica
en un valor de Z = 1.96
En el tercer paso, vamos a determinar los límites superior e inferior de confianza para el
intervalo de la media poblacional ya que se trata de una prueba de dos extremos.
Sustituyendo valores en ella, se tiene:
Lc = 60,000 1.96 (721.69)
Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas.
Li = 60,000 – 1,414.51 Li = 58,585.49 millas
Entonces la media de la población fluctúa entre 58,585.49 y 61,414.51 millas en un nivel de
confianza del 95%.
18. Distribución t de student
En probabilidad y estadística, la distribución t (de Student) es
una distribución de probabilidad que surge del problema de
estimar la media de una población normalmente distribuida
cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student
para la determinación de las diferencias entre dos varianzas
muéstrales y para la construcción del intervalo de confianza
para la diferencia entre las partes de dos poblaciones cuando
se desconoce la desviación típica de una población y esta debe
ser estimada a partir de los datos de una muestra.
Está diseñada para probar hipótesis en estudios con muestras
pequeñas (menores de 30)
La fórmula general para la T de Student es la siguiente:
19. En donde el numerador representa la diferencia a probar y el denominador la
desviación estándar de la diferencia llamado también Error Estándar. En esta fórmula
t representa al valor estadístico que estamos buscando X barra es el promedio de la
variable analizada de la muestra, y mi es el promedio poblacional de la variable a
estudiar. En el denominador tenemos a s como representativo de la desviación
estándar de la muestra y n el tamaño de ésta.
Grados de libertad: El número de grados de libertad es igual al tamaño de la muestra
(número de observaciones independientes) menos 1. gl = df = (n – 1)
Si pudiera expresar en un cierto número de pasos para resolver un problema de t de
student tendría que declarar los siguientes:
Paso 1. Plantear las hipótesis nulas (H0) y la hipótesis alternativa (H1). La hipótesis
alternativa plantea matemáticamente lo que queremos demostrar, en tanto que la
hipótesis nula plantea exactamente lo contrario.
Paso 2. Determinar el nivel de significancia (rango de aceptación de la hipótesis
alternativa), a .
Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para
aseguramiento de la calidad; y 0.10 para estudios o encuestas de mercadotecnia.
Paso 3. Evidencia muestral, se calcula la media y la desviación estándar a partir de la
muestra.
Paso 4. Se aplica la distribución T de Student para calcular la probabilidad de error
por medio de la fórmula general presentada al principio y se contrasta con el valor T
obtenido de la tabla correspondiente.
20. Paso 5. En base a la evidencia disponible se acepta o se rechaza la hipótesis alternativa. Si
la probabilidad de error (p) es mayor que el nivel de significancia se rechaza la hipótesis
alternativa. Si la probabilidad de error (p) es menor que el nivel de significancia se acepta
la hipótesis alternativa.
Por supuesto que al final lo que tenemos que contrastar es el valor de T que hayamos
obtenido en el problema contra el valor T crítico que obtenemos de la tabla de T de
Student.
Si el resultado del problema cae en la región de H0 se acepta ésta, de lo contrario se
rechaza. Por supuesto, si rechazas H0 aceptarás H1.
En la gráfica precedente se aprecian las regiones de aceptación y de rechazo con
respecto a H0.
Ejercicio 1: Se aplica una prueba de autoestima a 25 personas quienes obtienen una
calificación promedio de 62.1 con una desviación estándar de 5.83. Se sabe que el valor
correcto de la prueba debe ser mayor a 60. ¿Existe suficiente evidencia para comprobar
que no hay problemas de autoestima en el grupo seleccionado?
Paso 1. Hipótesis alternativa: la que se va a comprobar. El grupo no tiene problemas de
autoestima. Valor de prueba para determinar autoestima mayor a 60. Hipótesis nula, lo
contrario a la hipótesis alternativa.
H1 > 60;
21. H0 =< 60.
Paso 2. Determinar el nivel de significancia alfa: alfa = 0.05.
Paso 3. Resultados de la evidencia muéstrales: X = 62.1; s = 5.83
Paso 4. Aplicar la distribución de probabilidad calculando T:
El resultado de la ecuación es 1.8. Dado que 1.8 es mayor que
1.7109 cae en la región de H1 y se acepta la hipótesis
alternativa. Si buscamos el valor de 1.8 bajo la curva normal
encontraremos que es de 0.0359 el cual es menor que
0.05. La conclusión es que no hay problemas de autoestima
en el grupo estudiado.
22. Estimación por intervalos
La estimación por intervalos consiste en establecer el intervalo de valores
donde es más probable se encuentre el parámetro. La obtención del
intervalo se basa en las siguientes consideraciones:
a) Si conocemos la distribución muéstrales del estimador podemos
obtener las probabilidades de ocurrencia de los estadísticos muéstrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos
establecer la probabilidad de que el estimador se halle dentro de los
intervalos de la distribución muéstrales.
c) El problema es que el parámetro poblacional es desconocido, y por ello
el intervalo se establece alrededor del estimador. Si repetimos el
muestreo un gran número de veces y definimos un intervalo alrededor de
cada valor del estadístico muéstrales, el parámetro se sitúa dentro de cada
intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
Estadística Inferencial
Tema 8: Estimación
1 Introducción
2 Muestreo
3 Media, Varianza y proporción
23. La estimación por intervalos consiste en establecer el intervalo de valores
donde es más probable se encuentre el parámetro. La obtención del
intervalo se basa en las siguientes consideraciones:
a) Si conocemos la distribución muéstrales del estimador podemos obtener
las probabilidades de ocurrencia de los estadísticos muéstrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer
la probabilidad de que el estimador se halle dentro de los intervalos de la
distribución muéstrales.
c) El problema es que el parámetro poblacional es desconocido, y por ello el
intervalo se establece alrededor del estimador. Si repetimos el muestreo un
gran número de veces y definimos un intervalo alrededor de cada valor del
estadístico muéstrales, el parámetro se sitúa dentro de cada intervalo en un
porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo
de confianza".
Ejemplo: Se generan 100000 muestras aleatorias (n=25) de una población
que sigue la distribución Normal, y resulta:
24. La distribución de las Medias muéstrales aproxima
al modelo Normal:
En consecuencia, el intervalo dentro del cual se halla el 95% de
las Medias muéstrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la
distribución muéstrales son los valores cuya función de distribución es igual
a 0.975 y 0.025 respectivamente y se pueden obtener en las tablas de la
distribución Normal estandarizada o de funciones en aplicaciones
informáticas como Excel). Seguidamente generamos una muestra de la
población y obtenemos su Media, que es igual a 4.5. Si establecemos el
intervalo alrededor de la Media muéstrales, el parámetro poblacional (5.1)
está incluido dentro de sus límites:
25. Ahora bien, la distancia de un punto A un punto B es la misma que de B a A. Por esa
razón, la distancia desde m a la Media muéstrales es la misma que va de la Media
muéstrales a m. En consecuencia, si hacemos un muestreo con un número grande
de muestras observamos que el 95% de las veces (aproximadamente) el valor de la
Media de la población (m) se encuentra dentro del intervalo definido alrededor de
cada uno de los valores de la Media muéstrales. El porcentaje de veces que el valor
de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es
denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se
halle dentro del intervalo sea igual al 99%, la expresión anterior es:
(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución
muéstrales en las tablas de la distribución Normal estandarizada o de funciones
en aplicaciones informáticas como Excel), y son los valores cuya función de
probabilidad es igual a 0.995 y 0.005 respectivamente).
En estadística el tamaño de la muestra se le conoce como aquel número
determinado de sujetos o cosas que componen la muestra extraída de una
población, necesarios para que los datos obtenidos sean representativos de la
población. Es muy importante para el uso de cantidades grandes, fáciles y
rápidas
26. Objetivos de la determinación del tamaño
adecuado de una muestra:
1) Estimar un parámetro determinado
con el nivel de confianza deseado
2) Detectar una determinada diferencia, si
realmente existe, entre los grupos de
estudio con un mínimo de garantía.
3) Reducir costes o aumentar la rapidez
del estudio
Por ejemplo, en un estudio de investigación epidemiológico la determinación
de un tamaño adecuado de la muestra tendría como objetivo su factibilidad.
Así:
1) Si el número de sujetos es insuficiente habría que modificar los criterios
de selección, solicitar la colaboración de otros centros o ampliar el
período de reclutamiento. Los estudios con tamaños muéstrales
insuficientes, no son capaces de detectar diferencias entre grupos,
llegando a la conclusión errónea de que no existe tal diferencia.
2) Si el número de sujetos es excesivo, el estudio se encarece desde el punto
de vista económico y humano
27. El tamaño de una muestra es el número de individuos que
contiene.
Una fórmula muy extendida que orienta sobre el cálculo del
tamaño de la muestra para datos globales es la siguiente:
N: es el tamaño de la población o universo (número total de
posibles encuestados).
Zα: es una constante que depende del nivel de confianza que
asignemos. El nivel de confianza indica la probabilidad de que los
resultados de nuestra investigación sean ciertos: un 95,5 % de
confianza es lo mismo que decir que nos podemos equivocar con
una probabilidad del 4,5%. Los valores de Zα se obtienen de la tabla
de la distribución normal estándar N(0,1).
Los valores de Zα más utilizados y sus niveles de confianza son:
Valor de Zα
Nivel de confianza
1.28 1.65 1.69 1.75 1.81 1.88 1.96
80% 90% 91% 92% 93% 94% 95%
28. (Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en
la fórmula Zα=1.96)
e: es el error muéstrales deseado, en tanto por ciento. El error muéstrales es la
diferencia que puede haber entre el resultado que obtenemos preguntando a una
muestra de la población y el que obtendríamos si preguntáramos al total de ella.
Ejemplos:
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un
producto y tenemos un error muéstrales del 5% comprarán entre 95 y 105 personas.
Ejemplo 2: si hacemos una encuesta de satisfacción a los empleados con un error
muéstrales del 3% y el 60% de los encuestados se muestran satisfechos significa que
entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarán.
Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a
obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje
real de votos estará en el intervalo 52-58% (55% +/- 3%).
p: proporción de individuos que poseen en la población la característica de estudio. Este
dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opción
más segura.
q: proporción de individuos que no poseen esa característica, es decir, es 1-p.
n: tamaño de la muestra (número de encuestas que vamos a hacer).
Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de
mayor confianza o esté más libre de error necesariamente; antes es preciso minimizar la
principal fuente de error que tiene lugar en la recogida de datos.
29. Otra fórmula para calcular el tamaño de la muestra es:
n = N σ 2 Z α 2 e 2 ( N − 1 ) + σ 2 Z α 2 {displaystyle n={{Nsigma ^{2}Z_{alpha }^{2}}
over {e^{2}(N-1)+sigma ^{2}Z_{alpha }^{2}}}}
Donde: n = el tamaño de la muestra.
N = tamaño de la población.
σ {displaystyle sigma } = Desviación estándar de la población, que generalmente
cuando no se tiene su valor, suele utilizarse un valor estimado a ojo o a partir de
una pequeña muestra o muestra piloto. Para ser conservador (prudente), mejor
errar estimando por exceso que por defecto.
Zα: Valor obtenido mediante niveles de confianza. Es un valor constante que, si no
se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como
más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a
criterio del encuestador.
e = Límite aceptable de error muéstrales que, generalmente cuando no se tiene su
valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que
queda a criterio del encuestador.
La fórmula anterior se obtiene de la fórmula para calcular la estimación del
intervalo de confianza para la media:
30. Conclusión
Tal como esta investigación ha quedado demostrado lo importante que es cada uno
de estos puntos en nuestra carrera, tanto por el hecho de poder calcular una
distribución muestral de manera exacta en el que resulta de considerar todas las
muestras posibles que pueden ser tomadas de una población. Gracias a ello
podemos calcular la probabilidad que se tiene, dada una sola muestra, de acercarse
al parámetro de la población.
También se conoció lo que es una estimación puntual de un parámetro poblacional
es cuando se utiliza un único valor para estimar ese parámetro, es decir, se usa un
punto en concreto de la muestra para estimar el valor deseado. Cuando estimamos
un parámetro de forma puntual, podemos saber con certeza, cual es ese valor.
Un punto muy importante a destacar es sobre el tema de la Distribución t de Student
el cual es una distribución de probabilidad que surge del problema de estimar la
media de una población normalmente distribuida cuando el tamaño de la muestra es
pequeño.
Cada uno de los temas encontrados en esta investigación tiene mucha importancia
en nuestra carrera ya que podremos utilizar distintas metodologías que antes de
conocerlos se nos podria complicar mucho nuestro investigación
31. Bibliografía
•Distribución muestral-S.F-Recuperado de:
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_muestral#:~:text=En%20estad%C3%AD
stica%2C%20la%20distribuci%C3%B3n%20muestral,ser%20tomadas%20de%20una%20poblaci%C
3%B3n.&text=Mediante%20la%20distribuci%C3%B3n%20muestral%20se,un%20tama%C3%B1o%20
de%20muestra%20dado
•Problemas resueltos de distribución muestral-(2010)-Recuperado de:
https://www.slideshare.net/asrodriguez75/problemas-resueltos-de-distribucin-
muestral
•Distribuciones muestrales-S.F-Recuperado de:
http://recursostic.educacion.es/descartes/web/materiales_didacticos/inferencia_es
tadistica/distrib_muestrales.htm#:~:text=DISTRIBUCI%C3%93N%20MUESTRAL%20DE%20MEDI
AS,llamaremos%20distribuci%C3%B3n%20muestral%20de%20medias
•Estimación puntual-S.F-Recuperado de:
https://economipedia.com/definiciones/estimacion-
puntual.html#:~:text=Una%20estimaci%C3%B3n%20puntual%20de%20un,para%20estimar%20e
l%20valor%20deseado
•Estimación por intervalos-S.F-Recuperado de:
https://www.uv.es/webgid/Inferencial/5_estimacin_por_intervalos.html
•Distribución normal-S.F.-Recuperado de:
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
•Distribución T de Student.-S.F- Recuperado de:
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student#:~:text=En%20probabilidad%20y%20estad%
C3%ADstica%2C%20la,de%20la%20muestra%20es%20peque%C3%B1o.