Distribuciones Muestrales y Estimación de los Parámetros de una Población
Integrantes:
José González C.I: 28.576.187 Marcell Girardi C.I: 24. 491.579 Yulianny Marcano C.I: 26. 385.075 Alejandro Brito C.I: 24.947.747 José Pereira C.I: 28.095. 315
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Distribuciones Muestrales y Estimación de los Parámetros de una Población
1. República Bolivariana de Venezuela.
Ministerio del Poder Popular para la Educación Superior.
Instituto Universitario Politécnico “Santiago Mariño”
Sede Barcelona.
Escuelas: de Ing. De Sistemas y Ing. Industrial.
Materia: Estadística II.
Profesor: Estudiante:
Pedro Beltrán José González C.I: 28.576.187
Marcell Girardi C.I: 24. 491.579
Yulianny Marcano C.I: 26. 385.075
Alejandro Brito C.I: 24.947.747
José Pereira C.I: 28.095. 315
Barcelona, 20 de Julio del 2020
2.
Una distribución muestral es una distribución de Probabilidad de una estadística muestral
calculada a partir de todas las muestras posibles de tamaño "n" elegidas al azar de una
población determinada. En una población cuya distribución es conocida pero desconocemos
algún parámetro, podemos estimar dicho parámetro a partir de una muestra representativa. La
estimación de parámetros es el procedimiento utilizado para conocer las características de un
parámetro poblacional, a partir del conocimiento de la muestra. En este trabajo en diapositiva,
en el cual trata sobre la distribución muestral y la estimación de los parámetros de una
población, estaremos explicando su definición, mostraremos ejemplos, luego nos
desglosaremos con los temas de distribución muestral de media de diferencia de dos medias,
definiremos, haremos ejemplos de como realizar un ejercicio de dos medias y de dos
porciones de población, también se va a realizar los intervalos de muestras pequeñas y
grandes, explicaremos las distribuciones normales, distribución de la t-studen, estrategias de
evaluación, prueba escrita y estrategias .
3.
Una distribución muestral es una distribución de Probabilidad de una estadística
muestral calculada a partir de todas las muestras posibles de tamaño "n" elegidas al azar
de una población determinada. En estadística, la distribución muestral es lo que resulta
de considerar todas las muestras posibles que pueden ser tomadas de una población. Su
estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de
acercarse al parámetro de la población. Mediante la distribución muestral se puede
estimar el error para un tamaño de muestra dado.
4.
, 𝑆21, P1 para i = 1,m son variables aleatorias de las cuales es
de interés conocer su distribución de probabilidad o distribución
muestral.
5.
Ejemplo
Una moneda lanzada al aire tiene una probabilidad de 75% de
caer cara. Sea X = 1 si cae cara, y X = 0 si cae cruz. Encuentra la
distribución muestral de la media x para muestras de tamaño 3.
Solución
El experimento consiste en lanzar una moneda 3 veces y medir
la media muestral x. La siguiente tabla muestra la colección de
todos los resultados posibles (muestras) y media muestral asociada.
(H = cara, T = cruz).
6. Ejemplo
Como se muestra en la tabla, los valores posibles de x son 0,
1/3, 2/3, y 1. La distribución de muestra deseada es su distribución
de probabilidad más abajo.
7. La estimación de parámetros es el procedimiento utilizado para conocer las
características de un parámetro poblacional, a partir del conocimiento de la muestra.
Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de un
valor de un parámetro de la población; pero también necesitamos precisar un:
• Intervalo de Confianza
Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de
confianza específico.
• Nivel de Confianza
Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza.
• Error de Estimación Admisible
Que estará relacionado con el radio del intervalo de confianza.
8.
Una estimación puntual de un parámetro poblacional es cuando se utiliza un único
valor para estimar ese parámetro, es decir, se usa un punto en concreto de la muestra
para estimar el valor deseado. Cuando estimamos un parámetro de forma puntual,
podemos saber con certeza, cual es ese valor. Imaginemos una población de 30
personas de las que seleccionamos una muestra de 20 para las que conocemos sus
edades. Estimar de forma puntual la media de edad, sería tan sencillo como sumar esos
20 datos y dividirlos entre el total de la muestra estadística.
Pensemos ahora en que queremos estimar la altura media de esa muestra. Al
contrario que antes, no tenemos el valor de la altura de cada persona. En este caso no
podríamos realizar una estimación puntual, es decir, no podríamos hallar un valor
concreto de esa altura media. En este caso tendríamos que realizar una estimación por
intervalos, es decir, podríamos acotar el valor más alto y más bajo de las alturas de las
personas con cierta seguridad o lo que en estadística se conoce como cierto nivel de
confianza.
9. Cada muestra de tamaño n que podemos extraer de una población proporciona una
media. Si consideramos cada una de estas medias como valores de una variable
aleatoria podemos estudiar su distribución que llamaremos distribución muestral de
medias.
• Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n,
la distribución muestral de medias sigue también una distribución normal
• Si la población no sigue una distribución normal pero n>30, aplicando el llamado
Teorema central del límite la distribución muestral de medias se aproxima también a la
normal anterior.
10. Un intervalo de valores tal que permita establecer cuales son los valores mínimo y
máximo aceptables para la diferencia entre las medias de dos poblaciones. Pueden
darse dos situaciones según las muestras sean o no independientes; siendo en ambos
casos condición necesaria que las poblaciones de origen sean normales o
aproximadamente normales:
Muestras Independientes
Si puede suponerse que las varianzas de ambas poblaciones son iguales, el
intervalo de confianza para la diferencia de medias poblacionales está centrado en la
diferencia de las medias muestrales, siendo sus límites superior e inferior:
11.
Es una estimación de la desviación típica común a ambas poblaciones
obtenida a partir de las varianzas de las dos muestras. En la práctica si n1 y n2
son moderadamente grandes, el valor crítico
t/2 se aproxima, como ya se ha visto anteriormente, a los valores de la
distribución normal.
Si las varianzas poblacionales no pueden suponerse iguales los límites del
intervalo de confianza son:
12. El valor crítico t/2 corresponde a una distribución t cuyos grados de libertad
se calculan en base a ambos tamaños muestrales y a las desviaciones típicas
de cada grupo según la corrección propuesta por Dixon y Massey:
Para obtener el intervalo de confianza en ambos casos la secuencia es:
analizar y comparar medias
13. Los grupos pueden definirse en función de una variable cuantitativa o de
una cualitativa. Si la variable de agrupación presenta sólo dos valores o
modalidades, entonces se debe seleccionar Usar valores especificados e
indicar la modalidad que define el grupo 1 y la del grupo 2. Si la variable tiene
más de 2 valores o modalidades se elige la opción Punto de corte indicando el
valor de la variable que induce una partición en dos grupos, uno de los cuales
estará formado por todos los casos con valores menores que el especificado y
el otro por el resto de casos.
Se Obtienen:
- resultados de la prueba de Levene para contrastar la igualdad de varianzas
- resultados de la prueba T para contrastar la igualdad de medias
- intervalo de confianza para la diferencia de medias al 95% por defecto.
14.
1) Las notas de cierto examen se distribuyen según una normal de media 5,8 y desviación típica
2,4. Hallar la probabilidad de que la media de una muestra tomada al azar de 16 estudiantes
esté comprendida entre 5 y 7
• La población es N(5,8 , 2,4) , con n=16 la distribución muestral de medias se distribuye N(5,8 ,
0,6)
• Si x es la media de la muestra hemos de calcular la probabilidad
P(5 £ x £ 7) = P(-1,33 £ z £ 2) = P(z £ 2)-[1-P(z £ 1,3 3)] = 0,8854
15. En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos
la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue
una distribución binomial y cuando la extensión de la población es grande la distribución
binomial B(n,p) se aproxima a la normal.
Distribución Muestral de
Diferencia de Dos Porciones
• Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una
distribución normal.
Donde p es la proporción de uno de los valores que presenta la variable estadística en la
población y q=1-p.
16.
1) Si tiramos una moneda no trucada 100 veces, ¿cuál es la probabilidad de que
obtengamos más de 55 caras?
2) En una moneda no trucada la proporción de caras es 0,5, con lo que p=0,5 q=0,5
n=100
3) La distribución muestral de proporciones se distribuye
4) N(0,5 , 0,05)
5) Si llamamos p' a la proporción en la muestra hemos
de calcular la probabilidad
1) P(p'>0,55) = P(z>1) =
2) = 1 - P(z £ 1) = 1 - 0,8413 = 0,1587
17. La estimación por intervalos consiste en establecer el intervalo de valores donde
es más probable se encuentre el parámetro. La obtención del intervalo se basa en las
siguientes consideraciones.
Bajo ciertas condiciones de regularidad, es posible construir intervalos de
confianza asintóticos de una manera bastante general.
Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*,
la distribución asintótica del estimador, bajo condiciones generales de
regularidad, es Normal, de media el valor verdadero del parámetro θ y varianza
igual a la cota de Cramér-Rao σ2(θ*).
18. Bajo las suposiciones anteriores, es posible construir un intervalo de confianza
asintótico y con nivel de confianza (1 − α) · 100 % a partir de
Donde los valores de zα/2 se calculan a partir de la distribución N(0, 1) de forma que
P(|Z| > zα/2) = α. Es decir, se utiliza como estadístico pivote
El intervalo de confianza aproximado que resulta es:
19. Las circunstancias específicas para la construcción de este intervalo son las siguientes :
Intervalo para m
desconocida dado que n es pequeña no podemos tomar S como s
Distribución poblacional normal.
Nivel de confianza dado 1-a
Tamaño muestral desconocido luego nos colocamos en el peor de los casos , es decir
pequeño.
Del estudio de las distribuciones muéstrales conocemos que :
Como la distribución de t de student es una distribución simétrica , unimodal y centrada en 0 ,
de todos los intervalos que verifiquen que :
Es el correspondiente valor de la variable t para n - 1 grados de libertad
y nivel de significación a . Dicho intervalo quedaría :
20.
P(t Î IN) = 1 - a el de menor amplitud será:
21. La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el valor de una
variable aleatoria continua a una situación ideal. Esta adapta una variable aleatoria continua a una
función que depende de la media y la desviación típica. Es decir, la función y la variable aleatoria
continua tendrán la misma representación pero con ligeras diferencias. Una variable aleatoria continua
puede tomar cualquier número real.
La función asociada a la distribución normal estandarizada está dada por:
Donde: μ: media de la distribución.
σ: desviación estándar de la distribución.
π = 3.1415926535…
e = 2.71828…
x: variable aleatoria.
A una distribución normal de media μ y desviación estándar σ se le denota N(μ,σ).
La distribución normal es estandarizada cuando μ = 0 y σ = 1 recibe el nombre de curva normal
unitaria (N(0,1))
Distribución Normal
22.
En la mayoría de problemas, cuando se analizan
diferentes variables x, la distribución normal no tiene la
forma estandarizada, es decir, la media no es cero y la
desviación estándar no es uno. En esos casos, se
convierten los valores de la variable (x) a z, es decir, se
estandarizan los valores de la variable (x).
La fórmula de la variable estandarizada «z», la cual
indica cuántas desviaciones estándar se aleja el valor x de
la media, es la siguiente:
.
Distribución Normal
23.
La representación gráfica de esta distribución es una curva simétrica y su forma se
asemeja a una campana por lo que se conoce como campana de Gauss.
Propiedades de la distribución normal:
La forma de la curva de la distribución depende de sus dos parámetros: la media y la
desviación estándar.
La media indica la posición de la campana, la gráfica se desplaza a lo largo del eje
x.
A mayor desviación la curva será más "plana", dado que la distribución, en este
caso, presenta una mayor variabilidad.
La curva es simétrica respecto a la media.
Distribución Normal
24.
Si tenemos una variable aleatoria continua X con
una distribución normal no estandarizada, con media
igual a 10 y desviación estándar igual a 1, y el
problema pide calcular la probabilidad de que la
variable X tome un valor entre 10 y 11,50, hay que
estandarizar los valores de la variable X aplicando la
fórmula de z:
Ejemplo de
Distribución Normal
25.
Veamos la gráfica de esta distribución normal:
Y usando la tabla z, se calcula el área bajo la curva. Cuando z es
igual a 1,50, el área bajo la curva es de 0,4332.
Ejemplo de
Distribución Normal
26.
Podemos concluir que la probabilidad de que la variable
estandarizada z, tome un valor comprendido entre 10 y 11,50 es
de 0,4332.
Ejemplo de
Distribución Normal
27. Aspectos teóricos
Bases teóricas
Bases teóricas
En probabilidad T estadística, la distribución -t es una distribución de probabilidad
que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
En muchas ocasiones no se conoce σ y el número de observaciones en la
muestra es menor de 30
Estos casos. Se puede utilizar la desviación estándar de la muestra S como
una estimación de σ pero no es posible usar la distribución , como estadístico de
prueba.
El estadístico de prueba adecuado es la distribución t.
28.
Existen varias distribuciones t. cada una de ellas esta asociada con los que se
denominan "Grados de libertad este se define como el numero de valores que
podemos elegir libremente o sea el numero de observaciones menos uno.
Se encuentran mediante la fórmula
n-1
Una variable aleatoria
se distribuye según el
modelo de probabilidad t o
T de Student con k grados
de libertad, donde k es un
entero positivo.
29.
La distribución T de student, es una distribución continua.
La distribución T tiene una media de cero.
Tiene forma acampanada y simétrica.
No hay una distribución t, sino una “familia” de distribuciones t. todas
con la misma media cero, pero con su respectiva desviación estándar, identificad
cada una por sus respectivos grados de libertad.
Es decir, existe una distribución t para una muestra de 20, otra para una muestra
de 22, y así sucesivamente.
30.
La distribución t es mas ancha y mas plana en el centro que la
distribución normal estándar como resultado de ello se tiene una mayor
variabilidad en las medias de muestra calculadas a partir de muestras mas
pequeñas. Sin embargo, a medida que aumenta el tamaño de la muestra, la
distribución t se aproxima a la distribución normal estándar.
31.
Sus aplicaciones en la inferencia
estadística son para estimar $probar una
media y una diferencia de medias
(independiente y pareada).
Para determinar el intervalo de
confianza dentro del cual se puede estimar la
media de una población a partir de muestras
pequeñas (n <30).
Para probar (hipótesis cuando una
investigación se basa en muestreo pequeño.
32.
Prueba de hipótesis para Medias de t-student
La prueba de hipótesis para medias usando distribución de t student se
usa cuando se cumplen las siguientes dos condiciones:
Es posible calcular la media $ la desviación estándar a partir de la
muestra.
El tamaño de la muestra es menor a 30.
El procedimiento obedece a los 5 pasos esenciales
33.
Paso 1:
Plantear Hipótesis Nula (Ho) e Hipótesis Alternativa (Hi).
La hipótesis alternativa plantea matemáticamente lo que queremos
demostrar.
La hipótesis nula plantea exactamente lo contrario.
Paso 2:
Determinar nivel de significancia. (Rango de aceptación de hipótesis
alternativa).
Se considera:
0.05 para proyectos de investigación.
0.01 para aseguramiento de calidad.
0.10 para encuestas de mercadotecnia y políticas.
35.
Paso 4:
Se aplica la Distribución t-student para calcular la probabilidad de error (P)
por medio de la formula:
Grados de libertad = n-1
36.
Paso 5:
En base a la evidencia disponible se acepta o se rechaza la hipótesis
alternativa.
Si la probabilidad de error (P) es mayor que el nivel de
significancia:
SE RECHAZA LA HIPOTESIS ALTERNATIVA
Si la probabilidad de error (P) es menor que ele nivel de
significancia:
SE ACEPTA LA HIPOTESIS ALTERNATIVA.
38. 1. Los alumnos de ingeniería en sistemas computacionales realizan
pruebas con leds. El representante del grupo dice que sus leds duran 300
días.
Entonces los ing. en electromecánica van a varios supermercados y
compran 15 leds para probar esa afirmación. Los leds de la muestra duran
un promedio 290 días con una desviación estándar de 50 días.
Entonces, si quieren desmentir al representante de sistemas necesitan
saber cual es la probabilidad de que 15 leds seleccionados al azar tengan
una Vida promedio no mayor de 290 días
40. 2. Suponiendo que las calificaciones de una prueba de los alumnos
de la carrera de Ingeniera de sistemas del Tecnológico están
distribuidas normalmente con una media de 100. Ahora supongamos
que seleccionamos a 20 estudiantes y les hacemos un examen de
diagnostico de sistemas operativos. La desviaci6n estándar de la
muestra es de 15.
42. La estimación por intervalos consiste en establecer el intervalo de valores donde es más
probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
Si conocemos la distribución muestral del estimador podemos obtener las probabilidades
de ocurrencia de los estadísticos muéstrales.
Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad
de que el estimador se halle dentro de los intervalos de la distribución muestral.
El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se
establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y
definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se
sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
43.
Ejemplo:
La distribución de las Medias muéstrales obtenidas de
100000 muestras aleatorias y los intervalos alrededor de cada
una de las Medias obtenidas de diez de las muestras:
Donde ls y le simbolizan los límites superior
e inferior del intervalo de confianza al 95%.
Nueve de los diez intervalos (salvo el
definido alrededor de la Media muestral igual a
3.7) incluyen el valor del parámetro dentro sus
límites.
44. Las Estrategias de Evaluación :
Son el “conjunto de métodos, técnicas
y recursos que utiliza el docente para
valorar el aprendizaje del alumno”
(Díaz Barriga y Hernández, 2006).
45.
46. Una distribución muestral es una distribución de probabilidad de una estadística muestral
calculada a partir de todas las muestras posibles de tamaño "n" elegidas al azar de una
población determinada. En estadística, la distribución muestral es lo que resulta de considerar
todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite
calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la
población. Un estimador es un valor que puede calcularse a partir de los datos muestrales y
que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es
un estimador de la media poblacional, la proporción observada en la muestra es un estimador
de la proporción en la población. Una estimación es puntual cuando se obtiene un sólo valor
para el parámetro. Los estimadores más probables en este caso son los estadísticos
obtenidos en la muestra, aunque es necesario cuantificar el riesgo que se asume al
considerarlos. Un intervalo de valores tal que permita establecer cuales son los valores
mínimo y máximo aceptables para la diferencia entre las medias de dos poblaciones.
Pueden darse dos situaciones según las muestras sean o no independientes; siendo en
ambos casos condición necesaria que las poblaciones de origen sean normales o
aproximadamente normales la distribución t de student o distribución t es un modelo
teórico utilizado para aproximar el momento de primer orden de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño y se desconoce la
desviación típica.
47.
Autor: (Jeremy Maculet), Año (2016).
Título: (Distribución Muestral y Estimación ).
Dirección: https://www.zweigmedia.com/distribucionl/finitetopic1/sampldistr.html
1)
2)
3)
4)
Autor: (Antonio Campo), Año (2018).
Título: (Distribución Muestral de Medias de Diferencia de Dos Medias).
Dirección http://www.ub.edu/aplica_infor/muestaldemedias/cap4-3.htm
Autor: (Jorge Gómez), Año (2015).
Título: (Distribución Muestral de Diferencia de Dos Porciones).
Dirección: http://www.ub.edu/aplica_infor/dosporciones/cap4-4.htm
Autor: (Lionel Parras), Año (2018).
Título: (Estimación por Intervalos de la Media en Muestras Pequeñas y Grandes).
Dirección: http://www.est.uc3m.es/estadistica/Documentacion/ApuntesPequeñoy Grandes.pdf
Autor: (Josefina Pacheco), Año (2019).
Título: (Diagrama de Flechas).
Dirección: https://economipedia.com/definiciones/distribucion-t-de-student.html