El documento explica conceptos básicos de estadística inferencial, incluyendo el uso de muestras para hacer inferencias sobre poblaciones, la noción de error de muestreo, y la distribución muestral. Describe cómo al seleccionar muestras aleatorias de una población, los estadísticos muestrales como la media muestral pueden variar, y cómo la distribución de estas medias muestrales tiene una media igual al parámetro poblacional y una varianza que mide el error de muestreo.
Distribución de probabilidad continua o distribución Normal, cálculo de la puntuación Z y determinación del valor de probabilidad según la tabla de distribución Z.
Distribución de probabilidad continua o distribución Normal, cálculo de la puntuación Z y determinación del valor de probabilidad según la tabla de distribución Z.
Distribuciones Muestrales y Estimación de los Parámetros de una Poblaciónjosegonzalez1606
Distribuciones Muestrales y Estimación de los Parámetros de una Población
Integrantes:
José González C.I: 28.576.187 Marcell Girardi C.I: 24. 491.579 Yulianny Marcano C.I: 26. 385.075 Alejandro Brito C.I: 24.947.747 José Pereira C.I: 28.095. 315
Aquí se brinda un tratamiento más detallado a los modelos de heterocedasticidad. Test Breusch-Pagan. Test de White. Mínimos cuadrados ponderados (MCP). Mínimos cuadrados generalizados (MCG). Mínimos cuadrados generalizados factibles (MCGF). Estimación consistente de White.
Distribuciones Muestrales y Estimación de los Parámetros de una Poblaciónjosegonzalez1606
Distribuciones Muestrales y Estimación de los Parámetros de una Población
Integrantes:
José González C.I: 28.576.187 Marcell Girardi C.I: 24. 491.579 Yulianny Marcano C.I: 26. 385.075 Alejandro Brito C.I: 24.947.747 José Pereira C.I: 28.095. 315
Aquí se brinda un tratamiento más detallado a los modelos de heterocedasticidad. Test Breusch-Pagan. Test de White. Mínimos cuadrados ponderados (MCP). Mínimos cuadrados generalizados (MCG). Mínimos cuadrados generalizados factibles (MCGF). Estimación consistente de White.
Distribución muestral y estimación de parámetros para una población
Instituto Universitario Politécnico "Santiago Mariño"
Realizado por:
Castillo, Erick
Gallardo, Jean
Rodríguez, José Alejandro
Presentación de Estadística: Densidades de Probabilidad elaborado por los Maestrantes de la Universidad Gran Mariscal de Ayacucho sede El Tigre Edo. Anzoategui.
Pedro, Arismendi
Hernadez, Hermalys
Morffe, Andreina
DISTRIBUCION MUESTRAL DE LA MEDIA
Es la distribución de probabilidad de todas las posibles medias de las muestras de un determinado tamaño muestra de la población. EJERCICIOS DE APLICACION
Ipsos, empresa de investigación de mercados y opinión pública, divulgó su informe N°29 “Claves Ipsos” correspondiente al mes de abril, que encuestó a 800 personas con el fin de identificar las principales opiniones y comportamientos de las y los ciudadanos respecto de temas de interés para el país. En esta edición se abordó la a Carabineros de Chile, su evaluación, legitimidad en su actuar y el asesinato de tres funcionarios en Cañete. Además, se consultó sobre el Ejército y la opinión respecto de la marcha en Putre.
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxWalterOrdoez22
Es un conjunto de diapositivas creadas para la información sobre la importancia que tienen la interpol en honduras y los tratados entre ambas instituciones
2. GENERALMENTE LAS POBLACIONES SON DEMASIADO GRANDES
PARA SER ESTUDIADAS EN SU TOTALIDAD. ES NECESARIO
SELECCIONAR UNA MUESTRA REPRESENTATIVA DE UN TAMAÑO
MAS MANEJABLE. ESTA MUESTRA SE UTILIZA LUEGO PARA
SACAR CONCLUSIONES SOBRE LA POBLACION.
EJEMPLO:
SE PUEDE CALCULAR LA MEDIA MUESTRAL, EL ESTADISTICO Ⱦ, Y
UTILIZARLO COMO UN ESTIMADO DE LA MEDIA POBLACIONAL µ.
EL ESTADISTICO SE UTILIZA COMO ESTIMADOR DEL
PARAMETRO.
AL CONFIAR EN UNA MUESTRA PARA SACAR ALGUNA
CONCLUSION O INFERENCIA SOBRE LA POBLACION, SE ESTA EN
LA ESTADISTICA INFERENCIAL.
3. EL VALOR ESTADISTICO DEPENDE DE LA MUESTRA TOMADA. DE
CUALQUIER POBLACION DADA DE TAMAÑO N; ES POSIBLE
OBTENER MUCHAS MUESTRAS DIFERENTES DE TAMAÑO n.
CADA MUESTRA PUEDE TAMBIEN TENER UNA MEDIA
DIFERENTE.
ES POSIBLE OBTENER UNA DISTRIBUCION COMPLETA DE Ⱦs
DIFERENTES DE VARIAS MUESTRAS POSIBLES.
4.
X
Z
S (x - µ )2
N
s S (x - Ⱦ )2
n - 1
LA DISTRIBUCION MUESTRAL DE LA MEDIA ES LA DISTRIBUCION DE
PROBABILIDAD DE MEDIAS MUESTRALES, DONDE TODAS LAS
MUESTRAS TIENEN EL MISMO TAMAÑO n.
LOS ESTADISTICOS MUESTRALES QUE COINCIDEN CON EL
PARAMETRO POBLACIONAL SON: MEDIA (Ⱦ), VARIANZA (s2), y la
PROPORCION . (vea y analice el ejemplo de su libro página 251. 9ª. Ed.).
LOS ESTADISTICOS QUE NO COINCIDEN CON LOS PARAMETROS
POBLACIONALES: MEDIANA, RANGO, DESVIACION ESTANDAR
5. EL VALOR DE UN ESTADISTICO, COMO LA MEDIA MUESTRAL (Ⱦ),
DEPENDE DE LOS VALORES PARTICULARES INCLUIDOS EN LA
MUESTRA, Y GENERALMENTE VARÍA DE UNA MUESTRA A OTRA. TAL
VARIABILIDAD DE UN ESTADISTICO SE DENOMINA VARIABILIDAD DE
MUESTREO).
DISTRIBUCION MUESTRAL DE LA PROPORCION: DISTRIBUCION DE
PROBABILIDAD DE PROPORCIONES MUESTRALES, DONDE TODAS LAS
MUESTRAS TIENEN EL MISMO TAMAÑO MUESTRAL n.
SUPONGAMOS QUE SE TIENE UNA POBLACIÓN DE N = 4 INGRESOS
PARA CUATRO ESTUDIANTES UNIVERSITARIOS. ESTOS INGRESOS
SON Q. 100, Q. 200, Q. 300 Y Q. 400.
EL INGRESO PROMEDIO PUEDE CALCULARSE COMO µ = Q. 250
100 + 200 + 300 + 400 = 1000 / 4 = 250
6. PARA SIMPLIFICAR LAS COSAS:
SE PUEDE PENSAR QUE CALCULAR LA MEDIA DE CUATRO
OBSERVACIONES REQUIERE MUCHO ESFUERZO. COMO
ALTERNATIVA, SE DECIDE SELECCIONAR UNA MUESTRA DE n = 2
OBSERVACIONES PARA ESTIMAR LA µ “DESCONOCIDA”.
ENTONCES, SE SELECCIONARÁ ALEATORIAMENTE UNA
MUESTRA DE
4C2 = 6 POSIBLE MUESTRAS (todas las muestras posibles de tamaño
n 0 2 de una población de N = 4 ingresos)
Muestra Elementos muestrales x Media muestral Ⱦ
1 100, 200 150
2 100, 300 200
3 100, 400 250
4 200, 300 250
5 200, 400 300
6 300, 400 350
7. SALVO LAS MUESTRAS TERCERA Y CUARTA, CADA MUESTRA
TIENE UNA MEDIA DIFERENTE. ASUMIENDO QUE CADA
MUESTRA TIENE LA MISMA PROBABILIDAD DE SER
SELECCIONADA, LA PROBABILIDAD DE SELECCIONAR UNA
MUESTRA DE UNA Ⱦ IGUAL A LA MEDIA POBLACIONAL DE 250 ES
SOLO 2/6 = 33.3 %. CUATRO DE LAS SEIS MUESTRAS
RESULTARAN CON ALGUN ERROR EN EL PROCESO DE
ESTIMACION. ESTE ERROR DE MUESTREO ES LA DIFERENCIA
ENTRE µ Y LA MEDIA MUESTRAL QUE SE UTILIZA PARA
ESTIMARLO, (Ⱦ - µ).
ERROR DE MUESTREO: ES LA DIFERENCIA ENTRE EL
PARAMETRO POBLACIONAL Y EL ESTADISTICO DE LA MUESTRA
UTILIZADO PARA ESTIMAR EL PARAMETRO.
8. DEBIDO AL AZAR SE PUEDE SELECCIONAR UNA MUESTRA DE n
= 2 QUE CONSTE DE Q. 100 Y DE Q. 300. LA MEDIA RESULTANTE
DE Ⱦ = Q. 200 PRODUCE UN ERROR DE MUESTREO DE
Q. 250 – Q. 200 = Q. 50.
NUNCA SE PUEDE CALCULAR REALMENTE EL TAMAÑO DEL
ERROR DE MUESTREO DEBIDO A QUE LA MEDIA POBLACIONAL
SIGUE SIENDO DESCONOCIDA. SIN EMBARGO, SE DEBE SER
CONSCIENTE DE QUE ES PROBABLE QUE OCURRA ALGUN
ERROR DE MUESTREO.
9. CON UNA POBLACION DE SOLO N = 5, SE PUEDE ENUMERAR CADA
MEDIA MUESTRAL POSIBLE JUNTO CON SU RESPECTIVA PROBABILIDAD.
A ESA TABLA O LISTADO SE LE DENOMINA DISTRIBUCION MUESTRAL.
EJEMPLO
DISTRIBUCION MUESTRAL PARA MUESTRAS DE TAMAÑO n=2 EN UNA
POBLACION DE N=4 INGRESO.
Media muestral Ⱦ Número de muestras que dan Ⱦ probabilidad de P(x)
150 1 1/6
200 1 1/6
250 2 2/6
300 1 1/6
350 1 1/6
1
DISTRIBUCION MUESTRAL: ES UN LISTADO DE TODOS LOS VALORES
POSIBLES PARA UN ESTADISTICO Y LA PROBABILIDAD RELACIONADA
CON CADA VALOR.
10. LA DISTRIBUCION MUESTRAL DE LAS MEDIAS MUESTRALES ES
SIMPLEMENTE UNA LISTA DE TODAS LAS MEDIAS MUESTRALES
POSIBLES. ESTAS MEDIAS MUESTRALES, AL IGUAL QUE CUALQUIER
LISTA DE NUMEROS, TIENEN UNA MEDIA DENOMINADA “LA MEDIA DE LAS
MEDIAS MUESTRALES” O LA GRAN MEDIA.
ESTA MEDIA DE LAS MEDIAS SE CALCULA DE LA FORMA USUAL: LAS
OBSERVACIONES INDIVIDUALES (MEDIAS MUESTRALES) SE SUMAN Y EL
RESULTADO SE DIVIDE POR EL NUMERO DE OBSERVACIONES
(MUESTRAS). SE UTILIZA X CON DOBLE BARRA ARRIBA.
LA MEDIA DE LAS MEDIAS MUESTRALES = SX
k
DONDE k ES EL NÚMERO DE MUESTRAS EN LA DISTRIBUCION
MUESTRAL.
11. X = 150 + 200 + 250 + 250 + 300 + 350 = 250
6
Debemos notar que la media de la distribución muestral x es igual a la media de la
población original µ = 250. NO ES COINCIDENCIA. LA MEDIA DE LA
DISTRIBUCION MUESTRAL SIEMPRE SERA IGUAL A LA MEDIA
POBLACIONAL. X = µ.
LA VARIANZA MIDE LA DISPERSION DE LAS OBSERVACION
INDIVIDUALES (MEDIAS MUESTRALES) ALREDEDOR DE SU MEDIA (LA
GRAN MEDIA).
VARIANZA DE LA DISTRIBUCION
MUESTRAL DE LAS MEDIAS
MUESTRALES
2 =S (Ⱦ - X)2 = S (Ⱦ - µ)2
k k
12. DADAS LAS SEIS MEDIAS MUESTRALES ANTERIORES
2 (150250)2 + (200-250)2 + (250-250)2 + (250-250)2 + (300-250)2 + (350-250)2
6
= 4,167 AL CUADRADO
SI SE TUVIERA QUE SACAR LA RAÍZ CUADRADA DE LA VARIANZA EN LA
DISTRIBUCION DE ESTAS MEDIAS MUESTRALES, SE TENDRÍA EL ERROR
ESTÁNDAR DE LA DISTRIBUCION MUESTRAL, .
ENTONCES:
ERROR ESTANDAR DE LA
DISTRIBUCION MUESTRAL DE
LAS MEDIAS MUESTRALES
2
EN EL CASO 4,167 64.55
TODA MEDIDA DE LA TENDENCIA DE LA MEDIA MUESTRAL A DESVIARSE
DE µ SE LE DENOMINA ERROR ESTANDAR. POR LO TANTO EL ERROR
ESTANDAR MIDE LA TENDENCIA A SUFRIR DEL ERROR DE MUESTREO
EN EL ESFUERZO POR ESTIMAR µ
13. Ejemplo
Las ventas en miles de dólares para East Coast Manufacturing (ECM) durante
los últimos 5 meses fueron de 68, 73, 65, 80 y 72. Asumiendo que estos cinco
meses constituyen la población, la media claramente es µ = 71.6 . Como director
de marketing de ECM , se desea estimar ese µ “desconocido” tomando una
muestra de tamaño n = 3. Se espera que el error de muestreo que es probable
que ocurra sea relativamente pequeño. Realice la distribución muestral y haga
Comentarios sobre el posible error de muestreo.
5C3 = 10 muestras de distribución muestral:
No. De la muestra Elementos de la muestra
Media muestral
Ⱦ
1 68, 73, 65 68.67
2 68, 73, 80 73.67
3 68, 73, 72 71.00
4 68, 65, 80 71.00
5 68, 65, 72 68.33
6 68, 80, 72 73.33
7 73, 65, 80 72.67
8 73, 65, 72 70.00
9 73, 80, 72 75.00
10 65, 80, 72 72.33
14. Ⱦ P(x)
68.67 1/10
73.67 1/10
71.00 2/10
68.33 1/10
73.33 1/10
72.67 1/10
70.00 1/10
75.00 1/10
72.33 1/10
1
La
distribución
muestral es
La media de la distribución muestral es:
X =
68.67+73.67+71+71+68.33+73.33+72.67+70
+75+72.33
10
X = 71.6 = µ
La varianza y el error estándar de la
distribución muestral son:
2 S( Ⱦ - µ )
k
= (68.67 – 71.6)2 + (73.67 – 71.6) 2…+ (73.33 – 71.6)2
10
= 4.31 miles de dólares al cuadrado
2 4.31 2.08 miles de $
15. INTERPRETACION:
La media de la distribución muestral es igual a la media de la población original
µ = 71.6.
El error estándar, el cuál mide el grado de dispersión de las 10 medias
muestrales alrededor de µ, indica en cuánto puede variar la media muestral de la
media poblacional.
EL TEOREMA DEL LIMITE CENTRAL DICE QUE PARA UNA POBLACION
CUALQUIERA, A MEDIDA QUE n AUMENTA, LA DISTRIBUCION DE LAS
MEDIAS MUESTRALES SE APROXIMA A UNA DISTRIBUCION NORMAL
CON UNA X = µ Y UN ERROR ESTANDAR DE / n
TEOREMA DEL LIMITE CENTRAL: A MEDIDA QUE n SE VUELVE MAS
GRANDE, LA DISTRIBUCION DE LAS MEDIAS MUESTRALES SE
APROXIMARA A UNA DISTRIBUCION NORMAL CON UNA GRAN MEDIA X =µ Y
UN ERROR ESTANDAR DE / n
16. INCLUSO, SI LA POBLACION NO ESTA DISTRIBUIDA NORMALMENTE, LA
DISTRIBUCION DE MUESTREO DE LAS MEDIAS MUESTRALES SERA
NORMAL SI n ES LO SUFICIENTEMENTE GRANDE. LA REGLA GENERAL
ES QUE SI n ES POR LO MENOS 30, EL TEOREMA DEL LIMITE CENTRAL
ASEGURARA UNA DISTRIBUCION NORMAL EN LAS MEDIAS
MUESTRALES INCLUSO SI LA POBLACION NO ES NORMAL.
EJEMPLO
El teleférico en Vail, Colorado, lleva a los esquiadores a la cima de la montaña.
Hay una placa que indica que su capacidad máxima es de 12 personas o 2004
libras. Dicha capacidad se excedería si 12 personas tienen pesos con una media
mayor que 2004 / 12 = 167 libras.
Puesto que los hombres suelen pesar más que las mujeres, “el peor de los
casos” implicaría a 12 pasajeros hombres. Los pesos de los hombres se
distribuyen normalmente, con una media de 172 libras y una desviación estándar
de 29 libras (datos del National Health Survey).
a) Calcule la probabilidad de que, al seleccionar aleatoriamente a un hombre, su
peso sea mayor de 167 libras.
b) Calcule la probabilidad de que 12 hombres que se seleccionaron al azar
tengan una media mayor de 167 libras (de manera que su peso total sea mayor
que la máxima capacidad del teleférico de 2004 libras)
17. J
Observe que para responder al inciso a, debemos trabajar con
un valor individual de una población distribuida normalmente.
172
Área que interesa
Obtener la puntuación z
Z = x - µ = 167 – 172 = -0.17
29
167
Vamos a tabla de puntuaciones z negativas
-0.17 = 0.4325
Pero interesa mayor 167, entonces:
1- 0.4325 = 0.5675
La probabilidad de que un hombre que se selecciona aleatoriamente pese
más de 167 libras es de 0.5675
a)
18. J
b)
Para resolver el inciso b, utilizamos el teorema del límite central (ya
que estamos trabajando con la media de una muestra de 12 hombres,
no de un solo hombre). Aun cuando el tamaño de la muestra no es
mayor de 30, empleamos una distribución normal por la siguiente
razón: la población original de hombres tiene una distribución normal,
de manera que las muestras de cualquier tamaño producirán medias
distribuidas normalmente. Puesto que ahora estamos trabajando con
una distribución de medias de muestra, debemos emplear los
parámetros µx y x que se evalúan de la siguiente manera:
µx = µ = 172 y x = / n = 29 / 12 = 8.37158
El siguiente punto es importante: se debe usar la desviación estándar que se
calculo de 8.37158, no la desviación estándar original de 29 (porque estamos
trabajando con la distribución de medias de muestra, con una desviación estándar
de 8.37158 y no con la distribución de pesos individuales, cuya desviación
estándar es 29).
Z = Ⱦ - µx = 167 – 172 = -5 = - 0.60
x 29 8.37158
12
Buscamos en la tabla
-0.60 = 0.2743 pero
interesa mas de 167,
entonces
1 – 0.2743 = 0.7257
19. Condiciones requeridas para una distribución binomial
1. El procedimiento debe tener un número fijo de ensayos
2. Los ensayos deben ser independientes
3. Todos los resultados de cada ensayo deben estar clasificados en dos categorías
4. Las probabilidades deben permanecer constantes para cada ensayo
La distribución normal como aproximación de la distribución binomial
Si np ≥ 5 y nq ≥ 5; entonces la variable aleatoria binomial tiene una distribución de
probabilidad que puede aproximarse con una distribución normal, donde la
media y la desviación estándar están dadas por:
µ = np y = npq
20. EJEMPLO
El 45 % de todos los empleados del centro de capacitación gerencial en Condor
Magnetic tienen títulos universitarios. ¿Cuál es la probabilidad de que de los 150
empleados seleccionados aleatoriamente, 72 tengan título universitario?
La media y la desviación estándar son: µ = np = 150*0.45 = 67.5
npq 150*0.45*0.55 = 6.09
67.5
72
71.5
72.5
Z 72.5 = 72.5 – 67.5 = 0.82 tabla = 0.7939
6.09
Z 71.5 = 71.5 – 67.5 = 0.66 tabla = 0.7454
6.09
Entonces:
0.7939 – 0.7454 = 0.0485
21. USO DE LA DISTRIBUCION NORMAL COMO APROXIMACION DE LA DISTRIBUCION
BINOMIAL
INICIO
Primero intente resolver el problema de probabilidad binomial
¿ Son
np ≥ 5 y
nq ≥ 5?
No
Usar la fórmula de probabilidad
Binomial
P(x) = n! px * qn-x
(n-x)! x!
Si
Calcule µ = np y npq
Dibuje la curva normal e identifique la región que representa la
probabilidad que se busca. Asegure incluir la corrección (± 0.5)
Calcule z = x - µ donde µ y son los valores que se
encontraron y x se reemplazó con x – 0.5 o x + 0.5
Remítase a la tabla respectiva para encontrar el área a la izquierda
Use esa área para
calcular la
probabilidad
22. ES NECESARIO DETERMINAR SI LOS DATOS MUESTRALES PARECEN
PROVENIR DE UNA POBLACION DISTRIBUIDA NNORMALMENTE. EXISTEN
DIFERENTES METODOS.
GRAFICA CUARTILAR NORMAL: ES UNA GRAFICA DE PUNTOS (x,y)
DONDE CADA VALOR x PROVIENE DEL CONJUNTO ORIGINAL DE DATOS
MUESTRALES, ASI COMO CADA VALOR y ES UNA PUNTUACIÓN z
CORRESPONDIENTE A UN VALOR DE LA DISTRIBUCION NORMAL
ESTANDAR.
COMO SE CONSTRUYE? EJEMPLO
Edades de cinco presidentes de Estados Unidos con profesiones militares en el
momento de tomar posesión: 62, 46, 68, 64, 57. Construya una gráfica cuartilar
normal para las edades y determine si parecen prevenir de una población que se
distribuye normalmente.
23. Procedimiento:
1. Ordene los datos de menor a mayor : 46, 57, 62, 64, 68
2. Con una muestra de tamaño n = 5, cada valor representa una proporción de 1 /
5 de la muestra, por lo tanto se procede a identificar las áreas acumulativas a la
izquierda de los valores muestrales correspondientes. Estas áreas izquierdas
acumulativas, que se expresan en general como 1/2n, 3/2n, 5/2n, 7/2n, 9/2n, se
convierten en áreas especificas para el presente ejemplo, con n = 5 :
3. 1/10 , 3/10 , 5/10 , 7/10 , 9/10 Tales áreas izquierdas acumulativas que se
expresan en forma decimal, son: 0.1 , 0.3, 0.5, 0.7, 0.9
4. A continuación buscar en la tabla respectiva las áreas izquierdas acumulativas
de: 0.1000, 0.3000, 0.5000, 0.7000 y 0.9000. Encontramos estas puntuaciones z
correspondientes: -1.28, -0.52, 0, 0.52 y 1.28
5. Ahora se unen las edades ordenadas con sus puntuaciones z correspondientes;
obteniendo las siguientes coordenadas (46, -1.28), (57, -0.52), (62, 0), (64, 0.52)
y (68, 1.28)
6. Ahora gráfique e interprete
24. Puntuaciones
z
Edad
40 50 60 70
2
1
0
-1
-2
Los puntos parecen estar
razonablemente cerca de una
línea recta, concluimos que
las edades dadas parecen
provenir de una población que
se distribuye normalmente