1. UNIDAD 4 Distribuciones muestrales
Las muestras aleatorias obtenidas de una población son, por naturaleza
propia, impredecibles. No se esperaría que dos muestras aleatorias del
mismo tamaño y tomadas de la misma población tenga la misma media
muestral o que sean completamente parecidas; puede esperarse que
cualquier estadístico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra,
por ello, se quiere estudiar la distribución
de todos los valores posibles de un estadístico. Tales distribuciones serán
muy importantes en el estudio de la estadística inferencial, porque las
inferencias sobre las poblaciones se harán usando estadísticas muestrales.
Como el análisis de las distribuciones asociadas con los estadísticos
muestrales, podremos juzgar la confiabilidad de un estadístico muestral
como un instrumento para hacer inferencias sobre un parámetro
poblacional desconocido. Como los valores de un estadístico, tal como x,
varían de una muestra aleatoria a otra, se le puede considerar como una
variable aleatoria con su correspondiente distribución de frecuencias.
En general, la distribución muestral de un estadístico es la de todos sus
valores posibles calculados a partir de muestras del mismo tamaño.
4.1 Función de probabilidad.
S e l la m a fu n ci ó n d e p rob a b il i da d d e u n a va ri a bl e al ea to ri a d i scre ta
X a la a p li ca ció n q u e a so ci a a ca d a val o r d e x i de la va ri ab l e su
p r o ba b il i d ad p i .
0 ≤ pi ≤ 1
p1 + p2 + p3 + · · · + pn = Σ pi = 1
2. E j e mp l o .
C al c u l a r la dis tr ibuc ión de pr oba bil ida d d e la s pu n tu a ci o n e s
o b te ni d a s a l la n za r u n da d o .
x pi
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
1
4.2 Distribución binomial.
Experimentos en los cuales cada prueba tiene dos posibles resultados
(éxito y fracaso), cada resultado con probabilidad constante a lo largo del
experimento, en el que cada prueba es independiente. Se dice que son
experimentos binomiales en los en los que la distribución de probabilidad
de la variable al azar asociada es una distribución de Probabilidad
Binomial.
Un experimento binomial es el que posee las siguientes propiedades.
1. El experimento consiste en “n” ensayos repetidos.
2. Cada ensayo proporciona un resultado que puede clasificarse en éxito o
fracaso.
3. La probabilidad de éxitos designada por “p” permanece constante de un
ensayo a otro.
4. Los ensayos son independientes.
Si un ensayo Binomial puede resultar en un éxito con probabilidad “p” y en
un fracaso con probabilidad q = 1 – p, entonces la distribución de
probabilidad de la variable aleatoria binomial x, y el número de éxitos en “n”
ensayos independientes es:
3. Donde: x = 0, 1, 2,.....n
n = No. de eventos.
X = Numero de éxitos.
La media y la varianza de la distribución binomial b(x;n.p) son:
Ejemplo.
La probabilidad de que un automóvil que recorre la longitud completa de un
camino tenga un accidente es de 0.05. Encontrar la probabilidad de que
entre 17 automóviles que recorren este mismo camino tenga accidentes:
a) Exactamente 4.
b) Cuando mucho 4.
c) Al menos cuatro.
En el caso del inciso “a” que es una respuesta puntual se aplica la formula
en forma simple.
4. Donde: n = 17
x=4
p = 0.05
q = 1 – p = 1 – 0.05 = 0.95
Por lo tanto al sustituir
b) Cuando mucho 4, este puede expresarse también: máximo 4, a lo más
4, esto es de cero a 4, lo cual implica desde cero hasta cuatro.
Por lo que el resultado sería la sumatoria de probabilidades de cero a
cuatro.
5. d) Al menos 4, esto se puede expresar también como; por lo menos 4,
mínimo 4, esto es de cuatro en adelante.
Por la ley de los complementos.
La P(x ≥ 4) = 1 – P (x < 4) = 1 – P ( x ≤ 3 )
Esto es la probabilidad de 100 % menos la sumatoria de probabilidades de
0 a 3.
6. 4.3 Propiedades de la curva binomial.
La distribución normal proporciona una aproximación para la distribución
binomial cuando n, el numero de intentos, es alto y p, la probabilidad de un
éxito en un intento individual, se arpoxima a ½.
Se considera una práctica acertada el uso de la aproximación normal para
la distribución normal solo cuando np y n(1-p) son mayores que 5;
simbólicamente, cuando
np> 5 y n(1-p) > 5
8. 4.4 Distribución Hipergeometrica.
Aquellos experimentos en los cuales la variable al azar que define los
resultados del experimento es discreta y la probabilidad cambia a lo largo
del experimento, se dice que sigue una distribución hipergeométrica.
El modelo de probabilidad hipergeométrica se aplica al muestreo sin
reemplazo.
Un experimento hipergeométrico es aquel que pose las dos siguientes
propiedades.
1. Una muestra aleatoria de tamaño “n” se selecciona sin reemplazo de un
total de “N” resultados o artículos totales.
2. k resultados o artículos del total de “N” pueden clasificarse como éxitos y
N – k como fracasos.
Una variable aleatoria x tiene una distribución hipergeométrica y se conoce
como variable aleatoria hipergeométrica, si y solo si su distribución de
probabilidad está dada por:
Donde:
N = No. total de la población.
n = Tamaño de la muestra.
k = No. de elementos que cumplen la característica deseada.
x = 0, 1, 2, .... n
Los valores de la media y la varianza se calculan según las ecuaciones:
9. En una urna o recipiente hay un total de N objetos, entre los cuales hay
una cantidad k de objetos que son defectuosos, si se seleccionan de esta
urna n objetos al azar, y sin reemplazo, .cual es la probabilidad de obtener
x objetos defectuosos?
Solución:
Luego;
Donde:
p(x,n,N,k) = probabilidad de obtener x objetos defectuosos de entre n
seleccionados
muestras de n objetos en donde hay x que son
defectuosos y n-x buenos
todas las muestras posibles de seleccionar de n objetos tomadas
de entre N objetos en total = espacio muestral
Considerando que en la urna hay un total de 10 objetos, 3 de los cuales
son defectuosos, si se seleccionan 4 objetos al azar, .cual es la
probabilidad de que 2 sean defectuosos?
Solución:
N = 10 objetos en total
k = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
10. Donde,
Probabilidad asociada a cada muestra de 4 objetos que se
seleccionaron, con lo que se demuestra que las probabilidades no son
constantes
Formas o maneras de obtener 2 objetos defectuosos entre los
4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos
Como se observa en el desarrollo de la solución del problema, la
pretensión es demostrar que las probabilidades asociadas a cada uno de
los resultados no son constantes.
Luego la probabilidad de obtener 2 objetos defectuosos entre los 4
seleccionados al azar seria:
11. Ejemplo 4
En una prisión federal para mujeres, 100 de las 250 internas tienen puntos
de vistas políticas radicales. Si se elige a 5 de ellas al azar para
comparecer ante un comité legislativo; determinar la probabilidad de que
solo una de ellas tendrá ideas políticas radicales.
Mediante el uso de:
a) La formula de la distribución hipergeometrica.
Respuesta.
a) En este caso.
N = 250 mujeres
k = 100 tienen políticas radicales
n = 5 se eligen al azar
x = 1 tenga políticas radicales de las 5
Sustituyendo en la formula
Que se lee.
12. Probabilidad de que una mujer tenga políticas radicales, toma de una
muestra aleatoria de cinco, tomada de una población de 250, de las cuales
100 tienen políticas radicales.
4.5 Distribución de Poisson.
Existen experimentos de los cuales la probabilidad del evento es muy
pequeña, pero el número de pruebas es muy grande en tal forma que al
producto del número de intentos (prueba n) y la probabilidad del evento es
del orden 0.1 a 10 (np). La distribución recibe su nombre en honor de
Simeon Poisson, quien la estudió y dio a conocer en 1837. Con frecuencia
se denomina ley de eventos improbables, Lo cual
significa que la probabilidad p que suceda en un evento específico es
bastante pequeña.
El experimento de Poisson posee las siguientes propiedades:
1. Los eventos ocurren en forma independiente.
2. La probabilidad de que un resultado sencillo ocurra en un intervalo de
tiempo muy corto o en una región pequeña es proporcional a la longitud del
intervalo del tiempo.
3. La probabilidad de que más de un resultado ocurra en ese intervalo de
tiempo tan corto o en ésta región tan pequeña es despreciable.
13. Si X es el número de ocurrencia de un evento aleatorio en un intervalo de
tiempo o espacio, la probabilidad de que x ocurra, está dada por la función
de probabilidad de Poisson.
Donde: x es el número de ocurrencias.
e = es la constante 2.71828 (base del logaritmo neperiano).
µ = la media aritmética del numero de ocurrencias (éxitos) en un intervalo
de tiempo dado.
µ = λ = np
La distribución tiene muchas aplicaciones. Se utiliza como modelos para
describir fenómenos como la distribución de errores sobre captura de
datos. En número de ralladuras y otra imperfecciones en piezas
recientemente pintadas, el numero de partes defectuosas en embarques de
salidas, el número de clientes en espera de servicio en
un restaurante.
Ejemplo 5.
Al inspeccionar la aplicación de estaño por un proceso electrolítico
continuo, se descubre en promedio 0.2 imperfecciones por minuto. Calcule
las probabilidades de descubrir:
a) Una imperfección en tres minutos.
b) Al menos dos imperfecciones en 5 minutos.
c) A lo sumo una imperfección en 15 minutos.
14. Respuestas:
a) Si λ = μ = np = 0.2 en este caso nos está dando el promedio por
minuto, como el tiempo es 3 minutos.
λ = 0.2 x 3 minutos = 0.6 imperfecciones por tres minutos.
X = 1 imperfeccion.
b) Al menos 2 imperfecciones en 5 minutos. Esto puede expresarse
también como: por lo menos 2, cuando menos 2, mínimo 2, esto es de 2 en
adelante hasta infinito.
Por lo tanto la forma de resolverlo es por áreas complementarias. Si la
probabilidad total es 1, la probabilidad de que sean mínimo 2
imperfecciones es igual a la unidad menos la probabilidad de que ocurran
cero y una imperfección.
En este caso λ = (0.2) (5 minutos) = 1.0
15. c) A lo sumo una imperfección en 15 minutos, pudiendo expresarse esto
como: a lo más 1, cuando mucho 1, máximo 1, este es la acumulable
desde cero hasta uno.
Con λ = (0.2) (15 minutos) = 3
4.6 Esperanza matemática.
La esperanza matemática o valor esperado de una
variable aleatoria discreta es la suma del producto de
la probabilidad de cada suceso por el valor de dicho
suceso.
Los nombre de esperanza matemática y valor esperado
tienen su origen en los juegos de azar y hacen
referencia a la ganancia promedio esperada por un
jugador cuando hace un gran número de apuestas.
16. Si la esperanza matemática es cero, E(x) = 0, el juego
es equitativo, es decir, no existe ventaja ni para el
jugador ni para la banca.
4.7 Distribución de probabilidad continua.
Una de las principales características de las variables aleatorias continuas
consiste en que, al estudiar su probabilidad, esta no puede estimarse para
valores únicos, sino que se calcula por intervalos. Para estas variables
aleatorias, la probabilidad en un intervalo está representado por el área
bajo la curva, que representa a su función
de densidad entre los límites del intervalo.
La función f(x) es una función de densidad de probabilidad para la variable
aleatoria X, definida sobre el conjunto de los números reales R si satisface
las condiciones siguientes:
17. 4.7.1 Distribución normal.
Gran número de distribuciones tienen la forma de una campana; es decir,
alejándonos de la media, a derecha e izquierda, el número de
observaciones decrece de forma similar. Esto genera una curva simétrica.
Características:
a) Es generada por una variable de tipo continuo, denominada x;
-∞< x < ∞
b) La función que nos define esta distribución es:
1 2 2
f ( x , µ ,σ 2 ) = ε −( x − µ ) / 2σ
σ 2π -∞< x < ∞
Al dar a la función los valores de µ , σ2 y valores a x, obtendremos la
distribución en cuestión, la que tiene forma de campana, por lo que
también se le conoce como campana de Gauss. Hay un número infinito
de funciones de densidad Normal, una para cada combinación de µ y σ.
La media µ mide la ubicación de la distribución y la desviación estándar
σ mide su dispersión.
c) Es simétrica con respecto a su eje vertical.
d) Es asintótica con respecto a su eje horizontal; esto quiere decir que
jamás va a tocar el eje de las equis.
e) El área total bajo la curva es 1.
f) Sí sumamos a µ ± σ, se observará que aproximadamente el 68.26%
de los datos se encuentran bajo la curva, si sumamos a µ ± 2σ,
el 95.44% de los datos estará entre esos límites y si sumamos a µ ±
3σ, entonces el 99.74% de los datos caerá dentro de esos límites.
Esta característica es a la vez una forma empírica y rápida de
demostrar si los datos que se analizan tienen una distribución
Normal; ya que para trabajar los datos con esta distribución, debe
verificarse que efectivamente así se distribuyen, ya que de no
18. hacerlo, las decisiones que en un momento dado se tomarán de un
análisis de los datos con la distribución Normal, serían erróneas.
4.7.2 Ecuación de la normal.
La función f(x, µ, σ2), se integra entre los límites de la variable x; esto
es,
b
p( a ≥ x < b ) = ∫ f ( x ,µ ,σ
2
)dx
a
La integral anterior nos daría el área bajo la curva de la función, desde a
hasta b, que corresponde o es igual a la probabilidad buscada.
Debido a la dificultad que se presenta para integrar esta función cada
vez que sea necesario, lo que se hace es tipificar el valor de la variable
x, esto es, x se transforma en un valor de z, de la siguiente manera:
x−µ
z= = valor
σ
4.7.3 Graficas.
Suelen utilizarse dos tipos de tablas :
a) Proporcionan el área a la izquierda de un valor.
b) Ofrecen el área comprendida entre la media (0) y un valor.
En los dos casos, la tabla fija en la primera columna el valor de z con una
cifra decimal y, la segunda cifra decimal de z condiciona la columna que ha
de seleccionarse. En el cruce encontramos el área buscada.
21. Ejemplo 1. Una maquina que expende bebidas está regulada de modo que
descargue un promedio de 200 ml por vaso. Si la cantidad de liquido está
distribuida normalmente con una desviación estándar igual a 15 ml.
a) ¿Que porcentaje de vasos contendrá mas de 224 ml?
b) ¿Cual es la probabilidad de que un vaso contenga entre 191 y 209 ml ?
a) Primeramente marcamos en una grafica la referencia del área bajo la
curva buscada.
Si el área buscada son los vasos que contengan más de 224 ml. Que es a
la derecha en la curva.
Existen dos caminos para el cálculo de esta área dado que se busca el
extremo derecho. Primero dado que las tablas de la normal nos da el área
de izquierda a derecha hasta el valor de “z”. Con valor z = 1.6 en la tabla
positiva encontramos el área 0.9452 que corresponde a la parte izquierda
de 224 ml.
Por lo tanto la unidad que representa el área total bajo la curva le restamos
el valor encontrado.
P ( x > 224 ) = 1 – 0.9452 = 0.0548 = 5.48 %
22. Que es el área buscada y se lee 5.48 % de los vasos de 224 ml o mas
2.- El otro camino es por simetría si z = 1.6
en el extremo izquierdo tenemos un área igual dado que la curva normal
representa el área en dos partes iguales a la derecha e izquierda de la
media.
Buscamos en la tabla negativa o que corresponda al lado izquierdo y
tenemos el valor de esta área en forma directa z = -1.6, P ( x > 224 ) =
0.0548 lease 5.48 % de vasos con 224 ml o más.
b) Encontrar la probabilidad de que un vaso contenga entre 191 y 209 ml.
representándolo en la curva norma tenemos.
Lo que debemos encontrar es el área bajo la curva normal entre los puntos
191 y 209, considerando que la tabla nos da el área de izquierda a derecha
el camino es calcular el área mayor y restarle el área menor.
23. Lease que el 45.14 % de los vasos reciben entre 191 y 209 ml.
Ejemplo 2. Una compañía paga a sus empleados un salario promedio de $
15.00 pesos por hora, con una desviación estándar de $ 2.00 pesos. Si los
salarios tienen aproximadamente una distribución normal. ¿Qué
porcentaje de los trabajadores recibe un salario entre $12.00 y $18.00
pesos por hora?
Representando en la curva normal esta incógnita tendríamos: El área
buscada está entre 12 y 18 pesos por hora por lo cual se calculara el área
mayor y se le restara el área menor.
Lease que el 86.64 % de los trabajadores ganan entre 12 y 18 pesos por
hora.
24. 4.8 Otras distribuciones muestrales.
4.8.1 Distribución T- student.
Al hacer uso de muestras de tamaño N > 30, llamadas grandes muestras,
las distribuciones de muestreo de muchos estadísticos son
aproximadamente normales, siendo la aproximación tanto mejor cuanto
mayor sea N. Para muestras de tamaño menor que 30, llamadas pequeñas
muestras, esa aproximación no es buena y empeora al decrecer N, de
modo que son precisas ciertas modificaciones.
El estudio de la distribución de muestreo de estadísticos para pequeñas
muestras se llama teoría de pequeñas muestras. Sin embargo, un nombre
más apropiado seria teoría exacta del muestreo, pues sus resultados son
validos tanto para pequeñas muestras como para grandes.
Definamos el estadistico
Donde:
X = Media muestral
μ = Media poblacional
s = sˆ = desviación típica
que es análogo al estadístico z dado por
Si consideramos muestras de tamaño N tomadas de una población normal
(o casi normal) con media μ y si para cada una calculamos t, usando la
media muestral X y la desviación muestral s o sˆ , puede obtenerse la
distribución de muestreo para t. Esta distribución viene dada por
25. Donde Y0 es una constante que depende de N tal que el área bajo la curva
es 1, y donde la constante v = (N – 1) se llama grados de libertad ( v es la
letra griega nu)
GRADOS DE LIBERTAD
Para el cálculo de un estadístico, es necesario emplear tanto las
observaciones de muestras como propiedades de ciertos parámetros de la
población. Si estos parámetros son desconocidos, hay que estimarlos a
partir de la muestra.
El numero de grados de libertad de un estadístico, generalmente denotado
por v, se define como el numero de N observaciones independientes en la
muestra ( o sea, el tamaño de la muestra) menos el numero k de
parámetros de la población, que debe ser estimado a partir de
observaciones muestrales. En símbolos, v = N – k.
El numero de observaciones independientes en la muestra es N, de donde
podemos calcular X y s. Sin embargo, como debemos estimar μ, k = 1 y v =
N–1
26. Ejemplo
La figura 11.4 recoge el grafico de la distribución de Student con 9 grados
de libertad. Hallar el valor de t1 para el que:
a) El área sombreada de la derecha es 0.05.
b) El área total sombreada es 0.05.
c) El área total sin sombrear es 0.99.
d) El área en sombra de la izquierda es 0.01.
e) El área de la izquierda de t1 es 0.90.
29. 4.8.2 Distribución Chi-cuadrada
Si se extraen muestras aleatorias de una población normal, la varianza de
las muestras, s2 sigue una distribución que es independiente de la media
de la población. Para cada tamaño de la muestra la forma de la ley cambia.
El estadístico
en donde
sigue una distribución de probabilidad llamada chi-cuadrada (x2), con n-1
grados de libertad.
La forma de la distribución chi-cuadrada, lo mismo que la distribución t,
depende del número de grados de libertad asociados a s2. La tabla anexa
tiene tabulada dicha distribución y su manejo es similar al de la distribución
t de student.
La columna de la izquierda da los grados de libertad, los encabezados de
las columnas dan las áreas a la derecha de los valores de chi-cuadrada
que se presentan en el cuerpo de la tabla.
La distribución chi-cuadrada no es simétrica y, por ello, los valores que se
encuentran en las tablas tienen que ser consultados al determinar áreas
por los lados de la curva. Por ejemplo, con 10 grados de libertad el 99.5%
del área se encuentra a la izquierda de x2 = 25.1558 y el 5% a la izquierda
del valor x2 = 2.1558. El intervalo 2.1558 a 25.1558 contiene el 99% de los
casos en estudio.
Ejemplo:
Un fabricante de relojes de cocina anuncia que su producto funciona, en
promedio, 5 años, con una desviación muestral de 1.2 años (σ). Se toma
una muestra aleatoria de 6 relojes, siendo su vida de 6, 5.5, 4, 5.2, 5 y 4.3
años. Determinar el valor de x2 de tales datos.
30. Solución:
La media de la muestra es:
y la varianza de la muestra:
luego
que es valor de chi-cuadrada con 5 grados de libertad.
32. 4.8.3 Distribución F.
En 1924, Ronald A. Fisher, presento una distribución que facilita llevar a
cabo procedimientos inferenciales útiles usando la razón entre dos
varianzas muestrales. Podemos resumir la naturaleza de esta distribución,
denominada distribución F, de la siguiente manera:
Dadas s12 y s22 , o varianzas calculadas a partir de muestras aleatorias
independientes de tamaño n1 y n2 sacadas de poblaciones distribuidas
normalmente con varianzas σ12 y σ22 respectivamente, la variable aleatoria
sigue la distribución F con n1 – 1 y n2 – 1 grados de libertad.
Para especificar una distribución F se toman dos valores de grados de
libertad, uno asociado con el numerador y otro con el denominador.
Supongamos que se sacan muestras aleatorias independientes de tamaño
n1 y n2 de una población 1 y de una población 2 respectivamente y
supongamos que dichas poblaciones están normalmente distribuidas con
varianzas iguales ( esto es, σ12 = σ22 ). Podemos entonces volver a escribir
la ecuación de F como:
Ejemplo: Se presume que la variabilidad en el consumo diario de proteínas
es la misma para muchachos y muchachas de 15 años (σ12 = σ22). Una
muestra aleatoria de 16 muchachas y una muestra aleatoria independiente
de 20 muchachos arrojan varianzas (s2) de 608 gramos al cuadrado y de
320 gramos al cuadrado respectivamente. Suponer que los valores de
consumo diario de proteínas en las dos poblaciones esta normalmente
distribuidos. Encontrar el valor de F, para estos datos.
33. En la tabla correspondiente a F0.90 encontramos registrado, en la
intersección de 15 grados de libertad en el numerador y 19 en el
denominador, un valor de F= 1.86. En la intersección de 15 y 19 bajo F 0.95
encontramos F = 2.23.
Así pues, la probabilidad de observar una F 1.90 esta entre el 90% y
95%. (area a la izquierda de F)
y la probabilidad de observar una F 1.90 esta entre el 5% y 10%. (area a
la derecha de F).