Distribuições amostragem

ESTATÍSTICA

DISTRIBUIÇÕES POR AMOSTRAGEM

1. Introdução
Neste ponto encerra-se o percurso dedutivo “população → amostra”.
Partindo do conhecimento da população, caracterizar-se-ão as
distribuições de certas estatísticas amostrais, ou seja, analisar-se-á a
forma como tais estatísticas variam de amostra para amostra. Para
que tal seja possível, é necessário que as amostras sejam
seleccionadas de acordo com processos probabilísticos (isto é,
processos que tornem possível o cálculo da probabilidade de cada

O Professor: Manuel do Carmo 88

ESTATÍSTICA

elemento da população ser incluído em cada amostra). Nesta
disciplina considerar-se-á apenas o processo de amostragem
aleatória, como o mais importante dos processos probabilísticos. Note-
se que se utilizam frequentemente outros processos de amostragem,
designadamente os processos de amostragem estratificada e por
conglomerados.
DEF. 1 – Amostragem Aleatória
Quando as n variáveis aleatórias observadas, componentes do vector
(X1, X2,...., Xn) são independentes e identicamente distribuídas –
simbolicamente iid – diz-se que se trata de amostragem casual ou
aleatória.


ESTATÍSTICA

Ao pedir que as variáveis sejam identicamente distribuídas pretende-
se que os Xi, i=1, 2,..., n, sejam “cópias” da variável aleatória X que
representa o atributo da população em estudo. Ao pedir independência
está a pensar-se que, se a função de distribuição de X é F(x), a função
de distribuição conjunta das n variáveis Xi que compõem a amostra
aleatória se determina facilmente, pelo produto

F(x1,x2,….,xn) = F(x1)F(x2).....F(xn) (1)
Que se designa por distribuição da amostra. Esta distribuição traduz a
estrutura da população de amostras de dimensão n (do espaço -
amostra) obtidas da população representada pela variável aleatória X.


ESTATÍSTICA

Na maior parte das situações estamos em situação de inferência
estatística paramétrica.
Neste caso, a forma de F é, ou supõe-se, conhecida, seja F(x|θ), e
desconhece-se apenas o “verdadeiro” valor do parâmetro (escalar ou
vector), isto é, o valor particular que indexa a função de distribuição
que descreve “apropriadamente” as condições em que se observam
as variáveis ou, como também se diz, o processo gerador de dados.
A especificação consiste, neste caso, em admitir que F(x|θ) pertence a
uma família de expressão analítica conhecida,

ℱθ={F(x|θ): θ ∈ Θ}, (2)

ESTATÍSTICA

em que o parâmetro, escalar ou vector, assume valores em dado
conjunto Θ designado por espaço-parâmetro. O conjunto ℱθ é a família

das funções de distribuiçao F para todos os valores possíveis de θ ∈
Θ, e constitui o modelo probabilístico a considerar na inferência
estatística paramétrica.

DEF. 2 – Estatística
Uma estatística é uma variável, ou vector aleatório, T(X1, X2,...., Xn),
função da amostra aleatória X1, X2,...., Xn, que não envolve qualquer
parâmetro desconhecido.


ESTATÍSTICA

Se X1, X2,...., Xn é amostra casual de população normal N(μ, σ2) com
parâmetros μ e σ2 desconhecidos, são exemplos de estatísticas
unidimensionais:

1 1
∑ i
Xi , X =
n
∑ i
Xi , ∑ i
X ,
n
i
2
∑ i
X i2

não são estatísticas as funções:

1 1 1
σ
∑ ( Xi − μ ),
σ
∑ i
Xi ,
σ 2 ∑ i
X i2

porque dependem de parâmetros desconhecidos.


ESTATÍSTICA

2. Primeiros resultados sobre a média e a variância amostrais

Vamos neste ponto determinar o valor esperado e a variância das
estatísticas,
1 1
X=
n
∑ i
Xi e S =
2

n
∑ ( X i − X )2 , que são como se sabe, a

média amostral e a variância amostral, respectivamente.

Os teoremas que se seguem são de estrema importância, para
distinguir entre parâmetros da população e parâmetros da distribuição
por amostragem, bem como estabelecer relações entre eles.


ESTATÍSTICA

Teorema: 1
Se (X1, X2,...., Xn) é amostra casual de população para a qual existem
média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se
σ2
E ( X ) = μ , Var ( X ) = (3)
n

Teorema: 2
Se (X1, X2,...., Xn) é amostra casual de população para a qual existem
média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se
n −1 2
E (S ) =
2
σ , (4)
n


ESTATÍSTICA

Para o caso de se tratar de amostras de pequena dimensão (n<30), é
usual propor outra estatística para estimar σ2, a designada variância
corrigida,

1
S´ =2

n −1
∑ ( X i − X )2 , que verifica E(S´2) = σ2, e que não subavalia,

em média, a variância da população.

De modo a “justificar” alguns dos resultados a utilizar posteriormente,
vamos de seguida enunciar um teorema, encarado por muitos como
fundamental para a inferência estatística amostral.


ESTATÍSTICA

Teorema: 3 – Teorema do limite central
Dada a sucessão de variáveis aleatórias iid, X1, X2,...., Xn,...., com
média μ e variância σ2, então, quando n→+∞, a função de distribuição

∑ X i − nμ
n

da variável aleatória, Zn = i =1
(5)
nσ
tende para uma função de distribuição N(0, 1), ou seja, a distribuição
assimptótica de Zn é N(0, 1). Simbolicamente, Zn ~ N(0, 1). a

A conclusão do teorema, pode exprimir-se na forma alternativa

⎛ ∑ n X − nμ ⎞
lim P (Zn ≤ x ) = lim P ⎜ i =1
≤ x ⎟ = Φ( x ) ,
i
n →+∞ n →+∞ ⎜ nσ ⎟
⎝ ⎠

ESTATÍSTICA

ou, ainda,
⎛ ∑ n X − nμ ⎞
P (Zn ≤ x ) = P ⎜ i =1 ≤ x ⎟ ≈ Φ( x ) (n grande).
i

⎜ nσ ⎟
⎝ ⎠
Exemplo 1
Analisando o mercado de certo produto, uma empresa conclui que a
procura diária (em centenas de quilogramas) a satisfazer é uma
variável aleatória X com média 40 e variância 25. Sendo a produção
anual planeada de 11 500, pretende calcular-se a probabilidade de
haver procura anual excedentária, considerando que um ano tem 289
dias úteis.


ESTATÍSTICA

Representando por Xi, i=1, 2, 289, a variável aleatória que exprime a
procura no i-ésimo dia, tem-se E(Xi) = 40 e Var(Xi) = 25; pretende

calcular-se P (∑ 289
i =1 )
X i > 11 500 , como não se conhece a distribuição

das variáveis aleatórias Xi, o cálculo é efectuado através do teorema
0.8.
Tem-se,
⎛ ∑ 289 X − 289 × 40 11500 − 289 × 40 ⎞
(
P ∑ i =1 X i > 11 500 = P ⎜ i =1
289

⎜
i

25 × 289
)>
25 × 289
⎟
⎟
⎝ ⎠
≈ 1 - Φ(-0.71) = 1 – [1 -Φ(0.71)] = Φ(0.71) =0.7611.


ESTATÍSTICA

Corolário:
Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com
X −μ a
média μ e variância σ , então 2
~ N (0, 1) (6)
σ
n

∑
n
Xi
onde X = i =1
n
Uma forma alternativa de expressar o corolário anterior, é
a ⎛ σ2 ⎞
X ~ N ⎜ μ, ⎟ (7)
⎝ n ⎠


ESTATÍSTICA

3. Aproximações para distribuições discretas
Considere-se, em primeiro lugar, a aproximação da distribuição de
Bernoulli pela Normal.

Corolário:
Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com
distribuição de Bernoulli média E(Xi)=θ, e portanto, Var(Xi)=θ(1-θ), tem-

∑ X i − nθ
n
a
i =1
se ~ N (0, 1) (8)
n θ (1 − θ )

De outra forma, considere-se X = ∑ i =1 X i , variável aleatória com
n

distribuição binomial. Assim, quando n é grande, as probabilidades

ESTATÍSTICA

binomiais que exigem cálculos laboriosos podem obter-se rapidamente
de forma aproximada recorrendo ao corolário anterior.

Suponha-se que, com X ∼ B(n, θ), pretende calcular-se P(a ≤ X ≤ b), a
e b inteiros, 0 ≤ a < b ≤ n. Como se sabe, P(a ≤ X ≤ b) =

∑ Cx θ x (1 − θ )n − x , para valor exacto da probabilidade pretendida.
b n
x =a

Com n grande, o cálculo da expressão do segundo membro é muito
trabalhoso, principalmente se não for possível recorrer a um
computador.


ESTATÍSTICA

⎛ a − nθ X − nθ b − nθ ⎞
Contudo, P(a ≤ X ≤ b) = P ⎜ ≤ ≤ ⎟, e
⎜ nθ (1 − θ ) nθ (1 − θ ) nθ (1 − θ ) ⎟
⎝ ⎠
X − nθ a
em virtude do corolário anterior ~ N(0, 1)
nθ (1 − θ )

⎛ b − nθ ⎞ ⎛ a − nθ ⎞
e, portanto, P(a ≤ X ≤ b) ≈Φ ⎜ - Φ⎜
⎜ nθ (1 − θ ) ⎟ ⎜ nθ (1 − θ ) ⎟
(9)
⎟ ⎟
⎝ ⎠ ⎝ ⎠
Caso n não seja muito grande, ou então se nos pedem P(X = x),
devemos substituir a por a - 0.5 e b por b + 0.5. Nesta situação, os
resultados obtidos são mais aproximados.


ESTATÍSTICA

Considerem-se, agora, algumas regras práticas para o cálculo de
probabilidades que envolvem a distribuição binomial.
- Se n ≤ 20, deve utilizar-se directamente a distribuição binomial, o que permite o cálculo
exacto das probabilidades a partir dos valores apresentados em qualquer tabela da
distribuição em causa;
- Se n > 20, o cálculo aproximado das probabilidades deve atender aos seguintes casos:
Se θ ≤ 0.1, deve utilizar-se a aproximação de Poisson1 à Binomial;
Se θ ≥ 0.9, também se deve utilizar a já referida aproximação, considerando o
respectivo acontecimento complementar,
Se 0.1 < θ < 0.9, recorre-se à aproximação pela normal standardizada.

1
Def: Distribuição de Poisson
e −λ λx
Uma variável aleatória X com função de probabilidade f(x|λ)= , x=0, 1, 2,....,...(λ>0), diz-se que tem distribuição de Poisson. Simbolicamente, X ∼ Po(λ). As suas média e variância,
x!
são respectivamente: E(X)=λ e Var(X)=λ


ESTATÍSTICA

Refira-se, no entanto, que neste curso as situações a estudar devem
contemplar, unicamente, o último caso.

Exemplo 2
Seja a variável aleatória X ∼ B(200, 0.5). Neste caso, Θ = P(95 ≤ X ≤
105) deve interpretar-se como sendo a probabilidade par que, em 200
lançamentos de uma moeda, o número de “faces” não apresente em
relação a E(X) = 200 × 0.5 = 100 um desvio superior a 5. O valor

∑
105
exacto de Θ é, Θ = x = 95
Cx (0.5)x (0.5)200 − x = 0.563246, sendo o
200

cálculo tedioso caso se não disponha de computador. Recorrendo à
aproximação 9 e a uma tabela da distribuição Binomial,

ESTATÍSTICA

⎛ 95 − 200 × 0.5 X − 200 × 0.5 105 − 200 × 0.5 ⎞
Θ = P⎜ ≤ ≤ ⎟
⎝ 200 × 0.5 × 0.5 200 × 0.5 × 0.5 200 × 0.5 × 0.5 ⎠
⎛ 105 − 100 ⎞ ⎛ 95 − 100 ⎞
≈ Φ⎜ ⎟ - Φ⎜ ⎟
⎝ 50 ⎠ ⎝ 50 ⎠
≈ Φ(0.7071) - Φ(-0.7071) = 2×Φ(0.7071) – 1 = 0.520498
No entanto, se substituíssemos 105 por 105+0.5 e 95 por 95-0.5, a
aproximação era muito melhor, pois

⎛ 105 + 0.5 − 100 ⎞ ⎛ 95 − 0.5 − 100 ⎞
Θ ≈ Φ⎜ ⎟ - Φ⎜ ⎟
⎝ 50 ⎠ ⎝ 50 ⎠
≈ Φ(0.7778) - Φ(-0.7778) = 2×Φ(0.7778) –1 = 0.563316


ESTATÍSTICA

4. Amostragem de população de Bernoulli. Caso de uma
proporção.
Considere-se uma população de Bernoulli. Esta população é
composta por elementos de dois tipos – os que possuem e os que não
possuem determinado atributo – e é caracterizada por uma função
probabilidade da família,
ℱθ = {f(x|θ) = θx (1 - θ)1-x : x ∈ {0, 1} ∧ 0 < θ < 1}.

O parâmetro θ, que também se designa por proporção verdadeira, é
naturalmente a principal incógnita na amostragem de populações de
Bernoulli.

ESTATÍSTICA

A amostra casual de populações de Bernoulli, (X1, X2,........, Xn), é o
conjunto de n variáveis aleatórias independentes e identicamente
distribuídas, com função probabilidade individual da família ℱθ e

função probabilidades conjunta

Π f(xi|θ) = θ
n ∑ i xi (1 − θ )n −∑ i xi , 0 < θ < 1, x ∈ {0, 1}, i = 1, 2,…..n (10)
i =1 i

Na amostragem de populações de Bernoulli interessa sobretudo
estabelecer a distribuição por amostragem de duas estatísticas:
- Y = Σi Xi, que representa o número (frequência absoluta) de
elementos que na amostra possuem o atributo;

ESTATÍSTICA

- X = Σi Xi /n, que representa a proporção observada, isto é, a
frequência relativa de elementos que na amostra possuem o
atributo.

A solução para tais “problemas” aparece, naturalmente, através da
distribuição binomial.
Considere-se Y, soma de n variáveis aleatórias independentes com
distribuição de Bernoulli, ou seja Y ∼ B(n, θ), e
P(Y = y) = nCy θy (1 - θ)n-y, y = 0, 1, 2,……n
P( X = z) = P(Y = nz) =
= nCnz θnz (1 - θ)n-nz, z = 0/n, 1/n, 2/n,……n/n (11)

ESTATÍSTICA

A distribuição binomial aparece, desta forma, acometida em
distribuição por amostragem.
Quando a dimensão da amostra é razoavelmente grande, podemos
escrever
Y − nθ a
~ N (0, 1) (12)
nθ (1 − θ )
ou
X −θ a
~ N (0, 1) (13)
θ (1 − θ )
n
As aproximações consideradas poderão ser melhoradas se utilizarmos
as correcções de continuidade consideradas anteriormente.

ESTATÍSTICA

Com efeito, se substituirmos a por a-0.5 e b por b+0.5, obtemos a
sequência
⎛ b + 0.5 − nθ ⎞ ⎛ a − 0.5 − nθ ⎞
P(a ≤ X ≤ b) ≈ Φ ⎜ ⎟ - Φ⎜
⎜ ⎟ , 0 < a < b ≤ n (14)
⎜ nθ (1 − θ ) ⎟ ⎟
⎝ ⎠ ⎝ nθ (1 − θ ) ⎠
ou de forma equivalente

⎛b 1 ⎞ ⎛a 1 ⎞
⎜ + −θ ⎟ ⎜ − −θ ⎟
⎛a b⎞ a b
P ⎜ ≤ X ≤ ⎟ ≈ Φ ⎜ n 2n ⎟ - Φ ⎜ n 2n ⎟ , 0 < < ≤ 1 (15)
⎝n n⎠ ⎜ θ (1 − θ ) ⎟ ⎜ θ (1 − θ ) ⎟ n n
⎜ ⎟ ⎜ ⎟
⎝ n ⎠ ⎝ n ⎠
Assim, quando a dimensão da amostra o permite, os problemas
binomiais são “transportados” para a esfera de aplicação da

ESTATÍSTICA

distribuição normal e tornam mais acessíveis os cálculos. Por vezes,
torna-se aconselhável recorrer à lei dos acontecimentos raros,
utilizando a distribuição de Poisson para lidar com problemas de
Bernoulli.

Exemplo 3
Admita-se que uma instituição bancária classifica os seus clientes
possuidores de cartão de crédito em “maus” e “bons” riscos, conforme
tenham ou não faltado a um pagamento nos últimos 2 anos. Suponha-
se que a proporção de “maus” riscos (classificados com X=1) é de
0.05 para as agências da zona de Lisboa.


ESTATÍSTICA

Qual a probabilidade de se obter pelo menos 10% de “maus” riscos
numa amostra de:
a) 10 clientes;
b) 50 clientes;
c) 400 clientes?
Para responder a qualquer uma das alíneas, devemos calcular
P ( X ≥ 0.1), sabendo-se que Xi ∼ B(1, 0.05) para i=1,2,...,n.
a) Neste caso, pequena amostra, utiliza-se a distribuição Binomial,
P ( X ≥ 0.1)= P ( ∑ i =1 X i ≥ 10 × 0.1) = P ( ∑ i =1 X i ≥ 1) =1- P ( ∑ i =1 X i = 0)=1-
10 10 10

0.5987=0.4013,
recorrendo à Tabela da Binomial.

ESTATÍSTICA

b) Nesta situação, o recurso à distribuição Binomial, é muito
“laborioso”, no entanto nθ=50×0.05=2.5<5. Como θ é pequeno pode
utilizar-se a lei dos acontecimentos raros, ou seja, a aproximação à
Poisson2 de parâmetro igual a nθ.
Assim, P ( X ≥ 0.1)

=P (∑ 50
i =1
X i ≥ 50 × 0.1 = P ) (∑ 50
i =1
X i ≥ 5 = 1− P) (∑ 50
i =1
Xi ≤ 4 )
≈ 1 – (0.0821+0.2052+0.2565+0.2138+0.1336)=0.1088, utilizando a
tabela da distribuição de Poisson, com parâmetro 2.5.

c) Como se trata de uma grande amostra, utilizamos (14), isto é,
2
A regra prática para utilizar esta “lei” deve basear-se no pressuposto de que se tem um acontecimento raro e um número “elevado” de observações. Assim, não é aconselhável fazer a


ESTATÍSTICA

⎛ ⎞
⎜ X − 0.05 0.1 − 0.05 ⎟
P ( X ≥ 0.1)= P ⎜ ≥ ⎟
⎜ 0.05(1 − 0.05) 0.05(1 − 0.05) ⎟
⎜ ⎟
⎝ 400 400 ⎠
⎛ ⎞
⎜ 0.1 − 0.05 ⎟
≈1-Φ ⎜ ⎟
⎜ 0.05(1 − 0.05) ⎟
⎜ ⎟
⎝ 400 ⎠
≈ 1 - Φ(4.59) ≈ 0, se não se proceder à correcção de continuidade,
ou então

aproximação quando 0.1<θ<0.9 (quando θ≥0.9, é evidente que o acontecimento em causa não é “raro”; é o, sim, o seu complementar) ou quando n≤20.


ESTATÍSTICA

⎛ 1 ⎞
⎜ 0.1 − − 0.05 ⎟
X − 0.05 800
P ( X ≥ 0.1)= P ⎜ ≥ ⎟
⎜ 0.05(1 − 0.05) 0.05(1 − 0.05) ⎟
⎜ ⎟
⎝ 400 400 ⎠
⎛ 1 ⎞
⎜ 0.1 − − 0.05 ⎟
≈1-Φ ⎜ 800 ⎟
⎜ 0.05(1 − 0.05) ⎟
⎜ ⎟
⎝ 400 ⎠
≈ 1 - Φ(4.47) ≈ 0, o que é teoricamente mais correcto.


ESTATÍSTICA

5. Amostragem de população de Bernoulli. Caso de duas
proporções.

Considerem-se agora duas populações de Bernoulli, com parâmetros
θ1 e θ2. A ideia de comparar as duas proporções verdadeiras, θ1 e θ2,
surge em muitas situações praticas (por exemplo, proporção de curas
nos doentes tratados com o medicamento A e nos doentes tratados
com o medicamento B; proporção de peças defeituosas quando se
emprega o processo A e quando se emprega o processo B).
Então, nos estudos de amostragem, a diferença entre proporções
verdadeiras, θ1 - θ2, nunca pode ser conhecida exactamente; no


ESTATÍSTICA

entanto, podem estabelecer-se inferências através da estatística
X 1 − X 2 (a diferença entre proporções observadas) calculadas,
respectivamente, a partir de amostra casual da primeira população,
X1i
(X11, X12,...., X1m) ⇒ X 1 = ∑ i =1
m
,
m
e de amostra casual da segunda população,
X2 j
(X21, X22,...., X2n) ⇒ X 2 = ∑ j =1
n
,
n
amostras que se supõem escolhidas independentemente uma da
outra.


ESTATÍSTICA

Como não se conhece a distribuição exacta, só pode estudar-se a
distribuição assimptótica de X 1 − X 2 , válida quando as dimensões das
amostras são razoavelmente grandes. Tem-se, então

a
⎛ θ1(1 − θ1 ) ⎞ a
⎛ θ 2 (1 − θ 2 ) ⎞
X 1 ~ N ⎜ θ1, ⎟ , e X 2 ~ N ⎜θ2, ⎟ (16)
⎝ m ⎠ ⎝ n ⎠

Consequentemente, e utilizando a propriedade (corolário anterior) que
estabelece que a diferença de duas variáveis aleatórias independentes
com distribuição normal (aproximadamente normal) tem distribuição


ESTATÍSTICA

normal (aproximadamente normal), tem-se, depois de estandardizar, o
resultado

X 1 − X 2 − (θ1 − θ 2 ) a
~ N (0, 1) (17)
θ1 (1 − θ1 ) θ 2 (1 − θ 2 )
+
m n

Para tal, basta notar que
E( X 1 − X 2 ) = E( X 1) – E( X 2 ) = θ1 - θ2,
θ1(1 − θ1 ) θ 2 (1 − θ 2 )
e Var( X 1 − X 2 ) = Var( X 1) + Var( X 2 ) = +
m n


ESTATÍSTICA

Exemplo 4
Retome-se o exemplo 3 e suponha-se que a percentagem de “maus”
riscos na zona do Porto é de 0.06. recolhidas amostras independentes
nas zonas de Lisboa e Porto de dimensões 400 e 500,
respectivamente, qual a probabilidade de se observar uma proporção
maior de “maus” riscos em Lisboa do que no Porto?

A resposta é, então, encontrada calculando P( X 1 − X 2 >0), onde o
índice 1 designa a amostra de Lisboa, e o índice 2, a do Porto. Como
se trata de grandes amostras, recorremos a (17)


ESTATÍSTICA

⎛ ⎞
⎜ X 1 − X 2 − (θ − θ ) 0 − (0.05 − 0.06) ⎟
P( X 1 − X 2 >0)= P ⎜ 1 2
> ⎟
⎜ θ1(1 − θ1 ) θ 2 (1 − θ 2 ) 0.05 × 0.95 0.06 × 0.94 ⎟
⎜ + + ⎟
⎝ m n 400 500 ⎠
≈1-Φ(0.66)≈0.2546

Valor que evidencia os cuidados que devemos ter, no processo de
inferência, nas conclusões amostrais para a população. Com efeito,
embora a proporção de “maus” riscos seja menor em Lisboa do que no
Porto, mesmo assim a probabilidade de a média da amostra de Lisboa
ser superior à média da amostra do Porto é aproximadamente 25%.


ESTATÍSTICA

6. População normal: distribuição da média.

Considere-se agora (X1, X2,....., Xn) uma amostra casual da
população normal N(μ, σ2). Para obtermos a distribuição por
amostragem da média, X , aplicamos o corolário (6), depois de se
recordar que E( X )=μ e que Var( X )=σ2/n. Naturalmente, se (X1, X2,.....,
Xn) é uma amostra casual da população normal, N(μ, σ2), então
⎛ σ2 ⎞
X ~ N ⎜ μ, ⎟ (18)
⎝ n ⎠
o resultado anterior pode ainda escrever-se, de forma equivalente e
mais adequada às aplicações práticas, por

ESTATÍSTICA

X −μ
n ~ N (0,1) (19)
σ

Exemplo 5
Considere-se que a duração das chamadas telefónicas locais em
determinada empresa pode ser aproximada por uma distribuição
normal com média igual a 17 minutos e variância 25. Qual a
probabilidade de, numa amostra aleatória de n chamadas, a duração
média se situar entre 16 e 18 minutos?

Quando n=25, temos


ESTATÍSTICA

⎛ 16 − 17 X 25 − 17 18 − 17 ⎞
P(16 < X 25 < 18) = P ⎜ 25 < 25 < 25 ⎟
⎝ 25 25 25 ⎠
= Φ(1) - Φ(-1) = 2×Φ(1) – 1 ≈ 0.6826.
Faça o mesmo exercício, para n=100 e tire conclusões.

7. População normal: distribuição da variância.

( Xi − μ )
2

∑
n
Relembre-se, que a variável aleatória tem distribuição
i =1
σ 2

χ 2 (n) desde que as variáveis Xi sejam independentes e tenham
distribuição N(μ, σ2).


ESTATÍSTICA

Deste modo, considere-se uma amostra casual (X1, X2,....., Xn) de
população normal, N(μ, σ2), e as estatísticas X e S2.
Então prova-se que:
Teorema:4
Se (X1, X2,..., Xn) é uma amostra casual de uma população normal,

∑ (X )
n 2
nS 2 i =1 i −X
N(μ, σ ), então2
= ~ χ 2 (n − 1) (20)
σ 2
σ 2

(n − 1)S´2
Desta forma podemos, facilmente, concluir que ~ χ 2 (n − 1)
σ2
pois, nS2=(n-1)S´2.


ESTATÍSTICA

∑ (X − μ)
n 2
i =1
~ χ 2 (n )
i
A comparação entre e
σ 2

∑ (X )
n 2

i =1 i −X
~ χ 2 (n − 1) mostra que se perde um grau de liberdade
σ2
quando, na expressão da soma de quadrados, a média da população
é substituída pela média da amostra.


ESTATÍSTICA

Exemplo 6

Considere-se uma população normal da qual se extraiu uma amostra
de dimensão 25.
Supondo que se procura calcular a probabilidade de o quociente entre
a variância corrigida da amostra e a variância da população se situar
entre 0.79 e 1.18, obtém-se
⎛ S´2 ⎞ ⎛ (n − 1)S´2 ⎞
P ⎜ 0.79 < 2 < 1.18 ⎟ = P ⎜ 24 × 0.79 < < 24 × 1.18 ⎟
⎝ σ ⎠ ⎝ σ 2
⎠
≈ 0.75-0.25=0.5


ESTATÍSTICA

8. População normal: Rácio de Student.
No caso de amostragem de populações normais, o resultado (19) é
utilizado para estabelecer inferência sobre a média da população μ, a
partir da média da amostra, X , quando a variância, σ2 é conhecida.
Se a variância, σ2 é desconhecida – caso em que se diz que σ2 (ou σ)
é um parâmetro perturbador na óptica das inferências sobre μ - a
presença de σ em (19) torna impraticável a realização de inferência
com base neste resultado.
Durante anos pensou-se que o rácio de Student,
X −μ X −μ
n ou n −1 (21)
S´ S


ESTATÍSTICA

tinha distribuição normal, isto é, admitiu-se que a substituição de σ por
S´ no denominador de (21) não alterava a distribuição. Assim
acontece, com razoável aproximação, quando n é suficientemente
grande, caso em que pode empregar-se a distribuição assimptótica,
X −μ a
n ~ N (0,1) (22)
S´
Contudo, para pequenas amostras, S´ é vulnerável a grandes
flutuações de amostra para amostra, o que faz com que o rácio de
Student siga outra distribuição – a distribuição t-Student – e não a
distribuição normal. (ver distribuições teóricas)


ESTATÍSTICA

Desta forma, tem-se
X −μ
n ~ t (n − 1) (23)
S´

Exemplo 7
De uma população com distribuição normal de média e variância
desconhecidas, extraiu-se uma amostra casual de dimensão 25, cuja
variância corrigida é 49. Qual a probabilidade de a média da amostra
diferir da média da população, em valor absoluto, por uma valor
inferior a 2.4?


ESTATÍSTICA

A formulação, para resposta ao problema, é dada através de
P(| X - μ| < 2.4) ou então por P(-2.4 < X - μ < 2.4).

⎛ −2.4 X −μ 2.4 ⎞
Então, P(-2.4 < X - μ < 2.4) = P ⎜ < < ⎟
⎝ 49 / 25 S´/ n 49 / 25 ⎠

⎛ X −μ ⎞ ⎛ X −μ ⎞
= P ⎜ −1.711 < < 1.711⎟ =1-2×P ⎜ > 1.711⎟ =1-2×0.05=0.9
⎝ S´/ n ⎠ ⎝ S´/ n ⎠


ESTATÍSTICA

9. Populações normais: diferença entre duas médias.
Considerem-se duas amostras casuais, X11, X12,....., X1m, X21,
X22,......., X2n, obtidas, de forma independente, das populações normais
N(μ1, σ12) e N(μ2, σ22), respectivamente. Considerem-se, ainda,

1 m 1 n
X1 = ∑
m i =1
X1i e X 2 = ∑ j =1 X 2 j as respectivas médias.
n
Então, podemos concluir que
⎛ σ 12 σ 2 ⎞
2
X 1 − X 2 ~ N ⎜ μ1 − μ2 , + ⎟ (24)
⎝ m n ⎠
e de forma “mais simpática”


ESTATÍSTICA

(X 1 )
− X 2 − ( μ1 − μ2 )
~ N (0, 1) (25)
σ 12 σ2
2
+
m n
Contudo, as distribuições descritas, têm aplicação quando as
variâncias das duas populações são conhecidas. Quando se sabe que
as variâncias, embora desconhecidas, são iguais, pode recorrer-se a
outro resultado para estabelecer inferências sobre μ1 - μ2.
Supondo que σ12 = σ22 = σ2, o resultado (25) pode escrever-se

U=
(X 1 )
− X 2 − ( μ1 − μ2 )
~ N (0, 1)
1 1
σ +
m n


ESTATÍSTICA

Considerem-se agora, as variâncias corrigidas das duas amostras
1 1
∑ ∑
m n
S =´2
( X1i − X 1 ) , e S2 =
2 ´2
( X 2 j − X 2 )2
m − 1 i =1 n − 1 j =1
1

atendendo a (20), tem-se que V =
( m − 1) S1´2 + ( n − 1) S2
´2

~ χ 2 (m + n − 2)
σ2
e como as variáveis U e V são independentes, podemos aplicar a
definição 0.5, obtendo assim,
X 1 − X 2 − ( μ1 − μ2 )
1 1
+
T = m n ~ t (m + n − 2) (26)
( m − 1) S1 + ( n − 1) S2
´2 ´2

m+n−2


ESTATÍSTICA

pois S´2 =
( m − 1) S1´2 + ( n − 1) S2
´2

traduz a melhor aproximação ao valor
m+n−2
de σ2, comum às duas populações, que, no entanto, têm médias
diferentes.

∑ (X ) +∑ (X )
m 2 n 2

i =1 1i − X1 j =1 2j − X2
De facto, na expressão S ´2
= o
m+n−2
numerador corresponde à soma habitual adaptada à nova situação, e
o denominador é igual ao número total de observações menos duas,
uma vez que se utilizam as estatísticas X 1 e X 2 em substituição das
médias desconhecidas das populações, μ1 e μ2 (perderam-se dois
graus de liberdade). Não sendo válidas as expressões (25) e (26),


ESTATÍSTICA

quando as variâncias das populações são desconhecidas e diferentes,
as inferências sobre μ1 - μ2 tornam-se mais complexas.

Assim, quando a dimensão das amostras o permite, pode operar-se
com a distribuição normal assimptótica que resulta de substituir em
(25) as variâncias da população pelas variâncias das amostras.

Quando as amostras são pequenas, em particular se forem de
diferentes dimensões, uma solução possível consiste em recorrer à
aproximação de Welch. Este autor mostrou que


ESTATÍSTICA

Z=
(X 1 )
− X 2 − ( μ1 − μ2 ) a
~ t (v ) onde v é dado pelo maior inteiro
´2 ´2
S1 S2
+
m n
2
⎛s s ⎞ ´2 ´2

⎜m + n ⎟
1 2

contido em r = ⎝ ⎠ ´2 ´2
sendo s1 e s2 os valores
´2 2 ´2 2
1 ⎛ s1 ⎞ 1 ⎛ s2 ⎞
⎜ m ⎟ + n − 1⎜ n ⎟
m − 1⎝ ⎠ ⎝ ⎠
´2 ´2
observados nas amostras para S1 e S2 , respectivamente. Assim,
quando o valor de r não é inteiro, arredonda-se por defeito.


ESTATÍSTICA

Exemplo 8
Admita-se que os resultados do teste de QI são bem modelados por
distribuições normais de média 100 nos países A e B.
a) Recolhida uma amostra de dimensão 16 no país A, e outra, de
dimensão 10 no país B, calcule-se a probabilidade de a média da
primeira amostra ser superior em mais que 5 pontos à média da
segunda amostra, sabendo que se observou uma variância
amostral corrigida de 12 no país A e de 18 no país B?
b) Repita-se a questão anterior agora que, embora desconhecidas,
as variâncias nas duas populações são iguais.


ESTATÍSTICA

Nas duas questões é necessário calcular P X A − X B > 5 , sendo ( )
desconhecidas as variâncias das duas populações. Em a), não
existindo razoes para admitir que as variâncias são iguais, utiliza-se a
2
⎛ 12 18 ⎞
⎜ 16 + 10 ⎟
fórmula de Welch, obtendo-se r = ⎝ ⎠ ≈16.36, e
2 2
1 ⎛ 12 ⎞ 1 ⎛ 18 ⎞
⎜ 16 ⎟ + 9 ⎜ 10 ⎟
15 ⎝ ⎠ ⎝ ⎠
portanto, utiliza-se uma distribuição t-Student com 16 graus de
liberdade.

Como μA - μB = 100 - 100 = 0,


ESTATÍSTICA

⎛ ⎞
⎜
(
⎜ X A − X B − ( μ A − μB ) > ) 5−0 ⎟
⎟
(
P XA − XB > 5 = P
⎜ ´2
SA SB
) ´2
12 18 ⎟
= P(Z > 3.13)
⎜ + + ⎟
⎜ nA nB 16 10 ⎟
⎝ ⎠
≈ 0.001em b), recorremos à expressão (26)
⎛
⎜
(X A )
− X B − ( μ A − μB )
5−0
⎞
⎟
⎜ 1 1 1 1 ⎟
⎜ + + ⎟
( )
nA nB
P XA − XB > 5 = P⎜ > 16 10 ⎟
⎜ ( nA − 1) S + ( nB − 1) S
´2 ´2
15 × 12 + 9 × 18 ⎟
⎜ 16 + 10 − 2 ⎟
A B

⎜ nA + nB − 2 ⎟
⎜ ⎟
⎝ ⎠


ESTATÍSTICA

= P(X > 3.286) ≈ 0.001 (t-Student, com 24 graus de liberdade)

6.10. Populações normais: relação entre duas variâncias.
Vamos, por fim, estabelecer inferências sobre a relação entre as
σ 12
variâncias, 2 , de duas populações normais independentes, onde
σ2
´2
S1
será natural pensar na estatística ´2 . Sendo as duas amostras
S2
independentes, torna-se fácil ver que esta estatística pode ser
relacionada com o quociente de duas variáveis independentes com
distribuição do qui-quadrado, cada uma delas sendo dividida pelos


ESTATÍSTICA

respectivos graus de liberdade. Então, considerando as variáveis
aleatórias independentes,

U=
( m − 1) S1´2 ~ χ 2 (m − 1) e V=
( n − 1) S2
´2

~ χ 2 (n − 1) ,
σ 12 σ2
2

U /(m − 1) S1 σ 2
´2 2
obtém-se F = = ´2 2 (27)
V /(n − 1) S2 σ 1
onde F designa a, estudada, distribuição de Fisher.
Com efeito, suponha-se que se tem duas populações normais,
N(μ1, σ12) e N(μ2, σ22). Sejam S1 e S2 as variâncias corrigidas de
´2 ´2

amostras casuais independentes de dimensão m e n,


ESTATÍSTICA

respectivamente. Atendendo a (27) e à definição 0.6, concluímos
S1 σ 2
´2 2
imediatamente que ´2 2 ~F(m-1,n-1) (28)
S2 σ 1
e em particular, quando σ12 = σ22, obtém-se
´2
S1
´2
~F(m-1,n-1) (29)
S2
Exemplo 9
Considere-se, novamente, o exemplo 8, referente aos resultados dos
testes de QI em dois países. Admita-se que ambas as populações são
normais no que se refere aos resultados obtidos nestes testes e que
se recolheu uma amostra de dimensão 16 no país A, e outra, de


ESTATÍSTICA

dimensão 10, no país B. Admitindo que as variâncias nas duas
populações são iguais, qual a probabilidade de o quociente entre as
´2
SA
variâncias corrigidas das duas amostras, ´2 ser superior a 3.77?
SB

⎛ SA
´2
⎞
A resposta obtém-se, calculando P ⎜ ´2 > 3.77 ⎟ , utilizando a tabela da
⎝ SB ⎠
distribuição de Fisher, com 15 e 9 graus de liberdade [F(16-1, 10-
1)=F(15,9)], temos que a referida probabilidade é aproximadamente
0.025. É de salientar que, não sendo as amostras de dimensão igual,
⎛ SA
´2
⎞ ⎛ SB
´2
⎞
P ⎜ ´2 > 3.77 ⎟ ≠ P ⎜ ´2 > 3.77 ⎟ , como facilmente pode ser
⎝ SB ⎠ ⎝ SA ⎠


ESTATÍSTICA

comprovado. Suponha-se agora que pretendíamos calcular a
´2
SA
probabilidade de o quociente entre variâncias corrigidas, ´2 , ser
SB

⎛ SA
´2
⎞
inferior a 0.386. Então vamos calcular P ⎜ ´2 < 0.386 ⎟ , mas para tal
⎝ SB ⎠
devemos recorrer à propriedade, enunciada anteriormente no final da
Folha 12, da distribuição de Fisher.
⎛ SA
´2
⎞ ⎛ SB
´2
1 ⎞
Seja, P ⎜ ´2 < 0.386 ⎟ = P ⎜ ´2 > ⎟
⎝ SB ⎠ ⎝ SA 0.386 ⎠

⎛ SB
´2
⎞
= P ⎜ ´2 > 2.59 ⎟ ≈ 0.05 [F(10-1,16-1) = F(9,15)]
⎝ SA ⎠

O Professor: Manuel do Carmo Manuel do
Assinado de forma digital por
Manuel do Carmo
146
DN: cn=Manuel do Carmo, c=PT,
o=ISEGI-UNL, ou=ISLA-Lx,
Carmo email=carmo.manuel@gmail.com
Dados: 2010.03.07 23:33:47 Z

Distribuições amostragem

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Distribuições amostragem

Similar a Distribuições amostragem (20)

Último

Último (20)

Distribuições amostragem