SlideShare una empresa de Scribd logo
1 de 59
Descargar para leer sin conexión
ESTATÍSTICA




                                 DISTRIBUIÇÕES POR AMOSTRAGEM


    1. Introdução
    Neste ponto encerra-se o percurso dedutivo “população → amostra”.
Partindo do conhecimento da população, caracterizar-se-ão as
distribuições de certas estatísticas amostrais, ou seja, analisar-se-á a
forma como tais estatísticas variam de amostra para amostra. Para
que tal seja possível, é necessário que as amostras sejam
seleccionadas de acordo com processos probabilísticos (isto é,
processos que tornem possível o cálculo da probabilidade de cada

O Professor:   Manuel do Carmo                                            88
ESTATÍSTICA


elemento da população ser incluído em cada amostra). Nesta
disciplina considerar-se-á apenas o processo de amostragem
aleatória, como o mais importante dos processos probabilísticos. Note-
se que se utilizam frequentemente outros processos de amostragem,
designadamente os processos de amostragem estratificada e por
conglomerados.
DEF. 1 – Amostragem Aleatória
Quando as n variáveis aleatórias observadas, componentes do vector
(X1, X2,....,                    Xn) são independentes e identicamente distribuídas –
simbolicamente iid – diz-se que se trata de amostragem casual ou
aleatória.

O Professor:   Manuel do Carmo                                                         89
ESTATÍSTICA


Ao pedir que as variáveis sejam identicamente distribuídas pretende-
se que os Xi, i=1, 2,..., n, sejam “cópias” da variável aleatória X que
representa o atributo da população em estudo. Ao pedir independência
está a pensar-se que, se a função de distribuição de X é F(x), a função
de distribuição conjunta das n variáveis Xi que compõem a amostra
aleatória se determina facilmente, pelo produto


                             F(x1,x2,….,xn) = F(x1)F(x2).....F(xn)         (1)
Que se designa por distribuição da amostra. Esta distribuição traduz a
estrutura da população de amostras de dimensão n (do espaço -
amostra) obtidas da população representada pela variável aleatória X.

O Professor:   Manuel do Carmo                                                90
ESTATÍSTICA


Na maior parte das situações estamos em situação de inferência
estatística paramétrica.
Neste caso, a forma de F é, ou supõe-se, conhecida, seja F(x|θ), e
desconhece-se apenas o “verdadeiro” valor do parâmetro (escalar ou
vector), isto é, o valor particular que indexa a função de distribuição
que descreve “apropriadamente” as condições em que se observam
as variáveis ou, como também se diz, o processo gerador de dados.
A especificação consiste, neste caso, em admitir que F(x|θ) pertence a
uma família de expressão analítica conhecida,



                                 ℱθ={F(x|θ): θ ∈ Θ},                 (2)
O Professor:   Manuel do Carmo                                           91
ESTATÍSTICA


em que o parâmetro, escalar ou vector, assume valores em dado
conjunto Θ designado por espaço-parâmetro. O conjunto ℱθ é a família

das funções de distribuiçao F para todos os valores possíveis de θ ∈
Θ, e constitui o modelo probabilístico a considerar na inferência
estatística paramétrica.


DEF. 2 – Estatística
Uma estatística é uma variável, ou vector aleatório, T(X1, X2,...., Xn),
função da amostra aleatória X1, X2,...., Xn, que não envolve qualquer
parâmetro desconhecido.


O Professor:   Manuel do Carmo                                            92
ESTATÍSTICA


Se X1, X2,...., Xn é amostra casual de população normal N(μ, σ2) com
parâmetros μ e σ2 desconhecidos, são exemplos de estatísticas
unidimensionais:


                                  1                                      1
                ∑    i
                         Xi , X =
                                  n
                                          ∑   i
                                                  Xi ,     ∑     i
                                                                     X ,
                                                                         n
                                                                             i
                                                                              2
                                                                                       ∑     i
                                                                                                 X i2

não são estatísticas as funções:


                 1                        1                          1
                σ
                     ∑      ( Xi − μ ),
                                          σ
                                                  ∑   i
                                                          Xi ,
                                                                     σ   2    ∑   i
                                                                                      X i2

porque dependem de parâmetros desconhecidos.


O Professor:   Manuel do Carmo                                                                                   93
ESTATÍSTICA


    2. Primeiros resultados sobre a média e a variância amostrais


    Vamos neste ponto determinar o valor esperado e a variância das
estatísticas,
   1                                     1
X=
   n
                ∑    i
                         Xi      e   S =
                                      2

                                         n
                                             ∑   ( X i − X )2 , que são como se sabe, a

média amostral e a variância amostral, respectivamente.


Os teoremas que se seguem são de estrema importância, para
distinguir entre parâmetros da população e parâmetros da distribuição
por amostragem, bem como estabelecer relações entre eles.

O Professor:   Manuel do Carmo                                                           94
ESTATÍSTICA


Teorema: 1
Se (X1, X2,...., Xn) é amostra casual de população para a qual existem
média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se
                                                       σ2
                           E ( X ) = μ , Var ( X ) =                      (3)
                                                       n


Teorema: 2
Se (X1, X2,...., Xn) é amostra casual de população para a qual existem
média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se
                                          n −1 2
                                 E (S ) =
                                     2
                                              σ ,                        (4)
                                           n

O Professor:   Manuel do Carmo                                               95
ESTATÍSTICA


Para o caso de se tratar de amostras de pequena dimensão (n<30), é
usual propor outra estatística para estimar σ2, a designada variância
corrigida,


       1
S´ =2

     n −1
          ∑ ( X i − X )2 , que verifica E(S´2) = σ2, e que não subavalia,

em média, a variância da população.


De modo a “justificar” alguns dos resultados a utilizar posteriormente,
vamos de seguida enunciar um teorema, encarado por muitos como
fundamental para a inferência estatística amostral.

O Professor:   Manuel do Carmo                                             96
ESTATÍSTICA


Teorema: 3 – Teorema do limite central
Dada a sucessão de variáveis aleatórias iid, X1, X2,...., Xn,...., com
média μ e variância σ2, então, quando n→+∞, a função de distribuição

                                      ∑          X i − nμ
                                          n

da variável aleatória, Zn           =     i =1
                                                                               (5)
                                                 nσ
tende para uma função de distribuição N(0, 1), ou seja, a distribuição
assimptótica de Zn é N(0, 1). Simbolicamente, Zn ~ N(0, 1).     a




A conclusão do teorema, pode exprimir-se na forma alternativa


                                         ⎛ ∑ n X − nμ     ⎞
                 lim P (Zn ≤ x ) = lim P ⎜   i =1
                                                      ≤ x ⎟ = Φ( x ) ,
                                                   i
                n →+∞              n →+∞ ⎜        nσ      ⎟
                                         ⎝                ⎠
O Professor:   Manuel do Carmo                                                    97
ESTATÍSTICA


ou, ainda,
                                ⎛ ∑ n X − nμ     ⎞
                P (Zn ≤ x ) = P ⎜ i =1       ≤ x ⎟ ≈ Φ( x ) (n grande).
                                        i

                                ⎜      nσ        ⎟
                                ⎝                ⎠
Exemplo 1
Analisando o mercado de certo produto, uma empresa conclui que a
procura diária (em centenas de quilogramas) a satisfazer é uma
variável aleatória X com média 40 e variância 25. Sendo a produção
anual planeada de 11 500, pretende calcular-se a probabilidade de
haver procura anual excedentária, considerando que um ano tem 289
dias úteis.


O Professor:   Manuel do Carmo                                                     98
ESTATÍSTICA


Representando por Xi, i=1, 2, 289, a variável aleatória que exprime a
procura no i-ésimo dia, tem-se E(Xi) = 40 e Var(Xi) = 25; pretende

calcular-se P                    (∑   289
                                      i =1              )
                                             X i > 11 500 , como não se conhece a distribuição

das variáveis aleatórias Xi, o cálculo é efectuado através do teorema
0.8.
Tem-se,
                          ⎛ ∑ 289 X − 289 × 40 11500 − 289 × 40 ⎞
    (
P ∑ i =1 X i > 11 500 = P ⎜ i =1
    289

                          ⎜
                                   i

                                  25 × 289
                                             )>
                                                   25 × 289
                                                                ⎟
                                                                ⎟
                          ⎝                                     ⎠
≈ 1 - Φ(-0.71) = 1 – [1 -Φ(0.71)] = Φ(0.71) =0.7611.



O Professor:   Manuel do Carmo                                                                  99
ESTATÍSTICA


Corolário:
Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com
                                                 X −μ    a
média μ e variância σ , então               2
                                                         ~ N (0, 1)        (6)
                                                 σ
                                                     n

         ∑
                            n
                                   Xi
onde X =                    i =1
                             n
Uma forma alternativa de expressar o corolário anterior, é
                                        a ⎛ σ2 ⎞
                                    X ~ N ⎜ μ,   ⎟                         (7)
                                          ⎝    n ⎠




O Professor:   Manuel do Carmo                                                100
ESTATÍSTICA


    3. Aproximações para distribuições discretas
    Considere-se, em primeiro lugar, a aproximação da distribuição de
Bernoulli pela Normal.


Corolário:
Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com
distribuição de Bernoulli média E(Xi)=θ, e portanto, Var(Xi)=θ(1-θ), tem-

                                 ∑          X i − nθ
                                     n
                                                       a
                                     i =1
se                                                     ~ N (0, 1)        (8)
                                 n θ (1 − θ )

De outra forma, considere-se X = ∑ i =1 X i , variável aleatória com
                                                                n



distribuição binomial. Assim, quando n é grande, as probabilidades
O Professor:   Manuel do Carmo                                              101
ESTATÍSTICA


binomiais que exigem cálculos laboriosos podem obter-se rapidamente
de forma aproximada recorrendo ao corolário anterior.


Suponha-se que, com X ∼ B(n, θ), pretende calcular-se P(a ≤ X ≤ b), a
e b inteiros,                    0 ≤ a < b ≤ n. Como se sabe, P(a ≤ X ≤ b) =

∑              Cx θ x (1 − θ )n − x , para valor exacto da probabilidade pretendida.
     b      n
     x =a

Com n grande, o cálculo da expressão do segundo membro é muito
trabalhoso, principalmente se não for possível recorrer a um
computador.




O Professor:   Manuel do Carmo                                                      102
ESTATÍSTICA


                          ⎛ a − nθ                    X − nθ            b − nθ      ⎞
Contudo, P(a ≤ X ≤ b) = P ⎜             ≤                           ≤               ⎟, e
                          ⎜ nθ (1 − θ )               nθ (1 − θ )       nθ (1 − θ ) ⎟
                          ⎝                                                         ⎠
                                     X − nθ       a
em virtude do corolário anterior                  ~ N(0, 1)
                                    nθ (1 − θ )


                             ⎛ b − nθ ⎞         ⎛ a − nθ ⎞
e, portanto, P(a ≤ X ≤ b) ≈Φ ⎜               - Φ⎜
                             ⎜ nθ (1 − θ ) ⎟    ⎜ nθ (1 − θ ) ⎟
                                                                                      (9)
                                           ⎟                  ⎟
                             ⎝             ⎠    ⎝             ⎠
Caso n não seja muito grande, ou então se nos pedem P(X = x),
devemos substituir a por a - 0.5 e b por b + 0.5. Nesta situação, os
resultados obtidos são mais aproximados.


O Professor:   Manuel do Carmo                                                           103
ESTATÍSTICA


Considerem-se, agora, algumas regras práticas para o cálculo de
probabilidades que envolvem a distribuição binomial.
          - Se n ≤ 20, deve utilizar-se directamente a distribuição binomial, o que permite o cálculo
              exacto das probabilidades a partir dos valores apresentados em qualquer tabela da
              distribuição em causa;
          - Se n > 20, o cálculo aproximado das probabilidades deve atender aos seguintes casos:
                  Se θ ≤ 0.1, deve utilizar-se a aproximação de Poisson1 à Binomial;
                  Se θ ≥ 0.9, também se deve utilizar a já referida aproximação, considerando o
                  respectivo acontecimento complementar,
                  Se 0.1 < θ < 0.9, recorre-se à aproximação pela normal standardizada.




1
    Def: Distribuição de Poisson
                                                               e −λ λx
Uma variável aleatória X com função de probabilidade f(x|λ)=             , x=0, 1, 2,....,...(λ>0), diz-se que tem distribuição de Poisson. Simbolicamente, X ∼ Po(λ). As suas média e variância,
                                                                  x!
são respectivamente: E(X)=λ e Var(X)=λ

O Professor:     Manuel do Carmo                                                                                                                                                               104
ESTATÍSTICA


Refira-se, no entanto, que neste curso as situações a estudar devem
contemplar, unicamente, o último caso.


Exemplo 2
Seja a variável aleatória X ∼ B(200, 0.5). Neste caso, Θ = P(95 ≤ X ≤
105) deve interpretar-se como sendo a probabilidade par que, em 200
lançamentos de uma moeda, o número de “faces” não apresente em
relação a E(X) = 200 × 0.5 = 100 um desvio superior a 5. O valor

                                 ∑
                                     105
exacto de Θ é, Θ =                   x = 95
                                                Cx (0.5)x (0.5)200 − x = 0.563246, sendo o
                                              200



cálculo tedioso caso se não disponha de computador. Recorrendo à
aproximação 9 e a uma tabela da distribuição Binomial,
O Professor:   Manuel do Carmo                                                            105
ESTATÍSTICA


        ⎛ 95 − 200 × 0.5         X − 200 × 0.5     105 − 200 × 0.5 ⎞
   Θ = P⎜                 ≤                      ≤                  ⎟
        ⎝ 200 × 0.5 × 0.5        200 × 0.5 × 0.5    200 × 0.5 × 0.5 ⎠
         ⎛ 105 − 100 ⎞    ⎛ 95 − 100 ⎞
      ≈ Φ⎜           ⎟ - Φ⎜          ⎟
         ⎝     50 ⎠       ⎝    50 ⎠
      ≈ Φ(0.7071) - Φ(-0.7071) = 2×Φ(0.7071) – 1 = 0.520498
No entanto, se substituíssemos 105 por 105+0.5 e 95 por 95-0.5, a
aproximação era muito melhor, pois


        ⎛ 105 + 0.5 − 100 ⎞    ⎛ 95 − 0.5 − 100 ⎞
   Θ ≈ Φ⎜                 ⎟ - Φ⎜                ⎟
        ⎝        50       ⎠    ⎝       50       ⎠
      ≈ Φ(0.7778) - Φ(-0.7778) = 2×Φ(0.7778) –1 = 0.563316

O Professor:   Manuel do Carmo                                                  106
ESTATÍSTICA


    4. Amostragem de população de Bernoulli. Caso de uma
    proporção.
    Considere-se uma população de Bernoulli. Esta população é
composta por elementos de dois tipos – os que possuem e os que não
possuem determinado atributo – e é caracterizada por uma função
probabilidade da família,
                          ℱθ = {f(x|θ) = θx (1 - θ)1-x : x ∈ {0, 1} ∧ 0 < θ < 1}.


O parâmetro θ, que também se designa por proporção verdadeira, é
naturalmente a principal incógnita na amostragem de populações de
Bernoulli.
O Professor:   Manuel do Carmo                                                              107
ESTATÍSTICA


A amostra casual de populações de Bernoulli, (X1, X2,........, Xn), é o
conjunto de n variáveis aleatórias independentes e identicamente
distribuídas, com função probabilidade individual da família ℱθ e

função probabilidades conjunta


   Π f(xi|θ) = θ
       n         ∑ i xi (1 − θ )n −∑ i xi , 0 < θ < 1, x ∈ {0, 1}, i = 1, 2,…..n      (10)
       i =1                                             i




Na amostragem de populações de Bernoulli interessa sobretudo
estabelecer a distribuição por amostragem de duas estatísticas:
      - Y = Σi Xi, que representa o número (frequência absoluta) de
          elementos que na amostra possuem o atributo;
O Professor:   Manuel do Carmo                                                             108
ESTATÍSTICA


      - X = Σi Xi /n, que representa a proporção observada, isto é, a
          frequência relativa de elementos que na amostra possuem o
          atributo.


A solução para tais “problemas” aparece, naturalmente, através da
distribuição binomial.
Considere-se Y, soma de n variáveis aleatórias independentes com
distribuição de Bernoulli, ou seja Y ∼ B(n, θ), e
                                 P(Y = y) = nCy θy (1 - θ)n-y, y = 0, 1, 2,……n
      P( X = z) = P(Y = nz) =
      = nCnz θnz (1 - θ)n-nz, z = 0/n, 1/n, 2/n,……n/n (11)
O Professor:   Manuel do Carmo                                                           109
ESTATÍSTICA


A distribuição binomial aparece, desta forma, acometida em
distribuição por amostragem.
Quando a dimensão da amostra é razoavelmente grande, podemos
escrever
                                 Y − nθ            a
                                               ~ N (0, 1)      (12)
                                 nθ (1 − θ )
ou
                                 X −θ          a
                                              ~ N (0, 1)        (13)
                                 θ (1 − θ )
                                     n
As aproximações consideradas poderão ser melhoradas se utilizarmos
as correcções de continuidade consideradas anteriormente.
O Professor:   Manuel do Carmo                                      110
ESTATÍSTICA


Com efeito, se substituirmos a por a-0.5 e b por b+0.5, obtemos a
sequência
                       ⎛ b + 0.5 − nθ   ⎞    ⎛ a − 0.5 − nθ   ⎞
      P(a ≤ X ≤ b) ≈ Φ ⎜                ⎟ - Φ⎜
                                             ⎜                ⎟ , 0 < a < b ≤ n (14)
                       ⎜ nθ (1 − θ )    ⎟                     ⎟
                       ⎝                ⎠    ⎝ nθ (1 − θ )    ⎠
ou de forma equivalente


                       ⎛b 1             ⎞     ⎛a 1            ⎞
                       ⎜ +      −θ      ⎟     ⎜ −      −θ     ⎟
         ⎛a     b⎞                                                   a b
       P ⎜ ≤ X ≤ ⎟ ≈ Φ ⎜ n 2n           ⎟ - Φ ⎜ n 2n          ⎟ , 0 < < ≤ 1 (15)
         ⎝n     n⎠     ⎜ θ (1 − θ )     ⎟     ⎜ θ (1 − θ )    ⎟      n n
                       ⎜                ⎟     ⎜               ⎟
                       ⎝     n          ⎠     ⎝     n         ⎠
Assim, quando a dimensão da amostra o permite, os problemas
binomiais são “transportados” para a esfera de aplicação da
O Professor:   Manuel do Carmo                                                       111
ESTATÍSTICA


distribuição normal e tornam mais acessíveis os cálculos. Por vezes,
torna-se aconselhável recorrer à lei dos acontecimentos raros,
utilizando a distribuição de Poisson para lidar com problemas de
Bernoulli.


Exemplo 3
Admita-se que uma instituição bancária classifica os seus clientes
possuidores de cartão de crédito em “maus” e “bons” riscos, conforme
tenham ou não faltado a um pagamento nos últimos 2 anos. Suponha-
se que a proporção de “maus” riscos (classificados com X=1) é de
0.05 para as agências da zona de Lisboa.

O Professor:   Manuel do Carmo                                       112
ESTATÍSTICA


Qual a probabilidade de se obter pelo menos 10% de “maus” riscos
numa amostra de:
         a) 10 clientes;
         b) 50 clientes;
         c) 400 clientes?
Para responder a qualquer uma das alíneas, devemos calcular
P ( X ≥ 0.1), sabendo-se que Xi ∼ B(1, 0.05) para i=1,2,...,n.
         a) Neste caso, pequena amostra, utiliza-se a distribuição Binomial,
P ( X ≥ 0.1)= P ( ∑ i =1 X i ≥ 10 × 0.1) = P ( ∑ i =1 X i ≥ 1) =1- P ( ∑ i =1 X i = 0)=1-
                                 10               10                     10



0.5987=0.4013,
recorrendo à Tabela da Binomial.
O Professor:   Manuel do Carmo                                                          113
ESTATÍSTICA


              b) Nesta situação, o recurso à distribuição Binomial, é muito
      “laborioso”, no entanto nθ=50×0.05=2.5<5. Como θ é pequeno pode
      utilizar-se a lei dos acontecimentos raros, ou seja, a aproximação à
      Poisson2 de parâmetro igual a nθ.
Assim, P ( X ≥ 0.1)

=P         (∑       50
                    i =1
                           X i ≥ 50 × 0.1 = P            ) (∑                  50
                                                                               i =1
                                                                                      X i ≥ 5 = 1− P)                   (∑       50
                                                                                                                                 i =1
                                                                                                                                        Xi ≤ 4        )
≈ 1 – (0.0821+0.2052+0.2565+0.2138+0.1336)=0.1088, utilizando a
tabela da distribuição de Poisson, com parâmetro 2.5.


              c) Como se trata de uma grande amostra, utilizamos (14), isto é,
2
    A regra prática para utilizar esta “lei” deve basear-se no pressuposto de que se tem um acontecimento raro e um número “elevado” de observações. Assim, não é aconselhável fazer a

O Professor:      Manuel do Carmo                                                                                                                                                    114
ESTATÍSTICA


                ⎛                                                                                     ⎞
                ⎜   X − 0.05                                                            0.1 − 0.05 ⎟
P ( X ≥ 0.1)= P ⎜                ≥                                                                    ⎟
                ⎜ 0.05(1 − 0.05)                                                       0.05(1 − 0.05) ⎟
                ⎜                                                                                     ⎟
                ⎝      400                                                                  400       ⎠
     ⎛                                                 ⎞
     ⎜ 0.1 − 0.05                                      ⎟
≈1-Φ ⎜                                                 ⎟
     ⎜ 0.05(1 − 0.05)                                  ⎟
     ⎜                                                 ⎟
     ⎝      400                                        ⎠
    ≈ 1 - Φ(4.59) ≈ 0, se não se proceder à correcção de continuidade,
    ou então



aproximação quando 0.1<θ<0.9 (quando θ≥0.9, é evidente que o acontecimento em causa não é “raro”; é o, sim, o seu complementar) ou quando n≤20.

O Professor:   Manuel do Carmo                                                                                                                            115
ESTATÍSTICA


                ⎛                         1         ⎞
                ⎜                  0.1 −     − 0.05 ⎟
                    X − 0.05             800
P ( X ≥ 0.1)= P ⎜                ≥                  ⎟
                ⎜ 0.05(1 − 0.05)     0.05(1 − 0.05) ⎟
                ⎜                                   ⎟
                ⎝      400                400       ⎠
     ⎛        1         ⎞
     ⎜ 0.1 −     − 0.05 ⎟
≈1-Φ ⎜       800        ⎟
     ⎜ 0.05(1 − 0.05) ⎟
     ⎜                  ⎟
     ⎝        400       ⎠
   ≈ 1 - Φ(4.47) ≈ 0, o que é teoricamente mais correcto.




O Professor:   Manuel do Carmo                                      116
ESTATÍSTICA


    5. Amostragem de população de Bernoulli. Caso de duas
    proporções.


   Considerem-se agora duas populações de Bernoulli, com parâmetros
θ1 e θ2. A ideia de comparar as duas proporções verdadeiras, θ1 e θ2,
surge em muitas situações praticas (por exemplo, proporção de curas
nos doentes tratados com o medicamento A e nos doentes tratados
com o medicamento B; proporção de peças defeituosas quando se
emprega o processo A e quando se emprega o processo B).
Então, nos estudos de amostragem, a diferença entre proporções
verdadeiras, θ1 - θ2, nunca pode ser conhecida exactamente; no

O Professor:   Manuel do Carmo                                        117
ESTATÍSTICA


entanto, podem estabelecer-se inferências através da estatística
X 1 − X 2 (a diferença entre proporções observadas) calculadas,
respectivamente, a partir de amostra casual da primeira população,
                                                                 X1i
                             (X11, X12,...., X1m) ⇒ X 1 = ∑ i =1
                                                              m
                                                                     ,
                                                                 m
e de amostra casual da segunda população,
                                                                   X2 j
                             (X21, X22,...., X2n) ⇒ X 2 = ∑ j =1
                                                              n
                                                                          ,
                                                                    n
amostras que se supõem escolhidas independentemente uma da
outra.



O Professor:   Manuel do Carmo                                                        118
ESTATÍSTICA


Como não se conhece a distribuição exacta, só pode estudar-se a
distribuição assimptótica de X 1 − X 2 , válida quando as dimensões das
amostras são razoavelmente grandes. Tem-se, então


                             a
                               ⎛ θ1(1 − θ1 ) ⎞         a
                                                           ⎛ θ 2 (1 − θ 2 ) ⎞
                       X 1 ~ N ⎜ θ1,         ⎟ , e X 2 ~ N ⎜θ2,             ⎟      (16)
                               ⎝     m       ⎠             ⎝       n        ⎠


Consequentemente, e utilizando a propriedade (corolário anterior) que
estabelece que a diferença de duas variáveis aleatórias independentes
com distribuição normal (aproximadamente normal) tem distribuição



O Professor:   Manuel do Carmo                                                          119
ESTATÍSTICA


normal (aproximadamente normal), tem-se, depois de estandardizar, o
resultado


                           X 1 − X 2 − (θ1 − θ 2 )      a
                                                        ~ N (0, 1)                                (17)
                          θ1 (1 − θ1 ) θ 2 (1 − θ 2 )
                                      +
                                 m            n


Para tal, basta notar que
   E( X 1 − X 2 ) = E( X 1) – E( X 2 ) = θ1 - θ2,
                                                                 θ1(1 − θ1 ) θ 2 (1 − θ 2 )
   e Var( X 1 − X 2 ) = Var( X 1) + Var( X 2 ) =                            +
                                                                     m              n

O Professor:   Manuel do Carmo                                                                        120
ESTATÍSTICA


Exemplo 4
Retome-se o exemplo 3 e suponha-se que a percentagem de “maus”
riscos na zona do Porto é de 0.06. recolhidas amostras independentes
nas            zonas             de   Lisboa   e   Porto   de   dimensões   400   e   500,
respectivamente, qual a probabilidade de se observar uma proporção
maior de “maus” riscos em Lisboa do que no Porto?


A resposta é, então, encontrada calculando P( X 1 − X 2 >0), onde o
índice 1 designa a amostra de Lisboa, e o índice 2, a do Porto. Como
se trata de grandes amostras, recorremos a (17)



O Professor:   Manuel do Carmo                                                            121
ESTATÍSTICA


                    ⎛                                                        ⎞
                    ⎜ X 1 − X 2 − (θ − θ )              0 − (0.05 − 0.06)    ⎟
P( X 1 − X 2 >0)= P ⎜               1     2
                                                 >                           ⎟
                    ⎜ θ1(1 − θ1 ) θ 2 (1 − θ 2 )     0.05 × 0.95 0.06 × 0.94 ⎟
                    ⎜            +                               +           ⎟
                    ⎝     m             n               400            500   ⎠
≈1-Φ(0.66)≈0.2546


Valor que evidencia os cuidados que devemos ter, no processo de
inferência, nas conclusões amostrais para a população. Com efeito,
embora a proporção de “maus” riscos seja menor em Lisboa do que no
Porto, mesmo assim a probabilidade de a média da amostra de Lisboa
ser superior à média da amostra do Porto é aproximadamente 25%.


O Professor:   Manuel do Carmo                                                 122
ESTATÍSTICA


    6. População normal: distribuição da média.


    Considere-se agora (X1, X2,....., Xn) uma amostra casual da
população normal N(μ, σ2). Para obtermos a distribuição por
amostragem da média, X , aplicamos o corolário (6), depois de se
recordar que E( X )=μ e que Var( X )=σ2/n. Naturalmente, se (X1, X2,.....,
Xn) é uma amostra casual da população normal, N(μ, σ2), então
                                       ⎛ σ2 ⎞
                                 X ~ N ⎜ μ,   ⎟                      (18)
                                       ⎝    n ⎠
o resultado anterior pode ainda escrever-se, de forma equivalente e
mais adequada às aplicações práticas, por
O Professor:   Manuel do Carmo                                            123
ESTATÍSTICA


                                 X −μ
                                        n ~ N (0,1)          (19)
                                  σ


Exemplo 5
Considere-se que a duração das chamadas telefónicas locais em
determinada empresa pode ser aproximada por uma distribuição
normal com média igual a 17 minutos e variância 25. Qual a
probabilidade de, numa amostra aleatória de n chamadas, a duração
média se situar entre 16 e 18 minutos?


Quando n=25, temos

O Professor:   Manuel do Carmo                                    124
ESTATÍSTICA


                                           ⎛ 16 − 17      X 25 − 17      18 − 17    ⎞
P(16 < X 25                      < 18) = P ⎜         25 <           25 <         25 ⎟
                                           ⎝ 25               25            25      ⎠
= Φ(1) - Φ(-1) = 2×Φ(1) – 1 ≈ 0.6826.
Faça o mesmo exercício, para n=100 e tire conclusões.


    7. População normal: distribuição da variância.

                                                                   ( Xi − μ )
                                                                                2

                                                        ∑
                                                            n
Relembre-se, que a variável aleatória                                               tem distribuição
                                                            i =1
                                                                      σ   2


χ 2 (n) desde que as variáveis Xi sejam independentes e tenham
distribuição N(μ, σ2).


O Professor:   Manuel do Carmo                                                                       125
ESTATÍSTICA


Deste modo, considere-se uma amostra casual (X1, X2,....., Xn) de
população normal, N(μ, σ2), e as estatísticas X e S2.
Então prova-se que:
Teorema:4
Se (X1, X2,..., Xn) é uma amostra casual de uma população normal,

                                           ∑ (X                )
                                           n                       2
                                 nS 2      i =1       i   −X
N(μ, σ ), então2
                                         =                             ~ χ 2 (n − 1)                     (20)
                                 σ   2
                                                  σ   2



                                                                                  (n − 1)S´2
Desta forma podemos, facilmente, concluir que                                                  ~ χ 2 (n − 1)
                                                                                       σ2
pois, nS2=(n-1)S´2.


O Professor:   Manuel do Carmo                                                                                 126
ESTATÍSTICA



                                                          ∑ (X             − μ)
                                                            n                     2
                                                            i =1
                                                                                      ~ χ 2 (n )
                                                                       i
A                     comparação              entre                                                        e
                                                                   σ   2



∑ (X                       )
     n                         2

     i =1         i   −X
                                   ~ χ 2 (n − 1) mostra que se perde um grau de liberdade
               σ2
quando, na expressão da soma de quadrados, a média da população
é substituída pela média da amostra.




O Professor:   Manuel do Carmo                                                                             127
ESTATÍSTICA


Exemplo 6


Considere-se uma população normal da qual se extraiu uma amostra
de dimensão 25.
Supondo que se procura calcular a probabilidade de o quociente entre
a variância corrigida da amostra e a variância da população se situar
entre 0.79 e 1.18, obtém-se
  ⎛       S´2       ⎞     ⎛             (n − 1)S´2             ⎞
P ⎜ 0.79 < 2 < 1.18 ⎟ = P ⎜ 24 × 0.79 <            < 24 × 1.18 ⎟
  ⎝       σ         ⎠     ⎝                σ  2
                                                               ⎠
≈ 0.75-0.25=0.5



O Professor:   Manuel do Carmo                                             128
ESTATÍSTICA


    8. População normal: Rácio de Student.
    No caso de amostragem de populações normais, o resultado (19) é
utilizado para estabelecer inferência sobre a média da população μ, a
partir da média da amostra, X , quando a variância, σ2 é conhecida.
Se a variância, σ2 é desconhecida – caso em que se diz que σ2 (ou σ)
é um parâmetro perturbador na óptica das inferências sobre μ - a
presença de σ em (19) torna impraticável a realização de inferência
com base neste resultado.
Durante anos pensou-se que o rácio de Student,
                                 X −μ      X −μ
                                      n ou      n −1             (21)
                                  S´        S

O Professor:   Manuel do Carmo                                        129
ESTATÍSTICA


tinha distribuição normal, isto é, admitiu-se que a substituição de σ por
S´ no denominador de (21) não alterava a distribuição. Assim
acontece, com razoável aproximação, quando n é suficientemente
grande, caso em que pode empregar-se a distribuição assimptótica,
                                 X −μ   a
                                      n ~ N (0,1)                    (22)
                                  S´
Contudo, para pequenas amostras, S´ é vulnerável a grandes
flutuações de amostra para amostra, o que faz com que o rácio de
Student siga outra distribuição – a distribuição t-Student – e não a
distribuição normal. (ver distribuições teóricas)



O Professor:   Manuel do Carmo                                            130
ESTATÍSTICA


Desta forma, tem-se
                                 X −μ
                                      n ~ t (n − 1)             (23)
                                  S´


Exemplo 7
De uma população com distribuição normal de média e variância
desconhecidas, extraiu-se uma amostra casual de dimensão 25, cuja
variância corrigida é 49. Qual a probabilidade de a média da amostra
diferir da média da população, em valor absoluto, por uma valor
inferior a 2.4?



O Professor:   Manuel do Carmo                                       131
ESTATÍSTICA


A formulação, para resposta ao problema, é dada através de
P(| X - μ| < 2.4) ou então por P(-2.4 < X - μ < 2.4).


                                 ⎛ −2.4     X −μ          2.4   ⎞
Então, P(-2.4 < X - μ < 2.4) = P ⎜        <      <              ⎟
                                 ⎝ 49 / 25 S´/ n        49 / 25 ⎠

    ⎛          X −μ         ⎞        ⎛ X −μ         ⎞
= P ⎜ −1.711 <       < 1.711⎟ =1-2×P ⎜       > 1.711⎟ =1-2×0.05=0.9
    ⎝          S´/ n        ⎠        ⎝ S´/ n        ⎠




O Professor:   Manuel do Carmo                                          132
ESTATÍSTICA


    9. Populações normais: diferença entre duas médias.
Considerem-se duas amostras casuais, X11, X12,....., X1m,                                X21,
X22,......., X2n, obtidas, de forma independente, das populações normais
N(μ1, σ12) e N(μ2, σ22), respectivamente. Considerem-se, ainda,


                                   1 m               1 n
                       X1 =         ∑
                                   m i =1
                                          X1i e X 2 = ∑ j =1 X 2 j as respectivas médias.
                                                     n
Então, podemos concluir que
                                               ⎛           σ 12 σ 2 ⎞
                                                                  2
                                 X 1 − X 2 ~ N ⎜ μ1 − μ2 ,     +    ⎟                   (24)
                                               ⎝           m     n ⎠
e de forma “mais simpática”

O Professor:   Manuel do Carmo                                                               133
ESTATÍSTICA


                                 (X   1          )
                                          − X 2 − ( μ1 − μ2 )
                                                                ~ N (0, 1)              (25)
                                             σ 12        σ2
                                                          2
                                                     +
                                             m           n
Contudo, as distribuições descritas, têm aplicação quando as
variâncias das duas populações são conhecidas. Quando se sabe que
as variâncias, embora desconhecidas, são iguais, pode recorrer-se a
outro resultado para estabelecer inferências sobre μ1 - μ2.
Supondo que σ12 = σ22 = σ2, o resultado (25) pode escrever-se

                             U=
                                (X           1           )
                                                 − X 2 − ( μ1 − μ2 )
                                                                       ~ N (0, 1)
                                                         1 1
                                                  σ       +
                                                         m n

O Professor:   Manuel do Carmo                                                              134
ESTATÍSTICA


Considerem-se agora, as variâncias corrigidas das duas amostras
                     1                                  1
                         ∑                                 ∑
                           m                                 n
                S =´2
                               ( X1i − X 1 ) , e S2 =
                                            2     ´2
                                                                 ( X 2 j − X 2 )2
                    m − 1 i =1                        n − 1 j =1
                   1




atendendo a (20), tem-se que V =
                                 ( m − 1) S1´2 + ( n − 1) S2
                                                           ´2

                                                                                ~ χ 2 (m + n − 2)
                                                                σ2
e como as variáveis U e V são independentes, podemos aplicar a
definição 0.5, obtendo assim,
                                    X 1 − X 2 − ( μ1 − μ2 )
                                             1 1
                                                +
                             T =             m n              ~ t (m + n − 2)               (26)
                                   ( m − 1) S1 + ( n − 1) S2
                                             ´2            ´2


                                          m+n−2

O Professor:   Manuel do Carmo                                                                   135
ESTATÍSTICA



pois S´2 =
           ( m − 1) S1´2 + ( n − 1) S2
                                     ´2

                                              traduz a melhor aproximação ao valor
                                 m+n−2
de σ2, comum às duas populações, que, no entanto, têm médias
diferentes.

                                                ∑ (X                 ) +∑ (X                )
                                                  m                  2   n                      2

                                                  i =1   1i   − X1       j =1   2j   − X2
De facto, na expressão S                 ´2
                                              =                                                     o
                                                                 m+n−2
numerador corresponde à soma habitual adaptada à nova situação, e
o denominador é igual ao número total de observações menos duas,
uma vez que se utilizam as estatísticas X 1 e X 2 em substituição das
médias desconhecidas das populações, μ1 e μ2 (perderam-se dois
graus de liberdade). Não sendo válidas as expressões (25) e (26),

O Professor:   Manuel do Carmo                                                                      136
ESTATÍSTICA


quando as variâncias das populações são desconhecidas e diferentes,
as inferências sobre μ1 - μ2 tornam-se mais complexas.


Assim, quando a dimensão das amostras o permite, pode operar-se
com a distribuição normal assimptótica que resulta de substituir em
(25) as variâncias da população pelas variâncias das amostras.


Quando as amostras são pequenas, em particular se forem de
diferentes dimensões, uma solução possível consiste em recorrer à
aproximação de Welch. Este autor mostrou que



O Professor:   Manuel do Carmo                                           137
ESTATÍSTICA




Z=
   (X           1            )
                    − X 2 − ( μ1 − μ2 )   a
                                          ~ t (v ) onde v é dado pelo maior inteiro
                         ´2    ´2
                        S1 S2
                            +
                        m     n
                                                    2
                      ⎛s     s ⎞          ´2   ´2

                      ⎜m + n ⎟
                                          1    2


contido em r =        ⎝         ⎠               ´2   ´2
                                         sendo s1 e s2 os valores
                        ´2 2        ´2 2
                1 ⎛ s1 ⎞       1 ⎛ s2 ⎞
                    ⎜ m ⎟ + n − 1⎜ n ⎟
               m − 1⎝     ⎠       ⎝   ⎠
                              ´2   ´2
observados nas amostras para S1 e S2 , respectivamente. Assim,
quando o valor de r não é inteiro, arredonda-se por defeito.




O Professor:   Manuel do Carmo                                                      138
ESTATÍSTICA


Exemplo 8
Admita-se que os resultados do teste de QI são bem modelados por
distribuições normais de média 100 nos países A e B.
   a) Recolhida uma amostra de dimensão 16 no país A, e outra, de
       dimensão 10 no país B, calcule-se a probabilidade de a média da
       primeira amostra ser superior em mais que 5 pontos à média da
       segunda amostra, sabendo que se observou uma variância
       amostral corrigida de 12 no país A e de 18 no país B?
   b) Repita-se a questão anterior agora que, embora desconhecidas,
       as variâncias nas duas populações são iguais.



O Professor:   Manuel do Carmo                                         139
ESTATÍSTICA


Nas duas questões é necessário calcular P X A − X B > 5 , sendo    (              )
desconhecidas as variâncias das duas populações. Em a), não
existindo razoes para admitir que as variâncias são iguais, utiliza-se a
                                                                          2
                                                                ⎛ 12 18 ⎞
                                                                ⎜ 16 + 10 ⎟
fórmula               de         Welch,   obtendo-se   r =      ⎝         ⎠       ≈16.36,     e
                                                                    2           2
                                                            1 ⎛ 12 ⎞ 1 ⎛ 18 ⎞
                                                              ⎜ 16 ⎟ + 9 ⎜ 10 ⎟
                                                           15 ⎝ ⎠         ⎝ ⎠
portanto, utiliza-se uma distribuição t-Student com 16 graus de
liberdade.


Como μA - μB = 100 - 100 = 0,

O Professor:   Manuel do Carmo                                                                140
ESTATÍSTICA


                  ⎛                                                             ⎞
                  ⎜
                                     (
                  ⎜ X A − X B − ( μ A − μB ) >        )                    5−0 ⎟
                                                                                ⎟
    (
P XA − XB > 5 = P
                  ⎜         ´2
                          SA SB
                                 ) ´2
                                                                          12 18 ⎟
                                                                                  = P(Z > 3.13)
                  ⎜            +                                            +   ⎟
                  ⎜        nA nB                                          16 10 ⎟
                  ⎝                                                             ⎠
≈ 0.001em b), recorremos à expressão (26)
                 ⎛
                 ⎜
                                         (X   A           )
                                                  − X B − ( μ A − μB )
                                                                                   5−0
                                                                                               ⎞
                                                                                               ⎟
                 ⎜                                    1   1                        1    1      ⎟
                 ⎜                                      +                            +         ⎟
    (                            )
                                                     nA nB
P XA − XB > 5 = P⎜                                                        >       16 10        ⎟
                 ⎜                       ( nA − 1) S    + ( nB − 1) S
                                                       ´2            ´2
                                                                              15 × 12 + 9 × 18 ⎟
                 ⎜                                                              16 + 10 − 2 ⎟
                                                       A             B

                 ⎜                                 nA + nB − 2                                 ⎟
                 ⎜                                                                             ⎟
                 ⎝                                                                             ⎠

O Professor:   Manuel do Carmo                                                                       141
ESTATÍSTICA


= P(X > 3.286) ≈ 0.001 (t-Student, com 24 graus de liberdade)


    6.10. Populações normais: relação entre duas variâncias.
    Vamos, por fim, estabelecer inferências sobre a relação entre as
           σ 12
variâncias, 2 , de duas populações normais independentes, onde
           σ2
                                    ´2
                                   S1
será natural pensar na estatística ´2 . Sendo as duas amostras
                                   S2
independentes, torna-se fácil ver que esta estatística pode ser
relacionada com o quociente de duas variáveis independentes com
distribuição do qui-quadrado, cada uma delas sendo dividida pelos

O Professor:   Manuel do Carmo                                          142
ESTATÍSTICA


respectivos graus de liberdade. Então, considerando as variáveis
aleatórias independentes,

                U=
                   ( m − 1) S1´2        ~ χ 2 (m − 1)   e        V=
                                                                    ( n − 1) S2
                                                                              ´2

                                                                                   ~ χ 2 (n − 1) ,
                                 σ 12                                    σ2
                                                                          2



             U /(m − 1) S1 σ 2
                         ´2  2
obtém-se F =           = ´2 2                                                                (27)
             V /(n − 1) S2 σ 1
onde F designa a, estudada, distribuição de Fisher.
Com efeito, suponha-se que se tem duas populações normais,
N(μ1, σ12) e N(μ2, σ22). Sejam S1 e S2 as variâncias corrigidas de
                                ´2   ´2



amostras                   casuais        independentes     de    dimensão         m     e     n,


O Professor:   Manuel do Carmo                                                                  143
ESTATÍSTICA


respectivamente. Atendendo a (27) e à definição 0.6, concluímos
                 S1 σ 2
                  ´2  2
imediatamente que ´2 2 ~F(m-1,n-1)                              (28)
                 S2 σ 1
e em particular, quando σ12 = σ22, obtém-se
                                  ´2
                                 S1
                                   ´2
                                      ~F(m-1,n-1)               (29)
                                 S2
Exemplo 9
Considere-se, novamente, o exemplo 8, referente aos resultados dos
testes de QI em dois países. Admita-se que ambas as populações são
normais no que se refere aos resultados obtidos nestes testes e que
se recolheu uma amostra de dimensão 16 no país A, e outra, de

O Professor:   Manuel do Carmo                                      144
ESTATÍSTICA


dimensão 10, no país B. Admitindo que as variâncias nas duas
populações são iguais, qual a probabilidade de o quociente entre as
                                         ´2
                                        SA
variâncias corrigidas das duas amostras, ´2 ser superior a 3.77?
                                        SB

                                  ⎛ SA
                                     ´2
                                              ⎞
A resposta obtém-se, calculando P ⎜ ´2 > 3.77 ⎟ , utilizando a tabela da
                                  ⎝ SB        ⎠
distribuição de Fisher, com 15 e 9 graus de liberdade [F(16-1, 10-
1)=F(15,9)], temos que a referida probabilidade é aproximadamente
0.025. É de salientar que, não sendo as amostras de dimensão igual,
  ⎛ SA
     ´2
              ⎞                        ⎛ SB
                                          ´2
                                                   ⎞
P ⎜ ´2 > 3.77 ⎟                  ≠   P ⎜ ´2 > 3.77 ⎟ ,   como   facilmente   pode    ser
  ⎝ SB        ⎠                        ⎝ SA        ⎠

O Professor:   Manuel do Carmo                                                          145
ESTATÍSTICA


comprovado.                      Suponha-se   agora    que   pretendíamos                         calcular    a
                                                           ´2
                                                         SA
probabilidade de o quociente entre variâncias corrigidas, ´2 , ser
                                                          SB

                                         ⎛ SA
                                            ´2
                                                      ⎞
inferior a 0.386. Então vamos calcular P ⎜ ´2 < 0.386 ⎟ , mas para tal
                                         ⎝ SB         ⎠
devemos recorrer à propriedade, enunciada anteriormente no final da
Folha 12, da distribuição de Fisher.
        ⎛ SA
           ´2
                     ⎞     ⎛ SB
                              ´2
                                  1 ⎞
Seja, P ⎜ ´2 < 0.386 ⎟ = P ⎜ ´2 >     ⎟
        ⎝ SB         ⎠     ⎝ SA 0.386 ⎠

                    ⎛ SB
                       ´2
                                ⎞
                = P ⎜ ´2 > 2.59 ⎟ ≈ 0.05 [F(10-1,16-1) = F(9,15)]
                    ⎝ SA        ⎠

O Professor:   Manuel do Carmo                        Manuel do
                                                                  Assinado de forma digital por
                                                                  Manuel do Carmo
                                                                                                              146
                                                                  DN: cn=Manuel do Carmo, c=PT,
                                                                  o=ISEGI-UNL, ou=ISLA-Lx,
                                                      Carmo       email=carmo.manuel@gmail.com
                                                                  Dados: 2010.03.07 23:33:47 Z

Más contenido relacionado

La actualidad más candente

Econometria modelos de_regressao_linear
Econometria modelos de_regressao_linearEconometria modelos de_regressao_linear
Econometria modelos de_regressao_linearJoevan Santos
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasLucas Vinícius
 
Variaveis+aleatorias
Variaveis+aleatoriasVariaveis+aleatorias
Variaveis+aleatoriasFagner Talles
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linearcoelhojmm
 
Daum machado-equacoes-diferenciais
Daum machado-equacoes-diferenciaisDaum machado-equacoes-diferenciais
Daum machado-equacoes-diferenciaisRonaldo Lobato
 
Fórmulas estatística - medidas - central e dispersão
Fórmulas   estatística - medidas - central e dispersãoFórmulas   estatística - medidas - central e dispersão
Fórmulas estatística - medidas - central e dispersãomarioferreiraneto
 
equações diferenciais
equações diferenciais equações diferenciais
equações diferenciais Fisionomia
 
1 introdução e variáveis aletórias
1   introdução e variáveis aletórias1   introdução e variáveis aletórias
1 introdução e variáveis aletóriasFernando Lucas
 
Aula 8 variáveis aleatória contínua - parte 1
Aula 8   variáveis aleatória contínua - parte 1Aula 8   variáveis aleatória contínua - parte 1
Aula 8 variáveis aleatória contínua - parte 1Ariel Rennó Chaves
 
Aula 3 - Educação física
Aula 3  - Educação físicaAula 3  - Educação física
Aula 3 - Educação físicaCaroline Godoy
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013Pedro Casquilho
 

La actualidad más candente (20)

Ipaee capitulo3 2
Ipaee capitulo3 2Ipaee capitulo3 2
Ipaee capitulo3 2
 
Econometria modelos de_regressao_linear
Econometria modelos de_regressao_linearEconometria modelos de_regressao_linear
Econometria modelos de_regressao_linear
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Análise de regressão linear
Análise de regressão linearAnálise de regressão linear
Análise de regressão linear
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis Aleatórias
 
Variaveis+aleatorias
Variaveis+aleatoriasVariaveis+aleatorias
Variaveis+aleatorias
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
 
Revisaoestatistica
RevisaoestatisticaRevisaoestatistica
Revisaoestatistica
 
Daum machado-equacoes-diferenciais
Daum machado-equacoes-diferenciaisDaum machado-equacoes-diferenciais
Daum machado-equacoes-diferenciais
 
Fórmulas estatística - medidas - central e dispersão
Fórmulas   estatística - medidas - central e dispersãoFórmulas   estatística - medidas - central e dispersão
Fórmulas estatística - medidas - central e dispersão
 
92 268-1-pb (2)
92 268-1-pb (2)92 268-1-pb (2)
92 268-1-pb (2)
 
02 tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
02   tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA02   tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
02 tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
 
Variáveis aleatórias contínuas - Estatística II
Variáveis aleatórias contínuas - Estatística IIVariáveis aleatórias contínuas - Estatística II
Variáveis aleatórias contínuas - Estatística II
 
Intervalos de confianã‡a
Intervalos de confianã‡aIntervalos de confianã‡a
Intervalos de confianã‡a
 
equações diferenciais
equações diferenciais equações diferenciais
equações diferenciais
 
1 introdução e variáveis aletórias
1   introdução e variáveis aletórias1   introdução e variáveis aletórias
1 introdução e variáveis aletórias
 
Aula 8 variáveis aleatória contínua - parte 1
Aula 8   variáveis aleatória contínua - parte 1Aula 8   variáveis aleatória contínua - parte 1
Aula 8 variáveis aleatória contínua - parte 1
 
Introdução à Regressão Linear
Introdução à Regressão LinearIntrodução à Regressão Linear
Introdução à Regressão Linear
 
Aula 3 - Educação física
Aula 3  - Educação físicaAula 3  - Educação física
Aula 3 - Educação física
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013
 

Similar a Distribuições amostragem

Similar a Distribuições amostragem (20)

Aula 12 intervalo de confiança
Aula 12   intervalo de confiançaAula 12   intervalo de confiança
Aula 12 intervalo de confiança
 
Econometria
EconometriaEconometria
Econometria
 
Introd inferencia
Introd inferenciaIntrod inferencia
Introd inferencia
 
Introd inferencia
Introd inferenciaIntrod inferencia
Introd inferencia
 
Varaleat
VaraleatVaraleat
Varaleat
 
3. medidas de posição e dispersão (1)
3. medidas de posição e dispersão (1)3. medidas de posição e dispersão (1)
3. medidas de posição e dispersão (1)
 
Estatística10
Estatística10Estatística10
Estatística10
 
Formulário - Estatística
Formulário - EstatísticaFormulário - Estatística
Formulário - Estatística
 
Modulo 4
Modulo 4Modulo 4
Modulo 4
 
Aula18
Aula18 Aula18
Aula18
 
Inferência para cadeias de markov
Inferência para cadeias de markovInferência para cadeias de markov
Inferência para cadeias de markov
 
Aula 2 - Sistemas de informação
Aula 2 - Sistemas de informaçãoAula 2 - Sistemas de informação
Aula 2 - Sistemas de informação
 
Mdesc
MdescMdesc
Mdesc
 
Ce209teorica
Ce209teoricaCe209teorica
Ce209teorica
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
1. intervalo de confiança parte i
1. intervalo de confiança   parte i1. intervalo de confiança   parte i
1. intervalo de confiança parte i
 
Intervalo de Confiança para a Mediana amostral - Teste do Sinal
Intervalo de Confiança para a Mediana amostral - Teste do SinalIntervalo de Confiança para a Mediana amostral - Teste do Sinal
Intervalo de Confiança para a Mediana amostral - Teste do Sinal
 
Estatística: Modelos Discretos
Estatística: Modelos DiscretosEstatística: Modelos Discretos
Estatística: Modelos Discretos
 
Redes Neurais: Estimação de Densidades
Redes Neurais: Estimação de DensidadesRedes Neurais: Estimação de Densidades
Redes Neurais: Estimação de Densidades
 
Aula quatro jornadas12_handout
Aula quatro jornadas12_handoutAula quatro jornadas12_handout
Aula quatro jornadas12_handout
 

Último

Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinhaMary Alvarenga
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresLilianPiola
 
Regência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfRegência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfmirandadudu08
 
Simulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfSimulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfEditoraEnovus
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniCassio Meira Jr.
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalJacqueline Cerqueira
 
Família de palavras.ppt com exemplos e exercícios interativos.
Família de palavras.ppt com exemplos e exercícios interativos.Família de palavras.ppt com exemplos e exercícios interativos.
Família de palavras.ppt com exemplos e exercícios interativos.Susana Stoffel
 
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxAD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxkarinedarozabatista
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfHenrique Pontes
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
Habilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e EspecíficasHabilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e EspecíficasCassio Meira Jr.
 
ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024Jeanoliveira597523
 
02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdf02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdfJorge Andrade
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Sociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresSociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresaulasgege
 
Programa de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasPrograma de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasCassio Meira Jr.
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxOsnilReis1
 
Slides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptxSlides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptxSilvana Silva
 

Último (20)

Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinha
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
 
Regência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfRegência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdf
 
Simulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfSimulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdf
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
 
Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem Organizacional
 
Família de palavras.ppt com exemplos e exercícios interativos.
Família de palavras.ppt com exemplos e exercícios interativos.Família de palavras.ppt com exemplos e exercícios interativos.
Família de palavras.ppt com exemplos e exercícios interativos.
 
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxAD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
Habilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e EspecíficasHabilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e Específicas
 
ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024
 
02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdf02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdf
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
 
Sociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresSociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autores
 
Programa de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasPrograma de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades Motoras
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
 
Slides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptxSlides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptx
 

Distribuições amostragem

  • 1. ESTATÍSTICA DISTRIBUIÇÕES POR AMOSTRAGEM 1. Introdução Neste ponto encerra-se o percurso dedutivo “população → amostra”. Partindo do conhecimento da população, caracterizar-se-ão as distribuições de certas estatísticas amostrais, ou seja, analisar-se-á a forma como tais estatísticas variam de amostra para amostra. Para que tal seja possível, é necessário que as amostras sejam seleccionadas de acordo com processos probabilísticos (isto é, processos que tornem possível o cálculo da probabilidade de cada O Professor: Manuel do Carmo 88
  • 2. ESTATÍSTICA elemento da população ser incluído em cada amostra). Nesta disciplina considerar-se-á apenas o processo de amostragem aleatória, como o mais importante dos processos probabilísticos. Note- se que se utilizam frequentemente outros processos de amostragem, designadamente os processos de amostragem estratificada e por conglomerados. DEF. 1 – Amostragem Aleatória Quando as n variáveis aleatórias observadas, componentes do vector (X1, X2,...., Xn) são independentes e identicamente distribuídas – simbolicamente iid – diz-se que se trata de amostragem casual ou aleatória. O Professor: Manuel do Carmo 89
  • 3. ESTATÍSTICA Ao pedir que as variáveis sejam identicamente distribuídas pretende- se que os Xi, i=1, 2,..., n, sejam “cópias” da variável aleatória X que representa o atributo da população em estudo. Ao pedir independência está a pensar-se que, se a função de distribuição de X é F(x), a função de distribuição conjunta das n variáveis Xi que compõem a amostra aleatória se determina facilmente, pelo produto F(x1,x2,….,xn) = F(x1)F(x2).....F(xn) (1) Que se designa por distribuição da amostra. Esta distribuição traduz a estrutura da população de amostras de dimensão n (do espaço - amostra) obtidas da população representada pela variável aleatória X. O Professor: Manuel do Carmo 90
  • 4. ESTATÍSTICA Na maior parte das situações estamos em situação de inferência estatística paramétrica. Neste caso, a forma de F é, ou supõe-se, conhecida, seja F(x|θ), e desconhece-se apenas o “verdadeiro” valor do parâmetro (escalar ou vector), isto é, o valor particular que indexa a função de distribuição que descreve “apropriadamente” as condições em que se observam as variáveis ou, como também se diz, o processo gerador de dados. A especificação consiste, neste caso, em admitir que F(x|θ) pertence a uma família de expressão analítica conhecida, ℱθ={F(x|θ): θ ∈ Θ}, (2) O Professor: Manuel do Carmo 91
  • 5. ESTATÍSTICA em que o parâmetro, escalar ou vector, assume valores em dado conjunto Θ designado por espaço-parâmetro. O conjunto ℱθ é a família das funções de distribuiçao F para todos os valores possíveis de θ ∈ Θ, e constitui o modelo probabilístico a considerar na inferência estatística paramétrica. DEF. 2 – Estatística Uma estatística é uma variável, ou vector aleatório, T(X1, X2,...., Xn), função da amostra aleatória X1, X2,...., Xn, que não envolve qualquer parâmetro desconhecido. O Professor: Manuel do Carmo 92
  • 6. ESTATÍSTICA Se X1, X2,...., Xn é amostra casual de população normal N(μ, σ2) com parâmetros μ e σ2 desconhecidos, são exemplos de estatísticas unidimensionais: 1 1 ∑ i Xi , X = n ∑ i Xi , ∑ i X , n i 2 ∑ i X i2 não são estatísticas as funções: 1 1 1 σ ∑ ( Xi − μ ), σ ∑ i Xi , σ 2 ∑ i X i2 porque dependem de parâmetros desconhecidos. O Professor: Manuel do Carmo 93
  • 7. ESTATÍSTICA 2. Primeiros resultados sobre a média e a variância amostrais Vamos neste ponto determinar o valor esperado e a variância das estatísticas, 1 1 X= n ∑ i Xi e S = 2 n ∑ ( X i − X )2 , que são como se sabe, a média amostral e a variância amostral, respectivamente. Os teoremas que se seguem são de estrema importância, para distinguir entre parâmetros da população e parâmetros da distribuição por amostragem, bem como estabelecer relações entre eles. O Professor: Manuel do Carmo 94
  • 8. ESTATÍSTICA Teorema: 1 Se (X1, X2,...., Xn) é amostra casual de população para a qual existem média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se σ2 E ( X ) = μ , Var ( X ) = (3) n Teorema: 2 Se (X1, X2,...., Xn) é amostra casual de população para a qual existem média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se n −1 2 E (S ) = 2 σ , (4) n O Professor: Manuel do Carmo 95
  • 9. ESTATÍSTICA Para o caso de se tratar de amostras de pequena dimensão (n<30), é usual propor outra estatística para estimar σ2, a designada variância corrigida, 1 S´ =2 n −1 ∑ ( X i − X )2 , que verifica E(S´2) = σ2, e que não subavalia, em média, a variância da população. De modo a “justificar” alguns dos resultados a utilizar posteriormente, vamos de seguida enunciar um teorema, encarado por muitos como fundamental para a inferência estatística amostral. O Professor: Manuel do Carmo 96
  • 10. ESTATÍSTICA Teorema: 3 – Teorema do limite central Dada a sucessão de variáveis aleatórias iid, X1, X2,...., Xn,...., com média μ e variância σ2, então, quando n→+∞, a função de distribuição ∑ X i − nμ n da variável aleatória, Zn = i =1 (5) nσ tende para uma função de distribuição N(0, 1), ou seja, a distribuição assimptótica de Zn é N(0, 1). Simbolicamente, Zn ~ N(0, 1). a A conclusão do teorema, pode exprimir-se na forma alternativa ⎛ ∑ n X − nμ ⎞ lim P (Zn ≤ x ) = lim P ⎜ i =1 ≤ x ⎟ = Φ( x ) , i n →+∞ n →+∞ ⎜ nσ ⎟ ⎝ ⎠ O Professor: Manuel do Carmo 97
  • 11. ESTATÍSTICA ou, ainda, ⎛ ∑ n X − nμ ⎞ P (Zn ≤ x ) = P ⎜ i =1 ≤ x ⎟ ≈ Φ( x ) (n grande). i ⎜ nσ ⎟ ⎝ ⎠ Exemplo 1 Analisando o mercado de certo produto, uma empresa conclui que a procura diária (em centenas de quilogramas) a satisfazer é uma variável aleatória X com média 40 e variância 25. Sendo a produção anual planeada de 11 500, pretende calcular-se a probabilidade de haver procura anual excedentária, considerando que um ano tem 289 dias úteis. O Professor: Manuel do Carmo 98
  • 12. ESTATÍSTICA Representando por Xi, i=1, 2, 289, a variável aleatória que exprime a procura no i-ésimo dia, tem-se E(Xi) = 40 e Var(Xi) = 25; pretende calcular-se P (∑ 289 i =1 ) X i > 11 500 , como não se conhece a distribuição das variáveis aleatórias Xi, o cálculo é efectuado através do teorema 0.8. Tem-se, ⎛ ∑ 289 X − 289 × 40 11500 − 289 × 40 ⎞ ( P ∑ i =1 X i > 11 500 = P ⎜ i =1 289 ⎜ i 25 × 289 )> 25 × 289 ⎟ ⎟ ⎝ ⎠ ≈ 1 - Φ(-0.71) = 1 – [1 -Φ(0.71)] = Φ(0.71) =0.7611. O Professor: Manuel do Carmo 99
  • 13. ESTATÍSTICA Corolário: Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com X −μ a média μ e variância σ , então 2 ~ N (0, 1) (6) σ n ∑ n Xi onde X = i =1 n Uma forma alternativa de expressar o corolário anterior, é a ⎛ σ2 ⎞ X ~ N ⎜ μ, ⎟ (7) ⎝ n ⎠ O Professor: Manuel do Carmo 100
  • 14. ESTATÍSTICA 3. Aproximações para distribuições discretas Considere-se, em primeiro lugar, a aproximação da distribuição de Bernoulli pela Normal. Corolário: Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com distribuição de Bernoulli média E(Xi)=θ, e portanto, Var(Xi)=θ(1-θ), tem- ∑ X i − nθ n a i =1 se ~ N (0, 1) (8) n θ (1 − θ ) De outra forma, considere-se X = ∑ i =1 X i , variável aleatória com n distribuição binomial. Assim, quando n é grande, as probabilidades O Professor: Manuel do Carmo 101
  • 15. ESTATÍSTICA binomiais que exigem cálculos laboriosos podem obter-se rapidamente de forma aproximada recorrendo ao corolário anterior. Suponha-se que, com X ∼ B(n, θ), pretende calcular-se P(a ≤ X ≤ b), a e b inteiros, 0 ≤ a < b ≤ n. Como se sabe, P(a ≤ X ≤ b) = ∑ Cx θ x (1 − θ )n − x , para valor exacto da probabilidade pretendida. b n x =a Com n grande, o cálculo da expressão do segundo membro é muito trabalhoso, principalmente se não for possível recorrer a um computador. O Professor: Manuel do Carmo 102
  • 16. ESTATÍSTICA ⎛ a − nθ X − nθ b − nθ ⎞ Contudo, P(a ≤ X ≤ b) = P ⎜ ≤ ≤ ⎟, e ⎜ nθ (1 − θ ) nθ (1 − θ ) nθ (1 − θ ) ⎟ ⎝ ⎠ X − nθ a em virtude do corolário anterior ~ N(0, 1) nθ (1 − θ ) ⎛ b − nθ ⎞ ⎛ a − nθ ⎞ e, portanto, P(a ≤ X ≤ b) ≈Φ ⎜ - Φ⎜ ⎜ nθ (1 − θ ) ⎟ ⎜ nθ (1 − θ ) ⎟ (9) ⎟ ⎟ ⎝ ⎠ ⎝ ⎠ Caso n não seja muito grande, ou então se nos pedem P(X = x), devemos substituir a por a - 0.5 e b por b + 0.5. Nesta situação, os resultados obtidos são mais aproximados. O Professor: Manuel do Carmo 103
  • 17. ESTATÍSTICA Considerem-se, agora, algumas regras práticas para o cálculo de probabilidades que envolvem a distribuição binomial. - Se n ≤ 20, deve utilizar-se directamente a distribuição binomial, o que permite o cálculo exacto das probabilidades a partir dos valores apresentados em qualquer tabela da distribuição em causa; - Se n > 20, o cálculo aproximado das probabilidades deve atender aos seguintes casos: Se θ ≤ 0.1, deve utilizar-se a aproximação de Poisson1 à Binomial; Se θ ≥ 0.9, também se deve utilizar a já referida aproximação, considerando o respectivo acontecimento complementar, Se 0.1 < θ < 0.9, recorre-se à aproximação pela normal standardizada. 1 Def: Distribuição de Poisson e −λ λx Uma variável aleatória X com função de probabilidade f(x|λ)= , x=0, 1, 2,....,...(λ>0), diz-se que tem distribuição de Poisson. Simbolicamente, X ∼ Po(λ). As suas média e variância, x! são respectivamente: E(X)=λ e Var(X)=λ O Professor: Manuel do Carmo 104
  • 18. ESTATÍSTICA Refira-se, no entanto, que neste curso as situações a estudar devem contemplar, unicamente, o último caso. Exemplo 2 Seja a variável aleatória X ∼ B(200, 0.5). Neste caso, Θ = P(95 ≤ X ≤ 105) deve interpretar-se como sendo a probabilidade par que, em 200 lançamentos de uma moeda, o número de “faces” não apresente em relação a E(X) = 200 × 0.5 = 100 um desvio superior a 5. O valor ∑ 105 exacto de Θ é, Θ = x = 95 Cx (0.5)x (0.5)200 − x = 0.563246, sendo o 200 cálculo tedioso caso se não disponha de computador. Recorrendo à aproximação 9 e a uma tabela da distribuição Binomial, O Professor: Manuel do Carmo 105
  • 19. ESTATÍSTICA ⎛ 95 − 200 × 0.5 X − 200 × 0.5 105 − 200 × 0.5 ⎞ Θ = P⎜ ≤ ≤ ⎟ ⎝ 200 × 0.5 × 0.5 200 × 0.5 × 0.5 200 × 0.5 × 0.5 ⎠ ⎛ 105 − 100 ⎞ ⎛ 95 − 100 ⎞ ≈ Φ⎜ ⎟ - Φ⎜ ⎟ ⎝ 50 ⎠ ⎝ 50 ⎠ ≈ Φ(0.7071) - Φ(-0.7071) = 2×Φ(0.7071) – 1 = 0.520498 No entanto, se substituíssemos 105 por 105+0.5 e 95 por 95-0.5, a aproximação era muito melhor, pois ⎛ 105 + 0.5 − 100 ⎞ ⎛ 95 − 0.5 − 100 ⎞ Θ ≈ Φ⎜ ⎟ - Φ⎜ ⎟ ⎝ 50 ⎠ ⎝ 50 ⎠ ≈ Φ(0.7778) - Φ(-0.7778) = 2×Φ(0.7778) –1 = 0.563316 O Professor: Manuel do Carmo 106
  • 20. ESTATÍSTICA 4. Amostragem de população de Bernoulli. Caso de uma proporção. Considere-se uma população de Bernoulli. Esta população é composta por elementos de dois tipos – os que possuem e os que não possuem determinado atributo – e é caracterizada por uma função probabilidade da família, ℱθ = {f(x|θ) = θx (1 - θ)1-x : x ∈ {0, 1} ∧ 0 < θ < 1}. O parâmetro θ, que também se designa por proporção verdadeira, é naturalmente a principal incógnita na amostragem de populações de Bernoulli. O Professor: Manuel do Carmo 107
  • 21. ESTATÍSTICA A amostra casual de populações de Bernoulli, (X1, X2,........, Xn), é o conjunto de n variáveis aleatórias independentes e identicamente distribuídas, com função probabilidade individual da família ℱθ e função probabilidades conjunta Π f(xi|θ) = θ n ∑ i xi (1 − θ )n −∑ i xi , 0 < θ < 1, x ∈ {0, 1}, i = 1, 2,…..n (10) i =1 i Na amostragem de populações de Bernoulli interessa sobretudo estabelecer a distribuição por amostragem de duas estatísticas: - Y = Σi Xi, que representa o número (frequência absoluta) de elementos que na amostra possuem o atributo; O Professor: Manuel do Carmo 108
  • 22. ESTATÍSTICA - X = Σi Xi /n, que representa a proporção observada, isto é, a frequência relativa de elementos que na amostra possuem o atributo. A solução para tais “problemas” aparece, naturalmente, através da distribuição binomial. Considere-se Y, soma de n variáveis aleatórias independentes com distribuição de Bernoulli, ou seja Y ∼ B(n, θ), e P(Y = y) = nCy θy (1 - θ)n-y, y = 0, 1, 2,……n P( X = z) = P(Y = nz) = = nCnz θnz (1 - θ)n-nz, z = 0/n, 1/n, 2/n,……n/n (11) O Professor: Manuel do Carmo 109
  • 23. ESTATÍSTICA A distribuição binomial aparece, desta forma, acometida em distribuição por amostragem. Quando a dimensão da amostra é razoavelmente grande, podemos escrever Y − nθ a ~ N (0, 1) (12) nθ (1 − θ ) ou X −θ a ~ N (0, 1) (13) θ (1 − θ ) n As aproximações consideradas poderão ser melhoradas se utilizarmos as correcções de continuidade consideradas anteriormente. O Professor: Manuel do Carmo 110
  • 24. ESTATÍSTICA Com efeito, se substituirmos a por a-0.5 e b por b+0.5, obtemos a sequência ⎛ b + 0.5 − nθ ⎞ ⎛ a − 0.5 − nθ ⎞ P(a ≤ X ≤ b) ≈ Φ ⎜ ⎟ - Φ⎜ ⎜ ⎟ , 0 < a < b ≤ n (14) ⎜ nθ (1 − θ ) ⎟ ⎟ ⎝ ⎠ ⎝ nθ (1 − θ ) ⎠ ou de forma equivalente ⎛b 1 ⎞ ⎛a 1 ⎞ ⎜ + −θ ⎟ ⎜ − −θ ⎟ ⎛a b⎞ a b P ⎜ ≤ X ≤ ⎟ ≈ Φ ⎜ n 2n ⎟ - Φ ⎜ n 2n ⎟ , 0 < < ≤ 1 (15) ⎝n n⎠ ⎜ θ (1 − θ ) ⎟ ⎜ θ (1 − θ ) ⎟ n n ⎜ ⎟ ⎜ ⎟ ⎝ n ⎠ ⎝ n ⎠ Assim, quando a dimensão da amostra o permite, os problemas binomiais são “transportados” para a esfera de aplicação da O Professor: Manuel do Carmo 111
  • 25. ESTATÍSTICA distribuição normal e tornam mais acessíveis os cálculos. Por vezes, torna-se aconselhável recorrer à lei dos acontecimentos raros, utilizando a distribuição de Poisson para lidar com problemas de Bernoulli. Exemplo 3 Admita-se que uma instituição bancária classifica os seus clientes possuidores de cartão de crédito em “maus” e “bons” riscos, conforme tenham ou não faltado a um pagamento nos últimos 2 anos. Suponha- se que a proporção de “maus” riscos (classificados com X=1) é de 0.05 para as agências da zona de Lisboa. O Professor: Manuel do Carmo 112
  • 26. ESTATÍSTICA Qual a probabilidade de se obter pelo menos 10% de “maus” riscos numa amostra de: a) 10 clientes; b) 50 clientes; c) 400 clientes? Para responder a qualquer uma das alíneas, devemos calcular P ( X ≥ 0.1), sabendo-se que Xi ∼ B(1, 0.05) para i=1,2,...,n. a) Neste caso, pequena amostra, utiliza-se a distribuição Binomial, P ( X ≥ 0.1)= P ( ∑ i =1 X i ≥ 10 × 0.1) = P ( ∑ i =1 X i ≥ 1) =1- P ( ∑ i =1 X i = 0)=1- 10 10 10 0.5987=0.4013, recorrendo à Tabela da Binomial. O Professor: Manuel do Carmo 113
  • 27. ESTATÍSTICA b) Nesta situação, o recurso à distribuição Binomial, é muito “laborioso”, no entanto nθ=50×0.05=2.5<5. Como θ é pequeno pode utilizar-se a lei dos acontecimentos raros, ou seja, a aproximação à Poisson2 de parâmetro igual a nθ. Assim, P ( X ≥ 0.1) =P (∑ 50 i =1 X i ≥ 50 × 0.1 = P ) (∑ 50 i =1 X i ≥ 5 = 1− P) (∑ 50 i =1 Xi ≤ 4 ) ≈ 1 – (0.0821+0.2052+0.2565+0.2138+0.1336)=0.1088, utilizando a tabela da distribuição de Poisson, com parâmetro 2.5. c) Como se trata de uma grande amostra, utilizamos (14), isto é, 2 A regra prática para utilizar esta “lei” deve basear-se no pressuposto de que se tem um acontecimento raro e um número “elevado” de observações. Assim, não é aconselhável fazer a O Professor: Manuel do Carmo 114
  • 28. ESTATÍSTICA ⎛ ⎞ ⎜ X − 0.05 0.1 − 0.05 ⎟ P ( X ≥ 0.1)= P ⎜ ≥ ⎟ ⎜ 0.05(1 − 0.05) 0.05(1 − 0.05) ⎟ ⎜ ⎟ ⎝ 400 400 ⎠ ⎛ ⎞ ⎜ 0.1 − 0.05 ⎟ ≈1-Φ ⎜ ⎟ ⎜ 0.05(1 − 0.05) ⎟ ⎜ ⎟ ⎝ 400 ⎠ ≈ 1 - Φ(4.59) ≈ 0, se não se proceder à correcção de continuidade, ou então aproximação quando 0.1<θ<0.9 (quando θ≥0.9, é evidente que o acontecimento em causa não é “raro”; é o, sim, o seu complementar) ou quando n≤20. O Professor: Manuel do Carmo 115
  • 29. ESTATÍSTICA ⎛ 1 ⎞ ⎜ 0.1 − − 0.05 ⎟ X − 0.05 800 P ( X ≥ 0.1)= P ⎜ ≥ ⎟ ⎜ 0.05(1 − 0.05) 0.05(1 − 0.05) ⎟ ⎜ ⎟ ⎝ 400 400 ⎠ ⎛ 1 ⎞ ⎜ 0.1 − − 0.05 ⎟ ≈1-Φ ⎜ 800 ⎟ ⎜ 0.05(1 − 0.05) ⎟ ⎜ ⎟ ⎝ 400 ⎠ ≈ 1 - Φ(4.47) ≈ 0, o que é teoricamente mais correcto. O Professor: Manuel do Carmo 116
  • 30. ESTATÍSTICA 5. Amostragem de população de Bernoulli. Caso de duas proporções. Considerem-se agora duas populações de Bernoulli, com parâmetros θ1 e θ2. A ideia de comparar as duas proporções verdadeiras, θ1 e θ2, surge em muitas situações praticas (por exemplo, proporção de curas nos doentes tratados com o medicamento A e nos doentes tratados com o medicamento B; proporção de peças defeituosas quando se emprega o processo A e quando se emprega o processo B). Então, nos estudos de amostragem, a diferença entre proporções verdadeiras, θ1 - θ2, nunca pode ser conhecida exactamente; no O Professor: Manuel do Carmo 117
  • 31. ESTATÍSTICA entanto, podem estabelecer-se inferências através da estatística X 1 − X 2 (a diferença entre proporções observadas) calculadas, respectivamente, a partir de amostra casual da primeira população, X1i (X11, X12,...., X1m) ⇒ X 1 = ∑ i =1 m , m e de amostra casual da segunda população, X2 j (X21, X22,...., X2n) ⇒ X 2 = ∑ j =1 n , n amostras que se supõem escolhidas independentemente uma da outra. O Professor: Manuel do Carmo 118
  • 32. ESTATÍSTICA Como não se conhece a distribuição exacta, só pode estudar-se a distribuição assimptótica de X 1 − X 2 , válida quando as dimensões das amostras são razoavelmente grandes. Tem-se, então a ⎛ θ1(1 − θ1 ) ⎞ a ⎛ θ 2 (1 − θ 2 ) ⎞ X 1 ~ N ⎜ θ1, ⎟ , e X 2 ~ N ⎜θ2, ⎟ (16) ⎝ m ⎠ ⎝ n ⎠ Consequentemente, e utilizando a propriedade (corolário anterior) que estabelece que a diferença de duas variáveis aleatórias independentes com distribuição normal (aproximadamente normal) tem distribuição O Professor: Manuel do Carmo 119
  • 33. ESTATÍSTICA normal (aproximadamente normal), tem-se, depois de estandardizar, o resultado X 1 − X 2 − (θ1 − θ 2 ) a ~ N (0, 1) (17) θ1 (1 − θ1 ) θ 2 (1 − θ 2 ) + m n Para tal, basta notar que E( X 1 − X 2 ) = E( X 1) – E( X 2 ) = θ1 - θ2, θ1(1 − θ1 ) θ 2 (1 − θ 2 ) e Var( X 1 − X 2 ) = Var( X 1) + Var( X 2 ) = + m n O Professor: Manuel do Carmo 120
  • 34. ESTATÍSTICA Exemplo 4 Retome-se o exemplo 3 e suponha-se que a percentagem de “maus” riscos na zona do Porto é de 0.06. recolhidas amostras independentes nas zonas de Lisboa e Porto de dimensões 400 e 500, respectivamente, qual a probabilidade de se observar uma proporção maior de “maus” riscos em Lisboa do que no Porto? A resposta é, então, encontrada calculando P( X 1 − X 2 >0), onde o índice 1 designa a amostra de Lisboa, e o índice 2, a do Porto. Como se trata de grandes amostras, recorremos a (17) O Professor: Manuel do Carmo 121
  • 35. ESTATÍSTICA ⎛ ⎞ ⎜ X 1 − X 2 − (θ − θ ) 0 − (0.05 − 0.06) ⎟ P( X 1 − X 2 >0)= P ⎜ 1 2 > ⎟ ⎜ θ1(1 − θ1 ) θ 2 (1 − θ 2 ) 0.05 × 0.95 0.06 × 0.94 ⎟ ⎜ + + ⎟ ⎝ m n 400 500 ⎠ ≈1-Φ(0.66)≈0.2546 Valor que evidencia os cuidados que devemos ter, no processo de inferência, nas conclusões amostrais para a população. Com efeito, embora a proporção de “maus” riscos seja menor em Lisboa do que no Porto, mesmo assim a probabilidade de a média da amostra de Lisboa ser superior à média da amostra do Porto é aproximadamente 25%. O Professor: Manuel do Carmo 122
  • 36. ESTATÍSTICA 6. População normal: distribuição da média. Considere-se agora (X1, X2,....., Xn) uma amostra casual da população normal N(μ, σ2). Para obtermos a distribuição por amostragem da média, X , aplicamos o corolário (6), depois de se recordar que E( X )=μ e que Var( X )=σ2/n. Naturalmente, se (X1, X2,....., Xn) é uma amostra casual da população normal, N(μ, σ2), então ⎛ σ2 ⎞ X ~ N ⎜ μ, ⎟ (18) ⎝ n ⎠ o resultado anterior pode ainda escrever-se, de forma equivalente e mais adequada às aplicações práticas, por O Professor: Manuel do Carmo 123
  • 37. ESTATÍSTICA X −μ n ~ N (0,1) (19) σ Exemplo 5 Considere-se que a duração das chamadas telefónicas locais em determinada empresa pode ser aproximada por uma distribuição normal com média igual a 17 minutos e variância 25. Qual a probabilidade de, numa amostra aleatória de n chamadas, a duração média se situar entre 16 e 18 minutos? Quando n=25, temos O Professor: Manuel do Carmo 124
  • 38. ESTATÍSTICA ⎛ 16 − 17 X 25 − 17 18 − 17 ⎞ P(16 < X 25 < 18) = P ⎜ 25 < 25 < 25 ⎟ ⎝ 25 25 25 ⎠ = Φ(1) - Φ(-1) = 2×Φ(1) – 1 ≈ 0.6826. Faça o mesmo exercício, para n=100 e tire conclusões. 7. População normal: distribuição da variância. ( Xi − μ ) 2 ∑ n Relembre-se, que a variável aleatória tem distribuição i =1 σ 2 χ 2 (n) desde que as variáveis Xi sejam independentes e tenham distribuição N(μ, σ2). O Professor: Manuel do Carmo 125
  • 39. ESTATÍSTICA Deste modo, considere-se uma amostra casual (X1, X2,....., Xn) de população normal, N(μ, σ2), e as estatísticas X e S2. Então prova-se que: Teorema:4 Se (X1, X2,..., Xn) é uma amostra casual de uma população normal, ∑ (X ) n 2 nS 2 i =1 i −X N(μ, σ ), então2 = ~ χ 2 (n − 1) (20) σ 2 σ 2 (n − 1)S´2 Desta forma podemos, facilmente, concluir que ~ χ 2 (n − 1) σ2 pois, nS2=(n-1)S´2. O Professor: Manuel do Carmo 126
  • 40. ESTATÍSTICA ∑ (X − μ) n 2 i =1 ~ χ 2 (n ) i A comparação entre e σ 2 ∑ (X ) n 2 i =1 i −X ~ χ 2 (n − 1) mostra que se perde um grau de liberdade σ2 quando, na expressão da soma de quadrados, a média da população é substituída pela média da amostra. O Professor: Manuel do Carmo 127
  • 41. ESTATÍSTICA Exemplo 6 Considere-se uma população normal da qual se extraiu uma amostra de dimensão 25. Supondo que se procura calcular a probabilidade de o quociente entre a variância corrigida da amostra e a variância da população se situar entre 0.79 e 1.18, obtém-se ⎛ S´2 ⎞ ⎛ (n − 1)S´2 ⎞ P ⎜ 0.79 < 2 < 1.18 ⎟ = P ⎜ 24 × 0.79 < < 24 × 1.18 ⎟ ⎝ σ ⎠ ⎝ σ 2 ⎠ ≈ 0.75-0.25=0.5 O Professor: Manuel do Carmo 128
  • 42. ESTATÍSTICA 8. População normal: Rácio de Student. No caso de amostragem de populações normais, o resultado (19) é utilizado para estabelecer inferência sobre a média da população μ, a partir da média da amostra, X , quando a variância, σ2 é conhecida. Se a variância, σ2 é desconhecida – caso em que se diz que σ2 (ou σ) é um parâmetro perturbador na óptica das inferências sobre μ - a presença de σ em (19) torna impraticável a realização de inferência com base neste resultado. Durante anos pensou-se que o rácio de Student, X −μ X −μ n ou n −1 (21) S´ S O Professor: Manuel do Carmo 129
  • 43. ESTATÍSTICA tinha distribuição normal, isto é, admitiu-se que a substituição de σ por S´ no denominador de (21) não alterava a distribuição. Assim acontece, com razoável aproximação, quando n é suficientemente grande, caso em que pode empregar-se a distribuição assimptótica, X −μ a n ~ N (0,1) (22) S´ Contudo, para pequenas amostras, S´ é vulnerável a grandes flutuações de amostra para amostra, o que faz com que o rácio de Student siga outra distribuição – a distribuição t-Student – e não a distribuição normal. (ver distribuições teóricas) O Professor: Manuel do Carmo 130
  • 44. ESTATÍSTICA Desta forma, tem-se X −μ n ~ t (n − 1) (23) S´ Exemplo 7 De uma população com distribuição normal de média e variância desconhecidas, extraiu-se uma amostra casual de dimensão 25, cuja variância corrigida é 49. Qual a probabilidade de a média da amostra diferir da média da população, em valor absoluto, por uma valor inferior a 2.4? O Professor: Manuel do Carmo 131
  • 45. ESTATÍSTICA A formulação, para resposta ao problema, é dada através de P(| X - μ| < 2.4) ou então por P(-2.4 < X - μ < 2.4). ⎛ −2.4 X −μ 2.4 ⎞ Então, P(-2.4 < X - μ < 2.4) = P ⎜ < < ⎟ ⎝ 49 / 25 S´/ n 49 / 25 ⎠ ⎛ X −μ ⎞ ⎛ X −μ ⎞ = P ⎜ −1.711 < < 1.711⎟ =1-2×P ⎜ > 1.711⎟ =1-2×0.05=0.9 ⎝ S´/ n ⎠ ⎝ S´/ n ⎠ O Professor: Manuel do Carmo 132
  • 46. ESTATÍSTICA 9. Populações normais: diferença entre duas médias. Considerem-se duas amostras casuais, X11, X12,....., X1m, X21, X22,......., X2n, obtidas, de forma independente, das populações normais N(μ1, σ12) e N(μ2, σ22), respectivamente. Considerem-se, ainda, 1 m 1 n X1 = ∑ m i =1 X1i e X 2 = ∑ j =1 X 2 j as respectivas médias. n Então, podemos concluir que ⎛ σ 12 σ 2 ⎞ 2 X 1 − X 2 ~ N ⎜ μ1 − μ2 , + ⎟ (24) ⎝ m n ⎠ e de forma “mais simpática” O Professor: Manuel do Carmo 133
  • 47. ESTATÍSTICA (X 1 ) − X 2 − ( μ1 − μ2 ) ~ N (0, 1) (25) σ 12 σ2 2 + m n Contudo, as distribuições descritas, têm aplicação quando as variâncias das duas populações são conhecidas. Quando se sabe que as variâncias, embora desconhecidas, são iguais, pode recorrer-se a outro resultado para estabelecer inferências sobre μ1 - μ2. Supondo que σ12 = σ22 = σ2, o resultado (25) pode escrever-se U= (X 1 ) − X 2 − ( μ1 − μ2 ) ~ N (0, 1) 1 1 σ + m n O Professor: Manuel do Carmo 134
  • 48. ESTATÍSTICA Considerem-se agora, as variâncias corrigidas das duas amostras 1 1 ∑ ∑ m n S =´2 ( X1i − X 1 ) , e S2 = 2 ´2 ( X 2 j − X 2 )2 m − 1 i =1 n − 1 j =1 1 atendendo a (20), tem-se que V = ( m − 1) S1´2 + ( n − 1) S2 ´2 ~ χ 2 (m + n − 2) σ2 e como as variáveis U e V são independentes, podemos aplicar a definição 0.5, obtendo assim, X 1 − X 2 − ( μ1 − μ2 ) 1 1 + T = m n ~ t (m + n − 2) (26) ( m − 1) S1 + ( n − 1) S2 ´2 ´2 m+n−2 O Professor: Manuel do Carmo 135
  • 49. ESTATÍSTICA pois S´2 = ( m − 1) S1´2 + ( n − 1) S2 ´2 traduz a melhor aproximação ao valor m+n−2 de σ2, comum às duas populações, que, no entanto, têm médias diferentes. ∑ (X ) +∑ (X ) m 2 n 2 i =1 1i − X1 j =1 2j − X2 De facto, na expressão S ´2 = o m+n−2 numerador corresponde à soma habitual adaptada à nova situação, e o denominador é igual ao número total de observações menos duas, uma vez que se utilizam as estatísticas X 1 e X 2 em substituição das médias desconhecidas das populações, μ1 e μ2 (perderam-se dois graus de liberdade). Não sendo válidas as expressões (25) e (26), O Professor: Manuel do Carmo 136
  • 50. ESTATÍSTICA quando as variâncias das populações são desconhecidas e diferentes, as inferências sobre μ1 - μ2 tornam-se mais complexas. Assim, quando a dimensão das amostras o permite, pode operar-se com a distribuição normal assimptótica que resulta de substituir em (25) as variâncias da população pelas variâncias das amostras. Quando as amostras são pequenas, em particular se forem de diferentes dimensões, uma solução possível consiste em recorrer à aproximação de Welch. Este autor mostrou que O Professor: Manuel do Carmo 137
  • 51. ESTATÍSTICA Z= (X 1 ) − X 2 − ( μ1 − μ2 ) a ~ t (v ) onde v é dado pelo maior inteiro ´2 ´2 S1 S2 + m n 2 ⎛s s ⎞ ´2 ´2 ⎜m + n ⎟ 1 2 contido em r = ⎝ ⎠ ´2 ´2 sendo s1 e s2 os valores ´2 2 ´2 2 1 ⎛ s1 ⎞ 1 ⎛ s2 ⎞ ⎜ m ⎟ + n − 1⎜ n ⎟ m − 1⎝ ⎠ ⎝ ⎠ ´2 ´2 observados nas amostras para S1 e S2 , respectivamente. Assim, quando o valor de r não é inteiro, arredonda-se por defeito. O Professor: Manuel do Carmo 138
  • 52. ESTATÍSTICA Exemplo 8 Admita-se que os resultados do teste de QI são bem modelados por distribuições normais de média 100 nos países A e B. a) Recolhida uma amostra de dimensão 16 no país A, e outra, de dimensão 10 no país B, calcule-se a probabilidade de a média da primeira amostra ser superior em mais que 5 pontos à média da segunda amostra, sabendo que se observou uma variância amostral corrigida de 12 no país A e de 18 no país B? b) Repita-se a questão anterior agora que, embora desconhecidas, as variâncias nas duas populações são iguais. O Professor: Manuel do Carmo 139
  • 53. ESTATÍSTICA Nas duas questões é necessário calcular P X A − X B > 5 , sendo ( ) desconhecidas as variâncias das duas populações. Em a), não existindo razoes para admitir que as variâncias são iguais, utiliza-se a 2 ⎛ 12 18 ⎞ ⎜ 16 + 10 ⎟ fórmula de Welch, obtendo-se r = ⎝ ⎠ ≈16.36, e 2 2 1 ⎛ 12 ⎞ 1 ⎛ 18 ⎞ ⎜ 16 ⎟ + 9 ⎜ 10 ⎟ 15 ⎝ ⎠ ⎝ ⎠ portanto, utiliza-se uma distribuição t-Student com 16 graus de liberdade. Como μA - μB = 100 - 100 = 0, O Professor: Manuel do Carmo 140
  • 54. ESTATÍSTICA ⎛ ⎞ ⎜ ( ⎜ X A − X B − ( μ A − μB ) > ) 5−0 ⎟ ⎟ ( P XA − XB > 5 = P ⎜ ´2 SA SB ) ´2 12 18 ⎟ = P(Z > 3.13) ⎜ + + ⎟ ⎜ nA nB 16 10 ⎟ ⎝ ⎠ ≈ 0.001em b), recorremos à expressão (26) ⎛ ⎜ (X A ) − X B − ( μ A − μB ) 5−0 ⎞ ⎟ ⎜ 1 1 1 1 ⎟ ⎜ + + ⎟ ( ) nA nB P XA − XB > 5 = P⎜ > 16 10 ⎟ ⎜ ( nA − 1) S + ( nB − 1) S ´2 ´2 15 × 12 + 9 × 18 ⎟ ⎜ 16 + 10 − 2 ⎟ A B ⎜ nA + nB − 2 ⎟ ⎜ ⎟ ⎝ ⎠ O Professor: Manuel do Carmo 141
  • 55. ESTATÍSTICA = P(X > 3.286) ≈ 0.001 (t-Student, com 24 graus de liberdade) 6.10. Populações normais: relação entre duas variâncias. Vamos, por fim, estabelecer inferências sobre a relação entre as σ 12 variâncias, 2 , de duas populações normais independentes, onde σ2 ´2 S1 será natural pensar na estatística ´2 . Sendo as duas amostras S2 independentes, torna-se fácil ver que esta estatística pode ser relacionada com o quociente de duas variáveis independentes com distribuição do qui-quadrado, cada uma delas sendo dividida pelos O Professor: Manuel do Carmo 142
  • 56. ESTATÍSTICA respectivos graus de liberdade. Então, considerando as variáveis aleatórias independentes, U= ( m − 1) S1´2 ~ χ 2 (m − 1) e V= ( n − 1) S2 ´2 ~ χ 2 (n − 1) , σ 12 σ2 2 U /(m − 1) S1 σ 2 ´2 2 obtém-se F = = ´2 2 (27) V /(n − 1) S2 σ 1 onde F designa a, estudada, distribuição de Fisher. Com efeito, suponha-se que se tem duas populações normais, N(μ1, σ12) e N(μ2, σ22). Sejam S1 e S2 as variâncias corrigidas de ´2 ´2 amostras casuais independentes de dimensão m e n, O Professor: Manuel do Carmo 143
  • 57. ESTATÍSTICA respectivamente. Atendendo a (27) e à definição 0.6, concluímos S1 σ 2 ´2 2 imediatamente que ´2 2 ~F(m-1,n-1) (28) S2 σ 1 e em particular, quando σ12 = σ22, obtém-se ´2 S1 ´2 ~F(m-1,n-1) (29) S2 Exemplo 9 Considere-se, novamente, o exemplo 8, referente aos resultados dos testes de QI em dois países. Admita-se que ambas as populações são normais no que se refere aos resultados obtidos nestes testes e que se recolheu uma amostra de dimensão 16 no país A, e outra, de O Professor: Manuel do Carmo 144
  • 58. ESTATÍSTICA dimensão 10, no país B. Admitindo que as variâncias nas duas populações são iguais, qual a probabilidade de o quociente entre as ´2 SA variâncias corrigidas das duas amostras, ´2 ser superior a 3.77? SB ⎛ SA ´2 ⎞ A resposta obtém-se, calculando P ⎜ ´2 > 3.77 ⎟ , utilizando a tabela da ⎝ SB ⎠ distribuição de Fisher, com 15 e 9 graus de liberdade [F(16-1, 10- 1)=F(15,9)], temos que a referida probabilidade é aproximadamente 0.025. É de salientar que, não sendo as amostras de dimensão igual, ⎛ SA ´2 ⎞ ⎛ SB ´2 ⎞ P ⎜ ´2 > 3.77 ⎟ ≠ P ⎜ ´2 > 3.77 ⎟ , como facilmente pode ser ⎝ SB ⎠ ⎝ SA ⎠ O Professor: Manuel do Carmo 145
  • 59. ESTATÍSTICA comprovado. Suponha-se agora que pretendíamos calcular a ´2 SA probabilidade de o quociente entre variâncias corrigidas, ´2 , ser SB ⎛ SA ´2 ⎞ inferior a 0.386. Então vamos calcular P ⎜ ´2 < 0.386 ⎟ , mas para tal ⎝ SB ⎠ devemos recorrer à propriedade, enunciada anteriormente no final da Folha 12, da distribuição de Fisher. ⎛ SA ´2 ⎞ ⎛ SB ´2 1 ⎞ Seja, P ⎜ ´2 < 0.386 ⎟ = P ⎜ ´2 > ⎟ ⎝ SB ⎠ ⎝ SA 0.386 ⎠ ⎛ SB ´2 ⎞ = P ⎜ ´2 > 2.59 ⎟ ≈ 0.05 [F(10-1,16-1) = F(9,15)] ⎝ SA ⎠ O Professor: Manuel do Carmo Manuel do Assinado de forma digital por Manuel do Carmo 146 DN: cn=Manuel do Carmo, c=PT, o=ISEGI-UNL, ou=ISLA-Lx, Carmo email=carmo.manuel@gmail.com Dados: 2010.03.07 23:33:47 Z