SlideShare una empresa de Scribd logo
1 de 49
統計的推測  Statistical Inference



            推定と検定
            母集団と標本
            点推定
            区間推定
            2007.07.04  母平均のまとめ追加
            2007.05.25 情報統計学 R より編集
            2008.06.20 一部編集
            2012.07.13  信頼区間
            2012.07.17   t- 分布表の引き方




参考アニメーション
http://case.f7.ems.okayama-u.ac.jp/animation/population.html
母集団と標本

母集団 population
 調査したい全体 θ1θ2...θN
 母集団の特性値
   母平均    μ
   母分散    σ2
 全数調査
   時間がかかる
   費用がかかる
   もともと不可能な場合
標本調査 sample survey

 標本 sample
  母集団よりランダムに標本を抽出し、
  観測してデータ
      x1,x2,...,xn
  が得られる
  データの値は標本により異なる
  確率変数
      X1,X2,...,Xn
  の実現値
                     標本

             母集団
可能な標本の組数

有限母集団の場合
母集団の構成要素(岡山大学の全学生数)
    N         (    N=13,000
    )

標本数
   n        (   n=10 
     )
可能な標本の組数
    M  =  NCn
どの組を標本に選ぶか?!
無作為抽出 random sampling

 独立性の保証
  乱数
    乱数表
    乱数賽(サイコロ)
 非復元無作為抽出 without replacement
 復元無作為抽出  with replacement
 層別抽出法      stratified sampling
乱数賽
乱数表
乱数表

通常6頁
さいころで利用する頁
鉛筆を落として
最初に使用する値
必要な桁数で
通常下に読んでいく
47 都道府県
1 北海道    24   三重
2 青森     25   滋賀
3 岩手     26   京都
4 秋田     27   大阪
5 宮城     28   兵庫
6 山形     29   奈良
7 福島     30   和歌
8 茨城     31   鳥取
9 栃木     32   島根
10 群馬    33   岡山
11 埼玉    34   広島
12 千葉    35   山口
13 東京    36   徳島
14 神奈川   37   香川
15 新潟    38   愛媛
16 富山    39   高知
17 石川    40   福岡
18 福井    41   佐賀
19 山梨    42   長崎
20 長野    43   熊本
21 岐阜    44   大分
22 静岡    45   宮崎
23 愛知    46   鹿児島
         47   沖縄
層別無作為抽出法

市区町村、町丁字別、性別、学年別
のように、できるだけ均一な集団(層)
に分け
各層から無作為抽出

各層からどんな割合で標本をとるか
 各層の大きさに比例して
 各層のばらつきに比例して
推定と検定

推定 estimation
 母集団の特性値に何の情報もない
 特性値の値はどんな値か知りたい
   点推定   point estimation
   区間推定 interval estimation/ confidence interval
検定 testing
 母集団の特性値についてある情報を持ってい
 る
 その情報が正しいか否かを知りたい
   帰無仮説と対立仮説
   null hypothesis/ alternative hypothesis
点推定

仮想的な母集団
  i 名前 θi   > p1 <- c(148, 160, 159, 153, 151, 140)
            > p1
 1 A 148    [1] 148 160 159 153 151 140
 2 B 160    > mean(p1)
            [1] 151.8333   母平均
 3 C 159    > var(p1)
 4 D 153    [1] 54.96667    母分散
 5 E 151
 6 F 140
6⋅5
                                         M = N Cn = 6 C4 =      = 15
標本の取り出し方                                                   2 ⋅1
      標本    x1 x2 x3 x4       標本平均
1    ABCD   148 160 159 153   155.00
2    ABCE   148 160 159 151   154.50
3    ABCF   148 160 159 140   151.75    > mean(c(159, 153, 151, 140))
                                        [1] 150.75
4    ABDE   148 160 153 151   153.00
                                        途中省略
5    ABDF   148 160 153 140   150.25
6    ABEF   148 160 151 140   149.75    > mean(c(159, 153, 151, 140))
7    ACDE   148 159 153 151   152.75    [1] 150.75
                                        > mean(c(155.00, 154.50, 151.75, 153.00, 150.25,
8    ACDF   148 159 153 140   150.00
                                        +       149.75, 152.75, 150.00, 149.50, 148.00,
9    ACEF   148 159 151 140   149.50    +       155.75, 153.00, 152.50, 151.00, 150.75))
10   ADEF   148 153 151 140   148.00    [1] 151.8333
11   BCDE   160 159 153 151   155.75
12   BCDF   160 159 153 140   153.00
13   BCEF   160 159 151 140   152.75
14   BDEF   160 153 151 140   151.00
15   CDEF   159 153 151 140   150.75
     総平均                      151.833
点推定

標本確率変数 X1,X2,...,Xn の関数として
母集団の特性値(パラメータ) θ を定め
る

すなわち(
 θˆ = f   X ,X
           1     2
                     ,..., X n )


となる関数 f を定める
点推定に望まれる性質

不偏性     unbiasedness
一致性     consistency
有効性     efficiency
最尤法     maximum likelihood method
 最尤推定  MLE maximum likelihood estimator
不偏性 unbiasedness

            標本 1   推定値  ˆ
                       θ1
            標本 2   推定値 θ
                        ˆ
                          2
        .
        .
        .

            標本 L   推定値    ˆ
                         θL
不偏性

推定値の期待値が推定したい値


  θ θ
E ( ˆ) =

         ˆ +θ +... +θ
        θ1 2 ˆ       ˆ
      =               L
              L
例 表 7.1 の母平均の推定
 母平均
 µ = (148 + 160 + 159 + 153 + 151 + 140) / 6
   = 151.83333333333331


                                  1 n
 µ = f ( X 1, X 2 , , X n ) = X = ∑ X i   とおくと
 ˆ
                                  n i =1
 E ( µ ) = (155.00 + 154.50 +  + 150.75) / 15
     ˆ
    151.83333333333331
         =
一致性 consistency

 標本数 n を大きくする(全数調査に近づ
 ける)

       θˆ                       θ
 推定値  は母集団のパラメータ  に一
 致
     ˆ      ˆ
 limθ = limθ ( X 1 , X 2 ,..., X n) = θ
  n →∞    n →∞
例 一致性
     ˆ      ˆ
    θ = limθ ( X 1, X 2, , X n) = θ
lim
n →∞      n →∞

   1 n
X = ∑ Xi
   n i =1
         148 + 160 + 159 + 153 + 151 + 140
    →                                      = µ    → N )
                                                (n
                         6
有効性 efficiency
     ^
    θ       θ
 推定値  は、できるだけ  に近い値
 が現れることが望ましい。

 ( 分散は小さいほどよい )
         ^
    Var (θ ) ⇒ 最小化
例 全て不偏・一致推定量
 ˆ = θ ( X , X , X , X ) = X 1+ X 2+ X 3+ X 4
θ ˆ 1 2 3 4
                                   4
 ˆ = θ ( X , X , X , X ) = X 1+ X 2+ X 3
θ3 ˆ 1 2 3 4
                                 3
 ˆ = θ ( X , X , X , X ) = X 1+ X 2
θ2 ˆ 1 2 3 4
                               2
 ˆ = θ (X ,X ,X ,X ) = X 1
θ1 ˆ 1 2 3 4
                            1

    ˆ        ˆ      ˆ           ˆ
V (θ ) = E (θ − E (θ )) 2 = E (θ − θ ) 2
BLUE   Best Linear Unbiased
Estimator


    X 1 , X 2 ,..., X n
 データ           の線形結
 合の形式の推定値
       ^    ^

      θ = θ ( X , X ,..., X )
                        1       2       n

        = c X + c X + ... + c X
                1   1       2       2       n   n

 の中で分散最小のもの
                ^
       Var (θ ) ⇒ 最小化
最尤法
maximum likelihood method

 尤度関数  Likelihood Function
 n 個の観測値 x1,x2,...,xn の同時密度
     f ( x1 , x 2 ,, x n ) = f ( x1 , x 2 ,, x n ;θ )
 をパラメータ θ の関数として
    L(θ ) = L(θ ; x1 , x 2 ,, x n )
              f ( x1 , x 2 ,  , x n ) = f ( x1 , x 2 ,  , x n ;θ )
            =

 みたものが、
 パラメータ θ の「もっともらしさ」 = 「尤
 度」
最尤法

最尤法
尤度関数  L(θ) を最大にする θ を推定値


 L(θ ) = max   )
    ˆ        L(θ
             θ
                                            n
 log L(θ ) = log L(θ ; x1 , x2 ,  , xn ) = ∑ log f ( xi ;θ )
                                           i =1
最尤法

データが独立にとられている場合
                                    n
L(θ ) = f ( x1 , x2 ,..., xn ;θ ) = ∏ f ( xi ;θ )
                                   i =1



対数尤度関数
                            n                 n
l (θ ) = log L(θ ) = log ∏ f ( xi ;θ ) = ∑ log f ( xi ;θ )
                           i =1              i =1
正規分布の平均の点推定

X1 , X 2 ,..., X n ~ N ( µ , σ 2 )   のとき、対数尤度関数
                                         ( X i − µ )2
l ( µ ) = ∑ log f ( X i ; µ ) = K + ∑ {−              }
            i =1                    i       2σ   2


  ∂
      l ( µ ) = C 2∑ ( X i − µ )
∂µ                 i

 ∂l
       = 0 ⇒ ∑ ( X i − µ ) = 0 ⇒ ∑ X i = nµ
∂µ               i                  i

     1
µ
ˆ   = ∑ Xi
     n i
すなわち平均の最尤推定は標本平均
正規分布の平均の点推定

               1
        µ
        ˆ     = ∑ Xi
               n i
標本平均が
 不偏性
 一致性
 有効性 (BLUE)
 最尤性
のすべての意味で、一番良い推定量である。
正規分布の分散の点推定

平均 μ が既知の場合
        2 1 n
        σ = ∑ ( X i − µ )2
           n i =1
平均 μ が未知の場合
 最尤推定   2 1 n
        σ = ∑ ( X i − X )2
 不偏推定      n i =1
        2    1 n
        σ =      ∑
            n − 1 i =1
                       ( X i − X )2
∂                  ∂     n
                                    1         ( xi − µ ) 2
                        2 ∑
       log L(σ ) =
              2
                               log      exp[−              ]
∂ (σ )
     2
                   ∂ (σ ) i =1     2π σ          2σ  2


     ∂       n
                ( xi − µ ) 2 n          n
=         [∑ −              − log(2π ) − log σ 2 ]
  ∂ (σ 2 ) i =1    2σ 2      2          2
   n
       ( xi − µ ) 2     1      n 1
= ∑−                (− 2 2 ) −
  i =1      2         (σ )     2σ 2


=0
     1 n
σ 2 = ∑ ( xi − µ ) 2
 ˆ
     n i =1
n
                             1           ( xi − µ ) 2
log L( µ , σ 2 ) = ∑ log           exp[−              ]
                     i =1     2π σ           2σ 2

     n
          ( xi − µ ) 2     n          n
= ∑ [−                  ] − log(2π ) − log σ 2
   i =1       2σ 2         2          2
 ∂
      log L( µ , σ ) = 0
                   2

∂µ
   ∂
         log L( µ , σ 2 ) = 0
∂ (σ 2 )
   1 n
µ = ∑ xi = x
ˆ
   n i =1
     1 n
σ 2 = ∑ ( xi − x ) 2 = s 2
 ˆ
     n i =1
不偏分散
               n
E[ S ] = E[ ∑ ( X i − X ) 2 ]
     2

              i =1
         n
= E[∑ {( X i − µ ) − ( X − µ )}2 ]
      i =1
         n
= E[ ∑ ( X i − µ ) 2 − n ( X − µ ) 2 ]
      i =1
         n
= E[∑ (X i − µ ) 2 ] − nE[( X − µ ) 2 ]
      i =1

           σ2                              1 2       1 n
= nσ 2 − n
             n
                                    U =  2

                                         n −1
                                              S =       ∑
                                                   n − 1 i =1
                                                              (X i − X ) 2
= (n − 1)σ 2
                                              1               1
                                    E[U ] =
                                       2
                                                 E[ S ] =
                                                     2
                                                                   (n − 1)σ 2 = σ 2
                                            n −1            n −1
区間推定 interval estimation
     ˆ ˆ
   (θ L ,θU ) X 1 , X 2 ,..., X n
区間     をデータ         
に基づいてθˆ ( X , X ,..., X ),θˆ ( X , X ,..., X ))
   ˆ ˆ
 (θ L ,θU ) = ( L 1 2  n    U   1   2       n




と定める
区間の幅           θˆU − θˆL

定めた区間に母数がはいる確率
       ˆ   ˆ  Pr(θ L < θ < θ U )
信頼度  confidence level

 「区間の幅は狭く、確率は大きく」
 同時には満たせない

 条件付で考える
 「確率は最低限(悪くとも) 1-α 」以上という
 条件のもとで、幅を最少にするように定める

 この確率 1-α を信頼度という。
 定めた区間を信頼区間 (confidence interval) とい
 う
区間推定の定式化
標本  X 1 , X 2 ,  , X n
の関数として区間の端点を定める。
(θ L ,θ U ) = (θ L ( X 1 , X 2 ,  , X n ),θ U ( X 1 , X 2 ,  , X n ))


このとき
    θ L < θ < θ U ) ≥ 1 − α
  Pr(
という条件の下で。区間の幅
  θ U − θ L ⇒ 最小化
確率 95% の区間




             36
正規分布の母平均 μ の区間推定
 X 1 , X 2 , , X n ~ NID( µ , σ 2 )




                                                   0.4
    1 n            σ2
 X = ∑ X i ~ N (µ , )




                                                   0.3
                                       dnorm (x)
    n i =1         n




                                                   0.2
      X −µ




                                                   0.1
 Z=           ~ N (0,1)



                                                   0.0
        σ2                                               -3   -2   -1   0

                                                                        x
                                                                            1   2   3




         n
 Pr(a < Z < b) = 1 − α        区間の幅が一番短くなるのは
                              左右対称にとった場合
 Pr(− k < Z < k ) = 1 − α
 Pr( Z > kα / 2 ) = α / 2
正規分布の母平均 μ の区間推定
 X 1 , X 2 , , X n ~ NID( µ , σ 2 )
    1 n            σ2
 X = ∑ X i ~ N (µ , )
    n i =1         n
      X −µ
 Z=           ~ N (0,1)
        σ2
         n
 Pr(a < Z < b) = 1 − α
 Pr(− k < Z < k ) = 1 − α
 Pr( Z > kα / 2 ) = α / 2
Pr(−kα / 2 < Z < kα / 2 ) = 1 − α
                          σ2
Pr(−kα / 2   < ( X − µ) /    < kα / 2 ) = 1 − α
                          n
              σ2                  σ2
Pr(−kα / 2       < X − µ < kα / 2    ) = 1−α
              n                   n
                   σ2                      σ2
Pr(− X − kα / 2       < − µ < − X + kα / 2    ) = 1−α
                   n                       n
                  σ2                  σ2
Pr( X − kα / 2       < µ < X + kα / 2    ) = 1−α
                  n                   n
信頼区間
                  σ2              σ2               σ2
   − kα / 2
 (X                  , X + kα / 2    )  X ± kα / 2
                  n               n                n
本番




                                          100
> r <- sim.conf.interval(100, 10, 0.95)




                                          80
> r[apply(r, 1, prod) > 0, ]




                                          60
       [,1]    [,2]
[1,] -1.257169 -0.01757909



                                     gy
[2,] -1.300771 -0.06118130


                                          40
[3,] -1.323769 -0.08417887
[4,] -1.415869 -0.17627881
> (1:100)[apply(r, 1, prod) > 0]          20
[1] 48 64 96 99

> plot.conf.interval(r)
                                          0




                                                -2   -1   0    1   2

                                                          gx
正規分布の母平均 μ の区間推定
(母分散が未知の場合)
X 1 , X 2 ,, X n ~ N ( µ , σ 2 )
                                                            母分
   1 n             σ2        X −µ                           散 σ2
X = ∑ X i ~ N ( µ , ),   Z =       ~N (0,1)
   n i =1          n         σ2 /n                          の代
                                                            わり
Pr(−kα / 2 < Z < kα / 2 ) = 1 − α                           に推
                                                            定値
                X −µ
Pr(−kα / 2 <            < kα / 2 ) = 1 − α                  u2 を
                σ /n
                  2
                                                            代入
Pr( X − kα / 2 σ 2 / n < µ < X + kα / 2 σ 2 / n ) = 1 − α   しよ
               σ2              σ2                           う
[ X − kα / 2      , X + kα / 2    ] 
               n               n
自由度 n-1 の t- 分布
     X −µ
Z=             ~N (0,1)




                                              0.4
      σ /n
        2




                                              0.3
     X −µ
T=             ~ t n −1




                                       密度関数
      u2 / n




                                              0.2
                                              0.1
自由度mのt分布の密度関数

                                              0.0
              m +1              m +1
           Γ(
                                                    -3   -2   -1   0   1   2   3

                   )         −
                         x2  2
                                                                   x



f m ( x) =     2     1 +                          黒:標準正規分布
                 m      m                         赤:自由度9 t分布
           mπ Γ( )                                青:自由度3 t分布
                  2
t- 分布表
自由度10 上側確率
    0.025




                                     0.4
                                     0.3
                         dt(x, 10)

                                     0.2
                                     0.1
                                     0.0
                                           -4   -2   0   2   4



  Pr(T > 2.2281) = 0.025                             x




  Pr(| T |> 2.2281) = 0.025 × 2 = 0.05
  t10 (0.025) = 2.2281
自由度 8  両側確率 0.1




                                   0.4
                                   0.3
                        dt(x, 8)

                                   0.2
                                   0.1
                                   0.0
                                         -4   -2   0   2   4

                                                   x



 両側確率   T |> 1.8595) = 0.05 × 2 = 0.1
      Pr(|
 上側確率   T > 1.8595) = 0.05
      Pr(
 下側確率   T < −1.8595) = 0.05
      Pr(
      t8 (0.05) = 1.8595
X −µ
                             Z=             ~N (0,1)
                                  σ /n2


                             Pr(−kα / 2 < Z < kα / 2 ) = 1 − α
                             Pr( X − kα / 2 σ 2 / n < µ < X + kα / 2 σ 2 / n ) = 1 − α
      X −µ
T=             ~ t n −1
       u2 / n
Pr(−t n −1 (α / 2) < T < t n −1 (α / 2)) = 1 − α
                       u2                          u2
Pr( X − t n −1 (α / 2)    < µ < X + t n −1 (α / 2)    ) = 1−α
                       n                           n

信頼区間
                     u2                      u2
[ X − t n −1 (α / 2)    , X + t n −1 (α / 2)    ]
                     n                       n
区間推定のシミュレーション
(分散未知)
 > t.test(rnorm(10), conf.level=0.95)

        One Sample t-test

 data: rnorm(10)
 t = -1.0439, df = 9, p-value = 0.3237
 alternative hypothesis: true mean is not equal to 0
 95 percent confidence interval:
  -0.9129610 0.3364108
 sample estimates:
  mean of x
 -0.2882751

 > t.test(rnorm(10), conf.level=0.95)$conf.int
 [1] -0.4416194 1.4037247
 attr(,"conf.level")
 [1] 0.95
n=10 、 1-α=0.95 、 σ 2 = 未
 知
> sim.t.conf.interval <- function(nsim, n, conf) {
+ result <- c()
+ for (i in 1:nsim){




                                                                        100
+ result <- rbind(result, t.test(rnorm(n), conf.level=conf)$conf.int)
+ }
+ result




                                                                        80
+}
> set.seed(1231)
> rt<-sim.t.conf.interval(100,10,0.95)




                                                                        60
> rt[apply(rt,1,prod)>0,]
        [,1]    [,2]




                                                                   gy
[1,] -0.99062123 -0.12569906




                                                                        40
[2,] -1.10211619 -0.03000526
[3,] -0.54445510 -0.01016643
[4,] 0.01700083 1.08047258




                                                                        20
> which(apply(rt,1,prod)>0)
[1] 32 69 72 93
> plot.conf.interval(rt)

                                                                        0     -2   -1   0    1   2
                                                                                        gx
2つの信頼区間の比較




                                       100
     100




                                       80
     80




                                       60
     60




                                  gy
gy




                                       40
     40




                                       20
     20




                                       0
     0




           -2   -1   0    1   2              -2   -1   0    1   2

                     gx                                gx

Más contenido relacionado

La actualidad más candente

第4回MachineLearningのための数学塾資料(浅川)
第4回MachineLearningのための数学塾資料(浅川)第4回MachineLearningのための数学塾資料(浅川)
第4回MachineLearningのための数学塾資料(浅川)Shin Asakawa
 
PRML 1.6 情報理論
PRML 1.6 情報理論PRML 1.6 情報理論
PRML 1.6 情報理論sleepy_yoshi
 
「全ての確率はコイン投げに通ず」 Japan.R 発表資料
「全ての確率はコイン投げに通ず」 Japan.R 発表資料「全ての確率はコイン投げに通ず」 Japan.R 発表資料
「全ての確率はコイン投げに通ず」 Japan.R 発表資料Ken'ichi Matsui
 
続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章Roy Ray
 
EMアルゴリズム
EMアルゴリズムEMアルゴリズム
EMアルゴリズムmoritama1515
 
ラビットチャレンジレポート 応用数学
ラビットチャレンジレポート 応用数学ラビットチャレンジレポート 応用数学
ラビットチャレンジレポート 応用数学ssuserf4860b
 
ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習ssuserf4860b
 
東京都市大学 データ解析入門 2 行列分解 1
東京都市大学 データ解析入門 2 行列分解 1東京都市大学 データ解析入門 2 行列分解 1
東京都市大学 データ解析入門 2 行列分解 1hirokazutanaka
 
指数時間アルゴリズムの最先端
指数時間アルゴリズムの最先端指数時間アルゴリズムの最先端
指数時間アルゴリズムの最先端Yoichi Iwata
 
TokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~ん
TokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~んTokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~ん
TokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~んsleepy_yoshi
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知Yuya Takashina
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Shintaro Fukushima
 
続・わかりやすいパターン認識 9章
続・わかりやすいパターン認識 9章続・わかりやすいパターン認識 9章
続・わかりやすいパターン認識 9章hakusai
 
AI2018 8 ニューラルネットワークの基礎
AI2018 8 ニューラルネットワークの基礎AI2018 8 ニューラルネットワークの基礎
AI2018 8 ニューラルネットワークの基礎Hirotaka Hachiya
 
CVIM#11 3. 最小化のための数値計算
CVIM#11 3. 最小化のための数値計算CVIM#11 3. 最小化のための数値計算
CVIM#11 3. 最小化のための数値計算sleepy_yoshi
 
PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半Ohsawa Goodfellow
 
卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-Tomoshige Nakamura
 

La actualidad más candente (20)

第4回MachineLearningのための数学塾資料(浅川)
第4回MachineLearningのための数学塾資料(浅川)第4回MachineLearningのための数学塾資料(浅川)
第4回MachineLearningのための数学塾資料(浅川)
 
PRML 1.6 情報理論
PRML 1.6 情報理論PRML 1.6 情報理論
PRML 1.6 情報理論
 
「全ての確率はコイン投げに通ず」 Japan.R 発表資料
「全ての確率はコイン投げに通ず」 Japan.R 発表資料「全ての確率はコイン投げに通ず」 Japan.R 発表資料
「全ての確率はコイン投げに通ず」 Japan.R 発表資料
 
続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章
 
EMアルゴリズム
EMアルゴリズムEMアルゴリズム
EMアルゴリズム
 
ラビットチャレンジレポート 応用数学
ラビットチャレンジレポート 応用数学ラビットチャレンジレポート 応用数学
ラビットチャレンジレポート 応用数学
 
ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習
 
Linera lgebra
Linera lgebraLinera lgebra
Linera lgebra
 
東京都市大学 データ解析入門 2 行列分解 1
東京都市大学 データ解析入門 2 行列分解 1東京都市大学 データ解析入門 2 行列分解 1
東京都市大学 データ解析入門 2 行列分解 1
 
指数時間アルゴリズムの最先端
指数時間アルゴリズムの最先端指数時間アルゴリズムの最先端
指数時間アルゴリズムの最先端
 
TokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~ん
TokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~んTokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~ん
TokyoNLP#5 パーセプトロンで楽しい仲間がぽぽぽぽ~ん
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析
 
続・わかりやすいパターン認識 9章
続・わかりやすいパターン認識 9章続・わかりやすいパターン認識 9章
続・わかりやすいパターン認識 9章
 
AI2018 8 ニューラルネットワークの基礎
AI2018 8 ニューラルネットワークの基礎AI2018 8 ニューラルネットワークの基礎
AI2018 8 ニューラルネットワークの基礎
 
CVIM#11 3. 最小化のための数値計算
CVIM#11 3. 最小化のための数値計算CVIM#11 3. 最小化のための数値計算
CVIM#11 3. 最小化のための数値計算
 
PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半
 
卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-
 
PRML セミナー
PRML セミナーPRML セミナー
PRML セミナー
 
離散構造と離散分布
離散構造と離散分布離散構造と離散分布
離散構造と離散分布
 

Similar a 070 統計的推測 母集団と推定

Introduction to the particle filter
Introduction to the particle filterIntroduction to the particle filter
Introduction to the particle filterSatoshi Minakuchi
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布t2tarumi
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化Miyoshi Yuya
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知Chika Inoshita
 
Infomation geometry(overview)
Infomation geometry(overview)Infomation geometry(overview)
Infomation geometry(overview)Yoshitake Misaki
 
公開鍵暗号2: NP困難性
公開鍵暗号2: NP困難性公開鍵暗号2: NP困難性
公開鍵暗号2: NP困難性Joe Suzuki
 
8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論sleepy_yoshi
 
20170327_レムニスケートにまつわる色々な計算
20170327_レムニスケートにまつわる色々な計算20170327_レムニスケートにまつわる色々な計算
20170327_レムニスケートにまつわる色々な計算matsumoring
 
Prml3.5 エビデンス近似〜
Prml3.5 エビデンス近似〜Prml3.5 エビデンス近似〜
Prml3.5 エビデンス近似〜Yuki Matsubara
 
How to study stat
How to study statHow to study stat
How to study statAk Ok
 
JOIss2020 発表資料
JOIss2020 発表資料JOIss2020 発表資料
JOIss2020 発表資料mdkcpp 1015
 
【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門Zansa
 

Similar a 070 統計的推測 母集団と推定 (20)

Introduction to the particle filter
Introduction to the particle filterIntroduction to the particle filter
Introduction to the particle filter
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布
 
Nn bp formula
Nn bp formulaNn bp formula
Nn bp formula
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化
 
NLPforml5
NLPforml5NLPforml5
NLPforml5
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知
 
Infomation geometry(overview)
Infomation geometry(overview)Infomation geometry(overview)
Infomation geometry(overview)
 
公開鍵暗号2: NP困難性
公開鍵暗号2: NP困難性公開鍵暗号2: NP困難性
公開鍵暗号2: NP困難性
 
8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論
 
分布 isseing333
分布 isseing333分布 isseing333
分布 isseing333
 
20170327_レムニスケートにまつわる色々な計算
20170327_レムニスケートにまつわる色々な計算20170327_レムニスケートにまつわる色々な計算
20170327_レムニスケートにまつわる色々な計算
 
ndwave8.pdf
ndwave8.pdfndwave8.pdf
ndwave8.pdf
 
確率解析計算
確率解析計算確率解析計算
確率解析計算
 
Prml3.5 エビデンス近似〜
Prml3.5 エビデンス近似〜Prml3.5 エビデンス近似〜
Prml3.5 エビデンス近似〜
 
How to study stat
How to study statHow to study stat
How to study stat
 
Prml 4.3.5
Prml 4.3.5Prml 4.3.5
Prml 4.3.5
 
JOIss2020 発表資料
JOIss2020 発表資料JOIss2020 発表資料
JOIss2020 発表資料
 
【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門
 
C06
C06C06
C06
 
Ishihata 150319-final
Ishihata 150319-finalIshihata 150319-final
Ishihata 150319-final
 

Más de t2tarumi

K090 仮説検定
K090 仮説検定K090 仮説検定
K090 仮説検定t2tarumi
 
K060 中心極限定理clt
K060 中心極限定理cltK060 中心極限定理clt
K060 中心極限定理cltt2tarumi
 
K050 t分布f分布
K050 t分布f分布K050 t分布f分布
K050 t分布f分布t2tarumi
 
K040 確率分布とchi2分布
K040 確率分布とchi2分布K040 確率分布とchi2分布
K040 確率分布とchi2分布t2tarumi
 
K030 appstat201203 2variable
K030 appstat201203 2variableK030 appstat201203 2variable
K030 appstat201203 2variablet2tarumi
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202t2tarumi
 
K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201t2tarumi
 
K080 区間推定
K080 区間推定K080 区間推定
K080 区間推定t2tarumi
 
000 統計学入門 目標
000 統計学入門 目標000 統計学入門 目標
000 統計学入門 目標t2tarumi
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定t2tarumi
 
076 母比率の推定
076 母比率の推定076 母比率の推定
076 母比率の推定t2tarumi
 
060 期待値・中心極限定理
060 期待値・中心極限定理060 期待値・中心極限定理
060 期待値・中心極限定理t2tarumi
 
040 相関
040 相関040 相関
040 相関t2tarumi
 
030 2変数の集計
030 2変数の集計030 2変数の集計
030 2変数の集計t2tarumi
 
020 1変数の集計
020 1変数の集計020 1変数の集計
020 1変数の集計t2tarumi
 
010 統計学とは
010 統計学とは010 統計学とは
010 統計学とはt2tarumi
 

Más de t2tarumi (16)

K090 仮説検定
K090 仮説検定K090 仮説検定
K090 仮説検定
 
K060 中心極限定理clt
K060 中心極限定理cltK060 中心極限定理clt
K060 中心極限定理clt
 
K050 t分布f分布
K050 t分布f分布K050 t分布f分布
K050 t分布f分布
 
K040 確率分布とchi2分布
K040 確率分布とchi2分布K040 確率分布とchi2分布
K040 確率分布とchi2分布
 
K030 appstat201203 2variable
K030 appstat201203 2variableK030 appstat201203 2variable
K030 appstat201203 2variable
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202
 
K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201
 
K080 区間推定
K080 区間推定K080 区間推定
K080 区間推定
 
000 統計学入門 目標
000 統計学入門 目標000 統計学入門 目標
000 統計学入門 目標
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定
 
076 母比率の推定
076 母比率の推定076 母比率の推定
076 母比率の推定
 
060 期待値・中心極限定理
060 期待値・中心極限定理060 期待値・中心極限定理
060 期待値・中心極限定理
 
040 相関
040 相関040 相関
040 相関
 
030 2変数の集計
030 2変数の集計030 2変数の集計
030 2変数の集計
 
020 1変数の集計
020 1変数の集計020 1変数の集計
020 1変数の集計
 
010 統計学とは
010 統計学とは010 統計学とは
010 統計学とは
 

Último

My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfMy Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfinspirehighstaff03
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfoganekyokoi
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdfoganekyokoi
 
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」inspirehighstaff03
 
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライドリアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライドKen Fukui
 
International Politics I - Lecture 1
International Politics I - Lecture 1International Politics I - Lecture 1
International Politics I - Lecture 1Toru Oga
 
My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」inspirehighstaff03
 
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」inspirehighstaff03
 
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」inspirehighstaff03
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfoganekyokoi
 
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」inspirehighstaff03
 
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slidessusere0a682
 
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」inspirehighstaff03
 
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」inspirehighstaff03
 
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライドリアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライドKen Fukui
 
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdfTEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdfyukisuga3
 
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」inspirehighstaff03
 
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライドリアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライドKen Fukui
 
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」inspirehighstaff03
 
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライドリアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライドKen Fukui
 

Último (20)

My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfMy Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdf
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdf
 
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」
 
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライドリアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
 
International Politics I - Lecture 1
International Politics I - Lecture 1International Politics I - Lecture 1
International Politics I - Lecture 1
 
My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」
 
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」
 
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdf
 
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
 
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
 
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
 
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
 
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライドリアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
 
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdfTEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdf
 
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
 
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライドリアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
 
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
 
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライドリアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
 

070 統計的推測 母集団と推定

  • 1. 統計的推測  Statistical Inference 推定と検定 母集団と標本 点推定 区間推定 2007.07.04  母平均のまとめ追加 2007.05.25 情報統計学 R より編集 2008.06.20 一部編集 2012.07.13  信頼区間 2012.07.17   t- 分布表の引き方 参考アニメーション http://case.f7.ems.okayama-u.ac.jp/animation/population.html
  • 2. 母集団と標本 母集団 population 調査したい全体 θ1θ2...θN 母集団の特性値 母平均    μ 母分散    σ2 全数調査 時間がかかる 費用がかかる もともと不可能な場合
  • 3. 標本調査 sample survey 標本 sample 母集団よりランダムに標本を抽出し、 観測してデータ     x1,x2,...,xn が得られる データの値は標本により異なる 確率変数     X1,X2,...,Xn の実現値 標本 母集団
  • 4. 可能な標本の組数 有限母集団の場合 母集団の構成要素(岡山大学の全学生数)     N         (    N=13,000     ) 標本数    n        (   n=10       ) 可能な標本の組数     M  =  NCn どの組を標本に選ぶか?!
  • 5. 無作為抽出 random sampling 独立性の保証 乱数 乱数表 乱数賽(サイコロ) 非復元無作為抽出 without replacement 復元無作為抽出  with replacement 層別抽出法      stratified sampling
  • 9. 47 都道府県 1 北海道 24 三重 2 青森 25 滋賀 3 岩手 26 京都 4 秋田 27 大阪 5 宮城 28 兵庫 6 山形 29 奈良 7 福島 30 和歌 8 茨城 31 鳥取 9 栃木 32 島根 10 群馬 33 岡山 11 埼玉 34 広島 12 千葉 35 山口 13 東京 36 徳島 14 神奈川 37 香川 15 新潟 38 愛媛 16 富山 39 高知 17 石川 40 福岡 18 福井 41 佐賀 19 山梨 42 長崎 20 長野 43 熊本 21 岐阜 44 大分 22 静岡 45 宮崎 23 愛知 46 鹿児島 47 沖縄
  • 11. 推定と検定 推定 estimation 母集団の特性値に何の情報もない 特性値の値はどんな値か知りたい 点推定   point estimation 区間推定 interval estimation/ confidence interval 検定 testing 母集団の特性値についてある情報を持ってい る その情報が正しいか否かを知りたい 帰無仮説と対立仮説 null hypothesis/ alternative hypothesis
  • 12. 点推定 仮想的な母集団 i 名前 θi > p1 <- c(148, 160, 159, 153, 151, 140) > p1 1 A 148 [1] 148 160 159 153 151 140 2 B 160 > mean(p1) [1] 151.8333   母平均 3 C 159 > var(p1) 4 D 153 [1] 54.96667    母分散 5 E 151 6 F 140
  • 13. 6⋅5 M = N Cn = 6 C4 = = 15 標本の取り出し方 2 ⋅1 標本 x1 x2 x3 x4 標本平均 1 ABCD 148 160 159 153 155.00 2 ABCE 148 160 159 151 154.50 3 ABCF 148 160 159 140 151.75 > mean(c(159, 153, 151, 140)) [1] 150.75 4 ABDE 148 160 153 151 153.00 途中省略 5 ABDF 148 160 153 140 150.25 6 ABEF 148 160 151 140 149.75 > mean(c(159, 153, 151, 140)) 7 ACDE 148 159 153 151 152.75 [1] 150.75 > mean(c(155.00, 154.50, 151.75, 153.00, 150.25, 8 ACDF 148 159 153 140 150.00 + 149.75, 152.75, 150.00, 149.50, 148.00, 9 ACEF 148 159 151 140 149.50 + 155.75, 153.00, 152.50, 151.00, 150.75)) 10 ADEF 148 153 151 140 148.00 [1] 151.8333 11 BCDE 160 159 153 151 155.75 12 BCDF 160 159 153 140 153.00 13 BCEF 160 159 151 140 152.75 14 BDEF 160 153 151 140 151.00 15 CDEF 159 153 151 140 150.75 総平均 151.833
  • 14. 点推定 標本確率変数 X1,X2,...,Xn の関数として 母集団の特性値(パラメータ) θ を定め る すなわち( θˆ = f X ,X 1 2 ,..., X n ) となる関数 f を定める
  • 15. 点推定に望まれる性質 不偏性 unbiasedness 一致性 consistency 有効性 efficiency 最尤法 maximum likelihood method 最尤推定  MLE maximum likelihood estimator
  • 16. 不偏性 unbiasedness 標本 1   推定値 ˆ θ1 標本 2   推定値 θ ˆ 2 . . . 標本 L   推定値 ˆ θL
  • 17. 不偏性 推定値の期待値が推定したい値 θ θ E ( ˆ) = ˆ +θ +... +θ θ1 2 ˆ ˆ = L L
  • 18. 例 表 7.1 の母平均の推定 母平均 µ = (148 + 160 + 159 + 153 + 151 + 140) / 6 = 151.83333333333331 1 n µ = f ( X 1, X 2 , , X n ) = X = ∑ X i   とおくと ˆ n i =1 E ( µ ) = (155.00 + 154.50 +  + 150.75) / 15 ˆ    151.83333333333331 =
  • 19. 一致性 consistency 標本数 n を大きくする(全数調査に近づ ける) θˆ θ 推定値  は母集団のパラメータ  に一 致 ˆ ˆ limθ = limθ ( X 1 , X 2 ,..., X n) = θ n →∞ n →∞
  • 20. 例 一致性 ˆ ˆ θ = limθ ( X 1, X 2, , X n) = θ lim n →∞ n →∞ 1 n X = ∑ Xi n i =1 148 + 160 + 159 + 153 + 151 + 140     → = µ    → N ) (n 6
  • 21. 有効性 efficiency ^ θ θ 推定値  は、できるだけ  に近い値 が現れることが望ましい。 ( 分散は小さいほどよい ) ^ Var (θ ) ⇒ 最小化
  • 22. 例 全て不偏・一致推定量 ˆ = θ ( X , X , X , X ) = X 1+ X 2+ X 3+ X 4 θ ˆ 1 2 3 4 4 ˆ = θ ( X , X , X , X ) = X 1+ X 2+ X 3 θ3 ˆ 1 2 3 4 3 ˆ = θ ( X , X , X , X ) = X 1+ X 2 θ2 ˆ 1 2 3 4 2 ˆ = θ (X ,X ,X ,X ) = X 1 θ1 ˆ 1 2 3 4 1 ˆ ˆ ˆ ˆ V (θ ) = E (θ − E (θ )) 2 = E (θ − θ ) 2
  • 23. BLUE   Best Linear Unbiased Estimator X 1 , X 2 ,..., X n データ           の線形結 合の形式の推定値 ^ ^ θ = θ ( X , X ,..., X ) 1 2 n = c X + c X + ... + c X 1 1 2 2 n n の中で分散最小のもの ^ Var (θ ) ⇒ 最小化
  • 24. 最尤法 maximum likelihood method 尤度関数  Likelihood Function n 個の観測値 x1,x2,...,xn の同時密度     f ( x1 , x 2 ,, x n ) = f ( x1 , x 2 ,, x n ;θ ) をパラメータ θ の関数として    L(θ ) = L(θ ; x1 , x 2 ,, x n )     f ( x1 , x 2 ,  , x n ) = f ( x1 , x 2 ,  , x n ;θ ) = みたものが、 パラメータ θ の「もっともらしさ」 = 「尤 度」
  • 25. 最尤法 最尤法 尤度関数  L(θ) を最大にする θ を推定値 L(θ ) = max   ) ˆ L(θ θ n log L(θ ) = log L(θ ; x1 , x2 ,  , xn ) = ∑ log f ( xi ;θ ) i =1
  • 26. 最尤法 データが独立にとられている場合 n L(θ ) = f ( x1 , x2 ,..., xn ;θ ) = ∏ f ( xi ;θ ) i =1 対数尤度関数 n n l (θ ) = log L(θ ) = log ∏ f ( xi ;θ ) = ∑ log f ( xi ;θ ) i =1 i =1
  • 27. 正規分布の平均の点推定 X1 , X 2 ,..., X n ~ N ( µ , σ 2 ) のとき、対数尤度関数 ( X i − µ )2 l ( µ ) = ∑ log f ( X i ; µ ) = K + ∑ {− } i =1 i 2σ 2 ∂ l ( µ ) = C 2∑ ( X i − µ ) ∂µ i ∂l = 0 ⇒ ∑ ( X i − µ ) = 0 ⇒ ∑ X i = nµ ∂µ i i 1 µ ˆ = ∑ Xi n i すなわち平均の最尤推定は標本平均
  • 28. 正規分布の平均の点推定 1 µ ˆ = ∑ Xi n i 標本平均が 不偏性 一致性 有効性 (BLUE) 最尤性 のすべての意味で、一番良い推定量である。
  • 29. 正規分布の分散の点推定 平均 μ が既知の場合 2 1 n σ = ∑ ( X i − µ )2 n i =1 平均 μ が未知の場合 最尤推定 2 1 n σ = ∑ ( X i − X )2 不偏推定 n i =1 2 1 n σ = ∑ n − 1 i =1 ( X i − X )2
  • 30. ∂ n 1 ( xi − µ ) 2 2 ∑ log L(σ ) = 2 log exp[− ] ∂ (σ ) 2 ∂ (σ ) i =1 2π σ 2σ 2 ∂ n ( xi − µ ) 2 n n = [∑ − − log(2π ) − log σ 2 ] ∂ (σ 2 ) i =1 2σ 2 2 2 n ( xi − µ ) 2 1 n 1 = ∑− (− 2 2 ) − i =1 2 (σ ) 2σ 2 =0 1 n σ 2 = ∑ ( xi − µ ) 2 ˆ n i =1
  • 31. n 1 ( xi − µ ) 2 log L( µ , σ 2 ) = ∑ log exp[− ] i =1 2π σ 2σ 2 n ( xi − µ ) 2 n n = ∑ [− ] − log(2π ) − log σ 2 i =1 2σ 2 2 2 ∂ log L( µ , σ ) = 0 2 ∂µ ∂ log L( µ , σ 2 ) = 0 ∂ (σ 2 ) 1 n µ = ∑ xi = x ˆ n i =1 1 n σ 2 = ∑ ( xi − x ) 2 = s 2 ˆ n i =1
  • 32. 不偏分散 n E[ S ] = E[ ∑ ( X i − X ) 2 ] 2 i =1 n = E[∑ {( X i − µ ) − ( X − µ )}2 ] i =1 n = E[ ∑ ( X i − µ ) 2 − n ( X − µ ) 2 ] i =1 n = E[∑ (X i − µ ) 2 ] − nE[( X − µ ) 2 ] i =1 σ2 1 2 1 n = nσ 2 − n n U = 2 n −1 S = ∑ n − 1 i =1 (X i − X ) 2 = (n − 1)σ 2 1 1 E[U ] = 2 E[ S ] = 2 (n − 1)σ 2 = σ 2 n −1 n −1
  • 33. 区間推定 interval estimation ˆ ˆ (θ L ,θU ) X 1 , X 2 ,..., X n 区間     をデータ          に基づいてθˆ ( X , X ,..., X ),θˆ ( X , X ,..., X )) ˆ ˆ (θ L ,θU ) = ( L 1 2 n U 1 2 n と定める 区間の幅 θˆU − θˆL 定めた区間に母数がはいる確率 ˆ ˆ Pr(θ L < θ < θ U )
  • 34. 信頼度  confidence level 「区間の幅は狭く、確率は大きく」 同時には満たせない 条件付で考える 「確率は最低限(悪くとも) 1-α 」以上という 条件のもとで、幅を最少にするように定める この確率 1-α を信頼度という。 定めた区間を信頼区間 (confidence interval) とい う
  • 35. 区間推定の定式化 標本  X 1 , X 2 ,  , X n の関数として区間の端点を定める。 (θ L ,θ U ) = (θ L ( X 1 , X 2 ,  , X n ),θ U ( X 1 , X 2 ,  , X n )) このとき     θ L < θ < θ U ) ≥ 1 − α Pr( という条件の下で。区間の幅   θ U − θ L ⇒ 最小化
  • 37. 正規分布の母平均 μ の区間推定 X 1 , X 2 , , X n ~ NID( µ , σ 2 ) 0.4 1 n σ2 X = ∑ X i ~ N (µ , ) 0.3 dnorm (x) n i =1 n 0.2 X −µ 0.1 Z= ~ N (0,1) 0.0 σ2 -3 -2 -1 0 x 1 2 3 n Pr(a < Z < b) = 1 − α 区間の幅が一番短くなるのは 左右対称にとった場合 Pr(− k < Z < k ) = 1 − α Pr( Z > kα / 2 ) = α / 2
  • 38. 正規分布の母平均 μ の区間推定 X 1 , X 2 , , X n ~ NID( µ , σ 2 ) 1 n σ2 X = ∑ X i ~ N (µ , ) n i =1 n X −µ Z= ~ N (0,1) σ2 n Pr(a < Z < b) = 1 − α Pr(− k < Z < k ) = 1 − α Pr( Z > kα / 2 ) = α / 2
  • 39. Pr(−kα / 2 < Z < kα / 2 ) = 1 − α σ2 Pr(−kα / 2 < ( X − µ) / < kα / 2 ) = 1 − α n σ2 σ2 Pr(−kα / 2 < X − µ < kα / 2 ) = 1−α n n σ2 σ2 Pr(− X − kα / 2 < − µ < − X + kα / 2 ) = 1−α n n σ2 σ2 Pr( X − kα / 2 < µ < X + kα / 2 ) = 1−α n n 信頼区間 σ2 σ2 σ2    − kα / 2 (X , X + kα / 2 )  X ± kα / 2 n n n
  • 40. 本番 100 > r <- sim.conf.interval(100, 10, 0.95) 80 > r[apply(r, 1, prod) > 0, ] 60 [,1] [,2] [1,] -1.257169 -0.01757909 gy [2,] -1.300771 -0.06118130 40 [3,] -1.323769 -0.08417887 [4,] -1.415869 -0.17627881 > (1:100)[apply(r, 1, prod) > 0] 20 [1] 48 64 96 99 > plot.conf.interval(r) 0 -2 -1 0 1 2 gx
  • 41. 正規分布の母平均 μ の区間推定 (母分散が未知の場合) X 1 , X 2 ,, X n ~ N ( µ , σ 2 ) 母分 1 n σ2 X −µ 散 σ2 X = ∑ X i ~ N ( µ , ),   Z = ~N (0,1) n i =1 n σ2 /n の代 わり Pr(−kα / 2 < Z < kα / 2 ) = 1 − α に推 定値 X −µ Pr(−kα / 2 < < kα / 2 ) = 1 − α u2 を σ /n 2 代入 Pr( X − kα / 2 σ 2 / n < µ < X + kα / 2 σ 2 / n ) = 1 − α しよ σ2 σ2 う [ X − kα / 2 , X + kα / 2 ]  n n
  • 42. 自由度 n-1 の t- 分布 X −µ Z= ~N (0,1) 0.4 σ /n 2 0.3 X −µ T= ~ t n −1 密度関数 u2 / n 0.2 0.1 自由度mのt分布の密度関数 0.0 m +1 m +1 Γ( -3 -2 -1 0 1 2 3 )  − x2  2 x f m ( x) = 2 1 +  黒:標準正規分布 m  m 赤:自由度9 t分布 mπ Γ( )   青:自由度3 t分布 2
  • 44. 自由度10 上側確率 0.025 0.4 0.3 dt(x, 10) 0.2 0.1 0.0 -4 -2 0 2 4 Pr(T > 2.2281) = 0.025 x Pr(| T |> 2.2281) = 0.025 × 2 = 0.05 t10 (0.025) = 2.2281
  • 45. 自由度 8  両側確率 0.1 0.4 0.3 dt(x, 8) 0.2 0.1 0.0 -4 -2 0 2 4 x 両側確率   T |> 1.8595) = 0.05 × 2 = 0.1 Pr(| 上側確率   T > 1.8595) = 0.05 Pr( 下側確率   T < −1.8595) = 0.05 Pr( t8 (0.05) = 1.8595
  • 46. X −µ Z= ~N (0,1) σ /n2 Pr(−kα / 2 < Z < kα / 2 ) = 1 − α Pr( X − kα / 2 σ 2 / n < µ < X + kα / 2 σ 2 / n ) = 1 − α X −µ T= ~ t n −1 u2 / n Pr(−t n −1 (α / 2) < T < t n −1 (α / 2)) = 1 − α u2 u2 Pr( X − t n −1 (α / 2) < µ < X + t n −1 (α / 2) ) = 1−α n n 信頼区間 u2 u2 [ X − t n −1 (α / 2) , X + t n −1 (α / 2) ] n n
  • 47. 区間推定のシミュレーション (分散未知) > t.test(rnorm(10), conf.level=0.95) One Sample t-test data: rnorm(10) t = -1.0439, df = 9, p-value = 0.3237 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -0.9129610 0.3364108 sample estimates: mean of x -0.2882751 > t.test(rnorm(10), conf.level=0.95)$conf.int [1] -0.4416194 1.4037247 attr(,"conf.level") [1] 0.95
  • 48. n=10 、 1-α=0.95 、 σ 2 = 未 知 > sim.t.conf.interval <- function(nsim, n, conf) { + result <- c() + for (i in 1:nsim){ 100 + result <- rbind(result, t.test(rnorm(n), conf.level=conf)$conf.int) + } + result 80 +} > set.seed(1231) > rt<-sim.t.conf.interval(100,10,0.95) 60 > rt[apply(rt,1,prod)>0,] [,1] [,2] gy [1,] -0.99062123 -0.12569906 40 [2,] -1.10211619 -0.03000526 [3,] -0.54445510 -0.01016643 [4,] 0.01700083 1.08047258 20 > which(apply(rt,1,prod)>0) [1] 32 69 72 93 > plot.conf.interval(rt) 0 -2 -1 0 1 2 gx
  • 49. 2つの信頼区間の比較 100 100 80 80 60 60 gy gy 40 40 20 20 0 0 -2 -1 0 1 2 -2 -1 0 1 2 gx gx