SlideShare una empresa de Scribd logo
1 de 35
Descargar para leer sin conexión
統計学入門
第三回 様々なデータの分布
慶應義塾大学 大学院 野寺研究室 松尾洋一
自己紹介
松尾洋一
 慶應義塾大学大学院 理工学研究科 基礎理工学専攻
 野寺研究室 修士1年

 専門:数学・数値計算
 研究:Block Gram-Schmidt法のblock-sizeの決定手法



 今年の目標:サブ4                            よろしくね!!
     ≅ 34秒/100
    自転車と同じくらい
                                                2


                         “facebook”
さて,みなさん.

今日の内容に入る前に・・・




前回の内容を覚えています
か??
                3
今日やること
前回の復習
 正規分布
 二項分布

 様々な分布
  正規分布と中心極限定理
  ポアソン分布
  指数分布          4
正規分布
     平均と分散で決まる.
                 0.9


                 0.8


                 0.7


                 0.6


                 0.5                   N(0,1)
                                       N(0,0.5)
                 0.4                   N(0,2)
                                       N(-2,1)
                 0.3


                 0.2


                 0.1                              5

                  0
-6     -4   -2         0   2   4   6
正規分布


       正規分布
        の役割

          他分布の
確率モデル
           近似    6
正規分布が表す現象
正規分布に似ている??
                   男子大学生100人の身長データ
                   男子大学生   人の身長データ
 25




 20




 15


                                                                  人数
 10




  5




  0
      158   161   164   167   170   173   176   179   182   185
                                                                       7
正規分布
さまざまな現実現象の分布を表す!!
 測定誤差の分布
 生体物の形態に関する測定値
 管理状態で生産される製品の特性値


平均 と分散   から決定される
 データのばらつきの度合い




データから,平均と分散を計算するんや!!
                       8
正規分布が表す現象
このデータから正規分布を計算
                   男子大学生100人の身長データ
                   男子大学生   人の身長データ
 25




 20




 15


                                                                  人数
 10




  5




  0
      158   161   164   167   170   173   176   179   182   185
                                                                       9
正規分布
20歳男子の身長は平均170cm,分散64で近似できる.

次のことがわかる.
 身長が180cm以上の人の割合は?
 Ans.
 (180-170)/8=1.25
 Q(1.25)=0.1056 より,11%程度


 一般的に高身長(上位2割とする)になるためには,何cm必
 要?
 Ans.
 Q(0.2)=0.842,                          10
 (a-170)/8=0.845, a=176.76 より,177cm程度
正規分布


       正規分布
        の役割

          他分布の
確率モデル
           近似    11
二項分布
       標本数nと確率pによって決まる.
0.16


0.14


0.12


 0.1

                                         B(50,0.5)
0.08
                                         B(50,0.25)
                                         B(50,0.80)
0.06


0.04


0.02
                                                      12
  0
       0   10   20   30   40   50   60
二項分布
二つの項目をn回行った場合の分布
 コイン投げの表裏:p=0.5
 アンケートに対する,賛成p/反対(1-p),という回答
 不良率がpの,非常に大きい数の製品の集まりの中から,n
 個の製品を無作為に取り出したとき,その中に含まれる不良
 品の個数x


pが0,1に極めて近い値でないならば, nが大きいとき正
規分布による近似が可能


                               13
二項分布
    正規分布による近似
                        回のコイン投げの分布
                      50回のコイン投げの分布
0.12



 0.1



0.08



0.06

                                               B(50,0.5)

0.04



0.02



   0                                                       14
        0   10   20      30   40     50   60


-0.02
世の中の現象って,だいた
い正規分布になりそう.
「中心が一番高くて,左右対称」


  他の分布を勉強する
    必要ってあるの??
                  15
正規分布は万能??
19世紀
         正規分布は全ての現実現象をモデル化できる!!
              「正規分布万能主義」




           中心極限定理
           同じ現象に従うデータはどんなものであれ,
           データの数を多くすれば正規分布になる.
   ガウス




20世紀以降
    つまり,ほかの分布は勉強しなくていい!!ヤター!!     16
 「それはうそだ.むしろ正規分布にならない方が多い!!」
その他の分布
正規分布が最も一般的であるが,全てを正規分布で表
せるわけではない.

それぞれの分布が,それぞれ別々の現実現象を表す
確率モデルである.

いろいろな分布を知っていれば,データの組が与えら
れたとき,どのような分布に従うか推測,検証することが
できる.

         他の分布についてもお勉強するお     17
その他の分布を紹介する前に,,,
2つの分布の具体例をみた.

では,より一般に,グラフの形はどう表されるのか??
 平均µ,分散     ,標本数nなどであらわされる.
  文字は何でも良いが,伝統的にこれが使われる.

 正規分布:                    二項分布:

             :値 オイラー数と呼ばれている.


 例:平均0,分散1の正規分布

    1.2のとき,f x   0.1942           18
N(0,1)
               0.45


                0.4


               0.35


                0.3


               0.25
                                   f(x)=0.1941
                                                     N(0,1)
                0.2


               0.15


                0.1


               0.05


                 0
-6   -4   -2          0             2        4   6

                          x=1.2
                                                              19
ポアソン分布
稀現象の生起回数
 起こることが頻繁ではない事象の一定時間内の生起回数
 1時間の交通事故の件数
 1時間の機械の故障回数
 1時間の電話の呼び出し回数
 1枚の生地のキズの個数


どのようなグラフか?
 平均 ,分散


                             20
 に従う分布.
ポアソン分布
          ポアソン分布のグラフ
0.7



0.6



0.5



0.4                                                      Po(1)
                                                         Po(0.5)
                                                         Po(2.0)
0.3
                                                         Po(10)


0.2



0.1
                                                                   21

 0
      0    2   4   6   8   10   12   14   16   18   20
ポアソン分布
馬にけられて死んだプロシャ軍兵士の数
 ポーランドの統計学者が20年間にわたり,ポロ者の10軍団で
 1年間に馬にけられて死んだ兵士の数のデータを調べた.

      年間の
     1年間の    回数         確率                  の
                                     P(0.61)の
     死者数                             確率
         0        109        0.545     0.5434
         1        65         0.325     0.3314
         2        22         0.110     0.1011
         3         3         0.015     0.0206
         4         1         0.005     0.0031
      5以上          0         0.000     0.0004
         計        200        1.000      1.000   22
ポアソン分布
グラフにしてみると・・・
 0.6


 0.5


 0.4


 0.3                                確率
                                    p(0.61)

 0.2


 0.1


  0
       0    1   2   3   4   5   6



           ほぼ一致!!                             23
           ポアソン分布が稀現象のモデルになることが証明された.
でも,それって本当?
  偶然の一致じゃないの?
 数学的に証明でき
   る??

            たまたますごく似ているだけ


ポアソン分布が稀な現象を
       表す理由・・・              24
ポアソン分布
稀現象の生起回数とは ~特徴~
例:一定時間内の事故の件数
 一定時間をn等分することを考える.
 1.nを十分大きくとれば,n等分された各区間で事故が2件
 以上起こる可能性は無視できて,1回起こるか,または1回も
 起こらないかのどちらかと考えられる.(稀少性)
 2.各区間で事故が起こる確率はpである.(一定性)
 3.ある区間で事故が起こるか否かは,他の区間で事故が起
 こるか否かとは無関係である.(独立性)


  これは,二項分布に従うと考えられる.
                                25
ポアソン分布
二項分布の極限(npを一定にしたままnをとても大きく
する)をとると,二項分布をポアソン分布で近似できる.

                             ,
         二項分布
                    ポアソン分布



  つまり,ポアソン分布は二項分布の特殊な場合
  (標本数nが大きいとき,二項分布の計算が非常に面倒になるから)

         “詳しくは,配布資料を参照のこと“          26
二項分布
正規分布で近似できない二項分布の例
          p=0.01 (0に近い)
                     B(50,0.01)
0.7


0.6


0.5


0.4

                                            B(50,0.01)
0.3


0.2


0.1


 0
      0         5     10          15   20
                                                         27
           ポアソン分布で近似できる.
指数分布
一定時間内の事故の件数がポアソン分布に従うとする.



ある事故が起きてから,次の事故が起こるまでの時間は
指数分布になる.

  生起間隔の分布を表す




                            28
指数分布
         ある一定時間に事故が起こる回数がポアソン分布に従
         うならば,その生起間隔は指数分布に従う.
12



10



8

                                                                 Ex(1)
6                                                                Ex(0.2)
                                                                 Ex(2.0)
                                                                 Ex(10)
4



2


                                                                           29
0
     0   0.2   0.4   0.6   0.8   1   1.2   1.4   1.6   1.8   2
指数分布
例:プロシャ軍のある兵士が馬に蹴られて死んだとき,3
年間誰も死なない確率は??
 Ans.




 つまり,0.4567となる.

 “なぜ,このように計算できるのかは,
    配布資料を参照のこと“
                             30
今日のまとめ!!
正規分布は最も重要であるが,万能ではない.

ポアソン分布は,稀に起こる現象の一定時間内の発生
回数を表す.

指数分布は,ポアソン分布に従う現象において,ある現
象が起きてから次の現象が起こるまでの経過時間を表
す.

二項分布・ポアソン分布・正規分布・指数分布が代表的
な分布.これを知っとけば,分布に関してはok!!    31
参考文献

「統計解析入門」 篠崎信雄著 サイエンス社




                        32
配布資料
二項分布とポアソン分布



       二項分布
              ポアソン分布


証明




                       33
配布資料
       nが大きくなれば, は無視できるほど小さくなる
証明




                   オイラー数の定義


                        証明終了




                                 34
配布資料
指数分布の計算
 1年間に馬に蹴られて死ぬ兵士の平均をθとすれば,a年間
 に死ぬ兵士の数の平均はaθ.
 よって,a年間に兵士が一人も死なない確率は,
 平均aθのポアソン分布で0という値の出る確率でり.

 で与えられる.兵士が一人が死んでから,
 次の兵士が死ぬ までの時間をxで表すとすると,
 xがaより大きいということは,a年間に兵士が誰も死なない
 ということである.よって


 となるが,分布関数と確率密度関数の関係から,これはxが
                                35
 指数分布に従うことを示している.

Más contenido relacionado

Destacado

The concept of religion
The concept of religionThe concept of religion
The concept of religionRobby Ocampo
 
Alhusn Alwaqi الحصن الواقي
Alhusn Alwaqi الحصن الواقيAlhusn Alwaqi الحصن الواقي
Alhusn Alwaqi الحصن الواقيAbdullah Muhammad
 
【Zansa】物理学はWebデータ分析に使えるか
【Zansa】物理学はWebデータ分析に使えるか【Zansa】物理学はWebデータ分析に使えるか
【Zansa】物理学はWebデータ分析に使えるかZansa
 
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.html
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.htmlZansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.html
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.htmlZansa
 
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
【Zansa】第12回勉強会 -PRMLからベイズの世界へ【Zansa】第12回勉強会 -PRMLからベイズの世界へ
【Zansa】第12回勉強会 -PRMLからベイズの世界へZansa
 
【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門Zansa
 
ベイズ入門
ベイズ入門ベイズ入門
ベイズ入門Zansa
 
Zansa第4回勉強会 重回帰分析
Zansa第4回勉強会 重回帰分析Zansa第4回勉強会 重回帰分析
Zansa第4回勉強会 重回帰分析Zansa
 
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-Zansa
 
المراهقون يتعلمون ما يعايشونه
المراهقون يتعلمون ما يعايشونهالمراهقون يتعلمون ما يعايشونه
المراهقون يتعلمون ما يعايشونهAbdullah Muhammad
 
121218 zansa13 for web
121218 zansa13 for web121218 zansa13 for web
121218 zansa13 for webZansa
 
Adobe Photoshop Shortcuts اختصارات فوتوشوب
Adobe Photoshop Shortcuts اختصارات فوتوشوبAdobe Photoshop Shortcuts اختصارات فوتوشوب
Adobe Photoshop Shortcuts اختصارات فوتوشوبAbdullah Muhammad
 
Teaching think skills (Ar) تعليم مهارات التفكير
Teaching think skills (Ar) تعليم مهارات التفكيرTeaching think skills (Ar) تعليم مهارات التفكير
Teaching think skills (Ar) تعليم مهارات التفكيرAbdullah Muhammad
 

Destacado (15)

The concept of religion
The concept of religionThe concept of religion
The concept of religion
 
Alhusn Alwaqi الحصن الواقي
Alhusn Alwaqi الحصن الواقيAlhusn Alwaqi الحصن الواقي
Alhusn Alwaqi الحصن الواقي
 
【Zansa】物理学はWebデータ分析に使えるか
【Zansa】物理学はWebデータ分析に使えるか【Zansa】物理学はWebデータ分析に使えるか
【Zansa】物理学はWebデータ分析に使えるか
 
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.html
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.htmlZansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.html
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.html
 
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
【Zansa】第12回勉強会 -PRMLからベイズの世界へ【Zansa】第12回勉強会 -PRMLからベイズの世界へ
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
 
【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門【Zansa】第17回 ブートストラップ法入門
【Zansa】第17回 ブートストラップ法入門
 
ベイズ入門
ベイズ入門ベイズ入門
ベイズ入門
 
Ks%20 eng
Ks%20 engKs%20 eng
Ks%20 eng
 
Zansa第4回勉強会 重回帰分析
Zansa第4回勉強会 重回帰分析Zansa第4回勉強会 重回帰分析
Zansa第4回勉強会 重回帰分析
 
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-
 
المراهقون يتعلمون ما يعايشونه
المراهقون يتعلمون ما يعايشونهالمراهقون يتعلمون ما يعايشونه
المراهقون يتعلمون ما يعايشونه
 
121218 zansa13 for web
121218 zansa13 for web121218 zansa13 for web
121218 zansa13 for web
 
Mouse (ar) الفـأرة
Mouse (ar) الفـأرةMouse (ar) الفـأرة
Mouse (ar) الفـأرة
 
Adobe Photoshop Shortcuts اختصارات فوتوشوب
Adobe Photoshop Shortcuts اختصارات فوتوشوبAdobe Photoshop Shortcuts اختصارات فوتوشوب
Adobe Photoshop Shortcuts اختصارات فوتوشوب
 
Teaching think skills (Ar) تعليم مهارات التفكير
Teaching think skills (Ar) تعليم مهارات التفكيرTeaching think skills (Ar) تعليم مهارات التفكير
Teaching think skills (Ar) تعليم مهارات التفكير
 

Similar a Zansa0130presentation

指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係Nagi Teramo
 
統計学復習01
統計学復習01統計学復習01
統計学復習01Daichi Ito
 
データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=4-2 確率と確率分布データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=4-2 確率と確率分布Seiichi Uchida
 
第5章 統計的仮説検定 (Rによるやさしい統計学)
第5章 統計的仮説検定 (Rによるやさしい統計学)第5章 統計的仮説検定 (Rによるやさしい統計学)
第5章 統計的仮説検定 (Rによるやさしい統計学)Prunus 1350
 
統計学基礎
統計学基礎統計学基礎
統計学基礎Yuka Ezura
 
統計的因果推論の理論と実践10章.pdf
統計的因果推論の理論と実践10章.pdf統計的因果推論の理論と実践10章.pdf
統計的因果推論の理論と実践10章.pdfYasutoTerasawa
 
第6章 2つの平均値を比較する - TokyoR #28
第6章 2つの平均値を比較する - TokyoR #28第6章 2つの平均値を比較する - TokyoR #28
第6章 2つの平均値を比較する - TokyoR #28horihorio
 
ポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむMasaru Tokuoka
 

Similar a Zansa0130presentation (10)

指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係
 
潜在クラス分析
潜在クラス分析潜在クラス分析
潜在クラス分析
 
T45 episteme
T45 epistemeT45 episteme
T45 episteme
 
統計学復習01
統計学復習01統計学復習01
統計学復習01
 
データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=4-2 確率と確率分布データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=4-2 確率と確率分布
 
第5章 統計的仮説検定 (Rによるやさしい統計学)
第5章 統計的仮説検定 (Rによるやさしい統計学)第5章 統計的仮説検定 (Rによるやさしい統計学)
第5章 統計的仮説検定 (Rによるやさしい統計学)
 
統計学基礎
統計学基礎統計学基礎
統計学基礎
 
統計的因果推論の理論と実践10章.pdf
統計的因果推論の理論と実践10章.pdf統計的因果推論の理論と実践10章.pdf
統計的因果推論の理論と実践10章.pdf
 
第6章 2つの平均値を比較する - TokyoR #28
第6章 2つの平均値を比較する - TokyoR #28第6章 2つの平均値を比較する - TokyoR #28
第6章 2つの平均値を比較する - TokyoR #28
 
ポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむ
 

Zansa0130presentation