Enviar búsqueda
Cargar
データ解析のための統計モデリング入門3章後半
•
10 recomendaciones
•
5,171 vistas
Shinya Akiba
Seguir
Datos y análisis
Denunciar
Compartir
Denunciar
Compartir
1 de 27
Descargar ahora
Descargar para leer sin conexión
Recomendados
みどりぼん3章前半
みどりぼん3章前半
Akifumi Eguchi
データ解析のための統計モデリング入門 6.5章 後半
データ解析のための統計モデリング入門 6.5章 後半
Yurie Oka
みどりぼん読書会 第4章
みどりぼん読書会 第4章
Masanori Takano
第六回「データ解析のための統計モデリング入門」前半
第六回「データ解析のための統計モデリング入門」前半
Atsushi Hayakawa
データ解析のための統計モデリング入門4章
データ解析のための統計モデリング入門4章
Hirofumi Tsuruta
[The Elements of Statistical Learning]Chapter8: Model Inferennce and Averaging
[The Elements of Statistical Learning]Chapter8: Model Inferennce and Averaging
Yu Otsuka
幾何を使った統計のはなし
幾何を使った統計のはなし
Toru Imai
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
Masaru Tokuoka
Recomendados
みどりぼん3章前半
みどりぼん3章前半
Akifumi Eguchi
データ解析のための統計モデリング入門 6.5章 後半
データ解析のための統計モデリング入門 6.5章 後半
Yurie Oka
みどりぼん読書会 第4章
みどりぼん読書会 第4章
Masanori Takano
第六回「データ解析のための統計モデリング入門」前半
第六回「データ解析のための統計モデリング入門」前半
Atsushi Hayakawa
データ解析のための統計モデリング入門4章
データ解析のための統計モデリング入門4章
Hirofumi Tsuruta
[The Elements of Statistical Learning]Chapter8: Model Inferennce and Averaging
[The Elements of Statistical Learning]Chapter8: Model Inferennce and Averaging
Yu Otsuka
幾何を使った統計のはなし
幾何を使った統計のはなし
Toru Imai
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
Masaru Tokuoka
Maeshori missing
Maeshori missing
Daisuke Ichikawa
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
Zansa
PRML読み会第一章
PRML読み会第一章
Takushi Miki
kagamicomput201708
kagamicomput201708
swkagami
統計的学習の基礎_3章
統計的学習の基礎_3章
Shoichi Taguchi
カステラ本勉強会 第三回 補足
カステラ本勉強会 第三回 補足
ke beck
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能
Hiroshi Nakagawa
ガウス過程回帰の導出 ( GPR : Gaussian Process Regression )
ガウス過程回帰の導出 ( GPR : Gaussian Process Regression )
Kenji Urai
ma92007id395
ma92007id395
matsushimalab
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
Kei Nakagawa
データ解析5 単回帰分析
データ解析5 単回帰分析
Hirotaka Hachiya
パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩
t_ichioka_sg
カステラ本勉強会 第三回
カステラ本勉強会 第三回
ke beck
統計的学習の基礎 3章前半
統計的学習の基礎 3章前半
Kazunori Miyanishi
PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論
Akihiro Nitta
PRML8章
PRML8章
弘毅 露崎
PRML復々習レーン#11
PRML復々習レーン#11
Takuya Fukagai
kagamicomput201709
kagamicomput201709
swkagami
ビジネス活用事例で学ぶデータサイエンス入門 #2
ビジネス活用事例で学ぶデータサイエンス入門 #2
you shimajiro
[読会]Logistic regression models for aggregated data
[読会]Logistic regression models for aggregated data
shima o
データ解析のための統計モデリング入門 1~2章
データ解析のための統計モデリング入門 1~2章
itoyan110
Research cafe018 20150529_handouts_share
Research cafe018 20150529_handouts_share
Shuhei Ichikawa
Más contenido relacionado
La actualidad más candente
Maeshori missing
Maeshori missing
Daisuke Ichikawa
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
Zansa
PRML読み会第一章
PRML読み会第一章
Takushi Miki
kagamicomput201708
kagamicomput201708
swkagami
統計的学習の基礎_3章
統計的学習の基礎_3章
Shoichi Taguchi
カステラ本勉強会 第三回 補足
カステラ本勉強会 第三回 補足
ke beck
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能
Hiroshi Nakagawa
ガウス過程回帰の導出 ( GPR : Gaussian Process Regression )
ガウス過程回帰の導出 ( GPR : Gaussian Process Regression )
Kenji Urai
ma92007id395
ma92007id395
matsushimalab
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
Kei Nakagawa
データ解析5 単回帰分析
データ解析5 単回帰分析
Hirotaka Hachiya
パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩
t_ichioka_sg
カステラ本勉強会 第三回
カステラ本勉強会 第三回
ke beck
統計的学習の基礎 3章前半
統計的学習の基礎 3章前半
Kazunori Miyanishi
PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論
Akihiro Nitta
PRML8章
PRML8章
弘毅 露崎
PRML復々習レーン#11
PRML復々習レーン#11
Takuya Fukagai
kagamicomput201709
kagamicomput201709
swkagami
ビジネス活用事例で学ぶデータサイエンス入門 #2
ビジネス活用事例で学ぶデータサイエンス入門 #2
you shimajiro
[読会]Logistic regression models for aggregated data
[読会]Logistic regression models for aggregated data
shima o
La actualidad más candente
(20)
Maeshori missing
Maeshori missing
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
PRML読み会第一章
PRML読み会第一章
kagamicomput201708
kagamicomput201708
統計的学習の基礎_3章
統計的学習の基礎_3章
カステラ本勉強会 第三回 補足
カステラ本勉強会 第三回 補足
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能
ガウス過程回帰の導出 ( GPR : Gaussian Process Regression )
ガウス過程回帰の導出 ( GPR : Gaussian Process Regression )
ma92007id395
ma92007id395
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
データ解析5 単回帰分析
データ解析5 単回帰分析
パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩
カステラ本勉強会 第三回
カステラ本勉強会 第三回
統計的学習の基礎 3章前半
統計的学習の基礎 3章前半
PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論
PRML8章
PRML8章
PRML復々習レーン#11
PRML復々習レーン#11
kagamicomput201709
kagamicomput201709
ビジネス活用事例で学ぶデータサイエンス入門 #2
ビジネス活用事例で学ぶデータサイエンス入門 #2
[読会]Logistic regression models for aggregated data
[読会]Logistic regression models for aggregated data
Destacado
データ解析のための統計モデリング入門 1~2章
データ解析のための統計モデリング入門 1~2章
itoyan110
Research cafe018 20150529_handouts_share
Research cafe018 20150529_handouts_share
Shuhei Ichikawa
GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219
Shuhei Ichikawa
Cluster Analysis at REQUIRE 26, 2016/10/01
Cluster Analysis at REQUIRE 26, 2016/10/01
Shuhei Ichikawa
Awkでeffective前処理
Awkでeffective前処理
Shinya Akiba
Require19_04-accesibility_20150320_update
Require19_04-accesibility_20150320_update
Shuhei Ichikawa
03 「重回帰分析」の入門
03 「重回帰分析」の入門
Shuhei Ichikawa
データ解析のための統計モデリング入門10章前半
データ解析のための統計モデリング入門10章前半
Shinya Akiba
トピックモデルによる統計的潜在意味解析 2章後半
トピックモデルによる統計的潜在意味解析 2章後半
Shinya Akiba
Destacado
(9)
データ解析のための統計モデリング入門 1~2章
データ解析のための統計モデリング入門 1~2章
Research cafe018 20150529_handouts_share
Research cafe018 20150529_handouts_share
GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219
Cluster Analysis at REQUIRE 26, 2016/10/01
Cluster Analysis at REQUIRE 26, 2016/10/01
Awkでeffective前処理
Awkでeffective前処理
Require19_04-accesibility_20150320_update
Require19_04-accesibility_20150320_update
03 「重回帰分析」の入門
03 「重回帰分析」の入門
データ解析のための統計モデリング入門10章前半
データ解析のための統計モデリング入門10章前半
トピックモデルによる統計的潜在意味解析 2章後半
トピックモデルによる統計的潜在意味解析 2章後半
Similar a データ解析のための統計モデリング入門3章後半
Pythonによる機械学習
Pythonによる機械学習
Kimikazu Kato
Analyze by StatsModels or Numpy
Analyze by StatsModels or Numpy
Toshiki NOGUCHI
実践データ分析基礎
実践データ分析基礎
TOSHI STATS Co.,Ltd.
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
能動学習による多関係データセットの構築
能動学習による多関係データセットの構築
Hiroshi Kajino
Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
osamu morimoto
PRML第3章_3.3-3.4
PRML第3章_3.3-3.4
Takashi Tamura
「現実世界に活かす数学」 (麻布高等学校、教養総合、数学講義 5 回目)
「現実世界に活かす数学」 (麻布高等学校、教養総合、数学講義 5 回目)
Kensuke Otsuki
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
Kensuke Otsuki
Math in Machine Learning / PCA and SVD with Applications
Math in Machine Learning / PCA and SVD with Applications
Kenji Hiranabe
Data-Intensive Text Processing with MapReduce ch6.1
Data-Intensive Text Processing with MapReduce ch6.1
Sho Shimauchi
NagoyaStat#7 StanとRでベイズ統計モデリング(アヒル本)4章の発表資料
NagoyaStat#7 StanとRでベイズ統計モデリング(アヒル本)4章の発表資料
nishioka1
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
データ入力が終わってから分析前にすること
データ入力が終わってから分析前にすること
Masaru Tokuoka
コース導入講義(荒木)
コース導入講義(荒木)
Faculty of Economics, Momoyama Gakuin University
20191117_choco_bayes_pub
20191117_choco_bayes_pub
Yoichi Tokita
Lasso
Lasso
Akihiro Shiroshita
おしゃスタ@リクルート
おしゃスタ@リクルート
Issei Kurahashi
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
horihorio
論理と計算のしくみ 5.3 型付きλ計算 (前半)
論理と計算のしくみ 5.3 型付きλ計算 (前半)
Lintaro Ina
Similar a データ解析のための統計モデリング入門3章後半
(20)
Pythonによる機械学習
Pythonによる機械学習
Analyze by StatsModels or Numpy
Analyze by StatsModels or Numpy
実践データ分析基礎
実践データ分析基礎
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
能動学習による多関係データセットの構築
能動学習による多関係データセットの構築
Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
PRML第3章_3.3-3.4
PRML第3章_3.3-3.4
「現実世界に活かす数学」 (麻布高等学校、教養総合、数学講義 5 回目)
「現実世界に活かす数学」 (麻布高等学校、教養総合、数学講義 5 回目)
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
Math in Machine Learning / PCA and SVD with Applications
Math in Machine Learning / PCA and SVD with Applications
Data-Intensive Text Processing with MapReduce ch6.1
Data-Intensive Text Processing with MapReduce ch6.1
NagoyaStat#7 StanとRでベイズ統計モデリング(アヒル本)4章の発表資料
NagoyaStat#7 StanとRでベイズ統計モデリング(アヒル本)4章の発表資料
順序データでもベイズモデリング
順序データでもベイズモデリング
データ入力が終わってから分析前にすること
データ入力が終わってから分析前にすること
コース導入講義(荒木)
コース導入講義(荒木)
20191117_choco_bayes_pub
20191117_choco_bayes_pub
Lasso
Lasso
おしゃスタ@リクルート
おしゃスタ@リクルート
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
論理と計算のしくみ 5.3 型付きλ計算 (前半)
論理と計算のしくみ 5.3 型付きλ計算 (前半)
データ解析のための統計モデリング入門3章後半
1.
データ解析のための統計モデリング⼊入⾨門 ⼀一般化線形モデル(GLM) 3.5
~∼ 3.8 Shinya AKiba 2014/06/10
2.
About me ○研究テーマ
スペースデブリの軌道設計 Deeplearningを⽤用いた画像認識識 <-‐‑‒ いまここ ○バイト ALBERT -‐‑‒ 集計、分析のお仕事。最近はクラスタリング。 ○趣味とか ラグビー、Python、お酒、⿇麻雀 @aki_̲n1wa 秋庭 伸也 早稲⽥田⼤大学 -‐‑‒ 機械科学専攻 M2
3.
OUTLINE □これまでの話 □統計モデルの設計
-‐‑‒ 3.5 因⼦子型の統計モデル -‐‑‒ 3.6 数量量型 + 因⼦子型の統計モデル □「あてはまりのよさ」とは □3.7「何でも正規分布」「何でも直線」には無理理がある □3.8 まとめ
4.
OUTLINE □これまでの話 □統計モデルの設計
-‐‑‒ 3.5 因⼦子型の統計モデル -‐‑‒ 3.6 数量量型 + 因⼦子型の統計モデル □「あてはまりのよさ」とは □3.7「何でも正規分布」「何でも直線」には無理理がある □3.8 まとめ
5.
○2章
-‐‑‒ Rの使い⽅方(summary()、hist()など) -‐‑‒ 統計モデルの選択(ポアソン分布) -‐‑‒ 最尤推定(統計モデルのパラメータ推定) 「データ解析のための統計モデリング入門」サポートWebサイトより引用 http://hosho.ees.hokudai.ac.jp/ kubo/ce/IwanamiBook.html 2章はRで最尤推定を やってみようという話でした。 これまでの話 ○3章 -‐‑‒ Rの使い⽅方(glm()) -‐‑‒ 統計モデルの選択(ポアソン分布) -‐‑‒ 最尤推定(統計モデルのパラメータ推定) メモ:施肥の読み⽅方 -‐‑‒> せひ
6.
「データ解析のための統計モデリング入門」サポートWebサイトより引用 http://hosho.ees.hokudai.ac.jp/ kubo/ce/IwanamiBook.html Rの関数:glm()を使って 統計モデルを設計し、
統計モデルごとに対数尤度度を 計算、⽐比較する。 これまでの話 ○2章 -‐‑‒ Rの使い⽅方(summary()、hist()など) -‐‑‒ 統計モデルの選択(ポアソン分布) -‐‑‒ 最尤推定(統計モデルのパラメータ推定) ○3章 -‐‑‒ Rの使い⽅方(glm()) -‐‑‒ glm()で統計モデルの設計 -‐‑‒ 統計モデルごとに対数尤度度を⽐比較 (general) linear model : (一般)線形モデル generalized linear model : 一般化線形モデル
7.
OUTLINE □これまでの話 □統計モデルの設計
-‐‑‒ 3.5 因⼦子型の統計モデル -‐‑‒ 3.6 数量量型 + 因⼦子型の統計モデル □「あてはまりのよさ」とは □3.7「何でも正規分布」「何でも直線」には無理理がある □3.8 まとめ
8.
統計モデルの設計 3.4 3.6で、いろんな説明変数の組み合わせを考える。 線形予測子 体サイズ:x
施肥処理:f 3.4 ○ 3.5 ○ 3.6 ○ ○ 採用する説明変数
9.
3.5 説明変数が因⼦子型の統計モデル 「種⼦子の数:y
と施肥処理理(有無):f に関係がある」という仮定 fit.f <-‐‑‒ glm(y ~∼ f, data=d, family=poisson) 0 (施肥処理理無し) 1 (施肥処理理有り) p.56 本⽂文より ・「肥料料をやると平均種⼦子数がほんの少しだけ増える」と予測している。 線形予測⼦子: パラメータの推定値: 最大対数尤度: -237.627
10.
3.6 説明変数が数量量型+因⼦子型の統計モデル 「種⼦子の数:y
と(体サイズ:x、施肥処理理(有無):f) に関係がある」という仮定 fit.all <-‐‑‒ glm(y ~∼ x+f, data=d, family=poisson) p.58 本⽂文より ・このモデルではマイナス(肥料料の効果)だと推定されています。 ! 3.6.1の対数リンク関数については、p.60の図3.8を参照。 線形予測⼦子: パラメータの推定値: 最大対数尤度: -236.294
11.
OUTLINE □これまでの話 □統計モデルの設計
-‐‑‒ 3.5 因⼦子型の統計モデル -‐‑‒ 3.6 数量量型 + 因⼦子型の統計モデル □「あてはまりのよさ」とは □3.7「何でも正規分布」「何でも直線」には無理理がある □3.8 まとめ
12.
「あてはまりのよさ」とは 3.4 ~∼ 3.6で、計算している「あてはまりのよさ」とは??
-‐‑‒> 統計モデルが、観測データにフィットしているか 次数 対数尤度 2 -234.28 3 -234.21 4 -234.12 … … 10 -230.48 (※)「あてはまりのよさ」-‐‑‒> Goodness to fit 参考:http://en.wikipedia.org/wiki/Goodness_̲of_̲fit 線形予測⼦子の次数を増やしていくと… fit.2 <-‐‑‒ glm(y ~∼ I(x)+I(x^2)+f, data = d, family=poisson) fit.3 <-‐‑‒ glm(y ~∼ I(x)+I(x^2)+I(x^3)+f, data = d, family=poisson) … 次数が増えるにつれて、 対数尤度が大きくなっている→
13.
次数 対数尤度 2 -234.28 3
-234.21 4 -234.12 … … 10 -230.48 分かったお! とにかく次数を おおきくすればいいお!! 3.4 ~∼ 3.6で、計算している「あてはまりのよさ」とは?? -‐‑‒> 統計モデルが、観測データにフィットしているか 線形予測⼦子の次数を増やしていくと… fit.2 <-‐‑‒ glm(y ~∼ I(x)+I(x^2)+f, data = d, family=poisson) fit.3 <-‐‑‒ glm(y ~∼ I(x)+I(x^2)+I(x^3)+f, data = d, family=poisson) … 次数が増えるにつれて、 対数尤度が大きくなっている→ 「あてはまりのよさ」とは
14.
fit.10 <-‐‑‒ glm(y
~∼ I(x)+I(x^2)+I(x^3)+I(x^4)+I(x^5) +I(x^6)+I(x^7)+I(x^8)+I(x^9)+I(x^10)+f, data = d, family=poisson) 10次式でモデルを作るお!! 「あてはまりのよさ」とは
15.
7 8 9
10 11 12 2468101214 d$x d$y くねくねだお.. 「あてはまりのよさ」とは fit.10 <-‐‑‒ glm(y ~∼ I(x)+I(x^2)+I(x^3)+I(x^4)+I(x^5) +I(x^6)+I(x^7)+I(x^8)+I(x^9)+I(x^10)+f, data = d, family=poisson)
16.
7 8 9
10 11 12 2468101214 d$x d$y P.60 本⽂文より ・「妥当なモデル」かどうかは、あてはまりの良良しあし だけで決まる問題ではありません。 ・数式が現象をどのように表現しているのかという点に 注意しながら統計モデルを設計する。 「あてはまりのよさ」とは fit.10 <-‐‑‒ glm(y ~∼ I(x)+I(x^2)+I(x^3)+I(x^4)+I(x^5) +I(x^6)+I(x^7)+I(x^8)+I(x^9)+I(x^10)+f, data = d, family=poisson) くねくねだお..
17.
OUTLINE □これまでの話 □統計モデルの設計
-‐‑‒ 3.5 因⼦子型の統計モデル -‐‑‒ 3.6 数量量型 + 因⼦子型の統計モデル □「あてはまりのよさ」とは □3.7「何でも正規分布」「何でも直線」には無理理がある □3.8 まとめ
18.
3.7「何でも正規分布」「何でも直線」には無理理がある p.61 図3.9 架空データに対するLM, GLMの適用 ! p.62
本文より LM -> 何でも正規分布、x と y は直線関係 GLM(ポアソン分布) -> カウントデータ、yのばらつきは平均とともに増加
19.
3.7「何でも正規分布」「何でも直線」には無理理がある 何でも正規分布じゃだめか? -‐‑‒> 実際のデータで試してみましょう。
! 前回の話 「ポアソン分布に従うもの」-‐‑‒> サッカーのゴール数では? https://github.com/openfootball/world-cup githubにデータあった↓ World Cupのゴール数を調べてみよう。
20.
3.7「何でも正規分布」「何でも直線」には無理理がある 1930年年ウルグアイ⼤大会から2010年年南ア⼤大会までのcup.txtで ⼀一試合ごとの得点を集計する。(ソビエト、ユーゴスラビアなどは除いています) Histogram of
brazil$score1 brazil$score1 Frequency 0 2 4 6 8 05101520 ブラジル代表 データがたくさんあるので ブラジル代表を使います。
21.
3.7「何でも正規分布」「何でも直線」には無理理がある Histogram of brazil$score1 brazil$score1 Frequency 0
2 4 6 8 05101520 ブラジル代表 ⽇日本代表 Histogram of japan$score1 japan$score1 Frequency 0 2 4 6 8 05101520 1930年年ウルグアイ⼤大会から2010年年南ア⼤大会までのcup.txtで ⼀一試合ごとの得点を集計する。(ソビエト、ユーゴスラビアなどは除いています) ちなみにジャパンは
22.
3.7「何でも正規分布」「何でも直線」には無理理がある 統計モデルの仮定:⼀一試合のゴール数とFIFAランキングのポイント差に関係がある。 team1,score1,pts1,team2,score2,pts2,diff Brazil,1,1242,Algeria,0,858,384 Brazil,0,1242,Argentina,0,1175,67 Brazil,2,1242,Argentina,1,1175,67 Brazil,3,1242,Argentina,1,1175,67 Brazil,2,1242,Australia,0,526,716 Brazil,1,1242,Austria,0,643,599 Brazil,3,1242,Austria,0,643,599 Brazil,4,1242,Bolivia,0,483,759 Brazil,2,1242,Bulgaria,0,425,817 Brazil,3,1242,Cameroon,0,558,684 Brazil,4,1242,Chile,2,1026,216 … 『前処理理したデータ』 (※)1930年年の試合にも現在のポイントを 適⽤用しています…orz。ブラジルは昔から強いからいいかな。 http://www.fifa.com/worldranking/rankingtable/ 2014/06/10時点でのランキング
23.
3.7「何でも正規分布」「何でも直線」には無理理がある -200 0 200
400 600 800 01234567 x$diff x$score1 1950年ブラジル大会 vs スウェーデン FIFAランキングポイントの差 一試合の得点
24.
3.7「何でも正規分布」「何でも直線」には無理理がある 統計モデルの仮定:⼀一試合のゴール数とFIFAランキングのポイント差に関係がある。 brazil.lm <-‐‑‒ lm(d$score1~∼d$diff)
brazil.glm <-‐‑‒ glm(d$score1~∼d$diff, family=poisson) -200 0 200 400 600 800 02468 xx -200 0 200 400 600 800 02468 d$diff -200 0 200 400 600 800 02468 d$diff -200 0 200 400 600 800 02468 xx 線形モデル 一般化線形モデル
25.
3.7「何でも正規分布」「何でも直線」には無理理がある 統計モデルの仮定:⼀一試合のゴール数とFIFAランキングのポイント差に関係がある。 brazil.lm <-‐‑‒ lm(d$score1~∼d$diff)
brazil.glm <-‐‑‒ glm(d$score1~∼d$diff, family=poisson) -200 0 200 400 600 800 02468 xx -200 0 200 400 600 800 02468 d$diff -200 0 200 400 600 800 02468 d$diff -200 0 200 400 600 800 02468 xx 線形モデル 一般化線形モデル マイナスの得点が予測されてしまう
26.
3.8 まとめ □「あてはまりのよさ」≠「よい統計モデル」
-‐‑‒ あてはまりがよい -‐‑‒> 対数尤度度が⼤大きい ! □ 観測するデータを説明する妥当なモデルを選ぶ -‐‑‒ 種⼦子データならポアソン分布(が妥当っぽい) よい統計モデルの選び⽅方 -‐‑‒> 4章~∼ パラメータ推定 -‐‑‒> 8章~∼
27.
ご清聴ありがとうございました
Descargar ahora