SlideShare una empresa de Scribd logo
1 de 19
R・RStudioの導入Analysis Of Variance
(ANOVA)
- Repeated measures designs -
DARM 勉 強 会
#1.2
2013.02.19
広島大学教育学研究科
博士課程後期1年
德岡 大
R・RStudioの導入
Reporting Guideline
(Klockars, 2008)
Lix, L. M., & Keselman H. J. (2008). Analysis of variance:
repeated measures designs. In G. R., Hancock & R. O.
Mueller (Eds.), The Reviewer’s Guide to Quantitative
Methods in the Social Sciences. (pp. 15-27) New York:
Routledge.
反復測定デザインの分散分析
を行った論文を書くときには,
次の12項目を守りましょう!!
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
a. 1要因の反復測定
e.g.,1つのグループに対する 1つの従属変数を2回以上測定
2つ以上の実験条件の測定
i. 帰無仮説:全体的に従属変数が変化しないこと(包括的な仮説)
ii. 帰無仮説の棄却後:水準間での多重比較
iii. 水準間のアプリオリな対比が包括的な仮説の代わりにされることもある
b. 2要因(混合要因)の反復測定
e.g., 2(参加者間;性別:男性,女性)×3(参加者内;表情:ポジティブ,
ニュートラル,ネガティブ)
i. この場合,参加者はランダムサンプリング
ii. 混合要因では,基本的に交互作用に関心あり
c. 2要因(混合要因)の反復測定
e.g., 2(参加者間;介入:あり,なし)×2(参加者内;時間:time1, time
2)
i. この場合,参加者はランダム割り当て
1. 反復測定デザインのタイプが明記されること。
(i.e., 参加者内要因数と参加者間要因数および水準の
数)
反復測定デザインのタイプ
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
a) 母集団の中に効果(有意差)がある場合に,効果があるとす
る確率
a) Type Ⅱerror(β):実際には有意差があるのに,有意差なしとする確率
b) Cohen (1992)は「1 – β≦0.80」を推奨!
c)基本的に有意水準(α),効果量,検定力(1– β),サン
プルサイズ(N)の4つは,他の3つが決まると決まる関係に
ある
8. 検定力の問題が考慮され,サンプルサイズが報告され
ている。
検定力(1 – β err prob)
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
2.検定力の問題が考慮され,サンプルサイズが報告され
ている。
検定力とサンプルサイズの関係
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
 反復測定デザインで適切な検定力を持つサンプルサイズを
算出するために必要となる情報
① ある要因の効果量
② 測定回数
③ グループの数
④ 水準間の分散と共分散(相関)
※ N/K<1の場合,反復測定のMANOVAは参加者内効果を検定するために
使用できない
※ N/Kの比率が小さい場合,共分散が安定しない
※ グループサイズが等価でなく,グループの共分散の等質性の仮定が維持
できないなら反復測定ANOVAやMANOVAは妥当性でない結果を導く可
能性あり
2. 検定力の問題が考慮され,サンプルサイズが報告され
ている。
サンプルサイズの決定
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
 多変量反復測定:従属変数が各測定時期にP個あるもの
a) 個人内の変数内相関(i.e., 自己相関)
b) 個人内の変数間相関
 検定方法 (適用例はFiliz, Z. (2003)参照)
DMMとMMMはANOVAやMANOVAを拡張し,多変量の個人内主効果と交互作用効果
を検定するために提唱されてきた解析モデル
a) Doubly Multivariate Model (DMM)
適用条件:N/P<1のデータセットに適用できない。また,N/Pの比率が小
さいとき,共分散の推定値が安定しない。
b) Multivariate Mixed Model (MMM)
MMMはDMMよりも反復測定と従属変数の共分散構造について厳しい仮定を
おく。仮定を満たさない場合,MMMの結果は妥当ではない推定値を導く
c) Multiple Regression Model (MRM)
尐数のパラメタで共分散行列を定義できる。反復測定の共分散行列はそれ
ぞれの従属変数で等しいと仮定される分離可能な構造である。サンプルサ
イズが小さいとき,構造化しない共分散を仮定するよりも倹約的であり,
推定が安定する。
3.従属(i.e., 反応)変数の数とタイプが明記されてい
る
反復測定デザインの特徴と検定方法
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
 従属変数を離散的な尺度とした分析への適用
一般化線形モデル (Generalized Linear Model: GLM)は離散データの分析のためにモ
デルの統合をしている。離散データに対するGLM適用例
a) ロジスティック回帰 (logistic regression)
2値の反復測定の際に用いられる。ベルヌーイ分布に従うことを仮定する。
b) ポアソン回帰 (poisson regression)
従属変数が回数として数えられるデータや発生率の低いデータに対して用
いられる。ポアソン分布に従うことを仮定する。
c) 多項回帰 (multinomial regression)
順序データの反復測定
 GLMの類型
a) Marginal model: 分布の平均的な反応を推定する目的で使用
b) Random-effect model: 分布における個人の平均的な反応を推定する
目的で使用
3.従属(i.e., 反応)変数の数とタイプが明記されてい
る
反復測定デザインと一般化線形モデル
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
反復測定ANOVA,MANOVA,MRMは多変量正規分布
正規分布からの逸脱を検討する方法
a) 歪度(対称性),多変量歪度
0に近いことが左右対称性を意味し,正規性を示唆。
b) 尖度,多変量尖度
0に近いことで正規性を示唆する。尖度がない状態を3としている文献やソフト
ウェアもあるので注意
c) 具体的な検定方法
以下の検定は逸脱に対して敏感である。
1) Shpiro-Wilk検定:一変量正規分布
2) Mardia’s検定:多変量正規分布
多変量正規性からの逸脱に対して頑健な検定を選択することで,正規性を無視する
のも1つの手段となりうる。
4.従属変数の分布についての仮定が評価され,適切な検
定手続きが選択されている。
正規性の検討
各時点の測定値が正規分布
することは,必ずしも多変
量正規分布を意味しない。
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
a) 中心化傾向と変動性に頑健な測定を適用する。
 トリム平均
アプリオリに決定した割合について,分布の上位と下位から除外する。一般に
推奨されるのは上位下位それぞれ20%の除外。トリム平均は最小二乗平均よ
りも標準誤差が小さくなる。
 ウィンザライズド分散
ウィンザライズド平均とウィンザライズド・スコアの偏差平方和に基
づく分散。トリム平均の標準誤差は,ウィンザライズド分散の関数に
従うため,トリム分散の代わりに使用される。
※ウィンザライズド・スコア:トリムした後のデータの中で,最も小
さい値と最も大きい値を,それぞれ上位下位のトリムしたデータ箇所
に代入した得点。
※ウィンザライズド平均:ウィンザライズド・スコアを用いた平均値
4.従属変数の分布についての仮定が評価され,適切な検
定手続きが選択されている。
非正規性に対するアプローチ
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
b. 分析前にデータを順位化すること。
 魅力
• 簡単に実践できる。
• 正規分布からの逸脱に対して敏感でない。
 注意
• 順位はオリジナルの観測値の直線的な関数でないため,ケース
内の交互作用について適用できない。
• 順位化することで,もともと存在しない効果を追加する可能性
もある。
• 反復測定間の相関のパターンを変えるかもしれないため,反復
測定ANOVAのように相関構造について特定の仮定を置く分析
では,問題になりうる。
4.従属変数の分布についての仮定が評価され,適切な検
定手続きが選択されている。
非正規性に対するアプローチ
1
1
1
1
1
1
Reporting
Guideline
(Lix & Keselman)
c. ノンパラメトリック・ブートストラップ・リサンプリング法
(Berkovits, Hancock, & Nevitt, 2000)
 Bの数は,目的に依存する。信頼区間のためには,B≧1000を推奨,推定値の
ためには,300≦B≦1000で十分である。
4.従属変数の分布についての仮定が評価され,適切な検
定手続きが選択されている。
非正規性に対するアプローチ
オリジナル
データセット
1.オリジナルデータに基づいて
リサンプリング
2.個人内効果の平均で中心化
3.個人内効果の検定
ブートストラップ
・データセット B個のブートストラップ・
データセット
※1~3の手順を全ての
データセットで実施
検定統計量の小さい順に並べて,
B×(1-α)番目の検定統計量を評価
3
2
1
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
 共分散行列構造の仮定で,反復測定データに用いる分析手
続きが変わる
 球面性の仮定
 反復測定ANOVAにおける仮定であり,反復測定水準間のペア間の差の
分散の分布が等しくなければならない。
 多標本球面性 (multisample sphericity)の仮定
 混合デザインにおける仮定であり,反復測定水準間のペア間の差の分
散の分布に加えて,参加者要因の水準においても反復測定のペア間の
差の分散の分布も等しくなければならない。
※球面性の仮定は,社会,行動,健康科学の研究において満たされにくく,球面
性の仮定の検定は多変量正規分布からの逸脱に敏感であるため,反復測定ANOVA
は推奨できない。
5.反復測定の共分散構造についての仮定が評価され,
検定手続きの選択を導くために使用される。
共分散構造の仮定
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
a. 近似の自由度 (approximate df )によるANOVA
b. 反復測定 (repeated measure )MANOVA
 反復した測定値の一般的な共分散行列構造を仮定しない
 しかし,参加者間の水準でグループの共分散行列の等質性を仮定する
参加者間の水準間で共分散の等質性から逸脱すると,特にグループサイズが
等質でないときに,頑健でなくなる。
最も小さいグループサイズの共分散の変動性が,最も大きなグループサイズ
の変動よりも大きいならば,参加者内効果はタイプⅠエラーの確率が上昇。
最も小さいグループサイズの共分散の変動性が,最も大きなグループサイズ
の変動よりも小さいならば,参加者内効果はタイプⅡエラーの確率が上昇。
 共分散が等質であると仮定する必要性がないとき,自由度の調整をして,共分散の
等質性について無視することが推奨される (Keselman et al., 2008)。
 サンプルサイズが小さすぎなければ,参加者内効果について妥当な結果が得られ
る。
 多変量正規分布の仮定が維持できないとき,トリム平均とウィンザライズド分散
を用いて,自由度調整をすべき。
5.反復測定の共分散構造についての仮定が評価され,
検定手続きの選択を導くために使用される。
球面性の仮定を維持できない時
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
共分散構造のモデル選択を補助する統計量の要約と図視可が必要。
また,モデル適合度の計測や推定が使用される
a. ネストされたデータのモデル選択
• 尤度比検定の使用
b. ネストされていないデータのモデル選択
• 赤池情報基準(AIC)やSchwarz’s Bayesian Information
Criterion(BIC)を用いて判断。
• BICはAICよりも厳しくモデルを不利にするため,BICの使
用を勧める。
• 2つの情報基準は,同じ回帰パラメータを含む共分散構造
のモデルを比較するためだけに使用されるべき
5.反復測定の共分散構造についての仮定が評価され,
検定手続きの選択を導くために使用される。
共分散構造の選択
R・RStudioの導入
Reporting
Guideline
(Lix & Keselman)
共分散構造のモデル選択を補助する統計量の要約と図視可が必要。
また,モデル適合度の計測や推定が使用される
a. ネストされたデータのモデル選択
• 尤度比検定の使用
b. ネストされていないデータのモデル選択
• 赤池情報基準(AIC)やSchwarz’s Bayesian Information
Criterion(BIC)を用いて判断。
• BICはAICよりも厳しくモデルを不利にするため,BICの使
用を勧める。
• 2つの情報基準は,同じ回帰パラメータを含む共分散構造
のモデルを比較するためだけに使用されるべき
5.反復測定の共分散構造についての仮定が評価され,
検定手続きの選択を導くために使用される。
共分散構造の選択
R・RStudioの導入
欠損値のタイプと量の査定は反復測定の研究において必須!
 Monotone (drop-out) pattern:特定の時期に観測されるが,以降の測定で
は観測されない。Drop outは疲れや様々な理由で生じする
 Intermitted pattern:ところどころに欠損値を含むもの。
反復測定ANOVA,自由度調整ANOVA,反復測定MANOVAは完全なデータセットを仮
定するため,不完全データの場合,以下の3つの選択がある。
① リストワイズ除去法:1つでも欠損値のある参加者を分析から除外する方法。
② 最尤推定法:完全情報最尤推定法(full information maximum likelihood
estimation)などで欠損データを持つ参加者を削除しない方法。
③ 代入法:単一代入法や多重代入法を使って欠損値の代入をする方法。
6.欠損値の割合とパタンが考慮されること。欠損値を扱
うために適用した方法が同定される。
Reporting
Guideline
(Lix & Keselman)
欠損値の種類と対処
R・RStudioの導入
a) 単一代入法:平均値や回帰などでデータを置き換える。特に,欠損率が高い
に,欠損値のランダムな可変性を考慮できず,標準誤差を過小評価する結果
をもたらすため,推奨されていない。
b) 多重代入法:推奨されるアプローチ。完全データセットを複数作成し,分析
後に統合する。Shafer (1999)では,3~10のデータセットの作成が推奨さ
れる(※現在は,20程度作成することが推奨されている様子)。
6.欠損値の割合とパタンが考慮されること。欠損値を扱
うために適用した方法が同定される。
Reporting
Guideline
(Lix & Keselman)
代入法(imputation method)
R・RStudioの導入
a)Missing completely at random (MCAR)
観測が欠損することは,観測値と欠損値のどちらとも独立である可能性が
あるもの。
b)Missing at random (MAR)
観測が欠損することは,観測された反応のパターンにだけ依存するもの。
c)Missing not at random (MNAR)
その他全ての欠損データのメカニズム。
欠損メカニズムにより,欠損値処理をしたときのバイアスの程度が異なる。
MNARの場合,pattern selection modelやpattern mixture modelによって
バイアスが減尐するため,推奨されている。
6.欠損値の割合とパタンが考慮されること。欠損値を扱
うために適用した方法が同定される。
Reporting
Guideline
(Lix & Keselman)
欠損値のメカニズム

Más contenido relacionado

La actualidad más candente

Rで潜在ランク分析
Rで潜在ランク分析Rで潜在ランク分析
Rで潜在ランク分析Hiroshi Shimizu
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)Masaru Tokuoka
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数daiki hojo
 
内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価Yoshitake Takebayashi
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門Yu Tamura
 
GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219Shuhei Ichikawa
 
無限関係モデル (続・わかりやすいパターン認識 13章)
無限関係モデル (続・わかりやすいパターン認識 13章)無限関係モデル (続・わかりやすいパターン認識 13章)
無限関係モデル (続・わかりやすいパターン認識 13章)Shuyo Nakatani
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定Akira Masuda
 
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~. .
 
effectsパッケージを用いた一般化線形モデルの可視化
effectsパッケージを用いた一般化線形モデルの可視化effectsパッケージを用いた一般化線形モデルの可視化
effectsパッケージを用いた一般化線形モデルの可視化Yu Tamura
 
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析logics-of-blue
 
jamoviによるデータ分析(3):分散分析
jamoviによるデータ分析(3):分散分析jamoviによるデータ分析(3):分散分析
jamoviによるデータ分析(3):分散分析YUNO SHIMIZU
 
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定2 4.devianceと尤度比検定
2 4.devianceと尤度比検定logics-of-blue
 
第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)Masaru Tokuoka
 
第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)Yoshitake Takebayashi
 
統計的検定と例数設計の基礎
統計的検定と例数設計の基礎統計的検定と例数設計の基礎
統計的検定と例数設計の基礎Senshu University
 

La actualidad más candente (20)

Rで潜在ランク分析
Rで潜在ランク分析Rで潜在ランク分析
Rで潜在ランク分析
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 
内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門
 
GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219
 
無限関係モデル (続・わかりやすいパターン認識 13章)
無限関係モデル (続・わかりやすいパターン認識 13章)無限関係モデル (続・わかりやすいパターン認識 13章)
無限関係モデル (続・わかりやすいパターン認識 13章)
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
 
effectsパッケージを用いた一般化線形モデルの可視化
effectsパッケージを用いた一般化線形モデルの可視化effectsパッケージを用いた一般化線形モデルの可視化
effectsパッケージを用いた一般化線形モデルの可視化
 
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析
 
社会心理学とGlmm
社会心理学とGlmm社会心理学とGlmm
社会心理学とGlmm
 
jamoviによるデータ分析(3):分散分析
jamoviによるデータ分析(3):分散分析jamoviによるデータ分析(3):分散分析
jamoviによるデータ分析(3):分散分析
 
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定2 4.devianceと尤度比検定
2 4.devianceと尤度比検定
 
第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)
 
潜在クラス分析
潜在クラス分析潜在クラス分析
潜在クラス分析
 
統計的検定と例数設計の基礎
統計的検定と例数設計の基礎統計的検定と例数設計の基礎
統計的検定と例数設計の基礎
 
Stan超初心者入門
Stan超初心者入門Stan超初心者入門
Stan超初心者入門
 

Destacado

inferences with gaussians: 記法によるrstanの推定結果の違い
inferences with gaussians: 記法によるrstanの推定結果の違いinferences with gaussians: 記法によるrstanの推定結果の違い
inferences with gaussians: 記法によるrstanの推定結果の違いMasaru Tokuoka
 
MCMCで研究報告
MCMCで研究報告MCMCで研究報告
MCMCで研究報告Masaru Tokuoka
 
ベイズ主義による研究の報告方法
ベイズ主義による研究の報告方法ベイズ主義による研究の報告方法
ベイズ主義による研究の報告方法Masaru Tokuoka
 
データ入力が終わってから分析前にすること
データ入力が終わってから分析前にすることデータ入力が終わってから分析前にすること
データ入力が終わってから分析前にすることMasaru Tokuoka
 
rstanで情報仮説によるモデル評価してみる@Hjiyama.R
rstanで情報仮説によるモデル評価してみる@Hjiyama.Rrstanで情報仮説によるモデル評価してみる@Hjiyama.R
rstanで情報仮説によるモデル評価してみる@Hjiyama.RMasaru Tokuoka
 
ポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむMasaru Tokuoka
 
第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討Masaru Tokuoka
 
13.01.20.第1回DARM勉強会資料#3
13.01.20.第1回DARM勉強会資料#313.01.20.第1回DARM勉強会資料#3
13.01.20.第1回DARM勉強会資料#3Yoshitake Takebayashi
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてHiroshi Shimizu
 
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05 RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05 Masaru Tokuoka
 
13.01.20.第1回DARM勉強会資料#1
13.01.20.第1回DARM勉強会資料#113.01.20.第1回DARM勉強会資料#1
13.01.20.第1回DARM勉強会資料#1Yoshitake Takebayashi
 
Tokyo.R #22 Association Rules
Tokyo.R #22 Association RulesTokyo.R #22 Association Rules
Tokyo.R #22 Association Rulesosamu morimoto
 
Rexhep qosja te vertetat e vonuara
Rexhep qosja   te vertetat e vonuaraRexhep qosja   te vertetat e vonuara
Rexhep qosja te vertetat e vonuaraLibra Islame
 
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)Koichi Hamada
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Shohei Kumagai
 
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleHiroki Matsui
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用 Koichiro Gibo
 
要因計画データに対するベイズ推定アプローチ
要因計画データに対するベイズ推定アプローチ要因計画データに対するベイズ推定アプローチ
要因計画データに対するベイズ推定アプローチTakashi Yamane
 

Destacado (20)

第2回DARM勉強会
第2回DARM勉強会第2回DARM勉強会
第2回DARM勉強会
 
inferences with gaussians: 記法によるrstanの推定結果の違い
inferences with gaussians: 記法によるrstanの推定結果の違いinferences with gaussians: 記法によるrstanの推定結果の違い
inferences with gaussians: 記法によるrstanの推定結果の違い
 
MCMCで研究報告
MCMCで研究報告MCMCで研究報告
MCMCで研究報告
 
ベイズ主義による研究の報告方法
ベイズ主義による研究の報告方法ベイズ主義による研究の報告方法
ベイズ主義による研究の報告方法
 
データ入力が終わってから分析前にすること
データ入力が終わってから分析前にすることデータ入力が終わってから分析前にすること
データ入力が終わってから分析前にすること
 
rstanで情報仮説によるモデル評価してみる@Hjiyama.R
rstanで情報仮説によるモデル評価してみる@Hjiyama.Rrstanで情報仮説によるモデル評価してみる@Hjiyama.R
rstanで情報仮説によるモデル評価してみる@Hjiyama.R
 
ポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむポワソン分布の分布感をつかむ
ポワソン分布の分布感をつかむ
 
第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討
 
13.01.20.第1回DARM勉強会資料#3
13.01.20.第1回DARM勉強会資料#313.01.20.第1回DARM勉強会資料#3
13.01.20.第1回DARM勉強会資料#3
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
 
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05 RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
 
13.01.20.第1回DARM勉強会資料#1
13.01.20.第1回DARM勉強会資料#113.01.20.第1回DARM勉強会資料#1
13.01.20.第1回DARM勉強会資料#1
 
多変量解析
多変量解析多変量解析
多変量解析
 
Tokyo.R #22 Association Rules
Tokyo.R #22 Association RulesTokyo.R #22 Association Rules
Tokyo.R #22 Association Rules
 
Rexhep qosja te vertetat e vonuara
Rexhep qosja   te vertetat e vonuaraRexhep qosja   te vertetat e vonuara
Rexhep qosja te vertetat e vonuara
 
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用
 
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
 
要因計画データに対するベイズ推定アプローチ
要因計画データに対するベイズ推定アプローチ要因計画データに対するベイズ推定アプローチ
要因計画データに対するベイズ推定アプローチ
 

第1回DARM勉強会のANOVA補足(repeated measures designs)

  • 1. R・RStudioの導入Analysis Of Variance (ANOVA) - Repeated measures designs - DARM 勉 強 会 #1.2 2013.02.19 広島大学教育学研究科 博士課程後期1年 德岡 大
  • 2. R・RStudioの導入 Reporting Guideline (Klockars, 2008) Lix, L. M., & Keselman H. J. (2008). Analysis of variance: repeated measures designs. In G. R., Hancock & R. O. Mueller (Eds.), The Reviewer’s Guide to Quantitative Methods in the Social Sciences. (pp. 15-27) New York: Routledge. 反復測定デザインの分散分析 を行った論文を書くときには, 次の12項目を守りましょう!!
  • 3. R・RStudioの導入 Reporting Guideline (Lix & Keselman) a. 1要因の反復測定 e.g.,1つのグループに対する 1つの従属変数を2回以上測定 2つ以上の実験条件の測定 i. 帰無仮説:全体的に従属変数が変化しないこと(包括的な仮説) ii. 帰無仮説の棄却後:水準間での多重比較 iii. 水準間のアプリオリな対比が包括的な仮説の代わりにされることもある b. 2要因(混合要因)の反復測定 e.g., 2(参加者間;性別:男性,女性)×3(参加者内;表情:ポジティブ, ニュートラル,ネガティブ) i. この場合,参加者はランダムサンプリング ii. 混合要因では,基本的に交互作用に関心あり c. 2要因(混合要因)の反復測定 e.g., 2(参加者間;介入:あり,なし)×2(参加者内;時間:time1, time 2) i. この場合,参加者はランダム割り当て 1. 反復測定デザインのタイプが明記されること。 (i.e., 参加者内要因数と参加者間要因数および水準の 数) 反復測定デザインのタイプ
  • 4. R・RStudioの導入 Reporting Guideline (Lix & Keselman) a) 母集団の中に効果(有意差)がある場合に,効果があるとす る確率 a) Type Ⅱerror(β):実際には有意差があるのに,有意差なしとする確率 b) Cohen (1992)は「1 – β≦0.80」を推奨! c)基本的に有意水準(α),効果量,検定力(1– β),サン プルサイズ(N)の4つは,他の3つが決まると決まる関係に ある 8. 検定力の問題が考慮され,サンプルサイズが報告され ている。 検定力(1 – β err prob)
  • 6. R・RStudioの導入 Reporting Guideline (Lix & Keselman)  反復測定デザインで適切な検定力を持つサンプルサイズを 算出するために必要となる情報 ① ある要因の効果量 ② 測定回数 ③ グループの数 ④ 水準間の分散と共分散(相関) ※ N/K<1の場合,反復測定のMANOVAは参加者内効果を検定するために 使用できない ※ N/Kの比率が小さい場合,共分散が安定しない ※ グループサイズが等価でなく,グループの共分散の等質性の仮定が維持 できないなら反復測定ANOVAやMANOVAは妥当性でない結果を導く可 能性あり 2. 検定力の問題が考慮され,サンプルサイズが報告され ている。 サンプルサイズの決定
  • 7. R・RStudioの導入 Reporting Guideline (Lix & Keselman)  多変量反復測定:従属変数が各測定時期にP個あるもの a) 個人内の変数内相関(i.e., 自己相関) b) 個人内の変数間相関  検定方法 (適用例はFiliz, Z. (2003)参照) DMMとMMMはANOVAやMANOVAを拡張し,多変量の個人内主効果と交互作用効果 を検定するために提唱されてきた解析モデル a) Doubly Multivariate Model (DMM) 適用条件:N/P<1のデータセットに適用できない。また,N/Pの比率が小 さいとき,共分散の推定値が安定しない。 b) Multivariate Mixed Model (MMM) MMMはDMMよりも反復測定と従属変数の共分散構造について厳しい仮定を おく。仮定を満たさない場合,MMMの結果は妥当ではない推定値を導く c) Multiple Regression Model (MRM) 尐数のパラメタで共分散行列を定義できる。反復測定の共分散行列はそれ ぞれの従属変数で等しいと仮定される分離可能な構造である。サンプルサ イズが小さいとき,構造化しない共分散を仮定するよりも倹約的であり, 推定が安定する。 3.従属(i.e., 反応)変数の数とタイプが明記されてい る 反復測定デザインの特徴と検定方法
  • 8. R・RStudioの導入 Reporting Guideline (Lix & Keselman)  従属変数を離散的な尺度とした分析への適用 一般化線形モデル (Generalized Linear Model: GLM)は離散データの分析のためにモ デルの統合をしている。離散データに対するGLM適用例 a) ロジスティック回帰 (logistic regression) 2値の反復測定の際に用いられる。ベルヌーイ分布に従うことを仮定する。 b) ポアソン回帰 (poisson regression) 従属変数が回数として数えられるデータや発生率の低いデータに対して用 いられる。ポアソン分布に従うことを仮定する。 c) 多項回帰 (multinomial regression) 順序データの反復測定  GLMの類型 a) Marginal model: 分布の平均的な反応を推定する目的で使用 b) Random-effect model: 分布における個人の平均的な反応を推定する 目的で使用 3.従属(i.e., 反応)変数の数とタイプが明記されてい る 反復測定デザインと一般化線形モデル
  • 9. R・RStudioの導入 Reporting Guideline (Lix & Keselman) 反復測定ANOVA,MANOVA,MRMは多変量正規分布 正規分布からの逸脱を検討する方法 a) 歪度(対称性),多変量歪度 0に近いことが左右対称性を意味し,正規性を示唆。 b) 尖度,多変量尖度 0に近いことで正規性を示唆する。尖度がない状態を3としている文献やソフト ウェアもあるので注意 c) 具体的な検定方法 以下の検定は逸脱に対して敏感である。 1) Shpiro-Wilk検定:一変量正規分布 2) Mardia’s検定:多変量正規分布 多変量正規性からの逸脱に対して頑健な検定を選択することで,正規性を無視する のも1つの手段となりうる。 4.従属変数の分布についての仮定が評価され,適切な検 定手続きが選択されている。 正規性の検討 各時点の測定値が正規分布 することは,必ずしも多変 量正規分布を意味しない。
  • 10. R・RStudioの導入 Reporting Guideline (Lix & Keselman) a) 中心化傾向と変動性に頑健な測定を適用する。  トリム平均 アプリオリに決定した割合について,分布の上位と下位から除外する。一般に 推奨されるのは上位下位それぞれ20%の除外。トリム平均は最小二乗平均よ りも標準誤差が小さくなる。  ウィンザライズド分散 ウィンザライズド平均とウィンザライズド・スコアの偏差平方和に基 づく分散。トリム平均の標準誤差は,ウィンザライズド分散の関数に 従うため,トリム分散の代わりに使用される。 ※ウィンザライズド・スコア:トリムした後のデータの中で,最も小 さい値と最も大きい値を,それぞれ上位下位のトリムしたデータ箇所 に代入した得点。 ※ウィンザライズド平均:ウィンザライズド・スコアを用いた平均値 4.従属変数の分布についての仮定が評価され,適切な検 定手続きが選択されている。 非正規性に対するアプローチ
  • 11. R・RStudioの導入 Reporting Guideline (Lix & Keselman) b. 分析前にデータを順位化すること。  魅力 • 簡単に実践できる。 • 正規分布からの逸脱に対して敏感でない。  注意 • 順位はオリジナルの観測値の直線的な関数でないため,ケース 内の交互作用について適用できない。 • 順位化することで,もともと存在しない効果を追加する可能性 もある。 • 反復測定間の相関のパターンを変えるかもしれないため,反復 測定ANOVAのように相関構造について特定の仮定を置く分析 では,問題になりうる。 4.従属変数の分布についての仮定が評価され,適切な検 定手続きが選択されている。 非正規性に対するアプローチ
  • 12. 1 1 1 1 1 1 Reporting Guideline (Lix & Keselman) c. ノンパラメトリック・ブートストラップ・リサンプリング法 (Berkovits, Hancock, & Nevitt, 2000)  Bの数は,目的に依存する。信頼区間のためには,B≧1000を推奨,推定値の ためには,300≦B≦1000で十分である。 4.従属変数の分布についての仮定が評価され,適切な検 定手続きが選択されている。 非正規性に対するアプローチ オリジナル データセット 1.オリジナルデータに基づいて リサンプリング 2.個人内効果の平均で中心化 3.個人内効果の検定 ブートストラップ ・データセット B個のブートストラップ・ データセット ※1~3の手順を全ての データセットで実施 検定統計量の小さい順に並べて, B×(1-α)番目の検定統計量を評価 3 2 1
  • 13. R・RStudioの導入 Reporting Guideline (Lix & Keselman)  共分散行列構造の仮定で,反復測定データに用いる分析手 続きが変わる  球面性の仮定  反復測定ANOVAにおける仮定であり,反復測定水準間のペア間の差の 分散の分布が等しくなければならない。  多標本球面性 (multisample sphericity)の仮定  混合デザインにおける仮定であり,反復測定水準間のペア間の差の分 散の分布に加えて,参加者要因の水準においても反復測定のペア間の 差の分散の分布も等しくなければならない。 ※球面性の仮定は,社会,行動,健康科学の研究において満たされにくく,球面 性の仮定の検定は多変量正規分布からの逸脱に敏感であるため,反復測定ANOVA は推奨できない。 5.反復測定の共分散構造についての仮定が評価され, 検定手続きの選択を導くために使用される。 共分散構造の仮定
  • 14. R・RStudioの導入 Reporting Guideline (Lix & Keselman) a. 近似の自由度 (approximate df )によるANOVA b. 反復測定 (repeated measure )MANOVA  反復した測定値の一般的な共分散行列構造を仮定しない  しかし,参加者間の水準でグループの共分散行列の等質性を仮定する 参加者間の水準間で共分散の等質性から逸脱すると,特にグループサイズが 等質でないときに,頑健でなくなる。 最も小さいグループサイズの共分散の変動性が,最も大きなグループサイズ の変動よりも大きいならば,参加者内効果はタイプⅠエラーの確率が上昇。 最も小さいグループサイズの共分散の変動性が,最も大きなグループサイズ の変動よりも小さいならば,参加者内効果はタイプⅡエラーの確率が上昇。  共分散が等質であると仮定する必要性がないとき,自由度の調整をして,共分散の 等質性について無視することが推奨される (Keselman et al., 2008)。  サンプルサイズが小さすぎなければ,参加者内効果について妥当な結果が得られ る。  多変量正規分布の仮定が維持できないとき,トリム平均とウィンザライズド分散 を用いて,自由度調整をすべき。 5.反復測定の共分散構造についての仮定が評価され, 検定手続きの選択を導くために使用される。 球面性の仮定を維持できない時
  • 15. R・RStudioの導入 Reporting Guideline (Lix & Keselman) 共分散構造のモデル選択を補助する統計量の要約と図視可が必要。 また,モデル適合度の計測や推定が使用される a. ネストされたデータのモデル選択 • 尤度比検定の使用 b. ネストされていないデータのモデル選択 • 赤池情報基準(AIC)やSchwarz’s Bayesian Information Criterion(BIC)を用いて判断。 • BICはAICよりも厳しくモデルを不利にするため,BICの使 用を勧める。 • 2つの情報基準は,同じ回帰パラメータを含む共分散構造 のモデルを比較するためだけに使用されるべき 5.反復測定の共分散構造についての仮定が評価され, 検定手続きの選択を導くために使用される。 共分散構造の選択
  • 16. R・RStudioの導入 Reporting Guideline (Lix & Keselman) 共分散構造のモデル選択を補助する統計量の要約と図視可が必要。 また,モデル適合度の計測や推定が使用される a. ネストされたデータのモデル選択 • 尤度比検定の使用 b. ネストされていないデータのモデル選択 • 赤池情報基準(AIC)やSchwarz’s Bayesian Information Criterion(BIC)を用いて判断。 • BICはAICよりも厳しくモデルを不利にするため,BICの使 用を勧める。 • 2つの情報基準は,同じ回帰パラメータを含む共分散構造 のモデルを比較するためだけに使用されるべき 5.反復測定の共分散構造についての仮定が評価され, 検定手続きの選択を導くために使用される。 共分散構造の選択
  • 17. R・RStudioの導入 欠損値のタイプと量の査定は反復測定の研究において必須!  Monotone (drop-out) pattern:特定の時期に観測されるが,以降の測定で は観測されない。Drop outは疲れや様々な理由で生じする  Intermitted pattern:ところどころに欠損値を含むもの。 反復測定ANOVA,自由度調整ANOVA,反復測定MANOVAは完全なデータセットを仮 定するため,不完全データの場合,以下の3つの選択がある。 ① リストワイズ除去法:1つでも欠損値のある参加者を分析から除外する方法。 ② 最尤推定法:完全情報最尤推定法(full information maximum likelihood estimation)などで欠損データを持つ参加者を削除しない方法。 ③ 代入法:単一代入法や多重代入法を使って欠損値の代入をする方法。 6.欠損値の割合とパタンが考慮されること。欠損値を扱 うために適用した方法が同定される。 Reporting Guideline (Lix & Keselman) 欠損値の種類と対処
  • 18. R・RStudioの導入 a) 単一代入法:平均値や回帰などでデータを置き換える。特に,欠損率が高い に,欠損値のランダムな可変性を考慮できず,標準誤差を過小評価する結果 をもたらすため,推奨されていない。 b) 多重代入法:推奨されるアプローチ。完全データセットを複数作成し,分析 後に統合する。Shafer (1999)では,3~10のデータセットの作成が推奨さ れる(※現在は,20程度作成することが推奨されている様子)。 6.欠損値の割合とパタンが考慮されること。欠損値を扱 うために適用した方法が同定される。 Reporting Guideline (Lix & Keselman) 代入法(imputation method)
  • 19. R・RStudioの導入 a)Missing completely at random (MCAR) 観測が欠損することは,観測値と欠損値のどちらとも独立である可能性が あるもの。 b)Missing at random (MAR) 観測が欠損することは,観測された反応のパターンにだけ依存するもの。 c)Missing not at random (MNAR) その他全ての欠損データのメカニズム。 欠損メカニズムにより,欠損値処理をしたときのバイアスの程度が異なる。 MNARの場合,pattern selection modelやpattern mixture modelによって バイアスが減尐するため,推奨されている。 6.欠損値の割合とパタンが考慮されること。欠損値を扱 うために適用した方法が同定される。 Reporting Guideline (Lix & Keselman) 欠損値のメカニズム