SlideShare una empresa de Scribd logo
1 de 27
Cox比例ハザードモデル
とその周辺
TokyoR #46
2015/2/21
@kikurag1001
自己紹介
名前:@kikurage1001
お仕事:統計ソフトを作ってます@東京
兼
大学院生として医療統計を勉強してます@福岡
今は遺伝子解析をぼちぼち。。。
よく使うもの:R、SAS
楽しみ:映画データをいじくって眺める
内容
• Cox比例ハザードモデルとは?
• 実際に分析してみる
• ノモグラムを描いてみる
Cox比例ハザードモデル
• イベントが起こったか、起こらなかった
かについて、時間も含めて行う多変量解
析のこと
• 医療疫学分野、製品の寿命や故障の解析
などに使われる
特徴1
ℎ 𝑡 𝑥 = ℎ0(𝑡)exp(𝛽1 𝑥1 + 𝛽2 𝑥2 + ・・・ + 𝛽 𝑘 𝑥 𝑘)
• 柔軟性の高いモデル
• ハザード比:exp(偏回帰係数)
群間でのハザード(単位時間あたりの死亡確率)の比
1より大きいとリスクを上げ、1より小さいとリスクを下げる
• 比例ハザード性(ハザード比が常に一定)の仮定が必要
ベースラインハザード
(推定しない)
偏回帰係数と共変量の線形結合の指数関数
特徴2
• 累積ハザード関数から生存関数を求めることができる
• 生存予測ができる
𝐻 𝑡 =
0
𝑡
ℎ 𝑥 𝑑𝑥 = −log[𝑆(𝑡)]
累積ハザード関数
こんなニュースが・・・
最近、ミニシアターがどんどん閉館しているらしい
ミニシアターの閉館にどんな因子が関係しているのか?
※5スクリーン未満の映画館
実際に分析してみる
映画館のデータ(自作)を使って分析してみる
1910~2015年に営業している(た)5スクリーン未満の映画館
計128件のデータをCox比例ハザードモデルを用いて解析!
変数 説明
営業年数 営業年数(平均約36年)
営業中or閉館 営業中=0、閉館=1
総座席数 館内全体の座席数の合計
スクリーン数 館内のスクリーン数の合計
区のカテゴリー 映画館がある区のカテゴリー
シネコン有無 営業期間内にその映画館がある区
内にシネコンがあったか
都心
千代田区、中央区、
港区
副都心
新宿区、文京区、
渋谷区、豊島区
城東
台東区、墨田区、江東
区、荒川区、足立区、
葛飾区、江戸川区
城南
品川区、目黒区、
大田区
城西
世田谷区、中野区、
杉並区、練馬区
城北 北区、板橋区
その他市部
※シネコン:5スクリーン以上ある映画館
コード
結果
コード
結果
結果からわかること
• スクリーンは多いほうが良さそう
• 副都心地域はやばそう(新宿、渋谷等)
• シネコンの影響は・・・あったほうが?
グラフにしてみよう!!
ノモグラムを描いてみる
• 臨床の世界で使われる便利なグラフ
• 死んだり、病気になったりする可能性を
ざっくりと計算することができる
• Rで描ける!{rms}
コード
結果
市部
市部
市部
実際の使い方
もしも
• 総座席数400席 で
• スクリーン数2つ の映画館が
• シネコンのない
• 中野区に建設されたとしたら
どのくらいの確率で
50年後も営業しているかなあ??
市部
市部
市部
市部
3点 35点 38点 67点
市部
3 + 35 + 38 + 67 = 143点
市部
143点
市部
143点
市部
143点
0.65!
65%くらいの確率で、
営業してるんじゃ
ないかねぇ、たぶん
まとめ
説明 {survival} {rms}
Cox解析 coxph cph
残差の分析 residuals.coxph residuals.cph
比例ハザード性の確認 cox.zph ―
生存確率の算出 survfit survest.cph
Coxモデルの予測 predict.coxph predict
ノモグラムを描く ― nomogram
• Rを使えば、Cox比例ハザードモデルに関
することが色々できます
※ここで用いたデータ及び、解析方法、解釈については個人の見解に基づくものである
ことをご了承くださいm(-_-)m

Más contenido relacionado

La actualidad más candente

状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
horihorio
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
Miyoshi Yuya
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
Issei Kurahashi
 

La actualidad más candente (20)

状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果
 
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法
 
3分でわかる多項分布とディリクレ分布
3分でわかる多項分布とディリクレ分布3分でわかる多項分布とディリクレ分布
3分でわかる多項分布とディリクレ分布
 
2 3.GLMの基礎
2 3.GLMの基礎2 3.GLMの基礎
2 3.GLMの基礎
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
03 「重回帰分析」の入門
03 「重回帰分析」の入門03 「重回帰分析」の入門
03 「重回帰分析」の入門
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定2 4.devianceと尤度比検定
2 4.devianceと尤度比検定
 
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
 
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17
 
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
 
ベイズ推論とシミュレーション法の基礎
ベイズ推論とシミュレーション法の基礎ベイズ推論とシミュレーション法の基礎
ベイズ推論とシミュレーション法の基礎
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
 
EMアルゴリズム
EMアルゴリズムEMアルゴリズム
EMアルゴリズム
 
MICの解説
MICの解説MICの解説
MICの解説
 
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
 
「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例
 

Similar a Tokyo.R #46 Cox比例ハザードモデルとその周辺

Similar a Tokyo.R #46 Cox比例ハザードモデルとその周辺 (7)

反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング
 
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
 
How to use in R model-agnostic data explanation with DALEX & iml
How to use in R model-agnostic data explanation with DALEX & imlHow to use in R model-agnostic data explanation with DALEX & iml
How to use in R model-agnostic data explanation with DALEX & iml
 
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索する
 

Tokyo.R #46 Cox比例ハザードモデルとその周辺

Notas del editor

  1. http://www.eiren.org/toukei/data.html
  2. http://www.eiren.org/toukei/data.html