SlideShare una empresa de Scribd logo
1 de 21
傾向スコアでみる
 ソーシャルネットワーク分析
-	
  ⼝口コミとメディア広告ではどちらの影響⼒力力が強いのか	
  -




                      おしゃれStatisticsⅥ
                       6th	
  of	
  June,	
  2012
                             @millionsmile
Behavior	
  Correlation
                       in	
  Network
•   ⼈人間の⾏行行動は時空間ネットワーク上ではクラスター化しやすい。
    例)Christakis	
  &	
  Fowlerの有名な研究である「肥満は伝染する」


•   ⼈人間の⾏行行動はしばしばネットワークの構造に「相関」があると⾔言われる。
    -	
  Peer	
  influence(仲間による影響など:友達が買ったから⾃自分も買う)
    -	
  Homophily(類友:似たもの同⼠士は似たような⾏行行動を起こしやすい)
    -	
  Confounding	
  Factors(交絡因⼦子:周辺環境など外部の影響によって起こす⾏行行動)
    -	
  Selection(選択:トライアスロンをしている者同⼠士は友達になりやすい)


•   注意!「相関関係は必ずしも因果関係を意味しない」
    例)朝ごはんを⾷食べると成績があがる?
          朝ごはんを⾷食べたら成績があがるという因果関係はない。
          朝ごはんを⾷食べている⼦子は成績の平均が⾼高いという統計的に関連があるのだよ、というお話。
情報が伝播する上で重要となってくる
            2つのネットワークの特徴


•   Assortative	
  mixing	
  -	
  ネットワーク上の繋がっているノード(⼈人)同⼠士が似ている
    傾向、あるいはその特性に何かしらの正の相関(assortative)がある。
    mixingは⼈人間関係の場合であれば、話す⾔言語や⼈人種といった離散的性質のデータと、
    年齢といったスカラー的性質のデータをmixして計算するということ[Newman	
  03]


•   Temporal	
  clustering	
  -	
  ネットワーク上の繋がっているノード(⼈人)の⾏行行動は時空間
    的には独⽴立立している。例えば、幸せが伝染するといったときに、同時タイミングで幸せ
    になるわけではない。誰かが幸せになって、別の誰かが幸せになると時間的なタイミン
    グは独⽴立立している。とはいえ、ある程度時間的には固まって発⽣生するものである。
⾏行行動を起こしやすい情報伝播ネットワーク


情報伝播というと、複雑ネットワークではSISモデルやSIRモデルといった感染の数
理モデルが有名。※定義については[増⽥田	
  01]参照。


今⽇日はちょっと味⽅方を変え、
「⾏行行動を起こしやすいの情報伝播ネットワーク」
をみていく。


例)iPhoneを買ったのは、友達の影響なのか、メディアや広告の影響なのか。
InfluenceとHomophilyの定義する

     Influence                 Homophily
j君がiPhoneよかったよ!と⾔言うので     iさんとj君はiPhoneを買った。⼆二⼈人は友達
iさんはiPhoneを買った。           ではない。年齢、⾏行行動パターンが類似。




                                     ×
       ∗
      ai   ←    ∗
               aj             ai ← ci .
                               ∗
                                          ai . si .
                             aj ← cj .
                              ∗
                                          aj . sj .
  ∗
   :iやjの⾏行行動や選択(例:肥満の伝染、友達が買ったので⾃自分も買う)
a
a  :iやjの他の⾏行行動や選択
c  :iやjの個⼈人属性(例:性別、年齢など)
s  :iやjの状態(例:肥満、幸福など)
InfluenceとHomophilyの違い



•   マーケティング戦略におけるInfluenceとHomophilyの違い
    -	
  ⼝口コミ戦略vsメディア広告戦略
    -	
  インフルエンサーをターゲットにするvs顧客プロフィールから市場セグメントをする


•   情報の伝播におけるInfluenceとHomophilyの違い
    -	
  influence-basedの情報伝播	
  -	
  連鎖反応、迅速、指数関数的な変化、予測が難しい
    -	
  homophily-basedの情報伝播	
  -	
  ノードの特性から予測可能であり統制しやすい
InfluenceとHomophilyでは
        どちらの⽅方が影響⼒力力があるのだろうか

•   Yahoo!	
  Goという新サービスが、InfluenceとHomophilyのどちらの効果によって広
    まっていったのかを観察した論⽂文がある[Sinan	
  Aral	
  et	
  al.(2009)]
    -	
  Homophilyは傾向スコアによるマッチングで算出
    -	
  Influenceはランダムマッチングで算出




               実際の研究論⽂文をみつつ
              傾向スコアについて理解する
DATA
•   データはYahoo!のメッセンジャーユーザ2700万
    ⼈人のデータを利⽤用


•   デモグラや地理情報などの詳細データを利⽤用


•   2007年7⽉月にローンチされたYahoo!	
  Goのアダ
    プト率や利⽤用率を5ヶ⽉月に渡って⽇日々計測した


•   サンプリングできたアダプターは53万ノード
    ランダムサンプルしたノードは320万ノード


•   解析にはC++とComplex	
  Networks	
  Toolbox	
  
    for	
  Matlabを使ったらしい。共著者のLev	
                                     ※Yahoo!	
  GoはYahoo!	
  MailやYahoo!	
  Photなどのサービスや
    MuchnikさんのHPからDownloadできるみた                                        Web上のコンテンツをPC、携帯、テレビからシームレスに利
                                                                       ⽤用できるサービス。2010年にサービス停⽌止しているらしい。
    い。http://www.levmuchnik.net/Content/woomplexNetworksPackage.html
傾向スコアとは?
  実験することができない調査観察のデータなどの交絡因子の調整方法のこと。
  処理変数と結果変数の両方に相関する外部変数のことで、
  交絡因子を解析時に調整しないと因果関係が推定できない。

           処理変数               結果変数

               飲酒              癌




                      喫煙
例えば、癌になる人は飲酒との相関が高
いと出たとする。しかし、飲酒している
人は喫煙との相関も考えられるし、メタ
ボとの相関も考えられる。          メタボ
なので、癌の因果関係を求めるには、喫
煙とメタボの交絡も含めて計算する必要
がある。
                     交絡因子たち
傾向スコアとは?
                                Treated	
  Group            Untreated	
  Group

                                  Ti = 1                          Ti = 0
       Treated	
  Outcome	
  
               y1               Treated	
  Data                  Missing	
  Data


    Untreated	
  Outcome	
  
                                Missing	
  Data                 Untreated	
  Data
               y0

                                                   Covariance    Xi

因果関係を求める際、Treated	
  Groupの間での効果を調べるため、
Treated	
  Groupのy1とy0を使って計算したいのだが、
y0の⽅方は観測されていない⽋欠測データ(Missing	
  Data)なので⽤用いることができない。
傾向スコアとは?
                                    Treated	
  Group            Untreated	
  Group

                                      Ti = 1                          Ti = 0
           Treated	
  Outcome	
  
                   y1               Treated	
  Data                  Missing	
  Data


        Untreated	
  Outcome	
  
                   y0               Missing	
  Data
                                                         =          Untreated	
  Data



                                                       Covariance    Xi

そこで共変量(Covariance)の値がTreated	
  GroupとUntreated	
  Groupで
等しい時の割り当てはランダムと仮定をおき、
また共変量(Covariance)が同じならば
T=0のy0の期待を代⽤用できるとすれば因果関係を計算することができる。
※数式的証明は[宮川	
  04,	
  星野09]を参照
傾向スコアとは?
                                                共変量                      共変量を説明変数に加える


      傾向スコアよりどちらの処理に                          傾向スコア
      割り付けられやすいか計算する


                            Treated	
  Group            Untreated	
  Group

                              Ti = 1                          Ti = 0
   Treated	
  Outcome	
  
           y1               Treated	
  Data                  Missing	
  Data


Untreated	
  Outcome	
  
                            Missing	
  Data                 Untreated	
  Data
           y0

                                               Covariance    Xi
傾向スコアの定義
傾向スコアとは、割り付けられやすさの指標のこと。確率なので範囲は             0 ≤ ei ≤ 1.


         ei = p(zi = 1 | xi )
                         Xiの条件付きで処置1(z=1)に割り当てられる確率


      ei :   対象者iがグループ1に割り当てられる確率

  zi = 1 :   処置1に割り当て  ※割り当て変数は⼆二値{0,1}

      xi :   対象者iの共変量ベクトル
傾向スコアの推定
傾向スコアの真値はわからないので、データから推定する。


通常ロジスティック回帰モデルが使⽤用される。
                 1
   ei =
        1 + exp(−(α + βx))

                 ˆ ˆ
この尤度を最⼤大化する最尤推定値{  ,	
  β }を⽤用いることで傾向スコアの推定値が求める。
                 α   
                  1
   ei =
   ˆ
                    α ˆ
          1 + exp(−(ˆ + βx))          (式1)
ARAL論⽂文の傾向スコア
Aral論⽂文では傾向スコアを使ってhomophily	
  effect(類友効果)を計測している。


                                exp[αit + βit Xit + it ]
  pit = P (Tit = 1) | Xit ) =
                              1 + exp[αit + βit Xit + it ]

 Tit = 1 : ある時間間隔ΔtにおいてYahoo!Goをアダプトした友⼈人が⼀一⼈人以上いる
     Xit : 対象者iの共変量ベクトル(33個のベクトルを使ったようだ)
      it : 対象者iの個体差

        ※Δtは、              で計算される。 ∆t = ti − tj = R
                              a      a

                              a
        	
  	
  	
  -	
  t	
  	
  は、対象者iがアダプトした時間。
                         	
   i
                              a
          -	
  tj は、対象者jがアダプトした時間。対象者iの友達である。
                           
        ※分⺟母分⼦子に	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  +	
  	
  	
  it 	
  	
  	
  it 	
  +	
  	
  	
  	
  	
  を掛けると(式1)となる。どちらでも同じこと。
                                         exp[αit 	
  	
   β	
  	
  X 	
  	
   	
  	
   	
   it ]



この傾向スコアを使い、Adopt率=Treatedの数(n+)/Untreatedの数(n-)を計算する。
ARAL論⽂文の傾向スコア
ロジスティック回帰にε(個体差)を含めるかどうかの判断。

                       exp[αit + βit Xit + it ]
               pit =
                     1 + exp[αit + βit Xit + it ]

-	
  ε(個体差)は観察者が観測していない興味のない量
-	
  個体差の過分散が⼤大きい場合、計算に含めないと結果が正しく推定できない
  ※	
  αit + βit Xit
                   はpの平均値を変化させている→fixed	
  effect
          はpの平均値を変化させずばらつきだけをかえている→random	
  effect
  ※	
    it
  ※	
  fixed	
  effectとrandom	
  effectの両⽅方を含む統計モデルを混合モデルという。
  ※	
  過分散の⾒見見つけ⽅方については[久保	
  07]参照。


Aral論⽂文では、具体的にεにどんな値を設定しているのか記載されていないが
何かしらの調整を⾏行行なっているらしい、というのが数式よりわかる。
類友でべき分布




Adoptした友達が多いほど自分もadoptする確率が高まる
人間関係でよくみられる次数分布である。
→ほとんどがadpotした友達は圧倒的に少ない(1人)なので図がベキ分布する
時間軸でみるADOPT率




時間間隔を0日から6日間(Δt∈[0,6])で区切ってみたAdopt率
0日は対象者iと対象者jが同じ日にadoptしたということ
結果発表




Influenceによるadoptが49.8%, Homophilyによるadoptが50.2%
よって、微差ではあるがHomphilyの方が影響度が高い
※マーケティング施策としてはバイラルマーケティングもメディア広告も両方やったほうがよさげ
おまけ
多変量解析をする際によく使われるモデル:
-	
  Coxの⽐比例ハザードモデル
-	
  ロジスティック回帰モデル
-	
  傾向スコア


多変量解析をする際に時々使われるモデル:
-	
  ベイジアンモデル
-	
  ブーストラップ
-	
  マッチング
-	
  混合効果モデル
                                     [Biondi-Zoccai	
  11]


2000年のアメリカ⼤大統領選挙でブッシュとゴアでほぼ互⾓角の戦いだったが、結果を正
確に予測したのは1社だけ。この1社はネット調査を傾向スコアで調整し予測した。
                                   [星野・楠⽊木	
  07]
今やっている「複雑ネットワーク勉強会」の開催場所
                                                                                                                                   Facebookページ『複雑ネットワーク』:
                                                                                                                                   http://www.facebook.com/pages/%E8%A4%87%E9%9B
                                                                                                                                   %91%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF
                                                                                                                                   %E3%83%BC%E3%82%AF/309875385698514

References
•   Sinan	
  Aral,	
  Lev	
  Muhnik,	
  Arun	
  Sundararajan,	
   Distinguishing	
  influence-based	
  contagion	
  from	
  homophily-driven	
  diffusion	
  in	
  dynamic	
  
    networks (2009)
•   Aris	
  Anagnostopoulos,	
  Ravi	
  Kumar,	
  Mohammad	
  Mahdian,	
   Influence	
  and	
  Correlation	
  in	
  Social	
  Networks (2008)
•   M.	
  E.	
  J.	
  Newman,	
   Mixing	
  patterns	
  in	
  networks (2003)
•   Paul	
  R.	
  Rosenbaum,	
  Donald	
  B.	
  Robin,	
   The	
  central	
  Role	
  of	
  the	
  propensity	
  score	
  in	
  observational	
  studies	
  for	
  causal	
  effects (1983)
•   Giuseppe	
  Biondi-Zoccai,	
  et	
  al.,	
   Are	
  propensity	
  scores	
  really	
  superior	
  to	
  standard	
  multivariable	
  analysis? (2011)
•   M.	
  Scoledad	
  Cepeda,	
  et	
  al.,	
   Comparison	
  of	
  Logistic	
  Regression	
  versus	
  Propensity	
  Score	
  When	
  the	
  Number	
  of	
  Events	
  Is	
  Low	
  and	
  There	
  
    Are	
  Multiple	
  Confounders (2003)
•   宮川雅⺒巳:『統計的因果推論』,朝倉書店(2009)
•   星野崇宏:『調査観察データの統計科学』,岩波書店(2010)
•   Annette	
  J.	
  Dobson著/⽥田中豊・森川敏彦・⼭山中⽵竹春・冨⽥田誠訳:『⼀一般化線形モデル⼊入⾨門第2版』,共⽴立立出版(2011)
•   増⽥田直紀・今野紀雄:『複雑ネットワーク-基礎から応⽤用まで』,近代科学社(2010)
•   増⽥田直紀:『なぜ3⼈人いると噂が広まるのか』,⽇日本経済新聞出版社(2012)
•   ニコラス・A・クリスタキス、ジェイムズ・H・ファウラー著、⻤⿁鬼澤忍訳:『つながり-社会的ネットワークの驚くべき⼒力力』,講談社(2010)
•   『⼈人の好みにクチコミは効かない』(2011).Wired	
  Japanese	
  Edition:	
  http://wired.jp/2011/12/26/%E3%80%8C%E4%BA%BA%E3%81%AE%E5%A5%BD%E3%81%BF%E3%81%AB
    %E3%82%AF%E3%83%81%E3%82%B3%E3%83%9F%E3%81%AF%E5%8A%B9%E3%81%8B%E3%81%AA%E3%81%84%E3%80%8D%E2%94%80%E2%94%80%E3%83%8F%E3%83%BC%E3%83%B4%E3%82%A1/

•   @yokkuns:『Rで学ぶ傾向スコア解析⼊入⾨門』(2011).	
  slideshare:	
  http://www.slideshare.net/yokkuns/r-9387843
•   @isseing333:『観測データでの効果推定(傾向スコア、IPW、DR)』(2011).	
  blog:	
  http://d.hatena.ne.jp/isseing333/20110511/1305124310
•   林岳彦:『傾向スコア:その概念とRによる実装』(2012).	
  slideshare:	
  http://www.slideshare.net/takehikoihayashi/propensity-score-
    analysis-seminar-japanese
•   久保拓弥:『「個体差」を階層ベイズモデルであつかう』(2007).	
  pdf:	
  http://hosho.ees.hokudai.ac.jp/~kubo/stat/2006/b/kubostat2006b.pdf
•   星野崇宏・楠⽊木良⼀一対談:『ネット調査を補正する「傾向スコア」の可能性』,(2007)	
  article:	
  http://adv.yomiuri.co.jp/ojo/02number/200709/09toku2.html

Más contenido relacionado

La actualidad más candente

異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知hagino 3000
 
DataRobotを用いた要因分析 (Causal Analysis by DataRobot)
DataRobotを用いた要因分析 (Causal Analysis by DataRobot)DataRobotを用いた要因分析 (Causal Analysis by DataRobot)
DataRobotを用いた要因分析 (Causal Analysis by DataRobot)Yuya Yamamoto
 
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)Taro Tezuka
 
ベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるitoyan110
 
学部生向けベイズ統計イントロ(公開版)
学部生向けベイズ統計イントロ(公開版)学部生向けベイズ統計イントロ(公開版)
学部生向けベイズ統計イントロ(公開版)考司 小杉
 
コサインクラスタリング
コサインクラスタリングコサインクラスタリング
コサインクラスタリングosamu morimoto
 
PRML輪読#6
PRML輪読#6PRML輪読#6
PRML輪読#6matsuolab
 
[DL輪読会]Deep Learning 第4章 数値計算
[DL輪読会]Deep Learning 第4章 数値計算[DL輪読会]Deep Learning 第4章 数値計算
[DL輪読会]Deep Learning 第4章 数値計算Deep Learning JP
 
マハラノビス距離とユークリッド距離の違い
マハラノビス距離とユークリッド距離の違いマハラノビス距離とユークリッド距離の違い
マハラノビス距離とユークリッド距離の違いwada, kazumi
 
相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定Joe Suzuki
 
Graph convolution (スペクトルアプローチ)
Graph convolution (スペクトルアプローチ)Graph convolution (スペクトルアプローチ)
Graph convolution (スペクトルアプローチ)yukihiro domae
 
敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度Masa Kato
 
異常検知とGAN: AnoGan
異常検知とGAN: AnoGan異常検知とGAN: AnoGan
異常検知とGAN: AnoGanKoichiro tamura
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析Mitsunori Sato
 
Re永続データ構造が分からない人のためのスライド
Re永続データ構造が分からない人のためのスライドRe永続データ構造が分からない人のためのスライド
Re永続データ構造が分からない人のためのスライドMasaki Hara
 
Chapter7 回帰分析の悩みどころ
Chapter7 回帰分析の悩みどころChapter7 回帰分析の悩みどころ
Chapter7 回帰分析の悩みどころitoyan110
 
PRML 上 1.2.4 ~ 1.2.6
PRML 上 1.2.4 ~ 1.2.6PRML 上 1.2.4 ~ 1.2.6
PRML 上 1.2.4 ~ 1.2.6禎晃 山崎
 
空間データのための回帰分析
空間データのための回帰分析空間データのための回帰分析
空間データのための回帰分析springking
 
PRML 6.1章 カーネル法と双対表現
PRML 6.1章 カーネル法と双対表現PRML 6.1章 カーネル法と双対表現
PRML 6.1章 カーネル法と双対表現hagino 3000
 

La actualidad más candente (20)

異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
 
DataRobotを用いた要因分析 (Causal Analysis by DataRobot)
DataRobotを用いた要因分析 (Causal Analysis by DataRobot)DataRobotを用いた要因分析 (Causal Analysis by DataRobot)
DataRobotを用いた要因分析 (Causal Analysis by DataRobot)
 
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
Beta distribution and Dirichlet distribution (ベータ分布とディリクレ分布)
 
ベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づける
 
学部生向けベイズ統計イントロ(公開版)
学部生向けベイズ統計イントロ(公開版)学部生向けベイズ統計イントロ(公開版)
学部生向けベイズ統計イントロ(公開版)
 
コサインクラスタリング
コサインクラスタリングコサインクラスタリング
コサインクラスタリング
 
PRML輪読#6
PRML輪読#6PRML輪読#6
PRML輪読#6
 
[DL輪読会]Deep Learning 第4章 数値計算
[DL輪読会]Deep Learning 第4章 数値計算[DL輪読会]Deep Learning 第4章 数値計算
[DL輪読会]Deep Learning 第4章 数値計算
 
マハラノビス距離とユークリッド距離の違い
マハラノビス距離とユークリッド距離の違いマハラノビス距離とユークリッド距離の違い
マハラノビス距離とユークリッド距離の違い
 
相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定
 
Graph convolution (スペクトルアプローチ)
Graph convolution (スペクトルアプローチ)Graph convolution (スペクトルアプローチ)
Graph convolution (スペクトルアプローチ)
 
敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度
 
異常検知とGAN: AnoGan
異常検知とGAN: AnoGan異常検知とGAN: AnoGan
異常検知とGAN: AnoGan
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
 
Re永続データ構造が分からない人のためのスライド
Re永続データ構造が分からない人のためのスライドRe永続データ構造が分からない人のためのスライド
Re永続データ構造が分からない人のためのスライド
 
Chapter7 回帰分析の悩みどころ
Chapter7 回帰分析の悩みどころChapter7 回帰分析の悩みどころ
Chapter7 回帰分析の悩みどころ
 
PRML 上 1.2.4 ~ 1.2.6
PRML 上 1.2.4 ~ 1.2.6PRML 上 1.2.4 ~ 1.2.6
PRML 上 1.2.4 ~ 1.2.6
 
空間データのための回帰分析
空間データのための回帰分析空間データのための回帰分析
空間データのための回帰分析
 
因果推論の基礎
因果推論の基礎因果推論の基礎
因果推論の基礎
 
PRML 6.1章 カーネル法と双対表現
PRML 6.1章 カーネル法と双対表現PRML 6.1章 カーネル法と双対表現
PRML 6.1章 カーネル法と双対表現
 

Similar a 傾向スコアでみる ソーシャルネットワーク分析

理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門Hiroshi Unzai
 
20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pubYoichi Tokita
 
LS for Reinforcement Learning
LS for Reinforcement LearningLS for Reinforcement Learning
LS for Reinforcement Learningimlschedules
 
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展Shiga University, RIKEN
 
WWW2018 論文読み会 WebにおけるHuman Dynamics
WWW2018 論文読み会 WebにおけるHuman DynamicsWWW2018 論文読み会 WebにおけるHuman Dynamics
WWW2018 論文読み会 WebにおけるHuman Dynamicscyberagent
 
LET関西メソ研20140915公開版
LET関西メソ研20140915公開版LET関西メソ研20140915公開版
LET関西メソ研20140915公開版youwatari
 
変数同士の関連_MIC
変数同士の関連_MIC変数同士の関連_MIC
変数同士の関連_MICShushi Namba
 
第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討Masaru Tokuoka
 
統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-Shiga University, RIKEN
 
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践id774
 
Rm20150513 4key
Rm20150513 4keyRm20150513 4key
Rm20150513 4keyyouwatari
 
Introduction to statistics
Introduction to statisticsIntroduction to statistics
Introduction to statisticsKohta Ishikawa
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索するShiga University, RIKEN
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析Kunihiro Hisatsune
 
T検定と相関分析概要
T検定と相関分析概要T検定と相関分析概要
T検定と相関分析概要Junko Yamada
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門Yu Tamura
 
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」aitc_jp
 
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章Shushi Namba
 

Similar a 傾向スコアでみる ソーシャルネットワーク分析 (18)

理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門
 
20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub
 
LS for Reinforcement Learning
LS for Reinforcement LearningLS for Reinforcement Learning
LS for Reinforcement Learning
 
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
 
WWW2018 論文読み会 WebにおけるHuman Dynamics
WWW2018 論文読み会 WebにおけるHuman DynamicsWWW2018 論文読み会 WebにおけるHuman Dynamics
WWW2018 論文読み会 WebにおけるHuman Dynamics
 
LET関西メソ研20140915公開版
LET関西メソ研20140915公開版LET関西メソ研20140915公開版
LET関西メソ研20140915公開版
 
変数同士の関連_MIC
変数同士の関連_MIC変数同士の関連_MIC
変数同士の関連_MIC
 
第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討第2回DARM勉強会.preacherによるmoderatorの検討
第2回DARM勉強会.preacherによるmoderatorの検討
 
統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-
 
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践
 
Rm20150513 4key
Rm20150513 4keyRm20150513 4key
Rm20150513 4key
 
Introduction to statistics
Introduction to statisticsIntroduction to statistics
Introduction to statistics
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索する
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
 
T検定と相関分析概要
T検定と相関分析概要T検定と相関分析概要
T検定と相関分析概要
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門
 
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
 
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
 

Más de Hiroko Onari

teaming and weak internal information
teaming and weak internal informationteaming and weak internal information
teaming and weak internal informationHiroko Onari
 
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形Hiroko Onari
 
Data scientist casual talk in 白金台
Data scientist casual talk in 白金台Data scientist casual talk in 白金台
Data scientist casual talk in 白金台Hiroko Onari
 
はじめてのパターン認識勉強会 20130716
はじめてのパターン認識勉強会 20130716はじめてのパターン認識勉強会 20130716
はじめてのパターン認識勉強会 20130716Hiroko Onari
 
集合知プログラミング第2章推薦を行う
集合知プログラミング第2章推薦を行う集合知プログラミング第2章推薦を行う
集合知プログラミング第2章推薦を行うHiroko Onari
 
Social network analysis for startups ch6
Social network analysis for startups ch6Social network analysis for startups ch6
Social network analysis for startups ch6Hiroko Onari
 
Suicide ideation of individuals in online social networks tokyo webmining
Suicide ideation of individuals in online social networks tokyo webminingSuicide ideation of individuals in online social networks tokyo webmining
Suicide ideation of individuals in online social networks tokyo webminingHiroko Onari
 
2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワーク2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワークHiroko Onari
 
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215Hiroko Onari
 
複雑ネットワーク勉強会 二部グラフの基礎と応用 20120208
複雑ネットワーク勉強会  二部グラフの基礎と応用 20120208複雑ネットワーク勉強会  二部グラフの基礎と応用 20120208
複雑ネットワーク勉強会 二部グラフの基礎と応用 20120208Hiroko Onari
 
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122Hiroko Onari
 
統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座
統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座
統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座Hiroko Onari
 
Tokyo webmining 複雑ネットワークとデータマイニング
Tokyo webmining 複雑ネットワークとデータマイニングTokyo webmining 複雑ネットワークとデータマイニング
Tokyo webmining 複雑ネットワークとデータマイニングHiroko Onari
 

Más de Hiroko Onari (13)

teaming and weak internal information
teaming and weak internal informationteaming and weak internal information
teaming and weak internal information
 
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
 
Data scientist casual talk in 白金台
Data scientist casual talk in 白金台Data scientist casual talk in 白金台
Data scientist casual talk in 白金台
 
はじめてのパターン認識勉強会 20130716
はじめてのパターン認識勉強会 20130716はじめてのパターン認識勉強会 20130716
はじめてのパターン認識勉強会 20130716
 
集合知プログラミング第2章推薦を行う
集合知プログラミング第2章推薦を行う集合知プログラミング第2章推薦を行う
集合知プログラミング第2章推薦を行う
 
Social network analysis for startups ch6
Social network analysis for startups ch6Social network analysis for startups ch6
Social network analysis for startups ch6
 
Suicide ideation of individuals in online social networks tokyo webmining
Suicide ideation of individuals in online social networks tokyo webminingSuicide ideation of individuals in online social networks tokyo webmining
Suicide ideation of individuals in online social networks tokyo webmining
 
2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワーク2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワーク
 
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215
 
複雑ネットワーク勉強会 二部グラフの基礎と応用 20120208
複雑ネットワーク勉強会  二部グラフの基礎と応用 20120208複雑ネットワーク勉強会  二部グラフの基礎と応用 20120208
複雑ネットワーク勉強会 二部グラフの基礎と応用 20120208
 
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
 
統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座
統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座
統計学と複雑ネットワークのちょっと深いい話 - おしゃれStatistics @銀座
 
Tokyo webmining 複雑ネットワークとデータマイニング
Tokyo webmining 複雑ネットワークとデータマイニングTokyo webmining 複雑ネットワークとデータマイニング
Tokyo webmining 複雑ネットワークとデータマイニング
 

Último

20240209_case___________________________
20240209_case___________________________20240209_case___________________________
20240209_case___________________________i Smart Technologies
 
HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用
HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用
HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用wataruhonda3
 
「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料
「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料
「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料inoue13
 
【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf
【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf
【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf株式会社オプティマインド
 
令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdf
令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdf令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdf
令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdfjun_suto
 
Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料
Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料
Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料ssuser5a38bf
 
株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版
株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版
株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版DIGITAL VORN
 
20240319_case___________________________
20240319_case___________________________20240319_case___________________________
20240319_case___________________________i Smart Technologies
 
株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版
株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版
株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版DIGITAL VORN
 
株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版
株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版
株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版DIGITAL VORN
 
20240318_case___________________________
20240318_case___________________________20240318_case___________________________
20240318_case___________________________i Smart Technologies
 
ROMS_recruting_deck_for_website_20240322.pdf
ROMS_recruting_deck_for_website_20240322.pdfROMS_recruting_deck_for_website_20240322.pdf
ROMS_recruting_deck_for_website_20240322.pdfhirokisawa3
 
株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profile
株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profile株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profile
株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profilevrihomepage
 
株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版
株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版
株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版DIGITAL VORN
 
【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf
【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf
【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf株式会社オプティマインド
 

Último (16)

20240209_case___________________________
20240209_case___________________________20240209_case___________________________
20240209_case___________________________
 
HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用
HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用
HRMOS(ハーモス)タレントマネジメント_ご紹介資料_Saleshub掲載用
 
「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料
「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料
「育て」「動かし」「評価する」PRMツール。「PartnerProp」パートナープロップサービス資料
 
【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf
【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf
【株式会社オプティマインド】会社紹介資料(2024年04月更新)_中途採用.pdf
 
令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdf
令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdf令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdf
令和5年度_サステナブルツーリズムセミナー_ビジュアルレポート(公開用).pdf
 
Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料
Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料
Sportip, Inc. Company Deck 2024|株式会社Sportip紹介資料
 
Japan IT Week 2024 Brochure by 47Billion
Japan IT Week 2024 Brochure by 47BillionJapan IT Week 2024 Brochure by 47Billion
Japan IT Week 2024 Brochure by 47Billion
 
株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版
株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版
株式会社デジタルフォルン_会社説明資料~カルチャー~         2024年版
 
20240319_case___________________________
20240319_case___________________________20240319_case___________________________
20240319_case___________________________
 
株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版
株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版
株式会社デジタルフォルン_会社説明資料~事業内容~         2024年版
 
株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版
株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版
株式会社デジタルフォルン_会社説明資料~仕事内容~         2024年版
 
20240318_case___________________________
20240318_case___________________________20240318_case___________________________
20240318_case___________________________
 
ROMS_recruting_deck_for_website_20240322.pdf
ROMS_recruting_deck_for_website_20240322.pdfROMS_recruting_deck_for_website_20240322.pdf
ROMS_recruting_deck_for_website_20240322.pdf
 
株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profile
株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profile株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profile
株式会社ベクトル総研会社概要 Vector Research Institute (VRI) Corporate Profile
 
株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版
株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版
株式会社デジタルフォルン_会社説明資料~その他の働く環境~         2024年版
 
【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf
【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf
【株式会社オプティマインド】会社紹介資料_2024年4月11日更新(採用資料).pdf
 

傾向スコアでみる ソーシャルネットワーク分析

  • 2. Behavior  Correlation in  Network • ⼈人間の⾏行行動は時空間ネットワーク上ではクラスター化しやすい。 例)Christakis  &  Fowlerの有名な研究である「肥満は伝染する」 • ⼈人間の⾏行行動はしばしばネットワークの構造に「相関」があると⾔言われる。 -  Peer  influence(仲間による影響など:友達が買ったから⾃自分も買う) -  Homophily(類友:似たもの同⼠士は似たような⾏行行動を起こしやすい) -  Confounding  Factors(交絡因⼦子:周辺環境など外部の影響によって起こす⾏行行動) -  Selection(選択:トライアスロンをしている者同⼠士は友達になりやすい) • 注意!「相関関係は必ずしも因果関係を意味しない」 例)朝ごはんを⾷食べると成績があがる?       朝ごはんを⾷食べたら成績があがるという因果関係はない。       朝ごはんを⾷食べている⼦子は成績の平均が⾼高いという統計的に関連があるのだよ、というお話。
  • 3. 情報が伝播する上で重要となってくる 2つのネットワークの特徴 • Assortative  mixing  -  ネットワーク上の繋がっているノード(⼈人)同⼠士が似ている 傾向、あるいはその特性に何かしらの正の相関(assortative)がある。 mixingは⼈人間関係の場合であれば、話す⾔言語や⼈人種といった離散的性質のデータと、 年齢といったスカラー的性質のデータをmixして計算するということ[Newman  03] • Temporal  clustering  -  ネットワーク上の繋がっているノード(⼈人)の⾏行行動は時空間 的には独⽴立立している。例えば、幸せが伝染するといったときに、同時タイミングで幸せ になるわけではない。誰かが幸せになって、別の誰かが幸せになると時間的なタイミン グは独⽴立立している。とはいえ、ある程度時間的には固まって発⽣生するものである。
  • 5. InfluenceとHomophilyの定義する Influence Homophily j君がiPhoneよかったよ!と⾔言うので iさんとj君はiPhoneを買った。⼆二⼈人は友達 iさんはiPhoneを買った。 ではない。年齢、⾏行行動パターンが類似。 × ∗ ai ← ∗ aj ai ← ci . ∗ ai . si . aj ← cj . ∗ aj . sj . ∗   :iやjの⾏行行動や選択(例:肥満の伝染、友達が買ったので⾃自分も買う) a a  :iやjの他の⾏行行動や選択 c  :iやjの個⼈人属性(例:性別、年齢など) s  :iやjの状態(例:肥満、幸福など)
  • 6. InfluenceとHomophilyの違い • マーケティング戦略におけるInfluenceとHomophilyの違い -  ⼝口コミ戦略vsメディア広告戦略 -  インフルエンサーをターゲットにするvs顧客プロフィールから市場セグメントをする • 情報の伝播におけるInfluenceとHomophilyの違い -  influence-basedの情報伝播  -  連鎖反応、迅速、指数関数的な変化、予測が難しい -  homophily-basedの情報伝播  -  ノードの特性から予測可能であり統制しやすい
  • 7. InfluenceとHomophilyでは どちらの⽅方が影響⼒力力があるのだろうか • Yahoo!  Goという新サービスが、InfluenceとHomophilyのどちらの効果によって広 まっていったのかを観察した論⽂文がある[Sinan  Aral  et  al.(2009)] -  Homophilyは傾向スコアによるマッチングで算出 -  Influenceはランダムマッチングで算出 実際の研究論⽂文をみつつ 傾向スコアについて理解する
  • 8. DATA • データはYahoo!のメッセンジャーユーザ2700万 ⼈人のデータを利⽤用 • デモグラや地理情報などの詳細データを利⽤用 • 2007年7⽉月にローンチされたYahoo!  Goのアダ プト率や利⽤用率を5ヶ⽉月に渡って⽇日々計測した • サンプリングできたアダプターは53万ノード ランダムサンプルしたノードは320万ノード • 解析にはC++とComplex  Networks  Toolbox   for  Matlabを使ったらしい。共著者のLev   ※Yahoo!  GoはYahoo!  MailやYahoo!  Photなどのサービスや MuchnikさんのHPからDownloadできるみた Web上のコンテンツをPC、携帯、テレビからシームレスに利 ⽤用できるサービス。2010年にサービス停⽌止しているらしい。 い。http://www.levmuchnik.net/Content/woomplexNetworksPackage.html
  • 9. 傾向スコアとは? 実験することができない調査観察のデータなどの交絡因子の調整方法のこと。 処理変数と結果変数の両方に相関する外部変数のことで、 交絡因子を解析時に調整しないと因果関係が推定できない。 処理変数 結果変数 飲酒 癌 喫煙 例えば、癌になる人は飲酒との相関が高 いと出たとする。しかし、飲酒している 人は喫煙との相関も考えられるし、メタ ボとの相関も考えられる。 メタボ なので、癌の因果関係を求めるには、喫 煙とメタボの交絡も含めて計算する必要 がある。 交絡因子たち
  • 10. 傾向スコアとは? Treated  Group Untreated  Group Ti = 1 Ti = 0 Treated  Outcome   y1 Treated  Data Missing  Data Untreated  Outcome   Missing  Data Untreated  Data y0 Covariance Xi 因果関係を求める際、Treated  Groupの間での効果を調べるため、 Treated  Groupのy1とy0を使って計算したいのだが、 y0の⽅方は観測されていない⽋欠測データ(Missing  Data)なので⽤用いることができない。
  • 11. 傾向スコアとは? Treated  Group Untreated  Group Ti = 1 Ti = 0 Treated  Outcome   y1 Treated  Data Missing  Data Untreated  Outcome   y0 Missing  Data = Untreated  Data Covariance Xi そこで共変量(Covariance)の値がTreated  GroupとUntreated  Groupで 等しい時の割り当てはランダムと仮定をおき、 また共変量(Covariance)が同じならば T=0のy0の期待を代⽤用できるとすれば因果関係を計算することができる。 ※数式的証明は[宮川  04,  星野09]を参照
  • 12. 傾向スコアとは? 共変量 共変量を説明変数に加える 傾向スコアよりどちらの処理に 傾向スコア 割り付けられやすいか計算する Treated  Group Untreated  Group Ti = 1 Ti = 0 Treated  Outcome   y1 Treated  Data Missing  Data Untreated  Outcome   Missing  Data Untreated  Data y0 Covariance Xi
  • 13. 傾向スコアの定義 傾向スコアとは、割り付けられやすさの指標のこと。確率なので範囲は 0 ≤ ei ≤ 1. ei = p(zi = 1 | xi ) Xiの条件付きで処置1(z=1)に割り当てられる確率 ei : 対象者iがグループ1に割り当てられる確率 zi = 1 : 処置1に割り当て  ※割り当て変数は⼆二値{0,1} xi : 対象者iの共変量ベクトル
  • 14. 傾向スコアの推定 傾向スコアの真値はわからないので、データから推定する。 通常ロジスティック回帰モデルが使⽤用される。 1 ei = 1 + exp(−(α + βx)) ˆ ˆ この尤度を最⼤大化する最尤推定値{  ,  β }を⽤用いることで傾向スコアの推定値が求める。 α    1 ei = ˆ α ˆ 1 + exp(−(ˆ + βx)) (式1)
  • 15. ARAL論⽂文の傾向スコア Aral論⽂文では傾向スコアを使ってhomophily  effect(類友効果)を計測している。 exp[αit + βit Xit + it ] pit = P (Tit = 1) | Xit ) = 1 + exp[αit + βit Xit + it ] Tit = 1 : ある時間間隔ΔtにおいてYahoo!Goをアダプトした友⼈人が⼀一⼈人以上いる Xit : 対象者iの共変量ベクトル(33個のベクトルを使ったようだ) it : 対象者iの個体差 ※Δtは、              で計算される。 ∆t = ti − tj = R a a a      -  t    は、対象者iがアダプトした時間。   i a   -  tj は、対象者jがアダプトした時間。対象者iの友達である。    ※分⺟母分⼦子に                        +      it      it  +          を掛けると(式1)となる。どちらでも同じこと。 exp[αit     β    X           it ] この傾向スコアを使い、Adopt率=Treatedの数(n+)/Untreatedの数(n-)を計算する。
  • 16. ARAL論⽂文の傾向スコア ロジスティック回帰にε(個体差)を含めるかどうかの判断。 exp[αit + βit Xit + it ] pit = 1 + exp[αit + βit Xit + it ] -  ε(個体差)は観察者が観測していない興味のない量 -  個体差の過分散が⼤大きい場合、計算に含めないと結果が正しく推定できない   ※  αit + βit Xit             はpの平均値を変化させている→fixed  effect   はpの平均値を変化させずばらつきだけをかえている→random  effect   ※    it   ※  fixed  effectとrandom  effectの両⽅方を含む統計モデルを混合モデルという。   ※  過分散の⾒見見つけ⽅方については[久保  07]参照。 Aral論⽂文では、具体的にεにどんな値を設定しているのか記載されていないが 何かしらの調整を⾏行行なっているらしい、というのが数式よりわかる。
  • 20. おまけ 多変量解析をする際によく使われるモデル: -  Coxの⽐比例ハザードモデル -  ロジスティック回帰モデル -  傾向スコア 多変量解析をする際に時々使われるモデル: -  ベイジアンモデル -  ブーストラップ -  マッチング -  混合効果モデル [Biondi-Zoccai  11] 2000年のアメリカ⼤大統領選挙でブッシュとゴアでほぼ互⾓角の戦いだったが、結果を正 確に予測したのは1社だけ。この1社はネット調査を傾向スコアで調整し予測した。 [星野・楠⽊木  07]
  • 21. 今やっている「複雑ネットワーク勉強会」の開催場所 Facebookページ『複雑ネットワーク』: http://www.facebook.com/pages/%E8%A4%87%E9%9B %91%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF %E3%83%BC%E3%82%AF/309875385698514 References • Sinan  Aral,  Lev  Muhnik,  Arun  Sundararajan,   Distinguishing  influence-based  contagion  from  homophily-driven  diffusion  in  dynamic   networks (2009) • Aris  Anagnostopoulos,  Ravi  Kumar,  Mohammad  Mahdian,   Influence  and  Correlation  in  Social  Networks (2008) • M.  E.  J.  Newman,   Mixing  patterns  in  networks (2003) • Paul  R.  Rosenbaum,  Donald  B.  Robin,   The  central  Role  of  the  propensity  score  in  observational  studies  for  causal  effects (1983) • Giuseppe  Biondi-Zoccai,  et  al.,   Are  propensity  scores  really  superior  to  standard  multivariable  analysis? (2011) • M.  Scoledad  Cepeda,  et  al.,   Comparison  of  Logistic  Regression  versus  Propensity  Score  When  the  Number  of  Events  Is  Low  and  There   Are  Multiple  Confounders (2003) • 宮川雅⺒巳:『統計的因果推論』,朝倉書店(2009) • 星野崇宏:『調査観察データの統計科学』,岩波書店(2010) • Annette  J.  Dobson著/⽥田中豊・森川敏彦・⼭山中⽵竹春・冨⽥田誠訳:『⼀一般化線形モデル⼊入⾨門第2版』,共⽴立立出版(2011) • 増⽥田直紀・今野紀雄:『複雑ネットワーク-基礎から応⽤用まで』,近代科学社(2010) • 増⽥田直紀:『なぜ3⼈人いると噂が広まるのか』,⽇日本経済新聞出版社(2012) • ニコラス・A・クリスタキス、ジェイムズ・H・ファウラー著、⻤⿁鬼澤忍訳:『つながり-社会的ネットワークの驚くべき⼒力力』,講談社(2010) • 『⼈人の好みにクチコミは効かない』(2011).Wired  Japanese  Edition:  http://wired.jp/2011/12/26/%E3%80%8C%E4%BA%BA%E3%81%AE%E5%A5%BD%E3%81%BF%E3%81%AB %E3%82%AF%E3%83%81%E3%82%B3%E3%83%9F%E3%81%AF%E5%8A%B9%E3%81%8B%E3%81%AA%E3%81%84%E3%80%8D%E2%94%80%E2%94%80%E3%83%8F%E3%83%BC%E3%83%B4%E3%82%A1/ • @yokkuns:『Rで学ぶ傾向スコア解析⼊入⾨門』(2011).  slideshare:  http://www.slideshare.net/yokkuns/r-9387843 • @isseing333:『観測データでの効果推定(傾向スコア、IPW、DR)』(2011).  blog:  http://d.hatena.ne.jp/isseing333/20110511/1305124310 • 林岳彦:『傾向スコア:その概念とRによる実装』(2012).  slideshare:  http://www.slideshare.net/takehikoihayashi/propensity-score- analysis-seminar-japanese • 久保拓弥:『「個体差」を階層ベイズモデルであつかう』(2007).  pdf:  http://hosho.ees.hokudai.ac.jp/~kubo/stat/2006/b/kubostat2006b.pdf • 星野崇宏・楠⽊木良⼀一対談:『ネット調査を補正する「傾向スコア」の可能性』,(2007)  article:  http://adv.yomiuri.co.jp/ojo/02number/200709/09toku2.html