SlideShare una empresa de Scribd logo
1 de 28
Descargar para leer sin conexión
「オープンソースで学ぶ社会ネットワーク分析」
   第3章 中心性、権力、ボトルネック




        近藤しげ
        @shigex

         2012.7.20
自己紹介

 だれ:近藤しげ
 仕事:WEB系フリープログラマー
 学校:電気通信大学
 ゼミ:自然言語処理
 会社:虹なう
 好き:一週間後に迫ったフジロック
 ツイ:@shigex
いろいろと間違い
 この本、誤植がちょっと多いです。読むときは気をつけて!




•  Degree(次数) を「次元」と訳している箇所がある
•  "Betweenness centrality(媒介中心性)"を「媒介近接性」
•  「エゴのつながりは代えが効く。世界は彼の横をすり抜けていく」
  →正誤情報のためのwikiつくりました http://tokyosna.kondou.com
  →次回以降の発表者の方は、@shigexまでご連絡を。原著あり
原著の目次@USオライリー
  翻訳版の目次は章節までだけど、原著の目次は章節項まで
  書いてあるので、照らしあわせて読むとわかりやすいです。
「Social	
  Network	
  Analysis	
  for	
  Startups」




  USのオライリーのサイトの原著の公式ページから目次をみることができます
3章 中心性、権力、ボトルネック
3-1.サンプルデータ:ロシア人がやってくる
  i.      PythonとNetworkXについて       原著の目次より。	
  
                                    少し補足を入れてます。	
  ii.     LievJournalからノードとエッジを読み出す
  iii.    スノーボールサンプリング
  iv.     サンプルデータセットのファイルへの保存、ファイルからのロード
3-2.中心性
  i.  このネットワークでより重要なのは誰か
  ii.  「セレブ」を見つける ‒ 次数中心性
  iii.  ゴシップモンガー(ゴシップ屋)を探す ‒ 近接中心性
  iv.  コミュニケーションのボトルネック、コミュニティの架け橋を見つける ‒ 媒介中心性
  v.  中心性指標の組み合わせ
  vi.  誰が「灰色の枢機卿」か ‒ 固有ベクトル中心性
  vii.  Kloutスコア
  viii.  PageRank-Googleの中心性計測のアルゴリズム ‒ PageRankアルゴリズム
3-3.中心性指標ではわからないこと
第3章の全体の流れ


3-1. サンプルデータ取得
3-2. 4つの中心性指標の紹介+k,g
3-3. 中心性指標の問題点
3-1. サンプルデータ取得


Live Journal




   1999	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2002	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2003	
  	
  	
  	
  	
  	
  2003	
  	
  	
  	
  	
  	
  	
  2004	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2006	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2011	
  
                      サービス開始年
3-1. サンプルデータ取得


スノーボールサンプリング

 アルゴリズム
  –    中央のノードからスタート
  –    中央のノードの友人を取得
  –    友人1人1人について
       •    友人の友人を取得
       •    友人の友人の1人1人について
            –    友人の友人の友人を取得
            –    続く
3-2. 4+k+gの中心性指標の紹介


i. 重要なのはだれ?


 社会ネットワーク分析の第一歩

 権力、影響力、その他個人的な特性

 インフルエンサーを調べる前の第一歩
3-2. 4+k+gの中心性指標の紹介


ii. 次数中心性
 •  degree centrality

 •  次数とはノードが持っている接続の数

 •  次数中心性が高い
   =たくさんの人とつながってる、ハブ
   =入りの矢印が多いと、人気の高さ
    出る矢印が多いと、情報発信/収集力

 •  セレブ(=有名人)

 •  Twitter : フォロワーの数
3-2. 4+k+gの中心性指標の紹介


ii. 次数中心性

 •  日本のツイッター有名人は?


     1位     169万


     2位     150万


     3位     118万
                   2012年7月現在 meyou.jp調べ
3-2. 4+k+gの中心性指標の紹介


iii. 近接中心性

 •  closeness centrality

 •  全ての他ノードとの距離の平均

 •  近接中心性が高い
   =少ないリンクで他のノードにたどりつける
   =情報伝搬効率が良い

 •  ゴシップモンガー(=おしゃべり)
3-2. 4+k+gの中心性指標の紹介


iii. 近接中心性

計算方法
 a.  他のすべてのノードへの平均距離を計算
 b.  最大の距離で割る
                          N:	
  ノード数	
  
 c.  近接中心性 = 1 ÷ 平均距離     d(vi,	
  vj):	
  ノードvi,vjの距離	
  
                          Li	
  :	
  viから他のN-­‐1点への平均距離	


     F	
     E	

     C	
             D	

       A	
     B
3-2. 4+k+gの中心性指標の紹介


iii. 近接中心性




    ロシア人ネットワークの
    近接中心性のtop10
                     図3-6.ロシア人ネットワークの近接中心性の分布

これは、かなり密なネットワークであるにもかかわらず、このLJネットワークのコアは、それぞれのメン
バーから3ステップ以上離れたところにローカルなサブセットをもっているということを示している。
つまり、コアに属している人々でも、ネットワークのコアのなかにまったく見えない部分が含まれていると
いうことだ。
3-2. 4+k+gの中心性指標の紹介


iv. 媒介中心性

•  betweenness centrality

•  最も使われている

•  コミュニティのボトルネック、架け橋

•  どれだけ最短経路上にいるかを計る
3-2. 4+k+gの中心性指標の紹介

                                    0	
iv. 媒介中心性                0	

                                          0.6	
   0	
  計算方法
   1.  すべてのノードペアの最短単純路を計算
   2.  全てのノード i について i が含まれている
       最短単順路の数を数える
   3.  0≦b≦1になるように正規化
3-2. 4+k+gの中心性指標の紹介


iv. 媒介中心性

•  予防接種などに応用

•  「流れ」は最短路を通ると仮定

•  媒介中心性が高くなるためには、
 ノードが貴重な最短路の上にいることが重要

•  複雑ネットワークでは媒介中心性を
 「負荷」と呼ぶこともある
3-2. 4+k+gの中心性指標の紹介


v. 3つの中心性指標の組み合わせ

 次数中心性と媒介中心性は
 だいたい相関するが、
                 媒
 そうではない場合もある     介



                            次数
                             増田・今野(2010)「複雑ネットワーク」p35	




       表3-1. 中心性指標の組み合わせ
3-2. 4+k+gの中心性指標の紹介


v. 3つの中心性指標の組み合わせ

            •  3指標のtop10をマージした表
            •  ネットワークのエリートリスト


            •  全部で18人


            •  媒介性が目立つのはvalerois
3-2. 4+k+gの中心性指標の紹介


vi. 固有ベクトル中心性

 •  ゴッドファーザーは表にでてこない

 •  実力者につながってるとエラくなる

 •  eigenvector centrality

 •  リンク先のノードの次数によって、
  リンクを重み付けする

 •  「灰色の枢機     」(影の実力者)
3-2. 4+k+gの中心性指標の紹介


vi. 固有ベクトル中心性

 計算方法
  1.  まず、すべてのノードに1という中心性スコアを与える
  2.  ノードの隣にある全てのノードの中心性の合計として
      各ノードのスコアを再計算する




  3.  ここの値を最大値で割って、vを正規化する
  4.  vの値が変化をやめるまでステップ2と3を繰り返す
3-2. 4+k+gの中心性指標の紹介


補. 4つの中心性指標を比較




             増田・今野(2010)「複雑ネットワーク」p33より
3-2. 4+k+gの中心性指標の紹介


vii. クラウトスコア

 •  SNSでの影響力を計るスカウター

 •  2010年にサービス開始

 •  当初は、Twitterのみを基に算出していた

 •  現在はTwitter, Facebook, Google+
3-2. 4+k+gの中心性指標の紹介


vii. クラウトスコア

 •  Klout Score : 総合スコア

 •  True Reach : 実際に届いている数

 •  Amplification : リアクションの起きる確率

 •  Network Impact : ネットワークの影響力
3-2. 4+k+gの中心性指標の紹介


vii. クラウトスコア

 •  単一の指標ではノードの中心性を表現できない

 •  ノードの評価基準はいろいろある
  →クラウトスタイルってのも…
3-2. 4+k+gの中心性指標の紹介


viii. PageRank(google)

 •  外からのリンクで中心性を計る

 •  有向グラフ
 計算式




 •  収束するには時間がかかるけど、途中でも使える
 •  スケーラビリティがある
3-3. 中心性指標の問題点


中心性指標の問題点


•  単なる静的な点(ノード)の観察
•  エッジの分析や、ネットワークの動的な分析
はできない
•  4章は、ノードを超えて三者間の関係トライ
アドについて考える
書籍情報
•  オープンソースで学ぶ社会ネットワーク分析
 –    Maksim Tsvetovat,Alexander Kouznetsov著
 –    長尾高弘訳
 –    オライリー社
 –    2012年5月
 –    誤植が多いので、原著も買うはめに(泣)


•  「複雑ネットワーク―基礎から応用まで」
 –    増田直紀,今野紀雄
 –    近代科学社
 –    2010年4月
 –    理論書。このスライドでも、これから図を引用しました。
      オススメです。テキストが終わったら、次はこれでレベルアップを!

Más contenido relacionado

La actualidad más candente

ベータ分布の謎に迫る
ベータ分布の謎に迫るベータ分布の謎に迫る
ベータ分布の謎に迫るKen'ichi Matsui
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度Seiichi Uchida
 
全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み株式会社MonotaRO Tech Team
 
協調フィルタリング入門
協調フィルタリング入門協調フィルタリング入門
協調フィルタリング入門hoxo_m
 
2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワーク2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワークHiroko Onari
 
差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)Kentaro Minami
 
Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Shintaro Fukushima
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII
 
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016Tokoroten Nakayama
 
2章グラフ理論スピード入門
2章グラフ理論スピード入門2章グラフ理論スピード入門
2章グラフ理論スピード入門Teruo Kawasaki
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎Koichiro Gibo
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量についてla_flance
 
Visual Studio CodeでRを使う
Visual Studio CodeでRを使うVisual Studio CodeでRを使う
Visual Studio CodeでRを使うAtsushi Hayakawa
 
大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田Kosuke Shinoda
 
機械学習による生存予測
機械学習による生存予測機械学習による生存予測
機械学習による生存予測Yasuaki Sakamoto
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15Yoichi Ochiai
 
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎Preferred Networks
 

La actualidad más candente (20)

ベータ分布の謎に迫る
ベータ分布の謎に迫るベータ分布の謎に迫る
ベータ分布の謎に迫る
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
 
全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み
 
協調フィルタリング入門
協調フィルタリング入門協調フィルタリング入門
協調フィルタリング入門
 
Gephi Tutorial Visualization (Japanese)
Gephi Tutorial Visualization (Japanese)Gephi Tutorial Visualization (Japanese)
Gephi Tutorial Visualization (Japanese)
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワーク2部グラフとソーシャルネットワーク
2部グラフとソーシャルネットワーク
 
差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)
 
Marp Tutorial
Marp TutorialMarp Tutorial
Marp Tutorial
 
Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
 
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
 
2章グラフ理論スピード入門
2章グラフ理論スピード入門2章グラフ理論スピード入門
2章グラフ理論スピード入門
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量について
 
Visual Studio CodeでRを使う
Visual Studio CodeでRを使うVisual Studio CodeでRを使う
Visual Studio CodeでRを使う
 
大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田
 
機械学習による生存予測
機械学習による生存予測機械学習による生存予測
機械学習による生存予測
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15
 
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
 

Similar a 社会ネットワーク勉強会第3回発表

ネットワーク研究の最前線
ネットワーク研究の最前線ネットワーク研究の最前線
ネットワーク研究の最前線Kazuyuki Shudo
 
Information Network or Social Network?
Information Network or Social Network?Information Network or Social Network?
Information Network or Social Network?Motoka Fukui
 
Fast community structure identification of small world networks
Fast community structure identification of small world networksFast community structure identification of small world networks
Fast community structure identification of small world networksTokyo Institute of Technology
 
WWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social NetworksWWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social NetworksYuto Yamaguchi
 
Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析Hiroko Onari
 
ネットワーク科学の応用について
ネットワーク科学の応用についてネットワーク科学の応用について
ネットワーク科学の応用についてYuya Takashina
 
Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430Yuki Ogasawara
 
大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズムTakuya Akiba
 
「計算社会科学入門」5章 ネットワーク
「計算社会科学入門」5章 ネットワーク「計算社会科学入門」5章 ネットワーク
「計算社会科学入門」5章 ネットワークFujio Toriumi
 

Similar a 社会ネットワーク勉強会第3回発表 (9)

ネットワーク研究の最前線
ネットワーク研究の最前線ネットワーク研究の最前線
ネットワーク研究の最前線
 
Information Network or Social Network?
Information Network or Social Network?Information Network or Social Network?
Information Network or Social Network?
 
Fast community structure identification of small world networks
Fast community structure identification of small world networksFast community structure identification of small world networks
Fast community structure identification of small world networks
 
WWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social NetworksWWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social Networks
 
Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析
 
ネットワーク科学の応用について
ネットワーク科学の応用についてネットワーク科学の応用について
ネットワーク科学の応用について
 
Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430
 
大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム
 
「計算社会科学入門」5章 ネットワーク
「計算社会科学入門」5章 ネットワーク「計算社会科学入門」5章 ネットワーク
「計算社会科学入門」5章 ネットワーク
 

社会ネットワーク勉強会第3回発表