SlideShare una empresa de Scribd logo
1 de 25
Descargar para leer sin conexión
Community Detection
-  Girvan Newman Algorithm
-  Newman Algorithm
Community Detectionって?
あるネットワークの中で、	
  
密にリンクされたノードの集まりを見つける。	
  

コミュニティ間は疎

コミュニティ内は密
何の役に立つ?
似た特徴を持つノード同士が密にリンクされる傾向	
  
(Assorta)ve	
  Mixing)を持つネットワークにおいて	
  

Social Networks

WWW

Route

各ノードの特徴情報を用いずに、	
  
ネットワーク構造から似たノードのグループを発見できる。	
  
2つの階層クラスタリングアルゴリズム
Girvan-Newman Algorithm
Newman,	
  M.E.J.,	
  Girvan,	
  M.,	
  2004.	
  Finding	
  and	
  evalua)ng	
  community	
  structure	
  in	
  networks.	
  	
  
Physical	
  Review	
  E,	
  69(2),	
  026113.	
  	
  

Newman Algorithm
Newman,	
  M.E.J.,	
  2004.	
  Fast	
  algorithm	
  for	
  detec)ng	
  community	
  structure	
  in	
  networks.	
  
Physical	
  Review	
  E,	
  69(6),	
  066133.	
  	
  
2つの階層クラスタリングアルゴリズム
Girvan-Newman Algorithm

Newman Algorithm
2つの階層クラスタリングアルゴリズム
Girvan-Newman Algorithm

Newman Algorithm
Girvan-Newman Algorithm
Girvan-Newman Algorithm
グラフの中で、最も「コミュニティ間をつないでいる」可能性の高いエッジを見つけ、	
  
そのエッジを除去する。	
  
コミュニティ間をつなぐエッジ、どう見つける?
Shortest-­‐path	
  betweenness	
  
同一コミュニティ内の二点間の最短経路はほとんど重複しないはず。	
  

別々のコミュニティに属する二点間の最短経路の	
  
多くが同じエッジを通過するはず。	
  
デンドログラム
出力はコミュニティ分割の入れ子構造を表すデンドログラム。	
  

ネットワーク	
  

デンドログラム	
  
デンドログラム

どのコミュニティ構造が最適かを計る指標が必要。	
  
Modularity Q
N

Q = ∑ (eii − a )
2
i

i=1

N

(-­‐1/2<=Q<=1)	
  

: コミュニティ数	
  

eii : 総エッジ数に対する	
  

  両端がコミュニティ i	
  に含まれるエッジの割合	
  

ai : 総エッジ数に対する	
  

  少なくとも片端がコミュニティ i	
  に含まれるエッジの割合	
  
Modularity Qの意味
N

Q = ∑ (eii − a )
2
i

i=1
-­‐  「コミュニティ内のエッジ数が多い」だけでは不十分。	
  
-­‐  それだと全ノードが同じコミュニティに属している場合が最大。	
  
-­‐  ランダムグラフにおけるコミュニティ内エッジ数の期待値と比較。	
  
Modularity Qの意味
同じコミュニティに属するノードv,	
  ノードwの組み合わせについて	
  

1
=
∑(Avw − Pvw )δ (Cv, Cw )
2m vw
vw間にエッジが張られていれば1,	
  	
  
無ければ0	
  

同じ度数のランダムグラフで	
  
vw間にエッジが張られる確率	
  
Modularity Qが最大になる構造を採用する。

(Newman	
  and	
  Girvan,	
  2004)	
  

Community	
  数	
  
Girvan-Newman Algorithmの欠点
計算量が非常に大きい。	
  
-­‐  消去するエッジを見つけるための	
  
	
  betweennessの計算がO(mn)	
  
	
  
-­‐  全エッジを消去するためm回繰り返すので	
  
	
  合計O((m^2)n)	
  
Newman Algorithm
Newman Algorithm
Betweennessの計算はコストが高い。	
  
モジュラリティ値を上げる事が目的なら、一々betweennessの計算をせずに	
  
最初からモジュラリティについての最大化問題と捉えたらどうか。	
  
コミュニティ併合時のモジュラリティ上昇量に着目	
  

ΔQ	
  

モジュラリティQ=0	
  

モジュラリティQ=0+ΔQ	
  
コミュニティ合併時のモジュラリティ上昇量に着目

合併時のモジュラリティ上昇が大きい	
  

合併してもモジュラリティ上昇は少ない	
  

ΔQij = Qnew − (Qi + Q j ) = eij + e ji − 2ai a j = 2(eij + ai a j )
Newman Algorithm
Newman Algorithmの計算量
	
  
-­‐  コミュニティの併合とΔQの再計算にO(m+n)	
  
-­‐  全ノードが一つのコミュニティになるまで繰り返す	
  
	
  ので、全体としてO((m+n)n)	
  
-­‐	
   後にデータ構造を工夫したCNMアルゴリズムに
	
  よってO(n	
  log^2n)まで小さくなった。	
  
	
  
Girvan Newman VS Newman

精度はほとんど同じか、Girvan-­‐Newmanの方が少し良い程度。	
  
Girvan Newman VS Newman   (Pythonで実装)
まとめ
Girvan-­‐Newman	
  Algorithm	
  
-­‐  トップダウンでコミュニティを分割していく	
  
-­‐  Shortest-­‐path	
  betweennessに基づいてエッジを消去	
  
-­‐  O((m^2)n)	
  
Newman	
  Algorithm	
  
-­‐  ボトムアップでコミュニティを併合していく	
  
-­‐  モジュラリティの最大化が目的	
  
-­‐  コミュニティ併合時のモジュラリティ上昇に着目	
  
-­‐  O((m+n)n)	
  
References
-­‐	
  Girvan-­‐Newman	
  Algorithm	
  
Newman,	
  M.E.J.,	
  Girvan,	
  M.,	
  2004.	
  Finding	
  and	
  evalua)ng	
  community	
  structure	
  in	
  networks.	
  	
  
Physical	
  Review	
  E,	
  69(2),	
  026113.	
  	
  
(hZp://arxiv.org/abs/cond-­‐mat/0308217)	
  

-­‐	
  Newman	
  Algorithm	
  
Newman,	
  M.E.J.,	
  2004.	
  Fast	
  algorithm	
  for	
  detec)ng	
  community	
  structure	
  in	
  networks.	
  	
  
Physical	
  Review	
  E,	
  69(6),	
  066133.	
  
(hZp://arxiv.org/abs/cond-­‐mat/0309508)	
  	
  

-­‐	
  CNM	
  Algorithm	
  
Clauset,	
  A.,	
  Newman,	
  M.E.J.,	
  Moore,	
  C.,	
  2004.	
  Finding	
  community	
  structure	
  in	
  very	
  large	
  networks.	
  	
  
Physical	
  Review	
  E,	
  70(6),	
  066111.	
  	
  
(hZp://arxiv.org/abs/condmat/0408187)	
  

-­‐	
  各種コミュニティ発見アルゴリズムの比較	
  
Lancichine`,	
  A.,	
  Fortunato,	
  S.,	
  2009.	
  Community	
  detec)on	
  algorithms:	
  a	
  compara)ve	
  analysis.	
  	
  
Physical	
  Review	
  E,	
  80(5),	
  056117.	
  
(hZp://arxiv.org/abs/0908.1062)	
  	
  

Más contenido relacionado

La actualidad más candente

各OSにおいて、OpenCVをpythonから使う方法
各OSにおいて、OpenCVをpythonから使う方法各OSにおいて、OpenCVをpythonから使う方法
各OSにおいて、OpenCVをpythonから使う方法Katsuhiro Morishita
 
[DL輪読会]Vector-based navigation using grid-like representations in artificial ...
[DL輪読会]Vector-based navigation using grid-like representations in artificial ...[DL輪読会]Vector-based navigation using grid-like representations in artificial ...
[DL輪読会]Vector-based navigation using grid-like representations in artificial ...Deep Learning JP
 
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
[論文解説]Unsupervised monocular depth estimation with Left-Right ConsistencyRyutaro Yamauchi
 
RealSenseとYOLOを用いた物体把持
RealSenseとYOLOを用いた物体把持RealSenseとYOLOを用いた物体把持
RealSenseとYOLOを用いた物体把持NaotakaKawata
 
分布あるいはモーメント間距離最小化に基づく統計的音声合成
分布あるいはモーメント間距離最小化に基づく統計的音声合成分布あるいはモーメント間距離最小化に基づく統計的音声合成
分布あるいはモーメント間距離最小化に基づく統計的音声合成Shinnosuke Takamichi
 
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発LINE Corporation
 
スプラトゥーンから見える“ハマる”しかけ
スプラトゥーンから見える“ハマる”しかけスプラトゥーンから見える“ハマる”しかけ
スプラトゥーンから見える“ハマる”しかけAzusa Akaishi
 
研究について思うところ | What i think about research (in Japanese)
研究について思うところ | What i think about research (in Japanese)研究について思うところ | What i think about research (in Japanese)
研究について思うところ | What i think about research (in Japanese)Yuta Itoh
 
自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSEC
自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSEC自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSEC
自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSECNUProtein Co., Ltd
 
BRDFモデルの変遷
BRDFモデルの変遷BRDFモデルの変遷
BRDFモデルの変遷Teppei Kurita
 
[DL輪読会]A System for General In-Hand Object Re-Orientation
[DL輪読会]A System for General In-Hand Object Re-Orientation[DL輪読会]A System for General In-Hand Object Re-Orientation
[DL輪読会]A System for General In-Hand Object Re-OrientationDeep Learning JP
 
フーリエ変換を用いたテクスチャ解像度推定とその応用
フーリエ変換を用いたテクスチャ解像度推定とその応用フーリエ変換を用いたテクスチャ解像度推定とその応用
フーリエ変換を用いたテクスチャ解像度推定とその応用Hajime Uchimura
 
ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争Yosuke Shinya
 
ピンホールカメラモデル
ピンホールカメラモデルピンホールカメラモデル
ピンホールカメラモデルShohei Mori
 
학원 업종 네이버 온라인 마케팅
학원 업종 네이버 온라인 마케팅학원 업종 네이버 온라인 마케팅
학원 업종 네이버 온라인 마케팅더게임체인저스
 
Triplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identificationTriplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identificationtancoro
 
ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)
ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)
ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)Youichiro Miyake
 

La actualidad más candente (20)

ごちうサーチ
ごちうサーチごちうサーチ
ごちうサーチ
 
各OSにおいて、OpenCVをpythonから使う方法
各OSにおいて、OpenCVをpythonから使う方法各OSにおいて、OpenCVをpythonから使う方法
各OSにおいて、OpenCVをpythonから使う方法
 
[DL輪読会]Vector-based navigation using grid-like representations in artificial ...
[DL輪読会]Vector-based navigation using grid-like representations in artificial ...[DL輪読会]Vector-based navigation using grid-like representations in artificial ...
[DL輪読会]Vector-based navigation using grid-like representations in artificial ...
 
15 人工知能入門
15 人工知能入門15 人工知能入門
15 人工知能入門
 
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
 
RealSenseとYOLOを用いた物体把持
RealSenseとYOLOを用いた物体把持RealSenseとYOLOを用いた物体把持
RealSenseとYOLOを用いた物体把持
 
分布あるいはモーメント間距離最小化に基づく統計的音声合成
分布あるいはモーメント間距離最小化に基づく統計的音声合成分布あるいはモーメント間距離最小化に基づく統計的音声合成
分布あるいはモーメント間距離最小化に基づく統計的音声合成
 
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
 
スプラトゥーンから見える“ハマる”しかけ
スプラトゥーンから見える“ハマる”しかけスプラトゥーンから見える“ハマる”しかけ
スプラトゥーンから見える“ハマる”しかけ
 
XGBoostLSS - An extension of XGBoost to probabilistic forecasting, Alexander ...
XGBoostLSS - An extension of XGBoost to probabilistic forecasting, Alexander ...XGBoostLSS - An extension of XGBoost to probabilistic forecasting, Alexander ...
XGBoostLSS - An extension of XGBoost to probabilistic forecasting, Alexander ...
 
研究について思うところ | What i think about research (in Japanese)
研究について思うところ | What i think about research (in Japanese)研究について思うところ | What i think about research (in Japanese)
研究について思うところ | What i think about research (in Japanese)
 
自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSEC
自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSEC自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSEC
自然言語処理と機械学習を用いたタンパク質高発現塩基配列の創製@18th JSEC
 
BRDFモデルの変遷
BRDFモデルの変遷BRDFモデルの変遷
BRDFモデルの変遷
 
[DL輪読会]A System for General In-Hand Object Re-Orientation
[DL輪読会]A System for General In-Hand Object Re-Orientation[DL輪読会]A System for General In-Hand Object Re-Orientation
[DL輪読会]A System for General In-Hand Object Re-Orientation
 
フーリエ変換を用いたテクスチャ解像度推定とその応用
フーリエ変換を用いたテクスチャ解像度推定とその応用フーリエ変換を用いたテクスチャ解像度推定とその応用
フーリエ変換を用いたテクスチャ解像度推定とその応用
 
ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争
 
ピンホールカメラモデル
ピンホールカメラモデルピンホールカメラモデル
ピンホールカメラモデル
 
학원 업종 네이버 온라인 마케팅
학원 업종 네이버 온라인 마케팅학원 업종 네이버 온라인 마케팅
학원 업종 네이버 온라인 마케팅
 
Triplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identificationTriplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identification
 
ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)
ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)
ゲームにおけるニューラルネットワーク「NERO における学習と進化 」(後半)
 

Destacado

Datamining 8th Hclustering
Datamining 8th HclusteringDatamining 8th Hclustering
Datamining 8th Hclusteringsesejun
 
Advanced Methods in Network Science: Community Detection Algorithms
Advanced Methods in Network Science: Community Detection Algorithms Advanced Methods in Network Science: Community Detection Algorithms
Advanced Methods in Network Science: Community Detection Algorithms Daniel Katz
 
大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田Kosuke Shinoda
 
Community detection in social networks
Community detection in social networksCommunity detection in social networks
Community detection in social networksFrancisco Restivo
 
Communities and dynamics in social networks
Communities and dynamics in social networksCommunities and dynamics in social networks
Communities and dynamics in social networksFrancisco Restivo
 

Destacado (7)

R seminar on igraph
R seminar on igraphR seminar on igraph
R seminar on igraph
 
Datamining 8th Hclustering
Datamining 8th HclusteringDatamining 8th Hclustering
Datamining 8th Hclustering
 
Advanced Methods in Network Science: Community Detection Algorithms
Advanced Methods in Network Science: Community Detection Algorithms Advanced Methods in Network Science: Community Detection Algorithms
Advanced Methods in Network Science: Community Detection Algorithms
 
大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田
 
Community detection in social networks
Community detection in social networksCommunity detection in social networks
Community detection in social networks
 
Communities and dynamics in social networks
Communities and dynamics in social networksCommunities and dynamics in social networks
Communities and dynamics in social networks
 
Roles In Networks
Roles In NetworksRoles In Networks
Roles In Networks
 

Community detection