IIR 21 Link Analysis
- 2. • 21.1 Webのグラフ構造解析
– 21.1.1 アンカーテキスト重要
• 「ココをクリック」問題
– 頻出語にはペナルティを。
– アンカーテキストの拡大
• “evil empire”問題
– スパム対策が必要
- 3. • 21.2 PageRank
– リンク構造解析
– 全てのWebページに[0,1)のスコア
– ページ滞在確率
• ランダムウォーク
– テレポート
- 4. • 21.2.1 マルコフ連鎖
– 任意時点での推移確率を以下の行列で
表す
A B C Next status
A 0 0.5 0.5
N
i, Pij 1
B 1 0 0 j 1
1
C 0
0
Current status
- 9. 21.3 Hubs and Authorities
h(υ) = Σa y0
a (y0)
υ
a (y1)
y1
a (y2)
y2
Hubs Authorities
- 10. 21.3 Hubs and Authorities
a(υ) = Σh
y0 h (y0)
υ
h (y1)
y1
h (y2)
y2
Hubs Authorities
- 11. 21.3 Hubs and Authorities
HITS(Hyperlink-Induced Topic Search)
1. h(υ) = a(υ) = 1
2. 定常スコアの算出は固有ベクトルの算出と等価