Más contenido relacionado 11.12.06_論文紹介_Classification systems based on rough sets under the belief function framework2. 00. 目次
01. Introduction
02. Rough Sets, Generalization Distribution Table
03. Belief function theory
04. Classification Systems
05. Experiments
06. Summary
2011.12.07 雑誌会
1/ 45
8. 02. Rough Sets
Value Reduct
分類に不必要な条件属性値を消去し,決定表を単純化
する。
条件属性の部分集合Bを用いて,決定属性dによる同値
クラスに包含される同値クラスを構成するBのこと。
2011.12.07 雑誌会
7/ 45
12. 02. GDT - RS
GDTとRough Setsによるhybrid system
noisy data (矛盾のあるデータ) からルールを抽出する
[9, 41]
Strength S (P → Q)
ルール条件部
のPのstrengh
2011.12.07 雑誌会
ルールの
noise rate
11/ 45
13. 02. GDT - RS
Pのstrength
:PGを満足する対象の数
:Pを満足する可能性のある対象の数
noise rate
:Pを満足する対象のうちQに属する対象の数
2011.12.07 雑誌会
12/ 45
14. 03. Belief function theory
: frame of discernment(識別空間)
bba:basic belief assignment(基本信念割当)
belief function:信念関数
m で表す。
bbm:basic belief mass
m(E)で表す。
2011.12.07 雑誌会
13/ 45
15. 03. Belief function theory
Belief function:
Plausibility function:
具体例
0.5
m(x1) = 0.2, m(x1, x2) = 0.3
m(x2, x3) = 0.5
bel(x1)=0.2, bel(x1, x2)=0.5
pl(x1)=0.5, pl(x1,x2)=1.0
2011.12.07 雑誌会
0.3
0.2
x1
x2
x3
14/ 45
16. 03. Belief function theory
異なる情報源を結合した bbaを考える。
Conjunctive rule:両方の情報源が共に信頼できる[31]
Average rule:両方の証拠が対立する [21]
2011.12.07 雑誌会
15/ 45
18. 03. Belief function theory
Decision Making
Credal level
信念を belief function で表す。
Pignistic level
確率的な関数 pignistic probabilitiesで算出した結果を下
に意思決定を行う。
2011.12.07 雑誌会
17/ 45
26. 04. Belief Rough Set Classifier
belief function の下でのClassification Approach
STEP1. 冗長な条件属性の消去
- 縮約を求め,コアを抽出する。
縮約の算出に計算時間がかかってしまうので,ヒューリ
スティックな手法を適用する。(see Section 4.4)
2011.12.07 雑誌会
25/ 45
27. 04. Belief Rough Set Classifier
STEP2. 冗長な対象の消去
- 同じ条件属性を持つ対象を見つけ,それらの基本信念割
当を結合する。
2011.12.07 雑誌会
26/ 45
29. 04. Belief Rough Set Classifier
Belief decision rules の生成
Example
この結果とPignistic probabilities[p. 17]による計算を行い,
未知対象を分類する。
2011.12.07 雑誌会
28/ 45
30. 04. BRSC based on GDT
STEP 1. Generalization Decision Tableの生成
- 不完全な決定表の下でも通常どおり算出可能
STEP 2. compound object を定義
: compound object
それぞれのcompound object について,基本信念割当を計算する。
2011.12.07 雑誌会
29/ 45
31. 04. BRSC based on GDT
STEP 3. 矛盾したcompound objectsの消去
:noise rate
の条件を満たす
とする。
なければ,
2011.12.07 雑誌会
が存在したら,
の決定属性値を
の決定属性値を
とする。
30/ 45
32. 04. BRSC based on GDT
STEP 4. 決定ルールの最小記述長
- Discernibility vector を識別不能行列Aから生成
:対象 i , j 間で決定属性値と条件属性値が異なる条件属性の集合
Discernibility fucntion
を計算する。
2011.12.07 雑誌会
を用いてすべてのreduct values
31/ 45
33. 04. BRSC based on GDT
STEP 5. 最も良いルールの選択
- 等式(13)より決定ルールのstrength を求める。
- strength と記述長を考慮して最も良いルールを確定
STEP 6. Stopping criterion
2011.12.07 雑誌会
32/ 45
35. 04. Heuristic method
Algorithm
← コアを求め,それをRとする
← コア以外の条件属性の集合を,Pとする
←Rのdependency が閾値以下か判定
←UからRのPOS領域にある対象を引く
←条件属性Cを追加してPOS領域の濃度を計算
←RとPを更新する
2011.12.07 雑誌会
と
を分割してできた集合
族の要素の最も大きい濃度
とする
34/ 45
36. 05. Experimentation
BRSC と BRSC-GDTの2つのアプローチを評価する
実験1:UCI のデータ
人工的にuncertainly の程度を定める
Low degree:0 < P ≦ 0.3
Middle degree:0.3 < P ≦ 0.6
High degree:0.6 < P ≦ 1.0
2011.12.07 雑誌会
35/ 45
37. 05. Experimentation
実験2:Webアクセスログのデータ
Saint Mary’s Univ. のアクセスログデータ
140の生徒が受講する授業へのアクセス
アクセスから3つの決定属性udを決定
Studious, Crammers, Workers
アクセスログから以下の条件属性を設定
アクセス環境,アクセスした時間帯,アクセスした数,ノート
のダウンロード回数
K-meansで対象がudiに属する距離を計算し,その後以下の式でbba
を求める。
2011.12.07 雑誌会
36/ 45