SlideShare una empresa de Scribd logo
1 de 28
POPONG
Politician Network Analysis
2011-07-23
Eunjeong L. Park
Jooseoung Park
popong 2
Contents
1. 의안 정보 분석
2. 의원 정보 분석
popong
실험용 Raw data
► 국회 의안 정보 시스템 - 제 18대 국회 의안 중 처리 의안1)
3
1.1. 의안 정보 설명
1) http://likms.assembly.go.kr/bill/jsp/main.jsp
popong
► 의원 별 참여 의안에 대한 participation binary matrix 구성
• 단, 의안 이름이 같은데 발의자 구성이 같은 경우 하나의 record로 간주
► Case 분류 및 중복제거: 총 6가지 case에 대한 분석
• 의원수(n): 328명
• 의안수(m):
4
1.2. 의안 정보 전처리
의안 1 의안 2 의안 3 … 의안 m
의원 1 1 0 0 … 1
의원 2 1 0 1 … 0
… … … … … …
의원 n 0 1 0 … 1
전체 의안 노이즈제거 후 의안1)
전체 3262 2856
Accepted (원안가결, 수정가결) 505 472
Rejected (대안폐기, 폐기, 철회) 2757 2384
상임위원회 2510 2497
특별위원회 752 359
본 회의 53 23
1) 공동발의자수가 150명 이상인 경우를 제외
P(n,m) =
popong
Similarity calculation: 세 가지 set similarity measure 사용
► 의원 간의 상관계수를 계산하여 그들간의 비유사성(dissimilarity) 계산
• Dissimilarity = 1 - Abs(Similarity)
► 위에서 계산된 비유사성을 이용하여 계층군집 알고리즘 적용
• Single linkage(minimum distance) 사용
5
1.3. 데이터 분석
※ 계층군집 알고리즘
• 각 개체 간의 비유사도를 기반으로 가장 가까운 것 두 개를 묶는다.
• 묶은 개체 둘은 다시 하나의 개체로 간주하여 다시 앞 과정을 반복한다.
• 앞 두 과정을 전체가 하나로 묶일 때까지 반복한다.
popong 6
1.3. 데이터 분석
322326321320325317316311323312315295296304303302298297299301319324288289377133841281291681322061312482652376419224516482260183160268283191224281192234200277278226193263256204931957916517186264244211262199205189891277517832197181217169100101238276851522398170187172879227399812407628789727928218490182233207343325794235210146130214554029430096159290313073084279525321814580126913133143181291670746131364414011618513719622525520820125418627015323119416115810472652322592431632516217360220120482501425821667280167831432237122924527226923617969156144291062462411881172021802585020215162616326111024217710814125223919813949154112203562520911541285287471745415011310526635175166249103274190534221338149461576822821912237521221107222119512672628610911817135284176112473221102227111212155530433971881514724757361066141382751512301482711241341143271211252922911233053283062933103095988
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Jaccard Similarity based Hierarchical Clustering Dendrogram (D9)
322326321320318315314313307300255325317316311186295265225196296304298324303302319310297299301208140137442912211161851593283233122012543093129030572270231161153656030829429312112529225924913124823712812916813220621413013136622321662881041632431431671582967194222383219718175199332571912242811602682838226019220018323427745164278263256193226792049328217126486195165244189211178169101127982628789100942172052769928152859727918224023769227378172210349020717018737713323312381235120712292452232512201843275058216106615628017311719846427226923663102534825014214418023925224126728973246412871416110242179261204969174306188105156202162258222139113198228108112203285964210325465119035177541152272115783215683051191222741461501549147149175129167074433987151028437402661182410717109111288262092191351112472862133818593657155212521761476655414126134138275151230148271279525312480218145114
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Jaccard Similarity based Hierarchical Clustering Dendrogram (D10)
327328310309306293315929129230512612112512388313314318124257807310221415996221227290272879111718132021145252616286285284280275274272352713738270269412672664426146474849505152535425956575825860616263255656667686970717225474252251250246245243242241832392362322312302292282252232222202192132122092082032022011031041051061071081981101111121131141151161171181191201961221941241901881861851801791771761741731351361371381391401631421431441581571471481491501511561928315222231711722728160321691782812781811822771842731641871651892681911921934519526419726319926225676752042052537810110079211999881244822172188524086952382249322687922349089170260276971831532153921615416168247101551529364316242175141167109127200316826523713384131132129128145642482067727912166134249207282309421023523342894055342882952963023033042972993012981463193243153113123163173203213223233253263313091308307294300
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Jaccard Similarity based Hierarchical Clustering Dendrogram (D11)
327328326123325567891011121314151617183232021322321242526320318293173131631531435363738313312414243443114647484950515253543105657583096061626364656667686970717273743083077730630080295293838429028828788286285912842802752742722712702692672661021031041051061071082651101111121131141151161171181191202611222591242582572551281292541311321331341351361371381391401411421431441452521471481491501512512502481551561571581592472461621632452431661671682422412392371731741751761772361791802332322312301851862291882281902252232221942211962201982192142012022032132122062092084193242220721120423282172182051991971952002241932262719118919218718433234319182178238181240172171169244321651641603440451522531467625655127125591232622632641217512626810110099982737996782772788295281282283305929389902898729129286304852962972982998130130230321018329494276972352791702602161542493039130153161227215109
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
Jaccard Similarity based Hierarchical Clustering Dendrogram (D12)
314318313126791348651582012322552591612292542492251962702742317118628067185116269137241143104188284722878320810317316617911010719816105272167601532164125019421524522114437108246180140444915024369222356322026116223913611774251301426812023625873708177163156565825224226750514120266151062271021111151132851742131901092023920328661532915422817547621121192091571024139219462234354251491711852121552611176135212422114724738122511836571413427513815123027114812411466427952532181268014531287712913213320623724826513132100204256987982191192224260276164183200283234262861602641652789324017028125720726385197195339026816821121713023319923884295296303298302324319205226304922732441892821272972993012276182649915217121475169181277193871997279311312315320321322326316323325317101452101872317889948117228782351842902883430028996159551211231252922913054014629459913073083188293309310328306327
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Jaccard Similarity based Hierarchical Clustering Dendrogram (D1)
318322314313300328315321320255316326307201159312877133130129132214233206168131846423724826523225915841495134275138151253230271126218148801242714511412112312529229130531196118571225966364021505623961252106118582162691762475326715564425115611622111924383231254194113198284228266115272427169707437431091112744714917910193210020425698901977618228121023875169181922732442821891271712688717833821911922572242602761642001832342641602838626216593240195207263278199211217798517020519397279221529945277941011872902389782822617281235341842962983023193033173233253243041317317254610414413614029236163209112141157621501421201371862201472271081392038152515238153711051171431672081622192415426191212397225088110263123106728811122231772942428519069412871753121565146306301352021741962255213102180229245161293280733092496360107327491851032221544818825828624228968308201662463555297299301270295
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Jaccard Similarity based Hierarchical Clustering Dendrogram (D2)
323326322320325321317316312311315295296298304303302297301299319324379167470228223427619119216028327822426024025425516484237248265206201196165852812322592802692631864821619923113212913127016193711874599867967274185183158728326275204225602296311010020010526897277250193107101325665120137104239173172169238581432412611164915619820518198272195144287170140284264411942172566921521118910824644208142813724328207285150233117922732448923771366412817922011515218016815318825219722610610316219016312717116720962395020224525823627925117428621387111411821322217817711178682497661154359028856267525324220171522815726611384621184228222355431751013310921911817647149119941661462031391121352921228954182521019122261555124714723540425734339615925721422113030383612662429430073313073093103083133143183273282933051212921231252912901022271884142795253218138275230151271124145134148801261143069159
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Jaccard Similarity based Hierarchical Clustering Dendrogram (D3)
326327323322320318315314313300248328325321191317316312307310309257255303822342761591923112373081602832983042962952932782652242602402941642073132431930530229730129929125928025423220116912512384206962688579221991812162691659918516120593187200101486792273244127217170105459832100121292204281277263233274158195197861327577129131290231214210193711732562251892825889262196833724328172238107769018233791674703919878264110183241041401441201372491361426514114363972291024123981284116220815218043871711862722701116762163209150221116449431686927911719421134146219178502526422619023649722502356212813013341287156202154188115203061561132452356811117983017721560251617465326711322825421188814947292231532661031922028515710826113912251061741811226135147166212211092885517528666247176409128959258246184242513811952102203355415521322257361273227427951262532182751382301341518027114512414148114
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Jaccard Similarity based Hierarchical Clustering Dendrogram (D4)
314318313328322321315320316326300311307312126791316486515823225525920116124922927422525423127019671671861042801851161661371882211432692842872411031672081791738372272110144245198153411071056014030136731941802223725021521635243108246441507422725169142492201626810281172362612586312017723970267242141163201526651565650252581111131061153910920317429213285202112154190286536147228621751191020924139431572232521954149461181226171555242176135212111413427513815123027114812411438147247211225118365766427809525321812614512112312529229130531287713312913221413020623316884642372482651311932100204256981979076182210281238751691718792273244189282127181338219119225722426016427618320026428323486262160207165932407921121719526317027829094178205152268851931999727927722699452322101187897881172282353418429630332332529830231931732430459312949196159401463088832730629729930129331030929528928855
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Jaccard Similarity based Hierarchical Clustering Dendrogram (D5)
318322314313328300321315255320307232316326265237248259158312877133129132214130206233168846413132731120131229632332530331729830231932441495134275138151253230271126218148801242714511412112312529229130519321002042569819790761822102812387516917187338219119225722426016427618320026428323486262160207165932902401701952787921121726394922732441892821271812052681788515219319997279277226994523221011878981781722352830434184310159961611857596612236215056239612521061185821617626930640115510813920347149313092972993015326725011024714772212541317313617254622730186220177644251221156831162312541192431531941131982842721152282661906542671051171431672081622192412612882491308431091115152381112223292361121411632091572157120228527429419622526607916707414624517581528029310482132871796215073188371354917414063214222222910414451372496912018025818541881542862462702421071663529510210368552039289
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Jaccard Similarity based Hierarchical Clustering Dendrogram (D6)
318328314313322315321320316326300312311327307309310154256716481582322592552011612292742492842801988323125411622571270656719644251221272156216269185105117143167208241162581535623961252106107104144136140137219118186220194287142119243110722503018810326713173120261505311214111117911337115176180157910974228266166177691725462916323621520962150245213704360202411081392032118571226659258222364942826190633968111222314717447149102471510215524242383573227175212285154312877133130132129233214131206168846423724826541495134275138151253230271218126148801242714511412112312529229130524651521354020288193298100204256901977618221028123892273244282189127751691712681781818733821911922572602242761642641838623420016028326224016593207195290278263170152193857919921121799205277452394972792289101187226235781728128296303317323325298302319304184343249128629430814688961593062932892953129729930155
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Jaccard Similarity based Hierarchical Clustering Dendrogram (D7)
322328318314313300315321320255327316326307201312877133130132129233214131206168846423724815823226525941495134275253138151230218271126148801242714511412112312529229130531231116111857122596621365056239612525810611821626917640425326725072113228266198284272542472741392031551156442511561192431168323125422119415310847149911932981002042569019776182210281238922732442821891277516917126817818187338219119225726022427616426418386234290200160283240931652621952072782631931521707919921121799852052772345972798922101187942352267817228812963033173233252983023193041843432411122231317317254614729236163209621501041441361401121411571421371101201862202630711051172081431622191672412614310911117938212288213294215693093108865632422730651521771352852021907319622514617410217524522994828010180157162702249961597015430849602422891882223774396741287293258852035185166107312972993012862466855295103
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Jaccard Similarity based Hierarchical Clustering Dendrogram (D8)
전체 Accepted
Rejected 상임위
특별위 본회의
popong 7
Contents
1. 의안 정보 분석
2. 의원 정보 분석
popong
보유 데이터
8
2. 의원 정보 분석
popong
Network for members
► Bills can be used
• After filtering bills having more than 150 proposers
• The set of bills
– All bills
– Accepted bills
– Rejected bills
– 상임위원회 소관 bills
– 특별위원회 소관 bills
– 본회의 소관 bills
9
2.1. 의원 네트워크 구축
전체 의안 노이즈제거 후 의안1)
전체 3262 2856
Accepted bills 505 472
Rejected bills 2757 2384
상임위원회 2510 2497
특별위원회 752 359
본 회의 53 23
popong
Network for members
10
2.1. 의원 네트워크 구축
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
전체 Accepted
Rejected 상임위
특별위 본회의
popong
Network for members
► Using similarity matrix
• Calculated with all bills except having more than 150 proposers
► Using Spotfire
► Connected Component
• Most simple clustering in network analysis
► Betweenness
• Betweenness is a centrality measure of a vertex within a graph. Vertices that occur on
many shortest paths between other vertices have higher betweenness than
those that do not.
11
2.1. 의원 네트워크 구축
popong 12
2.1. 의원 네트워크 구축
Filter Settings
jacc_all_filtered
- Column 3: (0.30 <= Column 3 <= 1.00) without empty values
popong 13
2.2. “18대 국회 한 눈에 보기” – 여러 의원에 대하여
0 0 0 0 0 0 0 0 1 1 2 3 7
18
41
71
130
296
0
50
100
150
200
250
300
350
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
선거구-18대국회의원 상임위원회-18대국회의원
50
47 46 45 44 43
35
32
28 27
22
0 0 0 0
0
10
20
30
40
50
60
국토해양위원회
정무위원회
국방위원회
정보위원회
법제사법위원회
여성가족위원회
국회운영위원회
기획재정위원회
지식경제위원회
보건복지가족위원회
여성위원회
농림수산식품위원회
보건복지위원회
행정안전위원회
환경노동위원회
국회 회차-18대국회의원
51
46
18 17 15
12 12 11 11 10 8 8 8 6 6
3
54
0
10
20
30
40
50
60
경기
서울
부산
경남
경북
대구
인천
전남
전북
충남
강원
광주
충북
대전
울산
제주
비례
169
87
16
8 5 2 1 1 7
0
20
40
60
80
100
120
140
160
180
정당-18대국회의원
popong 14
2.2. “18대 국회 한 눈에 보기” – 여러 의원에 대하여
66
194
32
4
0
50
100
150
200
250
1 2 3 4
143
80
42
20
6 4 1
0
50
100
150
200
250
1 2 3 4 5 6 7
참여 상임위원회 수 - 18대국회의원 참여 상임위원회 수 - 18대국회의원
개
명
회
명
popong
Ex:
► 국토해양위원회(?)
► 정무위원회(?)
15
2.3. 상임위원회별 분석
중산층 시민 낙동강 국토 복지 4대강
공사현황 영산강 ….
발의 의안 보기
발의 의안 보기
국무총리실 날치기 감사 저축은행 브리핑
이상득 질의 동래구 …
…
해당 상임위원회의 역할을 간단히 설명
해당 상임위원회의
발의 의안의 처리 현황을 한 눈에 볼 수 있게 정리
해당 상임위원회의
발의 의안의 핵심어 (as if tag cloud)
해당 위원회의 핵심 인물들 (영향력 순)
popong
의원 i의 발의 의안의 통과 확률
► billPassMat(i) = P(i,:) x B(:, 4)
• Where P=(participation binary matrix), B=(bill matrix)
► 통과확률 = billPassMat {1,2}/billPassMat {1,2,3,4,5}
16
2.4. 의원별 분석 – 각 의원에 대하여
의결결과
1: 원안가결
2: 수정가결
3: 대안폐기
4: 폐기
5: 철회
의안id 제안일자 의결일자 의결결과 IF …
의안 1 1812699 2011-05-11 2011-07-22 1 0.45 …
의안 2 1246819 2011-04-24 2011-07-22 2 0.64 …
… … … … … … …
의안 m 1266626 2011-03-22 2011-04-21 4 1.54 …
B(m,p) =
원안가결 수정가결 대안폐기 폐기 철회
popong
Various Indices
► Centrality, Prestige 등의 network influence measure
► Activity
• 각 의안의 impact factor
► Diversity
► Sociability
► Tolerance
► Durability or Recency (?) 등 시간을 고려한 index
17
2.4. 의원별 분석 – 각 의원에 대하여
popong
► Network influence measures : ‘Centrality’
• Degree Centrality: [0,1]
• Closeness Centrality: [0,1], xi is central if it can easily interact with all other actors (i.e.,
distance is short)
• Betweenness Centrality:
18
2.4. 의원별 분석 – 각 의원에 대하여
𝐶 𝐷(𝑖) =
)𝑑(𝑖
𝑛 − 1
)𝑤ℎ𝑒𝑟𝑒 𝑑 𝑖 = node degree (𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑒𝑑𝑔𝑒𝑠
1
1
( )
( , )
C n
j
n
C i
d i j




𝑤ℎ𝑒𝑟𝑒 𝑑 𝑖, 𝑗
= 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 𝑓𝑟𝑜𝑚 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑖 𝑡𝑜 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗
(measured as the no. of links in a shortest path)
( )
( ) jk
B
j k jk
p i
C i
p
 
𝑝𝑗𝑘 = 𝑛𝑜. 𝑜𝑓 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡 𝑝𝑎𝑡ℎ𝑠 𝑏𝑡𝑤 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗 𝑎𝑛𝑑 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑘
𝑝𝑗𝑘 i = 𝑛𝑜. 𝑜𝑓 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡 𝑝𝑎𝑡ℎ𝑠 𝑏𝑡𝑤 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗 𝑎𝑛𝑑 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑘 𝑡ℎ𝑎𝑡 𝑝𝑎𝑠𝑠 𝑖
[0, 1]
( ) 2
' ( )
( 1)( 2)
jk
B
j k jk
p i
C i
p n n
 
 

[0, (n-1)(n-2)/2]
popong
► Recent Activity
• IF(b) = 의안 b의 impact factor 계산 : how?
•
– Where =0.75 (?)
19
2.4. 의원별 분석 – 각 의원에 대하여
( (
(18
( )recency b 
오늘날짜) - 발의일)
대국회의전체기간( 일) )
( ) ( , ) ( ) ( )
b B
Activity i P i b IF b recency b

  
(?)
popong
Diversity
► Calculate committee distribution based on
► Diversity is defined as the entropy of this distribution
20
2.4. 의원별 분석 – 각 의원에 대하여
A
# of bills of A belong to committee com
P (com) =
# of all bills of A
A A
com all committee
Diversity(A) P (com)logP (com)

  
popong
Sociability
► The score of sociability is basically defined based on how many co-proposers a
representative proposer has
► #co-billsc denotes the number of bills co-proposed between the representative
proposer and the coproposer c
21
2.4. 의원별 분석 – 각 의원에 대하여
c
each co-proposer(c)
)Sociabilty(A) = 1 + ln(#co-bills
popong
Tolerance
► The measure of how strong belief a proposer has
► 자신의 소신에 따라 의안을 발의하는 것과 대표 발의 자와 다른 정당 소속인 것이
과연 연관성이 있는가?
► 발의 의안 자체의 수가 매우 작은 경우 tolerance가 급격히 커질 수 있음
• 발의 의안 수가 매우 작은 의원의 경우 tolerance가 작아지도록 ?
• 혹은 해당 의원의 발의 의안 수를 함께 보여줌으로써 사용자 판단에 ?
22
2.4. 의원별 분석 – 각 의원에 대하여
# of bills that the representative proposer belongs to other party
# of all bills of A
Tolerance(A) =
popong
Durability
► The measure of how frequently a proposer keeps proposing
► The number of proposed bills a day
• 날짜가 생각보다 연속적이지만 의원 별로 봤을 때는 어떻게 될 지 모르겠음
23
2.4. 의원별 분석 – 각 의원에 대하여
0
50
100
150
200
250
300
350
popong
Durability
► 의원 별 의안 발의 사이 기간(interval)에 대해 계산
► Interval의 분포를 이용하여, 혹은 statistics를 이용하여 durability 값을 설정
► 얼마나 꾸준히 의안 발의에 참여하는지에 대한 정보를 포함해야 함
• Median
• Average
• Standard deviation
• max – min
• Interval의 분포의 average 혹은 median을 계산하여 이를 exponential의 모수로 설정
• 몇%의 확률로 며칠 후에 또 발의를 할 것인가 에 대한 계산도 가능할 것으로 사료됨
24
2.4. 의원별 분석 – 각 의원에 대하여
popong
Et cetera
► 최근 해당 의원의 관심사
• Do you want to see the change of his/her research interests?
► What else…?
25
2.4. 의원별 분석 – 각 의원에 대하여
popong
이건 우리 전문은 아니지만… plan?
► ‘열려라 국회’에서 크롤링된 데이터를 기반으로 하되, 보다 table로 깔끔하게 정리
되어 일관된 데이터 형태를 추구
• 향후 보다 다양하고 편리한 데이터 분석을 위함
► Meaningful Variables
• What else…?
26
2.5. 의원별 DB 구축
개인정보 의원번호 한문이름 출생지 홈페이지 재산내역 트위터id
학력 고등학교 대학교 대학원(n개)
정치활동 상임위 (16개) 의원당선 (18회) 정당 선거구
의정활동 본회의출석 본회의발의
기타경력 경력 (n개)
최근소식 관련뉴스
네트워크 -
popong
의원별 DB 구조
► 의원번호: 역대 국회의원 이름 크롤링 → 의원별 일련번호 지정
• 이름 중복을 처리하기 위한 key
• Ex: 강기갑’s id = 1024
► 학력
• 고등학교, 대학교, 대학학과 DB 등 필요
► 정치활동
• 선거구: “성남시 분당구 갑” vs “광주시” 등 어떻게 저장할 것인지의 문제
► 기타경력
• 활동분류 | 활동내용 | 시작일 | 마감일
27
2.5. 의원별 DB 구축
약간의 -_- 노가다 필요
popong
어쨌든 결론
► DB는 분석하기 쉬워야하고
► DB에서 끌어낸 분석의 인터페이스는 ‘의미있는 정보만’ ‘한눈에 보기 쉽게’ 담아야
할 것
28
2.5. 의원별 DB 구축

Más contenido relacionado

Destacado

Candidature ADVANCITY : Microfret Urbain
Candidature ADVANCITY : Microfret UrbainCandidature ADVANCITY : Microfret Urbain
Candidature ADVANCITY : Microfret UrbainQuattrolibri
 
今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜
今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜
今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜schoowebcampus
 
Street Sampling Media Kit
Street Sampling Media KitStreet Sampling Media Kit
Street Sampling Media Kitsathurston
 
2011-07-09 데이터 탐색
2011-07-09 데이터 탐색2011-07-09 데이터 탐색
2011-07-09 데이터 탐색Team POPONG
 
20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realization20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realizationTeam POPONG
 
Observación power point
Observación power pointObservación power point
Observación power pointelviraysaid24
 
Saunas and Athletic Performance
Saunas and Athletic PerformanceSaunas and Athletic Performance
Saunas and Athletic PerformanceJamie Bain
 
Pesquisa sobre toxoplasmose colabora na criação de ovinos
Pesquisa sobre toxoplasmose colabora na criação de ovinosPesquisa sobre toxoplasmose colabora na criação de ovinos
Pesquisa sobre toxoplasmose colabora na criação de ovinosAgricultura Sao Paulo
 
【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24
【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24
【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24Yuichiro Arakaki
 
Case Study - Saudi British Bank - HSBC’s Saudi Arabian Experience
Case Study - Saudi British Bank - HSBC’s Saudi Arabian ExperienceCase Study - Saudi British Bank - HSBC’s Saudi Arabian Experience
Case Study - Saudi British Bank - HSBC’s Saudi Arabian ExperienceUniversity of Connecticut
 

Destacado (13)

Candidature ADVANCITY : Microfret Urbain
Candidature ADVANCITY : Microfret UrbainCandidature ADVANCITY : Microfret Urbain
Candidature ADVANCITY : Microfret Urbain
 
今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜
今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜
今知っておきたい!最新「ビジネス理論」「フレームワーク」トレンド5選 先生:山田 案稜
 
Cao ch 3
Cao ch 3Cao ch 3
Cao ch 3
 
Street Sampling Media Kit
Street Sampling Media KitStreet Sampling Media Kit
Street Sampling Media Kit
 
2011-07-09 데이터 탐색
2011-07-09 데이터 탐색2011-07-09 데이터 탐색
2011-07-09 데이터 탐색
 
20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realization20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realization
 
How to Grow your Business using Social-Media
How to Grow your Business using Social-Media How to Grow your Business using Social-Media
How to Grow your Business using Social-Media
 
Observación power point
Observación power pointObservación power point
Observación power point
 
Saunas and Athletic Performance
Saunas and Athletic PerformanceSaunas and Athletic Performance
Saunas and Athletic Performance
 
Pesquisa sobre toxoplasmose colabora na criação de ovinos
Pesquisa sobre toxoplasmose colabora na criação de ovinosPesquisa sobre toxoplasmose colabora na criação de ovinos
Pesquisa sobre toxoplasmose colabora na criação de ovinos
 
【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24
【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24
【スキルアップ勉強会】合意に達するための交渉術(ハーバード流交渉術) 2013.03.24
 
Case Study - Saudi British Bank - HSBC’s Saudi Arabian Experience
Case Study - Saudi British Bank - HSBC’s Saudi Arabian ExperienceCase Study - Saudi British Bank - HSBC’s Saudi Arabian Experience
Case Study - Saudi British Bank - HSBC’s Saudi Arabian Experience
 
Noruegga
NorueggaNoruegga
Noruegga
 

Más de Team POPONG

2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안Team POPONG
 
2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안 2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안 Team POPONG
 
2011-09-24-UI기획안
2011-09-24-UI기획안2011-09-24-UI기획안
2011-09-24-UI기획안Team POPONG
 
2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰 2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰 Team POPONG
 
2011-07-02 데이터 탐색
2011-07-02 데이터 탐색2011-07-02 데이터 탐색
2011-07-02 데이터 탐색Team POPONG
 
2011-06-25 long term concept
2011-06-25 long term concept2011-06-25 long term concept
2011-06-25 long term conceptTeam POPONG
 
2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현Team POPONG
 
2011-04-02 사용자 FGI 실시안
2011-04-02 사용자 FGI 실시안 2011-04-02 사용자 FGI 실시안
2011-04-02 사용자 FGI 실시안 Team POPONG
 
2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONG2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONGTeam POPONG
 
2011-01-20 popong webpage
2011-01-20 popong webpage2011-01-20 popong webpage
2011-01-20 popong webpageTeam POPONG
 
2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddang2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddangTeam POPONG
 
2011-01-01 workshop agenda
2011-01-01 workshop agenda2011-01-01 workshop agenda
2011-01-01 workshop agendaTeam POPONG
 
2010-12-04 weekly meeting
2010-12-04 weekly meeting2010-12-04 weekly meeting
2010-12-04 weekly meetingTeam POPONG
 
2010-11-27 weekly meeting
2010-11-27 weekly meeting2010-11-27 weekly meeting
2010-11-27 weekly meetingTeam POPONG
 
2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****Team POPONG
 
2010-11-20 kick off meeting
2010-11-20 kick off meeting2010-11-20 kick off meeting
2010-11-20 kick off meetingTeam POPONG
 
g0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South Koreag0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South KoreaTeam POPONG
 
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것Team POPONG
 
2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료Team POPONG
 

Más de Team POPONG (20)

2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안
 
2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안 2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안
 
2011-09-24-UI기획안
2011-09-24-UI기획안2011-09-24-UI기획안
2011-09-24-UI기획안
 
2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰 2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰
 
2011-07-02 데이터 탐색
2011-07-02 데이터 탐색2011-07-02 데이터 탐색
2011-07-02 데이터 탐색
 
2011-06-25 long term concept
2011-06-25 long term concept2011-06-25 long term concept
2011-06-25 long term concept
 
2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현
 
2011-04-02 사용자 FGI 실시안
2011-04-02 사용자 FGI 실시안 2011-04-02 사용자 FGI 실시안
2011-04-02 사용자 FGI 실시안
 
2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONG2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONG
 
2011-01-20 popong webpage
2011-01-20 popong webpage2011-01-20 popong webpage
2011-01-20 popong webpage
 
2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddang2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddang
 
2011-01-01 workshop agenda
2011-01-01 workshop agenda2011-01-01 workshop agenda
2011-01-01 workshop agenda
 
2010-12-04 weekly meeting
2010-12-04 weekly meeting2010-12-04 weekly meeting
2010-12-04 weekly meeting
 
2010-11-27 weekly meeting
2010-11-27 weekly meeting2010-11-27 weekly meeting
2010-11-27 weekly meeting
 
2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****
 
2010-11-20 kick off meeting
2010-11-20 kick off meeting2010-11-20 kick off meeting
2010-11-20 kick off meeting
 
POPONG CCW talk
POPONG CCW talkPOPONG CCW talk
POPONG CCW talk
 
g0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South Koreag0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South Korea
 
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
 
2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료
 

2011-07-23 popong politician network analysis

  • 2. popong 2 Contents 1. 의안 정보 분석 2. 의원 정보 분석
  • 3. popong 실험용 Raw data ► 국회 의안 정보 시스템 - 제 18대 국회 의안 중 처리 의안1) 3 1.1. 의안 정보 설명 1) http://likms.assembly.go.kr/bill/jsp/main.jsp
  • 4. popong ► 의원 별 참여 의안에 대한 participation binary matrix 구성 • 단, 의안 이름이 같은데 발의자 구성이 같은 경우 하나의 record로 간주 ► Case 분류 및 중복제거: 총 6가지 case에 대한 분석 • 의원수(n): 328명 • 의안수(m): 4 1.2. 의안 정보 전처리 의안 1 의안 2 의안 3 … 의안 m 의원 1 1 0 0 … 1 의원 2 1 0 1 … 0 … … … … … … 의원 n 0 1 0 … 1 전체 의안 노이즈제거 후 의안1) 전체 3262 2856 Accepted (원안가결, 수정가결) 505 472 Rejected (대안폐기, 폐기, 철회) 2757 2384 상임위원회 2510 2497 특별위원회 752 359 본 회의 53 23 1) 공동발의자수가 150명 이상인 경우를 제외 P(n,m) =
  • 5. popong Similarity calculation: 세 가지 set similarity measure 사용 ► 의원 간의 상관계수를 계산하여 그들간의 비유사성(dissimilarity) 계산 • Dissimilarity = 1 - Abs(Similarity) ► 위에서 계산된 비유사성을 이용하여 계층군집 알고리즘 적용 • Single linkage(minimum distance) 사용 5 1.3. 데이터 분석 ※ 계층군집 알고리즘 • 각 개체 간의 비유사도를 기반으로 가장 가까운 것 두 개를 묶는다. • 묶은 개체 둘은 다시 하나의 개체로 간주하여 다시 앞 과정을 반복한다. • 앞 두 과정을 전체가 하나로 묶일 때까지 반복한다.
  • 6. popong 6 1.3. 데이터 분석 322326321320325317316311323312315295296304303302298297299301319324288289377133841281291681322061312482652376419224516482260183160268283191224281192234200277278226193263256204931957916517186264244211262199205189891277517832197181217169100101238276851522398170187172879227399812407628789727928218490182233207343325794235210146130214554029430096159290313073084279525321814580126913133143181291670746131364414011618513719622525520820125418627015323119416115810472652322592431632516217360220120482501425821667280167831432237122924527226923617969156144291062462411881172021802585020215162616326111024217710814125223919813949154112203562520911541285287471745415011310526635175166249103274190534221338149461576822821912237521221107222119512672628610911817135284176112473221102227111212155530433971881514724757361066141382751512301482711241341143271211252922911233053283062933103095988 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Jaccard Similarity based Hierarchical Clustering Dendrogram (D9) 322326321320318315314313307300255325317316311186295265225196296304298324303302319310297299301208140137442912211161851593283233122012543093129030572270231161153656030829429312112529225924913124823712812916813220621413013136622321662881041632431431671582967194222383219718175199332571912242811602682838226019220018323427745164278263256193226792049328217126486195165244189211178169101127982628789100942172052769928152859727918224023769227378172210349020717018737713323312381235120712292452232512201843275058216106615628017311719846427226923663102534825014214418023925224126728973246412871416110242179261204969174306188105156202162258222139113198228108112203285964210325465119035177541152272115783215683051191222741461501549147149175129167074433987151028437402661182410717109111288262092191351112472862133818593657155212521761476655414126134138275151230148271279525312480218145114 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Jaccard Similarity based Hierarchical Clustering Dendrogram (D10) 327328310309306293315929129230512612112512388313314318124257807310221415996221227290272879111718132021145252616286285284280275274272352713738270269412672664426146474849505152535425956575825860616263255656667686970717225474252251250246245243242241832392362322312302292282252232222202192132122092082032022011031041051061071081981101111121131141151161171181191201961221941241901881861851801791771761741731351361371381391401631421431441581571471481491501511561928315222231711722728160321691782812781811822771842731641871651892681911921934519526419726319926225676752042052537810110079211999881244822172188524086952382249322687922349089170260276971831532153921615416168247101551529364316242175141167109127200316826523713384131132129128145642482067727912166134249207282309421023523342894055342882952963023033042972993012981463193243153113123163173203213223233253263313091308307294300 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 Jaccard Similarity based Hierarchical Clustering Dendrogram (D11) 327328326123325567891011121314151617183232021322321242526320318293173131631531435363738313312414243443114647484950515253543105657583096061626364656667686970717273743083077730630080295293838429028828788286285912842802752742722712702692672661021031041051061071082651101111121131141151161171181191202611222591242582572551281292541311321331341351361371381391401411421431441452521471481491501512512502481551561571581592472461621632452431661671682422412392371731741751761772361791802332322312301851862291882281902252232221942211962201982192142012022032132122062092084193242220721120423282172182051991971952002241932262719118919218718433234319182178238181240172171169244321651641603440451522531467625655127125591232622632641217512626810110099982737996782772788295281282283305929389902898729129286304852962972982998130130230321018329494276972352791702602161542493039130153161227215109 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 Jaccard Similarity based Hierarchical Clustering Dendrogram (D12) 314318313126791348651582012322552591612292542492251962702742317118628067185116269137241143104188284722878320810317316617911010719816105272167601532164125019421524522114437108246180140444915024369222356322026116223913611774251301426812023625873708177163156565825224226750514120266151062271021111151132851742131901092023920328661532915422817547621121192091571024139219462234354251491711852121552611176135212422114724738122511836571413427513815123027114812411466427952532181268014531287712913213320623724826513132100204256987982191192224260276164183200283234262861602641652789324017028125720726385197195339026816821121713023319923884295296303298302324319205226304922732441892821272972993012276182649915217121475169181277193871997279311312315320321322326316323325317101452101872317889948117228782351842902883430028996159551211231252922913054014629459913073083188293309310328306327 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Jaccard Similarity based Hierarchical Clustering Dendrogram (D1) 318322314313300328315321320255316326307201159312877133130129132214233206168131846423724826523225915841495134275138151253230271126218148801242714511412112312529229130531196118571225966364021505623961252106118582162691762475326715564425115611622111924383231254194113198284228266115272427169707437431091112744714917910193210020425698901977618228121023875169181922732442821891271712688717833821911922572242602761642001832342641602838626216593240195207263278199211217798517020519397279221529945277941011872902389782822617281235341842962983023193033173233253243041317317254610414413614029236163209112141157621501421201371862201472271081392038152515238153711051171431672081622192415426191212397225088110263123106728811122231772942428519069412871753121565146306301352021741962255213102180229245161293280733092496360107327491851032221544818825828624228968308201662463555297299301270295 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Jaccard Similarity based Hierarchical Clustering Dendrogram (D2) 323326322320325321317316312311315295296298304303302297301299319324379167470228223427619119216028327822426024025425516484237248265206201196165852812322592802692631864821619923113212913127016193711874599867967274185183158728326275204225602296311010020010526897277250193107101325665120137104239173172169238581432412611164915619820518198272195144287170140284264411942172566921521118910824644208142813724328207285150233117922732448923771366412817922011515218016815318825219722610610316219016312717116720962395020224525823627925117428621387111411821322217817711178682497661154359028856267525324220171522815726611384621184228222355431751013310921911817647149119941661462031391121352921228954182521019122261555124714723540425734339615925721422113030383612662429430073313073093103083133143183273282933051212921231252912901022271884142795253218138275230151271124145134148801261143069159 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Jaccard Similarity based Hierarchical Clustering Dendrogram (D3) 326327323322320318315314313300248328325321191317316312307310309257255303822342761591923112373081602832983042962952932782652242602402941642073132431930530229730129929125928025423220116912512384206962688579221991812162691659918516120593187200101486792273244127217170105459832100121292204281277263233274158195197861327577129131290231214210193711732562251892825889262196833724328172238107769018233791674703919878264110183241041401441201372491361426514114363972291024123981284116220815218043871711862722701116762163209150221116449431686927911719421134146219178502526422619023649722502356212813013341287156202154188115203061561132452356811117983017721560251617465326711322825421188814947292231532661031922028515710826113912251061741811226135147166212211092885517528666247176409128959258246184242513811952102203355415521322257361273227427951262532182751382301341518027114512414148114 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Jaccard Similarity based Hierarchical Clustering Dendrogram (D4) 314318313328322321315320316326300311307312126791316486515823225525920116124922927422525423127019671671861042801851161661371882211432692842872411031672081791738372272110144245198153411071056014030136731941802223725021521635243108246441507422725169142492201626810281172362612586312017723970267242141163201526651565650252581111131061153910920317429213285202112154190286536147228621751191020924139431572232521954149461181226171555242176135212111413427513815123027114812411438147247211225118365766427809525321812614512112312529229130531287713312913221413020623316884642372482651311932100204256981979076182210281238751691718792273244189282127181338219119225722426016427618320026428323486262160207165932407921121719526317027829094178205152268851931999727927722699452322101187897881172282353418429630332332529830231931732430459312949196159401463088832730629729930129331030929528928855 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Jaccard Similarity based Hierarchical Clustering Dendrogram (D5) 318322314313328300321315255320307232316326265237248259158312877133129132214130206233168846413132731120131229632332530331729830231932441495134275138151253230271126218148801242714511412112312529229130519321002042569819790761822102812387516917187338219119225722426016427618320026428323486262160207165932902401701952787921121726394922732441892821271812052681788515219319997279277226994523221011878981781722352830434184310159961611857596612236215056239612521061185821617626930640115510813920347149313092972993015326725011024714772212541317313617254622730186220177644251221156831162312541192431531941131982842721152282661906542671051171431672081622192412612882491308431091115152381112223292361121411632091572157120228527429419622526607916707414624517581528029310482132871796215073188371354917414063214222222910414451372496912018025818541881542862462702421071663529510210368552039289 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Jaccard Similarity based Hierarchical Clustering Dendrogram (D6) 318328314313322315321320316326300312311327307309310154256716481582322592552011612292742492842801988323125411622571270656719644251221272156216269185105117143167208241162581535623961252106107104144136140137219118186220194287142119243110722503018810326713173120261505311214111117911337115176180157910974228266166177691725462916323621520962150245213704360202411081392032118571226659258222364942826190633968111222314717447149102471510215524242383573227175212285154312877133130132129233214131206168846423724826541495134275138151253230271218126148801242714511412112312529229130524651521354020288193298100204256901977618221028123892273244282189127751691712681781818733821911922572602242761642641838623420016028326224016593207195290278263170152193857919921121799205277452394972792289101187226235781728128296303317323325298302319304184343249128629430814688961593062932892953129729930155 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Jaccard Similarity based Hierarchical Clustering Dendrogram (D7) 322328318314313300315321320255327316326307201312877133130132129233214131206168846423724815823226525941495134275253138151230218271126148801242714511412112312529229130531231116111857122596621365056239612525810611821626917640425326725072113228266198284272542472741392031551156442511561192431168323125422119415310847149911932981002042569019776182210281238922732442821891277516917126817818187338219119225726022427616426418386234290200160283240931652621952072782631931521707919921121799852052772345972798922101187942352267817228812963033173233252983023193041843432411122231317317254614729236163209621501041441361401121411571421371101201862202630711051172081431622191672412614310911117938212288213294215693093108865632422730651521771352852021907319622514617410217524522994828010180157162702249961597015430849602422891882223774396741287293258852035185166107312972993012862466855295103 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Jaccard Similarity based Hierarchical Clustering Dendrogram (D8) 전체 Accepted Rejected 상임위 특별위 본회의
  • 7. popong 7 Contents 1. 의안 정보 분석 2. 의원 정보 분석
  • 9. popong Network for members ► Bills can be used • After filtering bills having more than 150 proposers • The set of bills – All bills – Accepted bills – Rejected bills – 상임위원회 소관 bills – 특별위원회 소관 bills – 본회의 소관 bills 9 2.1. 의원 네트워크 구축 전체 의안 노이즈제거 후 의안1) 전체 3262 2856 Accepted bills 505 472 Rejected bills 2757 2384 상임위원회 2510 2497 특별위원회 752 359 본 회의 53 23
  • 10. popong Network for members 10 2.1. 의원 네트워크 구축 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 전체 Accepted Rejected 상임위 특별위 본회의
  • 11. popong Network for members ► Using similarity matrix • Calculated with all bills except having more than 150 proposers ► Using Spotfire ► Connected Component • Most simple clustering in network analysis ► Betweenness • Betweenness is a centrality measure of a vertex within a graph. Vertices that occur on many shortest paths between other vertices have higher betweenness than those that do not. 11 2.1. 의원 네트워크 구축
  • 12. popong 12 2.1. 의원 네트워크 구축 Filter Settings jacc_all_filtered - Column 3: (0.30 <= Column 3 <= 1.00) without empty values
  • 13. popong 13 2.2. “18대 국회 한 눈에 보기” – 여러 의원에 대하여 0 0 0 0 0 0 0 0 1 1 2 3 7 18 41 71 130 296 0 50 100 150 200 250 300 350 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 선거구-18대국회의원 상임위원회-18대국회의원 50 47 46 45 44 43 35 32 28 27 22 0 0 0 0 0 10 20 30 40 50 60 국토해양위원회 정무위원회 국방위원회 정보위원회 법제사법위원회 여성가족위원회 국회운영위원회 기획재정위원회 지식경제위원회 보건복지가족위원회 여성위원회 농림수산식품위원회 보건복지위원회 행정안전위원회 환경노동위원회 국회 회차-18대국회의원 51 46 18 17 15 12 12 11 11 10 8 8 8 6 6 3 54 0 10 20 30 40 50 60 경기 서울 부산 경남 경북 대구 인천 전남 전북 충남 강원 광주 충북 대전 울산 제주 비례 169 87 16 8 5 2 1 1 7 0 20 40 60 80 100 120 140 160 180 정당-18대국회의원
  • 14. popong 14 2.2. “18대 국회 한 눈에 보기” – 여러 의원에 대하여 66 194 32 4 0 50 100 150 200 250 1 2 3 4 143 80 42 20 6 4 1 0 50 100 150 200 250 1 2 3 4 5 6 7 참여 상임위원회 수 - 18대국회의원 참여 상임위원회 수 - 18대국회의원 개 명 회 명
  • 15. popong Ex: ► 국토해양위원회(?) ► 정무위원회(?) 15 2.3. 상임위원회별 분석 중산층 시민 낙동강 국토 복지 4대강 공사현황 영산강 …. 발의 의안 보기 발의 의안 보기 국무총리실 날치기 감사 저축은행 브리핑 이상득 질의 동래구 … … 해당 상임위원회의 역할을 간단히 설명 해당 상임위원회의 발의 의안의 처리 현황을 한 눈에 볼 수 있게 정리 해당 상임위원회의 발의 의안의 핵심어 (as if tag cloud) 해당 위원회의 핵심 인물들 (영향력 순)
  • 16. popong 의원 i의 발의 의안의 통과 확률 ► billPassMat(i) = P(i,:) x B(:, 4) • Where P=(participation binary matrix), B=(bill matrix) ► 통과확률 = billPassMat {1,2}/billPassMat {1,2,3,4,5} 16 2.4. 의원별 분석 – 각 의원에 대하여 의결결과 1: 원안가결 2: 수정가결 3: 대안폐기 4: 폐기 5: 철회 의안id 제안일자 의결일자 의결결과 IF … 의안 1 1812699 2011-05-11 2011-07-22 1 0.45 … 의안 2 1246819 2011-04-24 2011-07-22 2 0.64 … … … … … … … … 의안 m 1266626 2011-03-22 2011-04-21 4 1.54 … B(m,p) = 원안가결 수정가결 대안폐기 폐기 철회
  • 17. popong Various Indices ► Centrality, Prestige 등의 network influence measure ► Activity • 각 의안의 impact factor ► Diversity ► Sociability ► Tolerance ► Durability or Recency (?) 등 시간을 고려한 index 17 2.4. 의원별 분석 – 각 의원에 대하여
  • 18. popong ► Network influence measures : ‘Centrality’ • Degree Centrality: [0,1] • Closeness Centrality: [0,1], xi is central if it can easily interact with all other actors (i.e., distance is short) • Betweenness Centrality: 18 2.4. 의원별 분석 – 각 의원에 대하여 𝐶 𝐷(𝑖) = )𝑑(𝑖 𝑛 − 1 )𝑤ℎ𝑒𝑟𝑒 𝑑 𝑖 = node degree (𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑒𝑑𝑔𝑒𝑠 1 1 ( ) ( , ) C n j n C i d i j     𝑤ℎ𝑒𝑟𝑒 𝑑 𝑖, 𝑗 = 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 𝑓𝑟𝑜𝑚 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑖 𝑡𝑜 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗 (measured as the no. of links in a shortest path) ( ) ( ) jk B j k jk p i C i p   𝑝𝑗𝑘 = 𝑛𝑜. 𝑜𝑓 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡 𝑝𝑎𝑡ℎ𝑠 𝑏𝑡𝑤 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗 𝑎𝑛𝑑 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑘 𝑝𝑗𝑘 i = 𝑛𝑜. 𝑜𝑓 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡 𝑝𝑎𝑡ℎ𝑠 𝑏𝑡𝑤 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗 𝑎𝑛𝑑 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑘 𝑡ℎ𝑎𝑡 𝑝𝑎𝑠𝑠 𝑖 [0, 1] ( ) 2 ' ( ) ( 1)( 2) jk B j k jk p i C i p n n      [0, (n-1)(n-2)/2]
  • 19. popong ► Recent Activity • IF(b) = 의안 b의 impact factor 계산 : how? • – Where =0.75 (?) 19 2.4. 의원별 분석 – 각 의원에 대하여 ( ( (18 ( )recency b  오늘날짜) - 발의일) 대국회의전체기간( 일) ) ( ) ( , ) ( ) ( ) b B Activity i P i b IF b recency b     (?)
  • 20. popong Diversity ► Calculate committee distribution based on ► Diversity is defined as the entropy of this distribution 20 2.4. 의원별 분석 – 각 의원에 대하여 A # of bills of A belong to committee com P (com) = # of all bills of A A A com all committee Diversity(A) P (com)logP (com)    
  • 21. popong Sociability ► The score of sociability is basically defined based on how many co-proposers a representative proposer has ► #co-billsc denotes the number of bills co-proposed between the representative proposer and the coproposer c 21 2.4. 의원별 분석 – 각 의원에 대하여 c each co-proposer(c) )Sociabilty(A) = 1 + ln(#co-bills
  • 22. popong Tolerance ► The measure of how strong belief a proposer has ► 자신의 소신에 따라 의안을 발의하는 것과 대표 발의 자와 다른 정당 소속인 것이 과연 연관성이 있는가? ► 발의 의안 자체의 수가 매우 작은 경우 tolerance가 급격히 커질 수 있음 • 발의 의안 수가 매우 작은 의원의 경우 tolerance가 작아지도록 ? • 혹은 해당 의원의 발의 의안 수를 함께 보여줌으로써 사용자 판단에 ? 22 2.4. 의원별 분석 – 각 의원에 대하여 # of bills that the representative proposer belongs to other party # of all bills of A Tolerance(A) =
  • 23. popong Durability ► The measure of how frequently a proposer keeps proposing ► The number of proposed bills a day • 날짜가 생각보다 연속적이지만 의원 별로 봤을 때는 어떻게 될 지 모르겠음 23 2.4. 의원별 분석 – 각 의원에 대하여 0 50 100 150 200 250 300 350
  • 24. popong Durability ► 의원 별 의안 발의 사이 기간(interval)에 대해 계산 ► Interval의 분포를 이용하여, 혹은 statistics를 이용하여 durability 값을 설정 ► 얼마나 꾸준히 의안 발의에 참여하는지에 대한 정보를 포함해야 함 • Median • Average • Standard deviation • max – min • Interval의 분포의 average 혹은 median을 계산하여 이를 exponential의 모수로 설정 • 몇%의 확률로 며칠 후에 또 발의를 할 것인가 에 대한 계산도 가능할 것으로 사료됨 24 2.4. 의원별 분석 – 각 의원에 대하여
  • 25. popong Et cetera ► 최근 해당 의원의 관심사 • Do you want to see the change of his/her research interests? ► What else…? 25 2.4. 의원별 분석 – 각 의원에 대하여
  • 26. popong 이건 우리 전문은 아니지만… plan? ► ‘열려라 국회’에서 크롤링된 데이터를 기반으로 하되, 보다 table로 깔끔하게 정리 되어 일관된 데이터 형태를 추구 • 향후 보다 다양하고 편리한 데이터 분석을 위함 ► Meaningful Variables • What else…? 26 2.5. 의원별 DB 구축 개인정보 의원번호 한문이름 출생지 홈페이지 재산내역 트위터id 학력 고등학교 대학교 대학원(n개) 정치활동 상임위 (16개) 의원당선 (18회) 정당 선거구 의정활동 본회의출석 본회의발의 기타경력 경력 (n개) 최근소식 관련뉴스 네트워크 -
  • 27. popong 의원별 DB 구조 ► 의원번호: 역대 국회의원 이름 크롤링 → 의원별 일련번호 지정 • 이름 중복을 처리하기 위한 key • Ex: 강기갑’s id = 1024 ► 학력 • 고등학교, 대학교, 대학학과 DB 등 필요 ► 정치활동 • 선거구: “성남시 분당구 갑” vs “광주시” 등 어떻게 저장할 것인지의 문제 ► 기타경력 • 활동분류 | 활동내용 | 시작일 | 마감일 27 2.5. 의원별 DB 구축 약간의 -_- 노가다 필요
  • 28. popong 어쨌든 결론 ► DB는 분석하기 쉬워야하고 ► DB에서 끌어낸 분석의 인터페이스는 ‘의미있는 정보만’ ‘한눈에 보기 쉽게’ 담아야 할 것 28 2.5. 의원별 DB 구축