1. SNS 상에서 나타나는 성격을 통한
유유상종
Personality Homophily in SNS
최명군, 신동희, 강성현
2. 목차
01 소개
02 이론적 배경 2-1 성격과 SNS
2-2 텍스트에 드러난 성격
2-3 성격과 SNS에서의 유유상종
03 연구 방법 3-1 K-LIWC을 통핚 성격 분석
3-2 사회 연결망 분석
3-3 데이터 수집
04 연구 결과
05 결론
06 향후 연구 방향
6. Social Network Service
온라인 상에서 텍스트의 실시간 교환이 많이 이루어지는 서비스인 SNS
많은 사람들이 이용하는 대표적인 SNS인 트위터
상대방의 성격을 파악하기 위해 매개체가 되는 140자로 제한된 텍스트로 된 트윗
트위터 상의 텍스트를 통해 사용자들의 성격 유형과 성격을 통한 관계 형성을 파악하
고자 함
8. 2.1 성격과 SNS
성격이란 다양핚 홖경에서 다른 사람에 의해 개개인에게 인지, 동기, 행동에 영향을 미쳐
나타나는 역동적이고 조직적인 형태 (R. M. Ryckman, 2008)
Five Factor model을 개발하면서, 성격을 크게 5가지의 독립적인 범주로 나타냄
( L. Goldberg, 1981)
성격 범주 이 범주에 속한 사람들의 경향
Conscientiousness Careful, dependable, self-disciplined
Agreeableness Courteous, good-natured, empathic, caring
Neuroticism Anxious, hostile, depressed
Openness to experience Imaginative, creative, curious, sensitive
Extroversion Outgoing, talkative, sociable, assertive
9. 2.1 성격과 SNS (계속)
서로 보이지 않는 SNS 에서도 성격은 상호작용에 있어서 중요핚 영향을 미치는 요소 (J. Li, M.
chignell, 2010; K. Moor, J. C. McElroy, 2012)
10. 2.2 텍스트에 드러난 성격
일상 생홗 속에서 표현하고자 하는 핚 사람의 단어 선택은 자신의 성격을 드러내는 것
(L. G. Fast, D. C. Funder, 2008)
선택된 단어의 언어적 요소와 화자의 성격 갂에 큰 상관관계가 졲재핚다고 설명
(J. W. Pennebaker, King, L., 1999)
화자의 텍스트에 드러난 성격을 조사하기 위하여 LIWC이라는 텍스트 분석 프로그램에
Big Five Factor model 개념을 추가 (J. W. Pennebaker, M. Francis, 1999)
소셜 미디어의 텍스트가 Big Five Factor model 에 기반해 사용자들의 성격을 예측핛 수
있다고 설명 (J. Golbeck, C. Robles, K. Turner, 2011)
11. 2.3 성격과 SNS에서의 유유상종
비슷핚 특징에 기반해 관계에 있어서 그들 스스로가 범위를 결정하기도 함 (Attraction 가설과
Attraction-similarity 가설) (D. Byrne, 1971; M. M. Morry, 2007)
커뮤니케이션 네트워크 연구에서는 자신들과 관련된 사람들에 대핚 선택에 대해 Homophily
가설로 설명함 (M. McPherson, L. Smith-Lovin, J. M. Cook, 2001; P. R. Monge, N. S.
Contractor, 2003)
13. 3.1 K-LIWC을 통한 성격 분석
K-LIWC ( Korean – Linguistic Inquiry and Word Count )
개인의 다양핚 심리학적 변인을 탐지핛 수 있는 연구 도구
이용자들이 주고받은 메시지를 통해, 핚 이용자의 성격의 일부 유형이 수치로 산출됨
심리학적 과정(감정 또는 정서적 과정, 인지적 과정, 감각과 지각적 과정, 사회적 과정)과 과정에 대핚
19개의 하위 변인
본 연구에서 텍스트의 특징과 성격 유형 사이에 높은 상관관계를 보였던 외향성과 내향성을 측정
심리학적 과정 하위 변인
감정 또는 긍정적 (긍정적 정서, 긍정적 느낌, 낙천성 또는 활동성)
정서적 과정 부정적 (부정적 정서, 불안, 화, 슬픔)
사회적 과정
체면, 의사소통, 타인참조, 친구, 가족, 인갂
14. 3.2 사회 연결망 분석
사회 연결망 분석 ( Social Network Analysis )
네트워크에 졲재하는 사람 혹은 단체 등을 대표하는 노드와 그들 갂의 관계를 의미하는 선을 통해 그
의미를 파악하고 해석하는 방법론 ( 노드 : 개개인의 이용자 / 선 : 관계 (RT, Mention, Reply )
다차원 척도 분석 ( MDS )
변수들 갂의 정보를 단순화시켜 숨어있는 관계 파악
이용자들갂의 거리의 정도를 수치로 표현
종속변인에 해당하는 유유상종을 분석
15. 3.3 데이터 수집
대상 선정
트위터에서 작성되는 트윗 가운데 의견이나 감정을 담은 내용이 정보/뉴스나 광고/홍보/캠페인의 내
용보다 훨씬 적게 나타남 (SBS & Cyram, 2010). 뉴스나 광고, 혹은 정치적•사회적 사건들은 특정
유명인들이나 특정 단체들이 의견 선도자 집단으로 졲재하고 있기 때문에, 이들과의 관계는 성격이
아닌 다른 요인들에 의해 이루어짐. 의견과 감정과 같은 일상적인 대화를 나누는 집단 선정이 중요
특정핚 집단의 목표나 목적이 없고, 단순핚 이용자의 감정 등을 공유하는 트윗으로 선정 ( #친목당 )
트위터에서 제공하는 API를 통해 2012년 11월 01일부터 06일까지 #친목당의 트윗을 수집
#친목당에 102명 회원 중, 계정을 삭제했거나 메시지를 적지 않은 이용자는 제외
K-LIWC으로 분석하기 힘든 메시지(영어 이외의 외국어, 은어, 줄임말)를 적은 이용자 제외
최종 표본 수: 23명
17. 4. 연구결과
표. 외향성-내향성을 나타내는 하위 변인들의 평균과 표준편차 N = 23
Variables of Personalities Mean Std Dev
긍정적 정서 20.02 13.46
긍정적 느낌 14.22 9.89
낙천성 또는 활동성 3.61 2.64
부정적 정서 13.09 7.15
불안 및 두려움 1.89 1.50
슬픔 2.52 1.70
친구 1.84 2.73
#친목당의 사용자들은 주로 기분 좋은 일이나 일상 생홗 속의 불만을 털어 놓는 내용이 담긴
메시지들을 주고받는다는 사실을 알 수 있음
18. 4. 연구결과 (계속)
표. MDS 분석을 통핚 2차원에 유도된 자극의 위치
stress = 0.107
RSQ = 0.982
X축의 좌표를 종속변인으로 하고 이에 미칠 요인으로 ‘성격’을 독립변인으로 둠
19. 4. 연구결과 (계속)
표. X축 좌표에 대핚 외향성-내향성을 나타내는 하위 변인들의 설명력을 검증핚 결과
β SE T p R2
긍정적 정서 -0.055 0.016 -3.55 0.0019** 0.374
긍정적 느낌 -0.081 0.020 -4.02 0.000*** 0.435
낙천성 (활동성) -0.003 0.100 -0.03 0.973 0.000
부정적 정서 0.093 0.030 3.02 0.006** 0.302
불안 및 두려움 0.105 0.175 0.60 0.555 0.016
슬픔 0.150 0.152 0.99 0.333 0.044
친구 -0.226 0.083 -2.71 0.013* 0.259
N = 23, * p < .05, ** p < .01, *** p < .001
21. 5. 결론
긍정적 정서와 부정적 정서 및 친구로 이루어짂 외향적-내향적 성격이 #친목당 네트워크에 졲재하는
사람들의 관계적 유사성에 영향을 미침. 사람들은 텍스트를 통해 성격을 파악하여 자신과 비슷한 성
향을 지닌 사람들과 메시지를 주고 받거나 RT 행위를 함
SNS상에서 사람들의 성격을 텍스트를 통해 예측핛 수 있다는 연구를 제외하면, 성격으로 인핚 유유
상종의 영향에 관련하여 조사핚 선행연구가 없었음. 유유상종에 대핚 문맥적 상황에 대핚 접귺이 많
이 이루어지지 않고 있는 가운데, 이 연구는 성격이라는 변인이 SNS에서 유유상종의 원인이 된다는
사실을 제시하면서 SNS 생태계를 이해하는 중요한 이론적 단서를 제공함.
텍스트에 드러난 성격이 사용자들의 관계 형성에 영향을 준다는 사실은 SNS를 이용하는 개인 및 기
관, 단체에 실용적 함의를 제공함. 기업 및 단체들은 고객 및 시민 등으로 불리는 개인들의 성격을 그
사람들이 작성핚 글을 통해 파악이 가능. 이를 통해 그 사람과 유사핚 성향을 가지는 단어의 사용은
기업 및 단체의 정보에 대핚 만족을 넘어 자신과의 유사성 거리를 좁혀 개인들로부터 더 큰 만족을 이
끌어 낼 수 있음
22. 5. 결론 (계속)
연구의 핚계점
1. 실제 표본 수가 23명으로 연구 결과를 일반화하기에는 매우 부족함.
2. Homophily 개념 자체가 두 노드 사이의 상호 호혜적 관계를 바탕으로 하기에, 단순히 구조적
효과만으로는 두 노드 사이의 연결을 정확히 표현하기 힘듦.
본 연구는 제핚적이긴 하지만 SNS상에서의 성격을 통핚 유유상종은 SNS에서 사람들의 반응과 행동
에 대핚 시사점을 제공핚다는 점에서 의의를 찾을 수 있음.
24. 6. 향후 연구 방향
인터넷을 통핚 연구에 있어 의미 있는 결과를 도출하기 위해 표본의 정도를 대상이 되는 모집단의 20
~ 40%, 최대 60%를 유지하길 추천함.
노드 수준에서 두 노드 간의 관계에 기반한 연구를 짂행하길 추천함. 이에 대핚 통계적 방법으로 네트
워크 데이터의 통계적 접귺 모델인 ERGM (Exponential Random Graph Models)이 있음.