SlideShare una empresa de Scribd logo
1 de 44
Descargar para leer sin conexión
강태영 (minvv23@underscore.kr)
코로나 이후, 반중 정서는 과연 심화되었을까? :
뉴스 포털 댓글 데이터를 활용한 온라인 여론 변화 분석
2021.12.18. <팬데믹 시대의 혐오>
Curriculum Vitae
강태영
minvv23@underscore.kr
Education
2019.03-2020.08. M.S. 경영공학 (KAIST)
2014.03.-2019.02 B.A. 사회학/정치학 (서강대학교)
Job & Activities
〮 2018.04.- 데이터 분석 & 미디어 컨텐츠 스타트업 <언더스코어>
〮 2020.09.- KAIST D.LAB Visiting Researcher
〮 2021.04.- MyMusicTaste Data Analyst
〮 2020.10.- KoreaPDS Statistician
Research Interest
〮 전산사회과학 (Computational Social Science)
- 온라인 미디어에서의 여론 형성과 유저 의사 결정
- 데이터 기반 인사(HR) 관리
〮 양적연구방법론 (Quantitative Research Methodology)
- 자연어처리 응용 연구
- 온라인 데이터 유저 텍스트 분석
Introduction
Introduction
Introduction
Introduction
Introduction
Introduction
연구의 목적
Research Questions
코로나 이후 반중(反中) 혐오발언은 증가했는가?
코로나 이전의 인종·국가 혐오 발화의 추세는 어떠했는가?
반중(反中) 혐오발언과 개인의 정치 성향의 관계는 어떠한가?
데이터와 방법론
Data & Methods
시간
혐오발언
Data & Methods
시간
혐오발언
Data & Methods
시간
혐오발언
Data & Methods
시간
혐오발언
Data & Methods
시간
혐오발언
이중차분
Difference-in-Differences
Data & Methods
기간
2011.01.01.-2021.11.01.
수집 대상
주요 언론사 64곳
검색어
중국, 일본, 中, 日, 한중, 한일
Data & Methods
다음 뉴스 크롤러
- 제목
- 언론사
- 댓글
네이버 뉴스 크롤러
- 제목
- 언론사
- 댓글
네이버 검색 API
1-1. BigKinds 뉴스 제목으로 검색
1-2. 다음 뉴스 제목으로 검색
2. 네이버 뉴스 크롤러 사용
다음 검색 API
1. BigKinds 뉴스 제목으로 검색
2. 다음 뉴스 크롤러 사용
BigKinds 뉴스DB
최종 데이터
(35,536개 뉴스)
- BigKinds 뉴스 제목
- 네이버 뉴스 제목
- 네이버 뉴스 댓글
- 다음 뉴스 제목
- 다음 뉴스 댓글
Data & Methods
Data & Methods
- 1,001,021건의 댓글 데이터를 모두 수집
- 네이버와 다음 각 포털에서 각각 약 2,000명 씩 총 3,802명의 유저 패널을 확보
- 중국과 일본 각각에 대해 최소 5회 씩은 댓글을 작성한 2,996명 패널을 최종 활용
Data & Methods
워드클라우드
Data & Methods
텍스트 네트워크 분석
워드클라우드
Data & Methods
왜 문제인가?
- 단순히 오래되어서가 아니라 ‘잘못된 방식’이어서 문제
- 언어가 표현(representation) 되는 방식을 적절히 보여주지 못하는 방법
- 어휘의 사용 빈도가 특정 문서의 언어적 특징들을 충분히 설명할 수 있는가?
- 어휘들 간의 네트워크가 특정 문서가 언어적 특징들을 충분히 설명할 수 있는가?
- 시각적으로 화려해(?) 보이기는 하니 효용감을 위해 자주 사용되고 있음
- 그러나 ‘해석‘이 실질적으로 불가능하기에 결국 분석가의 자의적인 해석이 분석/
시각화의 결과와는 무관해지는 문제가 발생
Data & Methods
Data & Methods
- 2019.01.-2021.07. 포털 뉴스 섹션 및 주요 온라인 커뮤니티에서 댓글 약 3.5만 건 수집
- 레이블링 완전 일치율 53.11% / 일관성 Krippendorff’s Alpha 0.713
- 분류 정확도(Label Ranking Average Precision) 0.914
Data & Methods
#1 : 토큰 추출 #2 : 토큰 평균 임베딩 #3 : 문서 클러스터링
Data & Methods
Sentence A
Sentence B
Pooling
Pooling
u
v
(u, v, |u-v|)
Classification
Layer
Sentence BERT
분석 결과
Empirical Analysis
Empirical Analysis
Empirical Analysis
Empirical Analysis
연구의 결론
Conclusion
통념과 달리, 코로나 이전에는 반중 발언의 증가 추세 관찰 X
Conclusion
판데믹을 거치며 본격적으로 반중 발언이 늘어나기 시작
Conclusion
반중 발언이 증가한 뉴스 주제들은 다양한 이슈를 포괄
Conclusion
보수 성향 유저일수록 반중 정서가 코로나 이후 더 급격히 증가
연구의 의의
Data
추론통계
Inferential Statistics
Implications
예측통계
Predictive Statistics
Data
Inferential
Statistics
Predictive
Statistics
인과분석
Causal Analysis
머신러닝/딥러닝
Machine Learning
Implications
Implications
시간
혐오발언
이중차분
Difference-in-Differences
Implications
Implications
감사합니다.
강태영 (minvv23@underscore.kr)
2021.12.18. <팬데믹 시대의 혐오> 컨퍼런스

Más contenido relacionado

La actualidad más candente

Tableauを使ってよかった3つのこと
Tableauを使ってよかった3つのことTableauを使ってよかった3つのこと
Tableauを使ってよかった3つのことHiroki Takarada
 
6 Ways to Quit Bullet Points with Style
6 Ways to Quit Bullet Points with Style6 Ways to Quit Bullet Points with Style
6 Ways to Quit Bullet Points with StylePodium Wisdom
 
Successfully Managing Customer Experience Combining VoC and UX Testing
Successfully Managing Customer Experience Combining VoC and UX TestingSuccessfully Managing Customer Experience Combining VoC and UX Testing
Successfully Managing Customer Experience Combining VoC and UX TestingUserZoom
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門Satoru Ishikawa
 
Brain Rules for Presenters
Brain Rules for PresentersBrain Rules for Presenters
Brain Rules for Presentersgarr
 
#LeanInTogether: How to Be a Workplace MVP
#LeanInTogether: How to Be a Workplace MVP#LeanInTogether: How to Be a Workplace MVP
#LeanInTogether: How to Be a Workplace MVPLean In
 
300: Lessons in strategy from the movie
300: Lessons in strategy from the movie300: Lessons in strategy from the movie
300: Lessons in strategy from the movieArpit Agarwal
 
Team Topologies in action - early results from industry - DOES London Virtual...
Team Topologies in action - early results from industry - DOES London Virtual...Team Topologies in action - early results from industry - DOES London Virtual...
Team Topologies in action - early results from industry - DOES London Virtual...Matthew Skelton
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeHideo Takagi
 
【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋Momota Sasaki
 
언더스코어 팀 소개서 v2.1
언더스코어 팀 소개서 v2.1언더스코어 팀 소개서 v2.1
언더스코어 팀 소개서 v2.1Tae Young Kang
 
Scrum Guide & SAFe Agile booklet
Scrum Guide & SAFe Agile bookletScrum Guide & SAFe Agile booklet
Scrum Guide & SAFe Agile bookletSoumya De
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門Yoichi Kawasaki
 
実例に学ぶ、クラウドネイティブセキュリティの勘所.pdf
実例に学ぶ、クラウドネイティブセキュリティの勘所.pdf実例に学ぶ、クラウドネイティブセキュリティの勘所.pdf
実例に学ぶ、クラウドネイティブセキュリティの勘所.pdfFumieNakayama
 
July Design-storm : Slidedocs
July Design-storm : SlidedocsJuly Design-storm : Slidedocs
July Design-storm : SlidedocsAmanda Makulec
 
ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減
ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減
ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減UNIRITA Incorporated
 
Design the team you need to succeed
Design the team you need to succeedDesign the team you need to succeed
Design the team you need to succeedChristina Wodtke
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxotato
 
White paper making an-operational_data_store_(ods)_the_center_of_your_data_...
White paper   making an-operational_data_store_(ods)_the_center_of_your_data_...White paper   making an-operational_data_store_(ods)_the_center_of_your_data_...
White paper making an-operational_data_store_(ods)_the_center_of_your_data_...Eric Javier Espino Man
 
Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!
Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!
Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!Hiroaki Komine
 

La actualidad más candente (20)

Tableauを使ってよかった3つのこと
Tableauを使ってよかった3つのことTableauを使ってよかった3つのこと
Tableauを使ってよかった3つのこと
 
6 Ways to Quit Bullet Points with Style
6 Ways to Quit Bullet Points with Style6 Ways to Quit Bullet Points with Style
6 Ways to Quit Bullet Points with Style
 
Successfully Managing Customer Experience Combining VoC and UX Testing
Successfully Managing Customer Experience Combining VoC and UX TestingSuccessfully Managing Customer Experience Combining VoC and UX Testing
Successfully Managing Customer Experience Combining VoC and UX Testing
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
 
Brain Rules for Presenters
Brain Rules for PresentersBrain Rules for Presenters
Brain Rules for Presenters
 
#LeanInTogether: How to Be a Workplace MVP
#LeanInTogether: How to Be a Workplace MVP#LeanInTogether: How to Be a Workplace MVP
#LeanInTogether: How to Be a Workplace MVP
 
300: Lessons in strategy from the movie
300: Lessons in strategy from the movie300: Lessons in strategy from the movie
300: Lessons in strategy from the movie
 
Team Topologies in action - early results from industry - DOES London Virtual...
Team Topologies in action - early results from industry - DOES London Virtual...Team Topologies in action - early results from industry - DOES London Virtual...
Team Topologies in action - early results from industry - DOES London Virtual...
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
 
【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋
 
언더스코어 팀 소개서 v2.1
언더스코어 팀 소개서 v2.1언더스코어 팀 소개서 v2.1
언더스코어 팀 소개서 v2.1
 
Scrum Guide & SAFe Agile booklet
Scrum Guide & SAFe Agile bookletScrum Guide & SAFe Agile booklet
Scrum Guide & SAFe Agile booklet
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門
 
実例に学ぶ、クラウドネイティブセキュリティの勘所.pdf
実例に学ぶ、クラウドネイティブセキュリティの勘所.pdf実例に学ぶ、クラウドネイティブセキュリティの勘所.pdf
実例に学ぶ、クラウドネイティブセキュリティの勘所.pdf
 
July Design-storm : Slidedocs
July Design-storm : SlidedocsJuly Design-storm : Slidedocs
July Design-storm : Slidedocs
 
ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減
ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減
ジョブ管理とサーバ監視の見直しから取り組む戦略的コスト削減
 
Design the team you need to succeed
Design the team you need to succeedDesign the team you need to succeed
Design the team you need to succeed
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptx
 
White paper making an-operational_data_store_(ods)_the_center_of_your_data_...
White paper   making an-operational_data_store_(ods)_the_center_of_your_data_...White paper   making an-operational_data_store_(ods)_the_center_of_your_data_...
White paper making an-operational_data_store_(ods)_the_center_of_your_data_...
 
Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!
Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!
Watson knowledge studio 紹介 - あなたの知識をWatson に教え込む!
 

Similar a 코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)

2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"Tae Young Kang
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
 
응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈HELENA LEE
 
News Big Data Analytics with 'Big Kinds'
News Big Data Analytics with 'Big Kinds'News Big Data Analytics with 'Big Kinds'
News Big Data Analytics with 'Big Kinds'Daemin Park
 
포닥스 발표자료1
포닥스 발표자료1포닥스 발표자료1
포닥스 발표자료1Youn Sang Ha
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)Han Woo PARK
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)NAVER D2
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질Sun Young Kim
 
About cerebro scholar
About cerebro scholarAbout cerebro scholar
About cerebro scholarJungeunKim49
 
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)Yan So
 
Week1 ot
Week1 otWeek1 ot
Week1 otEun Yu
 
사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1Han Woo PARK
 
고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 JM code group
 
글로벌 소프트웨어 교육 현황 및 교육 도구 동향
글로벌 소프트웨어 교육 현황 및 교육 도구 동향글로벌 소프트웨어 교육 현황 및 교육 도구 동향
글로벌 소프트웨어 교육 현황 및 교육 도구 동향봉조 김
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee
 
박한우 교수 프로파일(9 march2017)
박한우 교수 프로파일(9 march2017)박한우 교수 프로파일(9 march2017)
박한우 교수 프로파일(9 march2017)Han Woo PARK
 
2005 moon joy_deepest_final
2005 moon joy_deepest_final2005 moon joy_deepest_final
2005 moon joy_deepest_finalWarNik Chow
 

Similar a 코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어) (20)

2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈
 
News Big Data Analytics with 'Big Kinds'
News Big Data Analytics with 'Big Kinds'News Big Data Analytics with 'Big Kinds'
News Big Data Analytics with 'Big Kinds'
 
포닥스 발표자료1
포닥스 발표자료1포닥스 발표자료1
포닥스 발표자료1
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질
 
About cerebro scholar
About cerebro scholarAbout cerebro scholar
About cerebro scholar
 
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1
 
Rdata 180320
Rdata 180320Rdata 180320
Rdata 180320
 
고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주
 
글로벌 소프트웨어 교육 현황 및 교육 도구 동향
글로벌 소프트웨어 교육 현황 및 교육 도구 동향글로벌 소프트웨어 교육 현황 및 교육 도구 동향
글로벌 소프트웨어 교육 현황 및 교육 도구 동향
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 
박한우 교수 프로파일(9 march2017)
박한우 교수 프로파일(9 march2017)박한우 교수 프로파일(9 march2017)
박한우 교수 프로파일(9 march2017)
 
2장
2장2장
2장
 
2005 moon joy_deepest_final
2005 moon joy_deepest_final2005 moon joy_deepest_final
2005 moon joy_deepest_final
 

코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)