7. 데이터의 정의
데이터란?
•데이터
•관찰을 통해 수집되는 특성 또는 정보(일반적으로 수치)
•문자, 숫자, 소리, 영상, 단어 등
•데이터 유형
•정형데이터
•양적 자료(정량적)
•숫자로 얻을 수 있는 또는 표현될 수 있는 데이터, 수치 자료 (Numerical data)
•질적 자료(정성적)
•숫자로 표현할 수 없는 범주 데이터, 범주형 자료 (Categorical data)
•비정형 데이터
•이미지, 영상, 소리, 언어 등
10. 데이터 시각화의 정의
데이터 시각화란?
•데이터 시각화
•정의
•데이터(또는 분석 결과)를 쉽게 이해할 수 있도록
도표라는 시각적 수단을 통해 정보를 효과적으로 전달하는 것
•정보의 효과적 전달!!
11. 데이터 시각화의 효과
데이터 시각화란?
인간의 가장 강력한 감각 기관인 눈은
냄새, 소리, 맛, 촉감을 위한 기관보다 대역폭과 처리 능력이 훨씬 더 크다.
그러므로 정보시각화를 통한 데이터 표현은
인간의 가장 강력한 지각 능력을 최대한 효과적으로 활용하는 방법이다.
- 애덤페러, 아름다운 시각화
18. 데이터 시각화의 목적
데이터 시각화란?
•많은 양의 데이터를 한눈에 볼 수 있다.
•데이터 분석에 대한 전문 지식이 없어도,
누구나 쉽게 데이터 인사이트를 찾을 수 있다.
•요약 통계보다 정확한 데이터 분석 결과를 도출할 수 있다.
•효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다.
•데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다.
19. 데이터 시각화의 목적
데이터 시각화란?
•많은 양의 데이터를 한눈에 볼 수 있다.
•시각적 요소를 활용해 요약해 표현
서울시 상권 유동인구 데이터
20. 데이터 시각화의 목적
데이터 시각화란?
•데이터 분석에 대한 전문 지식이 없어도,
누구나 쉽게 데이터 인사이트를 찾을 수 있다.
2015 건강보험심사자료로 알아보는
대한민국 우울증 환자 및 치료 현황
77. Bokeh
데이터 시각화 도구
•웹 최적화 인터랙티브 시각화 라이브러리
•통계 분석 외에도 임의의 데이터 시각화를 지원
•시각화의 요소들을 직접 조절 가능
78. D3.js
데이터 시각화 도구
•Data-Driven Documents . JavaScript
•데이터 중심의 문서의 약자로 자바스크립트 기반 라이브러리
•사용자가 입력한 시각화 규칙을 바탕으로 데이터를 반영해 시각화 생성
•plotly도 d3.js를 사용하여 시각화
79. Folium
데이터 시각화 도구
•지도 데이터(Open Street Map) 위치정보를 시각화하는 라이브러리
•자바스크립트 기반으로 인터랙티브 지도 생성
•그 외 pydeck, ipyleaflet 등으로 지도 시각화 가능
81. 파이썬이란?
파이썬이란?
•가장 인기있는 프로그래밍 언어 중 하나이다.
•웹페이지개발, 데이터 분석, 인공지능 등
많은 영역에서 활용된다.
•오픈 소스로 무료로 이용가능하다
세계 프로그래밍 언어 인기 순위
82. 파이썬의 장단점
파이썬이란?
장점
- 문법이 쉬워 쉽게 배울 수 있다.
- 코드를 이해하기 쉽고 수정이 간단하다.
- 데이터분석 및 시각화와 관련된 패키지들이 잘 구성되어있다.
단점
-C, Java등에 비해 속도가 느리다.
-동시다발적인 연산을 하는데 적합하지 않다.
"hello world"를 프린트하기위한 코드
Java vs Python
프로그램 언어별 연산 속도
(값이 클수록 오래걸림)
83. 파이썬으로 할수 있는 것들
파이썬이란?
단순 계산
그래프 그리기
게임 만들기 데이터 분석 및 시각화Mathematics
84. Plotly란?
•파이썬에서 데이터를 시각화하기 위해서는 matplotlib, seaborn,
plotly등 시각화 라이브러리를 이용해야한다.
•Plotly는 파이썬의 시각화 라이브러리중 하나로 산점도, 막대그래프, 파이차트,
지도 등 다양한 시각화를 데이터를 이용해 구현할 수 있다.
85. Plotly 의 특징
plotly란?
•plotly.express - 간단한 코드로 효과적인 시각화를 할 수 있는 모듈
•plotly.graph_objects - 비교적 복잡한 코드를 이용해 세세한 설정을 지원하는 모듈
•크게 두가지 성격의 모듈이 있어 필요한 상황에 따라 효율적으로 데이터 시각화를 할 수 있다.
plotly.express(px) plotly.graph_objects(go)
88. 참고
• Fundamentals of Data Visualization, Claus O. Wilke
• 데이터시각화 이해하기 #1 데이터 시각화란?
• https://visualize.tistory.com/112
• 당신도 데이터 시각화를 해야 하는 5가지 이유
• http://www.bloter.net/archives/329334
• Anscombe's’ Quartet simulation
• https://www.autodeskresearch.com/publications/samestats
• 생존자 편항의 오류
• https://www.andrewahn.co/silicon-valley/survivorship-bias/
• Python에서 데이터 시각화하는 다양한 방법
• https://zzsza.github.io/development/2018/08/24/data-visualization-in-python/
• Seaborn vs Bokeh. Part 2. Bokeh tutorial
• https://lovit.github.io/visualization/2019/11/22/bokeh_tutorial/
• D3.js 란?
• https://velog.io/@smooth97/-Data-Visualizing-D3.js-%EB%9E%80
• 세계프로그래밍언어 순위
• https://ifuwanna.tistory.com/203
• 파이썬의 장단점
• http://www.itworld.co.kr/print/92103