SlideShare una empresa de Scribd logo
1 de 30
BOAZ 12기 강호석 고은비 고은
지 양태일 이지인 전준수 정
해원
코끼리(BOAZ) 사서의 도서 추천 솔루
션
BOAZ BOOKS
2020.01.18
TABLEOF CONTENTS
프로젝트 소
개
데이터 수
집 및 전
처리
모델링 및 평
가
웹 구현 및 시각
화
전시 안
내
프로젝트 소
개
프로젝트 소개 : 프로젝트 팀 구
성
NLP를공부한 BOAZ분석
태블로를 통한
데이터 시각화를 공부
한
BOAZ 시각화
fromgensim.models.doc2vec importTaggedDocument
fromgensim.modelsimportDoc2Vec
classDoc2VecCorpus:
definit (self, ts):
self.ts = ts
defiter (self):
for name,sentenceints:
if(len(sentence)>0):
yieldTaggedDocument(
words= sentence,
tags= [name])
doc2vec_corpus= Doc2VecCorpus(ts)
doc2vec_model= Doc2Vec(doc2vec_corpus)
MODELING
프로젝트 소개 : 주제 선정 과
정
어! 이 책 재미있게 읽었는데,
혹시 비슷한 내용의 책 또 없
나?
그렇게 많은 책을 다 읽어볼 시간은 없는
데…
알라딘의 도서 추천
“이상품을 구입하신 분들이 다음 상품도 구
입하셨습니다.”
이거 말고, 내용을 고려해서 도서 추천을
해 주는 곳은 없을까?
내용을 고려해서 도서를 추천해 줄 수 있는 서비스를 구현해 보고
자 함
프로젝트 소개 : 코끼리 사서의 도서 추천 솔
루션
코끼리 사서
사람들이 좋아할 책을 알려주고 싶지만 서점의 책을 모두 읽어볼 수가 없었던 우리의 코끼리
사서는, 어떤 책을 읽어야 할 지 모르는 이들을 위한 솔루션을 만들게 됩니다.
이제 그 코끼리 사서의 서재를 여러분에게 공개합니다!
동일한 카테고리 내
유사한 내용과 구매자 분포를
가진 책을 추천하는 서비스 구
현
프로젝트 소
개
: 프로젝트 목
표
데이터 수집 및 전처
리
책 속에서(실제 책 내용 활용 가능), 구매자 분포, 세일즈포인
트 등
1.사이트 “알라딘”선정 이유
데이터 수집 및 전처리 : 데이터
수집
책 속에
서
구매자 분
포
*알라딘 모바일 화
면
카테고리 30
개
카테고리 7개
경제 경영, 과학, 대학교재/전문서적,
소설/시/희곡, 어린이, 에세이, 자기계
발
어린이부터 성인까지 다양한 사용자를 고려하고, 대중적인 카테고리
를 선정
베스트 셀러 & 스테디 셀러
각 카테고리 별 2018년도의 베스트셀러, 스테디 셀
러
경제경영(243), 과학(297),대학교재/전문서적(239),
소설/시/희곡(296), 에세이(302),자기계발(285)
총 7개 카테고리, 약 2000권의 책 수집
데이터 수집 및 전처리 : 데이터
수집
2.데이터 스크래
핑
스크래핑 변
수
: 책제목, 작가, 출판일, 줄거리(책 속에서), 출판사 서
평, 구매자 성별/연령대별 분포(10-60), 카테고리,
출판사
데이터 수집 및 전처리 : 데이터
수집
2.데이터 스크래핑
스크래핑 데이
터
1.‘책속에서’ 영어 소문자 통
일
2.‘.’을 제외한 특수문자 제
거
3. ‘p.’, ‘접기’ 등 불용단어제거
전처리
PROCES
S
모델링 및 평
가
on
WD WW
Paragraph
id
the cat sat
Paragraphvectorwithdistributedmemory(PV-DM)
Classifier
Average/Concatenate
Paragraph Matrix
모델링 및 평
가
: 모델 설명_PV-DM
모델링 및 평가 : 모델
링
카테고리별로 나눈
후,
‘책속에서’를 이용해 Doc2veccorpus생성,
모델링 ( vector size=300)
구매자 분포 스케일링 해서 12개의 차원
추가
=총 312개의 vector
코사인 유사
도
모델링 및 평가 : 모델 평
가
30-50대 여성 >남성
40대 여성, 30-50 남성
20-40 남성
‘수학이 필요한 순간’의 구매자 분
포
‘물리가 쉬워지는 미적분’의 구매자 분
포
‘처음 배우는 딥러닝 수학*’의 구매자 분
포
a. Story(300차원의 vector)
b. Story+ 구매자 분포 (312차원의 vector)
구매자 분포가 비슷한 책을 추천한다고 설명
가능
모델링 및 평가 : Doc2vec모델링 및 분석 결
과
모델링 및 평가 : 서비스를 통한 추천 결과 (좋은
예)
모델링 및 평가 : 서비스를 통한 추천 결과 (좋은
예) 대시보
드
대시보
드
성별에 따른 분포 구매 연령에 따른 분포 성별에 따른 분포 구매 연령에 따른 분포
모델링 및 평가 : 서비스를 통한 추천 결과 (좋은
예)
모델링 및 평가 : 서비스를 통한 추천 결과 (좋은
예) 대시보
드
대시보
드
성별에 따른 분포 구매 연령에 따른 분포 성별에 따른 분포 구매 연령에 따른 분포
‘파이썬’에 관한 책을 추천 받았음에
도,
‘경제학’,
‘간호학’에 관한 책을 추
천.
모델링 및 평가 : 서비스를 통한 추천 결과 (나쁜
예)
모델링 및 평가 : 서비스를 통한 추천 결과 (나쁜
예)
모델링 및 평가 : 서비스를 통한 추천 결과 (나쁜
예) 대시보
드
대시보
드
성별에 따른 분포 구매 연령에 따른 분포
성별에 따른 분포 구매 연령에 따른 분포
웹 구현 및 시각
화
웹 구현 및 시각화 : 웹 구현 결
과
1
웹 구현 및 시각화 : 웹 구현 결
과
웹 구현 및 시각화 : 웹 평가 설문
Data
에너지의 방향 인식 방식 결정 방식 삶의 패턴
E I S N T F J P
단체 활동 선호, 생
각 을 표출하여 말
하기를 선호
혼자하는 활동 선호,
내면에 담고 글쓰는
것 을 선호
실용적이고 현실적이
며 숲보다 나무를 봄
미래를 추구하고 이
상 적이며, 두루뭉술
하고 자기만의 방식
있음. 주로 나무보다
숲을 봄
객관성과 합리성에
초 점, 논리적인 성
향, 일 과 목표, 효율
성 중시
감정 표현에 예민, 공
감적인 성향, 대인관
계 와 사람 중시
결단력이 있고, 철저
하 며 조직적, 명확성
, 예 측 가능성 및 계
획 중 시
융통성 있고 편안함 중
시, 자율롭고 즉흥적
- 모델 / 웹 개선점 파악을 위한 웹 설문 응답 수집 (300개)
PART1.응답자 기본 질문
Q1. 책을 주로 읽는 장소를 선택하여 주십시오
Q2. 책을 고를 때 가장 중요하게 여기는 요소는 무엇입니까?
PART2.응답자 웹 사용 경험 질문
Q1. 해당 도서 추천 시스템에서 본인이 가장 먼저 선택한 책의 카테고리는 무엇입
니까? Q2. 추천받은 책이 본인이 선택한 내용과 유사하다고 생각합니까?
Q3. 해당 추천시스템이 사용하기에 편리하십니까?
Q4. 해당 추천시스템을 개선하기 위해 계획하고 있는 서비스입니다. 다음 중 어느 항목을 가장 선호하십
니까?
PART3. 응답자 성향 질문
Q1. 본인이 해당 하는 쪽을 선택하여 주십시오
웹 구현 및 시각화 : 시각화 대시
보드
MBTI 별 선호 카테고
리
: 응답자 성향 질
문
카테고리 별 책 선택
에 고려하는 요소
: 응답자 기본 질문
책 줄거리 속 key-word *
구매자 연령대/성별 분
포*
* : 스크래핑 데이터 사용한 시각
화
*선택한 카테고리의 책
을 추천해주는 코끼리
사서
전시 안
내
BBM:BoazBarrier FreeMAP 코끼리 사서의 도서 추천 솔루션 :서재에 사는 코
끼리
Q &A

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BAOBAB 팀] : 반려동물 미용업 모바일 서비스 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BAOBAB 팀] : 반려동물 미용업 모바일 서비스 분석제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BAOBAB 팀] : 반려동물 미용업 모바일 서비스 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BAOBAB 팀] : 반려동물 미용업 모바일 서비스 분석
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Indus2ry 팀] : 2022산업동향- 편의점 & OTT 완벽 분석
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Indus2ry 팀] : 2022산업동향- 편의점 & OTT 완벽 분석제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Indus2ry 팀] : 2022산업동향- 편의점 & OTT 완벽 분석
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Indus2ry 팀] : 2022산업동향- 편의점 & OTT 완벽 분석
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [WHY 팀] : 나만의 웹툰일기 Toonight
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [WHY 팀] : 나만의 웹툰일기 Toonight제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [WHY 팀] : 나만의 웹툰일기 Toonight
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [WHY 팀] : 나만의 웹툰일기 Toonight
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
 
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
 
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BICS팀] : Boaz Industry Classification Standard
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BICS팀] : Boaz Industry Classification Standard제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BICS팀] : Boaz Industry Classification Standard
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BICS팀] : Boaz Industry Classification Standard
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Cm:)e팀] : 이커머스 고객경험 관리 분석
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Cm:)e팀] : 이커머스 고객경험 관리 분석제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Cm:)e팀] : 이커머스 고객경험 관리 분석
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Cm:)e팀] : 이커머스 고객경험 관리 분석
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [굿아이디어스] : 아이디어스 작가를 위한 비지니스 대시보드
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [굿아이디어스] : 아이디어스 작가를 위한 비지니스 대시보드제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [굿아이디어스] : 아이디어스 작가를 위한 비지니스 대시보드
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [굿아이디어스] : 아이디어스 작가를 위한 비지니스 대시보드
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
 
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 너의 기분 이모지(emoji)?
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 너의 기분 이모지(emoji)?제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 너의 기분 이모지(emoji)?
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 너의 기분 이모지(emoji)?
 

Similar a 제 11회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 코끼리(BOAZ) 사서의 도서 추천 솔루션

Korean manual for nodexl fb, flickr, twitter, youtube, wiki
Korean manual for nodexl fb, flickr, twitter, youtube, wikiKorean manual for nodexl fb, flickr, twitter, youtube, wiki
Korean manual for nodexl fb, flickr, twitter, youtube, wiki
Han Woo PARK
 
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

Sumi Kim
 
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
NAVER D2
 
7 프레임 워크와_방법론
7 프레임 워크와_방법론7 프레임 워크와_방법론
7 프레임 워크와_방법론
atelier t*h
 

Similar a 제 11회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 코끼리(BOAZ) 사서의 도서 추천 솔루션 (20)

추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-draft추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-draft
 
GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representation
 
프로젝트 기획안
프로젝트 기획안프로젝트 기획안
프로젝트 기획안
 
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
 
Audience research와 미디어 스타트업
Audience research와 미디어 스타트업Audience research와 미디어 스타트업
Audience research와 미디어 스타트업
 
20141215 액션러닝 원장님강의08
20141215 액션러닝 원장님강의0820141215 액션러닝 원장님강의08
20141215 액션러닝 원장님강의08
 
29th Meetup 실습 설명 및 실습 자료 링크
29th Meetup 실습 설명 및 실습 자료 링크29th Meetup 실습 설명 및 실습 자료 링크
29th Meetup 실습 설명 및 실습 자료 링크
 
응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈
 
Korean manual for nodexl fb, flickr, twitter, youtube, wiki
Korean manual for nodexl fb, flickr, twitter, youtube, wikiKorean manual for nodexl fb, flickr, twitter, youtube, wiki
Korean manual for nodexl fb, flickr, twitter, youtube, wiki
 
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

 
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
 
『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기
『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기
『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기
 
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
 
2014 0330-intel.education 정현준
2014 0330-intel.education 정현준2014 0330-intel.education 정현준
2014 0330-intel.education 정현준
 
2014 0330-intel.education 정현준
2014 0330-intel.education 정현준2014 0330-intel.education 정현준
2014 0330-intel.education 정현준
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
 
이상열, Interpretable Recommender System 개발 사례연구, NDC 2019
이상열, Interpretable Recommender System 개발 사례연구, NDC 2019이상열, Interpretable Recommender System 개발 사례연구, NDC 2019
이상열, Interpretable Recommender System 개발 사례연구, NDC 2019
 
알고리즘 마케팅 CH5
알고리즘 마케팅 CH5알고리즘 마케팅 CH5
알고리즘 마케팅 CH5
 
7 프레임 워크와_방법론
7 프레임 워크와_방법론7 프레임 워크와_방법론
7 프레임 워크와_방법론
 
2016년 인문정보학 Sql세미나 1/3
2016년 인문정보학 Sql세미나 1/32016년 인문정보학 Sql세미나 1/3
2016년 인문정보학 Sql세미나 1/3
 

Más de BOAZ Bigdata

Más de BOAZ Bigdata (20)

제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
 

제 11회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 코끼리(BOAZ) 사서의 도서 추천 솔루션

  • 1. BOAZ 12기 강호석 고은비 고은 지 양태일 이지인 전준수 정 해원 코끼리(BOAZ) 사서의 도서 추천 솔루 션 BOAZ BOOKS 2020.01.18
  • 2. TABLEOF CONTENTS 프로젝트 소 개 데이터 수 집 및 전 처리 모델링 및 평 가 웹 구현 및 시각 화 전시 안 내
  • 4. 프로젝트 소개 : 프로젝트 팀 구 성 NLP를공부한 BOAZ분석 태블로를 통한 데이터 시각화를 공부 한 BOAZ 시각화 fromgensim.models.doc2vec importTaggedDocument fromgensim.modelsimportDoc2Vec classDoc2VecCorpus: definit (self, ts): self.ts = ts defiter (self): for name,sentenceints: if(len(sentence)>0): yieldTaggedDocument( words= sentence, tags= [name]) doc2vec_corpus= Doc2VecCorpus(ts) doc2vec_model= Doc2Vec(doc2vec_corpus) MODELING
  • 5. 프로젝트 소개 : 주제 선정 과 정 어! 이 책 재미있게 읽었는데, 혹시 비슷한 내용의 책 또 없 나? 그렇게 많은 책을 다 읽어볼 시간은 없는 데… 알라딘의 도서 추천 “이상품을 구입하신 분들이 다음 상품도 구 입하셨습니다.” 이거 말고, 내용을 고려해서 도서 추천을 해 주는 곳은 없을까? 내용을 고려해서 도서를 추천해 줄 수 있는 서비스를 구현해 보고 자 함
  • 6. 프로젝트 소개 : 코끼리 사서의 도서 추천 솔 루션 코끼리 사서 사람들이 좋아할 책을 알려주고 싶지만 서점의 책을 모두 읽어볼 수가 없었던 우리의 코끼리 사서는, 어떤 책을 읽어야 할 지 모르는 이들을 위한 솔루션을 만들게 됩니다. 이제 그 코끼리 사서의 서재를 여러분에게 공개합니다!
  • 7. 동일한 카테고리 내 유사한 내용과 구매자 분포를 가진 책을 추천하는 서비스 구 현 프로젝트 소 개 : 프로젝트 목 표
  • 8. 데이터 수집 및 전처 리
  • 9. 책 속에서(실제 책 내용 활용 가능), 구매자 분포, 세일즈포인 트 등 1.사이트 “알라딘”선정 이유 데이터 수집 및 전처리 : 데이터 수집 책 속에 서 구매자 분 포 *알라딘 모바일 화 면
  • 10. 카테고리 30 개 카테고리 7개 경제 경영, 과학, 대학교재/전문서적, 소설/시/희곡, 어린이, 에세이, 자기계 발 어린이부터 성인까지 다양한 사용자를 고려하고, 대중적인 카테고리 를 선정 베스트 셀러 & 스테디 셀러 각 카테고리 별 2018년도의 베스트셀러, 스테디 셀 러 경제경영(243), 과학(297),대학교재/전문서적(239), 소설/시/희곡(296), 에세이(302),자기계발(285) 총 7개 카테고리, 약 2000권의 책 수집 데이터 수집 및 전처리 : 데이터 수집 2.데이터 스크래 핑
  • 11. 스크래핑 변 수 : 책제목, 작가, 출판일, 줄거리(책 속에서), 출판사 서 평, 구매자 성별/연령대별 분포(10-60), 카테고리, 출판사 데이터 수집 및 전처리 : 데이터 수집 2.데이터 스크래핑 스크래핑 데이 터 1.‘책속에서’ 영어 소문자 통 일 2.‘.’을 제외한 특수문자 제 거 3. ‘p.’, ‘접기’ 등 불용단어제거 전처리 PROCES S
  • 13. on WD WW Paragraph id the cat sat Paragraphvectorwithdistributedmemory(PV-DM) Classifier Average/Concatenate Paragraph Matrix 모델링 및 평 가 : 모델 설명_PV-DM
  • 14. 모델링 및 평가 : 모델 링 카테고리별로 나눈 후, ‘책속에서’를 이용해 Doc2veccorpus생성, 모델링 ( vector size=300) 구매자 분포 스케일링 해서 12개의 차원 추가 =총 312개의 vector
  • 15. 코사인 유사 도 모델링 및 평가 : 모델 평 가
  • 16. 30-50대 여성 >남성 40대 여성, 30-50 남성 20-40 남성 ‘수학이 필요한 순간’의 구매자 분 포 ‘물리가 쉬워지는 미적분’의 구매자 분 포 ‘처음 배우는 딥러닝 수학*’의 구매자 분 포 a. Story(300차원의 vector) b. Story+ 구매자 분포 (312차원의 vector) 구매자 분포가 비슷한 책을 추천한다고 설명 가능 모델링 및 평가 : Doc2vec모델링 및 분석 결 과
  • 17. 모델링 및 평가 : 서비스를 통한 추천 결과 (좋은 예)
  • 18. 모델링 및 평가 : 서비스를 통한 추천 결과 (좋은 예) 대시보 드 대시보 드 성별에 따른 분포 구매 연령에 따른 분포 성별에 따른 분포 구매 연령에 따른 분포
  • 19. 모델링 및 평가 : 서비스를 통한 추천 결과 (좋은 예)
  • 20. 모델링 및 평가 : 서비스를 통한 추천 결과 (좋은 예) 대시보 드 대시보 드 성별에 따른 분포 구매 연령에 따른 분포 성별에 따른 분포 구매 연령에 따른 분포
  • 21. ‘파이썬’에 관한 책을 추천 받았음에 도, ‘경제학’, ‘간호학’에 관한 책을 추 천. 모델링 및 평가 : 서비스를 통한 추천 결과 (나쁜 예)
  • 22. 모델링 및 평가 : 서비스를 통한 추천 결과 (나쁜 예)
  • 23. 모델링 및 평가 : 서비스를 통한 추천 결과 (나쁜 예) 대시보 드 대시보 드 성별에 따른 분포 구매 연령에 따른 분포 성별에 따른 분포 구매 연령에 따른 분포
  • 24. 웹 구현 및 시각 화
  • 25. 웹 구현 및 시각화 : 웹 구현 결 과 1
  • 26. 웹 구현 및 시각화 : 웹 구현 결 과
  • 27. 웹 구현 및 시각화 : 웹 평가 설문 Data 에너지의 방향 인식 방식 결정 방식 삶의 패턴 E I S N T F J P 단체 활동 선호, 생 각 을 표출하여 말 하기를 선호 혼자하는 활동 선호, 내면에 담고 글쓰는 것 을 선호 실용적이고 현실적이 며 숲보다 나무를 봄 미래를 추구하고 이 상 적이며, 두루뭉술 하고 자기만의 방식 있음. 주로 나무보다 숲을 봄 객관성과 합리성에 초 점, 논리적인 성 향, 일 과 목표, 효율 성 중시 감정 표현에 예민, 공 감적인 성향, 대인관 계 와 사람 중시 결단력이 있고, 철저 하 며 조직적, 명확성 , 예 측 가능성 및 계 획 중 시 융통성 있고 편안함 중 시, 자율롭고 즉흥적 - 모델 / 웹 개선점 파악을 위한 웹 설문 응답 수집 (300개) PART1.응답자 기본 질문 Q1. 책을 주로 읽는 장소를 선택하여 주십시오 Q2. 책을 고를 때 가장 중요하게 여기는 요소는 무엇입니까? PART2.응답자 웹 사용 경험 질문 Q1. 해당 도서 추천 시스템에서 본인이 가장 먼저 선택한 책의 카테고리는 무엇입 니까? Q2. 추천받은 책이 본인이 선택한 내용과 유사하다고 생각합니까? Q3. 해당 추천시스템이 사용하기에 편리하십니까? Q4. 해당 추천시스템을 개선하기 위해 계획하고 있는 서비스입니다. 다음 중 어느 항목을 가장 선호하십 니까? PART3. 응답자 성향 질문 Q1. 본인이 해당 하는 쪽을 선택하여 주십시오
  • 28. 웹 구현 및 시각화 : 시각화 대시 보드 MBTI 별 선호 카테고 리 : 응답자 성향 질 문 카테고리 별 책 선택 에 고려하는 요소 : 응답자 기본 질문 책 줄거리 속 key-word * 구매자 연령대/성별 분 포* * : 스크래핑 데이터 사용한 시각 화 *선택한 카테고리의 책 을 추천해주는 코끼리 사서
  • 29. 전시 안 내 BBM:BoazBarrier FreeMAP 코끼리 사서의 도서 추천 솔루션 :서재에 사는 코 끼리
  • 30. Q &A