SlideShare una empresa de Scribd logo
1 de 30
개인화 추천팀
정재훈
SK Planet 추천 플랫폼
콜로세오
@uzysjung
Objective-c Ranking
git-awards.com
5 Apps I developed were chosen as
New & Noteworthy, Staff Favorite in
Apple App Store.
정재훈
북미 iPad 교육
카테고리 1등
Collaborative
Filtering
추천 관련 발표는
다 추천알고리즘에 대한 발표 뿐…
추천 플랫폼은?
Deep Neural
Networks
Matrix
Factorization
Wide & Deep
Learning
이 발표는 …
• 안정적인 데이터 서빙.
• 빠른 응답성
• 알고리즘 생성
• 알고리즘 성능 평가
• 알고리즘 최적화
• 사용자 로그 수집
• 추천 성과 수집
• 추천 성과 분석
• 추천 성과 리포팅
추천 플랫폼
서빙
생성수집
추천 플랫폼의 역할
현황
• 11번가 추천 Recopick  Colloseo 전환. (3월)
• 추천 호출 하루 1억 건, Max RPS 2천 건 (11월)
• A/B테스트를 거쳐 11번가 20개 영역에 추천/광고 상용 서비스 중
• 2,200만 고객에게 7천만 상품에 대해 추천 적용 중
• 전년 대비 11번가 추천 경유거래액 7배 증가
SK플래닛 빅데이터 클러스터 기반 추천 플랫폼.
치열한 추천 알고리즘의 각축 장이 되기를 바라며 ‘IL COLOSSEO’에서 유래
콜로세오
최적화
실시간
ROI
콜로세오 아키텍쳐
상품상세 페이지 최하단
CF , MF , I2V , AR
’Title’ , ‘CollectionView’
추천 최적화 고려 요소
추천/호출 수, 추천수/상품 수
클릭율 , 경유거래액 , 경유거래 수 , 순거래액
서비스 영역
UI Component
적용 알고리즘
추천 커버리
지
성과 지표
Optimization
Optimization
추천에서 최적화 대상은?
알고리즘? , 서비스 영역?
서비스영역에 적용되어 있는
추천 알고리즘들 + UI
Optimization : 최적화 대상은?
RNN 상품상세 장바구니CF
알고리즘을 여러영역에 적용 서비스 영역에 알고리즘들을 적용
1. 알고리즘을 만든다.
2. 알고리즘이 적합한 영역을 찾는다.
1. 추천이 들어갈 서비스 영역을 선정한다.
2. 영역에 적합한 추천알고리즘을 고민한다.
3. 적용한다.
Optimization : 접근법
VS
Now배송
긴급공수
쇼킹딜
상품상세
장바구니
MF
CF
RNN
I2V
어떤 알고리즘이 좋을까?
커버리지 : 50%
평균 CTR 10%
각각의 추천 알고리즘은 개별적인 특성과 한계를 가짐.
Optimization : 어떻게 최적화 하지?
A
커버리지 : 100%
평균 CTR 5%
B
다양한 알고리즘의 조합으로 서비스 영역에 적용 가능
VS
+A B
커버리지 : 100%
평균 CTR 7.5%
그럼 어떻게 조합하지?
추천 Timeout
Optimization : 대안 알고리즘
A B C D추천
요청
BuyTogether : CF 기반 추천 로직 (Coverage : 29% )
BuyNext : CategoryToItem 기반 추천 로직 (Coverage : 100% )
PC 장바구니 A/B/C 테스트 (2017.9.11 ~ 12)
보완재 추천 알고리즘
BuyTogether BuyNext BT+BN
노출CTR (비율) 1.5 1 1.15
구매건수(비율) 1.52 1 2.1
Optimization : PC 장바구니 추천
<11번가 PC 장바구니 화면>
메인 알고리즘 대안 알고리즘
Optimization : AB테스트
A
A’
A’’
추천
요청
B
B’
AB테스트 결과
AB
A’B
A’’B
AB’
A’B’
A’’B’
메인 알고리즘의 로직
향상으로 이어짐.
적용결과
B’
A
ex) Norm * 0.3 + Vector * 0.7
Optimization : NOW배송 개인화 추천
Harald Steck et al, Interactive Recommender Systems: Tutorial, Proceedings of the 9th ACM Conference
on Recommender Systems, September 16-20, 2015, Vienna, Austria
While the orientations of the vectors reflect similarity, their
norms reflect the items’ popularity.
플랫폼 상에서 서비스 영역의 지속적인 무중단 A/B테스트
를 통해 최적값을 찾을 수 있음.
콜로세오
MF 서비스 영역적 특성에 맞게 Norm 과 Vector 비중을 최적화
“
“
영역 클릭 장바구니 구매
추천 없음 1 1 1
인기도 기반 1.17 1.34 1.2
유사도 기반 1.24 1.26 1
NOW배송 탭 개인화 MF A/B 테스트
2017.9.5 ~ 2017.9.15 (비율 5: 2.5: 2.5 )
Matrix Factorization - Norm (인기도) VS Vector (유사도)
Optimization : NOW배송 개인화 추천
<11번가 Now배송 탭 >
연관 상품 광고 AB테스트
2017.03.20 ~ 2017.03.21
플랫폼 기반 추천 로직 최적화
CF
Item
MAB
CF
Category
앙상블
사용자
플랫폼 지원 영역
사용자반응 추천결과
광고 추천 기존 광고
클릭 1.47배 1
광고매출 1.25배 1
Optimization : 연관 상품 광고
<11번가 상품상세 하단 영역>
User’s interest In Realtime – eCommerce 특성
Implicit feedback
(User action)
Explicit feedback
(User rate)
E-Commerce
>>
E-Commerce는 사용자 성향을 명시적으로 Feedback 받기 어렵다.
오픈마켓 특성 상 뚜렷한 목적을 가지고 방문하는 고객이 많다
생필품 사는데 사용자 성향이 반영될 수 있을까?
실시간 개인화 추천
영속성 단발성
그럼 개인화 추천은 어떻게 되야 할까?
+
현재 사용자의
쇼핑을 돕는 추천
(구매의도, 가격)
사용자의 성향에
기반한 추천
User’s interest In Realtime
User’s interest In Realtime : 콜로세오
Colloseo 특징
비로그인 상태 사용자 행동 수집
가족 계정에 대한 추론을 통해 각 사용자 추천 로직 대응 (동일 계정에 여러 핸드폰)
+App
Mobile
Web
PC
Web
+
Colloseo 실시간 로그 수집
실시간 개인화 추천 2차 5:5 A/B테스트 결과
기간 : 2016.12.13 ~ 2016.12.16
응답속도 개선( 평균 50ms )
커버리지 향상 ( 98% )
구분
노출 대비
CTR 비율
빌보드 3
긴급공수 1
개인화추천 8
쇼킹딜 2
User’s interest In Realtime : 콜로세오
Colloseo 개인화 추천
1.향상된 풍부한 사용자 로그
2. 실시간 연산 로드 분산
- 코드 최적화 , 인프라 개선 CTR
(Clicks/Views)
CTR
비율
경유 구매
비율
Recopick 0.41% 1(기준) 1(기준)
Colloseo 1.566% 3.819 3.459
구분
노출 대비
CTR 비율
기획전 1
개인화추천 5
Near Realtime Matrix Factorization
- Item Feature 시간 단위 연산
- User Latent Feature 실시간 연산
매 시간 학습
추천 호출 시점
사용자 히스토리 기반 계산
추천 결과 생성
추천 요청
K-Mean MF-NRT 성과
CTR 1 1.07 7%↑
CVR 1 1.04 4%↑
홈탭 쇼킹딜 5:5 A/B테스트
기간 : 2017.08.26~09.6 (7일간, App)
User’s interest In Realtime : NRT MF
Item Latent
Feature
User Latent
Feature
<11번가 홈탭 긴급공수, 쇼킹딜>
기존 로직 대비 10% 성능 향상 된
알고리즘 무조건 적용해야 될까?
Return On Invest
A 알고리즘 : Deep Neural Network 기반 CTR 5.5% , CVR 1%
B 알고리즘 : Thompson Sampling 기반 CTR 5 % , CVR 1%
- A/B 테스트 결과 : A가 B보다 10%↑
- 추천 상품 Pool : 500개
알고리즘 클릭 건수 구매 전환
A (DNN) 550 Click 5.5건
B (TS-MAB) 500 Click 5건
Return On Invest
ex) 기획전 페이지 (PV : 1만/일)
A
(DNN)
학습 + 인퍼런스 장비
(GPU 장비 필요)
>>
B
(TS-MAB)
서버 Only
시스템 복잡도
A (수동, 5) B (MAB, 5) 성과
CTR 1 1.94 94.39%↑
CVR 1 1.71 70.88%↑
A/B테스트
07.27~07.30 (4일간, Android)
- 1년 약 4천개의 기획전.
- 상대적으로 적은 노출
- 상품 변경이 잦음.
- 상품Pool 한정적 (100 ~ 2,000 개)
11번가기획전
성/연령 13개 Segment
Thompson Sampling
기반 최적화
ROI : 기획전
CF 배치시간 최적화
6천만 상품에 대한 시간단위 배치  15% 추천 성능 향상
11번가 가장 PV가 높은 영역
고객 충성도가 높은 영역
ROI는 ?
상품상세
ROI : 이 상품과 함께 본 상품
- 추천 서비스 영역은 특성 존재
- 한정된 상품 내에서는 추천알고리즘은 한계를 가지게 됨. (기획전의 경우 상품 Pool 이 한정)
- 한정된 조건  아무리 좋은 알고리즘도 고만 고만 해짐.
매출 뿐 아니라 Retention, Session 유지등 다양한 지표를 통해 효율 측정 고려 필요!
Return On Invest
ROI 고려하여 해당 영역의 최적화!
Summary
2
1
3
Commerce 추천은 실시간 사용자의 관심사가 중요!
추천은 알고리즘 연구가 아니다. 추천은 고객을 위한 서비스!
궁극적인 최적화 대상은 ‘고객을 위한 서비스 영역임’을 잊지 말자.
추천도 비즈니스 ! 추천도 투자 대비 수익을 생각해야 한다.
SKPlanet 개인화 추천팀
정재훈
감사합니다!

Más contenido relacionado

Similar a SKPlanet 추천 플랫폼 콜로세오 - SK ICT Tech Summit 2017 SKPlanet 추천 플랫폼 콜로세오 - SK ICT Tech Summit 2017

마케팅인사이트 회사소개서
마케팅인사이트 회사소개서마케팅인사이트 회사소개서
마케팅인사이트 회사소개서
mktarcadia
 
Ad pick campaign_201401
Ad pick campaign_201401Ad pick campaign_201401
Ad pick campaign_201401
ounjeong
 
Web analytics 2.0 study ch.9
Web analytics 2.0 study ch.9Web analytics 2.0 study ch.9
Web analytics 2.0 study ch.9
Eunyoung Kim
 
전자상거래 협업필터링
전자상거래 협업필터링전자상거래 협업필터링
전자상거래 협업필터링
InJae Hwang
 
[I Like Click]무료충전소운영제안서 071128
[I Like Click]무료충전소운영제안서 071128[I Like Click]무료충전소운영제안서 071128
[I Like Click]무료충전소운영제안서 071128
guest1f5f19
 

Similar a SKPlanet 추천 플랫폼 콜로세오 - SK ICT Tech Summit 2017 SKPlanet 추천 플랫폼 콜로세오 - SK ICT Tech Summit 2017 (20)

[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저
[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저
[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저
 
그로스 해킹 - Growth Hacking
그로스 해킹 - Growth Hacking그로스 해킹 - Growth Hacking
그로스 해킹 - Growth Hacking
 
Reco pick 소개자료_v05
Reco pick 소개자료_v05Reco pick 소개자료_v05
Reco pick 소개자료_v05
 
하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
 
RecoPick : recommendation services and some use cases
RecoPick : recommendation services and some use casesRecoPick : recommendation services and some use cases
RecoPick : recommendation services and some use cases
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
 
마케팅인사이트 회사소개서
마케팅인사이트 회사소개서마케팅인사이트 회사소개서
마케팅인사이트 회사소개서
 
Ad pick campaign_201401
Ad pick campaign_201401Ad pick campaign_201401
Ad pick campaign_201401
 
[시스템종합설계].pptx
[시스템종합설계].pptx[시스템종합설계].pptx
[시스템종합설계].pptx
 
Web analytics 2.0 study ch.9
Web analytics 2.0 study ch.9Web analytics 2.0 study ch.9
Web analytics 2.0 study ch.9
 
[GAMENEXT] 차세대 광고 수익화 모델 - nGEN, Tapjoy
[GAMENEXT] 차세대 광고 수익화 모델 - nGEN, Tapjoy[GAMENEXT] 차세대 광고 수익화 모델 - nGEN, Tapjoy
[GAMENEXT] 차세대 광고 수익화 모델 - nGEN, Tapjoy
 
[패스트캠퍼스]개인맞춤 패션 쇼핑몰 상품 추천 시스템
[패스트캠퍼스]개인맞춤 패션 쇼핑몰 상품 추천 시스템[패스트캠퍼스]개인맞춤 패션 쇼핑몰 상품 추천 시스템
[패스트캠퍼스]개인맞춤 패션 쇼핑몰 상품 추천 시스템
 
전자상거래 협업필터링
전자상거래 협업필터링전자상거래 협업필터링
전자상거래 협업필터링
 
kaggle hm fashion recsys pjct 발표 자료.pptx
kaggle hm fashion recsys pjct 발표 자료.pptxkaggle hm fashion recsys pjct 발표 자료.pptx
kaggle hm fashion recsys pjct 발표 자료.pptx
 
사용자분석 @코더스하이세미나
사용자분석 @코더스하이세미나사용자분석 @코더스하이세미나
사용자분석 @코더스하이세미나
 
[I Like Click]무료충전소운영제안서 071128
[I Like Click]무료충전소운영제안서 071128[I Like Click]무료충전소운영제안서 071128
[I Like Click]무료충전소운영제안서 071128
 
디지털 사이니지 품질 인증과 시청 효과 도입 검토2012
디지털 사이니지 품질 인증과 시청 효과 도입 검토2012디지털 사이니지 품질 인증과 시청 효과 도입 검토2012
디지털 사이니지 품질 인증과 시청 효과 도입 검토2012
 
[팝콘 시즌1] 최보경 : 실무자를 위한 인과추론 활용 - Best Practices
[팝콘 시즌1] 최보경 : 실무자를 위한 인과추론 활용 - Best Practices[팝콘 시즌1] 최보경 : 실무자를 위한 인과추론 활용 - Best Practices
[팝콘 시즌1] 최보경 : 실무자를 위한 인과추론 활용 - Best Practices
 
[PAP] 실무자를 위한 인과추론 활용 : Best Practices
[PAP] 실무자를 위한 인과추론 활용 : Best Practices[PAP] 실무자를 위한 인과추론 활용 : Best Practices
[PAP] 실무자를 위한 인과추론 활용 : Best Practices
 
AWS 솔루션을 활용한 마케팅 및 고객 관리 혁신 – 김선수, AWS 아마존 커넥트 사업 담당:: AWS Summit Online Kor...
AWS 솔루션을 활용한 마케팅 및 고객 관리 혁신 – 김선수, AWS 아마존 커넥트 사업 담당::  AWS Summit Online Kor...AWS 솔루션을 활용한 마케팅 및 고객 관리 혁신 – 김선수, AWS 아마존 커넥트 사업 담당::  AWS Summit Online Kor...
AWS 솔루션을 활용한 마케팅 및 고객 관리 혁신 – 김선수, AWS 아마존 커넥트 사업 담당:: AWS Summit Online Kor...
 

SKPlanet 추천 플랫폼 콜로세오 - SK ICT Tech Summit 2017 SKPlanet 추천 플랫폼 콜로세오 - SK ICT Tech Summit 2017

  • 1.
  • 2. 개인화 추천팀 정재훈 SK Planet 추천 플랫폼 콜로세오
  • 3. @uzysjung Objective-c Ranking git-awards.com 5 Apps I developed were chosen as New & Noteworthy, Staff Favorite in Apple App Store. 정재훈 북미 iPad 교육 카테고리 1등
  • 4. Collaborative Filtering 추천 관련 발표는 다 추천알고리즘에 대한 발표 뿐… 추천 플랫폼은? Deep Neural Networks Matrix Factorization Wide & Deep Learning 이 발표는 …
  • 5. • 안정적인 데이터 서빙. • 빠른 응답성 • 알고리즘 생성 • 알고리즘 성능 평가 • 알고리즘 최적화 • 사용자 로그 수집 • 추천 성과 수집 • 추천 성과 분석 • 추천 성과 리포팅 추천 플랫폼 서빙 생성수집 추천 플랫폼의 역할
  • 6. 현황 • 11번가 추천 Recopick  Colloseo 전환. (3월) • 추천 호출 하루 1억 건, Max RPS 2천 건 (11월) • A/B테스트를 거쳐 11번가 20개 영역에 추천/광고 상용 서비스 중 • 2,200만 고객에게 7천만 상품에 대해 추천 적용 중 • 전년 대비 11번가 추천 경유거래액 7배 증가 SK플래닛 빅데이터 클러스터 기반 추천 플랫폼. 치열한 추천 알고리즘의 각축 장이 되기를 바라며 ‘IL COLOSSEO’에서 유래 콜로세오
  • 8. 상품상세 페이지 최하단 CF , MF , I2V , AR ’Title’ , ‘CollectionView’ 추천 최적화 고려 요소 추천/호출 수, 추천수/상품 수 클릭율 , 경유거래액 , 경유거래 수 , 순거래액 서비스 영역 UI Component 적용 알고리즘 추천 커버리 지 성과 지표 Optimization
  • 10. 서비스영역에 적용되어 있는 추천 알고리즘들 + UI Optimization : 최적화 대상은?
  • 11. RNN 상품상세 장바구니CF 알고리즘을 여러영역에 적용 서비스 영역에 알고리즘들을 적용 1. 알고리즘을 만든다. 2. 알고리즘이 적합한 영역을 찾는다. 1. 추천이 들어갈 서비스 영역을 선정한다. 2. 영역에 적합한 추천알고리즘을 고민한다. 3. 적용한다. Optimization : 접근법 VS Now배송 긴급공수 쇼킹딜 상품상세 장바구니 MF CF RNN I2V
  • 12. 어떤 알고리즘이 좋을까? 커버리지 : 50% 평균 CTR 10% 각각의 추천 알고리즘은 개별적인 특성과 한계를 가짐. Optimization : 어떻게 최적화 하지? A 커버리지 : 100% 평균 CTR 5% B 다양한 알고리즘의 조합으로 서비스 영역에 적용 가능 VS +A B 커버리지 : 100% 평균 CTR 7.5%
  • 13. 그럼 어떻게 조합하지? 추천 Timeout Optimization : 대안 알고리즘 A B C D추천 요청
  • 14. BuyTogether : CF 기반 추천 로직 (Coverage : 29% ) BuyNext : CategoryToItem 기반 추천 로직 (Coverage : 100% ) PC 장바구니 A/B/C 테스트 (2017.9.11 ~ 12) 보완재 추천 알고리즘 BuyTogether BuyNext BT+BN 노출CTR (비율) 1.5 1 1.15 구매건수(비율) 1.52 1 2.1 Optimization : PC 장바구니 추천 <11번가 PC 장바구니 화면>
  • 15. 메인 알고리즘 대안 알고리즘 Optimization : AB테스트 A A’ A’’ 추천 요청 B B’ AB테스트 결과 AB A’B A’’B AB’ A’B’ A’’B’ 메인 알고리즘의 로직 향상으로 이어짐. 적용결과 B’ A
  • 16. ex) Norm * 0.3 + Vector * 0.7 Optimization : NOW배송 개인화 추천 Harald Steck et al, Interactive Recommender Systems: Tutorial, Proceedings of the 9th ACM Conference on Recommender Systems, September 16-20, 2015, Vienna, Austria While the orientations of the vectors reflect similarity, their norms reflect the items’ popularity. 플랫폼 상에서 서비스 영역의 지속적인 무중단 A/B테스트 를 통해 최적값을 찾을 수 있음. 콜로세오 MF 서비스 영역적 특성에 맞게 Norm 과 Vector 비중을 최적화 “ “
  • 17. 영역 클릭 장바구니 구매 추천 없음 1 1 1 인기도 기반 1.17 1.34 1.2 유사도 기반 1.24 1.26 1 NOW배송 탭 개인화 MF A/B 테스트 2017.9.5 ~ 2017.9.15 (비율 5: 2.5: 2.5 ) Matrix Factorization - Norm (인기도) VS Vector (유사도) Optimization : NOW배송 개인화 추천 <11번가 Now배송 탭 >
  • 18. 연관 상품 광고 AB테스트 2017.03.20 ~ 2017.03.21 플랫폼 기반 추천 로직 최적화 CF Item MAB CF Category 앙상블 사용자 플랫폼 지원 영역 사용자반응 추천결과 광고 추천 기존 광고 클릭 1.47배 1 광고매출 1.25배 1 Optimization : 연관 상품 광고 <11번가 상품상세 하단 영역>
  • 19. User’s interest In Realtime – eCommerce 특성 Implicit feedback (User action) Explicit feedback (User rate) E-Commerce >> E-Commerce는 사용자 성향을 명시적으로 Feedback 받기 어렵다. 오픈마켓 특성 상 뚜렷한 목적을 가지고 방문하는 고객이 많다 생필품 사는데 사용자 성향이 반영될 수 있을까?
  • 20. 실시간 개인화 추천 영속성 단발성 그럼 개인화 추천은 어떻게 되야 할까? + 현재 사용자의 쇼핑을 돕는 추천 (구매의도, 가격) 사용자의 성향에 기반한 추천 User’s interest In Realtime
  • 21. User’s interest In Realtime : 콜로세오 Colloseo 특징 비로그인 상태 사용자 행동 수집 가족 계정에 대한 추론을 통해 각 사용자 추천 로직 대응 (동일 계정에 여러 핸드폰) +App Mobile Web PC Web + Colloseo 실시간 로그 수집
  • 22. 실시간 개인화 추천 2차 5:5 A/B테스트 결과 기간 : 2016.12.13 ~ 2016.12.16 응답속도 개선( 평균 50ms ) 커버리지 향상 ( 98% ) 구분 노출 대비 CTR 비율 빌보드 3 긴급공수 1 개인화추천 8 쇼킹딜 2 User’s interest In Realtime : 콜로세오 Colloseo 개인화 추천 1.향상된 풍부한 사용자 로그 2. 실시간 연산 로드 분산 - 코드 최적화 , 인프라 개선 CTR (Clicks/Views) CTR 비율 경유 구매 비율 Recopick 0.41% 1(기준) 1(기준) Colloseo 1.566% 3.819 3.459 구분 노출 대비 CTR 비율 기획전 1 개인화추천 5
  • 23. Near Realtime Matrix Factorization - Item Feature 시간 단위 연산 - User Latent Feature 실시간 연산 매 시간 학습 추천 호출 시점 사용자 히스토리 기반 계산 추천 결과 생성 추천 요청 K-Mean MF-NRT 성과 CTR 1 1.07 7%↑ CVR 1 1.04 4%↑ 홈탭 쇼킹딜 5:5 A/B테스트 기간 : 2017.08.26~09.6 (7일간, App) User’s interest In Realtime : NRT MF Item Latent Feature User Latent Feature <11번가 홈탭 긴급공수, 쇼킹딜>
  • 24. 기존 로직 대비 10% 성능 향상 된 알고리즘 무조건 적용해야 될까? Return On Invest
  • 25. A 알고리즘 : Deep Neural Network 기반 CTR 5.5% , CVR 1% B 알고리즘 : Thompson Sampling 기반 CTR 5 % , CVR 1% - A/B 테스트 결과 : A가 B보다 10%↑ - 추천 상품 Pool : 500개 알고리즘 클릭 건수 구매 전환 A (DNN) 550 Click 5.5건 B (TS-MAB) 500 Click 5건 Return On Invest ex) 기획전 페이지 (PV : 1만/일) A (DNN) 학습 + 인퍼런스 장비 (GPU 장비 필요) >> B (TS-MAB) 서버 Only 시스템 복잡도
  • 26. A (수동, 5) B (MAB, 5) 성과 CTR 1 1.94 94.39%↑ CVR 1 1.71 70.88%↑ A/B테스트 07.27~07.30 (4일간, Android) - 1년 약 4천개의 기획전. - 상대적으로 적은 노출 - 상품 변경이 잦음. - 상품Pool 한정적 (100 ~ 2,000 개) 11번가기획전 성/연령 13개 Segment Thompson Sampling 기반 최적화 ROI : 기획전
  • 27. CF 배치시간 최적화 6천만 상품에 대한 시간단위 배치  15% 추천 성능 향상 11번가 가장 PV가 높은 영역 고객 충성도가 높은 영역 ROI는 ? 상품상세 ROI : 이 상품과 함께 본 상품
  • 28. - 추천 서비스 영역은 특성 존재 - 한정된 상품 내에서는 추천알고리즘은 한계를 가지게 됨. (기획전의 경우 상품 Pool 이 한정) - 한정된 조건  아무리 좋은 알고리즘도 고만 고만 해짐. 매출 뿐 아니라 Retention, Session 유지등 다양한 지표를 통해 효율 측정 고려 필요! Return On Invest ROI 고려하여 해당 영역의 최적화!
  • 29. Summary 2 1 3 Commerce 추천은 실시간 사용자의 관심사가 중요! 추천은 알고리즘 연구가 아니다. 추천은 고객을 위한 서비스! 궁극적인 최적화 대상은 ‘고객을 위한 서비스 영역임’을 잊지 말자. 추천도 비즈니스 ! 추천도 투자 대비 수익을 생각해야 한다.

Notas del editor

  1. 안녕하세요 SK플래닛 개인화 추천팀 정재훈입니다. 제가 2년간 레코픽 서비스를 개발/운영한 노하우를 기반으로 새로운 추천 플랫폼 콜로세오를 만들면서 고민했던 내용을 공유드리겠습니다.
  2. 간단히 제 소개를 드리면 저는 풀스택 개발자 입니다. -현대 모비스 : 전장 플랫폼 오디오를 개발 양산 -LG 전자기술원 : 대학원 전공인 햅틱&Tactile Feedback 연구 -NCSoft : 교육용 App 과 게임을 개발 했습니다. -SK플래닛 : 패션커머스 앱 스타일 태그, 야구실황중계 채팅 앱 베이스톡, 국내 최초 크라우드기반 추천 서비스 레코픽 -피냐타랩스라는 회사를 차려서 StylePop이라는 패션 팝업스토어 개발도 했습니다. -2년 전까지는 오픈소스 컨트리뷰션도 했었고 지금. 최근에는 바빠서 못하고 있구요. 근데 지금도 1등이더라구요. 크게 성공한 것도 있고 알려지지 않은 것도 있고. 제조업체를 제외하고는 완결형 조직에서 직접 기획부터 개발까지 진행을 한 경우가 많다. 홍보/캐릭터 없이 도라도라 새서미를 이기로 US 교육용 앱 1등도 해보고
  3. - Enter - 추천 관련 발표에 항상 나오는 CF , MF ,요즘은 DNN , W&D - 논문 보면 핵심 피쳐 , 하이퍼 파라메터 튜닝등 실서비스에 중요한 것들은 명확하게 설명되어 있지 않죠 - 논문 구현은 끝이 아닌 시작. 지속적으로 라이브서비스에서 고도화가 필요합니다. - 이 발표는 어떻게 추천시스템을 발전 시킬 것인가? - 추천 알고리즘을 어떻게 서비스에 적용할 것인가에 대해서 말씀 드릴 것입니다. - Enter - 추천 플랫폼 '콜로세오'를 통해서 말씀 드릴 것입니다.
  4. - 추천 플랫폼의 역할에 대해서 알아보겠습니다. - 추천 플랫폼의 역할은 크게 3가지 행동/성과 로그 수집 , 추천 생성 , 서빙으로 구분 됩니다. - 추천 플랫폼은 추천을 내보내고 평가하고 다시만드는 일련의 작업을 효율적으로 할 수 있도록 해줍니다.
  5. - SK플래닛의 추천 플랫폼 콜로세오를 소개 드리겠습니다. - 치열한 추천 알고리즘의 각축 장이 되기를 바라며 콜로세움에서 유래. - 3월에 런칭 / 11번가 현재 하루 추천 호출 2억건 , 현재도 초당 2천건 추천을 내보내고 있습니다. - 11번가 20개 영역에 서비스 중입니다.
  6. 콜로세오 아키텍쳐에 대해서 설명드리겠습니다. 콜로세오는 크게 3영역으로 나눠져 있습니다. DG, DB , DS 2명이서 사이드 프로젝트로 시작해서. 회사 공유 Data Infra를 최대한 활용. 운영 포인트 최소화 콜로세오 개발 철학은 Configuration Centric, Infrastructure independent Platform 에 중점을 둠. Infra independent Platform은 추후 레코픽서비스의 플랫폼 전환을 염두에 둔 것입니다. 3년간 레코픽이라는 추천 서비스를 해오면서 제가 느낀 추천 플랫폼에 가장 중요한 요소3가지 Enter 최적화 Enter 실시간성 Enter ROI 를 중심으로 콜로세오 기능/적용 현황을 살짝 소개 해드리겠습니다. 시간이 없어요. 간편한 운용 Configuration Centric. , Infrastructure Independent platform : 범용성 ( SKP IDC , AWS , Gcloud .. ) 3년간 레코픽을 해오면서 느꼈던 부분을 중심으로 기타 영역은 최대한 관리포인트를 줄이는 간결한 방향. 서비스 최적화 , 실시간 처리, 운영효율성 Hapijs Framework 국내최대 트래픽 Falcor, ES Query DSL 에 영감을 얻음. Bold 처리한 부분들에 대해서 볼 예정.
  7. 먼저 최적화에 대해서 알아보겠습니다. 추천 최적화를 위해 고려해볼 요소는 - 서비스영역 - UI - 추천 알고리즘입니다.
  8. - 추천 최적화 요소들을 알아 봤는데요 - 그럼 추천 최적화 대상은 뭘까요?
  9. -제가 생각하는 최적화 대상은 이렇습니다. Enter -서비스 영역에 적용 되어 있는 추천 알고리즘들! + UI 그럼 왜 이렇게 생각하는지 알아 보겠습니다.
  10. 추천 최적화 방법 중 어떤 것이 좋을까요? 알고리즘을 여러영역에 적용하는 법 - 내용 읽기 서비스 영역에 알고리즘을 적용 어떤 것이 좋을까요? Enter 서비스 영역에 알고리즘들을 적용하는 것이 좋습니다. 서비스 영역에 따라 중요지표가 달라짐. 홈화면은 허브역할 CTR이 중요 지표 , 상품페이지에서는 구매로의 연결이 중요. 동일 알고리즘으로 여러영역의 중요지표를 만족 시킬 수 없음. 서비스영역에 맞는 알고리즘 개발 필요. 영역 특성 홈화면 : 사용자의 상품 진입 중요. 상품페이지 : 구매전환 , 타 상품 진입 둘다 중요 장바구니 : 구매전환 중요
  11. 그럼 서비스 영역을 최적화 하면 된다는 것을 알았습니다. 그럼 어떻게 최적화 하는 것이 좋을까요? 또 다시 문제 A.B중 어떤 알고리즘이 좋을까요? Enter , Enter 3. 정답은 A내보내고 추천결과 없으면 B 내보내기 그러면 커버리지 100, CTR이 7.5% 4. 그럼 A+B는 어떻게 만들어야 될까요? 여러 알고리즘들의 가능합 조합으로 다 만들어 볼까요? 5개면 5!. 모든 서비스 영역에 대해서?
  12. 1. 대안알고리즘을 쭉 내보내도록 시스템을 만들면 됩니다. 2. 간단하죠?
  13. - 대안알고리즘의 실제 적용 예를 보겠습니다. - 11번가 PC 장바구니에 적용한 예입니다. - 3가지 알고리즘이 있는데요. BT와 BN , BT -> BN - 결과 보시면 BT+BN이 높은 것을 볼 수 있습니다. CTR은 노출기준입니다. - 더 여러사람에게 추천이 보여지고 그로인해 구매전환이 높아짐을 알 수 있습니다. BuyTogether만 있다면 나머지 트래픽은 버려지는 경우 + 커버리지가 안되서 버려지는 트래픽에서 BuyNext가 적용되어짐.
  14. 1. 최적화에 필수요소죠 2. 콜로세오 AB테스트에 대해 알아보겠습니다. 3. 콜로세오는 메인  대안 알고리즘 구조에서 여러 조합으로 AB테스트가 한꺼번에 돌아갈 수 있습니다. 4. 이를 통해 얻은 결과를 최종 조합으로 하이브리드 알고리즘을 적용할 수있고 5. 이를 기반으로 메인 알고리즘을 향상 시키는 인사이트를 전달하기도 합니다..
  15. 1. 다중 AB테스트를 통한 최적화 예시입니다. 2. MF Latent feature vector에서 벡터는 유사도 , norm은 인기도 의미 3. 서비스 영역별로 인기도가 중요할 수도 , 유사도가 중요할 수도 있습니다. 4. 적절함 값을 찾아내면 최적화가 됩니다.
  16. 나우배송 개인화추천에서의 결과 입니다. 클릭은 좀 떨어지지만 인기도 기반이 구매전환이 높음을 알 수 있습니다.
  17. 1. 콜로세오에서 지원하는 또다른 방식의 추천 최적화 방법입니다. MAB를 플랫폼에서 지원합니다. 2. 연관상품 광고는 CF Item기반 , Cat기반을 앙상블 합니다. 3. 이후 추천 후보군을 선정하고 실제로 고객에게 노출 3. 사용자반응을 기준으로 추천결과를 최적화 해나가도록 콜로세오에서 지원합니다. 4. 연관 상품 광고에 이와같이 적용 했으며 오른쪽과 같이 CTR 1.47배 매출 1.25배가 높아졌습니다.
  18. - 지금까지 콜로세오의 최적화 방법에 대해서 설명 드렸고 - 이제 실시간 성에 대해서 알아보겠습니다. - 본 문 읽기
  19. - 그럼 이런 커머스 환경에서 개인화 추천은 어떤 형태여야 할까요. - 저는 사용자의 성향을 파악하고 현재 사용자의 쇼핑을 돕는 두가지를 만족하는 것이 개인화 추천이라고 생각합니다. 6개월 치 Implicit feedback을 통해 사용자 성향을 분석하고 실시간 사용자의 구매의도를 파악하여 둘을 함께 제공한다.
  20. - 콜로세오는 사용자 성향/실시간 의도 파악을 위해서 - 다양한 기기에서 PC,MW,APP 비로그인 시의 사용자 모든 행동 로그를 비실명으로 수집하며 실시간으로 처리합니다. - 또한 동일ID를 가족끼리 공유하는 것을 파악하여 개별적으로 실시간 추천을 대응하고 있습니다.
  21. - 그래서 콜로세오 추천은 얼마나 좋아졌을까요? - 기존 11번가에 적용되었던 레코픽 대비 3.8배가 높습니다. - 이렇게 보면 레코픽이 안 좋은 것 아냐 라고 생각하실 수 있는데 - 레코픽도 타 추천 솔루션 업체와 벤치마크테스트 하면 압도하고 있습니다. 어떤 이유일까요 ? 추천 계산량 줄임. 인프라 최적화. 타임아웃 개선. 커머스에서 실시간 성은 정말 중요한 요소. 아무리 좋은 알고리즘이어도 실시간 성을 못살린다면?
  22. - 또다른 실시간 추천으로 콜로세오는 MF를 기반으로 한 실시간 추천 엔진을 가지고 있습니다. - 아이템은 시간단위 핛습 배치 , 사용자 피쳐는 ALS로 실시간으로 추천 호출 시점에 연산 합니다. - -결과는 기존 K-MEAN 기반 대비 7% 향상 홈화면은 트래픽이 높아서 7%도 의미가 큽니다.
  23. - 지금까지 콜로세오의 최적화 / 실시간 성에 소개해드렸구요 - 이제 자원을 효율적으로 사용하는 법에 대해서 얘기 해보겠습니다. - 또 다시 문제. - 본문 읽기
  24. -예시 상황입 입니다. -기획전 영역 A알고리즘 CTR B대비 10% 높지만 실제 구매 연결은 0.5건. -그러나 시스템 복잡도 , 장비 측면에서 A 알고리즘은 너무 비싸다. -효율 측면에서 어떤 알고리즘이 좋을까요? 트래픽이 적어서 10%가 큰차이가 아니네요. -전 당연히 B를 선택하겠습니다. 기획전 같이 상품 갯수가 한정 만약 상품이 10개 중 하나만 추천 해야 된다면 경우의 수는 1개 DNN 기반 알고리즘 개발 엄청 훌륭한 알고리즘 DNN 10 hidden layer 몇백원 벌자고 몇억장비 이용하지 않겠죠? , 상품 Pool 이 한정되면 추천가능 경우의 수는 줄어들어서 복잡한 예측보다 간단한 강화학습이 더 좋을 수 있음. AWS EMR 비용. 딥러닝 인퍼런스 장비 , 학습 장비는 비싸고 한정된 자원.
  25. - 실적용 예시 - 11번가 기획전에 MAB TS를 적용 했습니다. - 성과는 수동 편성 대비 100% 가까운 성능 향상을 보였습니다. - 상품Pool이 한정 되어 있으면 추천 로직의 성능이 최대로 발휘 되기 어려움. - Pool이 작으면 작을수로 MAB가 적은 비용으로 높은 성과를 낼 수 있음.
  26. - 11번가 전체 상품상세 하단에 이상품과 함께 본 상품은 고객 충성도가 높은 영역. - 기존 10시간 단위 배치를 스팍 익스큐터 600개 로그수 2배 배치를 매시간 연속적으로 돌려서 15% 추천 성능이 향상 되었습니다. - 잘한 것일까요? 네. 고객이 정말 많이 사용하는 영역입니다. - 경유거래액도 높구요. 아낌없이 컴퓨팅 리소스 사용해도 됩니다.
  27. ROI 정리 해보면 - 추천 서비스 영역은 특성 존재 - 예를 들면 한정된 상품Pool에서는 아무리 좋은 알고리즘도 고만고만 해짐 - ROI를 고려하여 알고리즘 적용, 배치시간등을 조절해야 함.
  28. - 마지막으로 오늘 내용을 정리해보면 - 본문 읽기.