SlideShare una empresa de Scribd logo
1 de 59
Descargar para leer sin conexión
글로벌 사례로 보는
데이터로 돈 버는 법
고영혁
트레저데이터 데이터사이언티스트/아키텍트
dylan@treasure-data.com
발표자인 데이터 사이언티스트 고영혁은 ?
0
1
2
3
4
5
수학
통계학
분야전문성
커뮤니케이션
시각화
프로그래밍
머신러닝
하둡생태계
 게임 진행이 막히거나 더디는 구간은?
 이용자의 게임 내 경제 활동 패턴은?
 이용자의 게임 내 콘텐츠 소모 패턴은?
 마케팅이 게임 활성화에 미치는 영향은?
 유료화 모델의 적절한 방향은?
 유료화 시 매출 예측 결과는?
답을 얻어내고 실행에 옮긴 질문 (2004 ~ 2006)
 거래 데이터로부터 라이프 이벤트 추출 가능?
 상품별 효과적인 라이프 이벤트는 무엇인가?
 어떤 이동 경로에 노출하는 것이 효과적인가?
 최종 구매에 도달시키기 위한 핵심 인자는?
 마케팅 형태에 따른 구매 전환율은?
답을 얻어내고 실행에 옮긴 질문 (2008 ~ 2009)
TREASURE DATA 소개
트레저데이터 회사 개요
Treasure Data 는 서비스 형태로 데이터 분석 인프라를 제공하는 세계
선도 기업으로서, 데이터 파이프라인과 데이터 플랫폼 관리의 각종
복잡한 이슈를 해결하여, 조직이 데이터로부터 가치를 추출하는 데에만
온전히 집중할 수 있도록 합니다.
• 설립연도: 2011년 12월
• 위치: Mountain View, CA (HQ), Tokyo, Seoul
• 투자현황: $47M raised from top Silicon Valley VCs (Now Series C)
• 개발하여 후원하는 글로벌 유명 오픈소스 프로젝트 목록
Treasure Data Investors
Treasure Data’s
Data Collection Technology Users
Jerry Yang
Yahoo! Founder
James Lindenbaum
Heroku Founder
Bill Tai
ex-CRV, leading angel
investor
• Very popular data collector
• Data serializer
• Enterprise data bulk loader
• Data collector from IoT/Embedded devices
The Growth of Treasure Data
60,000,000,000,000+Rows (October 2016)
트레저데이터 창업자 소개
Hiro Yoshikawa CEO
Kazuki Ota CTO
Sada Furuhashi Chief Software Architect
• 와세다 대학 재학 중에 Red Hat, Inc.에서 근무. 엔지니어로 경력을 시작하고 교육사업,제품 마케팅, 사업개발을
담당. 2009년에 미쓰이물산의 벤처 캐피탈 사업인 "미쓰이 벤처스"의 멤버로 미국으로 감.
• 오픈소스 소프트웨어 기업에 대한 투자와 경영에 종사한 경험을 살려 2011년에 미국 트레저데이터사를
창업하여 최고 경영자(CEO)로 취임, 현재에 이르고 있다.
• Red Hat에서의 오픈소스 소프트웨어 사업 경험과 미국에서의 사업 경험을 살려, 트레저데이터의 경영 전반
책임자로 활약중.
• 고등학교 시절부터 Linux의 데스크탑 환경 KDE 커미터로 OSS 커뮤니티에 공헌함.
• 2006년, 도쿄대학 이학부 정보과학과 재학중에 주식회사 Preferred Infrastructure의 최고기술책임자(CTO)로
취임. 여기에서 Hadoop을 만나 2009년에 "Hadoop 사용자 모임 재팬"을 설립. 현재 등록자수는 1,700명을
넘어 세계 최대규모의 Hadoop 커뮤니티가 되어있다.
• 2011년에 퇴직 후, 미국에서 트레저데이터사를 창업하고 최고기술책임자(CTO)로 취임, 현재에 이르고 있다.
• 2012년 쓰쿠바대학 대학원을 졸업. 학창시절인 2010년에 일본OSS추진포럼에서 “일본OSS장려상”을 수상.
• 또, 다국어 통신이 가능한 분산 인프라기술 “MessagePack(메시지 팩)”을 개발. 2008년에 오픈소스
소프트웨어로 공개하여 현재는 전 세계적으로 이용되고 있다.
• 2011년에는 미국 트레저데이터사를 요시카와,오타와 함께 창업. Hadoop기반의 클라우드 데이터 분석
플랫폼의 구축 및 구현을 담당하고있다. 2011년부터 로그 컬렉터 “Fluentd”의 개발을 시작.
• 현재는 Web서비스나 광고, CDN등을 비롯한 수많은 산업 분야에서 전 세계적으로 도입되어 2014년에는
Google Cloud Platform의 로그 컬렉터로 표준적으로 채용됨. 2015년 “Embulk”의 개발을 시작.
트레저데이터의 미션
데이터가 돈이 되기 위한 기본문제와 트레저데이터의 해결 접근법
Collect Store Analyze
Essential Infra for “Data Driven Action”
Action
Treasure Data • Cloud Data Storage and Interface
• Fully Managed SaaS
• Holistic Live Data Management Platform
• Enable to Make Data Automation (Data Product)
Easily and cost efficiently
데이터가 돈이 되기 위한 기본문제와 트레저데이터의 해결 접근법
3 관리하기 어려운 분석계
4 활용 안되는 KPIs
2 복잡한 시스템 통합
1 흩어져 있는 데이터 저장소들
Before TD
After TD
3
쉬운 솔루션 연계
2 관리 부담 제로
1
쉬운 데이터 수집
50+ Data Outputs
Multi-Tenant Cloud Service
300+ Data Sources
Traditional ETL/BI Process
데이터 유입
FRAGILE
하나의 변경으로
전체 시스템 고장 가능성
FRAGMENTED
분산된 데이터 마트
LIMITED
접근성, 질의, 유연성
ETL Team EDW Team BI Team End User & System
새로운 질의(BI)? ETL에서 부터 다시 시작!
Data
Consumer App
A Completely Different Data Approach
데이터 유입
MANAGED
클라우드 서비스
모티터링 & 지원
24/7/365
AGILE
실시간 필요한 데이터
선택 사용
IMMEDIATE
비지니스 속도와 같이
필요한 데이터 준비
Data Team End User & System
BI Tool
Data
Consumer App
Data
Mart
Dash
Board
모든데이터 저장, 필요한 데이터 선택 사용.
SCHEMALESS
단일 클라우드 플레폼에
모든 데이터 JSON 으로
저장
A Completely Different Data Approach
계획, 분석 그리고 행위!
초기 설정
분석
기다
림
분석
기다
림
스키마
업데이트
클러스터
크기
조정
초기 설정
개발에 집중!
데이터 분석가
엔지니어
데이터 분석가
엔지니어
MPP
데이터베이스
트레져 데이터는
스키마 적용이
자유로운(Schema
Less) 클라우드
서비스
내 데이터
어디에?
항상 바쁨!
내 데이터
어디에?
변경
금지!!
Before Treasure Data
After Treasure Data
SERVICE
ARCHITECTURE
Technical Architecture
멀티 클라우드 배포 AWS CloudStack OpenStack
Secure Connection
Gateway
수집
분석
Streaming Collector(Fluentd)
CLI Bulk Loader
JavaScript / Mobile .. SDKs
IoT
Presto
(MPP)
Hadoop
(MapReduce)
HivePig
REST
API
JDBC
ODBC
3rd Party BI
Dashboard
Adv. analytics tools
Path analytics
Web analytics
A/B testing
Use case support
Gaming
Ad-tech
IOT
Result
Push
OAuth
Server-Side Bulk Loader
Real-time Access
Multi-Tenant
Query Template
저장
Plazma
Schema-less
Distributed
Columnar
Storage
New Query Editor
관리 & 운영 Security Provisioning Monitoring Support
데이터 생태계의 혁신을 만들어낸 트레저데이터의 핵심 기술 역량
Storage
Data ProcessingData Import
트레저데이터가 개발한 프로그래밍 필요 없이
머신러닝을 실행할 수 있는 SQL 쿼리 형태의
라이브러리. 일본 주요 애드테크 기업들에서
CTR 예측 등에 활용
대규모 데이터 병렬 분산처리 기반
오타 CTO 가 세계 최대규모의 Hadoop 일본
유저 그룹을 설립
Facebook 이 개발한 병렬 분산처리 기반 오픈
소스 소프트웨어 프로젝트로서, Facebook,
Teradata 와 함께 트레저데이터도 개발에 참여
공동창업자 후루하시가 개발한 바이너리 기반
의 고속 변환이 가능한 데이터 압축 포맷
Pinterest, Uber 등에서도 데이터 저장용 포맷
으로 사용하고 있음
공동창업자 후루하시가 만든 벌크 형
식의 로그 수집 도구
오픈소스 소프트웨어로 공개한 지 1
년 반만에 100개 이상의 플러그인이
개발되었으며, WEB 서비스 기업을 중
심으로 사용되고 있음
트레저데이터가 개발한 IoT・임베디
드 기반을 위한 스트리밍 형식의 로
그 수집 도구
C언어로 개발되고 있어서 가볍고, 의
존성에 구애 받지 않고 이용 가능
Plazma
트레저데이터가 독자 개발한 타임스탬프를 인
덱스로 하는 스키마리스 컬럼기반 데이터베이
스. 시계열 로그 빅데이터 처리에 특히 강함
공동창업자 후루하시가 만든 스트리
밍 형식의 로그 수집 도구
Google, Microsoft, AWS 와 같은 글
로벌 기업들에서 로그 수집 도구로 사
용되고 있음
솔루션 비교
운영해야 할 인프라
투입할 직원 리소스
확장성 & 민첩성
지원
활용까지 소요 기간
총비용
하드웨어, 소프트웨어
구축 / 유지
제한됨 / 비쌈
자체 팀 필요
10-12 개월
$$$$$
시간당 인스턴스
설정 / 모니터링
제한됨 / 비쌈
별도 비용 지불
4-6 개월
$$$
없음
최초 설정 한 번
기본 포함
2-4 주
$
최저 비용 무한 자유도
(플렉서블 스키마 기반)
On-Premise In-Cloud Managed Service
다양한 분야의 글로벌 초우량 고객사
AD Tech
IoT
三菱重工
Retail Finance Technology
Agency / Trading Desk DMP / DSP Ad-Network
TelecommunicationMaker
EC Media Game/SNS
Digital Marketing
트레저데이터의 기술 (Fluentd, MessagePack, Embulk)을 사용하는 대표 기업
데이터로 돈 버는 글로벌 사례 #1
MUJI : 전통적 리테일에서 데이터 기반 O2O
MUJI (무인양품) 기본 소개
• 1980년 회사 설립
• 연매출 22억 USD
• 연수익 2억 USD
• 매장 현황 – 일본 401개 / 해외 301개
• MUJI = NO brand name or designer name
• 트레저데이터 활용 - 2013년부터
※ 2015년 2월 기준 자료
MUJI (무인양품) 기본 소개
MUJI (무인양품) 기본 소개
MUJI Japan MUJI Times Square
MUJI – Needs & Challenge (Pain Points)
• 매출의 성장
• 전세계에 걸쳐 있는 다수 매장의 관리
• 고객 로열티의 관리
• 데이터를 활용하는 것이 근본적인 답이라는 것은 알고 있음
 NEEDS
• 방대한 웹/앱/매장 데이터의 통합 문제
• 기존 시스템을 최대한 건드리지 않고 패러다임 시프트
• 시간. 시간. 시간
• Scalability
 CHALLENGE
Treasure Data
로 해결
무인양품의 O2O 기반 리테일 혁신의 HUB – MUJI Passport
 바코드 기반의 고객 ID 기능
 MUJI 쇼핑 포인트(마일리지) 기능
 혜택 쿠폰 발급
 매장 체크인 기능
 관련 뉴스
 쇼핑 가이드 – 제품 검색, 매장 안내
 선호도/관여도 정보 수집 (Like, Have)
 MUJI 마일리지의 통합 및 보너스
마일리지를 활용한 ID/정보 통합 유도 –
소셜 ID, 온라인 사이트 ID, 카드 ID
앱 첫화면
관련 뉴스
ID 매장 체크인
제품 검색 매장 안내
Digital ID+Owned Media+Store & Product Search
MUJI – Treasure data 활용 O2O Analytics Platform
MUJI – Treasure data 활용 핵심 및 결과
• 고객의 온라인 행동과 오프라인 행동 패턴을 데이터를 통해 모두 파악
• 온라인에서의 행동과 매장의 재고 및 매출 현황을 토대로, 고객의 매장
방문 시점에서 해당 고객 및 매출에 최적화된 스펙의 쿠폰을 실시간으로
생성하여 사용 유도
 활용 핵심
 활용 결과
• 매출 46% 증가
• 전체 매장 평균 쿠폰 활용률 100% 증가
• 오프라인 매장 내 체류시간 및 동선량 증가
MUJI – Next Step
• 현재 TD를 통해 연 30억 트랜잭션 이상의 데이터를 저비용으로 기존 시스템
건드리지 않고 효율적으로 처리
• 이렇게 쌓인 데이터를 TD의 Machine-Learning-As-a-Service 인 HiveMall 을
이용해서 매장 내 위치 기반 실시간 프로모션 엔진 준비
• TD 인터페이스를 통한 다양한 연계로 프로모션/마케팅 자동화를 효율적 구축
데이터로 돈 버는 글로벌 사례 #2
WISH : 개인화&자동화를 통한 쇼핑 최적화
WISH – 기본 소개
• 개인화 추천 기반 모바일 커머스
• 야후, 구글, 페이스북 엔지니어가 2011년 창업
• 창업 후 18개월만에 1500만 일활성화 이용자
• 전세계에서 두번째로 많이 다운로드된 쇼핑앱
• 현재 전세계 2억 일활성화 이용자
• 2015년 말 기업가치 $30억 (유니콘~데카콘)
• 2012년부터 TD 고객. 추후 TD에 투자까지
WISH – 기본 소개
• 개인화 추천 기반 모바일 커머스. 80~90% 까지 할인 상품 다수
WISH – Needs & Challenge (Pain Points)
• 핵심 고객 세그먼트인 개인화된 경험 원하는 여성에 대한 정확한 이해
• 비즈니스에 핵심이 되는 액션을 빨리 수행
• 전 직원간의 유기적인 데이터 기반 커뮤니케이션과 액션
 NEEDS
• 위시의 대부분은 여성을 잘 모르는 남성 엔지니어 (남탕)
• 구글, 야후, 페이스북 등에서 온 데이터, 머신러닝 전문가들이지만
이커머스에 필요한 방대한 것들을 다 알지도 못하고, 절대적인 사람
숫자도 부족
 CHALLENGE
WISH – Treasure Data 활용 아키텍처
WISH – Treasure Data 활용 A/B 테스트 시스템
100s of TD Queries
Data Cache
App Server
App Server
App Server
{“user_id”:1337,“action”: “buy”}
Custom Dashboard
WISH – Treasure Data 활용 핵심 및 결과
• TD의 Fluentd 를 활용하여 2시간 만에 이용자 행동패턴 핵심 데이터
수집 기반 구축
• 모든 고객 상호작용 포인트마다 A/B 테스트를 실행하여 결과가 자동
분석되고 최적 대안도 자동으로 서비스에 적용되는 프레임워크 구축
• TD 웹콘솔과 Python API 를 이용하여 전직원 누구나가 필요한
데이터에 마음대로 접근해서 간단한 SQL 쿼리로 필요한 분석을
실시간으로 마음대로 수행하는 환경 제공
• 상품 판매자들에게도 개인화된 판매 분석 대시보드 제공하여 효과적인
상품 전략을 세울 수 있게 함
 활용 핵심
 활용 결과
• 일 34억 이벤트 데이터를 TD로 처리하여 서비스/비즈니스 밸류 발굴
• 개인별로 최적화된 쇼핑 경험을 제공  고객이 WISH를 사랑하게 됨!
• 일 활성화 이용자 2억명 이상. 두번째로 많이 다운로드 된 쇼핑 앱
• 데이터 기반 자동화/효율화를 통한 멀티 버티컬 도입 및 성공
데이터로 돈 버는 글로벌 사례 #3
OISIX : 머신러닝으로 이탈고객 예측&방지
Oisix – 회사 개요
• 2000년 창업. 자본금 약 84억원
• 식재료와 완제품 요리의 전자상거래/리테일 판매 비즈니스
• 가입회원 대상 지속적 판매를 하는 서브스크립션 커머스 중심
Oisix – 회사 개요
• 전통적인 서브스크립션 커머스 대비 회원비 부담 없고, 개인화된
구매(식재료의 종류&수량, 배달 시간)가 가능
Oisix – 머신러닝을 활용한 이탈자 예측과 대응
 기계학습을 하고
지난 1달간의 데이터를 바탕으로
앞으로 1달간에 해지 할 가능성이 높은
고객 리스트를 Hivemall을 이용하여 작성
실시 내용
 회원의 정기 구매가 회사 전체 매출과
이익을 좌우하는데, 해지 징후가 있는 회원을
미리 파악 및 방어하는 대책이 부족했다
과제  오이식스(Oisix)고객 사례
 통계의 전문 지식 없이 머신러닝
 해지 예측 리스트에 있는 회원에게
포인트를 부여함으로써 해지율 반감
 해지 원인이 되는 액션, 이벤트를 찾아내고
비해지고객의 특징적인 행동도 파악 가능
기대 효과
Web
Mobile
속성 정보
행동 로그
클레임 정보
유입 경로
이용 서비스 정보
직접적 액션
간접적 액션
포인트 부여 케어콜
성공체험에로 유도UI 변경
예측에 사용하는 데이터 Hivemall 에서 머신러닝
고객 정보나 행동 로그를 바탕으로 기계학습을 하고 해지고객을 예측
Table of Who / When / How % Churn
Oisix – 머신러닝을 활용한 이탈자 예측과 대응 w/ Hivemall
Classification with Mahout
CREATE TABLE lr_model AS
SELECT
feature, -- reducers perform model averaging in
parallel
avg(weight) as weight
FROM (
SELECT logress(features,label,..) as (feature,weight)
FROM train
) t -- map-only task
GROUP BY feature; -- shuffled to reducers
This SQL query automatically runs in
parallel on Hadoop
• Machine Learning made easy for SQL developers
(ML for the rest of us)
• Interactive and Stable APIs w/ SQL abstraction
데이터로 돈 버는 글로벌 사례 #4
워너브로스 : 프로세스 자동화로 시간과 돈 절약
WARNER BROS. ENTERTAINMENT
• 게임 서비스 사업을 진행하기 위해서는 다양한
솔루션의 도움이 필요. 각 솔루션별로 제공하는
레포트와 기능들을 활용
• 사업이 고도화될수록 각 솔루션들이 기본으로
제공하는 것들에 만족하지 못하게 되고, 각각의 raw
data 를 직접 연결해서 활용하여 고차원의 분석을
하고 싶은 욕구가 강해짐
• 정형화된 레포트를 추출해서 보는 것만이 아니라
각 부서별로 그 때 그 때 필요한 분석을 하기
위해서는 데이터 엔지니어의 도움을 필요로
하다보니 병목이 점점 발생
• iOS, Android 매출 데이터의 병합 및 정제가
매끄럽지 못한 상황이 종종 발생
Pain Points
WARNER BROS. ENTERTAINMENT
650B records stored!
• 활용하던 솔루션들의 raw data 를 트레저데이터로
자동으로 수집 통합하여 원하던 고차원 분석을
마음대로 할 수 있게 됨
• 데이터 엔지니어의 도움을 최소화하여 분석이
필요한 누구든지 인터랙티브 쿼리의 프레스토
기반으로 Adhoc 분석을 활용하게 됨
• 데이터 활용 프로세스에서의 병목이 대폭적으로
감소했을 뿐만 아니라, 허드렛 일을 하던 데이터
엔지니어 리소스의 비중을 줄이고 데이터
사이언티스트 비중을 훨씬 강화
• 트레저데이터가 만든 data workflow management
engine 인 digdag.io 를 이용하여 매출 데이터 병합
및 정제와 이를 기반으로 한 매출 레포트 생성을
완전히 자동화
Benefits by Treasure Data
• UDFs, Web-hooks, Scripts
• Interactive queries via Presto
• Significantly reduced latency
Digdag.io
WARNER BROS. ENTERTAINMENT
데이터로 돈 버는 글로벌 사례 #5
DENTSU 등의 애드테크(ADTECH) 회사들
• 자체 개발한 온프레미스 DMP 솔루션은 새로운
고객마다 데이터 소스를 처리하는 커스터마이징을
하기 위해 수개월 이상이 걸림
• 데이터 엔지니어링 작업의 완료를 대기하느라
데이터 사이언스 팀의 업무 처리 속도가 저하됨
• DMP 솔루션에 대한 막대한 수요를 감당하지 못함
• 인프라스트럭쳐를 디자인하고 유지하는 것은
덴츠의 핵심 역량이 아님
• 데이터가 물리적으로 덴츠의 소유이다보니
데이터의 소유를 원하는 고객사 니즈 못맞춤
Pain Points
Dentsu – Pain Points
Dentsu – DMP Infra by Treasure Data and 3rd Parties
http://www.dentsu.co.jp/news/release/2015/1006-004272.html
• 별다른 추가 개발 없이 기존의 온프레미스 레거시
시스템에 바로 연동되는 유연한 클라우드 인프라를
통해 즉각적으로 문제가 해결됨
• 플러그인플러그 방식의 데이터 커넥터를 활용하여
새로운 데이터 소스를 설정하고 처리하는 데에
걸리던 시간을 수개월에서 몇일로 단축
• 엔지니어링 팀의 지원 없이 데이터사이언스 팀
스스로 새로운 디지털광고제품을 만들어냄
• 고객사의 데이터는 고객사 소유로, 고객사의
프라이빗 클라우드에 존재하여 마음대로 활용 가능
Benefits by Treasure Data
Dentsu – Benefits by Treasure Data
Treasure DMP 를 활용한 디지털 마케팅
채널 전송데이터 수집
1ST Party (고객 데이터)
TREASURE DMP
원천빅데이터 저장 , Data (ID) 통합
세그멘테이션 / 대시보드
데이터웨어하우스, 머신러닝 (추천 엔진 등)
데이터 연결/통합
2nd, 3rd Party DMP
광고 활동
마케팅 활동
CRM 활동
광고 로그 데이터
웹로그 데이터
모바일앱 데이터
소셜 데이터
POS 데이터
CRM 데이터
마케팅 자동화 데이터
매장 방문 데이터
고객 속성 데이터
생애 주기추정 연간 소득
날씨연계 데이터
관심사회사간 연결 데이터
POS 데이터 위치 데이터
Ad Network
DSP
이메일
LINE
Push Notification
Facebook / Twitter
콜센터
Divided out PC / SP site
TREASURE COLLECTOR
실시간으로 다양한 빅데이터를
간편하게 수집
TREASURE RESULT
다양한 프로그램과
쉽게 연동
TREASURE EXCHANGE
기업이 보유하고 있지 않은
이용자 ID의 연동
3rd Party Cookie 연계 포함
56
흩어져 있는 파일 형태의 광고 데이터 통합, 분석, 시각화
• 매번 정형 보고서를 만드는 데에
단조로운 작업이 많이 필요
• 보고 싶은 보고서를 보는 데에 많은
화면 전환이 필요
• 복수의 데이터 테이블을 다운로드하고
엑셀로 재집계하는 작업이 필요
• Web UI 에서 조작하기에는 불편한
점들이 있음
• 정형 보고서를 자동화할 수 있게 됨
• 보고 싶은 레포트를 Tableau 에서
손쉽게 볼 수 있게 됨
• 빅데이터의 고속 집계 및 애드혹
분석이 가능하게 됨
• 원천 데이터를 보존하고 있기 때문에,
모든 분석 요소 축과 조건을 활용한
시각화가 가능해짐
• 매일 CSV로 만들어지는 Sizmek 전체
원천 데이터를 트레저데이터로 자동
수집 저장
• 1차로 정제한 후에 Tableau 서버에
자동으로 전송
• Tableau Server 에서 기본 레포팅을
하고, Tableau Desktop 에서 Adhoc
분석을 실행
Sizmek Raw Data
(Standard, Rich, Conversion)
Sizmek Match Type Data
(Campaign, Site, Keywords, etc)
FTP 서버 자동 수집
레포트 자동 갱신
Adhoc 분석
(커스텀 레포트, 탐색 분석)
・기본 레포트
・어트리뷰션 레포트
・키워드 레포트 등
리인게이지먼트 광고 실행
Web 로그
iOS/Android 앱
고객DB, 과금DB 등
광고효과 측정 툴
타 겟 팅 전 송
S S P / 애 드 네 트 워 크
프라이빗 DMP
데 이 터 소 스
기타 SSP
/ ADX
 TD에서 작성한 세그먼트를 바탕으로
Nex8와 연계하여 광고를 전송한다.
 전송 결과도 IDFA단위로 TD상에서 축적.
 그 결과를 바탕으로 재분석하고 효과를 높인다.
실시 내용
 가망고객은 다 신규고객으로 만들어 놓은
상황이라 휴면 유저 발굴을 하고 싶다 (리텐션)
 PDCA사이클을 자동화 하고 싶다
 IDFA를 안전하게 연계시키고 싶다
과제  모바일 앱 서비스 사업 회사적합 고객
 IDFA를 기반으로 한 광고 전송
 휴면유저 발굴
 리셋 노가다 유저에 대한 광고 전송 제외
 PDCA고속 사이클에 의한 전송 최적화
기대 효과
축적하고있는 세그먼트 데이터를 NEX8와 연계하여 타겟팅 전송
고도화된 타겟팅 이메일 자동화
 트레저데이터가 리스트를 작성 하고
이메일 전송 툴과 연계
 이메일 개봉 로그에서 전송 리스트를
자동 업데이트
실시 내용
 고객 여정의 단계와 속성에 맞게
최적화 된 메시지를 전송하고 싶다
과제  회원 서비스 제공 기업적합 고객
 고객여정의 단계, 고객 속성에 맞는
최적의 이메일 전송
 자동 처리에 의한 PDCA 고속화
기대 효과
고수준의 전송 리스트를 이용한 이메일 마케팅의 실현
주의 관심 검색 구매
리인게이지먼트리타겟팅
전송 리스트 생성 / 툴 연계 최적의 리스트 / 콘텐츠로 이메일 전송 개봉 로그 수집
유저 A
유저 B
유저 C
유저 D
LINE 메신저 플랫폼과 데이터를 활용한 광고
프라이빗 DMP데 이 터 소 스
 LINE비즈니스 커넥트에서 취득 할 수 있는
유저 정보와 자사 보유 데이터를 연결시켜
콘텐츠나 광고를 전송
 그 결과를 바탕으로 재분석하고 효과를 높인다
실시 내용
 쌍방향 커뮤니케이션이나 1to1 마케팅 등
고객과의 관계를 강화 시키고 싶다
 LINE을 사용한 새로운 액션을 실행하고 싶다
과제  B2C 기업적합 고객
 유저의 로열티 상승
 정확도가 높은 광고 전송
기대 효과
고객 정보와 연결시켜 유저마다 다른 콘텐츠를 LINE으로 전송
Web 사이트 (Cookie)
모바일 앱 (IDFA/ADID)
메시지 서비스
관리 솔루션
세그먼트 별 메시지 전송
설문조사
문의 자동 응답
오운드 미디어 연계 / 유도
• mid
• 액션 데이터
• 설문조사 데이터 etc
(API경유로 취득)
LINE에서의 액션
Mid와 고객ID를 연결
세그먼트 별 동영상 전송
고객 DB (MID/Email&PW)
데이터로 돈을 벌고자 할 때
반드시 체크해야 하는 것
트레저데이터가 주도하는 데이터 기반 혁신의 핵심 명제
• 분석을 위한 데이터가 아닌 실행을 위한 데이터. Data Action
• 데이터 기반의 프로세스 자동화  Data Workflow Management
• 이종의 원천 데이터 결합을 통한 혁신 : Linked Data Based Innovation
• 데이터 기반의 커뮤니케이션과 문화
• Time based, streaming, log, … : 인생은 타이밍, 데이터도 타이밍
• Data Product !!
• Data Scientist vs. Data Engineer ?!
• Solution? Should be EASY !!
고영혁
트레저데이터 데이터사이언티스트/아키텍트
dylan@treasure-data.com
‘트레저데이터’에 대해
더 알고 싶으시면 클릭~!!

Más contenido relacionado

La actualidad más candente

데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.Yongho Ha
 
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축Sungmin Kim
 
Python을 활용한 챗봇 서비스 개발 1일차
Python을 활용한 챗봇 서비스 개발 1일차Python을 활용한 챗봇 서비스 개발 1일차
Python을 활용한 챗봇 서비스 개발 1일차Taekyung Han
 
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유Hyojun Jeon
 
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...Amazon Web Services Korea
 
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析Amazon Web Services Japan
 
Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차Taekyung Han
 
Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링
Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링
Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링Amazon Web Services Korea
 
화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자Yongho Ha
 
Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나Amazon Web Services Korea
 
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)Yongho Ha
 
고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...
고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...
고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...Amazon Web Services Korea
 
Kinesis Firehoseを使ってみた
Kinesis Firehoseを使ってみたKinesis Firehoseを使ってみた
Kinesis Firehoseを使ってみたMasaki Misawa
 
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)Jaikwang Lee
 
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...Amazon Web Services Korea
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립승화 양
 
로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법Jeongsang Baek
 
커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...
커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...
커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...Amazon Web Services Korea
 

La actualidad más candente (20)

데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.
 
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
 
Python을 활용한 챗봇 서비스 개발 1일차
Python을 활용한 챗봇 서비스 개발 1일차Python을 활용한 챗봇 서비스 개발 1일차
Python을 활용한 챗봇 서비스 개발 1일차
 
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
 
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
 
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
 
Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차
 
Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링
Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링
Amazon OpenSearch Deep dive - 내부구조, 성능최적화 그리고 스케일링
 
화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자
 
Log design
Log designLog design
Log design
 
Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon SageMaker 모델 배포 방법 소개::김대근, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
 
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
 
고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...
고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...
고객의 플랫폼/서비스를 개선한 국내 사례 살펴보기 – 장준성 AWS 솔루션즈 아키텍트, 강산아 NDREAM 팀장, 송영호 야놀자 매니저, ...
 
Kinesis Firehoseを使ってみた
Kinesis Firehoseを使ってみたKinesis Firehoseを使ってみた
Kinesis Firehoseを使ってみた
 
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
 
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립
 
Amazon Redshift 概要 (20分版)
Amazon Redshift 概要 (20分版)Amazon Redshift 概要 (20分版)
Amazon Redshift 概要 (20分版)
 
로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법
 
커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...
커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...
커머스 스타트업의 효율적인 데이터 분석 플랫폼 구축기 - 하지양 데이터 엔지니어, 발란 / 강웅석 데이터 엔지니어, 크로키닷컴 :: AWS...
 

Destacado

비즈니스 데이터 분석의 현재와 미래
비즈니스 데이터 분석의 현재와 미래비즈니스 데이터 분석의 현재와 미래
비즈니스 데이터 분석의 현재와 미래HT Kim
 
빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델datasciencekorea
 
What is support_engineer_in_treasuredata
What is support_engineer_in_treasuredataWhat is support_engineer_in_treasuredata
What is support_engineer_in_treasuredataTreasure Data, Inc.
 
Fluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker containerFluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker containerTreasure Data, Inc.
 
Building a system for machine and event-oriented data with Rocana
Building a system for machine and event-oriented data with RocanaBuilding a system for machine and event-oriented data with Rocana
Building a system for machine and event-oriented data with RocanaTreasure Data, Inc.
 
Introduction to New features and Use cases of Hivemall
Introduction to New features and Use cases of HivemallIntroduction to New features and Use cases of Hivemall
Introduction to New features and Use cases of HivemallTreasure Data, Inc.
 
Packaging Ecosystems -Monki Gras 2017
Packaging Ecosystems -Monki Gras 2017Packaging Ecosystems -Monki Gras 2017
Packaging Ecosystems -Monki Gras 2017Treasure Data, Inc.
 
Augmenting Mongo DB with treasure data
Augmenting Mongo DB with treasure dataAugmenting Mongo DB with treasure data
Augmenting Mongo DB with treasure dataTreasure Data, Inc.
 
Augmenting Mongo DB with Treasure Data
Augmenting Mongo DB with Treasure DataAugmenting Mongo DB with Treasure Data
Augmenting Mongo DB with Treasure DataTreasure Data, Inc.
 
Unifying Events and Logs into the Cloud
Unifying Events and Logs into the CloudUnifying Events and Logs into the Cloud
Unifying Events and Logs into the CloudTreasure Data, Inc.
 
Insight Data Engineering: Open source data ingestion
Insight Data Engineering: Open source data ingestionInsight Data Engineering: Open source data ingestion
Insight Data Engineering: Open source data ingestionTreasure Data, Inc.
 
Fluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker containerFluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker containerTreasure Data, Inc.
 

Destacado (15)

비즈니스 데이터 분석의 현재와 미래
비즈니스 데이터 분석의 현재와 미래비즈니스 데이터 분석의 현재와 미래
비즈니스 데이터 분석의 현재와 미래
 
빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델
 
What is support_engineer_in_treasuredata
What is support_engineer_in_treasuredataWhat is support_engineer_in_treasuredata
What is support_engineer_in_treasuredata
 
Fluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker containerFluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker container
 
Building a system for machine and event-oriented data with Rocana
Building a system for machine and event-oriented data with RocanaBuilding a system for machine and event-oriented data with Rocana
Building a system for machine and event-oriented data with Rocana
 
Fluentd - Unified logging layer
Fluentd -  Unified logging layerFluentd -  Unified logging layer
Fluentd - Unified logging layer
 
Introduction to New features and Use cases of Hivemall
Introduction to New features and Use cases of HivemallIntroduction to New features and Use cases of Hivemall
Introduction to New features and Use cases of Hivemall
 
Packaging Ecosystems -Monki Gras 2017
Packaging Ecosystems -Monki Gras 2017Packaging Ecosystems -Monki Gras 2017
Packaging Ecosystems -Monki Gras 2017
 
Augmenting Mongo DB with treasure data
Augmenting Mongo DB with treasure dataAugmenting Mongo DB with treasure data
Augmenting Mongo DB with treasure data
 
Augmenting Mongo DB with Treasure Data
Augmenting Mongo DB with Treasure DataAugmenting Mongo DB with Treasure Data
Augmenting Mongo DB with Treasure Data
 
Unifying Events and Logs into the Cloud
Unifying Events and Logs into the CloudUnifying Events and Logs into the Cloud
Unifying Events and Logs into the Cloud
 
Insight Data Engineering: Open source data ingestion
Insight Data Engineering: Open source data ingestionInsight Data Engineering: Open source data ingestion
Insight Data Engineering: Open source data ingestion
 
Open source data ingestion
Open source data ingestionOpen source data ingestion
Open source data ingestion
 
Fluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker containerFluentd and Docker - running fluentd within a docker container
Fluentd and Docker - running fluentd within a docker container
 
Keynote - Fluentd meetup v14
Keynote - Fluentd meetup v14Keynote - Fluentd meetup v14
Keynote - Fluentd meetup v14
 

Similar a 글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)

How to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesHow to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesDataya Nolja
 
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)Amazon Web Services Korea
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례Amazon Web Services Korea
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기Amazon Web Services Korea
 
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요Hosung Lee
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드kosena
 
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)Metatron
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)동학 노
 
IBM Cloud 사례집
IBM Cloud 사례집IBM Cloud 사례집
IBM Cloud 사례집ibmrep
 
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)Yan So
 
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료Sejeong Kim 김세정
 
유앤아워스_회사소개서
유앤아워스_회사소개서유앤아워스_회사소개서
유앤아워스_회사소개서ThomasYoon6
 
태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개HT Kim
 
1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개
1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개
1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개Steve Kim
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studiesDLAB
 
Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료환태 김
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117Han Woo PARK
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Wooseung Kim
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdfYunjeong Susan Hong
 
[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovation
[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovation[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovation
[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovationi2max
 

Similar a 글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data) (20)

How to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesHow to Make Money from Data - Global Cases
How to Make Money from Data - Global Cases
 
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
 
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)
 
IBM Cloud 사례집
IBM Cloud 사례집IBM Cloud 사례집
IBM Cloud 사례집
 
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
 
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
 
유앤아워스_회사소개서
유앤아워스_회사소개서유앤아워스_회사소개서
유앤아워스_회사소개서
 
태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개
 
1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개
1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개
1. 기업성장을 이끄는 microsoft dynamics 비전 및 국내구축사례 소개
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studies
 
Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
 
[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovation
[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovation[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovation
[아이투맥스] 2015.07_세일즈포스 crm 이노베이션 세미나 최신자료 salesforce crm innovation
 

Más de Treasure Data, Inc.

GDPR: A Practical Guide for Marketers
GDPR: A Practical Guide for MarketersGDPR: A Practical Guide for Marketers
GDPR: A Practical Guide for MarketersTreasure Data, Inc.
 
AR and VR by the Numbers: A Data First Approach to the Technology and Market
AR and VR by the Numbers: A Data First Approach to the Technology and MarketAR and VR by the Numbers: A Data First Approach to the Technology and Market
AR and VR by the Numbers: A Data First Approach to the Technology and MarketTreasure Data, Inc.
 
Introduction to Customer Data Platforms
Introduction to Customer Data PlatformsIntroduction to Customer Data Platforms
Introduction to Customer Data PlatformsTreasure Data, Inc.
 
Hands-On: Managing Slowly Changing Dimensions Using TD Workflow
Hands-On: Managing Slowly Changing Dimensions Using TD WorkflowHands-On: Managing Slowly Changing Dimensions Using TD Workflow
Hands-On: Managing Slowly Changing Dimensions Using TD WorkflowTreasure Data, Inc.
 
Brand Analytics Management: Measuring CLV Across Platforms, Devices and Apps
Brand Analytics Management: Measuring CLV Across Platforms, Devices and AppsBrand Analytics Management: Measuring CLV Across Platforms, Devices and Apps
Brand Analytics Management: Measuring CLV Across Platforms, Devices and AppsTreasure Data, Inc.
 
How to Power Your Customer Experience with Data
How to Power Your Customer Experience with DataHow to Power Your Customer Experience with Data
How to Power Your Customer Experience with DataTreasure Data, Inc.
 
Why Your VR Game is Virtually Useless Without Data
Why Your VR Game is Virtually Useless Without DataWhy Your VR Game is Virtually Useless Without Data
Why Your VR Game is Virtually Useless Without DataTreasure Data, Inc.
 
Connecting the Customer Data Dots
Connecting the Customer Data DotsConnecting the Customer Data Dots
Connecting the Customer Data DotsTreasure Data, Inc.
 
Harnessing Data for Better Customer Experience and Company Success
Harnessing Data for Better Customer Experience and Company SuccessHarnessing Data for Better Customer Experience and Company Success
Harnessing Data for Better Customer Experience and Company SuccessTreasure Data, Inc.
 
Scaling to Infinity - Open Source meets Big Data
Scaling to Infinity - Open Source meets Big DataScaling to Infinity - Open Source meets Big Data
Scaling to Infinity - Open Source meets Big DataTreasure Data, Inc.
 
Treasure Data: Move your data from MySQL to Redshift with (not much more tha...
Treasure Data:  Move your data from MySQL to Redshift with (not much more tha...Treasure Data:  Move your data from MySQL to Redshift with (not much more tha...
Treasure Data: Move your data from MySQL to Redshift with (not much more tha...Treasure Data, Inc.
 
Treasure Data From MySQL to Redshift
Treasure Data  From MySQL to RedshiftTreasure Data  From MySQL to Redshift
Treasure Data From MySQL to RedshiftTreasure Data, Inc.
 
Partner webinar presentation aws pebble_treasure_data
Partner webinar presentation aws pebble_treasure_dataPartner webinar presentation aws pebble_treasure_data
Partner webinar presentation aws pebble_treasure_dataTreasure Data, Inc.
 

Más de Treasure Data, Inc. (17)

GDPR: A Practical Guide for Marketers
GDPR: A Practical Guide for MarketersGDPR: A Practical Guide for Marketers
GDPR: A Practical Guide for Marketers
 
AR and VR by the Numbers: A Data First Approach to the Technology and Market
AR and VR by the Numbers: A Data First Approach to the Technology and MarketAR and VR by the Numbers: A Data First Approach to the Technology and Market
AR and VR by the Numbers: A Data First Approach to the Technology and Market
 
Introduction to Customer Data Platforms
Introduction to Customer Data PlatformsIntroduction to Customer Data Platforms
Introduction to Customer Data Platforms
 
Hands On: Javascript SDK
Hands On: Javascript SDKHands On: Javascript SDK
Hands On: Javascript SDK
 
Hands-On: Managing Slowly Changing Dimensions Using TD Workflow
Hands-On: Managing Slowly Changing Dimensions Using TD WorkflowHands-On: Managing Slowly Changing Dimensions Using TD Workflow
Hands-On: Managing Slowly Changing Dimensions Using TD Workflow
 
Brand Analytics Management: Measuring CLV Across Platforms, Devices and Apps
Brand Analytics Management: Measuring CLV Across Platforms, Devices and AppsBrand Analytics Management: Measuring CLV Across Platforms, Devices and Apps
Brand Analytics Management: Measuring CLV Across Platforms, Devices and Apps
 
How to Power Your Customer Experience with Data
How to Power Your Customer Experience with DataHow to Power Your Customer Experience with Data
How to Power Your Customer Experience with Data
 
Why Your VR Game is Virtually Useless Without Data
Why Your VR Game is Virtually Useless Without DataWhy Your VR Game is Virtually Useless Without Data
Why Your VR Game is Virtually Useless Without Data
 
Connecting the Customer Data Dots
Connecting the Customer Data DotsConnecting the Customer Data Dots
Connecting the Customer Data Dots
 
Harnessing Data for Better Customer Experience and Company Success
Harnessing Data for Better Customer Experience and Company SuccessHarnessing Data for Better Customer Experience and Company Success
Harnessing Data for Better Customer Experience and Company Success
 
Scalable Hadoop in the cloud
Scalable Hadoop in the cloudScalable Hadoop in the cloud
Scalable Hadoop in the cloud
 
Using Embulk at Treasure Data
Using Embulk at Treasure DataUsing Embulk at Treasure Data
Using Embulk at Treasure Data
 
Scaling to Infinity - Open Source meets Big Data
Scaling to Infinity - Open Source meets Big DataScaling to Infinity - Open Source meets Big Data
Scaling to Infinity - Open Source meets Big Data
 
Treasure Data: Move your data from MySQL to Redshift with (not much more tha...
Treasure Data:  Move your data from MySQL to Redshift with (not much more tha...Treasure Data:  Move your data from MySQL to Redshift with (not much more tha...
Treasure Data: Move your data from MySQL to Redshift with (not much more tha...
 
Treasure Data From MySQL to Redshift
Treasure Data  From MySQL to RedshiftTreasure Data  From MySQL to Redshift
Treasure Data From MySQL to Redshift
 
Partner webinar presentation aws pebble_treasure_data
Partner webinar presentation aws pebble_treasure_dataPartner webinar presentation aws pebble_treasure_data
Partner webinar presentation aws pebble_treasure_data
 
Introduction to Hivemall
Introduction to HivemallIntroduction to Hivemall
Introduction to Hivemall
 

글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)

  • 1. 글로벌 사례로 보는 데이터로 돈 버는 법 고영혁 트레저데이터 데이터사이언티스트/아키텍트 dylan@treasure-data.com
  • 2. 발표자인 데이터 사이언티스트 고영혁은 ? 0 1 2 3 4 5 수학 통계학 분야전문성 커뮤니케이션 시각화 프로그래밍 머신러닝 하둡생태계
  • 3.  게임 진행이 막히거나 더디는 구간은?  이용자의 게임 내 경제 활동 패턴은?  이용자의 게임 내 콘텐츠 소모 패턴은?  마케팅이 게임 활성화에 미치는 영향은?  유료화 모델의 적절한 방향은?  유료화 시 매출 예측 결과는? 답을 얻어내고 실행에 옮긴 질문 (2004 ~ 2006)
  • 4.  거래 데이터로부터 라이프 이벤트 추출 가능?  상품별 효과적인 라이프 이벤트는 무엇인가?  어떤 이동 경로에 노출하는 것이 효과적인가?  최종 구매에 도달시키기 위한 핵심 인자는?  마케팅 형태에 따른 구매 전환율은? 답을 얻어내고 실행에 옮긴 질문 (2008 ~ 2009)
  • 6. 트레저데이터 회사 개요 Treasure Data 는 서비스 형태로 데이터 분석 인프라를 제공하는 세계 선도 기업으로서, 데이터 파이프라인과 데이터 플랫폼 관리의 각종 복잡한 이슈를 해결하여, 조직이 데이터로부터 가치를 추출하는 데에만 온전히 집중할 수 있도록 합니다. • 설립연도: 2011년 12월 • 위치: Mountain View, CA (HQ), Tokyo, Seoul • 투자현황: $47M raised from top Silicon Valley VCs (Now Series C) • 개발하여 후원하는 글로벌 유명 오픈소스 프로젝트 목록 Treasure Data Investors Treasure Data’s Data Collection Technology Users Jerry Yang Yahoo! Founder James Lindenbaum Heroku Founder Bill Tai ex-CRV, leading angel investor • Very popular data collector • Data serializer • Enterprise data bulk loader • Data collector from IoT/Embedded devices
  • 7. The Growth of Treasure Data 60,000,000,000,000+Rows (October 2016)
  • 8. 트레저데이터 창업자 소개 Hiro Yoshikawa CEO Kazuki Ota CTO Sada Furuhashi Chief Software Architect • 와세다 대학 재학 중에 Red Hat, Inc.에서 근무. 엔지니어로 경력을 시작하고 교육사업,제품 마케팅, 사업개발을 담당. 2009년에 미쓰이물산의 벤처 캐피탈 사업인 "미쓰이 벤처스"의 멤버로 미국으로 감. • 오픈소스 소프트웨어 기업에 대한 투자와 경영에 종사한 경험을 살려 2011년에 미국 트레저데이터사를 창업하여 최고 경영자(CEO)로 취임, 현재에 이르고 있다. • Red Hat에서의 오픈소스 소프트웨어 사업 경험과 미국에서의 사업 경험을 살려, 트레저데이터의 경영 전반 책임자로 활약중. • 고등학교 시절부터 Linux의 데스크탑 환경 KDE 커미터로 OSS 커뮤니티에 공헌함. • 2006년, 도쿄대학 이학부 정보과학과 재학중에 주식회사 Preferred Infrastructure의 최고기술책임자(CTO)로 취임. 여기에서 Hadoop을 만나 2009년에 "Hadoop 사용자 모임 재팬"을 설립. 현재 등록자수는 1,700명을 넘어 세계 최대규모의 Hadoop 커뮤니티가 되어있다. • 2011년에 퇴직 후, 미국에서 트레저데이터사를 창업하고 최고기술책임자(CTO)로 취임, 현재에 이르고 있다. • 2012년 쓰쿠바대학 대학원을 졸업. 학창시절인 2010년에 일본OSS추진포럼에서 “일본OSS장려상”을 수상. • 또, 다국어 통신이 가능한 분산 인프라기술 “MessagePack(메시지 팩)”을 개발. 2008년에 오픈소스 소프트웨어로 공개하여 현재는 전 세계적으로 이용되고 있다. • 2011년에는 미국 트레저데이터사를 요시카와,오타와 함께 창업. Hadoop기반의 클라우드 데이터 분석 플랫폼의 구축 및 구현을 담당하고있다. 2011년부터 로그 컬렉터 “Fluentd”의 개발을 시작. • 현재는 Web서비스나 광고, CDN등을 비롯한 수많은 산업 분야에서 전 세계적으로 도입되어 2014년에는 Google Cloud Platform의 로그 컬렉터로 표준적으로 채용됨. 2015년 “Embulk”의 개발을 시작.
  • 10. 데이터가 돈이 되기 위한 기본문제와 트레저데이터의 해결 접근법 Collect Store Analyze Essential Infra for “Data Driven Action” Action Treasure Data • Cloud Data Storage and Interface • Fully Managed SaaS • Holistic Live Data Management Platform • Enable to Make Data Automation (Data Product) Easily and cost efficiently
  • 11. 데이터가 돈이 되기 위한 기본문제와 트레저데이터의 해결 접근법
  • 12. 3 관리하기 어려운 분석계 4 활용 안되는 KPIs 2 복잡한 시스템 통합 1 흩어져 있는 데이터 저장소들 Before TD
  • 13. After TD 3 쉬운 솔루션 연계 2 관리 부담 제로 1 쉬운 데이터 수집 50+ Data Outputs Multi-Tenant Cloud Service 300+ Data Sources
  • 14. Traditional ETL/BI Process 데이터 유입 FRAGILE 하나의 변경으로 전체 시스템 고장 가능성 FRAGMENTED 분산된 데이터 마트 LIMITED 접근성, 질의, 유연성 ETL Team EDW Team BI Team End User & System 새로운 질의(BI)? ETL에서 부터 다시 시작! Data Consumer App
  • 15. A Completely Different Data Approach 데이터 유입 MANAGED 클라우드 서비스 모티터링 & 지원 24/7/365 AGILE 실시간 필요한 데이터 선택 사용 IMMEDIATE 비지니스 속도와 같이 필요한 데이터 준비 Data Team End User & System BI Tool Data Consumer App Data Mart Dash Board 모든데이터 저장, 필요한 데이터 선택 사용. SCHEMALESS 단일 클라우드 플레폼에 모든 데이터 JSON 으로 저장
  • 16. A Completely Different Data Approach 계획, 분석 그리고 행위! 초기 설정 분석 기다 림 분석 기다 림 스키마 업데이트 클러스터 크기 조정 초기 설정 개발에 집중! 데이터 분석가 엔지니어 데이터 분석가 엔지니어 MPP 데이터베이스 트레져 데이터는 스키마 적용이 자유로운(Schema Less) 클라우드 서비스 내 데이터 어디에? 항상 바쁨! 내 데이터 어디에? 변경 금지!! Before Treasure Data After Treasure Data
  • 18. Technical Architecture 멀티 클라우드 배포 AWS CloudStack OpenStack Secure Connection Gateway 수집 분석 Streaming Collector(Fluentd) CLI Bulk Loader JavaScript / Mobile .. SDKs IoT Presto (MPP) Hadoop (MapReduce) HivePig REST API JDBC ODBC 3rd Party BI Dashboard Adv. analytics tools Path analytics Web analytics A/B testing Use case support Gaming Ad-tech IOT Result Push OAuth Server-Side Bulk Loader Real-time Access Multi-Tenant Query Template 저장 Plazma Schema-less Distributed Columnar Storage New Query Editor 관리 & 운영 Security Provisioning Monitoring Support
  • 19. 데이터 생태계의 혁신을 만들어낸 트레저데이터의 핵심 기술 역량 Storage Data ProcessingData Import 트레저데이터가 개발한 프로그래밍 필요 없이 머신러닝을 실행할 수 있는 SQL 쿼리 형태의 라이브러리. 일본 주요 애드테크 기업들에서 CTR 예측 등에 활용 대규모 데이터 병렬 분산처리 기반 오타 CTO 가 세계 최대규모의 Hadoop 일본 유저 그룹을 설립 Facebook 이 개발한 병렬 분산처리 기반 오픈 소스 소프트웨어 프로젝트로서, Facebook, Teradata 와 함께 트레저데이터도 개발에 참여 공동창업자 후루하시가 개발한 바이너리 기반 의 고속 변환이 가능한 데이터 압축 포맷 Pinterest, Uber 등에서도 데이터 저장용 포맷 으로 사용하고 있음 공동창업자 후루하시가 만든 벌크 형 식의 로그 수집 도구 오픈소스 소프트웨어로 공개한 지 1 년 반만에 100개 이상의 플러그인이 개발되었으며, WEB 서비스 기업을 중 심으로 사용되고 있음 트레저데이터가 개발한 IoT・임베디 드 기반을 위한 스트리밍 형식의 로 그 수집 도구 C언어로 개발되고 있어서 가볍고, 의 존성에 구애 받지 않고 이용 가능 Plazma 트레저데이터가 독자 개발한 타임스탬프를 인 덱스로 하는 스키마리스 컬럼기반 데이터베이 스. 시계열 로그 빅데이터 처리에 특히 강함 공동창업자 후루하시가 만든 스트리 밍 형식의 로그 수집 도구 Google, Microsoft, AWS 와 같은 글 로벌 기업들에서 로그 수집 도구로 사 용되고 있음
  • 20. 솔루션 비교 운영해야 할 인프라 투입할 직원 리소스 확장성 & 민첩성 지원 활용까지 소요 기간 총비용 하드웨어, 소프트웨어 구축 / 유지 제한됨 / 비쌈 자체 팀 필요 10-12 개월 $$$$$ 시간당 인스턴스 설정 / 모니터링 제한됨 / 비쌈 별도 비용 지불 4-6 개월 $$$ 없음 최초 설정 한 번 기본 포함 2-4 주 $ 최저 비용 무한 자유도 (플렉서블 스키마 기반) On-Premise In-Cloud Managed Service
  • 21. 다양한 분야의 글로벌 초우량 고객사 AD Tech IoT 三菱重工 Retail Finance Technology Agency / Trading Desk DMP / DSP Ad-Network TelecommunicationMaker EC Media Game/SNS Digital Marketing
  • 22. 트레저데이터의 기술 (Fluentd, MessagePack, Embulk)을 사용하는 대표 기업
  • 23. 데이터로 돈 버는 글로벌 사례 #1 MUJI : 전통적 리테일에서 데이터 기반 O2O
  • 24. MUJI (무인양품) 기본 소개 • 1980년 회사 설립 • 연매출 22억 USD • 연수익 2억 USD • 매장 현황 – 일본 401개 / 해외 301개 • MUJI = NO brand name or designer name • 트레저데이터 활용 - 2013년부터 ※ 2015년 2월 기준 자료
  • 26. MUJI (무인양품) 기본 소개 MUJI Japan MUJI Times Square
  • 27. MUJI – Needs & Challenge (Pain Points) • 매출의 성장 • 전세계에 걸쳐 있는 다수 매장의 관리 • 고객 로열티의 관리 • 데이터를 활용하는 것이 근본적인 답이라는 것은 알고 있음  NEEDS • 방대한 웹/앱/매장 데이터의 통합 문제 • 기존 시스템을 최대한 건드리지 않고 패러다임 시프트 • 시간. 시간. 시간 • Scalability  CHALLENGE Treasure Data 로 해결
  • 28. 무인양품의 O2O 기반 리테일 혁신의 HUB – MUJI Passport  바코드 기반의 고객 ID 기능  MUJI 쇼핑 포인트(마일리지) 기능  혜택 쿠폰 발급  매장 체크인 기능  관련 뉴스  쇼핑 가이드 – 제품 검색, 매장 안내  선호도/관여도 정보 수집 (Like, Have)  MUJI 마일리지의 통합 및 보너스 마일리지를 활용한 ID/정보 통합 유도 – 소셜 ID, 온라인 사이트 ID, 카드 ID 앱 첫화면 관련 뉴스 ID 매장 체크인 제품 검색 매장 안내 Digital ID+Owned Media+Store & Product Search
  • 29. MUJI – Treasure data 활용 O2O Analytics Platform
  • 30. MUJI – Treasure data 활용 핵심 및 결과 • 고객의 온라인 행동과 오프라인 행동 패턴을 데이터를 통해 모두 파악 • 온라인에서의 행동과 매장의 재고 및 매출 현황을 토대로, 고객의 매장 방문 시점에서 해당 고객 및 매출에 최적화된 스펙의 쿠폰을 실시간으로 생성하여 사용 유도  활용 핵심  활용 결과 • 매출 46% 증가 • 전체 매장 평균 쿠폰 활용률 100% 증가 • 오프라인 매장 내 체류시간 및 동선량 증가
  • 31. MUJI – Next Step • 현재 TD를 통해 연 30억 트랜잭션 이상의 데이터를 저비용으로 기존 시스템 건드리지 않고 효율적으로 처리 • 이렇게 쌓인 데이터를 TD의 Machine-Learning-As-a-Service 인 HiveMall 을 이용해서 매장 내 위치 기반 실시간 프로모션 엔진 준비 • TD 인터페이스를 통한 다양한 연계로 프로모션/마케팅 자동화를 효율적 구축
  • 32. 데이터로 돈 버는 글로벌 사례 #2 WISH : 개인화&자동화를 통한 쇼핑 최적화
  • 33. WISH – 기본 소개 • 개인화 추천 기반 모바일 커머스 • 야후, 구글, 페이스북 엔지니어가 2011년 창업 • 창업 후 18개월만에 1500만 일활성화 이용자 • 전세계에서 두번째로 많이 다운로드된 쇼핑앱 • 현재 전세계 2억 일활성화 이용자 • 2015년 말 기업가치 $30억 (유니콘~데카콘) • 2012년부터 TD 고객. 추후 TD에 투자까지
  • 34. WISH – 기본 소개 • 개인화 추천 기반 모바일 커머스. 80~90% 까지 할인 상품 다수
  • 35. WISH – Needs & Challenge (Pain Points) • 핵심 고객 세그먼트인 개인화된 경험 원하는 여성에 대한 정확한 이해 • 비즈니스에 핵심이 되는 액션을 빨리 수행 • 전 직원간의 유기적인 데이터 기반 커뮤니케이션과 액션  NEEDS • 위시의 대부분은 여성을 잘 모르는 남성 엔지니어 (남탕) • 구글, 야후, 페이스북 등에서 온 데이터, 머신러닝 전문가들이지만 이커머스에 필요한 방대한 것들을 다 알지도 못하고, 절대적인 사람 숫자도 부족  CHALLENGE
  • 36. WISH – Treasure Data 활용 아키텍처
  • 37. WISH – Treasure Data 활용 A/B 테스트 시스템 100s of TD Queries Data Cache App Server App Server App Server {“user_id”:1337,“action”: “buy”} Custom Dashboard
  • 38. WISH – Treasure Data 활용 핵심 및 결과 • TD의 Fluentd 를 활용하여 2시간 만에 이용자 행동패턴 핵심 데이터 수집 기반 구축 • 모든 고객 상호작용 포인트마다 A/B 테스트를 실행하여 결과가 자동 분석되고 최적 대안도 자동으로 서비스에 적용되는 프레임워크 구축 • TD 웹콘솔과 Python API 를 이용하여 전직원 누구나가 필요한 데이터에 마음대로 접근해서 간단한 SQL 쿼리로 필요한 분석을 실시간으로 마음대로 수행하는 환경 제공 • 상품 판매자들에게도 개인화된 판매 분석 대시보드 제공하여 효과적인 상품 전략을 세울 수 있게 함  활용 핵심  활용 결과 • 일 34억 이벤트 데이터를 TD로 처리하여 서비스/비즈니스 밸류 발굴 • 개인별로 최적화된 쇼핑 경험을 제공  고객이 WISH를 사랑하게 됨! • 일 활성화 이용자 2억명 이상. 두번째로 많이 다운로드 된 쇼핑 앱 • 데이터 기반 자동화/효율화를 통한 멀티 버티컬 도입 및 성공
  • 39. 데이터로 돈 버는 글로벌 사례 #3 OISIX : 머신러닝으로 이탈고객 예측&방지
  • 40. Oisix – 회사 개요 • 2000년 창업. 자본금 약 84억원 • 식재료와 완제품 요리의 전자상거래/리테일 판매 비즈니스 • 가입회원 대상 지속적 판매를 하는 서브스크립션 커머스 중심
  • 41. Oisix – 회사 개요 • 전통적인 서브스크립션 커머스 대비 회원비 부담 없고, 개인화된 구매(식재료의 종류&수량, 배달 시간)가 가능
  • 42. Oisix – 머신러닝을 활용한 이탈자 예측과 대응  기계학습을 하고 지난 1달간의 데이터를 바탕으로 앞으로 1달간에 해지 할 가능성이 높은 고객 리스트를 Hivemall을 이용하여 작성 실시 내용  회원의 정기 구매가 회사 전체 매출과 이익을 좌우하는데, 해지 징후가 있는 회원을 미리 파악 및 방어하는 대책이 부족했다 과제  오이식스(Oisix)고객 사례  통계의 전문 지식 없이 머신러닝  해지 예측 리스트에 있는 회원에게 포인트를 부여함으로써 해지율 반감  해지 원인이 되는 액션, 이벤트를 찾아내고 비해지고객의 특징적인 행동도 파악 가능 기대 효과 Web Mobile 속성 정보 행동 로그 클레임 정보 유입 경로 이용 서비스 정보 직접적 액션 간접적 액션 포인트 부여 케어콜 성공체험에로 유도UI 변경 예측에 사용하는 데이터 Hivemall 에서 머신러닝 고객 정보나 행동 로그를 바탕으로 기계학습을 하고 해지고객을 예측 Table of Who / When / How % Churn
  • 43. Oisix – 머신러닝을 활용한 이탈자 예측과 대응 w/ Hivemall Classification with Mahout CREATE TABLE lr_model AS SELECT feature, -- reducers perform model averaging in parallel avg(weight) as weight FROM ( SELECT logress(features,label,..) as (feature,weight) FROM train ) t -- map-only task GROUP BY feature; -- shuffled to reducers This SQL query automatically runs in parallel on Hadoop • Machine Learning made easy for SQL developers (ML for the rest of us) • Interactive and Stable APIs w/ SQL abstraction
  • 44. 데이터로 돈 버는 글로벌 사례 #4 워너브로스 : 프로세스 자동화로 시간과 돈 절약
  • 45. WARNER BROS. ENTERTAINMENT • 게임 서비스 사업을 진행하기 위해서는 다양한 솔루션의 도움이 필요. 각 솔루션별로 제공하는 레포트와 기능들을 활용 • 사업이 고도화될수록 각 솔루션들이 기본으로 제공하는 것들에 만족하지 못하게 되고, 각각의 raw data 를 직접 연결해서 활용하여 고차원의 분석을 하고 싶은 욕구가 강해짐 • 정형화된 레포트를 추출해서 보는 것만이 아니라 각 부서별로 그 때 그 때 필요한 분석을 하기 위해서는 데이터 엔지니어의 도움을 필요로 하다보니 병목이 점점 발생 • iOS, Android 매출 데이터의 병합 및 정제가 매끄럽지 못한 상황이 종종 발생 Pain Points
  • 46. WARNER BROS. ENTERTAINMENT 650B records stored! • 활용하던 솔루션들의 raw data 를 트레저데이터로 자동으로 수집 통합하여 원하던 고차원 분석을 마음대로 할 수 있게 됨 • 데이터 엔지니어의 도움을 최소화하여 분석이 필요한 누구든지 인터랙티브 쿼리의 프레스토 기반으로 Adhoc 분석을 활용하게 됨 • 데이터 활용 프로세스에서의 병목이 대폭적으로 감소했을 뿐만 아니라, 허드렛 일을 하던 데이터 엔지니어 리소스의 비중을 줄이고 데이터 사이언티스트 비중을 훨씬 강화 • 트레저데이터가 만든 data workflow management engine 인 digdag.io 를 이용하여 매출 데이터 병합 및 정제와 이를 기반으로 한 매출 레포트 생성을 완전히 자동화 Benefits by Treasure Data • UDFs, Web-hooks, Scripts • Interactive queries via Presto • Significantly reduced latency Digdag.io
  • 48. 데이터로 돈 버는 글로벌 사례 #5 DENTSU 등의 애드테크(ADTECH) 회사들
  • 49. • 자체 개발한 온프레미스 DMP 솔루션은 새로운 고객마다 데이터 소스를 처리하는 커스터마이징을 하기 위해 수개월 이상이 걸림 • 데이터 엔지니어링 작업의 완료를 대기하느라 데이터 사이언스 팀의 업무 처리 속도가 저하됨 • DMP 솔루션에 대한 막대한 수요를 감당하지 못함 • 인프라스트럭쳐를 디자인하고 유지하는 것은 덴츠의 핵심 역량이 아님 • 데이터가 물리적으로 덴츠의 소유이다보니 데이터의 소유를 원하는 고객사 니즈 못맞춤 Pain Points Dentsu – Pain Points
  • 50. Dentsu – DMP Infra by Treasure Data and 3rd Parties http://www.dentsu.co.jp/news/release/2015/1006-004272.html
  • 51. • 별다른 추가 개발 없이 기존의 온프레미스 레거시 시스템에 바로 연동되는 유연한 클라우드 인프라를 통해 즉각적으로 문제가 해결됨 • 플러그인플러그 방식의 데이터 커넥터를 활용하여 새로운 데이터 소스를 설정하고 처리하는 데에 걸리던 시간을 수개월에서 몇일로 단축 • 엔지니어링 팀의 지원 없이 데이터사이언스 팀 스스로 새로운 디지털광고제품을 만들어냄 • 고객사의 데이터는 고객사 소유로, 고객사의 프라이빗 클라우드에 존재하여 마음대로 활용 가능 Benefits by Treasure Data Dentsu – Benefits by Treasure Data
  • 52. Treasure DMP 를 활용한 디지털 마케팅 채널 전송데이터 수집 1ST Party (고객 데이터) TREASURE DMP 원천빅데이터 저장 , Data (ID) 통합 세그멘테이션 / 대시보드 데이터웨어하우스, 머신러닝 (추천 엔진 등) 데이터 연결/통합 2nd, 3rd Party DMP 광고 활동 마케팅 활동 CRM 활동 광고 로그 데이터 웹로그 데이터 모바일앱 데이터 소셜 데이터 POS 데이터 CRM 데이터 마케팅 자동화 데이터 매장 방문 데이터 고객 속성 데이터 생애 주기추정 연간 소득 날씨연계 데이터 관심사회사간 연결 데이터 POS 데이터 위치 데이터 Ad Network DSP 이메일 LINE Push Notification Facebook / Twitter 콜센터 Divided out PC / SP site TREASURE COLLECTOR 실시간으로 다양한 빅데이터를 간편하게 수집 TREASURE RESULT 다양한 프로그램과 쉽게 연동 TREASURE EXCHANGE 기업이 보유하고 있지 않은 이용자 ID의 연동 3rd Party Cookie 연계 포함
  • 53. 56 흩어져 있는 파일 형태의 광고 데이터 통합, 분석, 시각화 • 매번 정형 보고서를 만드는 데에 단조로운 작업이 많이 필요 • 보고 싶은 보고서를 보는 데에 많은 화면 전환이 필요 • 복수의 데이터 테이블을 다운로드하고 엑셀로 재집계하는 작업이 필요 • Web UI 에서 조작하기에는 불편한 점들이 있음 • 정형 보고서를 자동화할 수 있게 됨 • 보고 싶은 레포트를 Tableau 에서 손쉽게 볼 수 있게 됨 • 빅데이터의 고속 집계 및 애드혹 분석이 가능하게 됨 • 원천 데이터를 보존하고 있기 때문에, 모든 분석 요소 축과 조건을 활용한 시각화가 가능해짐 • 매일 CSV로 만들어지는 Sizmek 전체 원천 데이터를 트레저데이터로 자동 수집 저장 • 1차로 정제한 후에 Tableau 서버에 자동으로 전송 • Tableau Server 에서 기본 레포팅을 하고, Tableau Desktop 에서 Adhoc 분석을 실행 Sizmek Raw Data (Standard, Rich, Conversion) Sizmek Match Type Data (Campaign, Site, Keywords, etc) FTP 서버 자동 수집 레포트 자동 갱신 Adhoc 분석 (커스텀 레포트, 탐색 분석) ・기본 레포트 ・어트리뷰션 레포트 ・키워드 레포트 등
  • 54. 리인게이지먼트 광고 실행 Web 로그 iOS/Android 앱 고객DB, 과금DB 등 광고효과 측정 툴 타 겟 팅 전 송 S S P / 애 드 네 트 워 크 프라이빗 DMP 데 이 터 소 스 기타 SSP / ADX  TD에서 작성한 세그먼트를 바탕으로 Nex8와 연계하여 광고를 전송한다.  전송 결과도 IDFA단위로 TD상에서 축적.  그 결과를 바탕으로 재분석하고 효과를 높인다. 실시 내용  가망고객은 다 신규고객으로 만들어 놓은 상황이라 휴면 유저 발굴을 하고 싶다 (리텐션)  PDCA사이클을 자동화 하고 싶다  IDFA를 안전하게 연계시키고 싶다 과제  모바일 앱 서비스 사업 회사적합 고객  IDFA를 기반으로 한 광고 전송  휴면유저 발굴  리셋 노가다 유저에 대한 광고 전송 제외  PDCA고속 사이클에 의한 전송 최적화 기대 효과 축적하고있는 세그먼트 데이터를 NEX8와 연계하여 타겟팅 전송
  • 55. 고도화된 타겟팅 이메일 자동화  트레저데이터가 리스트를 작성 하고 이메일 전송 툴과 연계  이메일 개봉 로그에서 전송 리스트를 자동 업데이트 실시 내용  고객 여정의 단계와 속성에 맞게 최적화 된 메시지를 전송하고 싶다 과제  회원 서비스 제공 기업적합 고객  고객여정의 단계, 고객 속성에 맞는 최적의 이메일 전송  자동 처리에 의한 PDCA 고속화 기대 효과 고수준의 전송 리스트를 이용한 이메일 마케팅의 실현 주의 관심 검색 구매 리인게이지먼트리타겟팅 전송 리스트 생성 / 툴 연계 최적의 리스트 / 콘텐츠로 이메일 전송 개봉 로그 수집 유저 A 유저 B 유저 C 유저 D
  • 56. LINE 메신저 플랫폼과 데이터를 활용한 광고 프라이빗 DMP데 이 터 소 스  LINE비즈니스 커넥트에서 취득 할 수 있는 유저 정보와 자사 보유 데이터를 연결시켜 콘텐츠나 광고를 전송  그 결과를 바탕으로 재분석하고 효과를 높인다 실시 내용  쌍방향 커뮤니케이션이나 1to1 마케팅 등 고객과의 관계를 강화 시키고 싶다  LINE을 사용한 새로운 액션을 실행하고 싶다 과제  B2C 기업적합 고객  유저의 로열티 상승  정확도가 높은 광고 전송 기대 효과 고객 정보와 연결시켜 유저마다 다른 콘텐츠를 LINE으로 전송 Web 사이트 (Cookie) 모바일 앱 (IDFA/ADID) 메시지 서비스 관리 솔루션 세그먼트 별 메시지 전송 설문조사 문의 자동 응답 오운드 미디어 연계 / 유도 • mid • 액션 데이터 • 설문조사 데이터 etc (API경유로 취득) LINE에서의 액션 Mid와 고객ID를 연결 세그먼트 별 동영상 전송 고객 DB (MID/Email&PW)
  • 57. 데이터로 돈을 벌고자 할 때 반드시 체크해야 하는 것
  • 58. 트레저데이터가 주도하는 데이터 기반 혁신의 핵심 명제 • 분석을 위한 데이터가 아닌 실행을 위한 데이터. Data Action • 데이터 기반의 프로세스 자동화  Data Workflow Management • 이종의 원천 데이터 결합을 통한 혁신 : Linked Data Based Innovation • 데이터 기반의 커뮤니케이션과 문화 • Time based, streaming, log, … : 인생은 타이밍, 데이터도 타이밍 • Data Product !! • Data Scientist vs. Data Engineer ?! • Solution? Should be EASY !!