2. Contents
1. Data Science Project
2. Data Science Platform
3. Case Study
4. Dataiku Data Science Studio
3. Contents
1. Data Science Project
2. Data Science Platform
3. Case Study
4. Dataiku Data Science Studio
4. Enterprise Data Science Project
Operational Analytics (insight) Analytics Products (software)
Retail
•OA : Need estimates of cost of delivery, timing, etc.
•AP : Create and sell customer cross-sell data (Customer 360)
Transportation Service
•OA : Where to suggest that drivers locate ?
•AP : Targeted list of drivers for maintenance coupons
Social Network Service
•OA : Who you may know ?
•AP : Who might buy Data Science software ?
vs
14. Analytics AI Leader Key Questions
1. Big Data / Data Science Project 의 생산성 향상을 이루는 방법?
2. 여러 종류의 Data Science Project 를 효율적으로 관리하기 위한 방법 ?
3. Business Analysts and Data Scientists / Engineers 간에 효과적인 커뮤니케이션을 가능하게 하는 방법?
4. Data Science Projcet 에서 개발한 Code 에 대한 재사용 하는 방법?
5. 개발한 모델을 Analytics Products 로 간편하게 Deploy 하는 방법? (no re-coding)
6. …
Data Science Platform
15. • Data Science Platform :
(Data Scientist) 다양한 환경에서의 Data Science Project 개발→
(Non Data Scientist) Data 에 대해 Codeless 분석 및 머신러닝 모델에 대한 간편하게 테스트 →
è 여러 사람이 진행한 Data Science Project 를 쉽게 이해하고, 적용할 수 있는
Data Science Platform
knime
Rapidminer
Dataiku(다타이쿠)
Informatica
tableau
Qlik
16. Contents
1. Data Science Project
2. Data Science Platform
3. Case Study
4. Dataiku Data Science Studio
17. Case Study (S사)
Data Science Team
Embedded Business Team Per Product
Embedded Business Team Per Product
Embedded Business Team Per Product
18. Case Study (S사)
Data Science Team
Embedded Business Team Per Product
Embedded Business Team Per Product
Embedded Business Team Per Product
19. Case Study (S사)
Data Science Team
Embedded Business Team Per Product
Embedded Business Team Per Product
Embedded Business Team Per Product
Dataiku
26. 30
Dataiku Data Science Studio
• 100여개의 내장 함수를 활용하여
클릭만으로 분석 수행
• 다양한 프로그래밍 언어(R,
Python, SQL) 지원
• 플러그인을 활용한 코드 재사용
CODE… OR CLICK
CONNECT TO YOUR (MANY) DATA SOURCES
• 원 클릭 데이터베이스 연결
• 오픈소스 데이터 플랫폼(SQL,
Hadoop, Spark, NoSQL…) 과의 연동
• 카탈로그를 활용한 데이터 검색
• 복잡한 데이터 흐름도 간결한 표현
• 다양한 처리 엔진의 지원
DEVELOP REUSABLE/MAINTAINABLE DATA FLOWS
UNDERSTAND YOUR DATA
• 데이터에 대한 직관적 분석
• 신속한 시각화를 통해 팀원과 공유
27. • 모델 평가
• 모델 별 학습, 속성, 순서 이력 제공
• 편리한 모델 업데이트
(데이터 추가, 변수 생성, 주요 지표의 변동폭(%) 확인)
FULL TRAINING MANAGEMENTAUTO-ML OR CODE BASED
• 클릭만으로 머신러닝 모델을 생성, 평가
• 제공되는 머신러닝(ML) 라이브러리를 사용자가
커스터마이징하여 활용
Dataiku Data Science Studio
28. DISCUSSIONS
• 프로젝트에 대한 팀원과 의견 교환
• 대화 참여 및 알림 기능
• 모든 대화에 대한 이력 관리
WIKI FOR TEAM DOCUMENTATION
• 프로젝트 관련 문서 작성
• 공유 자료의 체계적인 관리
• 정형화된 문서작업으로 타 프로젝트에도 적용
• 최근 접근한 항목 위주 표시
• Wiki와 대시보드의 즐겨찾기
• 신규 유저를 위한 가이드 제공
• 폴더를 활용한 프로젝트의
효율적 관리
USER HOME PAGE
Dataiku Data Science Studio
29. Dataiku Data Science Studio
LINUX SERVER
ON PREMISE OR MANAGED CLOUD
CENTRALIZED OR AD-HOC DATA
SOURCES,
DATABASES, DATA LAKE
AVAILABLE OR SPUN-UP
PROCESSING RESOURCES
PRODUCTION SYSTEMS
VISUAL DEVELOPMENT
COMPLETE CODING ENVIRONMENTS
VISUALIZATION
COLLABORATION AND
PROJECT MANAGEMENT
AUDIT, MONITORING AND SCHEDULING
36. DSS Key References & Stats
Manufacturing Financial Services
Services Consumer Goods
Technology Consulting
E-Retail Media
Healthcare Travel
Global Presence
A WIDE USER BASE
POWERED BY A STRONG ORGANIZATION
Dataikers
200
BACKED BY MAJOR PARTNERS
Customers
200+
Users
20,000+
of customers expand
usage after first year
80%
Raised so far
$45M
POWERING INDUSTRY LEADERS