1. 강사소개
베스핀글로벌 최민준 이사
최민준 이사는 KOSCOM, Teradata, SKC&C, Oracle, HPE 등 국내외 IT
Service 기업을 거치면서 데이터 분석 서비스 영역에서 Data Architecting
전문 서비스를 중심으로 IT 컨설팅 업무를 수행했습니다.
현재는 베스핀글로벌 DMS(Data Management Service) 본부의 빅데이터
팀을 이끌면서 CSP 중심의 Cloud Bigdata Service 전문 인력(Data
Solutions Architect)과 함께 고객사의 니즈에 최적화된 Cloud native
Analytical Platform 구축 및 운영 업무를 수행하고 있습니다.
2. 교육, 클라우드로 혁신하다.
2020.06.10
최민준 이사 | Bespin Global DMS(Data Management Service) Dept.
대교의 대용량 데이터 분석 환경 구축 사례로 보는 교육 기업의 빅데이터&클라우드
3. - 3 -
AGENDA
1. Edu-Tech 시장 동향
2. 성장 동인 – CBA
3. Case Study – 대교 Cloud BigData Adaption
4. - 4 -
1. Edu-Tech 시장 동향
2. 성장 동인 – CBA
3. Case Study – 대교 Cloud BigData Adaption
AGENDA
5. - 5 -
Global Edu-Tech Market
Global Edu-tech Market의 성장은 연 평균 12.28% 성장세에 있음
Global Education Market Global Edu-Tech Market
Source : Holon IQ, Smart Estimates, January 2019
6. - 6 -
Global Edu-Tech Landscape
K12(초,중,고) 대상으로 한 다양한 방식의 Edu-Tech 기업이 활동하고 있으며 특히 중국 Edu-tech Start-Up 강세
Snapshot of Edu-Tech Landscape
Top 5 Edu-Tech Unicorns Company
회사명 국가 분류 펀딩규모 설립
BY JU’s India K12 $ 1.4B 2011
VIP KID China Lang $ 1.1B 2013
ZuoYeBang China K12 약 $ 0.5B 2014
17 ZuoYe China K12 약 $ 0.5B 2011
Yuanfudoa China K12 약 $ 0.5B 2012
Source : CB Insights
7. - 7 -
Global Edu-Tech Company 동향
음석인식, 안면인식 등의 AI 서비스 적용하여 학생에게는 1:1 맞춤형 서비스를 제공하고, 교사에게는 학생의
성취도, 학습현황 등의 상세 정보 제공
Company Country 동향 특징(적용기술)
TAL 중국
▪ 중국 최대의 K12 과외교육 기관
▪ $ 26B 이상의 시가 총액
▪ 150만명으로 증가
▪ 30~40% 이상의 성장율
✓ 컴퓨터 비전, 음성인식, 데이터마이닝/분석,
자연어처리 등의 AI 서비스 적용 개방형
교육 기술 플랫폼 보유
VIP KID 중국
▪ 실시간 1:1 영어 몰입 학습
▪ 30,000명의 미국, 캐나다 영어교사와
20만명의 중국학생
▪ 95%의 학생 유지율
▪ $ 760M 수익
✓ 안면인식 AI기술 적용하여
화상수업몰입수준 측정 및 반영
✓ 학습자의 어휘, 문법, 악센트 분석 후 교사
제공
DreamBox
Learning
미국
▪ 2006년 창립
▪ 초등학교 ~ 중학교 수준의 수학교육을
게임방식으로 제공
▪ 미국내 실 사용자 1,500만명
✓ 학습이력을 BigData P/F기반 구축
✓ 개인 맞춤형 과정 제시 AI 솔루션 적용
✓ 교사에게 성취도, 학습량 등 정보 제공
8. - 8 -
국내 Edu-Tech Market
국내 역시 에듀테크 시장은 ‘17년 4조 규모에서 ‘20년 10조원 규모로 성장할 것으로 예상됨
Source : 산업통상자원부, 정보통신산업진흥원, 업계추정
“2017년 대비 2배 이상 성장하여 10조원대의 규모로 성장할 것이며,
대기업부터 많은 스타트업까지 에듀테크 시장에 도전하고 있다.”
9. - 9 -
국내 EDU-Tech Company 동향
국내 유수의 전통 Education기업들도 학습데이터 수집 및 AI 적용을 통한 Edu-Tech 서비스 제공을 통한 성장세를
이어가고 있음
대교 웅진씽크빅 천재교육
• 대교 대표적인 AI 서비스
• 전년대비 약 175% 성장
( 누적회원 17만명 돌파 )
• AI 학습서비스 매출 449억원( YoY 193% )
• 출시 2달만에 2만회원
• 연간 매출 환산 230억원
• ‘15년 밀크티 서비스 출시 후 상승세
( 전년대비 100% 이상 증가 )
• 2년간 학습 후 재등록 회원 76%
• 개인 맞춤형 학습 제공 및 스마트 알고리즘
적용을 위해 BigData 분석
• 문제에 대한 세분화를 통해 단계적 학습 유도
• AI학습의 정확도를 높이기 위해
500억건의 학습데이터를 BigData 기반 분석
• 실리콘밸리의 KidAdaptive 솔루션과
웅진씽크빅 자체 AI학습 알고리즘 적용
• 수준에 맞춘 문제 제시로 단순반복형 유사
문제 제시와 차별화를 통해 학습능률 향상
• 밀크티 서비스를 위해 천재교육 보유 자료
Digital DB화
• 방대한 정보(DB) 및 AI 엔진 접목하여 맞춤형
학습 제공
10. - 10 -
1. Edu-Tech 시장 동향
2. 성장 동인 – CBA
3. Case Study – 대교 Cloud BigData Adaption
AGENDA
11. - 11 -
Data is Money?
Data와 AI가 만나면 더욱 강력해집니다. 수 많은 데이터를 확보하고 AI를 활용할 수 있는 유일한 방법은
클라우드기반의 빅데이터플랫폼을 사용하는 것임
지능 정보
SW
AI
Cloud
Big-Data
Data = Money
Data + AI = More Power
Data + AI + BigData P/F on Cloud
➔ Most Power By Efficency
12. - 12 -
BigData(Data Analytics) 환경의 도전과제
기업에서 내외부의 시스템을 통해서 생산되는 데이터 중 0.5%미만의 데이터가 분석에 활용되고 있음
13. - 13 -
Data ➔ Money, DataOps 과정이 필요
DataOps는 분석을 위한 데이터를 전달하기 위한 방법론으로 Data Debt을 Data Asset으로 변환하는 모든 과정임
“DataOps는 기업의 수많은 데이터 소스로부터 다양한 데이터 사용자 또는 조직에게 빠르고/반복적/안정적으로
고품질의 데이터를 전달하기 위한 방법론(People, Process, Tools, Services)이다”
Data
Debt
Data
Asset
DataOps
Data Silo,
Fragmentationed Data
Consolidate Data
Easy to Analytics
Better, Faster, Cheaper
How to create robust, Automated
Data Pipeline
* “Getting DataOps Right-O’Reilly” - Tamr -
14. - 14 -
AI/ML 분석 플랫폼으로써의 클라우드기반 빅데이터 서비스
빅데이터와 클라우드의 만남으로 무한한 저장공간 활용과 빠른 인프라 자원을 확보 할 수 있으며, 낭비 되어지는
비용 또한 잡을 수 있어, 신규 프로젝트 수행 시 최소한의 리스크로 빠르게 시작 할 수 있습니다.
➔ Scalable, Elastic, Available, Reliable, Secure, Managed 한
Cloud 특징과 Big Data Technology Evolution 의 만남
[Cloud Computing]
• 비용
• 유연성
• 효율화
• Scalable
• Full Managed (Serverless)
• 필요한 만큼 만 Sizing
• 언제든지 즉시, Deploy
• 사용한 만큼 지불
• Managed, Server-less
• 유연한 Re-Architecture
Public Cloud 특징 Public Cloud 사용 목적
15. - 15 -
AWS Data Lake 전략
모든 데이터는 S3 기반으로 수집되고 보관되어 관련 모든 분석서비스의 원천 데이터로 활용될 수 있음
16. - 16 -
AWS 기반 빅데이터 플랫폼 Conceptual Architecture
AWS는 S3를 기반으로 데이터 레이크를 구축하여 정형데이터 분석 뿐만 아니라 AI/ML과 같은 고급분석에 필요한
데이터를 공급하고 보관하는 End-To-End 빅데이터 플랫폼 아키텍쳐를 제시하고 있음
17. - 17 -
Edu-Tech Enabler로써의 CBA( Cloud / BigData / AI ) 역할
대량의 데이터기반으로 지속적이고 신속한 의사결정을 위한 안정적이고 유연하게 확장 가능한 환경을 구현하기
위해서는 AI/ML, BigData 분석플랫폼 및 Cloud 환경 Adaption은 필수적임
DATA AI
EDGE
COMPUTING
IT/CT
CONVERGENCE
EduTech
CLOUD
Media
✓ 수많은 모바일 디바이스 및 WEB/APP Application에서 수집된 고객 행동
데이터(WEB/APP Log) 기반 분석 필요
✓ 실시간으로 분석한 결과를 기반으로 학습자에게 코칭 결과를 제공
✓ 분석결과를 기반으로 데이터 기반 경영에 활용
Why Cloud ?
C
✓ 사용한 서비스 만큼만 비용 지불
✓ 고객 증가, 서비스 확장에 대한 Flexible한 대응
✓ 99.9999999% 이상의 안정성 보장
✓ Public 서비스 기반 글로벌 확장 용이
Why BigData ?B
Why AI/ML ?A ✓ 데이터기반의 수요예측을 통한 시스템 경영 적용
✓ 학생의 학습 패턴 및 성향을 고려한 Coaching 시스템 적용
✓ 대량의 비정형데이터(이미지, 음성, 동영상)등을 기반으로 학습지도에 활용
18. - 18 -
1. Edu-Tech 시장 동향
2. 성장 동인 – CBA
3. Case Study – 대교 Cloud BigData Adaption
AGENDA
19. - 19 -
대교 Cloud & BigData P/F Adaption
대교는 인터넷 기반 교육사업에 필요한 인프라를 Cloud 환경하에 구축함으로써 향후 고객의 증가 및 사업 확대에
따른 인프라 증가 및 운영/개발환경의 Flexibility 확보하였음
기업 소개
기업명 : ㈜ 대교
대교그룹 계열사 / 방문교육, 학원
업계 1위 기업
- 자본금 : 520억원
- 매출액 : 8,209억원 ( 2019년말 기준 )
- 직원수 : 2,500여명
- 주요 사업 영역 : 학습지, 참고서, 출판/종합유선방송프로그램
공급, 디지털학원
성장판 서비스
구축 on AWS
Cloud 적용 사례
2018년 07월 ~ 12월
Mobile WEB/App 기반 교육서비스 구축
수행사 : 베스핀글로벌, 비디
1
분석플랫폼 구축
PoC
2
성장판 기반
분석인프라 구축 및
고도화
3
2019년 05월 ~ 6월 ( 1개월 )
분석플랫폼 구축 Feasibility 분석
수행사 : ㈜베스핀글로벌, 대교CNS
2019년 10월 ~ 12월
성장판서비스 분석환경(DW/BI) 인프라 구축
수행사 : ㈜베스핀글로벌, 대교CNS
현재 : BI Reporting 환경 구축 예정
20. - 20 -
Cloud & BigData PF Adaption – 1단계 : 성장판 서비스 구축
총 7개월간의 일정으로 신규 서비스인 Mobile App/WEB 서비스기반의 성장판 서비스를 Cloud 환경하에 개발 및
적용함
사업 명
대교 눈높이 성장판 서비스 구축
https://www.youtube.com/watch?v=JKYeXoIxeJ4
❖ 사업기간
’18년 6월 4일 ~ ’18년 12월 28일(총 7개월간)
1차 Open : ’18.09.03
2차 Open : ‘18.12.12
❖ 사업내용
Mobile App기반 학습지 서비스 및 코칭 서비스 FrontEnd P/F 구축
on AWS Cloud
21. - 21 -
Cloud & BigData PF Adaption – 1단계 : 성장판 서비스 구축 > Architecture
기존 IDC센터와 연동된 클라우드내 VPC(가상퍼블릭클라우드 공간)을 구성하고 서비스를 위한 보안 접근 구성
환경을 포함한 확장성을 고려한 유연한 Cloud Native WEB/APP Service Architecture를 구성함
22. - 22 -
Cloud & BigData PF Adaption – 1단계 : 성장판 서비스 구축 > Data 수집
향후 빅데이터 분석 및 AI/ML 분석을 위한 기초데이터를 수집하기 위하여 Mobile Device에서 발생하는 학생의
Mobile내에서의 행동 데이터 뿐만 아니라 학생이 작성한 글씨체의 이미지 까지를 데이터레이크를 기반으로 수집
보관함
23. - 23 -
Cloud & BigData PF Adaption – 2단계 : 분석플랫폼 구축 PoC
대교가 보유하고 있는 다양한 대고객 서비스의 분석을 위하여 Cloud 환경에서 유연하고 성능효율적인 최적의
아키텍쳐 기반의 대용량데이터분석환경을 구현하고 운영방안을 확보하기 위하여 POC를 선행하여 진행함
✓ 대교 BI/DW Platform을 AWS Public Cloud로의 성공적으로 구현하기 위한 아키텍쳐 도출
✓ 최소의 비용으로 최적의 성능을 보장할 수 있는 서비스 구성 방안 도출
✓ 향후 확장성 및 운영 효율성을 고려한 관리 방안 도출
PoC 개요
서비스에 적합한 AWS Cloud 환경 구성
➢최적의 성능을 고려한 AWS Cloud 인프라 설계/구축
➢효율적인 데이터 적재, 분석, 조회 구성 방안 제시
➢향후 확장할 수 있는 유연한 시스템 설계 및 구축
PoC 목표: 대교 BI/DW Platform을 위한 최적의 AWS Cloud BigData Architecture 도출
효율적인 운영 관리 방법 도출
➢적절한 관리형 서비스 적용으로 관리 포인트 단순화
➢최적의 인프라 설계/구축을 통한 시스템 운영 비용 및 TCO 절감
24. - 24 -
Cloud & BigData PF Adaption – 2단계 : 분석플랫폼 구축 PoC > Architecture 및 특징
단 1.5개월으로 짧은 기간 동안 대교 서비스 아키텍처에 최적화된 분석 환경을 구축하기 위한 대량의 데이터
수집부터 분석 및 Visualization까지의 End-to-End 서비스를 구축/시연함으로써 구현에 대한 Know-How를 확보함
25. - 25 -
Cloud & BigData PF Adaption – 3단계 : 성장판서비스 분석환경 구축
POC를 통해서 확보한 Cloud Native 빅데이터 분석환경의 유연성 및 성능을 기반으로 대교 주력 서비스인 성장판
서비스의 효과적인 운영 및 지도교사를 위한 분석환경을 구축함
퍼블릭 Cloud 기반
성장판 분석 인프라 구축
학습서비스 운영 경험
지도교사 니즈 반영
Cloud Apdaption 전문인력
데이터 전문 분석가 참여
26. - 26 -
Cloud & BigData PF Adaption – 3단계 : 성장판서비스 분석환경 구축 > Data Pipeline 구현
AWS Glue Service를 기반으로 원천시스템에서 Target시스템으로의 데이터 흐름을 구현함
Data Pipeline 설계 목적
✓ 전체적인 데이터흐름에 대한 이해
✓ 데이터 특성에 따른 작업 개발
가이드 For 개발 협력사
✓ 개발 결과에 대한 완전성 검증
27. - 27 -
Cloud & BigData PF Adaption – 3단계 : 성장판서비스 분석환경 구축 > Data Cataloging
대교 Data Lake 인프라구축은 크게 성장판 서비스에 대한 DW구축과 성장판 외 시스템의 데이터 Lake 구축으로
구분되며, Data Lake에 생성되는 모든 데이터는 Ad-hoc분석을 위한 Data Catalog Crawling을 수행함