17. ‘사용자’를 포함한 시스템 최적화
쉽고 익숙하게
- 로컬 PC 사용 경험 같은,
- 기존의 작업 환경과 유사한,
- 빠른 응답 속도의,
18. ‘사용자’를 포함한 시스템 최적화
쉽고 익숙하게
- 로컬 PC 사용 경험 같은,
- 기존의 작업 환경과 유사한,
- 빠른 응답 속도의,
해커처럼
- 동시에 여러 아이디어 병행 실험
- 작동 중인 실험의 실행 시간 변형
- 효과적인 분석
19. ‘사용자’를 포함한 시스템 최적화
함께. 같이.
- 다른 사람의 실험을 쉽게 재현해 볼 수 있는,
- 다른 사람의 모델과 나의 모델을 쉽게 비교해 볼 수 있는,
쉽고 익숙하게
- 로컬 PC 사용 경험 같은,
- 기존의 작업 환경과 유사한,
- 빠른 응답 속도의,
해커처럼
- 동시에 여러 아이디어 병행 실험
- 작동 중인 실험의 실행 시간 변형
- 효과적인 분석
21. GPU 공유하기
수동 분배
각 서버마다 GPU를 특정 사용자에게 수동 분배 (게시판?)
http://www.remodeling.hw.net/business/leadership/charted-territory-a-low-tech-way-to-effectively-schedule-multiple-jobs
문제
어려운 재분배, 긴 유휴 시간, 환경 충돌
Dirty Hack
“당분간 우리 실험실은 텐서플로 버전 0.12만 쓴다!”
24. 재분배, 유휴 시간 문제 해결
Overbooking
GPU 리소스 가상화 — 문제 복잡도, 비결정적 시스템 응답
최대한 짧은 사용 시간
정확히 리소스를 사용할 시간만큼만 자원 배정
Save & resume
할당 받은 새로운 서버, 새로운 gpu를 이용해 작동하고 있던 실험을 쉽게 이주
25. Session, Model
Session: GPU를 할당 받아 한시적으로 작동하는 ‘프로그램’
GPU를 필요한 시간 동안만 점유하도록 함
Model: Session의 부산물(checkpoint)
자동 정량화: Validation을 거쳐 별도의 storage에 보관
실험 재개/이주
실험 설정 변경
[Game save 파일?]
29. Scheduler (w/ dynamic priority)
상황에 따른 우선 순위 배정
진행 경과에 따라 변화하는 우선 순위에 따른 자원 배정
Dynamic Priority Queue
실험이 ‘best model’을 갱신할 가능성을 기준으로 우선순위로 계산
단순한 grid search만으로도 쓸만한 AutoML
36. 당신의 Idle time 줄이기
동시에 여러 실험을 수행
분산된 응답
Exp. #1
Exp #2. vari. 1
Exp #2. vari. 2
Exp #3
37. 당신의 인지 능력 향상
Balance your brain
Visualization: 수고 없이 정보를 이해할 수 있는 방법
https://www.interaction-design.org/literature/book/the-encyclopedia-of-human-computer-interaction-2nd-ed/data-visualization-for-human-perception
38.
39.
40. 실험 경과 파악
기존 솔루션을 더 편리하게
Tensorboard, Visdom 등 이미 공개되어 있는 서버 활용
귀찮음 — 서버를 미리 띄워 놓고 데이터를 전송해야 함
느림 — 미리 코드에 리포트 관련 코드를 넣어 둬야 함
Your code @2 Visualization toolnsml
Your code @3
Your code @1
52. 가장 쉬운 환경 설정 방법
Base docker image
다양한 docker image 사용 가능
53. 가장 쉬운 환경 설정 방법
문제: 전보다 “훨씬” 느린 실험 부팅 시간
setup.py, requirements.txt를 실행하는데 반복적으로 소요되는 시간
tensorflow/tensorflow
(base docker image)
setup.py
requirements.txt
+ nsml-23ab42ac(sha1)
(user docker image)
해결책: User docker image
65. 학습된 모델은 자동적으로 순위 집계
응집력 있는 경쟁적 연구 환경
데이터셋을 대상으로 학습된 모델의 zoo
표준화, 정량화된 평가
잘 만들어진 경쟁 환경의 연구 가속화
AutoML의 environment
66. Continuously Integrated ML
sota server
Bob’s model 12
98.2%
Bob’s model 13
94.2%
Alice’s model 4
92.1%
Alice’s model 5
98.3%
REST API
https://service.nsml.navercorp.com/ASR