[부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략

CONNECT FOUNDATION
CONNECT FOUNDATIONCONNECT FOUNDATION
모델링 자동화와 실험 검증 전략
구건모
# RAY[TUNE] #WANDB #SLACK-BOT #JSON
부스트캠프 AI Tech <Tech Talk>
목차
• 모델링 자동화
• 모델링 자동화란?
• 모델링 자동화의 장점
• 실험 검증 전략
• 하이퍼 파라미터 검증 전략
• 학습 검증 전략 (1) - 학습 곡선
• 학습 검증 전략 (2) - 시각화
• 실험 공유를 통한 검증 전략 부스트캠프 AI Tech <Tech Talk>
2/
모델링 자동화란?
• Key 를 사용하여
부스트캠프 AI Tech <Tech Talk>
3/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
부스트캠프 AI Tech <Tech Talk>
4/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
• Modeling 을 수행
• train
• evaluate
부스트캠프 AI Tech <Tech Talk>
5/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
• Modeling 을 수행
• Config 파일로 통제되는 환경
부스트캠프 AI Tech <Tech Talk>
6/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
• Modeling 을 수행
• Config 파일로 통제되는 환경
• 한 개 Config이 모델 한 개를 모델링
부스트캠프 AI Tech <Tech Talk>
7/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• retriver_name : "TFIDF"
• retriver_name : "BM25"
• retriver_name : "DPRKOBERT"
• ST00.json, ST01.json, ST02.json
부스트캠프 AI Tech <Tech Talk>
8/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• 코드의 가독성 이 좋아진다.
• 추상화를 필연적으로 해야한다.
부스트캠프 AI Tech <Tech Talk>
9/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• 코드의 가독성 이 좋아진다.
• 추상화를 필연적으로 해야한다.
• 코드 효율이 좋아진다.
부스트캠프 AI Tech <Tech Talk>
10/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• 코드의 가독성 이 좋아진다.
• 안전한 기능 추가 가 가능하다.
• Key로 판단
• Key Default값 존재
• args.path
부스트캠프 AI Tech <Tech Talk>
11/
실험 검증 전략
• 모델링을 잘 했다고 성능이 좋지는 않다.
• 다만 다양한 실험을 쉽게 할 수 있을 뿐..
• 다양한 실험을 진행하면서 검증을 해야 된다.
• 이 실험이 정말 유의미한지
부스트캠프 AI Tech <Tech Talk>
12/
실험 검증 전략
• 실험을 진행하면서 들었던 의문점들
• 좋은 하이퍼파라미터 는 어떻게 찾아야 될까?
• 모델이 내가 원하는 대로 동작 을 하는 건가?
• A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까?
부스트캠프 AI Tech <Tech Talk>
13/
하이퍼파라미터 검증 전략
• 좋은 하이퍼파라미터 찾기는 굉장히 어렵습니다.
• 학습이 잘 안 될 경우
• 코드 문제인가?
• 눈에 보이는 오류가 아니라서 더 어렵습니다.
• 학습이 잘 될 경우
• 더 좋은 하이퍼파라미터가 있지 않을까?
부스트캠프 AI Tech <Tech Talk>
14/
하이퍼파라미터 검증 전략
• 제가 원하는 것은 최고의 하이퍼파라미터
• 첫 번째 스테이지에서 LB Score를 높이기 위해서
• 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작..
• 그렇게 2주가 지나고
부스트캠프 AI Tech <Tech Talk>
15/
하이퍼파라미터 검증 전략
• 제가 원하는 것은 최고의 하이퍼파라미터
• 첫 번째 스테이지에서 LB Score를 높이기 위해서
• 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작..
• 그렇게 2주가 지나고
• 이렇게 하면 안되겠다
부스트캠프 AI Tech <Tech Talk>
16/
하이퍼파라미터 검증 전략
• 필요한 것은 탄탄한 지식과 최적화 알고리즘
• Search Space를 잘~ 설정하는데 탄탄한 지식이 필요합니다.
부스트캠프 AI Tech <Tech Talk>
17/
하이퍼파라미터 검증 전략
• MSE Loss : 3.78
• 산술 계산해서 나오는 값?
• Likelihood를 최적화 하는 통계량
• 모수와의 거리
부스트캠프 AI Tech <Tech Talk>
18/
하이퍼파라미터 검증 전략
• Focal과 Cross Entropy
• Focal : [0.7 0.3]의 Confidence로 Acc 100%
• CE : [0.7 0.3]의 Confidence로 Acc 100%
부스트캠프 AI Tech <Tech Talk>
19/
하이퍼파라미터 검증 전략
• Learning Rate, Batch Size
• Gradient 벡터의 크기와 방향
부스트캠프 AI Tech <Tech Talk>
20/
하이퍼파라미터 검증 전략
• 지식과 경험이 부족하면 발생하는 일
• 4일 내내 BERT 하이퍼파라미터 이슈로 고생한다.
• 3일 동안 코드만 고쳤다.
부스트캠프 AI Tech <Tech Talk>
21/
하이퍼파라미터 검증 전략
• 최적화 알고리즘의 하이퍼파라미터
• Search Space 정의
• 하이퍼파라미터 최적화
• RAY[TUNE]
부스트캠프 AI Tech <Tech Talk>
22/
하이퍼파라미터 검증 전략
• 알고리즘은 뭐를 사용해야 할까?
• Sequential Optimisation
• Parallel Random Search
• Parallel Grid Search
• Population Based Training
부스트캠프 AI Tech <Tech Talk>
23/
하이퍼파라미터 검증 전략
Sequential Optimisation
• 학습하고 체크하고.. 학습하고..
• 저비용, 많은 시간 소요
부스트캠프 AI Tech <Tech Talk>
24/
하이퍼파라미터 검증 전략
Parallel Random/Grid Search
• 경우의 수가 굉장히 많다.
• 고 비용, 적은 시간 소요
부스트캠프 AI Tech <Tech Talk>
25/
하이퍼파라미터 검증 전략
Population Based Training
• 두 방법을 결합한 새로운 방법
• 저비용, 적은 시간 소요
• Exploit ­ 성능이 안 좋은 모델 대체
• Explore ­ perturbations 이후 학습
부스트캠프 AI Tech <Tech Talk>
26/
하이퍼파라미터 검증 전략
Population Based Training
• 단점은 많은 디스크 용량을 필요로 한다.
• Exploit 과정을 하기 위해서
• N개의 모델을 Checkpoint에 저장
• Gpu와 디스크 용량만 많다면
좋은 알고리즘
부스트캠프 AI Tech <Tech Talk>
27/
학습 검증 전략 (1) - 학습 곡선
• 과대 적합, 과소 적합을 판단하기에 가장 좋다.
부스트캠프 AI Tech <Tech Talk>
28/
학습 검증 전략 (1) - 학습 곡선
• WANDB
부스트캠프 AI Tech <Tech Talk>
29/
학습 검증 전략 (1) - 학습 곡선
• A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까?
• N번 돌린다음 모델의 성능 지표의 평균 값으로 판단을 하자.
부스트캠프 AI Tech <Tech Talk>
30/
학습 검증 전략 (2) - 시각화
• 학습 곡선만으로는 부족하다.
• 시각화
• 모델을 분석하는데 도움이 된다.
• 잘 만들어 놓으면 재사용이 용이하다.
부스트캠프 AI Tech <Tech Talk>
31/
학습 검증 전략 (2) - 시각화
• 시각화의 좋은 예
• 분석 할 때 좋은 시각화
• 결과 분석이 가능한 시각화
• 전체를 대상 으로 하는 시각화
부스트캠프 AI Tech <Tech Talk>
32/
학습 검증 전략 (2) - 시각화
• 시각화의 좋은 예
• 분석 할 때 좋은 시각화
• 결과 분석이 가능한 시각화
• 전체를 대상 으로 하는 시각화
• 모델들 간의 우위를 볼 수 있는 시각화
• Competition에 큰 도움이 됐다.
부스트캠프 AI Tech <Tech Talk>
33/
학습 검증 전략 (2) - 시각화
• 시각화의 나쁜 예
• 분석 할 때 나쁜 시각화
• 어딜 보고 예측하는 거니..?
• 하나를 대상 으로 하는 시각화
부스트캠프 AI Tech <Tech Talk>
34/
학습 검증 전략 (2) - 시각화
• 시각화의 나쁜 예
• 분석 할 때 나쁜 시각화
• 어딜 보고 예측하는 거니..?
• 하나를 대상 으로 하는 시각화
부스트캠프 AI Tech <Tech Talk>
35/
실험 공유를 통한 검증 전략
• 공유를 하면 자동으로 검증 이 되는 전략
• 모델링에 공유 기능을 추가 하면 효율이 좋다
부스트캠프 AI Tech <Tech Talk>
36/
실험 공유를 통한 검증 전략
부스트캠프 AI Tech <Tech Talk>
37/
Q&A
부스트캠프 AI Tech <Tech Talk>
38/
감사합니다
부스트캠프 AI Tech <Tech Talk>
39/
1 de 39

Recomendados

프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트 por
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트Minho Lee
3K vistas22 diapositivas
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming) por
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)CONNECT FOUNDATION
185 vistas26 diapositivas
테스트 기발 개발, TBD(Test based developement) por
테스트 기발 개발, TBD(Test based developement)테스트 기발 개발, TBD(Test based developement)
테스트 기발 개발, TBD(Test based developement)도형 임
1.1K vistas109 diapositivas
애자일 도입과 사례 공유 por
애자일 도입과 사례 공유애자일 도입과 사례 공유
애자일 도입과 사례 공유agilekorea
7.4K vistas55 diapositivas
TDD - 테스트 주도로 개발하기 por
TDD - 테스트 주도로 개발하기TDD - 테스트 주도로 개발하기
TDD - 테스트 주도로 개발하기현승 배
86 vistas26 diapositivas
Java 그쪽 동네는 por
Java 그쪽 동네는Java 그쪽 동네는
Java 그쪽 동네는도형 임
1.5K vistas24 diapositivas

Más contenido relacionado

Similar a [부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략

KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio) por
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)Sungmin Kim
4.5K vistas73 diapositivas
분석과 설계 por
분석과 설계분석과 설계
분석과 설계Haeil Yi
6.2K vistas89 diapositivas
T ka kr_4th por
T ka kr_4thT ka kr_4th
T ka kr_4thSubin An
468 vistas65 diapositivas
발표자료 1인qa로살아남는6가지방법 por
발표자료 1인qa로살아남는6가지방법발표자료 1인qa로살아남는6가지방법
발표자료 1인qa로살아남는6가지방법SangIn Choung
5.9K vistas41 diapositivas
모바일 앱 개발을 위한 Agile 적용 por
모바일 앱 개발을 위한 Agile 적용모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용Kevin Kim
8.3K vistas75 diapositivas
Chapter 11 Practical Methodology por
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical MethodologyKyeongUkJang
61 vistas38 diapositivas

Similar a [부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략(20)

KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio) por Sungmin Kim
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)
Sungmin Kim4.5K vistas
분석과 설계 por Haeil Yi
분석과 설계분석과 설계
분석과 설계
Haeil Yi6.2K vistas
T ka kr_4th por Subin An
T ka kr_4thT ka kr_4th
T ka kr_4th
Subin An468 vistas
발표자료 1인qa로살아남는6가지방법 por SangIn Choung
발표자료 1인qa로살아남는6가지방법발표자료 1인qa로살아남는6가지방법
발표자료 1인qa로살아남는6가지방법
SangIn Choung5.9K vistas
모바일 앱 개발을 위한 Agile 적용 por Kevin Kim
모바일 앱 개발을 위한 Agile 적용모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용
Kevin Kim8.3K vistas
Chapter 11 Practical Methodology por KyeongUkJang
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical Methodology
KyeongUkJang61 vistas
개발이 테스트를 만났을 때(Shift left testing) por SangIn Choung
개발이 테스트를 만났을 때(Shift left testing)개발이 테스트를 만났을 때(Shift left testing)
개발이 테스트를 만났을 때(Shift left testing)
SangIn Choung3.7K vistas
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안 por Clova Platform
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Platform2.2K vistas
Diquest 김경선 엔터프라이즈 검색에 적합한 por s song
Diquest 김경선 엔터프라이즈 검색에 적합한 Diquest 김경선 엔터프라이즈 검색에 적합한
Diquest 김경선 엔터프라이즈 검색에 적합한
s song65 vistas
애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절) por SangIn Choung
애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절)애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절)
애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절)
SangIn Choung3.6K vistas
SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리) por Eunchan Lee
SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리)SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리)
SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리)
Eunchan Lee1.2K vistas
Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig... por 박 상아
Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig...Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig...
Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig...
박 상아149 vistas
Bert3q KorQuAD Finetuning NLP Challenge por OverDeep
Bert3q KorQuAD Finetuning NLP ChallengeBert3q KorQuAD Finetuning NLP Challenge
Bert3q KorQuAD Finetuning NLP Challenge
OverDeep71 vistas
애자일 스크럼과 JIRA por Terry Cho
애자일 스크럼과 JIRA 애자일 스크럼과 JIRA
애자일 스크럼과 JIRA
Terry Cho45.7K vistas
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발 por Jaehoon Oh
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
Jaehoon Oh6.5K vistas
(독서광) 인공지능 소프트웨어 품질 보증을 위한 테스트 기법 por Jay Park
(독서광) 인공지능 소프트웨어  품질 보증을 위한 테스트 기법(독서광) 인공지능 소프트웨어  품질 보증을 위한 테스트 기법
(독서광) 인공지능 소프트웨어 품질 보증을 위한 테스트 기법
Jay Park1.1K vistas
역삼역, 이마트 AI_v최종.pdf por DeukJin Jeon
역삼역, 이마트 AI_v최종.pdf역삼역, 이마트 AI_v최종.pdf
역삼역, 이마트 AI_v최종.pdf
DeukJin Jeon941 vistas
기계독해를 위한 BERT 언어처리 모델 활용 por Kenneth Jung
기계독해를 위한 BERT 언어처리 모델 활용기계독해를 위한 BERT 언어처리 모델 활용
기계독해를 위한 BERT 언어처리 모델 활용
Kenneth Jung2.5K vistas
Mrc based cdqa_Seoul chatbot por Jun-Hyeong Lee
Mrc based cdqa_Seoul chatbotMrc based cdqa_Seoul chatbot
Mrc based cdqa_Seoul chatbot
Jun-Hyeong Lee570 vistas
Coding interview por Soohan Ahn
Coding interviewCoding interview
Coding interview
Soohan Ahn409 vistas

Más de CONNECT FOUNDATION

부스트캠프 웹・모바일 8기 설명회 (2023년) por
부스트캠프 웹・모바일 8기 설명회 (2023년)부스트캠프 웹・모바일 8기 설명회 (2023년)
부스트캠프 웹・모바일 8기 설명회 (2023년)CONNECT FOUNDATION
2.5K vistas41 diapositivas
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로 por
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로CONNECT FOUNDATION
73 vistas28 diapositivas
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend por
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspendCONNECT FOUNDATION
85 vistas30 diapositivas
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다 por
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다CONNECT FOUNDATION
40 vistas48 diapositivas
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지 por
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지CONNECT FOUNDATION
52 vistas21 diapositivas
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니 por
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니CONNECT FOUNDATION
53 vistas40 diapositivas

Más de CONNECT FOUNDATION(20)

부스트캠프 웹・모바일 8기 설명회 (2023년) por CONNECT FOUNDATION
부스트캠프 웹・모바일 8기 설명회 (2023년)부스트캠프 웹・모바일 8기 설명회 (2023년)
부스트캠프 웹・모바일 8기 설명회 (2023년)
CONNECT FOUNDATION2.5K vistas
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로 por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
CONNECT FOUNDATION73 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
CONNECT FOUNDATION85 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다 por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
CONNECT FOUNDATION40 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지 por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
CONNECT FOUNDATION52 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니 por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
CONNECT FOUNDATION53 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가 por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는  어떻게  재활용하는가[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는  어떻게  재활용하는가
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가
CONNECT FOUNDATION152 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍 por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
CONNECT FOUNDATION79 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
CONNECT FOUNDATION36 vistas
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까 por CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
CONNECT FOUNDATION68 vistas
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.) por CONNECT FOUNDATION
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
CONNECT FOUNDATION52 vistas
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti) por CONNECT FOUNDATION
 [특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti) [특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
CONNECT FOUNDATION227 vistas
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크) por CONNECT FOUNDATION
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
CONNECT FOUNDATION152 vistas
부스트캠프 웹∙모바일 7기 설명회 por CONNECT FOUNDATION
부스트캠프 웹∙모바일 7기 설명회부스트캠프 웹∙모바일 7기 설명회
부스트캠프 웹∙모바일 7기 설명회
CONNECT FOUNDATION393 vistas
[부스트캠프 Tech Talk] 배지연_Structure of Model and Task por CONNECT FOUNDATION
[부스트캠프 Tech Talk] 배지연_Structure of Model and Task[부스트캠프 Tech Talk] 배지연_Structure of Model and Task
[부스트캠프 Tech Talk] 배지연_Structure of Model and Task
CONNECT FOUNDATION257 vistas
[부스트캠프 Tech Talk] 신원지_Wandb Visualization por CONNECT FOUNDATION
[부스트캠프 Tech Talk] 신원지_Wandb Visualization[부스트캠프 Tech Talk] 신원지_Wandb Visualization
[부스트캠프 Tech Talk] 신원지_Wandb Visualization
CONNECT FOUNDATION352 vistas
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기 por CONNECT FOUNDATION
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
CONNECT FOUNDATION100 vistas
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기 por CONNECT FOUNDATION
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
CONNECT FOUNDATION1.5K vistas
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff por CONNECT FOUNDATION
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
CONNECT FOUNDATION98 vistas
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기 por CONNECT FOUNDATION
[부스트캠프 Tech talk] 황우진  딥러닝 가볍게 구현해보기[부스트캠프 Tech talk] 황우진  딥러닝 가볍게 구현해보기
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기
CONNECT FOUNDATION136 vistas

[부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략

  • 1. 모델링 자동화와 실험 검증 전략 구건모 # RAY[TUNE] #WANDB #SLACK-BOT #JSON 부스트캠프 AI Tech <Tech Talk>
  • 2. 목차 • 모델링 자동화 • 모델링 자동화란? • 모델링 자동화의 장점 • 실험 검증 전략 • 하이퍼 파라미터 검증 전략 • 학습 검증 전략 (1) - 학습 곡선 • 학습 검증 전략 (2) - 시각화 • 실험 공유를 통한 검증 전략 부스트캠프 AI Tech <Tech Talk> 2/
  • 3. 모델링 자동화란? • Key 를 사용하여 부스트캠프 AI Tech <Tech Talk> 3/
  • 4. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 부스트캠프 AI Tech <Tech Talk> 4/
  • 5. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 • Modeling 을 수행 • train • evaluate 부스트캠프 AI Tech <Tech Talk> 5/
  • 6. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 • Modeling 을 수행 • Config 파일로 통제되는 환경 부스트캠프 AI Tech <Tech Talk> 6/
  • 7. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 • Modeling 을 수행 • Config 파일로 통제되는 환경 • 한 개 Config이 모델 한 개를 모델링 부스트캠프 AI Tech <Tech Talk> 7/
  • 8. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • retriver_name : "TFIDF" • retriver_name : "BM25" • retriver_name : "DPRKOBERT" • ST00.json, ST01.json, ST02.json 부스트캠프 AI Tech <Tech Talk> 8/
  • 9. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • 코드의 가독성 이 좋아진다. • 추상화를 필연적으로 해야한다. 부스트캠프 AI Tech <Tech Talk> 9/
  • 10. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • 코드의 가독성 이 좋아진다. • 추상화를 필연적으로 해야한다. • 코드 효율이 좋아진다. 부스트캠프 AI Tech <Tech Talk> 10/
  • 11. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • 코드의 가독성 이 좋아진다. • 안전한 기능 추가 가 가능하다. • Key로 판단 • Key Default값 존재 • args.path 부스트캠프 AI Tech <Tech Talk> 11/
  • 12. 실험 검증 전략 • 모델링을 잘 했다고 성능이 좋지는 않다. • 다만 다양한 실험을 쉽게 할 수 있을 뿐.. • 다양한 실험을 진행하면서 검증을 해야 된다. • 이 실험이 정말 유의미한지 부스트캠프 AI Tech <Tech Talk> 12/
  • 13. 실험 검증 전략 • 실험을 진행하면서 들었던 의문점들 • 좋은 하이퍼파라미터 는 어떻게 찾아야 될까? • 모델이 내가 원하는 대로 동작 을 하는 건가? • A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까? 부스트캠프 AI Tech <Tech Talk> 13/
  • 14. 하이퍼파라미터 검증 전략 • 좋은 하이퍼파라미터 찾기는 굉장히 어렵습니다. • 학습이 잘 안 될 경우 • 코드 문제인가? • 눈에 보이는 오류가 아니라서 더 어렵습니다. • 학습이 잘 될 경우 • 더 좋은 하이퍼파라미터가 있지 않을까? 부스트캠프 AI Tech <Tech Talk> 14/
  • 15. 하이퍼파라미터 검증 전략 • 제가 원하는 것은 최고의 하이퍼파라미터 • 첫 번째 스테이지에서 LB Score를 높이기 위해서 • 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작.. • 그렇게 2주가 지나고 부스트캠프 AI Tech <Tech Talk> 15/
  • 16. 하이퍼파라미터 검증 전략 • 제가 원하는 것은 최고의 하이퍼파라미터 • 첫 번째 스테이지에서 LB Score를 높이기 위해서 • 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작.. • 그렇게 2주가 지나고 • 이렇게 하면 안되겠다 부스트캠프 AI Tech <Tech Talk> 16/
  • 17. 하이퍼파라미터 검증 전략 • 필요한 것은 탄탄한 지식과 최적화 알고리즘 • Search Space를 잘~ 설정하는데 탄탄한 지식이 필요합니다. 부스트캠프 AI Tech <Tech Talk> 17/
  • 18. 하이퍼파라미터 검증 전략 • MSE Loss : 3.78 • 산술 계산해서 나오는 값? • Likelihood를 최적화 하는 통계량 • 모수와의 거리 부스트캠프 AI Tech <Tech Talk> 18/
  • 19. 하이퍼파라미터 검증 전략 • Focal과 Cross Entropy • Focal : [0.7 0.3]의 Confidence로 Acc 100% • CE : [0.7 0.3]의 Confidence로 Acc 100% 부스트캠프 AI Tech <Tech Talk> 19/
  • 20. 하이퍼파라미터 검증 전략 • Learning Rate, Batch Size • Gradient 벡터의 크기와 방향 부스트캠프 AI Tech <Tech Talk> 20/
  • 21. 하이퍼파라미터 검증 전략 • 지식과 경험이 부족하면 발생하는 일 • 4일 내내 BERT 하이퍼파라미터 이슈로 고생한다. • 3일 동안 코드만 고쳤다. 부스트캠프 AI Tech <Tech Talk> 21/
  • 22. 하이퍼파라미터 검증 전략 • 최적화 알고리즘의 하이퍼파라미터 • Search Space 정의 • 하이퍼파라미터 최적화 • RAY[TUNE] 부스트캠프 AI Tech <Tech Talk> 22/
  • 23. 하이퍼파라미터 검증 전략 • 알고리즘은 뭐를 사용해야 할까? • Sequential Optimisation • Parallel Random Search • Parallel Grid Search • Population Based Training 부스트캠프 AI Tech <Tech Talk> 23/
  • 24. 하이퍼파라미터 검증 전략 Sequential Optimisation • 학습하고 체크하고.. 학습하고.. • 저비용, 많은 시간 소요 부스트캠프 AI Tech <Tech Talk> 24/
  • 25. 하이퍼파라미터 검증 전략 Parallel Random/Grid Search • 경우의 수가 굉장히 많다. • 고 비용, 적은 시간 소요 부스트캠프 AI Tech <Tech Talk> 25/
  • 26. 하이퍼파라미터 검증 전략 Population Based Training • 두 방법을 결합한 새로운 방법 • 저비용, 적은 시간 소요 • Exploit ­ 성능이 안 좋은 모델 대체 • Explore ­ perturbations 이후 학습 부스트캠프 AI Tech <Tech Talk> 26/
  • 27. 하이퍼파라미터 검증 전략 Population Based Training • 단점은 많은 디스크 용량을 필요로 한다. • Exploit 과정을 하기 위해서 • N개의 모델을 Checkpoint에 저장 • Gpu와 디스크 용량만 많다면 좋은 알고리즘 부스트캠프 AI Tech <Tech Talk> 27/
  • 28. 학습 검증 전략 (1) - 학습 곡선 • 과대 적합, 과소 적합을 판단하기에 가장 좋다. 부스트캠프 AI Tech <Tech Talk> 28/
  • 29. 학습 검증 전략 (1) - 학습 곡선 • WANDB 부스트캠프 AI Tech <Tech Talk> 29/
  • 30. 학습 검증 전략 (1) - 학습 곡선 • A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까? • N번 돌린다음 모델의 성능 지표의 평균 값으로 판단을 하자. 부스트캠프 AI Tech <Tech Talk> 30/
  • 31. 학습 검증 전략 (2) - 시각화 • 학습 곡선만으로는 부족하다. • 시각화 • 모델을 분석하는데 도움이 된다. • 잘 만들어 놓으면 재사용이 용이하다. 부스트캠프 AI Tech <Tech Talk> 31/
  • 32. 학습 검증 전략 (2) - 시각화 • 시각화의 좋은 예 • 분석 할 때 좋은 시각화 • 결과 분석이 가능한 시각화 • 전체를 대상 으로 하는 시각화 부스트캠프 AI Tech <Tech Talk> 32/
  • 33. 학습 검증 전략 (2) - 시각화 • 시각화의 좋은 예 • 분석 할 때 좋은 시각화 • 결과 분석이 가능한 시각화 • 전체를 대상 으로 하는 시각화 • 모델들 간의 우위를 볼 수 있는 시각화 • Competition에 큰 도움이 됐다. 부스트캠프 AI Tech <Tech Talk> 33/
  • 34. 학습 검증 전략 (2) - 시각화 • 시각화의 나쁜 예 • 분석 할 때 나쁜 시각화 • 어딜 보고 예측하는 거니..? • 하나를 대상 으로 하는 시각화 부스트캠프 AI Tech <Tech Talk> 34/
  • 35. 학습 검증 전략 (2) - 시각화 • 시각화의 나쁜 예 • 분석 할 때 나쁜 시각화 • 어딜 보고 예측하는 거니..? • 하나를 대상 으로 하는 시각화 부스트캠프 AI Tech <Tech Talk> 35/
  • 36. 실험 공유를 통한 검증 전략 • 공유를 하면 자동으로 검증 이 되는 전략 • 모델링에 공유 기능을 추가 하면 효율이 좋다 부스트캠프 AI Tech <Tech Talk> 36/
  • 37. 실험 공유를 통한 검증 전략 부스트캠프 AI Tech <Tech Talk> 37/
  • 38. Q&A 부스트캠프 AI Tech <Tech Talk> 38/