Ahea Team Spring batch

LEGACY BATCH PROBLEM
[A]개발자의 배치 개발 일상.
배치 통계를 위한 변수를
할당하는 코드 추가
트래픽 증
배치 개발 개발중 에러발생 - 로그
추가

[A]씨의 일을 인수인계 받은 [B] 개발자
로직이 어디있
지?
새벽에 도는 배치가
실패

기존 배치 개발의 문제점
1. 읽어오는 데이터 형태의 변화에 대응하기 힘들다. (CSV -> DB)
2. DB에 한꺼번에 COMMIT되는 건수가 너무 많았다.(트래픽 증가)
3. 배치 통계를 위한 변수를 할당하고 로깅 하는 코드 추가.
4. 유지보수가 힘들다. (비지니스 로직 어디있는거지?)
5. 실패 했을때 후 처리가 부족했다.(B씨 새벽에 배치가 실패)

ABOUT SPRING BATCH
SPRING BATCH != QUARTZ
Simple

ABOUT SPRING BATCH
BATCH란
Batch 는 일괄 처리를 뜻하는
용어.
Spring Framework
사용 편의성 기반.
스프링 배치는 스케줄러를 포함
하지 않고 스케줄러 와 함께 작
동.

SPRING BATCH HISTORY
Spring batch 는 컨설팅 회사인 엑센츄어
(Accenture)의 실무 경험을 바탕으로
Spring IO 팀과 함께 개발을 했으며, 이미
많은 회사에서 안정적으로 사용 중
Spring Batch는 로깅 / 추적, 트랜잭션 관리, 작업 처리
통계, 작업 재시작, 건너 뛰기 및 자원 관리를 포함
ABOUT SPRING BATCH

JOB LAUNCHER
SPRING BATCH DOMAIN

JobInstance = job + jobParameters
JobExecution은 한번 instance가 시도 되는 job개념.
SPRING BATCH DOMAIN

SPRING BATCH - TABLE
BATCH TABLE

SPRING BATCH - TABLE
TABLE - SAMPLE DATA

SPRING BATCH - DEMO
BATCH - SAMPLE DATA

SPRING BATCH - DEMO
@ENABLEBATCHPROCESSING
- jobBuilderFactory와 stepBuilderFactory 빈을 제공
- 생성 되는 TransactionManager 는 DataSourceTransactionManager 사용

firstName 과 lastname을 대문자로 만들어주는 PersionItemProcessor
Item 처리할 데이터의 가장 작은 구성 요소
SPRING BATCH - DEMO
PROCESSOR - BUSSINESS LOGIC

SPRING BATCH - CHUNK
CHUNK란
Chunk oriented processing refers to reading the data one at a time, and
creating 'chunks' that will be written out, within a transaction boundary.
One item is read in from an ItemReader, handed to an ItemProcessor, and
aggregated.
Once the number of items read equals the commit interval, the entire chunk
is written out via the ItemWriter, and then the transaction is committed.
하나의 TRANSACTION안에서 처리할 ITEM의 덩어리.

CHUNK 의 역할
Reader - Item 하나씩
Writer - chunk에 설정한 개수만큼

CHUNK 개수에 따른 속도 변화
chunk 10일때
수행시간 : 1초
chunk 100일때
수행시간 : 0.1초

CHUNK와 TRANSACTION

CHUNK 의 동작방식 정리
if> chunk 의 commit interval = 2

READER, WRITER 설정
SPRING BATCH - READER, WRITER

JDBCPAGING READER
paging을 사용해서 대량의 데이터를 짤라 읽는 방식

pageSize 를 10으로 set 후 sortKey 에 따라서 쿼리를 질의.
RepeatTemplate에 chunk만큼 저장 후 Insert
if> chunk 의 commit interval = 5

이미 가져온 10개중 5개가 남아서 read로 읽어오고 chunk에 쌓고 5개 되면 insert
sortKey에 따라서 order 를 걸고 그 다음부터 쿼리 질의.

1.Reader 에 pageSize만큼 쿼리 해온다.
2.reader가 한 건씩 처리.
3.chunk에 세팅한 만큼 쌓이면 write
JDBCPAGING READER - 정리

SPRING BATCH LISTENER
JOBEXECUTIONLISTENER

SPRING BATCH SOLUTION
BATCH 를 통해 해결.
1. 읽어오는 데이터 형태의 변화에 대응하기 힘들다. (CSV -> DB)
-> ITEMREADER라는 인터페이스를 통해 비교적 쉬운 방식으로 접근 가
능
2. DB에 한꺼번에 COMMIT되는 건수가 너무 많았다.
-> CHUNK ORIENTED PROCESSING 으로 COMMIT 되는 양을 조절 할
수 있다.
3. 배치 통계를 위한 변수를 할당하고 로깅 하는 코드 추가.
-> BATCH TABLE 에 통계에 필요한 값들이 알아서 저장된다.
4. 유지보수가 힘들다. (비지니스 로직 어디있는거지?)
-> PRECESS, READ, WRITER를 보면 어떻게 되있는지 쉽게 찾을 수 있
다.
5. 실패 했을때 후 처리가 부족했다.
-> EXECUTIONCONTEXT 라는 저장 공간에 저장된 정보를 활용해서 처
리.

ETC
추가 - 대용량 배치 처리 병렬 수행
1. 멀티쓰레드(Multi-threaded Step)
2. Parallel Steps.
3. 파티셔닝(Partitioning)

SPRING BATCH SOLUTION
AHEA STUDY 를 준비하면서…..

>https://docs.spring.io/spring/docs/current/spring-framework-reference/html/schedu
스프링 배치와 전자전부 프레임워크 : http://open.egovframe.go.kr/nforges/informat
스프링 배치 이점 : https://groups.google.com/forum/#!topic/ksug/9FMlJaE-zKU
스프링 배치 vs DB 프로시저 : https://groups.google.com/forum/#!topic/ksug/vznlOZ
대규모 배치시스템 성공적인 구축 전략 : https://www.kodb.or.kr/info/info_04_view.h

Ahea Team Spring batch

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Ahea Team Spring batch

Similar a Ahea Team Spring batch (20)

Ahea Team Spring batch

Notas del editor