SlideShare una empresa de Scribd logo
1 de 19
Descargar para leer sin conexión
머신러닝 플랫폼 기반의
철도사고위험예측
2016 데이터 그랜드 컨퍼런스
2016.11.04
1. 철도 안전 소개
2. 철도 사고위험예측
3. WISE ADVISOR
4. WISE 제품과 머신러닝
최근 잇단 열차 탈선 사고로 인해 철도안전의 중요성 대두
105
93
81 75
66
135
115 113 112
46
235
207
182
178
104
0
50
100
150
200
250
2011년 2012년 2013년 2014년 2015년
단위: 건, 명
한국철도공사, 사상사고 발생현황
사망 사상자 사고건수
철도안전의 중요성
철도 안전 소개
철도사고위험분석
철도
사고위험예측
선로이상 위험예측 프로세스
1. 데이터
엔지니어링
2. 예측모델링
예측
정보
생성
데이터
가공
예측모델
생성
비교검증
모델선
정
3. 운용적용
철도
사고위험예측
 분석범위: 경부고속선
일반선경부고속선경부고속선 일반선 경부고속선
주의 /위험 주의 /위험
 분석대상: KTX와 KTX-산천
 분석데이터 수집기간: 2011년~2015년
*월 1회 / 분기 1회 정기점검으로 결함 정보 부족
선로구간별
정기점검정보
선로구간별
기상정보
선로구간별
유지보수정보
데이터 수집 및 통합
철도
사고위험예측
평 균 5 0 5 . 7 9 6 7
• 다양한 종속변수를 사용하여 모델을 생성하고
테스트한 결과를 바탕으로 설정
• 구간별로 발생하는 결함들의 평균결함면적으로
설정
• 평균결함면적은 결함횟수와 결함면적을 동시에
고려할 수 있음
• 0.1%의 이상치 제거한 데이터의 평균을 기준으
로 주의 (0) / 위험(1) 이항 종속변수 생성
평균 548
데이터가공
모델
생성
검증
종속변수 데이터 가공
철도
사고위험예측
평 균 5 0 5 . 7 9 6 7
• 이전 점검일 사이의 유지보수 관련 정보 가공
이전 점검일 해당 점검일
• 연속적 기상상태의 중요성 (기온, 풍속, 강수량)
3일/ 7일/ 30일 – 평균/최고/최저 기상상태
독립변수 데이터 가공
철도
사고위험예측
로지스틱 회귀분석
• 결함면적을• 결함면적을
• 독립변수(x) – 연속형 / 범주형 포함 : 121 개
기상정보 선로정보 시계열정보
• 다중공선성 분석
1 6 2 7 3 10 4 18 5 22 6 25 7 27 8 31 9 35 10
36 11 39 12 40 13 43 14 45 15 47 16 49 17 50 18
51 19 52 20 53 21 54 22 55 23 56 24 58 25 59 26
60 27 61 28 62 29 63 30 65 31 66 32 67 33 68 34
70 35 71 36 72 37 73 38 74 39 75 40 76 41 77 42
78 43 80 44 81 45 82 46 83 47 85 48 86 49 87 50
88 51 90 52 91 53 92 54 93 55 94 56 95 57 96 58
97 59 98 60 101 61 103 62 104 63 105 64 106 65
107 66 108 67 109 68 120 69 121
121 중 61개의 독립변수 채택
• CONFUSION-MATRIX / ROC 분석
(Receiver-Operating Characteristic curve)
실제위험수준 정확도와 오분류의 관계 설명
예측 정확도 : 70%
Reference
Prediction 위험 주의
위험 1067 327
주의 263 359
철도
사고위험예측
• 결함면적을 • 결함면적을
기상정보
선로
정보 시계열정보
Train data: 800개
• 독립변수(x) – 연속형 / 범주형 포함 : 41 개
Reference
Prediction 위험 주의
위험 235 77
주의 166 322
예측정확도 : 69.75%
Reference
Prediction
위험
위험 주의
주의
서포트 벡터 머신
철도
사고위험예측
• 결함면적을
• 결함면적을
• 결함면적을
예측정확도 : 80.25%
모
델
A
모
델
B
예측정확도 : 71.25%
실제
예측 주의 위험
주의 0 -10
위험 -2 0
실제
예측 주의 위험
주의 343 101
위험 57 299
실제
예측 주의 위험
주의 238 68
위험 162 332
예측정확도 비용-이득
모델 A 80.25% -1,124
모델 B 71.25% -1,004
• 실제로 주의인데 주의로 예측한 경우와 위험인데 위험
으로 예측한 경우, 비용과 이득을 0으로 봄
• 실제로 주의인데 위험으로 예측한 경우 과도한 비용
이 소요될 수 있어 비용을 -2로 측정함
• 실제로 위험인데 주의로 예측한 경우 추가비용이 발생
될 수 있어 비용을 -10으로 보다 높게 측정함
• 모델 A가 예측 정확도 80%로 모델 B보다 높지만,
오분류 결과는 비용발생으로 이어지기 때문에
비용-이득 계산결과가 낮은 모델 B를 채택하였음
비교검증 및 모델선정
철도
사고위험예측
TM
TM
TM
통계 분석, 빅데이터, 웹 포털구축
AS-IS 분석
TO-BE 모델
링
AS-IS/TO-BE
테이블 매핑
이관 개발
이관 검증 이관 테스트 이관 리허설 실제 이관
WISE DQ™
머신러닝
머신러닝
http://data.gg.go.kr
[2016 데이터 그랜드 컨퍼런스] 4 2(인공지능). 위세아이텍 머신러닝플랫폼기반의철도사고위험예측

Más contenido relacionado

Destacado

[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...
[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...
[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...K data
 
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료K data
 
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...K data
 
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남K data
 
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상K data
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
 
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-final
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-final[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-final
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-finalK data
 
저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다eungjin cho
 
Data Science Driven Malware Detection
Data Science Driven Malware DetectionData Science Driven Malware Detection
Data Science Driven Malware DetectionVMware Tanzu
 
[FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview [FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview chanyoonkim
 

Destacado (10)

[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...
[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...
[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...
 
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료
 
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...
 
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남
 
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
 
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-final
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-final[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-final
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-final
 
저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다
 
Data Science Driven Malware Detection
Data Science Driven Malware DetectionData Science Driven Malware Detection
Data Science Driven Malware Detection
 
[FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview [FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview
 

Más de K data

[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향K data
 
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질K data
 
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안K data
 
[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화
[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화
[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화K data
 
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이 데이터정제와품질검증을위한mdm 시스템의기능과역할
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이  데이터정제와품질검증을위한mdm 시스템의기능과역할[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이  데이터정제와품질검증을위한mdm 시스템의기능과역할
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이 데이터정제와품질검증을위한mdm 시스템의기능과역할K data
 
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다K data
 
[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...
[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...
[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...K data
 
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상K data
 
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현K data
 
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략K data
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아K data
 

Más de K data (11)

[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
 
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질
 
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안
 
[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화
[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화
[2016 데이터 그랜드 컨퍼런스] 5 3(보안,품질). nh은행 금융플랫폼을 통한 핀테크 생태계 변화
 
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이 데이터정제와품질검증을위한mdm 시스템의기능과역할
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이  데이터정제와품질검증을위한mdm 시스템의기능과역할[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이  데이터정제와품질검증을위한mdm 시스템의기능과역할
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이 데이터정제와품질검증을위한mdm 시스템의기능과역할
 
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다
 
[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...
[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...
[2016 데이터 그랜드 컨퍼런스] 4 4(인공지능).마인즈랩 인공지능과 virtual assisstant-2016_datagrandcon...
 
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상
 
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현
 
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 

[2016 데이터 그랜드 컨퍼런스] 4 2(인공지능). 위세아이텍 머신러닝플랫폼기반의철도사고위험예측

  • 1. 머신러닝 플랫폼 기반의 철도사고위험예측 2016 데이터 그랜드 컨퍼런스 2016.11.04
  • 2. 1. 철도 안전 소개 2. 철도 사고위험예측 3. WISE ADVISOR 4. WISE 제품과 머신러닝
  • 3. 최근 잇단 열차 탈선 사고로 인해 철도안전의 중요성 대두 105 93 81 75 66 135 115 113 112 46 235 207 182 178 104 0 50 100 150 200 250 2011년 2012년 2013년 2014년 2015년 단위: 건, 명 한국철도공사, 사상사고 발생현황 사망 사상자 사고건수 철도안전의 중요성 철도 안전 소개
  • 5. 선로이상 위험예측 프로세스 1. 데이터 엔지니어링 2. 예측모델링 예측 정보 생성 데이터 가공 예측모델 생성 비교검증 모델선 정 3. 운용적용 철도 사고위험예측
  • 6.  분석범위: 경부고속선 일반선경부고속선경부고속선 일반선 경부고속선 주의 /위험 주의 /위험  분석대상: KTX와 KTX-산천  분석데이터 수집기간: 2011년~2015년 *월 1회 / 분기 1회 정기점검으로 결함 정보 부족 선로구간별 정기점검정보 선로구간별 기상정보 선로구간별 유지보수정보 데이터 수집 및 통합 철도 사고위험예측
  • 7. 평 균 5 0 5 . 7 9 6 7 • 다양한 종속변수를 사용하여 모델을 생성하고 테스트한 결과를 바탕으로 설정 • 구간별로 발생하는 결함들의 평균결함면적으로 설정 • 평균결함면적은 결함횟수와 결함면적을 동시에 고려할 수 있음 • 0.1%의 이상치 제거한 데이터의 평균을 기준으 로 주의 (0) / 위험(1) 이항 종속변수 생성 평균 548 데이터가공 모델 생성 검증 종속변수 데이터 가공 철도 사고위험예측
  • 8. 평 균 5 0 5 . 7 9 6 7 • 이전 점검일 사이의 유지보수 관련 정보 가공 이전 점검일 해당 점검일 • 연속적 기상상태의 중요성 (기온, 풍속, 강수량) 3일/ 7일/ 30일 – 평균/최고/최저 기상상태 독립변수 데이터 가공 철도 사고위험예측
  • 9. 로지스틱 회귀분석 • 결함면적을• 결함면적을 • 독립변수(x) – 연속형 / 범주형 포함 : 121 개 기상정보 선로정보 시계열정보 • 다중공선성 분석 1 6 2 7 3 10 4 18 5 22 6 25 7 27 8 31 9 35 10 36 11 39 12 40 13 43 14 45 15 47 16 49 17 50 18 51 19 52 20 53 21 54 22 55 23 56 24 58 25 59 26 60 27 61 28 62 29 63 30 65 31 66 32 67 33 68 34 70 35 71 36 72 37 73 38 74 39 75 40 76 41 77 42 78 43 80 44 81 45 82 46 83 47 85 48 86 49 87 50 88 51 90 52 91 53 92 54 93 55 94 56 95 57 96 58 97 59 98 60 101 61 103 62 104 63 105 64 106 65 107 66 108 67 109 68 120 69 121 121 중 61개의 독립변수 채택 • CONFUSION-MATRIX / ROC 분석 (Receiver-Operating Characteristic curve) 실제위험수준 정확도와 오분류의 관계 설명 예측 정확도 : 70% Reference Prediction 위험 주의 위험 1067 327 주의 263 359 철도 사고위험예측
  • 10. • 결함면적을 • 결함면적을 기상정보 선로 정보 시계열정보 Train data: 800개 • 독립변수(x) – 연속형 / 범주형 포함 : 41 개 Reference Prediction 위험 주의 위험 235 77 주의 166 322 예측정확도 : 69.75% Reference Prediction 위험 위험 주의 주의 서포트 벡터 머신 철도 사고위험예측
  • 11. • 결함면적을 • 결함면적을 • 결함면적을 예측정확도 : 80.25% 모 델 A 모 델 B 예측정확도 : 71.25% 실제 예측 주의 위험 주의 0 -10 위험 -2 0 실제 예측 주의 위험 주의 343 101 위험 57 299 실제 예측 주의 위험 주의 238 68 위험 162 332 예측정확도 비용-이득 모델 A 80.25% -1,124 모델 B 71.25% -1,004 • 실제로 주의인데 주의로 예측한 경우와 위험인데 위험 으로 예측한 경우, 비용과 이득을 0으로 봄 • 실제로 주의인데 위험으로 예측한 경우 과도한 비용 이 소요될 수 있어 비용을 -2로 측정함 • 실제로 위험인데 주의로 예측한 경우 추가비용이 발생 될 수 있어 비용을 -10으로 보다 높게 측정함 • 모델 A가 예측 정확도 80%로 모델 B보다 높지만, 오분류 결과는 비용발생으로 이어지기 때문에 비용-이득 계산결과가 낮은 모델 B를 채택하였음 비교검증 및 모델선정 철도 사고위험예측
  • 12. TM
  • 13. TM
  • 15.
  • 16. AS-IS 분석 TO-BE 모델 링 AS-IS/TO-BE 테이블 매핑 이관 개발 이관 검증 이관 테스트 이관 리허설 실제 이관