SlideShare a Scribd company logo
1 of 24
농업 빅데이터를 활용한 병해충 발생 예측
: 영주 사과를 대상으로

2013. 11. 29

전채남
(더아이엠씨)

1
목 차
Ⅰ. 연구 배경
Ⅱ. 기존 연구 검토

Ⅲ. 연구모형 및 방법
Ⅳ. 분석 결과

Ⅴ. 결론 및 연구의 한계점

2
Ⅰ. 연구 배경 및 목적
1. 연구 배경
소셜미디어 시대의 도래로 엄청난 데이터들이 다양한 형태로 실시간으로
생성되고 있어 전 산업영역에서 빅데이터 활용이 지속적으로 증가
그러나 농업분야의 빅데이터 활용에 대한 연구가 부족한 편임

사과는 경북이 전국 생산량의 63%를 차지하며(영남일보, 2012),
영주는 전국 최대 사과 생산지로 생산량이 7만여 톤에 이름(매일신문, 2012)

2012년부터 u-IT 기술을 이용하여 온도/습도, 토양수분, 강우여부,
해충 밀도 등과 같은 데이터를 영주의 사과 재배 농가에서 수집 중

3
Ⅰ. 연구 배경 및 목적
2. 연구 목적
본 연구는 농업 데이터를 이용하여 농작물의 작황에 영향을 미치는
요소인 병해충 발생을 예측하는 모델을 개발하는 것이 목적임
기존 연구의 검토를 통해 농업 빅데이터와 병해충 발생을 정의하고
연구모형를 제시한 후 연구문제를 설정함
농업관련 공공데이터와 민간데이터를 수집하고 정제하여 분석함
공공데이터와 민간데이터를 통해 패턴을 발견하고 여러 데이터와
병해충 발생의 상관성을 확인하여 향후 농업 빅데이터 연구의 발전을
위한 기초를 제공

4
Ⅱ. 기존 연구 검토
1. 검색엔진 쿼리 데이터를 이용한 유행성 독감 탐지(Ginsberg, J. et al, 2009)
웹 검색 쿼리의 형식으로 건강 찾기 행동을 모니터링 하는 방법으로
유행성 독감의 초기 탐지를 함
이를 위해 모집단에서 감기와 같은 질병(Influenza-Like Illness)를
추적하는 다수의 구글 검색 쿼리를 분석하는 방법을 제시
어떤 쿼리의 상대적 빈도는 환자가 독감 징후를 표시하는 의원 방문의

퍼센티지와 높게 상관되어 있어 약 하루 정도의 보고 차이를 보이면서 미국
각 지역의 주간 독감 활동의 현재 상황을 정확하게 측정할 수 있음
이런 접근은 웹 검색 이용자의 큰 모집단을 가지고 많은 지역에서 유행성 독
감을 탐지하기 위한 검색 쿼리를 활용하도록 함

5
Ⅱ. 기존 연구 검토
2.맨하탄의 맨홀 사건 예측을 위한 과정(Rudin, C. et al, 2010)
맨홀 사건 예측에 관한 콜롬비아/콘에디슨 프로젝트의 부분으로 개발된 지식
발견과 데이터마이닝 과정을 제시함
이 과정은 전처리의 의미있는 양을 요구하는 잡문서 형식의 생데이터(Raw
Data)를 가지고 우선 순위를 가진 현실 문제를 지원할 수 있음.
문서들은 예측 기준에 따라 순서화된 일련의 사례에 연결되어져 있음
이 연구의 목표는 화재, 폭발, 연기는 맨홀 같은 맨홀 사건의 취양성
(Vulnerability)에 따라 맨하탄(맨홀과 서비스박스)의 전력망 구조를 순서화
하는 것임

순서화 결과는 현재 맨하탄 전력망에 대한 우선 보수 작업을 하도록 사용되어
지고 있음
6
Ⅱ. 기존 연구 검토
3. 빅데이터 분석의 기술마케팅 활용에 관한 연구: 잠재 수요기업
발굴을 중심으로(전채남 외, 2013)
기술마케팅의 잠재 수요기업을 빅데이터를 활용해 발굴 하기 위해 KRISS의
2가지 신기술을 선정하고 데이터를 수집하여 텍스트마이닝과 시맨틱네트워
크분석을 실시 함
신기술과 관련된 분석단어를 통해 빅데이터를 수집하고 분석한 결과, 연결정
도, 연결정도중심성, 빈도 등을 통해 2개의 기술마다 상위 20개의 주요기술을
확인함
시맨틱네트워크분석을 실시하여 공동출현 연결망, 연결 강도, 코사인 유사계
수 등을 통해 2개 기술의 잠재 수요기업 을 발굴함
빅데이터의 활용 분야로 기술마케팅을 선택한 것은 기술시장의 특성으로 잠
재 수요기업의 발굴이 중요하기 때문임
7
Ⅱ. 기존 연구 검토
4. 연구문제

기존 연구 검토를 통해 다음과 같이 두 가지의 연구문제를 도출하였음

웹&SNS의 병해충 핵심어 사전을 활용해 병해충 발생을 예측할 수 있
을까?
기후 데이터를 이용한 적산온도는 병해충 발생을 예측할 수 있을까?
Ⅲ. 연구 모형 및 방법
1. 연구 모형
기후 데이터, u-IT 센서 데이터, 웹&SNS 데이터 등의 패턴을 분석하고
병해충 데이터와 상관성을 통해 농작물의 장황에 영향을 미치는 요소인
병해충 발생의 징후를 발견할 수 있을 것임
<그림 1> 연구모형

Data Set

결과

기후 데이터

u-IT 센서
데이터

병해충 데이터
병해충 징후 발견

웹&SNS
9
Ⅲ. 연구 모형 및 방법
2. 개념 정의
농업 빅데이터
⁃ 빅데이터는 큰 규모를 활용해 더 작은 규모에서는 불가능했던 새로운 통찰이나

새로운 형태의 가치를 추출할 수 있는 데이터(빅토르 마이어 쇤버거 외, 2013)
- 농업 빅데이터는 농업 생산과 관련해 생성되었거나 활용될 수 있는 빅데이터로
기후 데이터, u-IT 센서 데이터, 병해충 데이터, 웹&SNS 텍스트 등이 있음

병해충 발생 예측
⁃ 수집된 빅데이터의 데이터마이닝과 텍스트마이닝 기법을 활용하여 병해충
발생 패턴을 분석하고 병해충과 상관성이 높은 농업 데이터를 찾아 시각화 함
- 병해충과 상관성이 높은 농업 빅데이터를 활용하여 조기에 병해충 징후를
발견할 수 있도록 하여 신속한 방제의사결정을 지원함

10
Ⅲ. 연구 모형 및 방법
3. 데이터
병해충 데이터
○기

간 : 2005 ~ 2012년 (2010년 제외, 7년)

○ 수집방법 : 4~10월까지 5~10일 간격의 해충트랩에 유인된 병해충 수
○ 수집해충 : 복숭아순나방, 복숭아심식나방
○ 자료출처 : 영주시 농업기술센터 제공
기후 데이터
○기

간 : 2005 ~ 2012년

○ 수집방법 : 기상청 영주관측소 일 단위 발표 자료
○ 수집자료 : 평균기온, 최고기온, 최저기온, 평균습도, 일조, 강수량 등
○ 자료출처 : 기상청 홈페이지(http://www.kma.go.kr)
Ⅲ. 연구 모형 및 방법
3. 데이터
U-IT 센서 데이터
○기

간 : 2011년 11월 ~ 2012년

○ 수집범위 : 영주지역 13개 농가 u-IT 센서 데이터
○ 수집자료 : 5~10초 단위 기온, 습도, 토양수분, 해충 수

○ 자료출처 : 영주시청 제공
웹&SNS 데이터
○기

간 : 1998년 ~ 2013년 11월

○ 수집방법 : ‘영주’, ‘병해충’을 키워드로 검색된 데이터
○ 수집도구 : The SCRM
○ 수집범위 : 포털사이트(뉴스, 블로그, 카페) & SNS

12
Ⅲ. 연구 모형 및 방법
4. 웹&SNS 데이터 수집
The SCRM(http//:www.thescrm.co.kr)
- 사회 네트워크적 알고리즘에 기반한 KrKwic 프로그램(박한우, 2004)을

참조하여 기능을 개선한 한국어 기반 빅데이터 일관처리 솔루션
- 어떤 특정한 단어들이 어떤 다른 단어들과 함께 사용됨에 따라 메시지의
의미가 달라질 수 있음에 주목함 (박한우, 2004)
- 문장의 의미 연결을 중시하여 핵심단어들이 동시에 발생하는 빈도를 ‘관계’로

이해하고 동시출현 빈도에 기초한 네트워크 분석을 위한 분석 데이터 생성
- 연구자의 연구 목적에 따라 데이터를 추출하는 것이 아니라 데이터로부터
자연스럽게 등장한 의미들이 개념을 구성함
- 사회 네트워크분석이 가능한 분석 데이터 생성과 텍스트마이닝을 위한

데이터 수집, 정제를 한꺼번에 편리하고 신속하게 일관 처리하는 솔루션

13
Ⅲ. 연구 모형 및 방법
4. 웹&SNS 데이터 수집
자료 수집 및 처리 과정
- The SCRM을 통해 대용량의 비정형 데이터를 수집하고 데이터 처리 및

정제의 정확성을 높이기 위해 단계적 처리 방식을 사용하였음
- 일관처리로 텍스트마이닝까지 실시하여 단어 빈도 수를 계산하였음
<그림 2> 웹&SNS 데이터 수집 및 처리 과정

데이터 수집

데이터 처리/정제

텍스트마이닝

14
Ⅲ. 연구 모형 및 방법
5. 분석 방법
데이터마이닝
- 데이터마이닝이란 데이터로부터 유용한 패턴을 알아내고 그들 사이에서
필요한 관계를 파악하여 데이터에서 필요한 부분의 정보를 구하거나
의사결정을 하게 해주는 지식을 제공하는데 사용되는 수많은 기법
- 데이터마이닝은 단순히 대량의 데이터를 처리하는 기법이 아니고
상호교류적이고 반복적인 프로세스(허준 외, 2001)
- 데이터마이닝은 대용량의 데이터로부터 이들 데이터 내에 존재하는 관계,
패턴, 규칙 등을 탐색하고 모형화함으로써 유용한 지식을 추출하는
일련의 과정(박창이 외, 2008)

15
Ⅲ. 연구 모형 및 방법
5. 분석 방법
텍스트 마이닝
- 대용량의 비정형 데이터에서 숨겨진 패턴이나 키워드 등 유용한 정보를

추출하는 기술
- 문서로부터 구조화된 정보를 추출하여 규칙을 찾아내는 것을 목적으로
데이터베이스에서 문서의 분류 및 군집화, 문서 색인, 문서 여과 및 추천,
대표적 키워드 추출 등에 주로 응용(정근하, 2010)
분석 과정
정보 수집

정보 처리

분석 데이터 생성

정보 분석

병해충 관련 키워드
로 자료 수집

키워드 추출을 위한
데이터셋 준비

빈도수 등으로
주요 키워드 추출

병해충 발생과
상관관계 분석

<그림 3> 병해충 웹&SNS 지수
16
Ⅲ. 연구 모형 및 방법
4. 분석 방법
텍스트 빈도 수

- TF-IDF (Term Frequency – Inverse Document Frequency) 방식
• 어떤 단어가 특정 문서 내에서 얼마나 중요한지 나타내는 통계적 수치
• 정보추출 방법 중 가장 간단하면서도 강력한 방법
• 핵심어 추출, 검색 엔진의 검색 결과의 순위 등에 활용
- TF : 어떤 범위 내의 문서에서 얼마나 자주 등장하는지 나타내는
특정 단어의 빈도수
- DF : 특정한 단어가 일정한 범위의 문서들간의 자주 사용되는 지수
- IDF : DF의 역수

[텍스트 빈도 수 산출 공식]
17
Ⅳ. 분석 결과

<병해충 지수 그래프>

1. 웹&SNS 병해충 핵심어 사전과 병해충 발생
병해충 핵심어는 병해충을 분석단어로 사용하여 웹&SNS 데이터를 수집하여
텍스트마이닝과 소셜네트워크분석(SNA)을 실시하여 도출한 연관성이 높은
단어들이며 병해충 핵심어 사전은 이들의 집합임
<그림 4> 병해충 웹&SNS 지수

18
Ⅳ. 분석 결과
1. 웹&SNS 병해충 핵심어 사전과 병해충 발생
병해충 핵심어는 병해충 발생과 상관성이 있는 것을 보여짐
<그림 5> 병해충 웹&SNS 지수와 병해충 발생의 상관성

19
※ 자료 : 사과병해충종합관리 길잡이(농촌진흥청 사과시험장)

Ⅳ. 분석 결과

2. 기후 데이터와 병해충 발생
적산온도
- 기후와 식생 또는 토양의 관계를 나타내는 기후지수 중 하나
- 해충의 발육에 필요한 온도를 누적하여 계산한 값으로 해충발생시기를
예측 가능
적산온도 공식
- 일유효온도 = 일평균온도 – 발육영점온도
- 일평균온도가 발육영점온도 이하이면 일유효온도는 ‘0’
- 적산온도 = 일유효온도의 누적
구분

복숭아순나방

복숭아심식나방

1세대 발생 최성기

104도

286도

2세대 발생 최성기

490도

1188도

세대기간

알~성충 : 385도

발육영점온도

9.3도

11.6도

산출기준일

초발일

초발일

※ 자료 : 사과병해충종합관리 길잡이(농촌진흥청 사과시험장, 2012)

20
Ⅳ. 분석 결과
2. 기후 데이터와 병해충 발생
적산온도는 병해충 발생과 상관성이 있는 것을 보여짐
<그림 6> 적산온도와 병해충 발생의 상관성

21
Ⅴ. 결론 및 연구의 한계점
1. 결론
The SCRM을 통해 웹&SNS 데이터를 수집하고 정제한 후 텍스트마이닝을
실시하여 병충해 핵심어 사전을 만들고 지수화하여 패턴을 분석하고 병해충
발생과 상관성을 시각화를 통해 분석함
병해충 핵심어는 병해충 발생과 상관성이 있는 것으로 보여짐
연구 문제를 해결하기 위해 관련 공공 농업 빅데이터인 기후 데이터를 수집
하여 정제하고 처리한 후 데이터마이닝을 통해 적산온도를 산출하여 데이터

의 패턴을 분석하고 병해충 발생과 상관성을 시각화를 통해 분석함
적산온도는 병해충 발생과 상관성이 있는 것으로 보여짐
Ⅴ. 결론 및 연구의 한계점
2. 연구의 한계점
농업 빅데이터 수집의 어려움과 수집된 데이터의 정확성에 문제가 있음
농업에 특화된 병해충 비정형 데이터의 양 부족과 핵심어 사전 구축을 위한
텍스트의 부족
핵심어 사전 구축 후 병해충 발생과 웹&SNS 병해충 지수의 장기적인 상관성
분석이 필요함
기존 연구의 부족과 다양한 데이터의 통합을 위한 데이터마이닝 알고리즘의
정교화가 부족함
참고문헌
박창이, 김용대, 김진석, 송종우, 최호식(2011), R을 이용한 데이터마이닝, 교우사
박한우, Leydesdorff, L.(2004), 한국어의 내용분석을 위한 KrKwic 프로그램의 이해와 적용 :
Daum.net에서 제공된 지역혁신에 관한 뉴스를 대상으로, Journal of the Korean Data
Analysis Society , Vol,6(5)
이지연 역(2013), 빅데이터 : 빅데이터가 만드는 세상, 21세기북스, Viktor Mayer-Schönberger,
Kenneth Cukier (2013), Big Data: A Revolution That Will Transform How We Live,
Work, and Think, JohnMurrayPublishers,Ltd.
전채남, 서일원(2013), 빅데이터 분석의 기술마케팅 활용에 관한 연구 : 잠재 수요기업 발굴을 중심
으로, 마케팅논집 58호, pp.181-203

정근하(2011), 텍스트마이닝과 네트워크분석을 활용한 미래예측 방법 연구, 한국과학기술기획평가원
허준, 최병주(2001), 클레멘타인을 이용한 데이터마이닝, 허준, 최병주, SPSS아카데미
Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S., Brilliant, L.,(2009),
Detecting influenza epidemics using search engine query data, Nature 457,
http://dx.doi.org/10.1038/nature07634

Rudin, C., Passonneau, R. J., Radeva, A., Dutta, H., Ierome, S., Isaac, D.,(2010), A process for
predicting manhole events in Manhanttan, Mach Learn 80, pp.1-31
24

More Related Content

Viewers also liked

Analyzing Big Data to Discover Honest Signals of Innovation
Analyzing Big Data to Discover Honest Signals of InnovationAnalyzing Big Data to Discover Honest Signals of Innovation
Analyzing Big Data to Discover Honest Signals of Innovationdatasciencekorea
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원datasciencekorea
 
온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호
온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호
온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호datasciencekorea
 
A Unified Music Recommender System Using Listening Habits and Semantics of Tags
A Unified Music Recommender System Using Listening Habits and Semantics of TagsA Unified Music Recommender System Using Listening Habits and Semantics of Tags
A Unified Music Recommender System Using Listening Habits and Semantics of Tagsdatasciencekorea
 
소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점
소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점
소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점datasciencekorea
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선datasciencekorea
 
Structures of Twitter Crowds and Conversations Six distinct types of crowds t...
Structures of Twitter Crowds and Conversations Six distinct types of crowds t...Structures of Twitter Crowds and Conversations Six distinct types of crowds t...
Structures of Twitter Crowds and Conversations Six distinct types of crowds t...datasciencekorea
 
국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603
국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603
국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603datasciencekorea
 
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석datasciencekorea
 
Data Centric Art, Science, and Humanities
Data Centric Art, Science, and HumanitiesData Centric Art, Science, and Humanities
Data Centric Art, Science, and Humanitiesdatasciencekorea
 
DATA CENTRIC EDUCATION & LEARNING
 DATA CENTRIC EDUCATION & LEARNING DATA CENTRIC EDUCATION & LEARNING
DATA CENTRIC EDUCATION & LEARNINGdatasciencekorea
 
R의 이해와 활용_데이터사이언스학회
R의 이해와 활용_데이터사이언스학회R의 이해와 활용_데이터사이언스학회
R의 이해와 활용_데이터사이언스학회datasciencekorea
 
도시의 마음, 그 발현 - Emergent Mind of City
도시의 마음, 그 발현 - Emergent Mind of City도시의 마음, 그 발현 - Emergent Mind of City
도시의 마음, 그 발현 - Emergent Mind of Citydatasciencekorea
 
International Collaboration Networks in the Emerging (Big) Data Science
International Collaboration Networks in the Emerging (Big) Data ScienceInternational Collaboration Networks in the Emerging (Big) Data Science
International Collaboration Networks in the Emerging (Big) Data Sciencedatasciencekorea
 
텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남datasciencekorea
 
Data-driven biomedical science: implications for human disease and public health
Data-driven biomedical science: implications for human disease and public healthData-driven biomedical science: implications for human disease and public health
Data-driven biomedical science: implications for human disease and public healthdatasciencekorea
 
소셜미디어 분석방법론과 사례
소셜미디어 분석방법론과 사례소셜미디어 분석방법론과 사례
소셜미디어 분석방법론과 사례datasciencekorea
 
데이터 시각화의 글로벌 동향 20140819 - 고영혁
데이터 시각화의 글로벌 동향   20140819 - 고영혁데이터 시각화의 글로벌 동향   20140819 - 고영혁
데이터 시각화의 글로벌 동향 20140819 - 고영혁datasciencekorea
 
스마트 시티의 빅데이터 분석론 - 최준영
스마트 시티의 빅데이터 분석론 - 최준영스마트 시티의 빅데이터 분석론 - 최준영
스마트 시티의 빅데이터 분석론 - 최준영datasciencekorea
 
Bayesian Network 을 활용한 예측 분석
Bayesian Network 을 활용한 예측 분석Bayesian Network 을 활용한 예측 분석
Bayesian Network 을 활용한 예측 분석datasciencekorea
 

Viewers also liked (20)

Analyzing Big Data to Discover Honest Signals of Innovation
Analyzing Big Data to Discover Honest Signals of InnovationAnalyzing Big Data to Discover Honest Signals of Innovation
Analyzing Big Data to Discover Honest Signals of Innovation
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
 
온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호
온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호
온라인 데이터 분석을 통한 선거예측- 김찬우, 조인호
 
A Unified Music Recommender System Using Listening Habits and Semantics of Tags
A Unified Music Recommender System Using Listening Habits and Semantics of TagsA Unified Music Recommender System Using Listening Habits and Semantics of Tags
A Unified Music Recommender System Using Listening Habits and Semantics of Tags
 
소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점
소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점
소셜 텍스트 빅 테이터를 통해 분석한 화장품 유통구조 시사점
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
 
Structures of Twitter Crowds and Conversations Six distinct types of crowds t...
Structures of Twitter Crowds and Conversations Six distinct types of crowds t...Structures of Twitter Crowds and Conversations Six distinct types of crowds t...
Structures of Twitter Crowds and Conversations Six distinct types of crowds t...
 
국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603
국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603
국가의 신성장 동력으로서 공간정보의 가치와 활용 2016-0603
 
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
 
Data Centric Art, Science, and Humanities
Data Centric Art, Science, and HumanitiesData Centric Art, Science, and Humanities
Data Centric Art, Science, and Humanities
 
DATA CENTRIC EDUCATION & LEARNING
 DATA CENTRIC EDUCATION & LEARNING DATA CENTRIC EDUCATION & LEARNING
DATA CENTRIC EDUCATION & LEARNING
 
R의 이해와 활용_데이터사이언스학회
R의 이해와 활용_데이터사이언스학회R의 이해와 활용_데이터사이언스학회
R의 이해와 활용_데이터사이언스학회
 
도시의 마음, 그 발현 - Emergent Mind of City
도시의 마음, 그 발현 - Emergent Mind of City도시의 마음, 그 발현 - Emergent Mind of City
도시의 마음, 그 발현 - Emergent Mind of City
 
International Collaboration Networks in the Emerging (Big) Data Science
International Collaboration Networks in the Emerging (Big) Data ScienceInternational Collaboration Networks in the Emerging (Big) Data Science
International Collaboration Networks in the Emerging (Big) Data Science
 
텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남
 
Data-driven biomedical science: implications for human disease and public health
Data-driven biomedical science: implications for human disease and public healthData-driven biomedical science: implications for human disease and public health
Data-driven biomedical science: implications for human disease and public health
 
소셜미디어 분석방법론과 사례
소셜미디어 분석방법론과 사례소셜미디어 분석방법론과 사례
소셜미디어 분석방법론과 사례
 
데이터 시각화의 글로벌 동향 20140819 - 고영혁
데이터 시각화의 글로벌 동향   20140819 - 고영혁데이터 시각화의 글로벌 동향   20140819 - 고영혁
데이터 시각화의 글로벌 동향 20140819 - 고영혁
 
스마트 시티의 빅데이터 분석론 - 최준영
스마트 시티의 빅데이터 분석론 - 최준영스마트 시티의 빅데이터 분석론 - 최준영
스마트 시티의 빅데이터 분석론 - 최준영
 
Bayesian Network 을 활용한 예측 분석
Bayesian Network 을 활용한 예측 분석Bayesian Network 을 활용한 예측 분석
Bayesian Network 을 활용한 예측 분석
 

Similar to 농업 빅데이터를 활용한 병해충 발생 예측 모형

Inu x corps big idea contest_6팀 체커스
Inu x corps big idea contest_6팀 체커스Inu x corps big idea contest_6팀 체커스
Inu x corps big idea contest_6팀 체커스TaeHwanKim61
 
[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나
[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나
[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나Cyram Inc
 
웹보메트릭스02 1
웹보메트릭스02 1웹보메트릭스02 1
웹보메트릭스02 1Inho Cho
 
웹보메트릭스와 계량정보학02 1
웹보메트릭스와 계량정보학02 1웹보메트릭스와 계량정보학02 1
웹보메트릭스와 계량정보학02 1Han Woo PARK
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04Suntae Kim
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)Han Woo PARK
 
계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.Han Woo PARK
 
고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 JM code group
 
[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712Sunghun Bae
 
인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009Han Woo PARK
 
데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출SRCDSC
 
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안메가트렌드랩 megatrendlab
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data AnalysisMyunggoon Choi
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Dataymchu88
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Dataymchu88
 
연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관
연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관
연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관Suntae Kim
 
박한우 빅데이터 기술이전 특허소개
박한우 빅데이터 기술이전 특허소개박한우 빅데이터 기술이전 특허소개
박한우 빅데이터 기술이전 특허소개Han Woo PARK
 

Similar to 농업 빅데이터를 활용한 병해충 발생 예측 모형 (20)

Inu x corps big idea contest_6팀 체커스
Inu x corps big idea contest_6팀 체커스Inu x corps big idea contest_6팀 체커스
Inu x corps big idea contest_6팀 체커스
 
빅데이터
빅데이터빅데이터
빅데이터
 
[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나
[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나
[발표자료] 190401 논문 정보 수집과 연구 동향 분석 세미나
 
웹보메트릭스02 1
웹보메트릭스02 1웹보메트릭스02 1
웹보메트릭스02 1
 
웹보메트릭스와 계량정보학02 1
웹보메트릭스와 계량정보학02 1웹보메트릭스와 계량정보학02 1
웹보메트릭스와 계량정보학02 1
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
 
계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.
 
고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주
 
[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712
 
인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009
 
데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출
 
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Data
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Data
 
연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관
연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관
연구패러다임 변화와-데이터-집중-과학 국립해양생물자원관
 
박한우 빅데이터 기술이전 특허소개
박한우 빅데이터 기술이전 특허소개박한우 빅데이터 기술이전 특허소개
박한우 빅데이터 기술이전 특허소개
 

농업 빅데이터를 활용한 병해충 발생 예측 모형

  • 1. 농업 빅데이터를 활용한 병해충 발생 예측 : 영주 사과를 대상으로 2013. 11. 29 전채남 (더아이엠씨) 1
  • 2. 목 차 Ⅰ. 연구 배경 Ⅱ. 기존 연구 검토 Ⅲ. 연구모형 및 방법 Ⅳ. 분석 결과 Ⅴ. 결론 및 연구의 한계점 2
  • 3. Ⅰ. 연구 배경 및 목적 1. 연구 배경 소셜미디어 시대의 도래로 엄청난 데이터들이 다양한 형태로 실시간으로 생성되고 있어 전 산업영역에서 빅데이터 활용이 지속적으로 증가 그러나 농업분야의 빅데이터 활용에 대한 연구가 부족한 편임 사과는 경북이 전국 생산량의 63%를 차지하며(영남일보, 2012), 영주는 전국 최대 사과 생산지로 생산량이 7만여 톤에 이름(매일신문, 2012) 2012년부터 u-IT 기술을 이용하여 온도/습도, 토양수분, 강우여부, 해충 밀도 등과 같은 데이터를 영주의 사과 재배 농가에서 수집 중 3
  • 4. Ⅰ. 연구 배경 및 목적 2. 연구 목적 본 연구는 농업 데이터를 이용하여 농작물의 작황에 영향을 미치는 요소인 병해충 발생을 예측하는 모델을 개발하는 것이 목적임 기존 연구의 검토를 통해 농업 빅데이터와 병해충 발생을 정의하고 연구모형를 제시한 후 연구문제를 설정함 농업관련 공공데이터와 민간데이터를 수집하고 정제하여 분석함 공공데이터와 민간데이터를 통해 패턴을 발견하고 여러 데이터와 병해충 발생의 상관성을 확인하여 향후 농업 빅데이터 연구의 발전을 위한 기초를 제공 4
  • 5. Ⅱ. 기존 연구 검토 1. 검색엔진 쿼리 데이터를 이용한 유행성 독감 탐지(Ginsberg, J. et al, 2009) 웹 검색 쿼리의 형식으로 건강 찾기 행동을 모니터링 하는 방법으로 유행성 독감의 초기 탐지를 함 이를 위해 모집단에서 감기와 같은 질병(Influenza-Like Illness)를 추적하는 다수의 구글 검색 쿼리를 분석하는 방법을 제시 어떤 쿼리의 상대적 빈도는 환자가 독감 징후를 표시하는 의원 방문의 퍼센티지와 높게 상관되어 있어 약 하루 정도의 보고 차이를 보이면서 미국 각 지역의 주간 독감 활동의 현재 상황을 정확하게 측정할 수 있음 이런 접근은 웹 검색 이용자의 큰 모집단을 가지고 많은 지역에서 유행성 독 감을 탐지하기 위한 검색 쿼리를 활용하도록 함 5
  • 6. Ⅱ. 기존 연구 검토 2.맨하탄의 맨홀 사건 예측을 위한 과정(Rudin, C. et al, 2010) 맨홀 사건 예측에 관한 콜롬비아/콘에디슨 프로젝트의 부분으로 개발된 지식 발견과 데이터마이닝 과정을 제시함 이 과정은 전처리의 의미있는 양을 요구하는 잡문서 형식의 생데이터(Raw Data)를 가지고 우선 순위를 가진 현실 문제를 지원할 수 있음. 문서들은 예측 기준에 따라 순서화된 일련의 사례에 연결되어져 있음 이 연구의 목표는 화재, 폭발, 연기는 맨홀 같은 맨홀 사건의 취양성 (Vulnerability)에 따라 맨하탄(맨홀과 서비스박스)의 전력망 구조를 순서화 하는 것임 순서화 결과는 현재 맨하탄 전력망에 대한 우선 보수 작업을 하도록 사용되어 지고 있음 6
  • 7. Ⅱ. 기존 연구 검토 3. 빅데이터 분석의 기술마케팅 활용에 관한 연구: 잠재 수요기업 발굴을 중심으로(전채남 외, 2013) 기술마케팅의 잠재 수요기업을 빅데이터를 활용해 발굴 하기 위해 KRISS의 2가지 신기술을 선정하고 데이터를 수집하여 텍스트마이닝과 시맨틱네트워 크분석을 실시 함 신기술과 관련된 분석단어를 통해 빅데이터를 수집하고 분석한 결과, 연결정 도, 연결정도중심성, 빈도 등을 통해 2개의 기술마다 상위 20개의 주요기술을 확인함 시맨틱네트워크분석을 실시하여 공동출현 연결망, 연결 강도, 코사인 유사계 수 등을 통해 2개 기술의 잠재 수요기업 을 발굴함 빅데이터의 활용 분야로 기술마케팅을 선택한 것은 기술시장의 특성으로 잠 재 수요기업의 발굴이 중요하기 때문임 7
  • 8. Ⅱ. 기존 연구 검토 4. 연구문제 기존 연구 검토를 통해 다음과 같이 두 가지의 연구문제를 도출하였음 웹&SNS의 병해충 핵심어 사전을 활용해 병해충 발생을 예측할 수 있 을까? 기후 데이터를 이용한 적산온도는 병해충 발생을 예측할 수 있을까?
  • 9. Ⅲ. 연구 모형 및 방법 1. 연구 모형 기후 데이터, u-IT 센서 데이터, 웹&SNS 데이터 등의 패턴을 분석하고 병해충 데이터와 상관성을 통해 농작물의 장황에 영향을 미치는 요소인 병해충 발생의 징후를 발견할 수 있을 것임 <그림 1> 연구모형 Data Set 결과 기후 데이터 u-IT 센서 데이터 병해충 데이터 병해충 징후 발견 웹&SNS 9
  • 10. Ⅲ. 연구 모형 및 방법 2. 개념 정의 농업 빅데이터 ⁃ 빅데이터는 큰 규모를 활용해 더 작은 규모에서는 불가능했던 새로운 통찰이나 새로운 형태의 가치를 추출할 수 있는 데이터(빅토르 마이어 쇤버거 외, 2013) - 농업 빅데이터는 농업 생산과 관련해 생성되었거나 활용될 수 있는 빅데이터로 기후 데이터, u-IT 센서 데이터, 병해충 데이터, 웹&SNS 텍스트 등이 있음 병해충 발생 예측 ⁃ 수집된 빅데이터의 데이터마이닝과 텍스트마이닝 기법을 활용하여 병해충 발생 패턴을 분석하고 병해충과 상관성이 높은 농업 데이터를 찾아 시각화 함 - 병해충과 상관성이 높은 농업 빅데이터를 활용하여 조기에 병해충 징후를 발견할 수 있도록 하여 신속한 방제의사결정을 지원함 10
  • 11. Ⅲ. 연구 모형 및 방법 3. 데이터 병해충 데이터 ○기 간 : 2005 ~ 2012년 (2010년 제외, 7년) ○ 수집방법 : 4~10월까지 5~10일 간격의 해충트랩에 유인된 병해충 수 ○ 수집해충 : 복숭아순나방, 복숭아심식나방 ○ 자료출처 : 영주시 농업기술센터 제공 기후 데이터 ○기 간 : 2005 ~ 2012년 ○ 수집방법 : 기상청 영주관측소 일 단위 발표 자료 ○ 수집자료 : 평균기온, 최고기온, 최저기온, 평균습도, 일조, 강수량 등 ○ 자료출처 : 기상청 홈페이지(http://www.kma.go.kr)
  • 12. Ⅲ. 연구 모형 및 방법 3. 데이터 U-IT 센서 데이터 ○기 간 : 2011년 11월 ~ 2012년 ○ 수집범위 : 영주지역 13개 농가 u-IT 센서 데이터 ○ 수집자료 : 5~10초 단위 기온, 습도, 토양수분, 해충 수 ○ 자료출처 : 영주시청 제공 웹&SNS 데이터 ○기 간 : 1998년 ~ 2013년 11월 ○ 수집방법 : ‘영주’, ‘병해충’을 키워드로 검색된 데이터 ○ 수집도구 : The SCRM ○ 수집범위 : 포털사이트(뉴스, 블로그, 카페) & SNS 12
  • 13. Ⅲ. 연구 모형 및 방법 4. 웹&SNS 데이터 수집 The SCRM(http//:www.thescrm.co.kr) - 사회 네트워크적 알고리즘에 기반한 KrKwic 프로그램(박한우, 2004)을 참조하여 기능을 개선한 한국어 기반 빅데이터 일관처리 솔루션 - 어떤 특정한 단어들이 어떤 다른 단어들과 함께 사용됨에 따라 메시지의 의미가 달라질 수 있음에 주목함 (박한우, 2004) - 문장의 의미 연결을 중시하여 핵심단어들이 동시에 발생하는 빈도를 ‘관계’로 이해하고 동시출현 빈도에 기초한 네트워크 분석을 위한 분석 데이터 생성 - 연구자의 연구 목적에 따라 데이터를 추출하는 것이 아니라 데이터로부터 자연스럽게 등장한 의미들이 개념을 구성함 - 사회 네트워크분석이 가능한 분석 데이터 생성과 텍스트마이닝을 위한 데이터 수집, 정제를 한꺼번에 편리하고 신속하게 일관 처리하는 솔루션 13
  • 14. Ⅲ. 연구 모형 및 방법 4. 웹&SNS 데이터 수집 자료 수집 및 처리 과정 - The SCRM을 통해 대용량의 비정형 데이터를 수집하고 데이터 처리 및 정제의 정확성을 높이기 위해 단계적 처리 방식을 사용하였음 - 일관처리로 텍스트마이닝까지 실시하여 단어 빈도 수를 계산하였음 <그림 2> 웹&SNS 데이터 수집 및 처리 과정 데이터 수집 데이터 처리/정제 텍스트마이닝 14
  • 15. Ⅲ. 연구 모형 및 방법 5. 분석 방법 데이터마이닝 - 데이터마이닝이란 데이터로부터 유용한 패턴을 알아내고 그들 사이에서 필요한 관계를 파악하여 데이터에서 필요한 부분의 정보를 구하거나 의사결정을 하게 해주는 지식을 제공하는데 사용되는 수많은 기법 - 데이터마이닝은 단순히 대량의 데이터를 처리하는 기법이 아니고 상호교류적이고 반복적인 프로세스(허준 외, 2001) - 데이터마이닝은 대용량의 데이터로부터 이들 데이터 내에 존재하는 관계, 패턴, 규칙 등을 탐색하고 모형화함으로써 유용한 지식을 추출하는 일련의 과정(박창이 외, 2008) 15
  • 16. Ⅲ. 연구 모형 및 방법 5. 분석 방법 텍스트 마이닝 - 대용량의 비정형 데이터에서 숨겨진 패턴이나 키워드 등 유용한 정보를 추출하는 기술 - 문서로부터 구조화된 정보를 추출하여 규칙을 찾아내는 것을 목적으로 데이터베이스에서 문서의 분류 및 군집화, 문서 색인, 문서 여과 및 추천, 대표적 키워드 추출 등에 주로 응용(정근하, 2010) 분석 과정 정보 수집 정보 처리 분석 데이터 생성 정보 분석 병해충 관련 키워드 로 자료 수집 키워드 추출을 위한 데이터셋 준비 빈도수 등으로 주요 키워드 추출 병해충 발생과 상관관계 분석 <그림 3> 병해충 웹&SNS 지수 16
  • 17. Ⅲ. 연구 모형 및 방법 4. 분석 방법 텍스트 빈도 수 - TF-IDF (Term Frequency – Inverse Document Frequency) 방식 • 어떤 단어가 특정 문서 내에서 얼마나 중요한지 나타내는 통계적 수치 • 정보추출 방법 중 가장 간단하면서도 강력한 방법 • 핵심어 추출, 검색 엔진의 검색 결과의 순위 등에 활용 - TF : 어떤 범위 내의 문서에서 얼마나 자주 등장하는지 나타내는 특정 단어의 빈도수 - DF : 특정한 단어가 일정한 범위의 문서들간의 자주 사용되는 지수 - IDF : DF의 역수 [텍스트 빈도 수 산출 공식] 17
  • 18. Ⅳ. 분석 결과 <병해충 지수 그래프> 1. 웹&SNS 병해충 핵심어 사전과 병해충 발생 병해충 핵심어는 병해충을 분석단어로 사용하여 웹&SNS 데이터를 수집하여 텍스트마이닝과 소셜네트워크분석(SNA)을 실시하여 도출한 연관성이 높은 단어들이며 병해충 핵심어 사전은 이들의 집합임 <그림 4> 병해충 웹&SNS 지수 18
  • 19. Ⅳ. 분석 결과 1. 웹&SNS 병해충 핵심어 사전과 병해충 발생 병해충 핵심어는 병해충 발생과 상관성이 있는 것을 보여짐 <그림 5> 병해충 웹&SNS 지수와 병해충 발생의 상관성 19
  • 20. ※ 자료 : 사과병해충종합관리 길잡이(농촌진흥청 사과시험장) Ⅳ. 분석 결과 2. 기후 데이터와 병해충 발생 적산온도 - 기후와 식생 또는 토양의 관계를 나타내는 기후지수 중 하나 - 해충의 발육에 필요한 온도를 누적하여 계산한 값으로 해충발생시기를 예측 가능 적산온도 공식 - 일유효온도 = 일평균온도 – 발육영점온도 - 일평균온도가 발육영점온도 이하이면 일유효온도는 ‘0’ - 적산온도 = 일유효온도의 누적 구분 복숭아순나방 복숭아심식나방 1세대 발생 최성기 104도 286도 2세대 발생 최성기 490도 1188도 세대기간 알~성충 : 385도 발육영점온도 9.3도 11.6도 산출기준일 초발일 초발일 ※ 자료 : 사과병해충종합관리 길잡이(농촌진흥청 사과시험장, 2012) 20
  • 21. Ⅳ. 분석 결과 2. 기후 데이터와 병해충 발생 적산온도는 병해충 발생과 상관성이 있는 것을 보여짐 <그림 6> 적산온도와 병해충 발생의 상관성 21
  • 22. Ⅴ. 결론 및 연구의 한계점 1. 결론 The SCRM을 통해 웹&SNS 데이터를 수집하고 정제한 후 텍스트마이닝을 실시하여 병충해 핵심어 사전을 만들고 지수화하여 패턴을 분석하고 병해충 발생과 상관성을 시각화를 통해 분석함 병해충 핵심어는 병해충 발생과 상관성이 있는 것으로 보여짐 연구 문제를 해결하기 위해 관련 공공 농업 빅데이터인 기후 데이터를 수집 하여 정제하고 처리한 후 데이터마이닝을 통해 적산온도를 산출하여 데이터 의 패턴을 분석하고 병해충 발생과 상관성을 시각화를 통해 분석함 적산온도는 병해충 발생과 상관성이 있는 것으로 보여짐
  • 23. Ⅴ. 결론 및 연구의 한계점 2. 연구의 한계점 농업 빅데이터 수집의 어려움과 수집된 데이터의 정확성에 문제가 있음 농업에 특화된 병해충 비정형 데이터의 양 부족과 핵심어 사전 구축을 위한 텍스트의 부족 핵심어 사전 구축 후 병해충 발생과 웹&SNS 병해충 지수의 장기적인 상관성 분석이 필요함 기존 연구의 부족과 다양한 데이터의 통합을 위한 데이터마이닝 알고리즘의 정교화가 부족함
  • 24. 참고문헌 박창이, 김용대, 김진석, 송종우, 최호식(2011), R을 이용한 데이터마이닝, 교우사 박한우, Leydesdorff, L.(2004), 한국어의 내용분석을 위한 KrKwic 프로그램의 이해와 적용 : Daum.net에서 제공된 지역혁신에 관한 뉴스를 대상으로, Journal of the Korean Data Analysis Society , Vol,6(5) 이지연 역(2013), 빅데이터 : 빅데이터가 만드는 세상, 21세기북스, Viktor Mayer-Schönberger, Kenneth Cukier (2013), Big Data: A Revolution That Will Transform How We Live, Work, and Think, JohnMurrayPublishers,Ltd. 전채남, 서일원(2013), 빅데이터 분석의 기술마케팅 활용에 관한 연구 : 잠재 수요기업 발굴을 중심 으로, 마케팅논집 58호, pp.181-203 정근하(2011), 텍스트마이닝과 네트워크분석을 활용한 미래예측 방법 연구, 한국과학기술기획평가원 허준, 최병주(2001), 클레멘타인을 이용한 데이터마이닝, 허준, 최병주, SPSS아카데미 Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S., Brilliant, L.,(2009), Detecting influenza epidemics using search engine query data, Nature 457, http://dx.doi.org/10.1038/nature07634 Rudin, C., Passonneau, R. J., Radeva, A., Dutta, H., Ierome, S., Isaac, D.,(2010), A process for predicting manhole events in Manhanttan, Mach Learn 80, pp.1-31 24