SlideShare una empresa de Scribd logo
1 de 22
Descargar para leer sin conexión
[빅 데이터 분석] 무엇을 분석해야 하는가?
빅 데이터든 아니면 스몰 데이터든 결국은 [ 데이터 분석] 이라는 점이다. 따라서
우선은 데이터 분석에서 무엇이 대상이 되어야 하는가를 먼저 생각하고 넘어가는
것이 순서일 것이다.
빅 데이터 분석(Big Data Analysis)은 꽤나 인기있는 화두 하지만 막상 구체
적인 질문에 들어가면 아직은 별 명쾌한 대답을 구체적으로들 풀어내지 못
하고 있는 것이 현실이다. 심지어는 무엇이 빅 데이터 이며 왜 빅 데이터를
고민해야 하는가에 대해서 조차 그렇다. 그 때문에 언제나 그리고 얼마나 큰
가치를 빅 데이터 분석으로 부터 우리가 얻게 될 것인지에 대해 판단이 쉽질
않다.
고민하며
[Dimension 1] 육하원칙 5W1H
누가 - 고객, 직원, 점포, 라인
무엇을 - 상품, 서비스, 구매, 이용, 부품, 자재, 시설, 이상, 고장
언제 - 계절, 시간, 요일, 행사
어디서 - 지역, 국가, 건물
어떻게 - 채널, 지불수단, 만족, 속도
왜 - 좋아서, 불안해서, 편해서, 기분이 나빠서, 우울해서, ...
분석의 대상을 찾기 위해 고려할 수 있는 세가지 축과
두가지 추가적인 차원
[Dimension 2] 탐색적 데이터 분석의 유형
구조, 구성
차이, 변화, 반복, 주기
속도, 경로
진위, 영향
[Dimension 3] Value Chain상의 기능
결국 일반적인 기업내의 활동에서의 기능 영역의 범위가 어디인가를
의미한다.
(특히 기업에서의 활용 측면에서 보는 경우)
고객관리, 채널관리, 품질관리, 마케팅, 서비스, 자재관리, 인력관리
Mktg, SVC/CS, CRM, SCM, QM, ...
어떤 분야에 적용하려는가
[Additional Dimensions ] 그리고 두가지 추가적인 고려사항
과거, 현재, 미래 중 언제에 대한 분석 결과가 나와야 하는가
과거 중에서도 최근, 그리고 미래 중에서도 단기 미래라는 세부적인 시점에 대
한 판단이 필요
어떻게 활용할 것인가와 그에 따른 우선순위
분석결과로 찾아낸 지식과 정보를 어떤 활동에 적용할 것인가? 어떤 Action을
취할 수 있는가?
어떤 의사결정을 내릴 수 있는가?
누구에게 유용한 정보가 될 것인가?
그리고 우선순위는 상대적으로? (유용성, 시급성, 복잡도, 기타 제약사항. 예를
들면 데이터가 존재하는가와 같은) 수많은 분석 대상중 더 우선적인 것은 무
엇인가?
분석결과의 예
오늘은 남성 특히 회사원 층의 사람들이 강남역 근처에서 회식을 많이 하지
않을 것이다. 이 들은 다음주로 모임을 많이 미룰 것이며 화요일 모임이 특히
많을 것이다.
이를 찾아내기 위해서는 사전에 누가 언제 어디서 무엇을 할 것이며 대신 어떤
일이 다음에 벌어질 것인가로 구성된 분석이 미리 이루어져야 할 것이다. 이 분
석의 대상 영역은 마케팅, 그리고 중요도는 높다는 식의 판단도 따라야 할 것이
다.
빅데이터 분석의 대상 주제의 예는?
독감은 어떤 경로로 (어떤 속도로) 확산되는가?
구글이 독감을 예보한다. 그것도 미국 보건당국보다 더 빠르게.
황당하게 들릴 수 있지만 사실이다. 구글은 독감 증세 환자가 늘면 ‘감기’와 관
련된 단어를 검색하는 빈도가 함께 증가한다는 패턴을 발견했다. 이를 미국 질
병통제예방센터 데이터와 비교해본 결과 검색 빈도와 실제 독감 증세를 보인
환자 숫자 사이에 밀접한 상관관계가 있다는 사실을 밝혀냈다. 구글은 이 같은
분석을 바탕으로 웹사이트를 통해 시간 및 지역별 독감 유행 정보를 미국 보
건당국보다 한발 앞서 제공하고 있다.
구글이 이처럼 정부 당국보다 앞서 정보를 분석할 수 있는 이유는 수많은 사
용자들이 인터넷에 온갖 종류의 흔적을 남기기 때문이다. 인터넷에 접속해 이
뤄지는 모든 행동은 일종의 상호작용이다. 가령 특정 웹사이트에 로그인을 하
거나 게시물을 읽을 경우 해당 웹사이트 서버에 요청 기록이 남는다. 실로 막
대한 양의 정보들이 쌓이는 것이다. 기업들 사이에서는 이 같은 정보를 분석해
유의미한 정보를 만들어내려는 시도가 이어지고 있다. 기본적인 통계는 물론
미래를 예측하려는 움직임도 있다. 이른바 ‘빅 데이터’의 시대다.
기사중...
독감예측의 의의
독감의 확산에 대한 분석이 분석 대상 주제로 유용했던 이유는 무엇일까?
독감 확산이야 어차피 정부기관들에서 사후적으로는 통계가 나올 것이겠지
만 핵심은 독감 확산을 정부기관보다도 더 '먼저', 즉, 누구보다 빨리 파악할
수 있었기 때문.
그렇다면 더 먼저 파악할 수 있었던 이유는 무엇일까? 통상 빅 데이터라
고 부르는 종류의 데이터는 실시간 그리고 사람들의 검색이나 소셜네트워
크 등에서 에서 포착되는 비정형적인 새로운 데이터들이 반영될 수 있기
때문. 얼마나 빨리 정보를 생산할 수 있는가 그리고 당장 유용한 정보를 찾
아낼 수 있는가가 중요한 요인Nearest realtime information, most recent
update 여기에 사람들이 가치를 부여한다는 사실
현재 내지는 초단기적인 미래에 대한 정보가 더 가치있는 정보가 되는 경
우가 많다는 점이다.
이는 결코 마케팅이나 커뮤니케이션의 사이클이 짧아진다는 점 즉, 정보의
생산과 유통이 이루어지는 사이클이 짧아진다는 점과 무관하지 않다. 이 처
럼 생산 유통의 사이클이 짧아지면서 정보의 유효기간(또는 유통기간)이
함께 짧아진다.
시사점
독감의 확산이라는 분석이 누구에게 어떤 식으로 가치를 주었는가를 짚어볼
필요가 있을 듯 하다. 분석을 수행한 것은 구글. 검색업체이다. 하지만 그 정보
를 필요로 하는 곳은 일차적으로는 일반 개인들일 수 있다. 검색의 사용자라서
가 아니라 일반인들로 독감에 대한 사전 경계를 하려는 사람들일 수 있다. 독
감 자체가 아니라 구글은 사용자들에게 유용한 정보를 빠르게 그리고 필요한
시점에 제공한다는 가치로 인해 더 많은 사용자를 유치 및 유지 할 수 있고 그
댓가로 더 높은 광고수익을 얻을 수 있다는 점이다. 결국 찾아내는 정보를 직
접 사용하는자와 그 정보를 통해 금전적 이익을 누리는 자가 구분될 수 있다는
시사점을 볼 수 있는 것이다
좀더 우리 생활과 생각해보면
오늘은 어떤 손님이 많이 올 것이며 어떤 주문이 많이 들어올 것인가?
오늘은 어떤 손님이 많을 것으며 어떤 주문이 많을 것인가에서도 마찬가지.
초단기적인 예측, 즉, 최근의 동향으로 미루어 볼때 당장 또는 오늘, 조금
있다가 어떻게 신속하게 대응을 해야하는가를 결정할 수 있고 이를 통해
비용을 줄이거나 매출을 늘이기 위한 조치를 취할 수 있다. 음식점이라면
손님의 구성에 따라서 서비스 인력을 일시적으로 늘이거나 줄이는 것이 가
능하다. 재료를 추가로 조달하는 것도 가능하다. 유통업체라면 진열을 조
절해서 팔릴만한 상품을 더 많이 배치하는 것을 통해 매출을 높이는 것이
가능하다.
일종의 조기경보시스템 (Early Warning System)을 운영할 수 있다는 것이
다. 흐름에 대한 초단기 예측이 가능하도록, 사전에 모델이나 패턴을 개발
해 두었다가 활용한다는 것이다.
음식점의 예에서도 정보의 직접 사용자는 음식점 주인일 수 있겠지만 만일
음식점에 손님이 갑자기 증가할 때를 대비해 비상인력을 공급하는 업체가
있다면 더 큰 금전적 이익은 그 곳이 누릴 수 있을 가능성도 있다. 그리고
그런 기회를 이해하고 있는 업체라면 이 분석의 주체가 되어야 할지도 모
른다.
좀더 우리 생활과 생각해보면
(한참 사람 많은 연말 목요일 저녁시간, ... ) 오늘은 택시를 몇시에 어디서 잡
아야 쉽게 잡힐까?
사람 많은 연말이라면 도심에서 저녁시간 택시잡기는 쉽지 않다. 그러나
어디서 언제 잡는가에 따라서는 훨씬 수월하게 택시를 잡을 수 있다. 문제
는 그에 대한 답이 일정하지 않다는 것이다. 날씨나 그날 그날의 상황에 따
라 수시로 변화가 있다. 이 때문에 실시간적인 정보는 가치를 발휘한다. 어
디서 택시를 잡으면 얼마나 걸린다는 요약정보를 만들어 낼 수 있다면 그
것만으로도 사람들은 좀 더 쉽게 택시를 잡을 수 있는 곳을 찾아낼 수 있
다.
만약에 회사를 운영한다면
매출둔화 원인 진단과 커뮤니케이션 방향 수정
유통업체의 경우에도 제조업체의 경우에도 전체적으로 또는 특정 상품에
서 매출이 줄어드는 것을 파악하는 것은 오늘날의 IT시스템을 활용해 쉽게
가능하지만 큰 문제는 왜 매출이 줄어들었는가를 파악하는 것이 가능하지
않은 것이 현실이다. 빅데이터 분석을 위해 소셜네트워크로 부터 획득된
소비자들의 반응이 분석된다면 그 원인을 찾는 것이 가능해진다. 경쟁사의
신제품 출시나 프로모션의 영향인지, 지역이나 상권에 특별한 변화가 있었
기 때문인지, 기타 예상하지 못했던 사회적인 이슈 (예: 광우병 ) 가 발생되
었기 때문인지가 드러날 수 있다. 원인을 찾아낼 수 있다면 기업은 다양한
대처방안을 강구할 수 있다. 물리적으로 제품을 변경하지 않는다고 하더라
도 제품에 대한 커뮤니케이션 방향을 변화시키는 것으로도 매출의 둔화를
저지할 수 있을 것이다. 예를 들어 광우병이 특정 제품에 크게 부정적인 영
향을 미치고 있다면 제품에 포함된 소고기 관련 성분의 장점을 강조하던
메시지를 다른 기능적인 요소로 변경할 수 있을 것이다.
만약에 회사를 운영한다면
소비자 트렌드로 부터 제품 컨셉을 개발
새로운 제품을 개발하는 제조업체가 겪는 가장 큰 어려움이 바로 대상으로
하는 소비자들의 마음속에 무엇이 들어 있을까를 파악하는 것이다. 기존에
도 신상품 개발을 위한 표본설문조사는 가능했으나 비용이 크고 한가지 목
적으로 실시된 조사가 여러 용도로 재사용되기 어려운 문제점을 안고 있어
서 실효성이 매우 낮았자. 소셜데이터를 활용하는 분석을 한다고 해도 한
번에 새로운 상품의 구체적인 모습이 바로 드러나지는 않을 것이지만 폭넓
은 소비자층의 요구에 부합하는 또는 특정한 소비자 집단의 특별한 유구에
부합하는 좋은 신상품의 후보들을 찾아낼 수 있는 단서를 제공하는 것은
가능할 것이다.
빅 데이터 분석은 어떤 특성을 가지고 있는가?
어디서 분석주제를 찾을 것인가?
몇가지의 예를 살펴보면서 얻는 시사점은 활용이 광고나 R&D등 사람들의
움직임과 반응이 필요한 곳에 중요한 분석 주제들이 존재한다는 것이다.
또 사람들의 심리적인 상태나 환경적인 변화에 따라서 다른 결과가 나타나
게 되는 곳에서도 좋은 분석 주제들이 존재한다.
부동산 시장이나 주식시장은 사람들의 심리가 매우 중요하게 작용하는 영
역이다. 실제로 가치가 커지거나 작아지거나 한다기 보다는 사람들이 왜인
지 값이 오를 것이라고 믿는다 또는 값이 떨어질 것이라고 믿는다는 점이
결과적으로 시장의 구도를 변화시키기 때문이다. 실체 보다도 심리의 변화
와 확산이 중요한 경우이다. 독감에서 처럼 생태계의 변화에서도 비슷한
점을 찾을 수 있다. 실제 독감이라기 보다도 알려진, 사람들이 인식한 독감
이 중요할 수 있다. 사람들의 머리 속의 인식이 변화가 의료수요를 움직이
고 수급 불균형으로 이루어지는 결과도 낳게 될 수 있다.
빅 데이터 자료들의 특징
빅 데이터는 결과이지 원인이나 목적이 아니다.
[1] 거의 실시간적으로 포착될 수 있다는 점 Near Realtime Data Capture
[2] 거래와 같은 구체적인 행위 이외의 내용을 담은 데이터가 포착된다는 점
Soft Data Capture
[3] 사건이 발생되는 위치가 포착될 수 있다는 점 Location Data Capture
빅 데이터는 꼭 이세가지를 모두 충족하는 경우가 아니라 그중 일부를 포함하는
경우라면 조건이 성립된다고 보는 것이 옳을 것이다.
기존에도 POS 시스템을 통해 포착되는 거래 데이터에서 편의점의 매출 변화를
바탕으로 실시간에 가까운 단기적 상품별 매출 변화 예측이 불가능했던 것은 아
니다. 실제로 얼마나 많은 노력을 그에 쏟았는가와는 별개로 말이다. 일기예보에
비해 날이 더 춥게 느껴졌고, 그 때문에 특정 지역의 편의점에서 따듯한 음료가
평소 보다 또 예상 보다 더 팔려갈 수 있을 것을 예상할 수 있다. 일기예보와는
달리 비가 좀 일찍 그친다면 우산의 판매를 일찍 종료시킬 수 있을 것이다. 이들
은 거래 데이터만으로도 파악이 불가능한 것은 아닐 수 도 있다. 다만, 좀 더 많
은 데이터, 좀 더 다양한 데이터가 투입된다면 좀 더 정확하고 구체적인, 또 사
람들의 심리적인 변화에 따른 영향도 파악될 수 있다는 점에 차이가 있는 것이
다. 물론, 기존에 거래 데이터 조차 50% 이상 분석을 통해 그 가치를 얻어내지
못하고 있었던 상황이라면 추가적으로 그것도 대량의 데이터가 보태진다고 해
서 더 좋은 분석을 할 수 도, 더 좋은 업무적인 성과 내지는 활용도 기대할 수 없
을 것이다.
더 좋은 주제를 실수 없이 찾기 위한 Core Tips?
[1] (비록 반복적으로 그리고 시행착오를 거쳐 좋은 결과를 얻을 수 있을 지언
정) 사전에 충분한 노력을 투입해서 분석을 기획하라
[2] 분석에 꼭 빅 데이터가 필요한가를 확인하라 - 그리고 어떤 빅 데이터가 필요
한가를 확인하라
[3] 분석결과와 활용처간의 조합을 조금씩 바꿔 보면서 반복적으로 분석을 실시하
라 (Plan while doing) - 한 번의 분석은 그 것으로 끝나는 것이 아니므로 경우에
따라 한 분석이 한 곳에는 유용하게 활용되지 못하더라도 같은 내용이 다른 사람
에게 유용한 정보가 되거나 다른 용도로 유용해 질 수 있다는 기본 원리를 기억하
라
빅데이터 분석은 어떤 식으로 비지니스 가치를 창출하
게 되는가?
마이클 츄의 강연 내용 중에 빅 데이터 분석이 어떤 식으로 비지니스 가치를 만들
어내게 되는가에 대한 내용이 있었다. 막연한 빅데이터에 대한 관심이 실질적으로
가치로 연결되기 위해서, 분석과 기술이 그저 분석과 기술 그 자체로 머물지 않게
하기 위해서는 이 대목이 그 무엇 보다 중요한 부분일 수 밖에 없다. 기업과 조직
들이 가장 크게 그리고 먼저 관심을 둘 부분이 바로 이 대목. 이에 마이클 츄가 정
리한 다섯가지를 옮기고 풀이해 보자.
from
Michael Chui (McKinsey Global Institute)
Strata Summit 2011: Michael Chui, "Big Data: The Next Frontier"
( http://www.youtube.com/watch?v=C5VB0E1bWiI )
1. create transparency (투명성을 높임)
대표적으로 사기적발과 같은 유형의 적용사례가 이런 경우일 수 있음. 테러리스트
색출을 위해 의심스러운 대상과 그와 연결된 (통화내역, 페이스북 친구, 이메일 송
수신자 등) 네트워크등을 분석해 허브를 찾아내고, 추가적인 의심 대상을 색출하
는 등의 경우도 예가 됨. 기업내에서 내부적인 부정을 밝히는 작업도 이에 해당될
수 있음. 비정형적인 데이터가 분석될 수 있는 개연성이 높으며, 소셜네트워크 등
관계 데이터가 유용하게 사용될 수 있음.
주식시장에서 특정 종목이 작전에 의해 움직인다고 했을때 그 움직임에 대해 의심
하고 있는 사람들의 생각이 조기에 공유될 수 있도록 하는 프로세스가 존재한다면
이 역시 공공의 이익을 위한 투명성 제고의 대표적인 사례가 될 수 있을 것임
2. expose variability and enable experimentation (변화/변
경에 노출시키고 실험을 가능하게 함)
상품이나 마케팅 정책 등을 구분해서 수행하고 그에 대한 반응을 수집하여 새로운
상품이나 마케팅 정책을 만들어 내는 것이 예가 될 수 있음
3. segement populations to customize actions (활동에을
맞춤형으로 하기 위해 그 대상을 세분화함)
아마존이나 야후의 타겟 캠페인과 개인화, 타겟 광고 등 맞춤형 마케팅이 대표적
인 예가 될 수 있음. 광고 뿐 아니라 서비스를 고객의 요구와 상황의 특성에 따라
수행하는 것도 이 유형에 해당함
4. replace/ support human decision making (인간의 의사
결정을 대체하거나 지원함)
통적인 의사결정지원과 자동화의 범주에서 완전히 벗어난다기 보다는 다양한 유
형의 데이터를 활용하고, 특정 목적을 위해 수집된 소량의 표본 대신 대량의 데이
터를 사용한다는 측면에서 진일보 된 것으로 볼 수 있음. 정량적인 분석의 한계인
'왜 이런가, 왜 이 것이 바람직한가' 등에 대한 답 내지는 힌트를 제공할 수 있다는
점에서 가치를 줌
5. innovation of biz models, products, and services (비지
니스 모델, 상품, 서비스 등에 혁신을 이룸)
링크드인이 전문인력들의 네트워크를 사업모델의 대상으로 만든 것이 대표적인
사례. 링크드인은 데이터를 가공해서 만들어진 새로운 정보를 '상품(data
product)'으로 제공하고 이로 부터 수익을 창출하고 있음. 고객들 스스로 또는 고
객들이 상호간 협력하여 A/S를 수행할 수 있도록 하는 경우 즉, self service 내지
는 collaborative service 기능을 제공하여 고객의 만족과 편의성, 기업측의 비용절
감을 동시에 얻는 것도 방안이 될 수 있음
빅데이터사례
:: SCDF, 응급환자 발생 예측으로 구급차 출동시간 단축
:: 21세기 대약진 운동, 중국 빅 데이터
:: 전 세계 빅데이터의 심장이자 엔진 - 인도
:: 새로운 기준을 위한 다른 데이터를 수집, 분석한다 - 오클랜드
:: 관련 데이터를 모두 다 수집한다 - 독일 축구
:: 도쿄 택시협회의 배차 앱
:: 건강상태를 자세하게 파악하여, 보험료를 바꾸는 AXA 생명
:: 부족한 데이터를 다른 회사와 제휴하여 수집 - 소니은행
:: 일본 덴소의 외부 데이터를 연계한 지능형 HEMS
:: 빅데이터 분석으로 고객의 쇼핑 경험을 변화시키는 메이시
:: WOWOW 과거에 모아 두었지만 사용 안 했던 데이터를 사용
:: 아마존의 빅데이터 활용 - 개인화와 예측
:: 링크드인, 세계 경제 지도를 바꾼다
:: GE의 산업 인터넷 IoT
:: 히다치 조선 불꽃 사진 데이터 이용
:: 월마트는 빅데이터를 회사의 DNA로!
빅데이터사례
:: 일본의 콜센터 TMJ 통화 최적화
:: 일본의 하꾸이시 위성 사진 이용
:: ㈜오타니의 공간데이터 활용 부동산 가격 예측
:: 미국의 자동차 보험회사 프로그레시브
:: 쓰레기 처리 및 재활용 회사 미국의 루비콘
:: 애플 - IBM 동맹 기업용 모바일 앱
:: 알리바바 - 새로운 공룡
:: 맛집 추천, 못 믿겠다 파워플로거 - 다이닝 코드
:: 다이닝코드
:: 영화 뭐 볼까? - 왓챠가 알려줄게!
:: 전국 지역 축제, 예측으로 사업 기회 확대를
:: 서울심야버스, 이미 성공한 것일까?
:: 성남시, 빅 데이터 활용 - 선진 도서 행정 서비스
:: 개방된 공공 데이터는 무제한의 가능성을 담고 있다
:: 의회의 법안도 분석하고 예측한다
Case Study
1. 빅데이터로 맛을 증명하는 미국의 [푸드 지니어스]
2. 오늘의 정보로 내일의 패션 트렌드를 읽는 미국의 [에디트]
3. 빅데이터 매쉬업으로 부동산 가격을 정확히 예측하는 미국의 [질로우]
4. 신체 일부분이 발에 관한 빅데이터를 모아 상업화시킨 일본의 [아이웨어랩]
5. 빅데이터를 이용해 미이크로 맞춤 광고 시대를 여는 미국의 [로켓 퓨얼]
6. 학습과정의 취약점을 빅데이터로 찾아내, 학습성과를 높이는 미국의 [뉴턴]
7. 중소기업이 빅데이터로 180년 전통을 깨고 신사업에 나서서 성공한 일본의
[이토큐우에몬]

Más contenido relacionado

La actualidad más candente

빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410Peter Woo
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질Sun Young Kim
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기iron han
 
빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2ko donghwi
 
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21Donghan Kim
 
UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015YoungMin Jeon
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)동학 노
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선datasciencekorea
 
뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1Newsjelly
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향atelier t*h
 
데이터 분석 프로세스
데이터 분석 프로세스데이터 분석 프로세스
데이터 분석 프로세스Lee Seungeun
 
빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.Byounghee Kim
 
빅데이터 이용 사례 분석
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석ko donghwi
 
빅데이터란?
빅데이터란?빅데이터란?
빅데이터란?Yoseop Shin
 
데이터 사이언스 소개 - 정준호
데이터 사이언스 소개 -  정준호데이터 사이언스 소개 -  정준호
데이터 사이언스 소개 - 정준호준호 정
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117Han Woo PARK
 

La actualidad más candente (20)

분석7기 5조
분석7기 5조분석7기 5조
분석7기 5조
 
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기
 
빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2
 
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
 
UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)
 
Bigdata
BigdataBigdata
Bigdata
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
 
뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향
 
데이터 분석 프로세스
데이터 분석 프로세스데이터 분석 프로세스
데이터 분석 프로세스
 
빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.
 
Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해
 
빅데이터 이용 사례 분석
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석
 
빅데이터란?
빅데이터란?빅데이터란?
빅데이터란?
 
데이터 사이언스 소개 - 정준호
데이터 사이언스 소개 -  정준호데이터 사이언스 소개 -  정준호
데이터 사이언스 소개 - 정준호
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117
 

Similar a 빅데이터전문가교육 3학기 1

건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안메가트렌드랩 megatrendlab
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석수보 김
 
무역을 위한 디지털마케팅_2019516002
무역을 위한 디지털마케팅_2019516002무역을 위한 디지털마케팅_2019516002
무역을 위한 디지털마케팅_2019516002ssuserad469c
 
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안메가트렌드랩 megatrendlab
 
DLAB Big Data Issue Report 002
DLAB Big Data Issue Report 002DLAB Big Data Issue Report 002
DLAB Big Data Issue Report 002DLAB
 
[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색
[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색
[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색Creative Commons Korea
 
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !한국디자인진흥원 공공서비스디자인PD
 
데이터분석을 통한 의사결정 장혜린 박재욱
데이터분석을 통한 의사결정  장혜린 박재욱 데이터분석을 통한 의사결정  장혜린 박재욱
데이터분석을 통한 의사결정 장혜린 박재욱 Jinho Jung
 
소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점
소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점
소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점Youngjo Seong
 
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰JeongHeon Lee
 
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰JeongHeon Lee
 
[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성
[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성
[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성MezzoMedia
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다승화 양
 
2018 tech trends_and_present_report
2018 tech trends_and_present_report2018 tech trends_and_present_report
2018 tech trends_and_present_reportJUNHEEKIM27
 
02.소셜 큐레이션 서비스 마케팅 전략
02.소셜 큐레이션 서비스 마케팅 전략02.소셜 큐레이션 서비스 마케팅 전략
02.소셜 큐레이션 서비스 마케팅 전략Industrial Bank of Korea
 
인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20KYOYOON JUNG
 
DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003DLAB
 
소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)
소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)
소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)Jinseok Ro
 
Data driven design 소화하기
Data driven design 소화하기Data driven design 소화하기
Data driven design 소화하기Jaeyun Lee
 

Similar a 빅데이터전문가교육 3학기 1 (20)

건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석
 
무역을 위한 디지털마케팅_2019516002
무역을 위한 디지털마케팅_2019516002무역을 위한 디지털마케팅_2019516002
무역을 위한 디지털마케팅_2019516002
 
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
 
DLAB Big Data Issue Report 002
DLAB Big Data Issue Report 002DLAB Big Data Issue Report 002
DLAB Big Data Issue Report 002
 
[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색
[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색
[과학기술 오픈 데이터 활용캠프] 3조(마인드공공이) - 마인드맵 검색
 
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
 
데이터분석을 통한 의사결정 장혜린 박재욱
데이터분석을 통한 의사결정  장혜린 박재욱 데이터분석을 통한 의사결정  장혜린 박재욱
데이터분석을 통한 의사결정 장혜린 박재욱
 
소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점
소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점
소비자 직접 서비스(DTC Direct to Consumer) 시대의 도래와 시사점
 
기업의 공간빅데이터 활용사례
기업의 공간빅데이터 활용사례기업의 공간빅데이터 활용사례
기업의 공간빅데이터 활용사례
 
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
 
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
 
[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성
[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성
[메조미디어] 긍 부정을 넘어선 '정서 분석', 그리고 '딥 러닝'의 가능성
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
 
2018 tech trends_and_present_report
2018 tech trends_and_present_report2018 tech trends_and_present_report
2018 tech trends_and_present_report
 
02.소셜 큐레이션 서비스 마케팅 전략
02.소셜 큐레이션 서비스 마케팅 전략02.소셜 큐레이션 서비스 마케팅 전략
02.소셜 큐레이션 서비스 마케팅 전략
 
인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20
 
DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003
 
소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)
소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)
소셜미디어를 분석하는 마케터를 위한 가이드라인(1부)
 
Data driven design 소화하기
Data driven design 소화하기Data driven design 소화하기
Data driven design 소화하기
 

Más de Kangwook Lee (20)

분석8기 4조
분석8기 4조분석8기 4조
분석8기 4조
 
분석6기 4조
분석6기 4조분석6기 4조
분석6기 4조
 
기술8기 2조
기술8기 2조기술8기 2조
기술8기 2조
 
기술7기 2조
기술7기 2조기술7기 2조
기술7기 2조
 
기술6기 3조
기술6기 3조기술6기 3조
기술6기 3조
 
Apply교육
Apply교육Apply교육
Apply교육
 
빅데이터 분석활용 가이드 (1)
빅데이터 분석활용 가이드 (1)빅데이터 분석활용 가이드 (1)
빅데이터 분석활용 가이드 (1)
 
Editing textvariables
Editing textvariablesEditing textvariables
Editing textvariables
 
Summarizing data
Summarizing dataSummarizing data
Summarizing data
 
Subsetting andsorting
Subsetting andsortingSubsetting andsorting
Subsetting andsorting
 
Readingfromothersources
ReadingfromothersourcesReadingfromothersources
Readingfromothersources
 
Readingfromapis
ReadingfromapisReadingfromapis
Readingfromapis
 
Reading files4
Reading files4Reading files4
Reading files4
 
Reading files3
Reading files3Reading files3
Reading files3
 
Reading files2
Reading files2Reading files2
Reading files2
 
Reading files1
Reading files1Reading files1
Reading files1
 
Down loadingfiles
Down loadingfilesDown loadingfiles
Down loadingfiles
 
9
99
9
 
8
88
8
 
7
77
7
 

빅데이터전문가교육 3학기 1

  • 1. [빅 데이터 분석] 무엇을 분석해야 하는가? 빅 데이터든 아니면 스몰 데이터든 결국은 [ 데이터 분석] 이라는 점이다. 따라서 우선은 데이터 분석에서 무엇이 대상이 되어야 하는가를 먼저 생각하고 넘어가는 것이 순서일 것이다. 빅 데이터 분석(Big Data Analysis)은 꽤나 인기있는 화두 하지만 막상 구체 적인 질문에 들어가면 아직은 별 명쾌한 대답을 구체적으로들 풀어내지 못 하고 있는 것이 현실이다. 심지어는 무엇이 빅 데이터 이며 왜 빅 데이터를 고민해야 하는가에 대해서 조차 그렇다. 그 때문에 언제나 그리고 얼마나 큰 가치를 빅 데이터 분석으로 부터 우리가 얻게 될 것인지에 대해 판단이 쉽질 않다. 고민하며
  • 2. [Dimension 1] 육하원칙 5W1H 누가 - 고객, 직원, 점포, 라인 무엇을 - 상품, 서비스, 구매, 이용, 부품, 자재, 시설, 이상, 고장 언제 - 계절, 시간, 요일, 행사 어디서 - 지역, 국가, 건물 어떻게 - 채널, 지불수단, 만족, 속도 왜 - 좋아서, 불안해서, 편해서, 기분이 나빠서, 우울해서, ... 분석의 대상을 찾기 위해 고려할 수 있는 세가지 축과 두가지 추가적인 차원
  • 3. [Dimension 2] 탐색적 데이터 분석의 유형 구조, 구성 차이, 변화, 반복, 주기 속도, 경로 진위, 영향 [Dimension 3] Value Chain상의 기능 결국 일반적인 기업내의 활동에서의 기능 영역의 범위가 어디인가를 의미한다. (특히 기업에서의 활용 측면에서 보는 경우) 고객관리, 채널관리, 품질관리, 마케팅, 서비스, 자재관리, 인력관리 Mktg, SVC/CS, CRM, SCM, QM, ... 어떤 분야에 적용하려는가
  • 4. [Additional Dimensions ] 그리고 두가지 추가적인 고려사항 과거, 현재, 미래 중 언제에 대한 분석 결과가 나와야 하는가 과거 중에서도 최근, 그리고 미래 중에서도 단기 미래라는 세부적인 시점에 대 한 판단이 필요 어떻게 활용할 것인가와 그에 따른 우선순위 분석결과로 찾아낸 지식과 정보를 어떤 활동에 적용할 것인가? 어떤 Action을 취할 수 있는가? 어떤 의사결정을 내릴 수 있는가? 누구에게 유용한 정보가 될 것인가? 그리고 우선순위는 상대적으로? (유용성, 시급성, 복잡도, 기타 제약사항. 예를 들면 데이터가 존재하는가와 같은) 수많은 분석 대상중 더 우선적인 것은 무 엇인가?
  • 5. 분석결과의 예 오늘은 남성 특히 회사원 층의 사람들이 강남역 근처에서 회식을 많이 하지 않을 것이다. 이 들은 다음주로 모임을 많이 미룰 것이며 화요일 모임이 특히 많을 것이다. 이를 찾아내기 위해서는 사전에 누가 언제 어디서 무엇을 할 것이며 대신 어떤 일이 다음에 벌어질 것인가로 구성된 분석이 미리 이루어져야 할 것이다. 이 분 석의 대상 영역은 마케팅, 그리고 중요도는 높다는 식의 판단도 따라야 할 것이 다.
  • 6. 빅데이터 분석의 대상 주제의 예는? 독감은 어떤 경로로 (어떤 속도로) 확산되는가? 구글이 독감을 예보한다. 그것도 미국 보건당국보다 더 빠르게. 황당하게 들릴 수 있지만 사실이다. 구글은 독감 증세 환자가 늘면 ‘감기’와 관 련된 단어를 검색하는 빈도가 함께 증가한다는 패턴을 발견했다. 이를 미국 질 병통제예방센터 데이터와 비교해본 결과 검색 빈도와 실제 독감 증세를 보인 환자 숫자 사이에 밀접한 상관관계가 있다는 사실을 밝혀냈다. 구글은 이 같은 분석을 바탕으로 웹사이트를 통해 시간 및 지역별 독감 유행 정보를 미국 보 건당국보다 한발 앞서 제공하고 있다. 구글이 이처럼 정부 당국보다 앞서 정보를 분석할 수 있는 이유는 수많은 사 용자들이 인터넷에 온갖 종류의 흔적을 남기기 때문이다. 인터넷에 접속해 이 뤄지는 모든 행동은 일종의 상호작용이다. 가령 특정 웹사이트에 로그인을 하 거나 게시물을 읽을 경우 해당 웹사이트 서버에 요청 기록이 남는다. 실로 막 대한 양의 정보들이 쌓이는 것이다. 기업들 사이에서는 이 같은 정보를 분석해 유의미한 정보를 만들어내려는 시도가 이어지고 있다. 기본적인 통계는 물론 미래를 예측하려는 움직임도 있다. 이른바 ‘빅 데이터’의 시대다. 기사중...
  • 7. 독감예측의 의의 독감의 확산에 대한 분석이 분석 대상 주제로 유용했던 이유는 무엇일까? 독감 확산이야 어차피 정부기관들에서 사후적으로는 통계가 나올 것이겠지 만 핵심은 독감 확산을 정부기관보다도 더 '먼저', 즉, 누구보다 빨리 파악할 수 있었기 때문. 그렇다면 더 먼저 파악할 수 있었던 이유는 무엇일까? 통상 빅 데이터라 고 부르는 종류의 데이터는 실시간 그리고 사람들의 검색이나 소셜네트워 크 등에서 에서 포착되는 비정형적인 새로운 데이터들이 반영될 수 있기 때문. 얼마나 빨리 정보를 생산할 수 있는가 그리고 당장 유용한 정보를 찾 아낼 수 있는가가 중요한 요인Nearest realtime information, most recent update 여기에 사람들이 가치를 부여한다는 사실 현재 내지는 초단기적인 미래에 대한 정보가 더 가치있는 정보가 되는 경 우가 많다는 점이다. 이는 결코 마케팅이나 커뮤니케이션의 사이클이 짧아진다는 점 즉, 정보의 생산과 유통이 이루어지는 사이클이 짧아진다는 점과 무관하지 않다. 이 처 럼 생산 유통의 사이클이 짧아지면서 정보의 유효기간(또는 유통기간)이 함께 짧아진다.
  • 8. 시사점 독감의 확산이라는 분석이 누구에게 어떤 식으로 가치를 주었는가를 짚어볼 필요가 있을 듯 하다. 분석을 수행한 것은 구글. 검색업체이다. 하지만 그 정보 를 필요로 하는 곳은 일차적으로는 일반 개인들일 수 있다. 검색의 사용자라서 가 아니라 일반인들로 독감에 대한 사전 경계를 하려는 사람들일 수 있다. 독 감 자체가 아니라 구글은 사용자들에게 유용한 정보를 빠르게 그리고 필요한 시점에 제공한다는 가치로 인해 더 많은 사용자를 유치 및 유지 할 수 있고 그 댓가로 더 높은 광고수익을 얻을 수 있다는 점이다. 결국 찾아내는 정보를 직 접 사용하는자와 그 정보를 통해 금전적 이익을 누리는 자가 구분될 수 있다는 시사점을 볼 수 있는 것이다
  • 9. 좀더 우리 생활과 생각해보면 오늘은 어떤 손님이 많이 올 것이며 어떤 주문이 많이 들어올 것인가? 오늘은 어떤 손님이 많을 것으며 어떤 주문이 많을 것인가에서도 마찬가지. 초단기적인 예측, 즉, 최근의 동향으로 미루어 볼때 당장 또는 오늘, 조금 있다가 어떻게 신속하게 대응을 해야하는가를 결정할 수 있고 이를 통해 비용을 줄이거나 매출을 늘이기 위한 조치를 취할 수 있다. 음식점이라면 손님의 구성에 따라서 서비스 인력을 일시적으로 늘이거나 줄이는 것이 가 능하다. 재료를 추가로 조달하는 것도 가능하다. 유통업체라면 진열을 조 절해서 팔릴만한 상품을 더 많이 배치하는 것을 통해 매출을 높이는 것이 가능하다. 일종의 조기경보시스템 (Early Warning System)을 운영할 수 있다는 것이 다. 흐름에 대한 초단기 예측이 가능하도록, 사전에 모델이나 패턴을 개발 해 두었다가 활용한다는 것이다. 음식점의 예에서도 정보의 직접 사용자는 음식점 주인일 수 있겠지만 만일 음식점에 손님이 갑자기 증가할 때를 대비해 비상인력을 공급하는 업체가 있다면 더 큰 금전적 이익은 그 곳이 누릴 수 있을 가능성도 있다. 그리고 그런 기회를 이해하고 있는 업체라면 이 분석의 주체가 되어야 할지도 모 른다.
  • 10. 좀더 우리 생활과 생각해보면 (한참 사람 많은 연말 목요일 저녁시간, ... ) 오늘은 택시를 몇시에 어디서 잡 아야 쉽게 잡힐까? 사람 많은 연말이라면 도심에서 저녁시간 택시잡기는 쉽지 않다. 그러나 어디서 언제 잡는가에 따라서는 훨씬 수월하게 택시를 잡을 수 있다. 문제 는 그에 대한 답이 일정하지 않다는 것이다. 날씨나 그날 그날의 상황에 따 라 수시로 변화가 있다. 이 때문에 실시간적인 정보는 가치를 발휘한다. 어 디서 택시를 잡으면 얼마나 걸린다는 요약정보를 만들어 낼 수 있다면 그 것만으로도 사람들은 좀 더 쉽게 택시를 잡을 수 있는 곳을 찾아낼 수 있 다.
  • 11. 만약에 회사를 운영한다면 매출둔화 원인 진단과 커뮤니케이션 방향 수정 유통업체의 경우에도 제조업체의 경우에도 전체적으로 또는 특정 상품에 서 매출이 줄어드는 것을 파악하는 것은 오늘날의 IT시스템을 활용해 쉽게 가능하지만 큰 문제는 왜 매출이 줄어들었는가를 파악하는 것이 가능하지 않은 것이 현실이다. 빅데이터 분석을 위해 소셜네트워크로 부터 획득된 소비자들의 반응이 분석된다면 그 원인을 찾는 것이 가능해진다. 경쟁사의 신제품 출시나 프로모션의 영향인지, 지역이나 상권에 특별한 변화가 있었 기 때문인지, 기타 예상하지 못했던 사회적인 이슈 (예: 광우병 ) 가 발생되 었기 때문인지가 드러날 수 있다. 원인을 찾아낼 수 있다면 기업은 다양한 대처방안을 강구할 수 있다. 물리적으로 제품을 변경하지 않는다고 하더라 도 제품에 대한 커뮤니케이션 방향을 변화시키는 것으로도 매출의 둔화를 저지할 수 있을 것이다. 예를 들어 광우병이 특정 제품에 크게 부정적인 영 향을 미치고 있다면 제품에 포함된 소고기 관련 성분의 장점을 강조하던 메시지를 다른 기능적인 요소로 변경할 수 있을 것이다.
  • 12. 만약에 회사를 운영한다면 소비자 트렌드로 부터 제품 컨셉을 개발 새로운 제품을 개발하는 제조업체가 겪는 가장 큰 어려움이 바로 대상으로 하는 소비자들의 마음속에 무엇이 들어 있을까를 파악하는 것이다. 기존에 도 신상품 개발을 위한 표본설문조사는 가능했으나 비용이 크고 한가지 목 적으로 실시된 조사가 여러 용도로 재사용되기 어려운 문제점을 안고 있어 서 실효성이 매우 낮았자. 소셜데이터를 활용하는 분석을 한다고 해도 한 번에 새로운 상품의 구체적인 모습이 바로 드러나지는 않을 것이지만 폭넓 은 소비자층의 요구에 부합하는 또는 특정한 소비자 집단의 특별한 유구에 부합하는 좋은 신상품의 후보들을 찾아낼 수 있는 단서를 제공하는 것은 가능할 것이다.
  • 13. 빅 데이터 분석은 어떤 특성을 가지고 있는가? 어디서 분석주제를 찾을 것인가? 몇가지의 예를 살펴보면서 얻는 시사점은 활용이 광고나 R&D등 사람들의 움직임과 반응이 필요한 곳에 중요한 분석 주제들이 존재한다는 것이다. 또 사람들의 심리적인 상태나 환경적인 변화에 따라서 다른 결과가 나타나 게 되는 곳에서도 좋은 분석 주제들이 존재한다. 부동산 시장이나 주식시장은 사람들의 심리가 매우 중요하게 작용하는 영 역이다. 실제로 가치가 커지거나 작아지거나 한다기 보다는 사람들이 왜인 지 값이 오를 것이라고 믿는다 또는 값이 떨어질 것이라고 믿는다는 점이 결과적으로 시장의 구도를 변화시키기 때문이다. 실체 보다도 심리의 변화 와 확산이 중요한 경우이다. 독감에서 처럼 생태계의 변화에서도 비슷한 점을 찾을 수 있다. 실제 독감이라기 보다도 알려진, 사람들이 인식한 독감 이 중요할 수 있다. 사람들의 머리 속의 인식이 변화가 의료수요를 움직이 고 수급 불균형으로 이루어지는 결과도 낳게 될 수 있다.
  • 14. 빅 데이터 자료들의 특징 빅 데이터는 결과이지 원인이나 목적이 아니다. [1] 거의 실시간적으로 포착될 수 있다는 점 Near Realtime Data Capture [2] 거래와 같은 구체적인 행위 이외의 내용을 담은 데이터가 포착된다는 점 Soft Data Capture [3] 사건이 발생되는 위치가 포착될 수 있다는 점 Location Data Capture 빅 데이터는 꼭 이세가지를 모두 충족하는 경우가 아니라 그중 일부를 포함하는 경우라면 조건이 성립된다고 보는 것이 옳을 것이다. 기존에도 POS 시스템을 통해 포착되는 거래 데이터에서 편의점의 매출 변화를 바탕으로 실시간에 가까운 단기적 상품별 매출 변화 예측이 불가능했던 것은 아 니다. 실제로 얼마나 많은 노력을 그에 쏟았는가와는 별개로 말이다. 일기예보에 비해 날이 더 춥게 느껴졌고, 그 때문에 특정 지역의 편의점에서 따듯한 음료가 평소 보다 또 예상 보다 더 팔려갈 수 있을 것을 예상할 수 있다. 일기예보와는 달리 비가 좀 일찍 그친다면 우산의 판매를 일찍 종료시킬 수 있을 것이다. 이들 은 거래 데이터만으로도 파악이 불가능한 것은 아닐 수 도 있다. 다만, 좀 더 많 은 데이터, 좀 더 다양한 데이터가 투입된다면 좀 더 정확하고 구체적인, 또 사 람들의 심리적인 변화에 따른 영향도 파악될 수 있다는 점에 차이가 있는 것이 다. 물론, 기존에 거래 데이터 조차 50% 이상 분석을 통해 그 가치를 얻어내지 못하고 있었던 상황이라면 추가적으로 그것도 대량의 데이터가 보태진다고 해 서 더 좋은 분석을 할 수 도, 더 좋은 업무적인 성과 내지는 활용도 기대할 수 없 을 것이다.
  • 15. 더 좋은 주제를 실수 없이 찾기 위한 Core Tips? [1] (비록 반복적으로 그리고 시행착오를 거쳐 좋은 결과를 얻을 수 있을 지언 정) 사전에 충분한 노력을 투입해서 분석을 기획하라 [2] 분석에 꼭 빅 데이터가 필요한가를 확인하라 - 그리고 어떤 빅 데이터가 필요 한가를 확인하라 [3] 분석결과와 활용처간의 조합을 조금씩 바꿔 보면서 반복적으로 분석을 실시하 라 (Plan while doing) - 한 번의 분석은 그 것으로 끝나는 것이 아니므로 경우에 따라 한 분석이 한 곳에는 유용하게 활용되지 못하더라도 같은 내용이 다른 사람 에게 유용한 정보가 되거나 다른 용도로 유용해 질 수 있다는 기본 원리를 기억하 라
  • 16. 빅데이터 분석은 어떤 식으로 비지니스 가치를 창출하 게 되는가? 마이클 츄의 강연 내용 중에 빅 데이터 분석이 어떤 식으로 비지니스 가치를 만들 어내게 되는가에 대한 내용이 있었다. 막연한 빅데이터에 대한 관심이 실질적으로 가치로 연결되기 위해서, 분석과 기술이 그저 분석과 기술 그 자체로 머물지 않게 하기 위해서는 이 대목이 그 무엇 보다 중요한 부분일 수 밖에 없다. 기업과 조직 들이 가장 크게 그리고 먼저 관심을 둘 부분이 바로 이 대목. 이에 마이클 츄가 정 리한 다섯가지를 옮기고 풀이해 보자. from Michael Chui (McKinsey Global Institute) Strata Summit 2011: Michael Chui, "Big Data: The Next Frontier" ( http://www.youtube.com/watch?v=C5VB0E1bWiI )
  • 17. 1. create transparency (투명성을 높임) 대표적으로 사기적발과 같은 유형의 적용사례가 이런 경우일 수 있음. 테러리스트 색출을 위해 의심스러운 대상과 그와 연결된 (통화내역, 페이스북 친구, 이메일 송 수신자 등) 네트워크등을 분석해 허브를 찾아내고, 추가적인 의심 대상을 색출하 는 등의 경우도 예가 됨. 기업내에서 내부적인 부정을 밝히는 작업도 이에 해당될 수 있음. 비정형적인 데이터가 분석될 수 있는 개연성이 높으며, 소셜네트워크 등 관계 데이터가 유용하게 사용될 수 있음. 주식시장에서 특정 종목이 작전에 의해 움직인다고 했을때 그 움직임에 대해 의심 하고 있는 사람들의 생각이 조기에 공유될 수 있도록 하는 프로세스가 존재한다면 이 역시 공공의 이익을 위한 투명성 제고의 대표적인 사례가 될 수 있을 것임
  • 18. 2. expose variability and enable experimentation (변화/변 경에 노출시키고 실험을 가능하게 함) 상품이나 마케팅 정책 등을 구분해서 수행하고 그에 대한 반응을 수집하여 새로운 상품이나 마케팅 정책을 만들어 내는 것이 예가 될 수 있음 3. segement populations to customize actions (활동에을 맞춤형으로 하기 위해 그 대상을 세분화함) 아마존이나 야후의 타겟 캠페인과 개인화, 타겟 광고 등 맞춤형 마케팅이 대표적 인 예가 될 수 있음. 광고 뿐 아니라 서비스를 고객의 요구와 상황의 특성에 따라 수행하는 것도 이 유형에 해당함 4. replace/ support human decision making (인간의 의사 결정을 대체하거나 지원함) 통적인 의사결정지원과 자동화의 범주에서 완전히 벗어난다기 보다는 다양한 유 형의 데이터를 활용하고, 특정 목적을 위해 수집된 소량의 표본 대신 대량의 데이 터를 사용한다는 측면에서 진일보 된 것으로 볼 수 있음. 정량적인 분석의 한계인 '왜 이런가, 왜 이 것이 바람직한가' 등에 대한 답 내지는 힌트를 제공할 수 있다는 점에서 가치를 줌
  • 19. 5. innovation of biz models, products, and services (비지 니스 모델, 상품, 서비스 등에 혁신을 이룸) 링크드인이 전문인력들의 네트워크를 사업모델의 대상으로 만든 것이 대표적인 사례. 링크드인은 데이터를 가공해서 만들어진 새로운 정보를 '상품(data product)'으로 제공하고 이로 부터 수익을 창출하고 있음. 고객들 스스로 또는 고 객들이 상호간 협력하여 A/S를 수행할 수 있도록 하는 경우 즉, self service 내지 는 collaborative service 기능을 제공하여 고객의 만족과 편의성, 기업측의 비용절 감을 동시에 얻는 것도 방안이 될 수 있음
  • 20. 빅데이터사례 :: SCDF, 응급환자 발생 예측으로 구급차 출동시간 단축 :: 21세기 대약진 운동, 중국 빅 데이터 :: 전 세계 빅데이터의 심장이자 엔진 - 인도 :: 새로운 기준을 위한 다른 데이터를 수집, 분석한다 - 오클랜드 :: 관련 데이터를 모두 다 수집한다 - 독일 축구 :: 도쿄 택시협회의 배차 앱 :: 건강상태를 자세하게 파악하여, 보험료를 바꾸는 AXA 생명 :: 부족한 데이터를 다른 회사와 제휴하여 수집 - 소니은행 :: 일본 덴소의 외부 데이터를 연계한 지능형 HEMS :: 빅데이터 분석으로 고객의 쇼핑 경험을 변화시키는 메이시 :: WOWOW 과거에 모아 두었지만 사용 안 했던 데이터를 사용 :: 아마존의 빅데이터 활용 - 개인화와 예측 :: 링크드인, 세계 경제 지도를 바꾼다 :: GE의 산업 인터넷 IoT :: 히다치 조선 불꽃 사진 데이터 이용 :: 월마트는 빅데이터를 회사의 DNA로!
  • 21. 빅데이터사례 :: 일본의 콜센터 TMJ 통화 최적화 :: 일본의 하꾸이시 위성 사진 이용 :: ㈜오타니의 공간데이터 활용 부동산 가격 예측 :: 미국의 자동차 보험회사 프로그레시브 :: 쓰레기 처리 및 재활용 회사 미국의 루비콘 :: 애플 - IBM 동맹 기업용 모바일 앱 :: 알리바바 - 새로운 공룡 :: 맛집 추천, 못 믿겠다 파워플로거 - 다이닝 코드 :: 다이닝코드 :: 영화 뭐 볼까? - 왓챠가 알려줄게! :: 전국 지역 축제, 예측으로 사업 기회 확대를 :: 서울심야버스, 이미 성공한 것일까? :: 성남시, 빅 데이터 활용 - 선진 도서 행정 서비스 :: 개방된 공공 데이터는 무제한의 가능성을 담고 있다 :: 의회의 법안도 분석하고 예측한다
  • 22. Case Study 1. 빅데이터로 맛을 증명하는 미국의 [푸드 지니어스] 2. 오늘의 정보로 내일의 패션 트렌드를 읽는 미국의 [에디트] 3. 빅데이터 매쉬업으로 부동산 가격을 정확히 예측하는 미국의 [질로우] 4. 신체 일부분이 발에 관한 빅데이터를 모아 상업화시킨 일본의 [아이웨어랩] 5. 빅데이터를 이용해 미이크로 맞춤 광고 시대를 여는 미국의 [로켓 퓨얼] 6. 학습과정의 취약점을 빅데이터로 찾아내, 학습성과를 높이는 미국의 [뉴턴] 7. 중소기업이 빅데이터로 180년 전통을 깨고 신사업에 나서서 성공한 일본의 [이토큐우에몬]