9. Ⅲ 정형 + 비정형 데이터 이슈
정보의 단절
STRUCTURED UNSTRUCTURED
DATA SILO DATA SILO
SEARCH ENGINE
BUSINESS INTELLIGENCE
Dashboards, performance metrics, cubes
PPT DOC JPG MP3
“UNSTRUCTURED” CONTENTS
“STRUCTURED” BUSINESS DATA
email, documents, media, web pages, etc.
Databases, data warehouses, ERP, CRM, etc.
9 / 43
10. Ⅲ 비정형 데이터 활용의 문제
2,502 exa(1018)bytes by 2012
49% ??
“나의 업무수행에
필요한 정보를 찾는 것은
어렵고 시간이 많이 드는
일이다”
Source: AIIM Survey, “
기업에서의 정보 검색이
웹 검색보다 어렵다”
Source: the Digital Universe Expands, IDC
http://www.storagenewsletter.com/news/miscellaneous/idc-digital-information-created
10 / 43
12. Ⅳ UIA Platform의 필요성
Unified Information Access
“사람들은 정보가 존재하는 위치에 상
관 없이, 비즈니스 정보의 접근을 원
하고 있다.”
“다음 시기의 비약적인 생산성 증대는 정
형/비정형데이터를
통합 분석하는 IT시스템으로부터
올 것이다. 그러한 IT시스템은 비즈니스
운영의 모든 측면의 발전을 가져다 줄 것
이다.”
12 / 43
13. Ⅳ UIA 데이터 프로세스
UIA Platform
정형 정보 Connector Ingest
SINGLE ACCESS POINT
통합
고객정보 DM DW
통합정보분석
비정형 정보
Harvester Ingest
13 / 43
15. Ⅳ UIA (Unified Information Access)의 세부 기능
TM
UIA(Unified Information Access) Platform
Query-time JOIN Sentiment Analysis
Keyword Extraction Adapter/Harvester
(Attivio 특허 기술) (Document/Entity)
Documents Homepage
Blog, Community, Portal contents CMS
ERP text on bulletin
BI Server Social sites such as Twitter
News, Magazines Call Center Commerce
CRM Site
Data Documents, reports on Web plain text buyer
Warehouse on customers comments
Regulation Web Sites
Maps email attached files
Other Web Sites messaging
Business
Systems Mail Server/ text on reports or scanned images
External Databases (Open API) Groupware
15 / 43
18. Ⅳ Innovative Tech. for UIA: Query-time JOIN
“자전거 이용이 는다는데 관련된 금융상품이 우리도 있나?”
>>> “그런 상품을 이용하는 고객들은 누구지?”
UIA with Query-time JOIN
SINGLE ACCESS POINT
UIA Platform No JOIN Table
이슈 on SA 상품DB 약관문서 고객DB 거래DB
18 / 43
19. Ⅳ Keyword · Facet Recommendation
원인 분석, 이슈 포착 등 분석의 힌트나 마케팅 insight를 제공
고유명사
해당 영역 전문용어
컨텐츠 빈도/연관도 모델
생성 Facet Definition
무의미 명사
사전
제거
19 / 43
20. Ⅳ Sentiment Analysis
언어에 무관하게 학습 엔진(Machine Learning)에 의한 모델 형성과 판단 수행
재학습
새로운 컨텐츠
긍정샘플 부정샘플 UIA CORE
UIA CORE 엔진
엔진
완죤 Tokenizer: 형태소 분석
잘
ㅋㅋ
하다+ㅐ요 Tokenizer: 형태소 분석 Lang. Analysis: 동의어처리 등
!!!
완죤 3:2 Sentiment Model Builder:
2:1
5:3 3:7 잘 언어통계학적 관계성 분석 분석
ㅋㅋ 2:1
1:1 5:3
모델
4:2 하다
!!! 1:1
모델
생성
X Positive +0.63
판단 오류
Negative -0.21
20 / 43
22. Ⅴ 어떤 임원도 몰랐던 주가 폭락의 이유
불만 제기 고장판명
(9개월 소요)
(08.3.31)
밴드 동료
‘United Breaks Guitars’
(15개월 후, 09.7.6)
어떤 임원도 밴드
원인을 파악하지 못함
UA요청거부
• 조회수 1천만+
• 타임지 선정
4일 만에 UBG #2, #3
“2009년 Top 10
주가 10% 폭락
동영상”
22 / 43
23. Ⅴ SNS 활용 브랜드 관리의 필요성
브랜드 가치 하락 방어
불의의 사고나 악성 루머로부터 오랜 투자를 통해 쌓아온 브랜드
가치 보호
소셜 미디어를 통한 브랜드 가치 타격에 대한 효과적인 조기 진화
멕시코만 원유유출 타격
•BP(British Petroleum)의 기록적인 원유유출 사고발생
•TV광고 등 전통적인 미디어관리에만 집중하고, 소셜미디어 간과
개요 •BP를 조롱하는 가짜 트위터 계정이 큰 인기를 끄는 동안 대응조치 없
었음
•뒤늦게 공식트위터를 개설하였 으나, 가짜 트위터 팔로워가
결과 공식트위터의 10배가 넘는 대표적 기업이미지 실추사례
23 / 43
24. Ⅴ Brand Mgt. System 도입 효과
소셜 관리 생산성 증대
1인 미디어 성격의 소셜 미디어 특성상 인력 리소스가 많이 소요
메시지 배포/이벤트 관리뿐만 아니라 체계적 분석과 진화전략 필요
메시지 배포 관리
소셜 이벤트 관리
소셜 미디어 관리 인력 100명
소셜 분석
개 • 소셜 미디어에서의 브랜드 타격 경험
요 후 소셜 마케팅에 적극 대응으로 전화
활 • 종류별 33개 트위터 계정 운영
• 9개의 블로그와 아이디어 스톰
동 (Idea Storm) 등 다수 커뮤니티 운영
성 • 2009년, 트위터를 통해 $6.9M(80억원)
과 추가 매출
24 / 43
25. Ⅴ SNS 대응 현황
인력에 의존
실험적 시도, 따라하기식 유행
지속적인 관리나 추이 분석 어려움
컨트롤이 쉬운 ATL(4대 매체) 중심 운영
실질적인 인사이트 도출에는 실패
25 / 43
27. Ⅴ 브랜드 관리를 위한 소셜 미디어 분석
Monitoring
Influencer
Trend
Sentiment
Campaign Performance
27 / 43
28. Ⅴ 소셜 미디어 핵심 분석 포인트
STEP2 • LISTEN!
STEP1 • Establish Goals
STEP3 • Analyze and Optimize
1차 분석 2차 분석
이슈는 무엇인가?
만족도나 선호도는? 노출도
지속성
어떤 이야기가 지속되나? (전파율)
누가 부정적 영향력자인가? 사람 유형
누가 민원신청자인가? 도달율
민원의 원인은 무엇인가? 관계 분석
영향력자
얼마나 펴졌는가? 분석
키워드/속성
누가 관심을 갖는가? 추출
어떤 반응인가? 경쟁 비교
누가 영향력자인가?
감성 분석
누가 정책 대상인가? 성과 분석
누가 대중을 주도하는가? 성과 지표
28 / 43
29. Ⅴ 게시글 효과분석 (H카드)
게시글 키워드 전반적인
연관 키워드 감성도 분석
파악 (부정의견 추출)
(확장 분석)
Facet1) List
(검색필터)
출처
- twitter (1,234)
- facebook (567)
카드사 노출도와 감성도
시계열 분석 게시글에 대한 영향력자 분석
- 현대카드(934)
- 삼성카드 (512)
- 신한카드 (12) SocialRank
이벤트
- 칼러짚1004 (823)
- 블로그리뉴얼 (244)
활동 유형
- Tweet (535)
- Retweet (321)
- Reply (482)
- Posting (202) Fan/Follower 증가 효과 8 캠페인 성과 고급 분석
- Comment (101)
- Like (99)
29 / 43
30. Ⅴ 빠르고 신속하게! (H카드)
이슈 글 게재 데이터 수집 이슈 감지 이슈 분석 이슈 대응 대응 완료
데이터 수집 주기 알람 체크 주기
최대 알람까지 기본 알람 기준 + 사용자 경보 설정 이슈 트렌드 모니터링 및 분석
최대 소요시간
정확도 높은 감성분석을 통한 기관, 주요인물, 정책 등
Positive Negative Neutral 판정 이슈 주제에 대한
[소셜피플관리]
SocialRank
노출도 키워드 소셜 영향도
30 / 43
31. Ⅴ SNS 데이터 분석 예시 (무상급식과 서울시장 보선)
(총 데이터 건수 : 67,360 건)
안철수 서울시장 후보 단일화 곽노현
오세훈 시장 사퇴
출마선언 선언 교육감 구속
31 / 43
32. Ⅴ SNS 데이터 분석 예시 (빼빼로 데이)
INSIGHT
빼빼로 만들다 2676
• ‘사다’ 와 ‘만들다’ 트윗노출도가 비슷한
수준 → 빼빼로 DIY 시장수요 큼
빼빼로 사다 3093 • 빼빼로를 만드는 경우 핵심적인 재료
선택 기준은 위생 및 안전
0 1000 2000 3000 4000 향후 빼빼로데이 판매제품 선정에 참고
노출수
금요일 월요일 빼빼로 데이
100%
INSIGHT
80%
• 수동적 액션(RT)가 많은 출근 첫날인 월요일에 60%
RT이벤트나 대화 화두제공이 효과적일 것 40%
20%
• 뺴빼로데이 당일 및 금요일의 높은 TW비율은
유저들의 능동적인 대화자세를 의미 0%
← 유저의 액션을 필요로 하는 퀴즈 이벤트 등
RP RT TW
32 / 43
33. Ⅴ Social Analytics 기반 Brand Management 효과
브랜드 가치 하락 방어
Brand 비용 효율적인
차별적 정보자산 구축
Management 광고 효과
Social Analytics
소셜 관리 생산성 증대 마케팅 조사비용 대체
33 / 43
35. Ⅵ ARM 도입 배경 및 필요성
How do you get information about
regulation change??
부처별 전체 2011년 현재
12,905건의 규제 존재
국내 규제 건수 연 평균 8% 증가
할인점 영업규제 손실 연 5조원
35 / 42
36. Ⅵ ARM (Active Regulatory Mnagement)
Monitor
Regulatory
Changes
Active Regulatory Management
Document Link to Internal
Compliance Policies
• UIA 적용 솔루션
Push to Key
• 자동화된 규제변화 감지 및 업데이트 Personnel by
Role
• 기업의 컴플라이언스 리스크, 비용, 브랜
드손상의 감소
• 고객사 경쟁력 강화
36 / 42
37. Ⅵ ARM 도입사례
Problem
200명
Effect
Solution
UIA_ARM 2000만 $
37 / 42
38. Ⅵ 고객의 경험을 무시하지 말라
기존 CRM에 대해 기업들
약 62% 불만족
단일 채널이 아닌
다양한 고객 접점 채널
대상이 기업위주가 아닌
고객 주도형 시대로의 변화
38 / 42
39. Ⅵ CEM (Customer Experience Management)
Customer Experience Management
Retail Telephone
• 고객관계 강화를 위한 UIA 솔루션
• 고객경험 강화를 위한 고객 인터랙션 접
점
관련 데이터 및 콘텐츠 수집
• 추가판매 및 교차판매 기회 증대
• 부정적 고객 이벤트의 최소화
• 기업의 대고객 경쟁력 강화 및 추가 이윤
Website Social Media 창출
39 / 42
40. Ⅵ CEM 도입사례
Effect
Problem 260%
80개
Solution
UIA_CEM
40 / 42