Big Data Use Cases

Big Data Use
DevNexus Conference
2/18/2013

*Fully buzzword-compliant title

1

*
Cases

whoami
•

Brad Anderson

•

Solutions Architect at MapR (Atlanta)

•

ATLHUG co-chair

•

NoSQL East Conference 2009

•

“boorad” most places (twitter, github)

•

banderson@maprtech.com
2

Mobile

Virtualization

Social
Media

B2B

Application Service Provider

Cloud
Client/Server
Web 2.0

Service Bureau

Software-as-a-Service
3

Big Data is not new!
but the tools are.

8

Ship the Function to the Data
Distributed Computing

Traditional Architecture
function

function

data

data

function

data

data

function

function

data

data

function

data

RDBMS

function

data

data

data

data

data

data

data

data

function

function

function

data

data

data

data

data

data

data

data

data

function

function

function

data

data

data

SAN/NAS

9

Variation: Multiple MapReduces
Example: Fraud Detection in User Transactions
MapReduce

Transaction
data

LDA training
LDA scoring

G2 score

95 %-ile LDA anomaly

HBase /
MapR M7 Edition

Candidate events
for analyst review
http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation
10

MapR Distribution for Apache Hadoop


Complete Hadoop
distribution



Comprehensive
management suite



Industry-standard
interfaces



Enterprise-grade
dependability



Higher performance
11

Use Case
Company
 Data Source(s)
 Technique(s)
 Business Value


13

Data Sources

Server Telemetry
 Monitoring Logs
 Network Flow


15

Techniques

Pattern Recognition
 Proactive Monitoring
 Early Alert Delivery


16

Telecommunications Giant

ETL Offload
18

Telecommunications

Data Sources

Customer Records
 Contract Data
 Purchase Orders
 Call Center


19

Telecommunications

Techniques
Analytics

ETL

20

Telecommunications

Techniques

+
ETL (Hadoop)

Analytics (Teradata)
21

Telecommunications

Business Value

22

Credit Card
Issuer

Data Sources

Customer Purchase History
 Merchant Designations
 Merchant Special Offers


23

Credit Card
Issuer

Techniques
Hadoop
Purchase
History

Export
(4 hrs)

App
App

Merchant
Information

Recommendation
Engine Results
(Mahout)

Presentation
Data Store
(DB2)

App
App

Merchant
Offers

App

Import
(4 hrs)
24

Credit Card
Issuer

Techniques
Hadoop
Purchase
History
Merchant
Information

Recommendation
Engine Results
(Mahout)

Index
Update
(2 min)

App
App

Recommendation
Search Index
(Solr)

App
App

Merchant
Offers

App

25

Credit Card
Issuer

Business Value

26

Waste & Recycling Leader

Idle Alerts
27

Data Sources


Truck Geolocation Data

20,000 trucks
– 5 sec interval
–



Landfill Geographic Boundaries
28

Techniques
Realtime Stream Computation
(Storm)

Truck
Geolocation

Data

Hadoop
Storage

Immediate
Alerts

Batch Computation
(MapReduce)

Tax Reduction
Reporting

Shortest Path
Graph Algorithm

Route
Optimization

29

Data Sources



Anti-Money Laundering
Consumer Transactions

32

Techniques
Anti-Money Laundering
System

Consumer Transactions
System

33

Techniques
AML
Data Lake
(Hadoop)

Suspicious
Events

Consumer
Transactions

Analyst
Latent Dirichlet Allocation,
Bayesian Learning Neural Network,
Peer Group Analysis
34

Machine Learning
Search Relevance
DNA Matching
36

Data Sources

Birth, Death, Census, Military, I
mmigration records
 Search Behavior Activity
 DNA SNP (snips)


37

Techniques
Record Linking
 Search Relevance
 Clickstream Behavior
 Security Forensics
 DNA Matching


38

Data Sources


Inrix Road Segment Data

Avg Speed / minute / segment
– Reference Speeds
–



Road Segment Geolocation Data
41

Techniques
 Bottleneck Detection Algorithm
 Time Offset Correlations
–



Alternate Routes

Predictive Congestion Analysis

–

Growth & Term Assumptions
42

Similar Characteristics
Lots of Data
 Structured, Semi-Structured, Unstructured
 Varied Systems Interoperating
– Hadoop, Storm, Solr, MPP, Visualizations


Increase Revenue
 Decrease Costs


46

Big Data Use Cases

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Big Data Use Cases

Similar a Big Data Use Cases (20)

Más de boorad

Más de boorad (12)

Último

Último (20)

Big Data Use Cases

Notas del editor