Grizzly: Efficient Stream Processing Through Adaptive Query Compilation

Grizzly: Efficient Stream Processing
Through Adaptive Query Compilation
Philipp M. Grulich¹, Sebastian Breß², Steffen Zeuch¹², Jonas Traub¹,
Janis von Bleichert¹, Zongxiong Chen², Tilmann Rabl³, Volker Markl¹²
Technische Universität Berlin¹, DFKI GmbH², HPI & Universität Potsdam³
1

Sigmod 2020, Grizzly: Efficient Stream Processing Through Adaptive Query Compilation, Grulich et al.
Limitations of state-of-the-art SPEs
Current SPEs use hardware resources inefficiently [Zeuch et al., Zhang et al.]
2

3
1. Interpretation-based processing model causes poor cache utilization.

4
2. Upfront-Partitioning causes high overhead on single nodes.

5
3. SPEs do not react to changing data-characteristics at runtime.
Data Stream

6
3. SPEs do not react to changing data-characteristics.
An SPE should be hardware- and data-conscious.

Our Proposal
Grizzly: Efficient Stream Processing Through
Adaptive Query Compilation
7

Grizzly’s Core Principles
Order Preserving
Task-based Parallelization
Continuous Adaptive
Optimizations
8
Query Compilation for
Stream Processing

Stream Processing
● Fuses operators to
compact code blocks.
● Support unique stream
processing operators.
9
Order Preserving
Continuous Adaptive
Optimizations

Query Compilation
10
From(user_purchases )
.filter(origin=’Germany’)
.keyBy(userid)
.windowBy(TumblingWindow(days(7)), Max(price).as(max_price))
.filter(max_price > 42)

Stream Processing
● Fuses operators to
compact code blocks.
● How to support
combination of
window assignment,
function, and trigger?
Order Preserving
● Concurrent execution
on a global state.
● Supporting order
requirement of stream
processing.
● Exploiting
NUMA-conﬁguration.
11

12
● Input stream is processed in small batches (sized to network buffer).
● Pipelines are executed concurrently on a shared state.

Lock-Free Window Processing
● Allows threads to process
windows concurrently.
● Lightweight coordination for
window triggering.
NUMA-awareness
● Pre-aggregate window results on
locally to minimize inter-NUMA
node communication.
13

Order Preserving
Continuous Adaptive
Optimizations
● Feedback loop between
code-generation and
query execution.
● Lightweight monitoring
at runtime.
14
Stream Processing

Adaptive Re-Optimization
Generic Execution:
● Without data-dependent optimizations.
15
Instrumentalized Execution:
● Injects profiling code to collect statistics.
(predicate selectivity, value distribution)
Specialized Execution:
● Specialize operator implementation
(predication, fixed hash-tables)

Adaptive Optimization
16
Deoptimization:
● Migrates from optimized to less optimized execution.
● Caused by violated assumptions or changed data characteristics.

Evaluation
17

Grizzly outperforms state-of-the-art SPEs by up-to 10x.
Evaluation: System Comparison
18

Code generation is beneficial for a wide range of workloads.
Evaluation: Workloads
19

Evaluation: Adaptive Optimizations
Adaptive optimizations are crucial to reach peak performance.
20

Summary
www.nebula.stream
@NebulaStream
Grizzly:
● Query compilation for stream processing.
● Task-based parallelization while taking ordering
requirements into account.
● Adaptive optimization to reach to changing data
characteristics.
21

Query Compilation
22

System Architecture
23

Grizzly: Efficient Stream Processing Through Adaptive Query Compilation

Recomendados

Recomendados

Más contenido relacionado

Similar a Grizzly: Efficient Stream Processing Through Adaptive Query Compilation

Similar a Grizzly: Efficient Stream Processing Through Adaptive Query Compilation (20)

Último

Último (20)

Grizzly: Efficient Stream Processing Through Adaptive Query Compilation