Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

Building a Distributed Data Pipeline

523 visualizaciones

Publicado el

Spark, Akka, MLlib, Kafka, Spray
Presentation & demo for http://www.daysofcode.nl/ @daysofcode

Publicado en: Software
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Building a Distributed Data Pipeline

  1. 1. BUILDING A DISTRIBUTED MACHINE LEARNING AT SCALE
  2. 2. BACKGROUND DATA ▸Data is everywhere ▸Data, unapplied, is useless ▸How can we turn high volume & velocity data into value?
  3. 3. BACKGROUND PIPELINE ▸Process the data continuously ▸Apply several processing steps COLLECT MODEL DEPLOY INTEGRA TE
  4. 4. SOLUTION ANALYSE THE STOCK MARKET YAHOO.C OM YAHOO.C OM (PREFETCHED) COLLECTO R MESSAGE BROKER STREAMIN G STORAGE MODEL MACHINE LEARNING MLlibWEBSERVI CE USER / CLIENTS
  5. 5. DEMO DEMO (FINGERS CROSSED)
  6. 6. DONE QUESTIONS? ▸?

×