Effiziente Verarbeitung von großen Datenmengen

Eﬃziente Verarbeitung von großen Datenmengen
Andreas Eisenkolb

January 7, 2014

Andreas Eisenkolb


January 7, 2014

1 / 11

Inhaltsverzeichnis

1

Big Data

2

MapReduce

Andreas Eisenkolb


January 7, 2014

2 / 11

Big Data

Andreas Eisenkolb


January 7, 2014

3 / 11

Big Data

speichert ca. 2,5 Petabytes
1 Petabyte = 1 048 576 Gigabytes
IBM Festplatten-Cluster speichert 20 Petabayte
1

1

Quelle: http://www.dailytech.com/article.aspx?newsid=22558
Andreas Eisenkolb


January 7, 2014

4 / 11

Was versteht man unter Big Data?

Big Data
Big Data bezeichnet große Datenmengen aus vielf¨ltigen Quellen, die mit
a
Hilfe neu entwickelter Methoden und Technologien erfasst, verteilt,
gespeichert, durchsucht, analysiert und visualisiert werden k¨nnena .
o
a

Wissenschaftliche Dienste des Deutschen Bundestages

Andreas Eisenkolb


January 7, 2014

5 / 11

Big Data Challenge

Andreas Eisenkolb


January 7, 2014

6 / 11

Die 4 ”Vs” von Big Data

Andreas Eisenkolb


January 7, 2014

7 / 11

Was ist MapReduce?

MapReduce
MapReduce ist ein vom Unternehmen Google Inc. eingef¨hrtes
u
Programmiermodell f¨r nebenl¨uﬁge Berechnungen uber große
u
a
¨
Datenmengen auf Computerclustern.

Andreas Eisenkolb


January 7, 2014

8 / 11

Warum MapReduce?

Eﬃziente Verarbeitung großer Datenmengen
Einfache Benutzung (Fehlerbehandlung, Datenverteilung, etc.)

Andreas Eisenkolb


January 7, 2014

9 / 11

MapReduce

Andreas Eisenkolb


January 7, 2014

10 / 11

Andreas Eisenkolb


January 7, 2014

11 / 11

Effiziente Verarbeitung von großen Datenmengen

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (13)

Más de Florian Stegmaier

Más de Florian Stegmaier (16)

Effiziente Verarbeitung von großen Datenmengen