SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
22.10.2013

BigData und BigQuery
Siegfried Stepke & Lukas Wojcik, e-dialog

Google bietet eine Schnittstelle von Analytics zu BigQuery, seiner Big Data Engine.
Was kann das bringen?

WAS IST EIGENTLICH BIG DATA?

1
22.10.2013

Big data is like teenage sex:
everyone talks about it,
nobody really know how to do it,
everyone thinks everyone else is doing it,
so everyone claims they are doing it…

• Was ist BigData?

2
22.10.2013

Unter uns gesagt:

Big Data ist eine willkommene Ausrede,
bisherige Versäumnisse in der DatenAnalyse aufzuholen.
Voraussetzungen:
• Ziele - Business Objectives
• Datenqualität
Dann reicht oft schon „small data“

Warum also?
•
•
•
•

Große Datenmengen strukturiert untersuchen
Abfolgen erkennen
Anreichern
Mit Rohdaten arbeiten

3
22.10.2013

Use Cases
• Besucherverhalten in sehr langen Zeiträumen
analysieren:
– „Welche Website Bereiche hatten die höchste
Volatilität in der Absprungrate zwischen 2010 und
2013?“

• Komplexe Flows untersuchen:
– “Aus welchen Quellen kamen User, die im CheckoutProzess ausstiegen um innerhalb von 10 Minuten mit
einem Voucher-Code den Prozess abzuschließen?
Welche Codes waren das?”

Use Cases
• Daten anreichern und abfragen:
– z.B. Autoren-Details: “Zeig mir die Engagement-Rate
meiner Top-100 Autoren nach Channel in 2012”
– Z.B. nachträglich Produkt-Attribute dazuladen: “Zeig
mir alle Warenkörbe, die rote Produkte enthielten im
Vergleich zu Produkten aus Leder”

• Data-Warehouse Integration:
– “Mache eine wöchentliche Auswertung der
eingeloggten User, schreibe die Top-5 angesehenen
aber nicht gekauften Produkte in unser CRM.”

4
22.10.2013

Use Cases
• Komplexe Anreicherung
– Wetter Daten nach Datum und Region
– Geographische Informationen wie
• Durchschnittliche Haushaltseinkommen
• Einwohnerdichte
• …

GOOGLE‘S BIGQUERY

5
22.10.2013

Was ist Google BigQuery?
• Ein Web Service, das interaktive Analysen an
riesigen Datensets bis zu Milliarden Rows
ermöglicht.

Google BigQuery empfiehlt Tabellen nicht
relational aufzubauen,
sondern
denormalisiert
Relational

Denormalisiert

6
22.10.2013

Um Redundanz zu vermeiden, sollten Tabellen
verschachtelt (nested)
erstellt werden:
Denormalisiert

Verschachtelt

SQL-Like Queries; Nur Abfragen (kein INSERT
und kein UPDATE)

7
22.10.2013

Datenimport
• Optionen:
•
•

Direkt Upload (Browser Tool)
API
•

•
•

Streaming

Google Cloud Storage
Google Analytics Premium

Datenimport
API CSV Limits
•
•

Maximale Zeilen & Spaltenlänge:
Maximale Dateigröße beim Upload:
• Komprimiert:
• Unkomprimiert, mit Zeilenumbrüchen:
• Unkomprimiert, ohne Zeilenumbrüche:

1 MB
1 GB
4 GB
1 TB

8
22.10.2013

Datenimport
API JSON Limits
•
•

Maximale Zeilenlänge:
Maximale Dateigröße beim Upload:
• Komprimiert:
• Unkomprimiert:

20 MB

1 GB
1 TB

Datenimport
API
•

Verschiedene fertige Libraries für
•
•
•
•
•
•
•

•

.NET
Java
PHP
JavaScript
Python
Ruby
etc…

Daten Live Streamen möglich

9
22.10.2013

Schnittstelle
•
•
•
•

Täglicher Upload der gesammelten Daten
(unsampled)
Auf Session-Level inklusive aller Session-Hits(!!!)
nested inklusive Timestamps. Jede Session ist eine
Zeile.
D.h. wir haben es ab nun erstmals in GA mit
Rohdaten zu tun, die uns zur Verfügung stehen!
Ermöglicht damit vorige Use-Cases und z.B. TVTracking!

Import aus Google Analytics per CSV
Nur aggregierte, gesampelte Daten mit eingeschränkten
Attributen…
1. Google Analytics Report öffnen
2. Höchstmögliche Anzahl Zeilen
auswählen:
3. CSV Datei exportieren:

10
22.10.2013

Datenimport
Import aus Google Analytics per CSV

4. Neues Dataset

6. CSV Datei
auswählen
5. Create and Import

Oder über die APIs automatisiert…

Vergleich
• Rohdaten
• Un-sampelt
• Abfolgen innerhalb von
Sessions verfügbar
• Alle Attribute
denormalisiert verfügbar

• Aggregierte Daten
• Gesampelte Daten
• • Dimensionen können nur
soweit es die API im Export
erlaubt gemeinsam
ausgewertet werden

11
22.10.2013

ABFRAGEN UND REPORTING

Abfragen und Reporting
• Browser-Tool
• Command Line Interface
• API
– Selbst programmiert
– Von Google
• XLS Connector
• Fusion Tables

– Third Party…

12
22.10.2013

Demo

13
22.10.2013

Das Produkt
•

•
•

•

Analyse riesiger Datenmengen ohne ein Datenzentrum zu
betreiben.
Jederzeit kündbar.
Jederzeit eigene Daten
löschen.
2 Preiskomponenten:
•
•

Ausgeführte Abfragen
Belegter Speicherplatz

14
22.10.2013

BigQuery Preise
• On-Demand
•
•
•
•

Speicherplatz

100GB gratis
$80 (per TB/Monat)
Interaktive Abfragen $35 (per durchlaufenen TB)
Batch Abfragen
$20 (per durchlaufenen TB)
Inserts streamen
Kostenlos bis 01.01.2014
(danach $0.01 per 10.000 eingefügte Zeilen)

BigQuery Preise
• Paketpreise
•
•
•
•

100 TB
400 TB
1.500 TB
4.000 TB

$3.300 / Monat ($33 per TB)
$12.000 / Monat ($30 per TB)
$40.500 / Monat ($27 per TB)
$100.000 / Monat ($25 per TB)

(On Demand: $80 per TB)

15
22.10.2013

Premium only
• Sprechen Sie mit uns, wenn für Sie relevant!
• e-dialog ist

Vielen Dank!

16
22.10.2013

Voraussetzungen
•
•

Google Account anlegen
Billing im API Center aktivieren:
•

•

https://code.google.com/apis/console/

Neues Dataset in BigQuery anlegen:
•

https://bigquery.cloud.google.com

API Center

17
22.10.2013

Google API’s Rechtevergaben

18

Más contenido relacionado

Más de e-dialog GmbH

GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)
GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)
GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)e-dialog GmbH
 
GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)
GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)
GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)e-dialog GmbH
 
GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...
GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...
GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...e-dialog GmbH
 
GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)
GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)
GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)e-dialog GmbH
 
GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...
GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...
GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...e-dialog GmbH
 
Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)
Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)
Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)e-dialog GmbH
 
Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...
Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...
Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...e-dialog GmbH
 
Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...
Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...
Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...e-dialog GmbH
 
Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...
Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...
Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...e-dialog GmbH
 
Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...
Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...
Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...e-dialog GmbH
 
Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...
Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...
Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...e-dialog GmbH
 
Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...
Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...
Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...e-dialog GmbH
 
Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...
Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...
Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...e-dialog GmbH
 
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...e-dialog GmbH
 
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...e-dialog GmbH
 
Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...
Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...
Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...e-dialog GmbH
 
Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...
Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...
Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...e-dialog GmbH
 
Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...
Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...
Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...e-dialog GmbH
 
Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)
Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)
Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)e-dialog GmbH
 
Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...
Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...
Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...e-dialog GmbH
 

Más de e-dialog GmbH (20)

GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)
GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)
GMP-Con 2019 - Programmatic Display mit DV360 - Lisa Weichselbaum (e-dialog)
 
GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)
GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)
GMP-Con 2019 - Facebook & Google Analytics in Love - Michaela Linhart (e-dialog)
 
GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...
GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...
GMP-Con 2019 - Enterprise Ausblick, CRM, Machine Learning, Cloud - Siegfried ...
 
GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)
GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)
GMP-Con 2019 - Enhanced E-Commerce - Markus Vollmert (lunapark)
 
GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...
GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...
GMP-Con 2019 - Conversion Optimierung mit Analytics + Optimize - Sophie Kubec...
 
Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)
Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)
Google Analytics Konferenz 2019_Kampagnen-Tracking_Holger Tempel (webalytics)
 
Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...
Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...
Google Analytics Konferenz 2019_App Tracking_Runa Reno (Booking.com) & Markus...
 
Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...
Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...
Google Analytics Konferenz 2019_Attribution: building a model_Martin Frotzler...
 
Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...
Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...
Google Analytics Konferenz 2019_Audience Management_Emma Crawford-Prajapati (...
 
Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...
Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...
Google Analytics Konferenz 2019_Data Privacy & Consent Management_Eckart Holz...
 
Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...
Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...
Google Analytics Konferenz 2019_Conversion Optimierung mit Analytics & Optimi...
 
Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...
Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...
Google Analytics Konferenz 2019_Customer Data Platform_Michaela Linhart (e-di...
 
Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...
Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...
Google Analytics Konferenz 2019_Customer Data Platform_Timo von Focht (Comman...
 
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Siegfr...
 
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...
Google Analytics Konferenz 2019_Google Marketing Platform - Enterprise_Oleg P...
 
Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...
Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...
Google Analytics Konferenz 2019_Google Tag Manager Hacks - für jeden etwas da...
 
Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...
Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...
Google Analytics Konferenz 2019_Machine Learning in der Praxis_Kateryna Salii...
 
Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...
Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...
Google Analytics Konferenz 2019_Google Cloud Platform_Carl Fernandes & Ksenia...
 
Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)
Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)
Google Analytics Konferenz 2019_Search Ads 360_Axel Täubert (Google)
 
Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...
Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...
Google Analytics Konferenz 2019_Personalisierung: Werbemittel & Website_Qin L...
 

Google Analytics Konferenz 2013: S. Stepke & L. Wojcik, e-dialog: Big Data

  • 1. 22.10.2013 BigData und BigQuery Siegfried Stepke & Lukas Wojcik, e-dialog Google bietet eine Schnittstelle von Analytics zu BigQuery, seiner Big Data Engine. Was kann das bringen? WAS IST EIGENTLICH BIG DATA? 1
  • 2. 22.10.2013 Big data is like teenage sex: everyone talks about it, nobody really know how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it… • Was ist BigData? 2
  • 3. 22.10.2013 Unter uns gesagt: Big Data ist eine willkommene Ausrede, bisherige Versäumnisse in der DatenAnalyse aufzuholen. Voraussetzungen: • Ziele - Business Objectives • Datenqualität Dann reicht oft schon „small data“ Warum also? • • • • Große Datenmengen strukturiert untersuchen Abfolgen erkennen Anreichern Mit Rohdaten arbeiten 3
  • 4. 22.10.2013 Use Cases • Besucherverhalten in sehr langen Zeiträumen analysieren: – „Welche Website Bereiche hatten die höchste Volatilität in der Absprungrate zwischen 2010 und 2013?“ • Komplexe Flows untersuchen: – “Aus welchen Quellen kamen User, die im CheckoutProzess ausstiegen um innerhalb von 10 Minuten mit einem Voucher-Code den Prozess abzuschließen? Welche Codes waren das?” Use Cases • Daten anreichern und abfragen: – z.B. Autoren-Details: “Zeig mir die Engagement-Rate meiner Top-100 Autoren nach Channel in 2012” – Z.B. nachträglich Produkt-Attribute dazuladen: “Zeig mir alle Warenkörbe, die rote Produkte enthielten im Vergleich zu Produkten aus Leder” • Data-Warehouse Integration: – “Mache eine wöchentliche Auswertung der eingeloggten User, schreibe die Top-5 angesehenen aber nicht gekauften Produkte in unser CRM.” 4
  • 5. 22.10.2013 Use Cases • Komplexe Anreicherung – Wetter Daten nach Datum und Region – Geographische Informationen wie • Durchschnittliche Haushaltseinkommen • Einwohnerdichte • … GOOGLE‘S BIGQUERY 5
  • 6. 22.10.2013 Was ist Google BigQuery? • Ein Web Service, das interaktive Analysen an riesigen Datensets bis zu Milliarden Rows ermöglicht. Google BigQuery empfiehlt Tabellen nicht relational aufzubauen, sondern denormalisiert Relational Denormalisiert 6
  • 7. 22.10.2013 Um Redundanz zu vermeiden, sollten Tabellen verschachtelt (nested) erstellt werden: Denormalisiert Verschachtelt SQL-Like Queries; Nur Abfragen (kein INSERT und kein UPDATE) 7
  • 8. 22.10.2013 Datenimport • Optionen: • • Direkt Upload (Browser Tool) API • • • Streaming Google Cloud Storage Google Analytics Premium Datenimport API CSV Limits • • Maximale Zeilen & Spaltenlänge: Maximale Dateigröße beim Upload: • Komprimiert: • Unkomprimiert, mit Zeilenumbrüchen: • Unkomprimiert, ohne Zeilenumbrüche: 1 MB 1 GB 4 GB 1 TB 8
  • 9. 22.10.2013 Datenimport API JSON Limits • • Maximale Zeilenlänge: Maximale Dateigröße beim Upload: • Komprimiert: • Unkomprimiert: 20 MB 1 GB 1 TB Datenimport API • Verschiedene fertige Libraries für • • • • • • • • .NET Java PHP JavaScript Python Ruby etc… Daten Live Streamen möglich 9
  • 10. 22.10.2013 Schnittstelle • • • • Täglicher Upload der gesammelten Daten (unsampled) Auf Session-Level inklusive aller Session-Hits(!!!) nested inklusive Timestamps. Jede Session ist eine Zeile. D.h. wir haben es ab nun erstmals in GA mit Rohdaten zu tun, die uns zur Verfügung stehen! Ermöglicht damit vorige Use-Cases und z.B. TVTracking! Import aus Google Analytics per CSV Nur aggregierte, gesampelte Daten mit eingeschränkten Attributen… 1. Google Analytics Report öffnen 2. Höchstmögliche Anzahl Zeilen auswählen: 3. CSV Datei exportieren: 10
  • 11. 22.10.2013 Datenimport Import aus Google Analytics per CSV 4. Neues Dataset 6. CSV Datei auswählen 5. Create and Import Oder über die APIs automatisiert… Vergleich • Rohdaten • Un-sampelt • Abfolgen innerhalb von Sessions verfügbar • Alle Attribute denormalisiert verfügbar • Aggregierte Daten • Gesampelte Daten • • Dimensionen können nur soweit es die API im Export erlaubt gemeinsam ausgewertet werden 11
  • 12. 22.10.2013 ABFRAGEN UND REPORTING Abfragen und Reporting • Browser-Tool • Command Line Interface • API – Selbst programmiert – Von Google • XLS Connector • Fusion Tables – Third Party… 12
  • 14. 22.10.2013 Das Produkt • • • • Analyse riesiger Datenmengen ohne ein Datenzentrum zu betreiben. Jederzeit kündbar. Jederzeit eigene Daten löschen. 2 Preiskomponenten: • • Ausgeführte Abfragen Belegter Speicherplatz 14
  • 15. 22.10.2013 BigQuery Preise • On-Demand • • • • Speicherplatz 100GB gratis $80 (per TB/Monat) Interaktive Abfragen $35 (per durchlaufenen TB) Batch Abfragen $20 (per durchlaufenen TB) Inserts streamen Kostenlos bis 01.01.2014 (danach $0.01 per 10.000 eingefügte Zeilen) BigQuery Preise • Paketpreise • • • • 100 TB 400 TB 1.500 TB 4.000 TB $3.300 / Monat ($33 per TB) $12.000 / Monat ($30 per TB) $40.500 / Monat ($27 per TB) $100.000 / Monat ($25 per TB) (On Demand: $80 per TB) 15
  • 16. 22.10.2013 Premium only • Sprechen Sie mit uns, wenn für Sie relevant! • e-dialog ist Vielen Dank! 16
  • 17. 22.10.2013 Voraussetzungen • • Google Account anlegen Billing im API Center aktivieren: • • https://code.google.com/apis/console/ Neues Dataset in BigQuery anlegen: • https://bigquery.cloud.google.com API Center 17