SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
Business Intelligence
voor Managers – Big
Data zonder Warehouse
(1)
Business Intelligence voor Managers – Big Data zonder Warehouse (1)
Pg, 2
Deze blogreeks valt binnen ons thema ‘Management & BI’. Dit thema is bedoeld voor managers
die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in
begrijpelijke taal en zonder alle technische termen en hypes.
Big Data professionals lijken sterk gekant tegen data warehouses. Komt dat door een nieuw
oplaaiende geloofsstrijd, door de herdefinitie van BI-terminologie, incompatibiliteit van de
onderliggende tools en technieken of iets anders?
Big Data
Zoals in voorgaande blogs beschreven is Big Data een centrale factor in Business Intelligence
voor de verwerking van grote hoeveelheden data uit externe, niet-beïnvloedbare bronnen.
Daarbij worden nieuwe technieken en tools gebruikt. Ook de werkwijze binnen BI wordt
daarvoor aangepast, om preciezer te zijn: de data-integratie functie verplaatst. Daar ligt ook een
flinke uitdaging voor bedrijven bij het bouwen van Big Data oplossingen.
In een eerdere blog heb ik al eens iets geschreven over de mogelijke combinatie van data lakes
(opslag-vehikel voor Big Data) en data warehouses (opslag-vehikel voor klassieke, interne data).
Business Intelligence voor Managers – Big Data zonder Warehouse (1)
Pg, 3
Misschien was dat iets te vroeg voor de 'strijdende' partijen en moet eerst een discussie over
basismethoden of 'basis geloven' opgestart worden.
Het Big Data geloof
Big Data wordt in beginsel ongestructureerd of beter gezegd ongerelateerd opgeslagen in
moderne file system based data lakes. Het niet leggen van relaties tussen de data is essentieel.
Relaties worden pas gelegd als je hebt bepaald waarvoor je de data wilt gebruiken. Bovendien
leg je die relaties alleen voor dat specifieke gebruik. Per gebruik kunnen de relaties dus ook
verschillen. In vaktermen: we doen extractie (E) en laden (L) maar nog geen transformatie of
integratie (T). Transformatie start pas als het specifieke gebruik van de data is bepaald. Dat is
de ELT-aanpak. Omdat data alleen maar per gebruik wordt geïntegreerd, is er geen behoefte
aan een integrerend data warehouse. Want daarin zou je de data al voorafgaand aan het gebruik
met elkaar in verband brengen.
Business Intelligence voor Managers – Big Data zonder Warehouse (1)
Pg, 4
Het data warehouse geloof
Een data warehouse is de verzamelplaats voor data waarin relaties direct gelegd worden. Dit
gebeurt vanuit de bedrijfscontext. De meeste entiteiten hebben nu eenmaal onderlinge relaties
gebaseerd op de manier waarin ze binnen het bedrijf zijn ontstaan. Die relaties worden dus niet
zozeer gelegd vanuit een specifiek gebruik voor managementinformatie (MI-producten). De
integratie wordt veelal vormgegeven door een datamodel waarin deze relaties staan
gedefinieerd. Opnieuw in vaktermen: de data worden geëxtraheerd (E), getransformeerd en
geïntegreerd (T) waarbij alle relaties gelegd worden en daarna in het data warehouse geladen
(L). Anders gezegd: de ETL-aanpak.
Big believers
Zoals bij elk geloof zijn er ook 'big believers' en wel binnen beide opvattingen. Als vanouds
kennen we BI-professionals die als uiteindelijk doel hebben de relaties te leggen tussen alle
data. Dat betekent dus een centraal data warehouse met één enterprise datamodel. Daarbij
worden termen gebruikt als: 'één ontologie voor het hele bedrijf' om alle semantische verwarring
Business Intelligence voor Managers – Big Data zonder Warehouse (1)
Pg, 5
te voorkomen en 'a single version of the truth'. Klinkt al een beetje als de woorden van een big
believer, toch?
De Big Data beweging kent ook big believers. Je kunt je waarschijnlijk wel voorstellen hoe ook
zij, in strikte regels redeneren. "In een Data Lake mogen geen relaties gelegd worden, anders is
het geen data lake meer". "Alleen als het 'gebruik' is gedefinieerd, gaan we data uit het data
lake halen en relaties leggen om een specifieke datalevering vorm te geven". De Big data
aanpak sluit trouwens best aardig aan bij een agile aanpak, want zowel de collectie en opslag
van data als de combinatie ervan voor gebruik, kunnen in kleine leveringen vorm krijgen.
Kort samengevat (en dus ook wat ongenuanceerd): de ETL-ers ('klassiek') willen naar de
extreem waarbij je alle relaties in het begin van de datastroom legt, voordat het in het data
warehouse wordt opgeslagen. Terwijl de ELT-ers ('Big Data') de relaties juist zo laat mogelijk
leggen en het liefst voor elk individueel gebruik.
Business Intelligence voor Managers – Big Data zonder Warehouse (1)
Pg, 6
Sounds good...?
Het klinkt goed zou je zeggen, lekker agile software ontwikkelen in kleine hapklare brokjes. Dit
in plaats van de grote, centrale effort om een bedrijfsbreed datamodel te ontwikkelen waarin alle
relaties voorgedefinieerd worden. Veel grote bedrijven hebben immers inmiddels jaren besteed
aan die modellering, met vaak magere resultaten. Maar zoals zo vaak ligt de praktische
waarheid niet in het genadeloos toepassen van één van de extremen. In mijn volgende blog zal
ik de twee geloven eens wat nader beschouwen en dan kijken we wat we in de praktijk van elke
geloof kunnen gebruiken.
Blijf op de hoogte van onze blogs
Ben je nieuwsgierig naar het tweede deel van deze blog of onze andere blogs over Big data,
Data Science en BI? Abonneer je via onderstaande knop dan op het thema ‘Management & BI’.
Zodra er een nieuwe blog in de reeks verschijnt, krijg je automatisch een seintje (per e-mail)
met een link.
Business Intelligence voor Managers – Big Data zonder Warehouse (1)
Pg, 7
Laat hieronder een opmerking achter als je een bepaald onderwerp rond Business Intelligence
wilt aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog
binnen het thema wordt besproken.

Más contenido relacionado

Destacado

Degree Audit-Mikhiela Mozingo-Anthony
Degree Audit-Mikhiela Mozingo-AnthonyDegree Audit-Mikhiela Mozingo-Anthony
Degree Audit-Mikhiela Mozingo-Anthony
Mikhiela Anthony
 

Destacado (12)

Com4 innov at a glance - october 2016
Com4 innov   at a glance - october 2016Com4 innov   at a glance - october 2016
Com4 innov at a glance - october 2016
 
Rapport attractivite-regionale-2016-1
Rapport attractivite-regionale-2016-1Rapport attractivite-regionale-2016-1
Rapport attractivite-regionale-2016-1
 
1st midterm take home (open book and notes)
1st midterm take home (open book and notes)1st midterm take home (open book and notes)
1st midterm take home (open book and notes)
 
Full wave rectifier
Full wave rectifierFull wave rectifier
Full wave rectifier
 
Conferencia natalia el agua
Conferencia natalia el aguaConferencia natalia el agua
Conferencia natalia el agua
 
Quimica (1)
Quimica (1)Quimica (1)
Quimica (1)
 
Big Data 2.0: ETL & Analytics: Implementing a next generation platform
Big Data 2.0: ETL & Analytics: Implementing a next generation platformBig Data 2.0: ETL & Analytics: Implementing a next generation platform
Big Data 2.0: ETL & Analytics: Implementing a next generation platform
 
Op amp basics
Op amp basicsOp amp basics
Op amp basics
 
Досвід роботи
Досвід роботиДосвід роботи
Досвід роботи
 
Degree Audit-Mikhiela Mozingo-Anthony
Degree Audit-Mikhiela Mozingo-AnthonyDegree Audit-Mikhiela Mozingo-Anthony
Degree Audit-Mikhiela Mozingo-Anthony
 
Autorretratua eredua iker
Autorretratua eredua ikerAutorretratua eredua iker
Autorretratua eredua iker
 
Large scale ETL with Hadoop
Large scale ETL with HadoopLarge scale ETL with Hadoop
Large scale ETL with Hadoop
 

Más de FourPoints Business Intelligence

Más de FourPoints Business Intelligence (20)

De Definition of Done: essentieel voor verwachtingsmanagement
De Definition of Done: essentieel voor verwachtingsmanagement De Definition of Done: essentieel voor verwachtingsmanagement
De Definition of Done: essentieel voor verwachtingsmanagement
 
Business Intelligence voor Managers – Geef Big Data de ruimte
Business Intelligence voor Managers – Geef Big Data de ruimteBusiness Intelligence voor Managers – Geef Big Data de ruimte
Business Intelligence voor Managers – Geef Big Data de ruimte
 
Business Intelligence voor Managers – Big Data zonder Warehouse (2)
Business Intelligence voor Managers – Big Data zonder Warehouse (2) Business Intelligence voor Managers – Big Data zonder Warehouse (2)
Business Intelligence voor Managers – Big Data zonder Warehouse (2)
 
marketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodigmarketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodig
 
marketing intelligence voor managers – wat is big data? en moeten we er inmid...
marketing intelligence voor managers – wat is big data? en moeten we er inmid...marketing intelligence voor managers – wat is big data? en moeten we er inmid...
marketing intelligence voor managers – wat is big data? en moeten we er inmid...
 
BI architectuur - business versus enterprise
BI architectuur -  business versus enterpriseBI architectuur -  business versus enterprise
BI architectuur - business versus enterprise
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)
 
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
 
Marketing Intelligence voor Managers – Marketing Automation Tools
Marketing Intelligence voor Managers – Marketing Automation ToolsMarketing Intelligence voor Managers – Marketing Automation Tools
Marketing Intelligence voor Managers – Marketing Automation Tools
 
Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis
 
Marketing intelligence voor managers – data science proces
Marketing intelligence voor managers –  data science proces Marketing intelligence voor managers –  data science proces
Marketing intelligence voor managers – data science proces
 
Marketing intelligence voor managers – de marketing data scientist
Marketing intelligence voor managers –  de marketing data scientistMarketing intelligence voor managers –  de marketing data scientist
Marketing intelligence voor managers – de marketing data scientist
 
Marketing intelligence voor managers – de marketing cyclus
Marketing intelligence voor managers – de marketing cyclusMarketing intelligence voor managers – de marketing cyclus
Marketing intelligence voor managers – de marketing cyclus
 
Marketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroMarketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - Intro
 
Marketing intelligence voor managers – big data voor mkb
Marketing intelligence voor managers – big data voor mkbMarketing intelligence voor managers – big data voor mkb
Marketing intelligence voor managers – big data voor mkb
 
Marketing Intelligence voor Managers – Customer Data voor MKB
 Marketing Intelligence  voor Managers – Customer Data voor MKB Marketing Intelligence  voor Managers – Customer Data voor MKB
Marketing Intelligence voor Managers – Customer Data voor MKB
 
Marketing Intelligence voor Managers - Zinvolle Big Data
Marketing Intelligence voor Managers - Zinvolle Big DataMarketing Intelligence voor Managers - Zinvolle Big Data
Marketing Intelligence voor Managers - Zinvolle Big Data
 
Marketing Intelligence voor Managers – Inbound Marketing voor MKB
Marketing Intelligence voor Managers – Inbound Marketing voor MKBMarketing Intelligence voor Managers – Inbound Marketing voor MKB
Marketing Intelligence voor Managers – Inbound Marketing voor MKB
 
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
 
Marketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
Marketing Intelligence voor Managers – Kanalen, Verkoop en MarketingMarketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
Marketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
 

Business Intelligence voor Managers – Big Data zonder Warehouse (1)

  • 1. Business Intelligence voor Managers – Big Data zonder Warehouse (1)
  • 2. Business Intelligence voor Managers – Big Data zonder Warehouse (1) Pg, 2 Deze blogreeks valt binnen ons thema ‘Management & BI’. Dit thema is bedoeld voor managers die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in begrijpelijke taal en zonder alle technische termen en hypes. Big Data professionals lijken sterk gekant tegen data warehouses. Komt dat door een nieuw oplaaiende geloofsstrijd, door de herdefinitie van BI-terminologie, incompatibiliteit van de onderliggende tools en technieken of iets anders? Big Data Zoals in voorgaande blogs beschreven is Big Data een centrale factor in Business Intelligence voor de verwerking van grote hoeveelheden data uit externe, niet-beïnvloedbare bronnen. Daarbij worden nieuwe technieken en tools gebruikt. Ook de werkwijze binnen BI wordt daarvoor aangepast, om preciezer te zijn: de data-integratie functie verplaatst. Daar ligt ook een flinke uitdaging voor bedrijven bij het bouwen van Big Data oplossingen. In een eerdere blog heb ik al eens iets geschreven over de mogelijke combinatie van data lakes (opslag-vehikel voor Big Data) en data warehouses (opslag-vehikel voor klassieke, interne data).
  • 3. Business Intelligence voor Managers – Big Data zonder Warehouse (1) Pg, 3 Misschien was dat iets te vroeg voor de 'strijdende' partijen en moet eerst een discussie over basismethoden of 'basis geloven' opgestart worden. Het Big Data geloof Big Data wordt in beginsel ongestructureerd of beter gezegd ongerelateerd opgeslagen in moderne file system based data lakes. Het niet leggen van relaties tussen de data is essentieel. Relaties worden pas gelegd als je hebt bepaald waarvoor je de data wilt gebruiken. Bovendien leg je die relaties alleen voor dat specifieke gebruik. Per gebruik kunnen de relaties dus ook verschillen. In vaktermen: we doen extractie (E) en laden (L) maar nog geen transformatie of integratie (T). Transformatie start pas als het specifieke gebruik van de data is bepaald. Dat is de ELT-aanpak. Omdat data alleen maar per gebruik wordt geïntegreerd, is er geen behoefte aan een integrerend data warehouse. Want daarin zou je de data al voorafgaand aan het gebruik met elkaar in verband brengen.
  • 4. Business Intelligence voor Managers – Big Data zonder Warehouse (1) Pg, 4 Het data warehouse geloof Een data warehouse is de verzamelplaats voor data waarin relaties direct gelegd worden. Dit gebeurt vanuit de bedrijfscontext. De meeste entiteiten hebben nu eenmaal onderlinge relaties gebaseerd op de manier waarin ze binnen het bedrijf zijn ontstaan. Die relaties worden dus niet zozeer gelegd vanuit een specifiek gebruik voor managementinformatie (MI-producten). De integratie wordt veelal vormgegeven door een datamodel waarin deze relaties staan gedefinieerd. Opnieuw in vaktermen: de data worden geëxtraheerd (E), getransformeerd en geïntegreerd (T) waarbij alle relaties gelegd worden en daarna in het data warehouse geladen (L). Anders gezegd: de ETL-aanpak. Big believers Zoals bij elk geloof zijn er ook 'big believers' en wel binnen beide opvattingen. Als vanouds kennen we BI-professionals die als uiteindelijk doel hebben de relaties te leggen tussen alle data. Dat betekent dus een centraal data warehouse met één enterprise datamodel. Daarbij worden termen gebruikt als: 'één ontologie voor het hele bedrijf' om alle semantische verwarring
  • 5. Business Intelligence voor Managers – Big Data zonder Warehouse (1) Pg, 5 te voorkomen en 'a single version of the truth'. Klinkt al een beetje als de woorden van een big believer, toch? De Big Data beweging kent ook big believers. Je kunt je waarschijnlijk wel voorstellen hoe ook zij, in strikte regels redeneren. "In een Data Lake mogen geen relaties gelegd worden, anders is het geen data lake meer". "Alleen als het 'gebruik' is gedefinieerd, gaan we data uit het data lake halen en relaties leggen om een specifieke datalevering vorm te geven". De Big data aanpak sluit trouwens best aardig aan bij een agile aanpak, want zowel de collectie en opslag van data als de combinatie ervan voor gebruik, kunnen in kleine leveringen vorm krijgen. Kort samengevat (en dus ook wat ongenuanceerd): de ETL-ers ('klassiek') willen naar de extreem waarbij je alle relaties in het begin van de datastroom legt, voordat het in het data warehouse wordt opgeslagen. Terwijl de ELT-ers ('Big Data') de relaties juist zo laat mogelijk leggen en het liefst voor elk individueel gebruik.
  • 6. Business Intelligence voor Managers – Big Data zonder Warehouse (1) Pg, 6 Sounds good...? Het klinkt goed zou je zeggen, lekker agile software ontwikkelen in kleine hapklare brokjes. Dit in plaats van de grote, centrale effort om een bedrijfsbreed datamodel te ontwikkelen waarin alle relaties voorgedefinieerd worden. Veel grote bedrijven hebben immers inmiddels jaren besteed aan die modellering, met vaak magere resultaten. Maar zoals zo vaak ligt de praktische waarheid niet in het genadeloos toepassen van één van de extremen. In mijn volgende blog zal ik de twee geloven eens wat nader beschouwen en dan kijken we wat we in de praktijk van elke geloof kunnen gebruiken. Blijf op de hoogte van onze blogs Ben je nieuwsgierig naar het tweede deel van deze blog of onze andere blogs over Big data, Data Science en BI? Abonneer je via onderstaande knop dan op het thema ‘Management & BI’. Zodra er een nieuwe blog in de reeks verschijnt, krijg je automatisch een seintje (per e-mail) met een link.
  • 7. Business Intelligence voor Managers – Big Data zonder Warehouse (1) Pg, 7 Laat hieronder een opmerking achter als je een bepaald onderwerp rond Business Intelligence wilt aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog binnen het thema wordt besproken.