Data quality and data model quality are key for Solvency II compliance and risk management of insurance companies. The presentation shows how to manage it.
2. Agenda
• Zielsetzung
• Data Profiling
• Data-Quality-Tools
• Masterdatenmanagement
• Konsolidiertes Unternehmensdatenmodell
Business Consulting Düsseldorf 2007 2
3. Vorstellung
• Matthias Nadler-Schulz
– 33 Jahre
– seit 1997 berufstätig (IT/FM)
– seit 2002 BI/DWH-Consultant
– 2002-2005: DATA MART Consulting
– seit 2006: LogicaCMG
– Team Manager BI Financial Services
– Schwerpunkt im Bereich der Datenbewirtschaftung und COGNOS
– Account Manager für die BARMER
– Weitere Kunden sind die Gothaer, AMB, Apobank, CoBa, DreBa
Business Consulting Düsseldorf 2007 3
4. Vorstellung
• Dr. Leonhardt Wohlschlager, Dipl.Kfm., PMP
– Studium in Köln, Paris und Rotterdam
– 1994 – 1995 IBM, Köln, Datenmodellierung
– 1996 – 1997 Société Maria Galland, Information
Management, Paris
DigiVision, Köln, Electronic Business
– 1998 – 2000 IBM, Hamburg, Electronic Business
– 2001 – 2005 Universität zu Köln, Informationsmanagement,
Freiberufliche Tätigkeit
– seit 2006 LogicaCMG, Düsseldorf
– Schwerpunkt in den Bereichen des Information Management, IT Management und
CRM mit international Ausrichtung (CEMS MIM)
– Project Management Professional (PMP)
– Veröffentlichungen zum Thema Informationsmanagement in der
Versicherungswirtschaft
– Kunden sind die Barmer, IDG, Gothaer, Vodafone und Unternehmensberatungen.
Business Consulting Düsseldorf 2007 4
5. Zielsetzung
• Begriffsbestimmung der Datenqualität
• Datenqualität als Notwendigkeit im DWH-Projekt
• Relevanz der Masterdaten und der fachlichen Erhebung
• Einsatzpotential von Data Profiling und Quality
Business Consulting Düsseldorf 2007 5
6. Problemstellung
Schwerwiegende Datenfehler in einem Vertriebsinformationssystem
führen zu Akzeptanzverlusten bei den Endanwendern
• Das VIS ist das zentrale Steuerungsinstrument im Vertrieb und ist Quelle für die
Provisionssysteme.
• Nutzer sind sowohl der konzerneigene Vertrieb als auch externe
Vermittlungspartner (Finanzdienstleister, Banken, freie Vermittler).
• Die Verarbeitung scheint fehlerfrei zu arbeiten, Testläufe zeigen keine
Abweichungen. Das System arbeitete einen längeren Zeitraum
erwartungsgemäß.
• Quellsysteme sind zum Teil nicht einsehbar. Abgleiche gegen die Bestands-
systeme zeigen bei einigen Vermittlern erhebliche Abweichungen.
Nutzungsmöglichkeiten durch unklare Datenqualität
eingeschränkt
Business Consulting Düsseldorf 2007 6
7. Wie können wir diese Probleme verhindern? Unsere Thesen…
• These 1:
Data Profiling erleichtert eine frühzeitige Identifizierung von möglichen
Datenproblemen.
• These 2:
Data Quality im ETL-Prozess gibt den Fachbereichen die Möglichkeit, Business
Rules einzusetzen.
• These 3:
Stamm- und Strukturdaten müssen zeitlich abgegrenzt und fortlaufend gepflegt
werden.
• These 4:
Grundlage des physischen Modells muss ein abgestimmtes konzeptionelles
Datenmodell sein.
Business Consulting Düsseldorf 2007 7
8. Definition der Datenqualität
Datenqualität Relevant,
korrekt,
konform,
• bezeichnet die Relevanz und Korrektheit zuverlässig
von Informationen ?
• beschreibt, wie gut eine Information bzw. ein Datensatz ist, um die Realität zu
beschreiben, d.h. inwieweit sie ein Modell tatsächlicher Situationen bildet.
• besagt, wie verläßlich eine Information ist und inwieweit man sie als
Grundlage für eine Planung des eigenen Handelns verwenden kann.
• ist nicht gleichbedeutend mit der Relevanz (der Semantik) oder mit dem
formalen Informationsgehalt (der statistischen Signifikanz).
Business Consulting Düsseldorf 2007 8
9. Typische Kriterien für Datenqualität
• Richtigkeit
• Konsistenz
• Vollständigkeit
• Aktualität
• Aufgabenbezogenheit
• Zusammenhangbezogenheit
Quelle: Vgl. zu den Zielen des Datenmanagements: Jörg Biethahn; Norbert Rohrig /Datenmanagement 1990/ 740 f.
Business Consulting Düsseldorf 2007 9
10. Die Messbarkeit von Datenqualität Beschreibung
• Wie lässt sich die Datenqualität im Data Warehousing messen?
– Wie erreichen wir eine Akzeptanz der Messung?
– Wie sollen wir die Messkriterien gewichten?
– Wie wollen wir den Messvorgang operationalisieren?
– Wie sollen wir die Interpretationsspielräume reduzieren?
Business Consulting Düsseldorf 2007 10
11. Messen der Datenqualität im Data Warehousing (Beispiel)
Qualitätsattribute
1. Realtime verfügbar
2. aktuell
3. genau Bewertungsbogen
Bewertungsbogen
4. exakt
5. objektiv
Wie wichtig ist für Sie, 1 2 3 4 5
6. interpretierbar daß Daten folgende
7. relevant Eigenschaften haben Attributgruppen
Attributgruppen
8. Einfache Pflege (1 = unwichtig / 5 = sehr
9. transparent wichtig)? Attribut Definition Gruppe
…
verfügbar x
Genauigkeit
aktuell x
differenziert x 1. Glaubwürdigkeit
genau x 2. Objektivität
… Verfügbarkeit
1. Definition einer 1. für alle NLs
2. DRM
Attributliste zur Konsistenz
1. Spartenneutralität
Beschreibung der 2. Gewichtung und Gruppierung …
Datenqualität der Listeneinträge durch
Nutzer pro Fachbereich
3. Bildung von Attributgruppen
durch IT-Experten
und Key User
Business Consulting Düsseldorf 2007 11
12. Ein zusätzliches Kriterium: Transparenz über die Daten
Tarif-, Vertrags-, Leistungs-
Transparenz und Partner-Informationen
Aktivität
Geschäfts- Aktivität
Geschäfts-
regel
regel
Partner
Spezifikation
durch
Partner
Spezifikation Kontakt-
punkt Vertrag
und Objekt
Ort
Finanz-
anlagen
Leistungs-
erstellung
Ereignis
Finanz-
Transaktion
Kontakt-
Aktivität
Geschäfts- punkt Vertrag
regel
und Objekt
Partner
Spezifikation
Ort
Finanz-
Kontakt-
punkt Vertrag anlagen
und
Ort
Objekt
Leistungs-
Reporting und Überwachung
Finanz-
erstellung
anlagen
Leistungs-
erstellung
Ereignis
Finanz-
Ereignis
Transaktion
Finanz-
Transaktion
Pro Datenquelle und -typ:
Key Attributes
Automation -vollständig?
-redundant?
-zeitgerecht?
-…
Datenabgleich
Datenbereinigung
Business Consulting Düsseldorf 2007 12
13. Begriffsdefinition Data Profiling
Unter Data Profiling
Data Profiling
wird ein Prozess verstanden,
bei dem Daten in einer Datenquelle
mit statistischen Werkzeugen und Methoden
Source
analysiert werden,
Data Quality
um die Datenqualität zu ermitteln.
Business Consulting Düsseldorf 2007 13
14. Data Profiling
• liefert Angaben über die Aufgabenbezogenheit der Daten
• liefert Maße für Datenqualität
• verfolgt die Datenqualität
• prüft, ob die Datenwerte die Metadaten definieren und vice versa
• liefert eine unternehmensweite Sicht, z.B. für Masterdatenmanagement
Business Consulting Düsseldorf 2007 14
15. Problem Profiling Beschreibung
Quellsysteme sind zum Teil nicht
einsehbar.
These 1:
Data Profiling erleichtert eine frühzeitige Identifizierung von möglichen
Datenproblemen.
Beispiel:
Die Schnittstelle eines Kooperationspartners soll die Antragsbestandssätze
und alle nachfolgenden Antragsbewegungssätze liefern.
Tatsächlich werden jedoch nur Antragsbestandssätze geliefert.
Business Consulting Düsseldorf 2007 15
16. Lösung Profiling
Be
i sp
iel
Business Consulting Düsseldorf 2007 16
17. Problem Profiling Beschreibung
Die Verarbeitung scheint fehlerfrei zu arbeiten,
Testläufe zeigen keine Abweichungen.
These 2:
Data Quality im ETL-Prozess gibt den Fachbereichen die Möglichkeit,
Business Rules einzusetzen.
Beispiel:
Regeln in den Köpfen der Mitarbeitern sind nicht in den Systemen hinterlegt
und nicht dokumentiert.
Business Consulting Düsseldorf 2007 17
20. Begriffsdefinition des Masterdatenmanagements
• Verwaltung und Organisation derjenigen Referenz- oder Masterdaten,
die von IT-Anwendungssystemen und Abteilungen geteilt werden.
• Konsistente Informationsverarbeitung in heterogenen
Systemarchitekturen hierdurch erreichbar
• besonders geeignet für große Unternehmen mit vielen
Geschäftsfunktionen
Quelle: Vgl. wikipedia (Hrsg.) /Master Data Management 2007/ http://en.wikipedia.org/wiki/Master_Data_Management
Business Consulting Düsseldorf 2007 20
21. Problem Profiling Beschreibung
Abgleiche gegen die Bestandssysteme zeigen
bei einigen Vermittlern erhebliche Abweichungen.
These 3:
Stamm- und Strukturdaten müssen zeitlich abgegrenzt und fortlaufend gepflegt
werden.
Beispiel:
Die Versicherung als Organisation wandelt sich ständig. Daher müssen die
Stamm- und Strukturdaten im ETL-Prozess an die organisatorischen
Veränderungen angepasst werden kann.
Business Consulting Düsseldorf 2007 21
24. Probleme ohne konzeptionelles Datenmodell
Unterschiedliche Begriffsdefinitionen führen zu
inkonsistenten Berichten.
These 4:
Grundlage des physischen Modells muss ein abgestimmtes konzeptionelles
Datenmodell sein.
Beispiel:
In der Lebensversicherung gibt es eine Produktsicht, in der Schaden- und
Unfallversicherung eine Tarifsicht.
Business Consulting Düsseldorf 2007 24
25. Einzelprobleme bei der Herstellung einer konzeptionellen Sicht
• Die Fachabteilungen investieren nicht genügend Zeit in der Vermittlung ihrer
Sicht, ihrer Anforderungen oder in die Klarstellung der Sachverhalte.
• Bestimmte Informationsobjekte werden zu stark in den Vordergrund gestellt.
• Die Fachabteilungen sind nicht bereit, ihre Sichten gegenseitig abzustimmen
bzw. andere Sicht anzunehmen.
• Die Beziehungen zwischen den hauptsächlichen Informationsobjekten werden
nicht erhoben.
• Einzelne Fachabteilungen erkennen ihre Berichte bzw. (bei der Erstellung) die
Inhalte des physischen Datenmodells nicht wieder.
Business Consulting Düsseldorf 2007 25
26. Konsolidierung: Unternehmensweit einheitliche Partnersicht
Be
i sp
iel
Verträge Kunden- Schäden
stammdaten
Einheitliche
Kundengesamtsicht Storno- Kunden-
im Vertrieb und risiko wert
Service
Kontakte Kundendaten Inkasso
Business Consulting Düsseldorf 2007 26
27. Berichtsorientiertes Vorgehen
1. Begriff eines Berichts erheben
2. Begriff mit den schon erhobenen Begriffen abgleichen
3. Abstimmung in Workshops mit den Fachabteilungen
4. Konzeptionelle Modellierung
5. Transformation in ein physisches Datenmodell
6. (Top down / Bottom up – Herangehensweise)
Business Consulting Düsseldorf 2007 27
28. Vorgehen bei Analyse und Design des Core DWH (Übersicht)
Merkmale
Attribute
Templates Kennzahlen
Definitionen
Workshop- Berichts-
Glossar
Listen anforderungen
Aktivität
Geschäfts-
regel
Daten- Verwendungs- Begriffs
Partner
Spezifikation
matrix verwendungen
Kontakt-
punkt Vertrag
modell
und Objekt
Ort
Finanz-
anlagen
Leistungs-
erstellung
Ereignis
Finanz-
Transaktion
Schnittstelle zur physischen Modellierung
Business Consulting Düsseldorf 2007 28
29. Template – Merkmale und Definitionen
Eingabefelder Vertrags-
definition
Merkmal Definition Anmerkung
Vertrag zwischen einem Versicherungsunternehmen und Versicherungsnehmer über die
Vertrag Gewährung von Versicherungsschutz gegen Beitragszahlung.
Ein gemeldetes Ereignis, durch das sich die Vermögenslage des Geschädigten mit und nach
dem schädigendem Ereignis gegenüber der vorherigen Lage verschlechtert hat. Daraus kann
Schaden ein Anspruch auf Entschädigung aus einem Versicherungsvertrag entstehen.
Kunde Kunde ist ein Partner mit der Rolle VN zum Vertrag Es werden derzeit in anderen
Vertriebsweg sind die Vertriebskanäle. Z.B. Ausschließlichkeitsorganisation, Makler,
Vertriebsweg Kooperationspartner, Direkt(Impuls), Banken und Sonstige
Sparte Zusammenfassung gleichartiger Risiken/Wagnisse mit zugrundeliegendem Bedingungswerk
Stellt die unterste Stufe des
Vertriebs dar. Die Rechtsform
kann hierbei sowohl Makler
HGB §93 als auch HGB §84
Agentur dezentrale Vertriebseinheit sein.
Außendienstbezirk Unterteilung der Vertriebsstätte zur Zuordnung des Betreuers (z.B. Verkaufsleiter, Orgaleiter,
Die Organisationsdirektion (OD) stellt eine regionale Zusammenfassung von Vertriebsstätten bitte mit Vertrieb klären, aktuell
ohne dem Vertriebsweg Makler dar. gibt es die Nummern 1 - 4 und
9
OD
Produkt Bezeichnung eines eigenständigen Deckungsumfangs des Konzerns. Stellt eine innerhalb der
Gothaer standardisierte Kombination eines oder mehrerer Risiken dar.
Wagnis Risiko in Haftpflicht z.B. Privathaftpflicht für Angestellte
Business Consulting Düsseldorf 2007 29
30. Template – Attribute und Definitionen
Attribut-
definitionen
Business Consulting Düsseldorf 2007 30
31. Template - Fakten und Kennzahlen
Kennzahlen-
definitionen
Business Consulting Düsseldorf 2007 31
32. Template - Berichte
Bericht:
Kennzahlen-
Anzahl
definitionen
Versiche-rungen
pro
Spartennummer
und Monat
Business Consulting Düsseldorf 2007 32
36. Konsolidierung
1. Wiederverwendung bereits definierter Begriffe
2. Qualitätssicherung der Templates mit Rücklauf
3. Erzeugen einer Begriffsliste und Auswertung
4. Zuordnungen
5. Modellierung
6. Qualitätssicherung
Business Consulting Düsseldorf 2007 36
37. Partnermodell
Konsolidierte
Orgadaten
Business Consulting Düsseldorf 2007 37
39. Zielfoto
Hubs Externe Daten Interne Daten
Agentur-
system Kunden-
Kontakt- service Center Produkt-
datenbank datenbank
MDM
Internet Manuelle Agentur-
Eingaben Schaden- Manuelle
datenbank Eingaben Kunden-
datenbank datenbank
• Tarifrechner
Data Quality Stage Bereich Data Profiling
Physische Data Warehouse Ausnahme-
Speicherung Manuelle berichte
Eingaben Regel
Partner Spezifikation
• Risikomanagement
Data Profiling
Adresse und
Gebiet Objekt Vertrag
• Controlling
Kapital-
Leistungs- anlagen
erbringung
Ereignis
Finanz-
transaktionen
Data Quality Selektion, Transformation
Data
Marts
Ausnahme- Scoring- Marketing Data Profiling
Risikodaten Kontaktdaten
daten daten datenbank
Risk Mgmt. Stornofrüh- Scoring- Kontakt- Database
System warnsystem System applikation Marketing
• Stornofrüherkennung • Profitabilitätsanalyse • Gute, schlechte • Kundenanliegen • Profile/Segmente
• Stornoprophylaxe • Kundenwert Risiken • Servicestandards • Kampagnenmgmt.
Business Consulting Düsseldorf 2007 39
40. Unsere Empfehlung
Zuerst eine konsolidierte fachliche Erhebung ...
... dann die Bereitstellung von MasterDaten ...
... auf deren Basis dann Business Rules hinterlegt werden...
... welche als Grundlage für das Profiling dienen!
Business Consulting Düsseldorf 2007 40
41. Richtlinie für Planung eines DWH mit garantierter Datenqualität
• Unternehmensweite Datendefinition
– Informationen müssen in ihrer Bedeutung unter den Fachbereichen abgestimmt
sein
• Datendefinitionen auf Schemaebene
• erlaubte Wertbereiche auf Instanzebene
• Übernahme der nur tatsächlich benötigten Daten
– keine Datenfriedhöfe
• Übernahme der Detaildaten und Ablage der Metadaten
– Detaildaten in DWH integrieren und historisieren
• spätere Analyseanforderungen abdecken
• Aufbewahrung zur Nachvollziehbarkeit der abgeleiteten Daten für jurist.
Fragestellungen
Quelle: Lehner /Datenbanktechnologie für DWH-Systeme 2003/ 123 ff.
Business Consulting Düsseldorf 2007 41
43. Zielfoto
Data Profiling
Data Quality
Data Profiling
Data Quality
Data Profiling
Business Consulting Düsseldorf 2007 43
44. Lösung
• Top-down und Bottom-up-Vorgehensweise müssen sich ergänzen
• Erhebung der Beziehungen zwischen den Objekten erforderlich
• Fallabschliessende Erledigung eines Begriffs vor Implementierung in das
Physische Datenmodell
Business Consulting Düsseldorf 2007 44
45. Abgrenzung der Stammdaten von den Bewegungsdaten
• Stammdaten ist ein Begriff aus der Informatik („Datenmanagement“) und der
Betriebswirtschaft („betriebliche Anwendungsprogramme“).
• Daten einer Anwendung können entsprechend ihrer Änderungshäufigkeit in
Stammdaten und Bewegungsdaten eingeteilt werden.
• Im Kontext betrieblicher Mengen- und Wertebetrachtungen gibt es darüber
hinaus noch den Begriff Bestandsdaten.
Quelle: http://de.wikipedia.org/wiki/Stammdaten, gefunden am 20.08.2007
Business Consulting Düsseldorf 2007 45
46. Konditionelle Abhängigkeiten: Vater-Sohn-Beziehungen
B
Organi- Ba eispi
Person Partner c e
No hma l
sation Spezifikation
tat n-
ion
Partner- Partner- Partnerrolle in
Vertrag
beziehung name Spezifikat.
Partnerrolle in
Registrierung Ort
Vertrag
Registrierter Partner/Ort-
Konto Statistik
Partner Beziehung
Partner/Konto- Partner in
Beziehung Statistik
Business Consulting Düsseldorf 2007 46
48. Änderungsdienst
Stammdaten =
Daten, die über einen
längeren Zeitraum
unverändert bleiben.
statisch
Definiert über den
Änderungsdienst, d.h.
die Anzahl der Einfüge-,
dynamisch Änderungs- und
Löschungsoperationen
von Datensätzen
Business Consulting Düsseldorf 2007 48
49. Beispiele für Data Profiling
• Datentypen
– Alphabetische Werte in numerischem Datentyp
• Muster
– BLZ: 999 999 999
• Domain
– Geschlecht: 0 anstelle von (m, w)
• Häufigkeit
– Die meisten Versicherungsnehmer sind männlich.
• Statistiken
– Maximum, Minimum, Median, Modus, Durchschnitt, Erwartungswert,
Standardabweichung
• Interdependenz
– Zip-Code hängt ab vom Country Code.
Business Consulting Düsseldorf 2007 49
Notas del editor
Richtigkeit nach höchsten versicherungswirtschaftlich vertretbaren Genauigkeitsanforderungen Konsistenz z.B. Prüfung der Korrektheit durch Bereichsangaben / Abprüfung alternativer Werte Vollständigkeit Reicht die Menge der verfügbaren Daten für die versicherungswirschaftlichen Entscheidungen, z.B. die Stornoidentifikation, aus? Aktualität z.B. möglichst automatische Datenerfassung der Kontakte oder Anträge Aufgabenbezogenheit z.B. Daten in richtiger Dimension, richtigem Planungszeitraum für den richtigen Tarif? Zusammenhangbezogenheit z.B. Daten und Kennzahlen für das interne und externe Rechnungswesen Zusammenhangbezogenheit: Es muß festgehalten werden, welche Daten mit welchem Zeitbezug wo in welcher Form und welchem Bezug stehen und wie die Daten für welchen Zweck erstellt wurden, wer auf diese Daten zugreifen darf und wer für die Richtigkeit der Daten verantwortlich ist.
liefert Angaben über die Aufgabenbezogenheit der Daten z.B. Tauglichkeit der Daten für Kundenklassifikationen liefert Maße für Datenqualität z.B. Rufnummernqualität für Telefonaktionen verfolgt die Datenqualität z.B. Verbesserung der Kundendatenqualität bei Bereinigungsaktionen prüft, ob die Datenwerte die Metadaten definieren und vice versa z.B. Anzahl 0171-Nummern im Attribut „tel_buero“ liefert eine unternehmensweite Sicht, z.B. für Masterdatenmanagement
Datentypen Alphabetische Werte in numerischem Datentyp Muster BLZ: 999 999 999 Domain Geschlecht: 0 anstelle von (m, w) Häufigkeit Die meisten Versicherungsnehmer sind männlich. Statistiken Maximum, Minimum, Median, Modus, Durchschnitt, Erwartungswert, Standardabweichung Interdependenz Zip-Code hängt ab vom Country Code.