Stammdaten-Qualitätsmanagement – “Do It Right The First Time”
Eine unternehmensweite IT-Lösung (z.B. ERP, MDM, PLM, SCM) erlaubt die gemeinsame Nutzung von Daten und ermöglicht eine globale Zusammenarbeit über die Firmengrenzen hinaus mit Kunden und Lieferanten. Aber wie stellen Sie sicher, dass die Daten immer konsistent sind und keine Dubletten enthalten?
Standard IT-Tools und -Prozesse ermöglichen die Wiederverwendung von Daten durch einfache Suchfunktionen. Dies gilt aber nur, sofern diese Daten klar strukturiert, konsistent und komplett sind. Ein hohes Niveau der Datenqualität zu erreichen, ist aber in der Realität oft schon innerhalb der eigenen Firma schwierig. Wenn darüber hinaus auch Lieferantendaten mit integriert werden, ist dies mit herkömmlichen Ansätzen fast unmöglich – ganz abgesehen von den Herausforderungen bei Mergers& Acquisitions.
Mit der Oracle Product Data Quality (PDQ) Lösung, stehen Ihnen Werkzeuge (patentierte semantische DataLens™-Technologie) zur Verfügung, um Ihre Daten automatisch zu reinigen, zu extrahieren, zu standardisieren und zu klassifizieren. Dubletten und Referenzen werden erkannt sowie die Übersetzung von nicht standardisierten Daten in mehrere Sprachen sichergestellt. Die offene Architektur ermöglicht die Integrationen in nahezu alle IT-Systeme. Z.B. durch einen automatischen Qualitätscheck schon bei der Stammdatenneuanlage wird der Aufwand für die Neuanlage erheblich reduziert und die Datenqualität deutlich gesteigert - “Do It Right The First Time”.
Dies führt zu erheblichen Kosteneinsparungen und zu einer qualitativen Verbesserung Ihrer Prozesse.
1. 26 PROJEKTE
Wie lässt sich die Stammdaten-
qualität in ERP/PLM-Systemen
kontinuierlich steigern?
Ralf Kittel, Karlsruhe
Eine unternehmensweite ERP/PLM-Lösung erlaubt die gemeinsame
Nutzung von Daten und ermöglicht eine globale Zusammenarbeit
über die Firmengrenzen hinaus mit Kunden und Lieferanten. Aber
wie stellen Sie sicher, dass die Daten immer konsistent sind und
keine Dubletten enthalten?
Standard IT-Tools und -Prozesse ermögli- n Tippfehler Dreck auf der Windschutzscheibe. Man
chen die Wiederverwendung von Daten n Kontinuierliche Integration von Liefe- kann damit lange Zeit weiterfahren. Der
durch einfache Suchfunktionen. Dies gilt rantendaten (verschiedene Anbieter Dreck nimmt aber immer mehr zu und
nur, sofern diese Daten klar strukturiert, mit unterschiedlichen Produkt-Codes) irgendwann wird ein Punkt erreicht, an
konsistent und komplett sind. Ein hohes n Lieferanten, die Produktinformationen dem es lebensgefährlich wird, weiterzu-
Niveau der Datenqualität zu erreichen, ist nicht im geforderten Format liefern fahren.
in der Realität oft schon innerhalb der können
eigenen Firma schwierig. Wenn darüber n Mergers & Acquisitions. Fusionen und Qualität der Produktdaten muss zum
hinaus auch Lieferantendaten mit inte- Übernahme von Firmen Bestandteil der umfassenden Qualitäts-
griert werden, ist dies mit herkömm- n Verschiedene Systeme verwenden ver- strategie des Unternehmens werden
lichen Ansätzen fast unmöglich – ganz schiedene Codes / Werte für dieselbe (TQM – Total Quality Management und
abgesehen von den Herausforderungen Sache TDQM – Total Data Quality Management).
bei Mergers & Acquisitions. Mit der Oracle n Unzureichende Recherche-Tools, kom-
Product Data Quality (PDQ) Lösung, biniert mit Zeitdruck, zwingen Benutzer Wie stellen sich Istsituation und
stehen jetzt Werkzeuge (patentierte dazu, doppelte Datensätzen anzulegen Anforderungen dar?
semantische DataLens™-Technologie) zur n keine Einschränkungen, da keine
Verfügung, um die Daten automatisch zu Kontrolle vorhanden ist Aktuelle Analysen in den Unternehmen
reinigen, extrahieren, standardisieren n mehrere ERP-System im Firmenverbund zeigen, dass bis zu 80% der befragten
und klassifizieren. Dubletten und Refe- im Einsatz Unternehmen unzufrieden mit ihrer
renzen werden erkannt sowie die Über- n Fehlende Systemharmonisierung/ Datenqualität sind. Über 70% scheuen
setzung von nicht standardisierten Daten -Konsolidierung die Bereinigung und Standardisierung von
in mehrere Sprachen sichergestellt. Die n ….. Produktdaten, weil das Durchführen von
offene Architektur ermöglicht die Integra- Maßnahmen zur Verbesserung der Pro-
tionen in nahezu alle ERP/PLM-Systeme. Stammdatenqualität in duktdatenqualität zu schwierig, zu zeit-
Dies führt zu erheblichen Kosteneinspa- integrierten IT Applikationen aufwendig, zu kostenintensiv und somit
rungen und zu einer qualitativen Verbes- durch Semantik-Technologie fast undurchführbar ist.
serung von Business Intelligence Analysen.
Die Informationsflut im Unternehmen Heterogene inkonsistente Datenbestände
Wie gelangen schlechte Stamm- wächst täglich. Viele datenführende entstehen durch jahrelang mangelnde
daten in eine IT-Applikation? Systeme wie ERP, PLM, MDM aber auch Datenpflege, durch Fusion und Übernah-
webbasierende Kataloge enthalten Tau- men, durch mehrere Altsysteme, durch
n Verschiedene Mitarbeiter an verteilten sende von Produktdaten, die dieselbe verschiedene Applikationen, die jede für
internationalen Standorten haben un- Bedeutung haben, aber unterschiedlich- sich eigene Metadaten führen. Darin gibt
terschiedliche Gewohnheiten im Um- ste Formate und Inhalte führen. Dies es unterschiedliche Typen und viele Kate-
gang mit IT-Systemen macht dem Anwender das Suchen und gorien der Metadaten, die in strukturierter
n Verschiedene Muttersprachen Verarbeiten wichtiger Informationen oder auch unstrukturierter Form vorliegen
n Verschiedene Mitarbeiter benutzen schwer, kostet Zeit und führt zu Fehlern. mit unterschiedlichen Schreibweisen,
verschiedenen Abkürzungen für die Bedeutungen, Synonymen und Gültig-
gleiche Sache Schlechte Produktdatenqualität ist wie keiten sowie daraus einstehende Folge-
ProduktDatenJournal Nr. 2 I 2011
2. PROJEKTE 27
Bild 1: Varianten von Elektromotordaten, je nach Hersteller Bild 2: PDQ mit sematischer Suchfunktion
rungen und Zusammenhänge (bspw. n E-commerce, Vertrieb chende Beschreibungen usw. erscheint
Skt-Schraube, Ring, Leiter). n Product Design aufwendig. Sie setzt voraus, dass Abfrage-
n Lager & Logistik tools und Auswertungen flexibel formu-
Ein leicht nachvollziehbares Beispiel der n Kundendienst liert werden können. Darüber hinaus
Vielfalt von Produktdaten und Katego- n Business Intelligence müssen die Daten nicht nur in ihren
rien sind Varianten von Elektromotoren Strukturen, sondern auch in unstruktu-
als Kaufteil, die von vielen Firmen welt- Warum sollte man Produktdaten riertem Kontext analysiert werden. Das
weit angeboten werden. Die Produkte harmonisieren? setzt lernfähige, leicht definierbare und
sind teilweise austauschbar. Es sind semantische Suchwerkzeuge voraus,
die gleichen Kennwerte. Dennoch sind Selbst das beste Informationssystem ähnlich wie man sie von der Internet-
Vollständigkeit, Formatierungen und wird durch schlechte Datenqualität aus- suche her kennt. Die Qualität der Such-
Produktbezeichnungen sehr unter- gehebelt. Das zieht sich durch alle ergebnisse selbst sollte bei der seman-
schiedlich. Anwendungssysteme hindurch. Schlechte tischen Suche in den Produktdaten aber
Produktdatenqualität führt zu hohem wesentlich besser sein als im Internet.
Informationen und Produktdaten sind Suchaufwand, unscharfen Trefferquoten,
lebensnotwendig im Unternehmen. Der geringer Transparenz und Fehlern im Welche Lösungsstrategie für
Informationsfluss läuft in der Regel dem Prozess. Unzureichende Qualität der bessere Produktdatenqualität ist
Materialfluss voraus. Er ist global. Neben Produktdaten beeinflusst somit Produkt- praktikabel?
strukturierten Daten begleiten ebenso qualität und Kundenzufriedenheit.
viele unstrukturierte und sogar grafische Produktdaten sind etwas Besonderes im
Daten die Geschäftsprozesse hin zu den Durch Homogenisierung und hohe Trans- Unternehmen und unterscheiden sich
vielen Lieferanten, zu den Standorten, zu parenz in den Produktdaten kann die deutlich von anderen Datenbeständen.
Kunden und das in den verschiedensten Komplexität von Produkten, Varianten, Personal-, Kontakt- und Adressdaten
Sprachen. Produktdaten sollten daher Kategorien und Regelwerken reduziert bspw. sind einigermaßen systematisiert.
unternehmensweit eine genaue, eindeu- werden. Aber trotz STEP und ISO 10303 gibt es
tige und gültige Sicht auf die Produkte, für die umfassende Beschreibung von
ihre Technologien, Regeln und Prozesse Die Pflege von Prdukt- /Stammdaten ist Produktdaten keinen hinreichenden
abbilden. Dennoch hat jeder Anwender- die Grundlage für wichtige Geschäfts- Standard. Anwender von Produktdaten
bereich andere Sichten auf Daten, Infor- prozesse und -entscheidungen. haben jeweils unterschiedliche Sichten
mationen und Abläufe. auf diese Daten – sei es im Bereich
Schwierig ist die Antwort auf die Frage, e-Commerce, Produktentwicklung, Ein-
Produktdaten haben häufig eine hohe wie der Grad der Produktdatenqualität kauf, Logistik, Produktion oder Kunden-
Dynamik, zwar völlig anders als die gemessen und monetär bewertet werden dienst. Auch die Zusammenhänge in den
Bewegungsdaten, jedoch ändern sich kann? Es fehlen Methoden, um die Vor- Anwendersichten auf die Produktdaten
Kategorien, Strukturen, Bezeichnungen teile konsistenter Daten und durchgängi- sind unterschiedlich, ebenso Bezeichnun-
usw. durch die eng vernetzten globalen ger Informationsflüsse bei unterschied- gen, Gültigkeit und Regeln.
Informationsflüsse in den vielfältigen lichen Anwendungen zu quantifizieren.
Anwendungssystemen ständig wie Eine Analyse des Bestands an Produktda- Produktdaten haben einen sehr hohen,
bspw. in: ten auf Dubletten, ähnliche Teile, abwei- zentralen, häufig unterschätzten, mate-
Nr. 2 I 2011 ProduktDatenJournal
3. 28 PROJEKTE
und gepflegt werden? Bereits der Aus-
tausch von strukturierten Produktdaten
zwischen verschiedenen Anwendungs-
systemen stellt sich oft schwierig dar.
Noch aufwendiger ist die Sicherstellung
der Synchronisation und der Konsistenz
von unstrukturierten Daten, Dateninhalten
oder Datenkategorien in den unter-
schiedlichen Anwendungssystemen. Hier
kommen die Vorteile des PDQ-Manage-
ment mit semantischer Suche gegenüber
bisherigen Methoden klar zum Vor-
schein:
Bild 3
Manuelle Arbeitsweise zum Bereini-
gen von Produktdaten ist
n zu zeitintensiv,
n zu langsam und
n zu teuer.
Programmierte Tools sind
n wenig flexibel wegen der Program-
mierung,
n aufwendig für die vielen Ausnahme-
regeln, selten skalierbar, kaum selbst-
lernend,
n dediziert und beschränkt auf wenige
Anwendungskategorien, bzw. Anwen-
dungssysteme.
Vorteile eines semantisch arbeitenden
Data-Quality-Tools (Semantic Based
Data Lensing, Data Cleansing) sind:
n Semantik benutzt die Bedeutung von
natürlichen Worten, Synonymen und
deren Kontext.
n Datenrepository, Kombinatorik und
Ablaufregeln werden grafisch inter-
aktiv definiert.
Bild 4: Product Data Quality Server
Bei der Suche im Web beispielsweise
wird semantisch gesucht. Je nach Zusam-
menhang in der Fragestellung können
sich dabei andere Antworten ergeben.
Beispiel:
riellen Wert für das Unternehmen. Des- materiellen Erzeugnisse des Unterneh- n Wann kam der erste Mensch auf den
wegen ist es zwingend, dass Produkt- mens. Produktdatenqualität muss Teil der Mond? = 21. Juli 1969 02:56:20 (UTC)
daten und die Informationsflüsse im TQM-Strategie des Unternehmens werden n Wer war der erste Mensch auf dem
Unternehmen in gleicher Weise effizient (TQM – Total Quality Management) als Mond? = Neil Alden Armstrong
behandelt werden wie die Materialien Vision für TDQM (Total Data Quality
und deren physikalischen Materialflüsse. Management). Auf Produktdaten bezogen können mit
Wie beim Materialfluss wird der gesamte semantischer Suchtechnik relativ schnell
Geschäftsprozess gestört, sobald der Die sogenannten Masterdaten oder Pro- Analysen von Datenbeständen durchge-
Informationsfluss unterbrochen ist. Es duktdaten sollten möglichst zentral ge- führt werden. Mit dem PDQ-Tool werden
kommt sehr auf effiziente und konsistente pflegt und verwaltet werden. Hierfür gibt Regeln und Filter zur Bereinigung und
Informations-Prozesse an: es bekannte Lösungsansätze in Form von Zusammenführung von Datenbeständen
n Zwischen Anwendern und Abteilun- Master-Daten-Management (MDM) oder grafisch interaktiv erstellt und können
gen, bezogen auf Produktdaten das Produkt- leicht erweitert werden. In Verbindung
n Zwischen Unternehmen und Information-Management (PIM). mit dem PDQ-Tool kann PIM im laufen-
n Zwischen Anwendungssystemen den Betrieb die Produktdatenqualität
Die Frage bleibt, wie erreicht man eine innerhalb der Informationsflüsse sicher-
Daten und Information haben als bessere Qualität in den vorhandenen stellen. Das Einrichten der Rolle eines
„Immaterielles Produkt“ denselben Produktdaten, die noch dazu oft in meh- Produktdaten-Qualitätsmanagers ist sehr
Anspruch an Produkt-Qualität wie die reren Anwendungssystemen entstehen hilfreich, eigentlich unumgänglich.
ProduktDatenJournal Nr. 2 I 2011
4. PROJEKTE 29
Semantische Suche hilft ebenso bei der Anwendungssystemen dar. Bezogen auf n PDM / PLM
Migration von Daten aus verschiedenen das Produktdaten Management spricht n E-commerce, Web-Kataloge
Anwendungssystemen. Das PDQ-Tool man auch von PIM Product Information
kann für die Transformation der Produkt- Management. Dadurch wird erreicht, Durch hochwertige, geprüfte und konsi-
daten aus einem ins andere Anwen- dass das MDM / PIM entkoppelt wird stente Daten und Informationen wird
dungssystem genutzt werden. und in den jeweiligen Anwendungen Datenbruch vermieden. Das führt zur
spezifische Sichten auf die Daten, Daten- Verringerung von Mehraufwänden der
Für den unternehmensspezifischen Einsatz strukturen und Datenformate bestehen Mitarbeiter durch schlechte Datenqualität
von semantischer Suche kommt es im bleiben können, wie bspw. in CRM, ERP, und verbessert die Effizienz in allen
wesentlichen darauf an, die technischen PLM, LVS, e-Commerce usw.. Unternehmensbereichen, bei Zulieferern
Dictionaries aufzubauen und mit den und bei Kunden.
Begrifflichkeiten auszustatten, die die Dieser Ansatz bildet die Basis für ein kon-
Anwender täglich benutzen. Oracle hat sistentes, unternehmensweites Daten- Wesentlich geringere Kosten und Zeit-
im Januar 2010 die Firma Silver Creek, management und befreit Abteilungen, aufwände entstehen sowohl für einmalige
die #1 für PDQ-Lösungen, übernommen. Standorte oder Zulieferer davon, das Datenbereinigung, als auch für laufende
Diese Data-Lensing /Cleansing-Funktion gleiche System oder einheitliche Daten- Prüfung und Datenkonsolidierung.
ist als Oracle PDQ – Product Data Quality formate nutzen zu müssen. Ergebnis einer gleichbleibend guten
Server verfügbar. Definitionen der unter- Produktdatenqualität ist eine schnellere
nehmensspezifischen, semantischen Mit PDQ bietet Oracle eine äußerst wert- und bessere Auskunftsfähigkeit durch
Modelle können mit PDQ in kurzer Zeit volle Applikation an, um die MDM / PIM- höhere Transparenz der Produktdaten.
erstellt werden und passen sich an (self- Datenqualität im täglichen Informations-
tuning). fluss eines Unternehmens umfassend Reduktion von Teilebeständen durch Ver-
gewährleisten zu können. Für die Inte- meiden von Dubletten erzielen nachweis-
Der Einsatzbereich von PDQ geht über grationen stehen die Techniken der SOA lich eine spürbare monetäre Verbesserung
Suchen, Standardisieren, Zusammenfüh- Middleware und WebServices zur Verfü- der Bevorratung und Lieferbereitschaft
ren, Übersetzen bis hin zu Umformatieren. gung. und dadurch eine deutliche Reduktion
Dialoge, Regelwerke und Abläufe für die von Gemeinkosten.
Datenkonsolidierung erstellt der PDQ- Welches Nutzenpotenzial kann
Manager ohne Programmierung mit Hilfe erschlossen werden? Die Pflege von Stammdaten ist die
der grafischen Technik zusammen. Ein Grundlage für wichtige Geschäftsprozesse
grafisches Dashboard bringt Übersicht, Eine Analyse der Datenbestände mit und -entscheidungen. PDQ trägt maß-
zeigt die Statistik über den Prozess der der semantischen Abfragetechnik (Data- geblich zur Verbesserung von Business
Datenbereinigung und unterstützt bei Cleansing) von Oracle PDQ zeigt oft Intelligence Lösungen bei.
der Regelung von Ausnahmen. überraschend hohe Trefferquoten und
legt somit den Handlungsbedarf bei der Ungenauigkeit und schlechte Qualität
Wie wird PDQ in eine bestehen- Verbesserung der Produktdatenqualität der Produktdaten im Informationsfluss
de IT-Infrastruktur integriert? offen. Es ist zu empfehlen, über ein Ana- sind eine stille, meist unentdeckte
lyseprojekt, lohnende Kategorien für Wachstumsbremse. Mit Oracle PDQ und
7.1 Extrahieren von Daten: Data Cleansing und bspw. Dubletten- dem PIM / MDM Lösungsansatz kann
Oracle PDQ kann Daten aus vielen ver- bereinigung zu finden. diese Bremse gelöst werden und bringt
schiedenen Datenquellen extrahieren, neuen Schwung in das wertvollste Gut
z. B. Texte, Microsoft Excel-Tabellen, Web Geeignet für Prüfung, Konsolidierung des Unternehmens – die Produktinfor-
Services, XML und Datenbanken. Dabei und Transformierung von Produktdaten mationen und den Informationsfluss.
kann PDQ sogar auf implementierte sind große Warengruppen und Produkt- Qualität der Produktdaten muss Bestand-
DB-Funktionen /Prozeduren zugreifen. kategorien unterschiedlicher Lieferanten teil der Qualitätsstrategie des Unterneh-
und Hersteller aus den verschiedensten mens sein. n
7.2 Publizieren/Speichern von Daten: Industrien wie z. B.:
Oracle PDQ kann die bearbeiteten Daten n Handel
in verschiedenen Zielsysteme speichern – n Nahrungsmittelindustrie
auch gleichzeitig in mehrere Zielsysteme n Konsumgüter
z. B. im XML-, Excel- oder Text-Format. n Elektronik & High Industrie
Die Daten können auch automatische an n Medizintechnik
einen FTP-Server versendet werden. n Maschinen und Anlagen
n Automotive und Aerospace (OEM und
Wie fügt sich PDQ in eine beste- Zulieferer)
hende MDM/PLM-Architektur?
Ebenso lässt die Verwaltung von Pro-
Die Strategie des Master Data Manage- duktdaten in mehreren Anwendungs-
ment (MDM) trennt die Verwaltung der systemen an unterschiedlichen Standorten Kontakt
Produktdaten von der Nutzung dieser mit verschiedenen Anforderungen an die
Masterdaten in den Anwendungssyste- Sichten auf Daten, Beschreibungen und Ralf Kittel
men. Das Master Data Management Sprachen eine hohe Trefferrate vermuten, Oracle Deutschland B.V. & Co. KG
stellt die Zusammenfassung der Stamm- wie sie typischerweise anzufinden sind in: Karlsruhe
daten, der Strukturen, der Verfahren und n ERP Tel.: +49 721 6291 532
Data Repositories unabhängig von den n Master Data Management E-Mail: ralf.kittel@oracle.com
Nr. 2 I 2011 ProduktDatenJournal