SlideShare una empresa de Scribd logo
1 de 15
Descargar para leer sin conexión
www.via-nova-architectura.org February 2007 1
Semantische interoperabiliteit met
behulp van een bedrijfsbrede
taxonomie
Wat kunnen we leren van IBM’s IFW Business Data Concepts
Classification?
Richard Claassens
Steeds meer worden geautomatiseerde systemen aan elkaar gekoppeld die
onafhankelijk van elkaar ontwikkeld zijn. Hierbij kunnen gemakkelijk semantische
conflicten ontstaan. In veel publicaties wordt een taxonomie, als oplossing
aangedragen. Een bedrijfsbrede taxonomie waarmee veel ervaring is, is het Business
Data Concepts Classification model van IBM’s Information FrameWork. Dit model
kent een invulling voor bankbedrijven en is al meer dan 10 jaar op de markt. De
aanpak en structuur om concepten, relaties tussen concepten en termen te
specificeren is geschikt om allerlei vormen van semantische conflicten te voorkomen.
1. Inleiding
De groei van het internet, de internationalisering van de handel en de opkomst van
“information economics” resulteert in een vernieuwde zienswijze op de rol van
informatiesystemen in de bedrijfsvoering en het management ervan. Internet technologie
levert het fundament voor nieuwe bedrijfsmodellen, nieuwe bedrijfsprocessen en nieuwe
manieren van voor de distributie van kennis [Laudon, 2004].
Voordat deze nieuwe zienswijze gemeengoed was, werden de meeste toepassingen volgens
“tight coupled” principes ontwikkeld. Daarbij zijn slechts één of enkele database(s) betrokken
en draait de gehele toepassing op één of een beperkt aantal platform(s)/machine(s). Bij een
dergelijke aanpak is een groep van analisten en ontwikkelaars redelijk in staat om zonder
strikte en volledig expliciete semantische beschrijvingen een semantisch consistente
toepassing te realiseren.
Vrij vertaald schetst L. Orbst [2004] in zijn presentatie: ‘Ontologies and the Semantic Web:
An Overview’, een meer actueel beeld:
“Geautomatiseerde systemen worden steeds meer samengesteld uit delen
gedistribueerde functionaliteit die onafhankelijk van elkaar ontwikkeld zijn, die zich op
verschillende platforms bevinden en die zich in principe overal kunnen bevinden. Met
deze toenemende complexiteit van systemen en IT-behoeften en een grotere afstand
tussen de systemen, is het noodzakelijk om oplossingen te adopteren die beter
aansluiten op het niveau waarop menselijke interactie plaatsvindt. Het is van belang om
gebruik te gaan maken van semantiek en deze expliciet te gaan beschrijven. Tevens is
het noodzakelijk om aansluiting te verkrijgen van het niveau van gegevens en
www.via-nova-architectura.org February 2007 2
informatie, ofwel het semantische niveau waarop menselijke individuen met elkaar
communiceren. Semantische beschrijvingen en semantische interoperabiliteit/integratie
worden in toenemende mate belangrijk.”
In het vervolg van dit paper zullen de problemen die door Orbst worden geschetst meer in
detail worden toegelicht (Hoofdstuk 2), inclusief de oplossingsrichting(en) waar hij naar
verwijst (hoofdstuk 3 en 4). Hierbij zal de nadruk komen te liggen op semantische
interoperabiliteit/integratie binnen het bedrijf. Vervolgens wordt in hoofdstuk 5 een oplossing
beschreven die gebruik maakt van een taxonomievorm die uit de bibliotheekwetenschap
afkomstig is. Vervolgens wordt IBM’s Business Data Concepts Classification gepositioneerd,
beschreven (hoofdstuk 6 en 7) en geëvalueerd (hoofdstuk 8). Na een korte verhandeling over
investeringen in bedrijfsbrede taxonomieën (hoofdstuk 9) wordt met conclusies afgerond
(hoofdsstuk 10).
2. Communicatieproblemen
Aan de hand van de “meaning triangel” van Ogden en Richards [1923], zullen een aantal type
van communicatieproblemen worden beschreven en mogelijke oplossingen.
2.1. Communicatie tussen mensen
Wanneer we het niveau beschouwen waarop mensen direct of indirect met elkaar
communiceren (Human to Human = H2H) dan treden daar veelvuldig problemen op die onder
andere worden veroorzaakt door semantische onduidelijkheden. Dave McComb [2004 :16],
illustreert dit met het volgende tekstfragment: “Er zijn 880.000 juristen in de Verenigde Staten
die een industrie vertegenwoordigen met een omzet van $100 miljard. Een van de meest
lucratieve bezigheden is het opstellen en interpreteren van contracten en het procederen in
geval er geschillen in relatie tot de contracten ontstaan.” Dit betekent dat het vanuit een
financieel oogpunt de moeite waard is, om de kans op het optreden van semantische
verschillen te verminderen.
Een van de belangrijke oorzaken van conflicten in de menselijke communicatie wordt
veroorzaakt doordat dezelfde gecommuniceerde symbolen kunnen leiden tot verschillende
concepten, bij personen die de gecommuniceerde gegevens ontvangen en interpreteren. Dit is
te illustreren met behulp van de “meaning triangle” van Odgen en Richards [1923]. In figuur 1
is te zien dat als gevolg van de ambiguïteit van woorden, bijvoorbeeld term “jaguar”, dezelfde
term kan leiden tot verschillende interpretaties en daarmee tot verschillende abstracte beelden
(concepten). Het verhaal wordt nog moeilijker wanneer we te maken krijgen met concepten,
die niet direct in de werkelijke wereld zijn waar te nemen.
Stands for
Refers toSymbolize
Concept(s) (in mind)
–or
•thougt
•idea
•intension
“Jaguar”
1) The Meaning Triangle
2) Example of the ambiguity of symbols
Symbol(s) –or
•term
•label
•code
Referent(s) -or
•thing
•object
•extension
(Based on Ogden & Richards, 1923)
Figuur 1 Een voorbeeld van semantische misinterpretatie
www.via-nova-architectura.org February 2007 3
Het is niet realistisch om te veronderstellen dat er één eenvoudige oplossing voor dergelijke
problemen te bedenken is. Het is wel zinvol om oplossingen te zoeken die bovengenoemde
problemen minimaliseren, voor die situaties waarvoor dit zinvol is. Aangezien dat er bij steeds
meer communicatie, geautomatiseerde systemen betrokken zijn, moeten deze in de oplossing
worden meegenomen.
2.2. Het ontwikkelen van geautomatiseerde systemen
De grote uitdaging van het ontwikkelen van geautomatiseerde systemen is het omzetten van
de kennis en wensen uit een expertisedomein naar de syntax die door het geautomatiseerde
systeem kan worden geïnterpreteerd. De uitdaging is nog groter wanneer een geautomatiseerd
systeem gerealiseerd moet worden dat een oplossing moet bieden voor meer
expertisedomeinen en individuen met hun eigen kennis en ervaring. Er zou in dit verband
gesproken kunnen worden van H2H-communcatie met het doel om een geautomatiseerd
systeem te ontwerpen en te realiseren.
John Zachman [1987] onderkent binnen zijn Information System Architecture (ISA) vijf
ontwerpniveaus: “Scoop, Bedrijfsmodel, Systeemmodel, Technologiemodel, Component”, om
van een bedrijfsmodel tot een geautomatiseerd systeem te komen. Daarnaast bevat het ISA-
raamwerk zes perspectieven: “Wat, Hoe, Waar, Wie, Wanneer en Waarom”, die bij de
specificatie van een te bouwen geautomatiseerd systeem meegenomen zou moeten worden.
Bij de bovenste drie ontwerpniveaus zijn systeemanalisten betrokken, die werken op de grens
van het geautomatiseerde systeem en de buitenwereld [Sowa, 2000: 188]. Dit betekent dat zij
moeten afstemmen met de expertise- en gebruikersdomeinen waarin het geautomatiseerde
systeem moet gaan opereren. Een van de verantwoordelijkheden van de systeemanalisten is
dat de semantische conflicten met de buitenwereld zo veel mogelijk worden uitgesloten. Een
van de hulpmiddelen die vaak hierbij gebruikt wordt is een bedrijfsbreed gegevensmodel,
gebaseerd op een ER-diagram. In het ISA-raamwerk vormt dit model de uitwerking van het
Wat-perspectief op het ontwerpniveau van het bedrijfsmodel. Uit de volgende publicatie blijkt
dat een dergelijke aanpak niet altijd tot de gewenste resultaten leidt. Darke & Shanks [1999:
20] hebben op basis van een onderzoek de volgende conclusie getrokken:
Een groot probleem met bedrijfsbrede gegevensmodellen is dat ze moeilijk te begrijpen
zijn. Hun abstractie ofwel generieke concepten komen onvertrouwd over voor zowel de
gebruikers als de IS-professionals, en staan vaak ver weg van hun lokale
organisatorische context. Empirische studies geven de indicatie dat veel organisaties
zijn geconfronteerd met significante problemen bij ontwikkelen en het gebruik van een
bedrijfsbreed datamodel.
De ontwerpniveaus Technologiemodel en Component hebben betrekking op de techniek. De
specificaties uit hogere niveaus moet door ontwikkelaars worden vertaald naar een
computerprogramma waarbij semantische afspraken worden meegenomen. Er bestaat niet zo
iets als een vaag computerprogramma [Sowa, 2000]. Een programma functioneert altijd zeer
precies (een formeel model), maar desondanks is het mogelijk dat het geen enkele relatie
heeft met datgene waarvoor het ooit bedoeld is. De beslissingen en beschrijvingen op de
hogere niveaus vormen de basis voor dat het programma zich semantisch correct gedraagt en
dat gebruikers de semantiek correct kunnen interpreteren.
2.3. Het gebruik van geautomatiseerde systemen door mensen
Wanneer het geplande geautomatiseerde systeem operationeel is, zullen de gebruikers van het
systeem met semantisch juiste gegevens moet vullen (Human to Application = H2A) en/of
door het systeem verstrekte gegevens op een juiste wijze gaan interpreteren (Aplication to
human = A2H). De meeste traditionele applicaties zijn een combinatie van H2A en A2H, een
zogenaamde H2A2H-apllicatie waarbij het verstrekken van gegevens en de invoer van
gegevens wordt gecombineerd [McComb, 2004: 27].
Geautomatiseerde systemen zijn niet of nauwelijks in staat om gegevens semantisch te
interpreteren en te valideren. Dit betekent dat de verantwoordelijkheid hiervoor bij mensen
ligt. Om semantische interpretatie en validatie te kunnen uitvoeren, moeten de gebruikers wel
www.via-nova-architectura.org February 2007 4
over de noodzakelijke informatie, kennis en ervaring beschikken. Om de gebruiker op de
hoogte te brengen van de betekenis van de gegevens is een termenlijst ofwel thesaurus een
veel gebruikt middel. Een dergelijke lijst werkt vaak goed in een omgeving waarbij de
gegevens exclusief tot een expertisedomein zijn toe te wijzen. Gegevens die afkomstig zijn, of
betrekking hebben op verschillende expertisedomeinen, kunnen niet met een eenvoudig
gestructureerde termenlijst inzichtelijk worden gemaakt.
2.4. Het koppelen van geautomatiseerde systemen
Geautomatiseerde systemen worden steeds meer samengesteld uit delen gedistribueerde
functionaliteit die:
• vaak onafhankelijk van elkaar ontwikkeld zijn;
• zich op verschillende platforms bevinden;
• zich in principe overal kunnen bevinden [Orbst, 2004].
In situaties waarbij gegevens uit verschillende expertisedomeinen en van verschillende
applicaties worden gecombineerd en met elkaar in verband worden gebracht, is een expliciete
beschrijving van de gegevens noodzakelijk. Niet alleen een expliciete beschrijving, maar een
beschrijving van onderlinge afhankelijkheden tussen de gegevens en de afhankelijkheid met de
omgeving wordt dan steeds meer een noodzaak. Die situatie kan al vrij snel optreden wanneer
verschillende geautomatiseerde systemen met elkaar gekoppeld worden (Application to
Application =A2A).
In figuur 2 is weergegeven welke type modellen en welke vormen van communicatie op elkaar
afgestemd dienen te worden. De formele modellen in deze figuur zijn een onderdeel van de
geautomatiseerde systemen en zijn een resultaat van systeemontwikkeling. Een
systeemontwikkeling alleen al is een complex proces waarbij veel communicatie bij nodig is en
waarbij de nodige semantische conflicten kunnen optreden. Met de term agent wordt een
autonoom “handelend iets” bedoeld en dat “iets” is tevens in staat is met andere agents te
communiceren. Die agents kunnen zowel mensen als machines zijn.
• ...
Human
Agent 1
(HA1)
Human
Agent 2
(HA2)
exchange signs,
e.g. nat. language
‘‘JAGUAR“
Internal
models
Formal
models
exchange signs,
e.g. protocols
MA1
HA1 HA2 MA2
a specific domain,
e.g. animals
Machine
Agent 1
(MA1)
Machine
Agent 2
(MA2)
(H2H) (H2A),(H2A2H),(A2H) (A2A)
= flow of communication
and also the flow of semantics(H2H) (H2A),(H2A2H),(A2H) (A2A)
Human to human Human to application Application to human Application to application
Stands for
Refers toSymbolize
Symbol Referent
Concept
Things in the
real world
Concepts /
Semantic structures
Symbols /
Syntactic structures
The Meaning Triangle
&
(Based on Maedche, 2002)
Figuur 2 Verschillende vormen van modellen en de verschillende vormen van communicatie
www.via-nova-architectura.org February 2007 5
3. Mogelijke oplossingsrichting
Voor de geschetste problemen wordt in een overweldigend aantal publicaties de volgende
oplossing aangedragen: Het gebruik van een ontologie.
In de volgende opsomming wordt een globaal overzicht van de toepassingsmogelijkheden van
een ontologie weergegeven [Ushold,1996]:
• communicatie – tussen mensen en organisaties;
• interoperabiliteit – tussen systemen;
• software engineering – specificaties, kwaliteit, herbruikbare componenten en
kennisacquisitie.
De ontologie wordt gebruikt om de ontology commitment te beschrijven, wat Gruber [1993]
omschrijft als de overeenstemming over objecten en relaties waarover gecommuniceerd wordt.
Verder is er een overeenkomst om een gezamenlijk vocabulair op een coherente en
consistente wijze te hanteren.
In figuur 3 zijn de concepten ontology en ontology commitment gepositioneerd, in relatie tot
de omgeving.
• ...
Human
Agent 1
(HA1)
Human
Agent 2
(HA2)
exchange signs,
e.g. nat. language
‘‘JAGUAR“
Internal
models
Formal
models
exchange signs,
e.g. protocols
HA1
MA2
a specific domain,
e.g. animals
Machine
Agent 1
(MA1)
Machine
Agent 2
(MA2)
Ontology
Description
Ontology
Formal Semantics
=The ontological commitment refers to agreements on the use
of the shared vocabulary by the agents committed to the
ontology
Stands for
Refers toSymbolize
Symbol Referent
Concept
Things in the
real world
Concepts /
Semantic structures
Symbols /
Syntactic structures
The Meaning Triangle
commit
MA1
commit
commit commit
HA2
commit
(Based on Maedche, 2002)
Figuur 3 Een ontologie: Een oplossing om verschillende vormen van modellen en de
verschillende vormen van communicatie aan elkaar te kunnen relateren
Uitgaande van de drie voorgaande Figuurn zou een ontologie opgevat kunnen worden als een
gezamenlijke, eenduidige en consistente “meaning triangle” die, door met elkaar
communicerende agents wordt gehanteerd. In de volgende paragraaf worden een aantal
gepubliceerde inzichten op het begrip ontologie behandeld.
4. Wat is een ontologie?
De klassieke vorm, de wetenschap van ontologie, is een discipline van de filosofie die zich
bezig houdt met de aard en de organisatie van de realiteit. Vanuit een andere invalshoek
wordt het nu gebruikt om de wereld te beschrijven, met het doel om ondersteuning te bieden
aan de ontwikkeling van informatiesystemen. In die context worden vaak de volgende
definities gehanteerd:
• an explicit specification of a conceptualization [Gruber, 1993: 199]
www.via-nova-architectura.org February 2007 6
• a shared understanding of some domain of interest [Uschold, 1996]
In veel publicaties worden naar deze (vage) definities verwezen maar er is ook de nodige
kritiek op. Chris Welty [2000], een onderzoeker die zich met ontology-driven conceptual
modeling bezig houdt, hanteert de volgende definitie:
De beschrijving van de soorten van aanwezige entiteiten en de wijze waarop ze met
elkaar gerelateerd zijn
Hij geeft tevens aan dat een ontologie de volgende aspecten moet bevatten: betekenis,
organisatie, taxonomie, overeenstemming, vocabulair, relatie met de reële wereld.
Er zijn veel afwijkende inzichten over de vorm waarin een ontologie moet worden beschreven.
Gruber [1995] geeft aan dat een ontologie elke vorm kan krijgen om algemene en complexe
structuren te beschrijven (language independant). B. Smith [2000], een onderzoeker die zich
bezig houdt met formele ontologie, onder andere voor informatiesystemen, geeft een aantal
aanwijzigen voor het ontwikkelen van een bruikbare ontologie:
Een ontologie moet niet bestaan uit een enkele boomstructuur maar uit een familie van
boomstructuren, die elk een weerspiegeling zijn van specifieke zienswijzen (facetten of
elementen) van het doeldomein. Naast de verschillende zienswijzen moeten
verschillende gegranuleerdheden (of levels) worden ondersteund, bijvoorbeeld:
microscopisch, mesoscopisch, macroscopisch.
B. Madsen [2002] heeft een schematisch overzicht (figuur 4) gemaakt met een aantal
aspecten van een ontologie, inclusief de verschillende opties, waar ontologie in de doelstelling
en de wijze van uitwerking van elkaar kunnen verschillen. Een aspect dat centraal staat in veel
discussies, is hoe formeel een ontologie dient te zijn en op welk moment er niet meer van een
ontologie gesproken mag worden. Vaak wordt een lichtgewicht ontologie aangeduid als
taxonomie. In deze categorie zijn begrippen als: catalogus, glossarium, thesaurus en directory
te plaatsen.
philoso-
phical
ontology
pragmatic
ontology
top level
ontology
universal
ontology
domain
specific
ontology
general
ontology
task
specific
ontology
task inde-
pendant
ontology
language
inde-
pendant
ontology
language
inde-
pendant
ontology
formal
ontology
not
formal
onto-
logy
VIEW
specific
ontology
LEVEL SUBJECT PURPOSE LANGUAGE FORMALIZING
application
specific
ontology
Guarino, Nicola (1998). Formal Ontology and Information Systems,. In: Formal
Ontology in Information Systems, Proceedings of the First International
Conference (FOIS'98), June 6-8, Trento, Italy, 3-15. Ed. Nicola Guarino.
Amsterdam: IOS Press.
Bodil Nistrup Madsen (2002), based on a.o.:
ontology
Figuur 4 Aspecten van een ontologie en mogelijke opties binnen die aspecten
Reimer [2001] definieert een taxonomie als een gecontroleerd vocabulair die is geordend in
een concept hiërarchie. Een ontologie definieert hij als een taxonomie waar de betekenis van
elk concept gedefinieerd is door de specificatie van de eigenschappen, relaties naar andere
concepten en axioma’s die zorgen voor een inperking van de interpretatie.
www.via-nova-architectura.org February 2007 7
Waarin verschilt een ontologie nu van een gegevensmodel? S. Toivonen [2003] geeft aan dat
er geen strikte scheidslijn tussen deze twee type modellen te trekken is maar dat een
ontologie:
• meer algemeen en meer herbruikbaar is;
• toepasbaar is voor meer doelstellingen en gebruikersgroepen;
• eenvoudiger gemeenschappelijk te delen is;
• meer gericht zijn op de semantiek van concepten (in tegenstelling tot een zuivere
structuur en integriteit).
Uit de voorafgaande verhandeling is te concluderen dat er veel voordelen worden toebedeeld
aan het gebruik van een ontologie maar dat er veel manieren zijn waarop een ontologie kan
worden gecreëerd en vormgegeven. Om de veronderstelde voordelen daadwerkelijk te kunnen
behalen moeten behoorlijk wat afwegingen en keuzes worden gemaakt. Aangezien het
ontwikkelen en het onderhouden van ontologie voor informatiesystemen nog een relatief
nieuwe discipline is, zijn er nog maar weinig goede voorbeelden te vinden, die als leidraad
kunnen dienen.
5. Het ontwikkelen en onderhouden van een ontologie/taxonomie
In een speciale uitgave van de ACM over ontology engineering, geven Gruninger & Lee [2002]
aan dat het creëren van ontologieën een moeilijke, tijdrovende kostbare aangelegenheid is.
Vooral wanneer het ontwerp formeel genoeg moet zijn om geautomatiseerd redeneren te
ondersteunen. Deze laatste genoemde mogelijkheid zal binnen de meeste ondernemingen op
dit moment geen hoge prioriteit hebben. Het is daarom de moeite waard om naar oplossingen
te zoeken die wat minder formeel en wat meer pragmatisch zijn.
In tegenstelling tot de informatie technologie beschikt de bibliotheekwetenschap wel over een
uitgebreide ervaring op het gebied van een ontwikkelen en onderhouden van taxonomieën.
Hier worden twee type classificatieschema’s toegepast: enumerative en faceted. De
enumerative-aanpak verlangt een kennisdomein dat successievelijke verdeeld wordt in engere
klassen die alle mogelijk subklassen bevatten, inclusief samengestelde klassen. De faceted
aanpak, die door Ranganathan [1967] in 1939 is voorgesteld, baseert zich niet op een
uitsplitsing van het universum van kennis, maar is gebaseerd op het opsplitsen van complexe
subjecten in beperkt subjectdomein, in groepen van simpele concepttermen, die ook wel facets
worden genoemd [Prieto-Díaz, 2002]. In de tweede fase worden deze facets gesynthetiseerd
in een gecontroleerd vocabulair inclusief beschrijvingen van samengestelde subjecten. In de
bibliotheekwereld is het gebruikelijk om daarnaast nog een coderingsschema te ontwikkelen
voor de onderdelen binnen de classificatieboom.
R. Prieto-Díaz [2002] beschrijft in het artikel: ‘a facetted Approach to building Ontologies’, een
aanpak die gebaseerd is op facetted classifications. Eerst wordt top-down, met behulp van
aanwezige expertise, een initiële classificatiehiërarchie opgesteld. Vervolgens worden
gerelateerde termen in informatieobjecten in categorieën gegroepeerd (bottom-up). Als laatste
wordt de initiële classificatiehiërarchie via een iteratief proces met de gecreëerde clusters
vergeleken, en als resultaat kunnen mogelijke aanpassingen op de hiërarchie worden
doorgevoerd. In de figuur 5 wordt dit proces schematische afgebeeld.
www.via-nova-architectura.org February 2007 8
Postulated Ontology Synthesized Clusters
Ontology is modified based
on how it maps to
discovered clusters
x s
t u
v w
D
F
E
B
C
A
Clusters are
mapped to
ontology
2) Bottom-up
3) Revising & validating
1) Top-down
R. Prieto-Díaz (2002)
Figuur 5 De hoofdstappen binnen het faceted domein analyseproces
R. Prieto-Diaz [2002] schrijft dat het grootste voordeel van de aanpak is, dat het praktisch en
bruikbaar is. De aanpak resulteert in ontologieën die geen formele definities van concepten en
axioma’s bevatten maar wel een gestructureerde gecontroleerd vocabulair dat op informele
wijze concepten definieert. Het resultaat biedt wel voldoende informatie om de specificatie van
een formele ontologie en bijbehorende formele documentatie te ondersteunen. Zijn eigen
ervaringen zijn zeer positief en deze zijn opgedaan in het beschrijven van domeinmodellen
voor command&control-systemen en systemen voor bank- en verzekeringsinstellingen.
Er zijn geen aanwijzingen dat deze specifieke aanpak verder breed in de praktijk wordt
toegepast. Dit is wel het geval met een oplossing die sterke overeenkomsten met deze aanpak
kent: het IBM Business Data Concepts Classification model.
6. IBM Information FrameWork (IFW)
Het Business Concepts Classification model is een onderdeel van het IBM Information
Framework (IFW). Dit informatie raamwerk is afgeleid van het Information Systems
Framework (ISA) dat door J.A. Zachman [1987] in IBM Systems Journal 26, beschreven is. In
een tweede artikel over ISA: extending and formalizing the framework for Information
Systems Architecture [Sowa, 1992], wordt het raamwerk meer formeel beschreven en heeft
een uitbreiding van het aantal kolommen plaatsgevonden. Omdat de bedenkers van IFW al
tegen onduidelijkheden en tekortkomingen van ISA waren opgelopen, hebben zij besloten om
hier zelf praktische oplossingen voor te bedenken. In tegenstelling tot ISA wat een leeg
raamwerk is, bestaat voor IFW een volledig uitgewerkte taxonomie voor een Bankbedrijf,
inclusief daarvan afgeleide modellen en toepassingen.
IFW is ontwikkeld door IBM’s Banking Solution Centre in Dublin in samenwerking met, en met
input en feedback van een aantal vooraanstaande financiële instellingen in de wereld
[Evernden, 1996]. Het project is in 1991 gestart en is verder gegaan met resultaten van twee
eerdere projecten op dit vlak: Financial Application Architectuur(FAA) en Financial Application
Solutions (FAS90). The Financial Services Function Model (FSFM) heeft in 1993 haar eerste
release gekend en is in 1994 opgevolgd door het Financial Services Workflow Model (FSWM).
Inmiddels zijn deze modellen met diverse producten aangevuld, zoals een Object Model voor
object georiënteerde omgevingen (FSOM), een Banking Data Warehouse oplossing (BDW), een
oplossing voor het snel implementeren van datamarts (EZMart solution), en recentelijk is het
object model uitgebreid met een interface design model. Deze laatste uitbreiding ondersteunt
www.via-nova-architectura.org February 2007 9
oplossingen waarbij interfaces en hergebruik van (bestaande) componenten als uitgangpunten
worden gehanteerd. Volgens de commerciële informatie op de website van IBM hebben 170
banken en verzekeringsmaatschappijen van een van de producten gebruik gemaakt en aan de
verdere ontwikkeling ervan bijgedragen.
Evernden [1996] heeft een uitgebreide beschrijving over de verschillen tussen de twee
raamwerken. Wat de karakterisering betreft geeft hij de volgende verschillen aan:
Daar waar ISA zich richt op een Informatie systeem Architectuur, richt IFW zich meer
op het managen van de informatie. ISA biedt een systematische taxonomie van
concepten voor gerelateerde zaken in de wereld van representaties voor de computer.
IFW richt zich meer op het beschrijven van situatie waar informatie wordt gecreëerd en
gebruikt.
ISA heeft een raamwerk van zes kolommen, vijf rijen en dertig cellen. Bij IFW wordt een meer
gedetailleerde opdeling gehanteerd waarbij uiteindelijk vijftig cellen ontstaan:
Horizontale groepering: Types of information (Inclusief de verdere opdeling):
• Organization – Strategy (1), Structure (2), Skills (3)
• Business – Data (4), Function (5), Workflow (6), Solution (7)
• Technical – Interface (8), Network (9), Platform (10)
Verticale groepering: Levels of constraints, (Inclusief de verdere opdeling):
• Deconstruction - Domain Concept (A-level), Domain Classification (B-level)
• Composition – Generic Template (C-level), Design Context (C’-level)
• Implementation -Operational Bound (D-level)
Voor de overzichtelijkheid is het raamwerk in figuur 6 schematisch afgebeeld.
III) Technical ViewII) Business View
The Information Framework
I) Organisation View
Structure SkillsStrategy Data Functions Workflow Solutions Interface Networks Platforms
Domain
Concept
(A-level)
Domain
Classification
(B-level)
Generic
Template
(C-level)
Design
Context
(C’-level)
Operational
Bound
(D-level)
Deconstruction
level
Composition
level
Implementation
level
Types of infomation
Levels of constraint
-Three views
-Three levels
-Ten columns
-Five rows
-Fifty cells -Six dimensions
(See next page)
Modelware International (1999)
Figuur 6 Het IFW-raamwerk
De opdeling van de kolommen, samen met de basisstructuur, is ontworpen om hergebruik van
informatie in elk van de andere cellen mogelijk te maken. In IFW is “informatie” een
samenstelling van informatiecomponenten om de kennis en ervaring over een gegeven domein
te kunnen omvatten, zoal bijvoorbeeld de financiële industrie. Deze componenten kunnen
elementair of geaggregeerd zijn. Kenmerkend is dat “informatie” wordt opgevat als een
www.via-nova-architectura.org February 2007 10
complexe groepering van componenten die vanuit verschillende gezichtspunten kunnen
worden beschouwd. Een van deze gezichtpunten is het “data”-perspectief. “Data” is een van de
basisbouwblokken om informatie te kunnen creëren. Informatie is opgeslagen als een
combinatie van stukjes data. IFW wordt gebruikt om een deel van informatie te analyseren, de
informatie op te breken in constitueerde componenten en vervolgens de componenten in de
aangewezen cel van het raamwerk te plaatsen.
Het opbreken van informatie in componenten bewerkstelligt dat ieder informatie component
slechts een maal beschreven hoeft te worden. Zoals bij elke dossiersysteem is het belangrijk
dat het plaatsen van informatiecomponenten in cellen, volgens bepaalde regels of richtlijnen
gebeurt. IFW maakt gebruik van een faceted classification systeem waarbij elke samenstelling
van informatie wordt gevormd uit onderdelen die uit de verschillende perspectieven of
aspecten geselecteerd worden.
7. IFW Business Data Concepts Classification
Voor de beschrijving van IFW Business Data Concepts Classification zal het white paper:
Business Classification Model, van Modelware International [1999], worden samengevat. Dit
bedrijf was de leverancier van het geautomatiseerde hulpmiddel voor de ondersteuning van
IFW.
In veel systeemontwerpmethoden is het gebruikelijk om onderscheid te maken in de volgende
beschouwingniveaus:
• Conceptueel – hier worden de concepten in het te beschouwen domein beschreven
(Business);
• Logisch – dit is een implementatieonafhankelijk ontwerp;
• Fysiek – dit is een implementatieafhankelijk ontwerp.
Vaak worden voor al de drie beschouwingniveaus nagenoeg vergelijkbare diagrammen
gebruikt die bekend staan onder de namen: object relatie (OR) model en entiteit relatie (ER)
model. De bedenkers van IFW zijn van mening dat deze modellen niet geschikt zijn om
domeinbrede beschrijving te maken waarbij alle apecten vanuit verschillende gezichtpunten
een plaats in het model krijgen. Bij de ER/OR-modellen bestaat het gevaar dat een gezichtpunt
de overhand krijgt en dat vanuit dit gezichtpunt data-elementen worden gegroepeerd. Bij het
tot stand komen van deze modellen wordt vaak bewust of onbewust rekening gehouden met
de datastructuren waar de data-elementen hun plek gaan krijgen. Het gevolg is dat een deel
van de gebruikers hun eigen view op het domein niet meer terug zien.
Om het genoemde nadeel te voorkomen is binnen IFW voor de uitwerking van conceptueel
niveau gekozen voor een classificatie model ofwel een taxonomie. Op het hoogste niveau, het
A-level, worden negen data domeinconcepten beschreven:
• Betrokken partij - involved party (IP);
• Overeenkomst – arrangement (AR);
• Conditie – condition (CN);
• Product/services – product/service (PD);
• Locatie – location (LC);
• Classificatie – classification (CL);
• Business richtinggevende waarden - Business Direction Items (BD);
• Gebeurtenis – event (EV);
• Hulpbron – resource (RC).
Het concept classification is een uitzondering en wordt gebruikt voor die (deel)taxonomieën
waarvan uit meer dan één concept kan worden gerelateerd. Voorbeelden van concepten
www.via-nova-architectura.org February 2007 11
waarvoor dit geldt zijn: meeteenheden, talen, rating modellen en structureren voor financiële
verslaglegging.
Deze A-level concepten vormen de basis voor een onderliggende verzameling
deeltaxonomieën, die samen het B-level vormen. Vanuit het B-level worden logische ER-
schema’s samengesteld (het C- en C’-niveau), die vervolgens worden vertaald in een database
schema (het D-niveau). Deze opdeling is in figuur 7 afgebeeld.
IFW Framework
-3 Layers of the data column
Deconstruction
level
Composition
level
Implementation
level
Conceptual
Logical
Physical
Involved
Party (IP)
Arrangement
(AR)
Conditions
(CN)
Product
(PD)
Location
(LO)
Classification
(CL)
Business
Direction
Item (BD)
Event
(EV)
Resource
Item
(RI)
A-level
B-level
C-level & C’-level
D-level
9 data concepts
27 classification
hierarchies
54 business
objects
Based on: Modelware International (1999)
Figuur 7 Onderdelen van het data concepts classification model en de afhankelijkheid met de
overige gegevensgeoriënteerde modellen
Vanuit elk A-level data concept worden drie hiërarchieën opgebouwd, die samen het B-level
vormen.
Ten eerste een fundamentele hiërarchie die de fundamentele concepten meer in detail uitwerkt
en bevat subtypes van het A-level concept en de status waarin een concept zich kan bevinden.
Ten tweede een associatieve hiërarchie waarin relaties tussen onderlinge concepten worden
beschreven. Dit kunnen relaties zijn tussen concepten die zich willekeurig binnen de taxonomie
bevinden. Dergelijke relaties worden uitgedrukt op domein conceptniveau. Voorbeeld daarvan
is: ‘IP is spouse of IP’. De relatie kan worden voorzien van beperkingen en bij het beschrijven
daarvan kunnen concepten uit de verschillende hiërarchieën worden toegepast. Zo kan
bijvoorbeeld worden vastgelegd dat één IP in de ‘IP is spouse of IP’-relatie het geslacht vrouw
is terwijl de tweede IP van het mannelijk is.
Ten derde: Een descriptor hiërarchie beschrijft op welke wijze concepten in de werkelijkheid
worden geïdentificeerd. Vaak gebeurt dit op basis van een verzameling van kenmerken,
bijvoorbeeld: naam, adres, geboortedatum.
Elk beschreven dataconcept kan worden vervolgd met één of meer labels die elk een vraag
impliceren. Het antwoord erop bestaat uit een opsomming van één of meer concepten. Een
combinatie van een vraaglabel en de antwoorden wordt een schema genoemd. De schema’s
ontstaan door verschillende gezichtpunten die op de business bestaan. De aanpak biedt de
mogelijkheid om de gezichtpunten die diverse bedrijfsdomeinen op het bedrijf hebben, op een
ordelijke wijze onder te brengen. In figuur 8 is het resultaat van een dergelijke ordening
afgebeeld.
www.via-nova-architectura.org February 2007 12
Involved Party(IP)
INVOLVED
PARTY
TYPE
Individual INDIVIDUAL GENDER
Female
Male
Organization
ORGANIZATION
LEGAL STRUCTURE
TYPE
Corporation
Partnership
IP Descriptor
IP
DESCRIPTOR
TYPE
IPName component
IP
NAME
COMPONENT TYPE
Given Name
Name Initial
Family name
IP Relationship
IP
RELATIONSHIP
TYPE
IP/IP-relationship
IP/IP
RELATIONSHIP
TYPE
IP is spouse of IP
IP is employee of IP
IP is customer of IP
INDIVIDUAL
EMPLOYMENT
STATUS
Working Individual
Not Employed Individual
1. Fundamental hierarchy
2. Descriptive hierarchy
3. Relationship hierarchy
Answer(s)Question= +scheme
Explanation of the B-level
-Concept Involved party (IP)
Based on: Modelware International (1999)
Figuur 8 De opsplitsing van een concept op het A-level, in drie hiërarchieën
8. Evaluatie van IFW Business Data Concepts Classification
Veel informatie met betrekking tot IFW en het Financial Services Data Model is proprierty.
Desondanks is er toch de nodige vrij verkrijgbare informatie beschikbaar. Zelf ben ik aanwezig
geweest bij een tweedaagse sessie, waarbij IFW-specialisten uitleg hebben gegeven over het
model en de inhoud. Specialisten uit diverse afdelingen van een bank waren aanwezig, om het
model te beoordelen voor gebruik in een data warehouse project. De informatie architecten
van de bank hadden in het verleden al de ambitie opgegeven om tot een geïntegreerd
gegevensmodel over de afdelingen heen te komen. Tijdens die sessie bleek dat de beelden die
de specialisten over de gegevens in bank hadden, nauwelijks van elkaar afweken.
Afdelingsspecifieke details bleken al vaak al in de hiërarchie aanwezig of konden vrij
gemakkelijk aan het model worden toegevoegd. Na aanpassing in het model konden binnen
een uur aangepaste prototypes van rapporten worden getoond, met daarin de nieuwe
gegevenselementen verwerkt.
In de communicatie tussen personen met verschillende expertise is het Business Data Concept
model een bruikbaar hulpmiddel. Het biedt het een goede basis voor verschillende technische
modellen die in automatiseringtrajecten worden toegepast. Het business data concept model in
combinatie met daarvan afgeleide modellen worden al meer dan 10 jaar succesvol
commercieel op de markt gebracht. Binnen het domein bankbedrijf lijkt IFW Business Data
Concepts Classification de belofte te kunnen waarmaken die aan ontologieën worden
toegekend.
9. Investeren in een organisatiebrede taxonomie
Investeringen in taxonomieën zullen zelden of nooit op directe wijze tot kostenbesparingen
omzetverbeteringen leiden. Het kan het beste worden gepositioneerd als een infrastructurele
investering om bedrijfsbrede strategische doelen te ondersteunen. Dit is te illustreren aan de
hand van het model (figuur 9) van Weill en Broadbent [1998] om investeringen in een IT
investeringsportfolio te positioneren.
www.via-nova-architectura.org February 2007 13
Management Objectives
Infor-
mational Strategic
Transactional
Infrastructure
Increased control
Better information
Better integration
Improved quality
Business integration
Flexibility & agility
Reduced marginal cost of IT
Reduced IT costs over time
Standardization
Increased sales
Competitive advantage
Competitive necessity
Market positioning
Innovative services
Cut costs
Increased ,
throughput
Positionering
van de
investering in
taxonomieën -Types of IT investments-
Based on Weill, P. & Broadbent, M, 1998)
Figuur 9 Een opdeling in type IT-investeringen, afgezet tegen mogelijke management
doelstellingen
De investering kan indirect een bijdrage leveren aan:
• de snellere realisatie van business integratie oplossingen:
• een hogere flexibiliteit en wendbaarheid van de geautomatiseerde systemen
(Infrastructural);
• een betere informatie en een verbeterde kwaliteit en integratie van informatie
(Informational);
• E-business initiatieven waarmee de strategische concurrentie positie van een bedrijf
kan worden verbeterd (Strategic).
De positieve bijdragen die een organisatiebrede taxonomie kunnen bieden is als volgt samen
te vatten:
• Het sneller en op een semantisch verantwoorde wijze kunnen koppelen van heterogene
en geautomatiseerde systemen.
• Minder fouten en conflicten als gevolg van minder onduidelijkheden over de semantiek
van gegevens.
Investeringen kunnen pas iets kunnen opleveren wanneer de taxonomieën actief in projecten
en het dagelijkse werkzaamheden worden toegepast.
10. Conclusies
In veel publicaties worden ontologieën en de lichtgewichte versie ervan, een taxonomie, als
oplossing aangedragen voor een groot aantal communicatieproblemen waarbij
geautomatiseerde systemen betrokken zijn. Veel minder informatie is beschikbaar over de
wijze waarop een ontologie of taxonomie in de praktijk het beste ontwikkeld, onderhouden en
toegepast kan worden. Voor bedrijfsbrede taxonomieën blijkt de facetted classification aanpak
tot praktisch bruikbare resultaten te leiden. In het bijzonder de specifieke invulling die binnen
IBM’s IFW wordt gehanteerd, heeft zich in de praktijk bewezen. Het biedt:
• ondersteuning bij het oplossen van communicatieproblemen tussen verschillende
expertisedomeinen;
www.via-nova-architectura.org February 2007 14
• vorm en structuur waardoor redundantie in concepten en bijbehorende termen
eenvoudig kan worden voorkomen;
• uitbreidbaarheid zonder dat de hoofdstructuur van de taxonomie gewijzigd hoeft te
worden;
• een stabiel uitgangspunt voor meer formele modellen, die noodzakelijk zijn voor
volledige geautomatiseerde communicatie en verwerking;
• een mogelijke basis voor een kennisapplicatie waar gebruikers geïnformeerd worden
over de betekenis van de termen en hun afhankelijkheden, die binnen een bedrijf
worden gehanteerd.
Indien een bedrijf besluit om met een ontologie te gaan aanschaffen en/of ontwikkelen, dan is
het aan te bevelen om kennis te nemen en eventueel gebruik te maken best practices die
binnen IBM’s IFW Business Data Concepts Classification zijn toegepast.
Referenties
[Darke, 1999] Darke P. & Shanks G., Understanding corporate data models,
Information & Management, Volume 35, Issue 1, 4 January 1999.
[Evernden, 1996] Evernden R., The Information Framework. IBM Systems Journal, Vol.
35, No. 1. 1996
[Gruber, 1993] Gruber, T., A Translation Approach to Portable Ontology
Specifications. In Knowledge Acquisition, 5(2), 1993.
[Gruber, 1993] Gruber, T., Towards Priciples for the Design of Ontologies Used for
Knowledge Sharing. - In: N. Guarino, R. Poli (Eds.), Formal Ontology
in Conceptual Analysis and Knowledge Representation. Boston:
Kluwer Academic Publishers,1995.
[Gruninger, 2002] Gruninger M. & Lee J., Ontology Applications and Design,
Communications of the ACM, February 2002, Vol. 45, No.2.
[IBM, 2002] IBM, IFW Object Models, General Information Manual, 2002.
[IBM, 2002a] IBM, IFW Critical Business Process Models. General Information
Manual, 2002.
[IBM, 2002b] IBM, Implementing Message Based Integration Using the IFW / IAA
Object Models, Release 1.0, First Edition, July 2002.
[IBM, 2002c] IBM, Building Components with the IFW / IAA Object Models, Release
1.0, First Edition, July 2002.
[IBM, 2004] IBM, Information FrameWork Object Models solution from IBM,
http://www1.ibm.com/industries/financialservices/doc/content/soluti
on/391981103.html, 2004.
[Laudon, 2004] Laudon K. & Laudon P., Management Information Systems, Managing
the digital firm, 8th Ed. New Jersey, Pearson Education, 2004.
[Madsen, 2004] Madsen, B.,Terminological ontologies, Ph.d. course on representation
formalisms for ontologies, Copenhagen, 30.10.-1.11.02
[Maedche, 2002] Maedche, A., Ontology Learning for the Semantic Web. Kluwer
Academic Publishers, Boston, MA, 2002.
Ing. R.H.W. Claassens MIM
SNS Bank
Richard.Claassens@SNS.NL
www.via-nova-architectura.org February 2007 15
[McComb, 2003] McComb, D., Semantics in Business Systems -- The Savvy Manager's
Guide, Morgan Kaufmann, 2003.
[Modelware, 1999] Modelware International, White paper: The Business Classisfication
Model, 1999.
[Ogden, 1923] Ogden, C. K. & Richards, I. A., "The Meaning of Meaning." 8th Ed.
New York, Harcourt, Brace & World, Inc, 1923.
[Orbst, 2005] Orbst, L., Ontologies and the Semantic Web: An Overview, MITRE
Information Semantics Center for Innovative Computing &
Informatics, www.xml.saic.com/icml/ic_mwg/ Obrst-Semantic_Web-
Intro11.ppt, 2005.
[Prieto-Díaz, 2002] Prieto-Díaz R., A Faceted Approach to Building Ontologies,
Commonwealth Information Security Center, James Madison
University, 2002.
[Ranganathan, 1967] Ranganathan, S.R., Prolegomena to Library Classification. Asian
Publishing House, Bombay, India, 1967.
[Reimer, 2001] Reimer, U., Tutorial on Organizational Memories for Capturing,
Sharing and Utilizing Knowledge. International Conference on
Enterprise Information Systems, ICEIS 2001, Setubal, Portugal, July
7-10, 2001.
http://research.swisslife.ch/~reimer/OM_Tutorial/index.html
[Smith, 2000] Smith B., Ontology: philosophical and computational,
http://wings.buffalo.edu/philosophy/faculty/smith/articles/ontologies.
html, 2000.
[Sowa, 1992] Sowa, J.F. & J.A. Zachman, Extending and formalizing the framework
for information systems architecture, IBM Systems Journal, Vol. 31,
No. 3, 1992.
[Sowa, 2000] Sowa, J. F. Knowledge Representation, Logical, Philosophical and
Computational Foundations. Brooks Cole Publishing Co, 2000.
[Toivonen, 2003] Toivonen, S., Ontologies, Course 582407: Software Agent
Technology, VTT Information Technology 3.3, 2003.
[Uschold, 1996] Uschold, M. & Gruninger, M., Ontologies: principles, methods, and
applications, Knowledge Engineering Review, 11(2), 1996.
[Weill, 1998] Weill, P. & Broadbent, M., Leveraging the new infrastructure. Harvard
Business School Press, 1998.
[Welty,2000] Welty, C., Ontology-Driven Conceptual Modeling, IBM Watson
Research Center, 2000.
http://ontolog.cim3.net/file/resource/presentation/OntoClean--
ChrisWelty_20041118/OntoClean-2004v1--ChrisWelty_20041118.ppt
[Zachman, 1987] Zachman, J. A., A Framework for Information Systems Architecture,
IBM Systems Journal 26, No. 3, 1987.

Más contenido relacionado

Destacado

Heidag Architectuur | presentatie van verkenningen
Heidag Architectuur | presentatie van verkenningenHeidag Architectuur | presentatie van verkenningen
Heidag Architectuur | presentatie van verkenningenRichard Claassens CIPPE
 
What changes with the EU Data Protection Regulation for Gambling Companies
What changes with the EU Data Protection Regulation for Gambling CompaniesWhat changes with the EU Data Protection Regulation for Gambling Companies
What changes with the EU Data Protection Regulation for Gambling CompaniesGiulio Coraggio
 
#Privacy Matters - Come il regolamento privacy europeo da un problema può div...
#Privacy Matters - Come il regolamento privacy europeo da un problema può div...#Privacy Matters - Come il regolamento privacy europeo da un problema può div...
#Privacy Matters - Come il regolamento privacy europeo da un problema può div...Giulio Coraggio
 
What changes for Internet of Things technologies with the EU Data Protection ...
What changes for Internet of Things technologies with the EU Data Protection ...What changes for Internet of Things technologies with the EU Data Protection ...
What changes for Internet of Things technologies with the EU Data Protection ...Giulio Coraggio
 
Privacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitiefPrivacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitiefRichard Claassens CIPPE
 

Destacado (7)

Cloud computing lunchsessie (v2)
Cloud computing lunchsessie (v2)Cloud computing lunchsessie (v2)
Cloud computing lunchsessie (v2)
 
Verkenning geo services
Verkenning geo services Verkenning geo services
Verkenning geo services
 
Heidag Architectuur | presentatie van verkenningen
Heidag Architectuur | presentatie van verkenningenHeidag Architectuur | presentatie van verkenningen
Heidag Architectuur | presentatie van verkenningen
 
What changes with the EU Data Protection Regulation for Gambling Companies
What changes with the EU Data Protection Regulation for Gambling CompaniesWhat changes with the EU Data Protection Regulation for Gambling Companies
What changes with the EU Data Protection Regulation for Gambling Companies
 
#Privacy Matters - Come il regolamento privacy europeo da un problema può div...
#Privacy Matters - Come il regolamento privacy europeo da un problema può div...#Privacy Matters - Come il regolamento privacy europeo da un problema può div...
#Privacy Matters - Come il regolamento privacy europeo da un problema può div...
 
What changes for Internet of Things technologies with the EU Data Protection ...
What changes for Internet of Things technologies with the EU Data Protection ...What changes for Internet of Things technologies with the EU Data Protection ...
What changes for Internet of Things technologies with the EU Data Protection ...
 
Privacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitiefPrivacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitief
 

Similar a Semantische interoperabiliteit met behulp van een bedrijfsbrede taxonomie

160729-WP05-Operating-Model-Canvas-Definitief-JG
160729-WP05-Operating-Model-Canvas-Definitief-JG160729-WP05-Operating-Model-Canvas-Definitief-JG
160729-WP05-Operating-Model-Canvas-Definitief-JGAnderson MacGyver
 
20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal Domein20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal Domeingueste730a5
 
20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal Domein20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal DomeinBram Alkema
 
Prestaties verbeteren met New Governance
Prestaties verbeteren met New GovernancePrestaties verbeteren met New Governance
Prestaties verbeteren met New GovernanceLeon Dohmen
 
Commonline, de wereld na de periodiek
Commonline, de wereld na de periodiekCommonline, de wereld na de periodiek
Commonline, de wereld na de periodiekEmil Heijkants
 
Transe careb mwhitepaper_finaal
Transe careb mwhitepaper_finaalTranse careb mwhitepaper_finaal
Transe careb mwhitepaper_finaalimec.archive
 
Pembertons gelijk
Pembertons gelijkPembertons gelijk
Pembertons gelijkDino Seelig
 
220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdf220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdfGerard van der Hoeven
 
Enterprise social media studiedag hogescholenraad
Enterprise social media  studiedag hogescholenraadEnterprise social media  studiedag hogescholenraad
Enterprise social media studiedag hogescholenraadMarijn Somers
 
AI en de 4e industriële revolutie.pptx
AI en de 4e industriële revolutie.pptxAI en de 4e industriële revolutie.pptx
AI en de 4e industriële revolutie.pptxVictor22022001
 
Lotus Connections Als Social Intranet 1.0
Lotus Connections Als Social Intranet 1.0Lotus Connections Als Social Intranet 1.0
Lotus Connections Als Social Intranet 1.0Edwin Kanis
 
whitepaper Qquest versie 4 dd 5-1-2016
whitepaper Qquest versie 4 dd 5-1-2016whitepaper Qquest versie 4 dd 5-1-2016
whitepaper Qquest versie 4 dd 5-1-2016Ruud Harreman CMC
 
FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...
FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...
FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...Flevum
 
Identity Management en Architectuur
Identity Management en ArchitectuurIdentity Management en Architectuur
Identity Management en ArchitectuurLeon Kuunders
 
Het Nieuwe Werken mbv IBM technologie
Het Nieuwe Werken mbv IBM technologieHet Nieuwe Werken mbv IBM technologie
Het Nieuwe Werken mbv IBM technologiePim van Wetten
 
Rosaert academy MMIT brochure 2016
Rosaert academy MMIT brochure 2016Rosaert academy MMIT brochure 2016
Rosaert academy MMIT brochure 2016Nardie Scharenborg
 
Rosaert academy mmit brochure 2016
Rosaert academy mmit brochure 2016Rosaert academy mmit brochure 2016
Rosaert academy mmit brochure 2016Nardie Scharenborg
 

Similar a Semantische interoperabiliteit met behulp van een bedrijfsbrede taxonomie (20)

160729-WP05-Operating-Model-Canvas-Definitief-JG
160729-WP05-Operating-Model-Canvas-Definitief-JG160729-WP05-Operating-Model-Canvas-Definitief-JG
160729-WP05-Operating-Model-Canvas-Definitief-JG
 
20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal Domein20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal Domein
 
20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal Domein20080207 Camerik Digitaal Domein
20080207 Camerik Digitaal Domein
 
Prestaties verbeteren met New Governance
Prestaties verbeteren met New GovernancePrestaties verbeteren met New Governance
Prestaties verbeteren met New Governance
 
Commonline, de wereld na de periodiek
Commonline, de wereld na de periodiekCommonline, de wereld na de periodiek
Commonline, de wereld na de periodiek
 
Transe careb mwhitepaper_finaal
Transe careb mwhitepaper_finaalTranse careb mwhitepaper_finaal
Transe careb mwhitepaper_finaal
 
Pembertons gelijk
Pembertons gelijkPembertons gelijk
Pembertons gelijk
 
11. Wat is Big Data? En moeten we er wat mee?
11. Wat is Big Data? En moeten we er wat mee?11. Wat is Big Data? En moeten we er wat mee?
11. Wat is Big Data? En moeten we er wat mee?
 
220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdf220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdf
 
Enterprise social media studiedag hogescholenraad
Enterprise social media  studiedag hogescholenraadEnterprise social media  studiedag hogescholenraad
Enterprise social media studiedag hogescholenraad
 
AI en de 4e industriële revolutie.pptx
AI en de 4e industriële revolutie.pptxAI en de 4e industriële revolutie.pptx
AI en de 4e industriële revolutie.pptx
 
Lotus Connections Als Social Intranet 1.0
Lotus Connections Als Social Intranet 1.0Lotus Connections Als Social Intranet 1.0
Lotus Connections Als Social Intranet 1.0
 
Hoe kan mixit je helpen?
Hoe kan mixit je helpen?Hoe kan mixit je helpen?
Hoe kan mixit je helpen?
 
whitepaper Qquest versie 4 dd 5-1-2016
whitepaper Qquest versie 4 dd 5-1-2016whitepaper Qquest versie 4 dd 5-1-2016
whitepaper Qquest versie 4 dd 5-1-2016
 
FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...
FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...
FEX - 141124 - Van alignment naar ongewoon samenwerken final - bron boudewijn...
 
Identity Management en Architectuur
Identity Management en ArchitectuurIdentity Management en Architectuur
Identity Management en Architectuur
 
Trendrapport ESN
Trendrapport ESNTrendrapport ESN
Trendrapport ESN
 
Het Nieuwe Werken mbv IBM technologie
Het Nieuwe Werken mbv IBM technologieHet Nieuwe Werken mbv IBM technologie
Het Nieuwe Werken mbv IBM technologie
 
Rosaert academy MMIT brochure 2016
Rosaert academy MMIT brochure 2016Rosaert academy MMIT brochure 2016
Rosaert academy MMIT brochure 2016
 
Rosaert academy mmit brochure 2016
Rosaert academy mmit brochure 2016Rosaert academy mmit brochure 2016
Rosaert academy mmit brochure 2016
 

Más de Richard Claassens CIPPE

Privacy het nieuwe groen | KNVI afdeling IT-audit | definitief
Privacy het nieuwe groen | KNVI afdeling IT-audit | definitiefPrivacy het nieuwe groen | KNVI afdeling IT-audit | definitief
Privacy het nieuwe groen | KNVI afdeling IT-audit | definitiefRichard Claassens CIPPE
 
Is privacywetgeving een blokkade voor technologisch gedreven innovatie?
Is privacywetgeving een blokkade voor technologisch gedreven innovatie?Is privacywetgeving een blokkade voor technologisch gedreven innovatie?
Is privacywetgeving een blokkade voor technologisch gedreven innovatie?Richard Claassens CIPPE
 
Data Masking | waar in het IT-systeemlandschap? ...
Data Masking | waar in het IT-systeemlandschap?                              ...Data Masking | waar in het IT-systeemlandschap?                              ...
Data Masking | waar in het IT-systeemlandschap? ...Richard Claassens CIPPE
 
Taken van de functionaris voor gegevensbescherming
Taken van de functionaris voor gegevensbescherming Taken van de functionaris voor gegevensbescherming
Taken van de functionaris voor gegevensbescherming Richard Claassens CIPPE
 
Positie van de functionaris voor gegevensbescherming (FG)
Positie van de functionaris voor gegevensbescherming (FG)Positie van de functionaris voor gegevensbescherming (FG)
Positie van de functionaris voor gegevensbescherming (FG)Richard Claassens CIPPE
 
Pripare methodology-handbook-final-feb-24-2016
Pripare methodology-handbook-final-feb-24-2016Pripare methodology-handbook-final-feb-24-2016
Pripare methodology-handbook-final-feb-24-2016Richard Claassens CIPPE
 
Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)Richard Claassens CIPPE
 
Establishing SOA and SOA Governance 23032010 Amsterdam
Establishing SOA and SOA Governance 23032010 AmsterdamEstablishing SOA and SOA Governance 23032010 Amsterdam
Establishing SOA and SOA Governance 23032010 AmsterdamRichard Claassens CIPPE
 
Ontwerpmodel Internet Of Things Diensten
Ontwerpmodel  Internet Of Things  DienstenOntwerpmodel  Internet Of Things  Diensten
Ontwerpmodel Internet Of Things DienstenRichard Claassens CIPPE
 
Software packaged software principles publiek
Software packaged software principles publiekSoftware packaged software principles publiek
Software packaged software principles publiekRichard Claassens CIPPE
 

Más de Richard Claassens CIPPE (20)

Privacy het nieuwe groen | KNVI afdeling IT-audit | definitief
Privacy het nieuwe groen | KNVI afdeling IT-audit | definitiefPrivacy het nieuwe groen | KNVI afdeling IT-audit | definitief
Privacy het nieuwe groen | KNVI afdeling IT-audit | definitief
 
Is privacywetgeving een blokkade voor technologisch gedreven innovatie?
Is privacywetgeving een blokkade voor technologisch gedreven innovatie?Is privacywetgeving een blokkade voor technologisch gedreven innovatie?
Is privacywetgeving een blokkade voor technologisch gedreven innovatie?
 
Data Masking | waar in het IT-systeemlandschap? ...
Data Masking | waar in het IT-systeemlandschap?                              ...Data Masking | waar in het IT-systeemlandschap?                              ...
Data Masking | waar in het IT-systeemlandschap? ...
 
Taken van de functionaris voor gegevensbescherming
Taken van de functionaris voor gegevensbescherming Taken van de functionaris voor gegevensbescherming
Taken van de functionaris voor gegevensbescherming
 
Positie van de functionaris voor gegevensbescherming (FG)
Positie van de functionaris voor gegevensbescherming (FG)Positie van de functionaris voor gegevensbescherming (FG)
Positie van de functionaris voor gegevensbescherming (FG)
 
Pripare methodology-handbook-final-feb-24-2016
Pripare methodology-handbook-final-feb-24-2016Pripare methodology-handbook-final-feb-24-2016
Pripare methodology-handbook-final-feb-24-2016
 
Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)
 
Establishing SOA and SOA Governance 23032010 Amsterdam
Establishing SOA and SOA Governance 23032010 AmsterdamEstablishing SOA and SOA Governance 23032010 Amsterdam
Establishing SOA and SOA Governance 23032010 Amsterdam
 
Verkenning internet of things
Verkenning internet of thingsVerkenning internet of things
Verkenning internet of things
 
A taxonomy of personal data by origin
A taxonomy of personal data by origin A taxonomy of personal data by origin
A taxonomy of personal data by origin
 
Ontwerpmodel Internet Of Things Diensten
Ontwerpmodel  Internet Of Things  DienstenOntwerpmodel  Internet Of Things  Diensten
Ontwerpmodel Internet Of Things Diensten
 
Software packaged software principles publiek
Software packaged software principles publiekSoftware packaged software principles publiek
Software packaged software principles publiek
 
Kennismaking sfdc v1
Kennismaking sfdc v1Kennismaking sfdc v1
Kennismaking sfdc v1
 
Authenticatie
AuthenticatieAuthenticatie
Authenticatie
 
Cloud computing overzicht
Cloud computing overzichtCloud computing overzicht
Cloud computing overzicht
 
Establishing Soa And Soa Governance Hsa
Establishing Soa And Soa Governance HsaEstablishing Soa And Soa Governance Hsa
Establishing Soa And Soa Governance Hsa
 
Cloud Computing
Cloud ComputingCloud Computing
Cloud Computing
 
The evolution of Business Intelligence
The evolution of Business IntelligenceThe evolution of Business Intelligence
The evolution of Business Intelligence
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
SSME Introduction
SSME IntroductionSSME Introduction
SSME Introduction
 

Semantische interoperabiliteit met behulp van een bedrijfsbrede taxonomie

  • 1. www.via-nova-architectura.org February 2007 1 Semantische interoperabiliteit met behulp van een bedrijfsbrede taxonomie Wat kunnen we leren van IBM’s IFW Business Data Concepts Classification? Richard Claassens Steeds meer worden geautomatiseerde systemen aan elkaar gekoppeld die onafhankelijk van elkaar ontwikkeld zijn. Hierbij kunnen gemakkelijk semantische conflicten ontstaan. In veel publicaties wordt een taxonomie, als oplossing aangedragen. Een bedrijfsbrede taxonomie waarmee veel ervaring is, is het Business Data Concepts Classification model van IBM’s Information FrameWork. Dit model kent een invulling voor bankbedrijven en is al meer dan 10 jaar op de markt. De aanpak en structuur om concepten, relaties tussen concepten en termen te specificeren is geschikt om allerlei vormen van semantische conflicten te voorkomen. 1. Inleiding De groei van het internet, de internationalisering van de handel en de opkomst van “information economics” resulteert in een vernieuwde zienswijze op de rol van informatiesystemen in de bedrijfsvoering en het management ervan. Internet technologie levert het fundament voor nieuwe bedrijfsmodellen, nieuwe bedrijfsprocessen en nieuwe manieren van voor de distributie van kennis [Laudon, 2004]. Voordat deze nieuwe zienswijze gemeengoed was, werden de meeste toepassingen volgens “tight coupled” principes ontwikkeld. Daarbij zijn slechts één of enkele database(s) betrokken en draait de gehele toepassing op één of een beperkt aantal platform(s)/machine(s). Bij een dergelijke aanpak is een groep van analisten en ontwikkelaars redelijk in staat om zonder strikte en volledig expliciete semantische beschrijvingen een semantisch consistente toepassing te realiseren. Vrij vertaald schetst L. Orbst [2004] in zijn presentatie: ‘Ontologies and the Semantic Web: An Overview’, een meer actueel beeld: “Geautomatiseerde systemen worden steeds meer samengesteld uit delen gedistribueerde functionaliteit die onafhankelijk van elkaar ontwikkeld zijn, die zich op verschillende platforms bevinden en die zich in principe overal kunnen bevinden. Met deze toenemende complexiteit van systemen en IT-behoeften en een grotere afstand tussen de systemen, is het noodzakelijk om oplossingen te adopteren die beter aansluiten op het niveau waarop menselijke interactie plaatsvindt. Het is van belang om gebruik te gaan maken van semantiek en deze expliciet te gaan beschrijven. Tevens is het noodzakelijk om aansluiting te verkrijgen van het niveau van gegevens en
  • 2. www.via-nova-architectura.org February 2007 2 informatie, ofwel het semantische niveau waarop menselijke individuen met elkaar communiceren. Semantische beschrijvingen en semantische interoperabiliteit/integratie worden in toenemende mate belangrijk.” In het vervolg van dit paper zullen de problemen die door Orbst worden geschetst meer in detail worden toegelicht (Hoofdstuk 2), inclusief de oplossingsrichting(en) waar hij naar verwijst (hoofdstuk 3 en 4). Hierbij zal de nadruk komen te liggen op semantische interoperabiliteit/integratie binnen het bedrijf. Vervolgens wordt in hoofdstuk 5 een oplossing beschreven die gebruik maakt van een taxonomievorm die uit de bibliotheekwetenschap afkomstig is. Vervolgens wordt IBM’s Business Data Concepts Classification gepositioneerd, beschreven (hoofdstuk 6 en 7) en geëvalueerd (hoofdstuk 8). Na een korte verhandeling over investeringen in bedrijfsbrede taxonomieën (hoofdstuk 9) wordt met conclusies afgerond (hoofdsstuk 10). 2. Communicatieproblemen Aan de hand van de “meaning triangel” van Ogden en Richards [1923], zullen een aantal type van communicatieproblemen worden beschreven en mogelijke oplossingen. 2.1. Communicatie tussen mensen Wanneer we het niveau beschouwen waarop mensen direct of indirect met elkaar communiceren (Human to Human = H2H) dan treden daar veelvuldig problemen op die onder andere worden veroorzaakt door semantische onduidelijkheden. Dave McComb [2004 :16], illustreert dit met het volgende tekstfragment: “Er zijn 880.000 juristen in de Verenigde Staten die een industrie vertegenwoordigen met een omzet van $100 miljard. Een van de meest lucratieve bezigheden is het opstellen en interpreteren van contracten en het procederen in geval er geschillen in relatie tot de contracten ontstaan.” Dit betekent dat het vanuit een financieel oogpunt de moeite waard is, om de kans op het optreden van semantische verschillen te verminderen. Een van de belangrijke oorzaken van conflicten in de menselijke communicatie wordt veroorzaakt doordat dezelfde gecommuniceerde symbolen kunnen leiden tot verschillende concepten, bij personen die de gecommuniceerde gegevens ontvangen en interpreteren. Dit is te illustreren met behulp van de “meaning triangle” van Odgen en Richards [1923]. In figuur 1 is te zien dat als gevolg van de ambiguïteit van woorden, bijvoorbeeld term “jaguar”, dezelfde term kan leiden tot verschillende interpretaties en daarmee tot verschillende abstracte beelden (concepten). Het verhaal wordt nog moeilijker wanneer we te maken krijgen met concepten, die niet direct in de werkelijke wereld zijn waar te nemen. Stands for Refers toSymbolize Concept(s) (in mind) –or •thougt •idea •intension “Jaguar” 1) The Meaning Triangle 2) Example of the ambiguity of symbols Symbol(s) –or •term •label •code Referent(s) -or •thing •object •extension (Based on Ogden & Richards, 1923) Figuur 1 Een voorbeeld van semantische misinterpretatie
  • 3. www.via-nova-architectura.org February 2007 3 Het is niet realistisch om te veronderstellen dat er één eenvoudige oplossing voor dergelijke problemen te bedenken is. Het is wel zinvol om oplossingen te zoeken die bovengenoemde problemen minimaliseren, voor die situaties waarvoor dit zinvol is. Aangezien dat er bij steeds meer communicatie, geautomatiseerde systemen betrokken zijn, moeten deze in de oplossing worden meegenomen. 2.2. Het ontwikkelen van geautomatiseerde systemen De grote uitdaging van het ontwikkelen van geautomatiseerde systemen is het omzetten van de kennis en wensen uit een expertisedomein naar de syntax die door het geautomatiseerde systeem kan worden geïnterpreteerd. De uitdaging is nog groter wanneer een geautomatiseerd systeem gerealiseerd moet worden dat een oplossing moet bieden voor meer expertisedomeinen en individuen met hun eigen kennis en ervaring. Er zou in dit verband gesproken kunnen worden van H2H-communcatie met het doel om een geautomatiseerd systeem te ontwerpen en te realiseren. John Zachman [1987] onderkent binnen zijn Information System Architecture (ISA) vijf ontwerpniveaus: “Scoop, Bedrijfsmodel, Systeemmodel, Technologiemodel, Component”, om van een bedrijfsmodel tot een geautomatiseerd systeem te komen. Daarnaast bevat het ISA- raamwerk zes perspectieven: “Wat, Hoe, Waar, Wie, Wanneer en Waarom”, die bij de specificatie van een te bouwen geautomatiseerd systeem meegenomen zou moeten worden. Bij de bovenste drie ontwerpniveaus zijn systeemanalisten betrokken, die werken op de grens van het geautomatiseerde systeem en de buitenwereld [Sowa, 2000: 188]. Dit betekent dat zij moeten afstemmen met de expertise- en gebruikersdomeinen waarin het geautomatiseerde systeem moet gaan opereren. Een van de verantwoordelijkheden van de systeemanalisten is dat de semantische conflicten met de buitenwereld zo veel mogelijk worden uitgesloten. Een van de hulpmiddelen die vaak hierbij gebruikt wordt is een bedrijfsbreed gegevensmodel, gebaseerd op een ER-diagram. In het ISA-raamwerk vormt dit model de uitwerking van het Wat-perspectief op het ontwerpniveau van het bedrijfsmodel. Uit de volgende publicatie blijkt dat een dergelijke aanpak niet altijd tot de gewenste resultaten leidt. Darke & Shanks [1999: 20] hebben op basis van een onderzoek de volgende conclusie getrokken: Een groot probleem met bedrijfsbrede gegevensmodellen is dat ze moeilijk te begrijpen zijn. Hun abstractie ofwel generieke concepten komen onvertrouwd over voor zowel de gebruikers als de IS-professionals, en staan vaak ver weg van hun lokale organisatorische context. Empirische studies geven de indicatie dat veel organisaties zijn geconfronteerd met significante problemen bij ontwikkelen en het gebruik van een bedrijfsbreed datamodel. De ontwerpniveaus Technologiemodel en Component hebben betrekking op de techniek. De specificaties uit hogere niveaus moet door ontwikkelaars worden vertaald naar een computerprogramma waarbij semantische afspraken worden meegenomen. Er bestaat niet zo iets als een vaag computerprogramma [Sowa, 2000]. Een programma functioneert altijd zeer precies (een formeel model), maar desondanks is het mogelijk dat het geen enkele relatie heeft met datgene waarvoor het ooit bedoeld is. De beslissingen en beschrijvingen op de hogere niveaus vormen de basis voor dat het programma zich semantisch correct gedraagt en dat gebruikers de semantiek correct kunnen interpreteren. 2.3. Het gebruik van geautomatiseerde systemen door mensen Wanneer het geplande geautomatiseerde systeem operationeel is, zullen de gebruikers van het systeem met semantisch juiste gegevens moet vullen (Human to Application = H2A) en/of door het systeem verstrekte gegevens op een juiste wijze gaan interpreteren (Aplication to human = A2H). De meeste traditionele applicaties zijn een combinatie van H2A en A2H, een zogenaamde H2A2H-apllicatie waarbij het verstrekken van gegevens en de invoer van gegevens wordt gecombineerd [McComb, 2004: 27]. Geautomatiseerde systemen zijn niet of nauwelijks in staat om gegevens semantisch te interpreteren en te valideren. Dit betekent dat de verantwoordelijkheid hiervoor bij mensen ligt. Om semantische interpretatie en validatie te kunnen uitvoeren, moeten de gebruikers wel
  • 4. www.via-nova-architectura.org February 2007 4 over de noodzakelijke informatie, kennis en ervaring beschikken. Om de gebruiker op de hoogte te brengen van de betekenis van de gegevens is een termenlijst ofwel thesaurus een veel gebruikt middel. Een dergelijke lijst werkt vaak goed in een omgeving waarbij de gegevens exclusief tot een expertisedomein zijn toe te wijzen. Gegevens die afkomstig zijn, of betrekking hebben op verschillende expertisedomeinen, kunnen niet met een eenvoudig gestructureerde termenlijst inzichtelijk worden gemaakt. 2.4. Het koppelen van geautomatiseerde systemen Geautomatiseerde systemen worden steeds meer samengesteld uit delen gedistribueerde functionaliteit die: • vaak onafhankelijk van elkaar ontwikkeld zijn; • zich op verschillende platforms bevinden; • zich in principe overal kunnen bevinden [Orbst, 2004]. In situaties waarbij gegevens uit verschillende expertisedomeinen en van verschillende applicaties worden gecombineerd en met elkaar in verband worden gebracht, is een expliciete beschrijving van de gegevens noodzakelijk. Niet alleen een expliciete beschrijving, maar een beschrijving van onderlinge afhankelijkheden tussen de gegevens en de afhankelijkheid met de omgeving wordt dan steeds meer een noodzaak. Die situatie kan al vrij snel optreden wanneer verschillende geautomatiseerde systemen met elkaar gekoppeld worden (Application to Application =A2A). In figuur 2 is weergegeven welke type modellen en welke vormen van communicatie op elkaar afgestemd dienen te worden. De formele modellen in deze figuur zijn een onderdeel van de geautomatiseerde systemen en zijn een resultaat van systeemontwikkeling. Een systeemontwikkeling alleen al is een complex proces waarbij veel communicatie bij nodig is en waarbij de nodige semantische conflicten kunnen optreden. Met de term agent wordt een autonoom “handelend iets” bedoeld en dat “iets” is tevens in staat is met andere agents te communiceren. Die agents kunnen zowel mensen als machines zijn. • ... Human Agent 1 (HA1) Human Agent 2 (HA2) exchange signs, e.g. nat. language ‘‘JAGUAR“ Internal models Formal models exchange signs, e.g. protocols MA1 HA1 HA2 MA2 a specific domain, e.g. animals Machine Agent 1 (MA1) Machine Agent 2 (MA2) (H2H) (H2A),(H2A2H),(A2H) (A2A) = flow of communication and also the flow of semantics(H2H) (H2A),(H2A2H),(A2H) (A2A) Human to human Human to application Application to human Application to application Stands for Refers toSymbolize Symbol Referent Concept Things in the real world Concepts / Semantic structures Symbols / Syntactic structures The Meaning Triangle & (Based on Maedche, 2002) Figuur 2 Verschillende vormen van modellen en de verschillende vormen van communicatie
  • 5. www.via-nova-architectura.org February 2007 5 3. Mogelijke oplossingsrichting Voor de geschetste problemen wordt in een overweldigend aantal publicaties de volgende oplossing aangedragen: Het gebruik van een ontologie. In de volgende opsomming wordt een globaal overzicht van de toepassingsmogelijkheden van een ontologie weergegeven [Ushold,1996]: • communicatie – tussen mensen en organisaties; • interoperabiliteit – tussen systemen; • software engineering – specificaties, kwaliteit, herbruikbare componenten en kennisacquisitie. De ontologie wordt gebruikt om de ontology commitment te beschrijven, wat Gruber [1993] omschrijft als de overeenstemming over objecten en relaties waarover gecommuniceerd wordt. Verder is er een overeenkomst om een gezamenlijk vocabulair op een coherente en consistente wijze te hanteren. In figuur 3 zijn de concepten ontology en ontology commitment gepositioneerd, in relatie tot de omgeving. • ... Human Agent 1 (HA1) Human Agent 2 (HA2) exchange signs, e.g. nat. language ‘‘JAGUAR“ Internal models Formal models exchange signs, e.g. protocols HA1 MA2 a specific domain, e.g. animals Machine Agent 1 (MA1) Machine Agent 2 (MA2) Ontology Description Ontology Formal Semantics =The ontological commitment refers to agreements on the use of the shared vocabulary by the agents committed to the ontology Stands for Refers toSymbolize Symbol Referent Concept Things in the real world Concepts / Semantic structures Symbols / Syntactic structures The Meaning Triangle commit MA1 commit commit commit HA2 commit (Based on Maedche, 2002) Figuur 3 Een ontologie: Een oplossing om verschillende vormen van modellen en de verschillende vormen van communicatie aan elkaar te kunnen relateren Uitgaande van de drie voorgaande Figuurn zou een ontologie opgevat kunnen worden als een gezamenlijke, eenduidige en consistente “meaning triangle” die, door met elkaar communicerende agents wordt gehanteerd. In de volgende paragraaf worden een aantal gepubliceerde inzichten op het begrip ontologie behandeld. 4. Wat is een ontologie? De klassieke vorm, de wetenschap van ontologie, is een discipline van de filosofie die zich bezig houdt met de aard en de organisatie van de realiteit. Vanuit een andere invalshoek wordt het nu gebruikt om de wereld te beschrijven, met het doel om ondersteuning te bieden aan de ontwikkeling van informatiesystemen. In die context worden vaak de volgende definities gehanteerd: • an explicit specification of a conceptualization [Gruber, 1993: 199]
  • 6. www.via-nova-architectura.org February 2007 6 • a shared understanding of some domain of interest [Uschold, 1996] In veel publicaties worden naar deze (vage) definities verwezen maar er is ook de nodige kritiek op. Chris Welty [2000], een onderzoeker die zich met ontology-driven conceptual modeling bezig houdt, hanteert de volgende definitie: De beschrijving van de soorten van aanwezige entiteiten en de wijze waarop ze met elkaar gerelateerd zijn Hij geeft tevens aan dat een ontologie de volgende aspecten moet bevatten: betekenis, organisatie, taxonomie, overeenstemming, vocabulair, relatie met de reële wereld. Er zijn veel afwijkende inzichten over de vorm waarin een ontologie moet worden beschreven. Gruber [1995] geeft aan dat een ontologie elke vorm kan krijgen om algemene en complexe structuren te beschrijven (language independant). B. Smith [2000], een onderzoeker die zich bezig houdt met formele ontologie, onder andere voor informatiesystemen, geeft een aantal aanwijzigen voor het ontwikkelen van een bruikbare ontologie: Een ontologie moet niet bestaan uit een enkele boomstructuur maar uit een familie van boomstructuren, die elk een weerspiegeling zijn van specifieke zienswijzen (facetten of elementen) van het doeldomein. Naast de verschillende zienswijzen moeten verschillende gegranuleerdheden (of levels) worden ondersteund, bijvoorbeeld: microscopisch, mesoscopisch, macroscopisch. B. Madsen [2002] heeft een schematisch overzicht (figuur 4) gemaakt met een aantal aspecten van een ontologie, inclusief de verschillende opties, waar ontologie in de doelstelling en de wijze van uitwerking van elkaar kunnen verschillen. Een aspect dat centraal staat in veel discussies, is hoe formeel een ontologie dient te zijn en op welk moment er niet meer van een ontologie gesproken mag worden. Vaak wordt een lichtgewicht ontologie aangeduid als taxonomie. In deze categorie zijn begrippen als: catalogus, glossarium, thesaurus en directory te plaatsen. philoso- phical ontology pragmatic ontology top level ontology universal ontology domain specific ontology general ontology task specific ontology task inde- pendant ontology language inde- pendant ontology language inde- pendant ontology formal ontology not formal onto- logy VIEW specific ontology LEVEL SUBJECT PURPOSE LANGUAGE FORMALIZING application specific ontology Guarino, Nicola (1998). Formal Ontology and Information Systems,. In: Formal Ontology in Information Systems, Proceedings of the First International Conference (FOIS'98), June 6-8, Trento, Italy, 3-15. Ed. Nicola Guarino. Amsterdam: IOS Press. Bodil Nistrup Madsen (2002), based on a.o.: ontology Figuur 4 Aspecten van een ontologie en mogelijke opties binnen die aspecten Reimer [2001] definieert een taxonomie als een gecontroleerd vocabulair die is geordend in een concept hiërarchie. Een ontologie definieert hij als een taxonomie waar de betekenis van elk concept gedefinieerd is door de specificatie van de eigenschappen, relaties naar andere concepten en axioma’s die zorgen voor een inperking van de interpretatie.
  • 7. www.via-nova-architectura.org February 2007 7 Waarin verschilt een ontologie nu van een gegevensmodel? S. Toivonen [2003] geeft aan dat er geen strikte scheidslijn tussen deze twee type modellen te trekken is maar dat een ontologie: • meer algemeen en meer herbruikbaar is; • toepasbaar is voor meer doelstellingen en gebruikersgroepen; • eenvoudiger gemeenschappelijk te delen is; • meer gericht zijn op de semantiek van concepten (in tegenstelling tot een zuivere structuur en integriteit). Uit de voorafgaande verhandeling is te concluderen dat er veel voordelen worden toebedeeld aan het gebruik van een ontologie maar dat er veel manieren zijn waarop een ontologie kan worden gecreëerd en vormgegeven. Om de veronderstelde voordelen daadwerkelijk te kunnen behalen moeten behoorlijk wat afwegingen en keuzes worden gemaakt. Aangezien het ontwikkelen en het onderhouden van ontologie voor informatiesystemen nog een relatief nieuwe discipline is, zijn er nog maar weinig goede voorbeelden te vinden, die als leidraad kunnen dienen. 5. Het ontwikkelen en onderhouden van een ontologie/taxonomie In een speciale uitgave van de ACM over ontology engineering, geven Gruninger & Lee [2002] aan dat het creëren van ontologieën een moeilijke, tijdrovende kostbare aangelegenheid is. Vooral wanneer het ontwerp formeel genoeg moet zijn om geautomatiseerd redeneren te ondersteunen. Deze laatste genoemde mogelijkheid zal binnen de meeste ondernemingen op dit moment geen hoge prioriteit hebben. Het is daarom de moeite waard om naar oplossingen te zoeken die wat minder formeel en wat meer pragmatisch zijn. In tegenstelling tot de informatie technologie beschikt de bibliotheekwetenschap wel over een uitgebreide ervaring op het gebied van een ontwikkelen en onderhouden van taxonomieën. Hier worden twee type classificatieschema’s toegepast: enumerative en faceted. De enumerative-aanpak verlangt een kennisdomein dat successievelijke verdeeld wordt in engere klassen die alle mogelijk subklassen bevatten, inclusief samengestelde klassen. De faceted aanpak, die door Ranganathan [1967] in 1939 is voorgesteld, baseert zich niet op een uitsplitsing van het universum van kennis, maar is gebaseerd op het opsplitsen van complexe subjecten in beperkt subjectdomein, in groepen van simpele concepttermen, die ook wel facets worden genoemd [Prieto-Díaz, 2002]. In de tweede fase worden deze facets gesynthetiseerd in een gecontroleerd vocabulair inclusief beschrijvingen van samengestelde subjecten. In de bibliotheekwereld is het gebruikelijk om daarnaast nog een coderingsschema te ontwikkelen voor de onderdelen binnen de classificatieboom. R. Prieto-Díaz [2002] beschrijft in het artikel: ‘a facetted Approach to building Ontologies’, een aanpak die gebaseerd is op facetted classifications. Eerst wordt top-down, met behulp van aanwezige expertise, een initiële classificatiehiërarchie opgesteld. Vervolgens worden gerelateerde termen in informatieobjecten in categorieën gegroepeerd (bottom-up). Als laatste wordt de initiële classificatiehiërarchie via een iteratief proces met de gecreëerde clusters vergeleken, en als resultaat kunnen mogelijke aanpassingen op de hiërarchie worden doorgevoerd. In de figuur 5 wordt dit proces schematische afgebeeld.
  • 8. www.via-nova-architectura.org February 2007 8 Postulated Ontology Synthesized Clusters Ontology is modified based on how it maps to discovered clusters x s t u v w D F E B C A Clusters are mapped to ontology 2) Bottom-up 3) Revising & validating 1) Top-down R. Prieto-Díaz (2002) Figuur 5 De hoofdstappen binnen het faceted domein analyseproces R. Prieto-Diaz [2002] schrijft dat het grootste voordeel van de aanpak is, dat het praktisch en bruikbaar is. De aanpak resulteert in ontologieën die geen formele definities van concepten en axioma’s bevatten maar wel een gestructureerde gecontroleerd vocabulair dat op informele wijze concepten definieert. Het resultaat biedt wel voldoende informatie om de specificatie van een formele ontologie en bijbehorende formele documentatie te ondersteunen. Zijn eigen ervaringen zijn zeer positief en deze zijn opgedaan in het beschrijven van domeinmodellen voor command&control-systemen en systemen voor bank- en verzekeringsinstellingen. Er zijn geen aanwijzingen dat deze specifieke aanpak verder breed in de praktijk wordt toegepast. Dit is wel het geval met een oplossing die sterke overeenkomsten met deze aanpak kent: het IBM Business Data Concepts Classification model. 6. IBM Information FrameWork (IFW) Het Business Concepts Classification model is een onderdeel van het IBM Information Framework (IFW). Dit informatie raamwerk is afgeleid van het Information Systems Framework (ISA) dat door J.A. Zachman [1987] in IBM Systems Journal 26, beschreven is. In een tweede artikel over ISA: extending and formalizing the framework for Information Systems Architecture [Sowa, 1992], wordt het raamwerk meer formeel beschreven en heeft een uitbreiding van het aantal kolommen plaatsgevonden. Omdat de bedenkers van IFW al tegen onduidelijkheden en tekortkomingen van ISA waren opgelopen, hebben zij besloten om hier zelf praktische oplossingen voor te bedenken. In tegenstelling tot ISA wat een leeg raamwerk is, bestaat voor IFW een volledig uitgewerkte taxonomie voor een Bankbedrijf, inclusief daarvan afgeleide modellen en toepassingen. IFW is ontwikkeld door IBM’s Banking Solution Centre in Dublin in samenwerking met, en met input en feedback van een aantal vooraanstaande financiële instellingen in de wereld [Evernden, 1996]. Het project is in 1991 gestart en is verder gegaan met resultaten van twee eerdere projecten op dit vlak: Financial Application Architectuur(FAA) en Financial Application Solutions (FAS90). The Financial Services Function Model (FSFM) heeft in 1993 haar eerste release gekend en is in 1994 opgevolgd door het Financial Services Workflow Model (FSWM). Inmiddels zijn deze modellen met diverse producten aangevuld, zoals een Object Model voor object georiënteerde omgevingen (FSOM), een Banking Data Warehouse oplossing (BDW), een oplossing voor het snel implementeren van datamarts (EZMart solution), en recentelijk is het object model uitgebreid met een interface design model. Deze laatste uitbreiding ondersteunt
  • 9. www.via-nova-architectura.org February 2007 9 oplossingen waarbij interfaces en hergebruik van (bestaande) componenten als uitgangpunten worden gehanteerd. Volgens de commerciële informatie op de website van IBM hebben 170 banken en verzekeringsmaatschappijen van een van de producten gebruik gemaakt en aan de verdere ontwikkeling ervan bijgedragen. Evernden [1996] heeft een uitgebreide beschrijving over de verschillen tussen de twee raamwerken. Wat de karakterisering betreft geeft hij de volgende verschillen aan: Daar waar ISA zich richt op een Informatie systeem Architectuur, richt IFW zich meer op het managen van de informatie. ISA biedt een systematische taxonomie van concepten voor gerelateerde zaken in de wereld van representaties voor de computer. IFW richt zich meer op het beschrijven van situatie waar informatie wordt gecreëerd en gebruikt. ISA heeft een raamwerk van zes kolommen, vijf rijen en dertig cellen. Bij IFW wordt een meer gedetailleerde opdeling gehanteerd waarbij uiteindelijk vijftig cellen ontstaan: Horizontale groepering: Types of information (Inclusief de verdere opdeling): • Organization – Strategy (1), Structure (2), Skills (3) • Business – Data (4), Function (5), Workflow (6), Solution (7) • Technical – Interface (8), Network (9), Platform (10) Verticale groepering: Levels of constraints, (Inclusief de verdere opdeling): • Deconstruction - Domain Concept (A-level), Domain Classification (B-level) • Composition – Generic Template (C-level), Design Context (C’-level) • Implementation -Operational Bound (D-level) Voor de overzichtelijkheid is het raamwerk in figuur 6 schematisch afgebeeld. III) Technical ViewII) Business View The Information Framework I) Organisation View Structure SkillsStrategy Data Functions Workflow Solutions Interface Networks Platforms Domain Concept (A-level) Domain Classification (B-level) Generic Template (C-level) Design Context (C’-level) Operational Bound (D-level) Deconstruction level Composition level Implementation level Types of infomation Levels of constraint -Three views -Three levels -Ten columns -Five rows -Fifty cells -Six dimensions (See next page) Modelware International (1999) Figuur 6 Het IFW-raamwerk De opdeling van de kolommen, samen met de basisstructuur, is ontworpen om hergebruik van informatie in elk van de andere cellen mogelijk te maken. In IFW is “informatie” een samenstelling van informatiecomponenten om de kennis en ervaring over een gegeven domein te kunnen omvatten, zoal bijvoorbeeld de financiële industrie. Deze componenten kunnen elementair of geaggregeerd zijn. Kenmerkend is dat “informatie” wordt opgevat als een
  • 10. www.via-nova-architectura.org February 2007 10 complexe groepering van componenten die vanuit verschillende gezichtspunten kunnen worden beschouwd. Een van deze gezichtpunten is het “data”-perspectief. “Data” is een van de basisbouwblokken om informatie te kunnen creëren. Informatie is opgeslagen als een combinatie van stukjes data. IFW wordt gebruikt om een deel van informatie te analyseren, de informatie op te breken in constitueerde componenten en vervolgens de componenten in de aangewezen cel van het raamwerk te plaatsen. Het opbreken van informatie in componenten bewerkstelligt dat ieder informatie component slechts een maal beschreven hoeft te worden. Zoals bij elke dossiersysteem is het belangrijk dat het plaatsen van informatiecomponenten in cellen, volgens bepaalde regels of richtlijnen gebeurt. IFW maakt gebruik van een faceted classification systeem waarbij elke samenstelling van informatie wordt gevormd uit onderdelen die uit de verschillende perspectieven of aspecten geselecteerd worden. 7. IFW Business Data Concepts Classification Voor de beschrijving van IFW Business Data Concepts Classification zal het white paper: Business Classification Model, van Modelware International [1999], worden samengevat. Dit bedrijf was de leverancier van het geautomatiseerde hulpmiddel voor de ondersteuning van IFW. In veel systeemontwerpmethoden is het gebruikelijk om onderscheid te maken in de volgende beschouwingniveaus: • Conceptueel – hier worden de concepten in het te beschouwen domein beschreven (Business); • Logisch – dit is een implementatieonafhankelijk ontwerp; • Fysiek – dit is een implementatieafhankelijk ontwerp. Vaak worden voor al de drie beschouwingniveaus nagenoeg vergelijkbare diagrammen gebruikt die bekend staan onder de namen: object relatie (OR) model en entiteit relatie (ER) model. De bedenkers van IFW zijn van mening dat deze modellen niet geschikt zijn om domeinbrede beschrijving te maken waarbij alle apecten vanuit verschillende gezichtpunten een plaats in het model krijgen. Bij de ER/OR-modellen bestaat het gevaar dat een gezichtpunt de overhand krijgt en dat vanuit dit gezichtpunt data-elementen worden gegroepeerd. Bij het tot stand komen van deze modellen wordt vaak bewust of onbewust rekening gehouden met de datastructuren waar de data-elementen hun plek gaan krijgen. Het gevolg is dat een deel van de gebruikers hun eigen view op het domein niet meer terug zien. Om het genoemde nadeel te voorkomen is binnen IFW voor de uitwerking van conceptueel niveau gekozen voor een classificatie model ofwel een taxonomie. Op het hoogste niveau, het A-level, worden negen data domeinconcepten beschreven: • Betrokken partij - involved party (IP); • Overeenkomst – arrangement (AR); • Conditie – condition (CN); • Product/services – product/service (PD); • Locatie – location (LC); • Classificatie – classification (CL); • Business richtinggevende waarden - Business Direction Items (BD); • Gebeurtenis – event (EV); • Hulpbron – resource (RC). Het concept classification is een uitzondering en wordt gebruikt voor die (deel)taxonomieën waarvan uit meer dan één concept kan worden gerelateerd. Voorbeelden van concepten
  • 11. www.via-nova-architectura.org February 2007 11 waarvoor dit geldt zijn: meeteenheden, talen, rating modellen en structureren voor financiële verslaglegging. Deze A-level concepten vormen de basis voor een onderliggende verzameling deeltaxonomieën, die samen het B-level vormen. Vanuit het B-level worden logische ER- schema’s samengesteld (het C- en C’-niveau), die vervolgens worden vertaald in een database schema (het D-niveau). Deze opdeling is in figuur 7 afgebeeld. IFW Framework -3 Layers of the data column Deconstruction level Composition level Implementation level Conceptual Logical Physical Involved Party (IP) Arrangement (AR) Conditions (CN) Product (PD) Location (LO) Classification (CL) Business Direction Item (BD) Event (EV) Resource Item (RI) A-level B-level C-level & C’-level D-level 9 data concepts 27 classification hierarchies 54 business objects Based on: Modelware International (1999) Figuur 7 Onderdelen van het data concepts classification model en de afhankelijkheid met de overige gegevensgeoriënteerde modellen Vanuit elk A-level data concept worden drie hiërarchieën opgebouwd, die samen het B-level vormen. Ten eerste een fundamentele hiërarchie die de fundamentele concepten meer in detail uitwerkt en bevat subtypes van het A-level concept en de status waarin een concept zich kan bevinden. Ten tweede een associatieve hiërarchie waarin relaties tussen onderlinge concepten worden beschreven. Dit kunnen relaties zijn tussen concepten die zich willekeurig binnen de taxonomie bevinden. Dergelijke relaties worden uitgedrukt op domein conceptniveau. Voorbeeld daarvan is: ‘IP is spouse of IP’. De relatie kan worden voorzien van beperkingen en bij het beschrijven daarvan kunnen concepten uit de verschillende hiërarchieën worden toegepast. Zo kan bijvoorbeeld worden vastgelegd dat één IP in de ‘IP is spouse of IP’-relatie het geslacht vrouw is terwijl de tweede IP van het mannelijk is. Ten derde: Een descriptor hiërarchie beschrijft op welke wijze concepten in de werkelijkheid worden geïdentificeerd. Vaak gebeurt dit op basis van een verzameling van kenmerken, bijvoorbeeld: naam, adres, geboortedatum. Elk beschreven dataconcept kan worden vervolgd met één of meer labels die elk een vraag impliceren. Het antwoord erop bestaat uit een opsomming van één of meer concepten. Een combinatie van een vraaglabel en de antwoorden wordt een schema genoemd. De schema’s ontstaan door verschillende gezichtpunten die op de business bestaan. De aanpak biedt de mogelijkheid om de gezichtpunten die diverse bedrijfsdomeinen op het bedrijf hebben, op een ordelijke wijze onder te brengen. In figuur 8 is het resultaat van een dergelijke ordening afgebeeld.
  • 12. www.via-nova-architectura.org February 2007 12 Involved Party(IP) INVOLVED PARTY TYPE Individual INDIVIDUAL GENDER Female Male Organization ORGANIZATION LEGAL STRUCTURE TYPE Corporation Partnership IP Descriptor IP DESCRIPTOR TYPE IPName component IP NAME COMPONENT TYPE Given Name Name Initial Family name IP Relationship IP RELATIONSHIP TYPE IP/IP-relationship IP/IP RELATIONSHIP TYPE IP is spouse of IP IP is employee of IP IP is customer of IP INDIVIDUAL EMPLOYMENT STATUS Working Individual Not Employed Individual 1. Fundamental hierarchy 2. Descriptive hierarchy 3. Relationship hierarchy Answer(s)Question= +scheme Explanation of the B-level -Concept Involved party (IP) Based on: Modelware International (1999) Figuur 8 De opsplitsing van een concept op het A-level, in drie hiërarchieën 8. Evaluatie van IFW Business Data Concepts Classification Veel informatie met betrekking tot IFW en het Financial Services Data Model is proprierty. Desondanks is er toch de nodige vrij verkrijgbare informatie beschikbaar. Zelf ben ik aanwezig geweest bij een tweedaagse sessie, waarbij IFW-specialisten uitleg hebben gegeven over het model en de inhoud. Specialisten uit diverse afdelingen van een bank waren aanwezig, om het model te beoordelen voor gebruik in een data warehouse project. De informatie architecten van de bank hadden in het verleden al de ambitie opgegeven om tot een geïntegreerd gegevensmodel over de afdelingen heen te komen. Tijdens die sessie bleek dat de beelden die de specialisten over de gegevens in bank hadden, nauwelijks van elkaar afweken. Afdelingsspecifieke details bleken al vaak al in de hiërarchie aanwezig of konden vrij gemakkelijk aan het model worden toegevoegd. Na aanpassing in het model konden binnen een uur aangepaste prototypes van rapporten worden getoond, met daarin de nieuwe gegevenselementen verwerkt. In de communicatie tussen personen met verschillende expertise is het Business Data Concept model een bruikbaar hulpmiddel. Het biedt het een goede basis voor verschillende technische modellen die in automatiseringtrajecten worden toegepast. Het business data concept model in combinatie met daarvan afgeleide modellen worden al meer dan 10 jaar succesvol commercieel op de markt gebracht. Binnen het domein bankbedrijf lijkt IFW Business Data Concepts Classification de belofte te kunnen waarmaken die aan ontologieën worden toegekend. 9. Investeren in een organisatiebrede taxonomie Investeringen in taxonomieën zullen zelden of nooit op directe wijze tot kostenbesparingen omzetverbeteringen leiden. Het kan het beste worden gepositioneerd als een infrastructurele investering om bedrijfsbrede strategische doelen te ondersteunen. Dit is te illustreren aan de hand van het model (figuur 9) van Weill en Broadbent [1998] om investeringen in een IT investeringsportfolio te positioneren.
  • 13. www.via-nova-architectura.org February 2007 13 Management Objectives Infor- mational Strategic Transactional Infrastructure Increased control Better information Better integration Improved quality Business integration Flexibility & agility Reduced marginal cost of IT Reduced IT costs over time Standardization Increased sales Competitive advantage Competitive necessity Market positioning Innovative services Cut costs Increased , throughput Positionering van de investering in taxonomieën -Types of IT investments- Based on Weill, P. & Broadbent, M, 1998) Figuur 9 Een opdeling in type IT-investeringen, afgezet tegen mogelijke management doelstellingen De investering kan indirect een bijdrage leveren aan: • de snellere realisatie van business integratie oplossingen: • een hogere flexibiliteit en wendbaarheid van de geautomatiseerde systemen (Infrastructural); • een betere informatie en een verbeterde kwaliteit en integratie van informatie (Informational); • E-business initiatieven waarmee de strategische concurrentie positie van een bedrijf kan worden verbeterd (Strategic). De positieve bijdragen die een organisatiebrede taxonomie kunnen bieden is als volgt samen te vatten: • Het sneller en op een semantisch verantwoorde wijze kunnen koppelen van heterogene en geautomatiseerde systemen. • Minder fouten en conflicten als gevolg van minder onduidelijkheden over de semantiek van gegevens. Investeringen kunnen pas iets kunnen opleveren wanneer de taxonomieën actief in projecten en het dagelijkse werkzaamheden worden toegepast. 10. Conclusies In veel publicaties worden ontologieën en de lichtgewichte versie ervan, een taxonomie, als oplossing aangedragen voor een groot aantal communicatieproblemen waarbij geautomatiseerde systemen betrokken zijn. Veel minder informatie is beschikbaar over de wijze waarop een ontologie of taxonomie in de praktijk het beste ontwikkeld, onderhouden en toegepast kan worden. Voor bedrijfsbrede taxonomieën blijkt de facetted classification aanpak tot praktisch bruikbare resultaten te leiden. In het bijzonder de specifieke invulling die binnen IBM’s IFW wordt gehanteerd, heeft zich in de praktijk bewezen. Het biedt: • ondersteuning bij het oplossen van communicatieproblemen tussen verschillende expertisedomeinen;
  • 14. www.via-nova-architectura.org February 2007 14 • vorm en structuur waardoor redundantie in concepten en bijbehorende termen eenvoudig kan worden voorkomen; • uitbreidbaarheid zonder dat de hoofdstructuur van de taxonomie gewijzigd hoeft te worden; • een stabiel uitgangspunt voor meer formele modellen, die noodzakelijk zijn voor volledige geautomatiseerde communicatie en verwerking; • een mogelijke basis voor een kennisapplicatie waar gebruikers geïnformeerd worden over de betekenis van de termen en hun afhankelijkheden, die binnen een bedrijf worden gehanteerd. Indien een bedrijf besluit om met een ontologie te gaan aanschaffen en/of ontwikkelen, dan is het aan te bevelen om kennis te nemen en eventueel gebruik te maken best practices die binnen IBM’s IFW Business Data Concepts Classification zijn toegepast. Referenties [Darke, 1999] Darke P. & Shanks G., Understanding corporate data models, Information & Management, Volume 35, Issue 1, 4 January 1999. [Evernden, 1996] Evernden R., The Information Framework. IBM Systems Journal, Vol. 35, No. 1. 1996 [Gruber, 1993] Gruber, T., A Translation Approach to Portable Ontology Specifications. In Knowledge Acquisition, 5(2), 1993. [Gruber, 1993] Gruber, T., Towards Priciples for the Design of Ontologies Used for Knowledge Sharing. - In: N. Guarino, R. Poli (Eds.), Formal Ontology in Conceptual Analysis and Knowledge Representation. Boston: Kluwer Academic Publishers,1995. [Gruninger, 2002] Gruninger M. & Lee J., Ontology Applications and Design, Communications of the ACM, February 2002, Vol. 45, No.2. [IBM, 2002] IBM, IFW Object Models, General Information Manual, 2002. [IBM, 2002a] IBM, IFW Critical Business Process Models. General Information Manual, 2002. [IBM, 2002b] IBM, Implementing Message Based Integration Using the IFW / IAA Object Models, Release 1.0, First Edition, July 2002. [IBM, 2002c] IBM, Building Components with the IFW / IAA Object Models, Release 1.0, First Edition, July 2002. [IBM, 2004] IBM, Information FrameWork Object Models solution from IBM, http://www1.ibm.com/industries/financialservices/doc/content/soluti on/391981103.html, 2004. [Laudon, 2004] Laudon K. & Laudon P., Management Information Systems, Managing the digital firm, 8th Ed. New Jersey, Pearson Education, 2004. [Madsen, 2004] Madsen, B.,Terminological ontologies, Ph.d. course on representation formalisms for ontologies, Copenhagen, 30.10.-1.11.02 [Maedche, 2002] Maedche, A., Ontology Learning for the Semantic Web. Kluwer Academic Publishers, Boston, MA, 2002. Ing. R.H.W. Claassens MIM SNS Bank Richard.Claassens@SNS.NL
  • 15. www.via-nova-architectura.org February 2007 15 [McComb, 2003] McComb, D., Semantics in Business Systems -- The Savvy Manager's Guide, Morgan Kaufmann, 2003. [Modelware, 1999] Modelware International, White paper: The Business Classisfication Model, 1999. [Ogden, 1923] Ogden, C. K. & Richards, I. A., "The Meaning of Meaning." 8th Ed. New York, Harcourt, Brace & World, Inc, 1923. [Orbst, 2005] Orbst, L., Ontologies and the Semantic Web: An Overview, MITRE Information Semantics Center for Innovative Computing & Informatics, www.xml.saic.com/icml/ic_mwg/ Obrst-Semantic_Web- Intro11.ppt, 2005. [Prieto-Díaz, 2002] Prieto-Díaz R., A Faceted Approach to Building Ontologies, Commonwealth Information Security Center, James Madison University, 2002. [Ranganathan, 1967] Ranganathan, S.R., Prolegomena to Library Classification. Asian Publishing House, Bombay, India, 1967. [Reimer, 2001] Reimer, U., Tutorial on Organizational Memories for Capturing, Sharing and Utilizing Knowledge. International Conference on Enterprise Information Systems, ICEIS 2001, Setubal, Portugal, July 7-10, 2001. http://research.swisslife.ch/~reimer/OM_Tutorial/index.html [Smith, 2000] Smith B., Ontology: philosophical and computational, http://wings.buffalo.edu/philosophy/faculty/smith/articles/ontologies. html, 2000. [Sowa, 1992] Sowa, J.F. & J.A. Zachman, Extending and formalizing the framework for information systems architecture, IBM Systems Journal, Vol. 31, No. 3, 1992. [Sowa, 2000] Sowa, J. F. Knowledge Representation, Logical, Philosophical and Computational Foundations. Brooks Cole Publishing Co, 2000. [Toivonen, 2003] Toivonen, S., Ontologies, Course 582407: Software Agent Technology, VTT Information Technology 3.3, 2003. [Uschold, 1996] Uschold, M. & Gruninger, M., Ontologies: principles, methods, and applications, Knowledge Engineering Review, 11(2), 1996. [Weill, 1998] Weill, P. & Broadbent, M., Leveraging the new infrastructure. Harvard Business School Press, 1998. [Welty,2000] Welty, C., Ontology-Driven Conceptual Modeling, IBM Watson Research Center, 2000. http://ontolog.cim3.net/file/resource/presentation/OntoClean-- ChrisWelty_20041118/OntoClean-2004v1--ChrisWelty_20041118.ppt [Zachman, 1987] Zachman, J. A., A Framework for Information Systems Architecture, IBM Systems Journal 26, No. 3, 1987.