SlideShare una empresa de Scribd logo
1 de 40
Descargar para leer sin conexión
Tiedon määrä kasvaa rajusti – keinot hallita
Semanttinen teknologia avuksi
Sisällön- & dokumenttien hallinta '13
Heimo Hänninen
12.6.2013
Esittely
Talent Base
Luomme asiakkaillemme kilpailuetua suunnittelemalla parhailla
menetelmillä tarkoituksenmukaisia IT-ratkaisuja.
1 Strategia
2 Prosessit
3 Ratkaisusuunnittelu
Palvelualueemme
Yksittäisestä sovelluksesta kokonaisuuden hallintaan
Avaintiedon
hallinta
(MDM)
Sisällönhallinta (ECM)
Asiakkuudenhallinta (CRM)
Verkkokauppa
Sähköiset palvelut
Talent Base apuna semanttisen tiedonhallinnan
kehittämisessä
Perustan luominen (master data management)
• Datan profilointi, data standardit & tietomallit, business case, evaluoinnit, arkkitehtuurit,
projektointi…
Sisällönhallinta
• Metadatamallit, taksonomiat, verkkosisällön hallinta, strategian luonti
Semanttisen tiedonhallinnan käyttöönotto
• Hallitut ensiaskeleet (esim. asiakastiedon hallinta, dokumenttien luokittelu)
• 360 näkyvyyden luonti
• Ontology Systems kumppani (www.ontology.com)
Faktapohjainen tiedonhallinta
• Liiketoimintaontologian luonti
• liiketoimintasanastot
Best place is
cloud base…
Informaatio tsunami
Haaste
Tiedon määrä kasvaa
2011-02-09 9
Tiedon määrä kasvaa
2011-02-09 10
Informaation määrä
tuplautuu kahdessa
vuodessa!
Mitä minä kommunikoin?
Miten sinä ymmärrät?
Haaste
Semantiikan kolmio: puhumme
symboleilla, ajattelemme
konsepteilla, tarkoitamme aitoja asioita
2011-06-17 12
Asiakas?
• “symbol”
Nimi
• “concept”
Henkilökohtainen rajallinen käsitys
oliosta “ajatusolio päässäsi”
• “referent”
Todellinen olio
http://www.yso.fi/
onto/liito/p1332
Henkilö
Leasing firma
Yritysasiakas
Myyntipäällikkö
Company Customer
Client
Asiakas = joka maksaa
auton huoltolaskun
http://jhsmeta.fi/
sanasto/id/henkilö
/J15152
Asiakas = joka noutaa
auton
Huoltopäällikkö
Liike-elämän hengen velttous:
Huomenna huomataan, että tänään
ei tehty mitään päätöksiä uusista
kehityshankkeista
Haaste
Ei käsitellä tänään. Kirjoittajan huomio
näinä ankean talouden aikoina.
Esityksen agenda
1. Tiedonhallinnan ongelmat => liiketoiminnan
haasteet
2. Ontologia ja semanttinen tiedonhallinta
1. Mitä se on?
2. Miten se tehdään?
3. Yhteenveto
Tiedonhallinnan ongelmat
liiketoiminnan haasteet
Tiedonhallinnan haasteet
Epäyhtenäiset käsitteet ja kuvaukset
Tiedon määrä kasvaa (nopeammin kuin käsittelykyky)
Tiedon huono laatu
Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut)
Tieto ei ole rakenteista
Tieto on hajallaan, usein siiloissa
Rajoittunut tietoisuus relevantista tiedosta
Liiketoiminnan tempo vaatii tietoa nopeasti
Semanttinen
teknologia
auttaa
Liiketoiminnan ongelmia
Ihmiset
turhautuu
Huonoja
päätöksiä
Turhaa työtä /
huono
tuottavuus
Väärinkäsityksiä
Huonoa
palvelua
"Cognitive
treshold
exeeded"
Kun kompleksisuus ylittää ymmärryksen  ihminen hyppää faktoista
taikauskoon päätöksenteossa (Rebecca Costa)
Liiketoiminnan ongelmia
Ihmiset
turhautuu
Huonoja
päätöksiä
Turhaa työtä /
huono
tuottavuus
Väärinkäsityksiä
Huonoa
palvelua
"Cognitive
treshold
exeeded"
Semanttinen tiedonhallinta
Semanttinen teknologia - häh?
Kielitieteessä
• Fonologia = äänteet,
• Morfologia = lauseiden
muodostuminen
• Semantiikka = merkitykset
• Pragmatiikka = sanat kontekstissa
• esim. ironia, terminologia
politiikassa, piilomerkitykset
Filosofia
• Ontologia = filosofinen
tiede, tutkii olemisen kategorioita
Semanttinen teknologia
• Ontologia = konseptuaalinen
tietomalli
tietämysrakenteelle, kohde
spesifinen
• Semanttisuus = merkityksiä
hyödyntävä, (kieltä ja merkityksiä
rajatusti ymmärtävä)
Suunnattu graafi - peruspalikka
• RDF tripletti edustaa nimettyä suunnattua graafia.
• Siten se soveltuu paremmin tietynlaisen tietämyksen
mallintamiseen kuin relaatiomalli.
Heimo
Tämä kalvo
On luonut
Subject Predicate  Object
Ontologian luonti – Graafi konsepti
ASPEN, an industry-leading Advanced
Service Platform for Ethernet Networks
A-2200
Access
Aspen
A-2200
Service
platform
Access
is a type of product
contains a product
is a type of product
Ethernet
Networks
is applicable for
Mitä on ontologia?
Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä
@toimiala MDM…
@kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan
konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta
Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)
Logiikka: päättely, haut, navigointi ym.
Faktat,
informaatio
URL
Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä
@toimiala MDM…
@kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan
konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta
Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)
Logiikka: päättely, haut, navigointi ym.
Faktat,
informaatio
URL
Mitä on ontologia - tietokoneelle?
Mikä on ontologiapalvelu?
Talent Basen määritelmä:
Ontologiapalvelu on tiedonhallintakyvykkyys:
• Luoda konseptuaalinen malli tietovarantojen päälle:
– Käsin mallintaen tai
– Automaattisesti (varmistettava luotettavuustaso)
• Palvella tietointensiivisiä sovelluksia:
- Muodostaa yhteinen malli olennaiselle tiedolle
- Tiedon haku liiketoimintakäsitteiden avulla
- Yhdistellä tietoa yli siilojen
- Linkittää data ja sisältö liiketoiminnan kontekstiin
- Tuo ei-rakenteisen tiedon analytiikan saataville
- Koskematta tietolähteisiin (haku lähteistä tarvittaessa)
• Toteutettu semanttisella teknologialla
• Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus)
Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu
Data ja sisältö
Ontologiapalvelu
Ontologia tiedonhallinnan maailmassa
projekti
tuotepalvelu
työkalu toimitus
ihminen
ratkaisu
asiakas teknologia
tarpeet
hyödyt
Sovellukset
Käyttäjät
Haku Help desk
Projektin
työpöytä
Tuote-opas
CMSTietämyksen
integrointi BI
Tiedonhallinnan tasot – semantic CM
Metadata
•Tietotyypit
•Kuvaava
•Hallinnointi & käsittely
Luokittelut
•Taksonomia
•Tesaurus
•Sanasto
Konseptuaalinen
•Laaja tesaurus
•Ontologia
Ilmaisuvoima
Metatiedon
uuttaminen
Luokittelun
ehdottaminen
Asioiden
yhdistely
Sisällön rajallinen
ymmärrys
Päättely
Semanttinen vs. perinteinen sisällönhallinta
Semanttinen Perinteinen
Pienen tietoyksikkö • Entiteetti (asia) • Dokumentti
Haun fokus • Entiteetit, suhteet + sisältö • Teksti
Metadatan taso • Tietämyskartta • Arvot ja datatyypit
Kuvaavan luokittelun luonti • Uuttaminen, ehdottava • Käsin (ei tehdä)
Sisällön luokittelu • Hallittu termistö,
määritelmät, synonyymit,
relaatiot jne.
• Dokumenttityypit, vapaat
”tägit”
Linkitys liiketoiminnan
tietotarpeisiin
• Kuvattu: taksonomiaan,
tesaurukseen, ontologiaan
• Eri järjestelmässä (paras
arvaus haun pohjalta)
Jokapäiväinen ontologiamme – Google search
Tekstihaku
• Haetaan
sanoja
indeksoidusta
sisällöstä
Luokittelu
• Hakutulokset
ehostetaan
vertaamalla
luokitteleviin
termeihin
Tekstianalyysi
• Tulosten
relevanssi
määräytyy
semanttisen
analyysin
pohjalta
Konseptuaa-
linen
• Sanoja
verrataan
tunnettuihin
konsepteihin
• Kielelliset
analyysit
Linked Open
Data yhdistetty
• Vertaus
globaaleihin
konsepteihin.
• Linkitetyt
hakutulokset.
• Päättely
• Luonnollisen
kielen ymmärtä-
minen
tänään
Sanoista asioihin, asioista konsepteihin
Knowledge from
Freebase.com via API
By knowledge graph:
http://www.freebase.com/m/040zch
Known
concept
Knowledge graph - esimerkki
Miten se tehdään?
Ontologia ja semanttinen tiedonhallinta
-rooli
Tietoarkkitehtuurin kerrokset
33
Rakenne
ERP
projekti
tuotepalvelu
työkalu toimitus
ihminen
IntraEmailsMDM
IA tasot
Konseptuaalinen
Looginen
Toteutus
ratkaisu
CMS
asiakas
Tietotyypit
Data
ja sisältö
- metadata
Ontologia
Tietämyskartta:
-Liiket. entiteetit
-attribuutit
-suhteet
Järjestelmät
-tietokuvaukset
Asiayhteys
teknologia
tarpeet
hyödyt
Luokittelut
Big Data
Liike-
toiminta
prosessi
T&K Tuotanto Myynti Huolto
Minulle tärkeä tieto.
Hyviä päätöksiä.
Laadukas tieto.
Saatavuus.
Yhteinen kieli.
Jaettu ymmärrys.
Ontologiaratkaisun rakennuspalikat
ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ
projekti
tuotepalvelu
työkalu toimitus
ihmine
n
ratkaisu
asiakas teknologia
tarpeet
hyödyt Rakenteinen
tieto
Muu sisältö
+ +
STANDARDITRDFS, OWL, SKOS
RIF
ISO Topic Maps
RFF/XML
SPARQL
Web API
XML, JSON-LD, RDFa
ODBC/JDBC Unicode
Tiedonhallinan kypsyys
Tiedot ja data
siiloissa
Tiedot
kuvattu,
Siilojen
mäppäys
Bisnestarpeet
mäpätty
tietoon
Päättely ja
analytiikka,
Säännöt
Strateginen
johtamisväline
Ennusteet
Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys
Kyvykkyys
Vertikaali
ratkaisu
Tietämyksen
integrointi palvelu
Ei tarvitse olla
täydellistä ollakseen
hyödyllistä
Sanasto
Tyypillisiä käyttötapauksia
• Automatisoida operaattori-portaalin sisällönhallintaa
– Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio
• Hallita tietoa & mainoksia portaalissa
– uutiset eri lähteistä reititetään, mainosten täsmäys
• ”Älykkäät” asiantuntijan apuvälineet
– Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen
• Tietämystason tiedon integrointi
– EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio
• Tärkeän tiedon uuttaminen isoista datamääristä
– Telco operaattoreiden BSS/OSS datan louhinta
• Globaali avoin tieto (julkishallinto, bisnes)
– Tiedon yhdistely ja käyttö Web APIn kautta
– Programmableweb.com (MuleSoft)
– http://www.bbc.co.uk/ontologies/
Opiskele lisää semanttista tiedonkäsittelyä
• Suomessa:
– http://data.aalto.fi/
– http://jhsmeta.fi/sanasto/
– http://informationthinker.blogspot.fi/ (Heimon blogi)
• W3C:
– http://www.w3.org/standards/semanticweb/
– http://www.w3schools.com/web/web_semantic.asp
• Toimittajien valitut palat (MBS warning!):
– http://www.cambridgesemantics.com/semantic-university/
– http://www.poolparty.biz/videos/
– http://www.fluidops.com/publications/
– http://www.ontology.com/resources/
– http://www.programmableweb.com/ (Web API)
The Semantic Web = a Web with a meaning.
Yhteenveto
Yhteenveto
• Semanttinen teknologia tarjoaa joustavaa ja tehokasta
informaation hallintaa:
– Tehokkaampia keinoja hallita tieto-tsunamia
– Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan
– Tehostaa tiedon hakua
– Automatisoi metatiedon luontia (auto tagging)
– Tuo ei-rakenteisen tiedon analytiikan saataville
– Metatasolla on kettärämpää mallintaa liiketoimintaa
• Vaikka iso asia - liikkeelle pääsee helposti
• Semanttinen netti = Linked Open Data (web of data)
• Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)
Kysymysten aika
olkaa hyvä!
Kiitos!
Heimo.hanninen@talentbase.fi

Más contenido relacionado

Similar a Tiedonhallinnan ongelmat ja semanttisen teknologian keinot - 2013

Semanttinen Web
Semanttinen WebSemanttinen Web
Semanttinen WebTapva
 
1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteetSpartaConsulting
 
Tiedonhankinta
TiedonhankintaTiedonhankinta
TiedonhankintaParo Teesu
 
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajanaUusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajanaPerttu Monthan
 
Sähköinen työpöytä - suunnittelu, toteutus, hankehallinta
Sähköinen työpöytä - suunnittelu, toteutus, hankehallintaSähköinen työpöytä - suunnittelu, toteutus, hankehallinta
Sähköinen työpöytä - suunnittelu, toteutus, hankehallintaPerttu Tolvanen
 
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...ivoriofinland
 
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri RoponenSemanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri RoponenTilastokeskus
 
Business models Julkinen data
Business models Julkinen dataBusiness models Julkinen data
Business models Julkinen dataFloApps
 
Julkinen Data Business mallit
Julkinen Data Business mallitJulkinen Data Business mallit
Julkinen Data Business mallitFloApps
 
Datajournalimin työpaja Apps4Finland 2011
Datajournalimin työpaja Apps4Finland 2011Datajournalimin työpaja Apps4Finland 2011
Datajournalimin työpaja Apps4Finland 2011Louhos
 
Rpresentation
RpresentationRpresentation
RpresentationLeo Lahti
 
Metsäalan innovaatio- ja osaamisverkosto
Metsäalan innovaatio- ja osaamisverkostoMetsäalan innovaatio- ja osaamisverkosto
Metsäalan innovaatio- ja osaamisverkostoEbax Ltd
 
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaanTalent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaanLoihde Advisory
 
Mitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassaMitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassaNorth Patrol
 
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaanRatkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaanInnokyla
 
Yhteiskunnan mittaaminen: Big data ja tiedonlouhinta
Yhteiskunnan mittaaminen: Big data ja tiedonlouhintaYhteiskunnan mittaaminen: Big data ja tiedonlouhinta
Yhteiskunnan mittaaminen: Big data ja tiedonlouhintaTuukka Ylä-Anttila
 
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2    onko tätä tutkittu aiemminTutkimusta tutkielmaan 2    onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemminAnne Holappa
 
New biz4finland jukka ahtikari
New biz4finland   jukka ahtikariNew biz4finland   jukka ahtikari
New biz4finland jukka ahtikariApps4Finland
 

Similar a Tiedonhallinnan ongelmat ja semanttisen teknologian keinot - 2013 (20)

Semanttinen Web
Semanttinen WebSemanttinen Web
Semanttinen Web
 
1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet
 
Tiedonhankinta
TiedonhankintaTiedonhankinta
Tiedonhankinta
 
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajanaUusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
 
Sähköinen työpöytä - suunnittelu, toteutus, hankehallinta
Sähköinen työpöytä - suunnittelu, toteutus, hankehallintaSähköinen työpöytä - suunnittelu, toteutus, hankehallinta
Sähköinen työpöytä - suunnittelu, toteutus, hankehallinta
 
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
 
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri RoponenSemanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
 
Business models Julkinen data
Business models Julkinen dataBusiness models Julkinen data
Business models Julkinen data
 
Julkinen Data Business mallit
Julkinen Data Business mallitJulkinen Data Business mallit
Julkinen Data Business mallit
 
Datajournalimin työpaja Apps4Finland 2011
Datajournalimin työpaja Apps4Finland 2011Datajournalimin työpaja Apps4Finland 2011
Datajournalimin työpaja Apps4Finland 2011
 
Rpresentation
RpresentationRpresentation
Rpresentation
 
Metsäalan innovaatio- ja osaamisverkosto
Metsäalan innovaatio- ja osaamisverkostoMetsäalan innovaatio- ja osaamisverkosto
Metsäalan innovaatio- ja osaamisverkosto
 
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaanTalent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
 
Mitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassaMitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassa
 
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaanRatkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
 
Yhteiskunnan mittaaminen: Big data ja tiedonlouhinta
Yhteiskunnan mittaaminen: Big data ja tiedonlouhintaYhteiskunnan mittaaminen: Big data ja tiedonlouhinta
Yhteiskunnan mittaaminen: Big data ja tiedonlouhinta
 
Näin ostat intranetin
Näin ostat intranetinNäin ostat intranetin
Näin ostat intranetin
 
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2    onko tätä tutkittu aiemminTutkimusta tutkielmaan 2    onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemmin
 
New biz4finland jukka ahtikari
New biz4finland   jukka ahtikariNew biz4finland   jukka ahtikari
New biz4finland jukka ahtikari
 
Venla Salmi: Tutkimustieto päätöksenteon tukena
Venla Salmi: Tutkimustieto päätöksenteon tukenaVenla Salmi: Tutkimustieto päätöksenteon tukena
Venla Salmi: Tutkimustieto päätöksenteon tukena
 

Tiedonhallinnan ongelmat ja semanttisen teknologian keinot - 2013

  • 1. Tiedon määrä kasvaa rajusti – keinot hallita Semanttinen teknologia avuksi Sisällön- & dokumenttien hallinta '13 Heimo Hänninen 12.6.2013
  • 3. Talent Base Luomme asiakkaillemme kilpailuetua suunnittelemalla parhailla menetelmillä tarkoituksenmukaisia IT-ratkaisuja.
  • 4. 1 Strategia 2 Prosessit 3 Ratkaisusuunnittelu Palvelualueemme
  • 5. Yksittäisestä sovelluksesta kokonaisuuden hallintaan Avaintiedon hallinta (MDM) Sisällönhallinta (ECM) Asiakkuudenhallinta (CRM) Verkkokauppa Sähköiset palvelut
  • 6. Talent Base apuna semanttisen tiedonhallinnan kehittämisessä Perustan luominen (master data management) • Datan profilointi, data standardit & tietomallit, business case, evaluoinnit, arkkitehtuurit, projektointi… Sisällönhallinta • Metadatamallit, taksonomiat, verkkosisällön hallinta, strategian luonti Semanttisen tiedonhallinnan käyttöönotto • Hallitut ensiaskeleet (esim. asiakastiedon hallinta, dokumenttien luokittelu) • 360 näkyvyyden luonti • Ontology Systems kumppani (www.ontology.com) Faktapohjainen tiedonhallinta • Liiketoimintaontologian luonti • liiketoimintasanastot
  • 10. Tiedon määrä kasvaa 2011-02-09 10 Informaation määrä tuplautuu kahdessa vuodessa!
  • 11. Mitä minä kommunikoin? Miten sinä ymmärrät? Haaste
  • 12. Semantiikan kolmio: puhumme symboleilla, ajattelemme konsepteilla, tarkoitamme aitoja asioita 2011-06-17 12 Asiakas? • “symbol” Nimi • “concept” Henkilökohtainen rajallinen käsitys oliosta “ajatusolio päässäsi” • “referent” Todellinen olio http://www.yso.fi/ onto/liito/p1332 Henkilö Leasing firma Yritysasiakas Myyntipäällikkö Company Customer Client Asiakas = joka maksaa auton huoltolaskun http://jhsmeta.fi/ sanasto/id/henkilö /J15152 Asiakas = joka noutaa auton Huoltopäällikkö
  • 13. Liike-elämän hengen velttous: Huomenna huomataan, että tänään ei tehty mitään päätöksiä uusista kehityshankkeista Haaste Ei käsitellä tänään. Kirjoittajan huomio näinä ankean talouden aikoina.
  • 14. Esityksen agenda 1. Tiedonhallinnan ongelmat => liiketoiminnan haasteet 2. Ontologia ja semanttinen tiedonhallinta 1. Mitä se on? 2. Miten se tehdään? 3. Yhteenveto
  • 16. Tiedonhallinnan haasteet Epäyhtenäiset käsitteet ja kuvaukset Tiedon määrä kasvaa (nopeammin kuin käsittelykyky) Tiedon huono laatu Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut) Tieto ei ole rakenteista Tieto on hajallaan, usein siiloissa Rajoittunut tietoisuus relevantista tiedosta Liiketoiminnan tempo vaatii tietoa nopeasti Semanttinen teknologia auttaa
  • 17. Liiketoiminnan ongelmia Ihmiset turhautuu Huonoja päätöksiä Turhaa työtä / huono tuottavuus Väärinkäsityksiä Huonoa palvelua "Cognitive treshold exeeded" Kun kompleksisuus ylittää ymmärryksen  ihminen hyppää faktoista taikauskoon päätöksenteossa (Rebecca Costa)
  • 18. Liiketoiminnan ongelmia Ihmiset turhautuu Huonoja päätöksiä Turhaa työtä / huono tuottavuus Väärinkäsityksiä Huonoa palvelua "Cognitive treshold exeeded"
  • 20. Semanttinen teknologia - häh? Kielitieteessä • Fonologia = äänteet, • Morfologia = lauseiden muodostuminen • Semantiikka = merkitykset • Pragmatiikka = sanat kontekstissa • esim. ironia, terminologia politiikassa, piilomerkitykset Filosofia • Ontologia = filosofinen tiede, tutkii olemisen kategorioita Semanttinen teknologia • Ontologia = konseptuaalinen tietomalli tietämysrakenteelle, kohde spesifinen • Semanttisuus = merkityksiä hyödyntävä, (kieltä ja merkityksiä rajatusti ymmärtävä)
  • 21. Suunnattu graafi - peruspalikka • RDF tripletti edustaa nimettyä suunnattua graafia. • Siten se soveltuu paremmin tietynlaisen tietämyksen mallintamiseen kuin relaatiomalli. Heimo Tämä kalvo On luonut Subject Predicate  Object
  • 22. Ontologian luonti – Graafi konsepti ASPEN, an industry-leading Advanced Service Platform for Ethernet Networks A-2200 Access Aspen A-2200 Service platform Access is a type of product contains a product is a type of product Ethernet Networks is applicable for
  • 23. Mitä on ontologia? Yritys @nimi Heimo @rooli konsultti @sivu http://link @sposti heimo… Työntekijä @toimiala MDM… @kaupunki Espoo @nimi Talent Base Listaa MDM toimialan konsultit Espoossa. @ID 2157464-4 työsuhde Organisaation todellinen maailma Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta Valitut oliot, yhteydet, ominaisuudet Liiketoiminnan tarpeet (sovellukset) Logiikka: päättely, haut, navigointi ym. Faktat, informaatio URL
  • 24. Yritys @nimi Heimo @rooli konsultti @sivu http://link @sposti heimo… Työntekijä @toimiala MDM… @kaupunki Espoo @nimi Talent Base Listaa MDM toimialan konsultit Espoossa. @ID 2157464-4 työsuhde Organisaation todellinen maailma Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta Valitut oliot, yhteydet, ominaisuudet Liiketoiminnan tarpeet (sovellukset) Logiikka: päättely, haut, navigointi ym. Faktat, informaatio URL Mitä on ontologia - tietokoneelle?
  • 25. Mikä on ontologiapalvelu? Talent Basen määritelmä: Ontologiapalvelu on tiedonhallintakyvykkyys: • Luoda konseptuaalinen malli tietovarantojen päälle: – Käsin mallintaen tai – Automaattisesti (varmistettava luotettavuustaso) • Palvella tietointensiivisiä sovelluksia: - Muodostaa yhteinen malli olennaiselle tiedolle - Tiedon haku liiketoimintakäsitteiden avulla - Yhdistellä tietoa yli siilojen - Linkittää data ja sisältö liiketoiminnan kontekstiin - Tuo ei-rakenteisen tiedon analytiikan saataville - Koskematta tietolähteisiin (haku lähteistä tarvittaessa) • Toteutettu semanttisella teknologialla • Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus) Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu
  • 26. Data ja sisältö Ontologiapalvelu Ontologia tiedonhallinnan maailmassa projekti tuotepalvelu työkalu toimitus ihminen ratkaisu asiakas teknologia tarpeet hyödyt Sovellukset Käyttäjät Haku Help desk Projektin työpöytä Tuote-opas CMSTietämyksen integrointi BI
  • 27. Tiedonhallinnan tasot – semantic CM Metadata •Tietotyypit •Kuvaava •Hallinnointi & käsittely Luokittelut •Taksonomia •Tesaurus •Sanasto Konseptuaalinen •Laaja tesaurus •Ontologia Ilmaisuvoima Metatiedon uuttaminen Luokittelun ehdottaminen Asioiden yhdistely Sisällön rajallinen ymmärrys Päättely
  • 28. Semanttinen vs. perinteinen sisällönhallinta Semanttinen Perinteinen Pienen tietoyksikkö • Entiteetti (asia) • Dokumentti Haun fokus • Entiteetit, suhteet + sisältö • Teksti Metadatan taso • Tietämyskartta • Arvot ja datatyypit Kuvaavan luokittelun luonti • Uuttaminen, ehdottava • Käsin (ei tehdä) Sisällön luokittelu • Hallittu termistö, määritelmät, synonyymit, relaatiot jne. • Dokumenttityypit, vapaat ”tägit” Linkitys liiketoiminnan tietotarpeisiin • Kuvattu: taksonomiaan, tesaurukseen, ontologiaan • Eri järjestelmässä (paras arvaus haun pohjalta)
  • 29. Jokapäiväinen ontologiamme – Google search Tekstihaku • Haetaan sanoja indeksoidusta sisällöstä Luokittelu • Hakutulokset ehostetaan vertaamalla luokitteleviin termeihin Tekstianalyysi • Tulosten relevanssi määräytyy semanttisen analyysin pohjalta Konseptuaa- linen • Sanoja verrataan tunnettuihin konsepteihin • Kielelliset analyysit Linked Open Data yhdistetty • Vertaus globaaleihin konsepteihin. • Linkitetyt hakutulokset. • Päättely • Luonnollisen kielen ymmärtä- minen tänään
  • 30. Sanoista asioihin, asioista konsepteihin Knowledge from Freebase.com via API By knowledge graph: http://www.freebase.com/m/040zch Known concept
  • 31. Knowledge graph - esimerkki
  • 32. Miten se tehdään? Ontologia ja semanttinen tiedonhallinta
  • 33. -rooli Tietoarkkitehtuurin kerrokset 33 Rakenne ERP projekti tuotepalvelu työkalu toimitus ihminen IntraEmailsMDM IA tasot Konseptuaalinen Looginen Toteutus ratkaisu CMS asiakas Tietotyypit Data ja sisältö - metadata Ontologia Tietämyskartta: -Liiket. entiteetit -attribuutit -suhteet Järjestelmät -tietokuvaukset Asiayhteys teknologia tarpeet hyödyt Luokittelut Big Data Liike- toiminta prosessi T&K Tuotanto Myynti Huolto Minulle tärkeä tieto. Hyviä päätöksiä. Laadukas tieto. Saatavuus. Yhteinen kieli. Jaettu ymmärrys.
  • 34. Ontologiaratkaisun rakennuspalikat ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ projekti tuotepalvelu työkalu toimitus ihmine n ratkaisu asiakas teknologia tarpeet hyödyt Rakenteinen tieto Muu sisältö + + STANDARDITRDFS, OWL, SKOS RIF ISO Topic Maps RFF/XML SPARQL Web API XML, JSON-LD, RDFa ODBC/JDBC Unicode
  • 35. Tiedonhallinan kypsyys Tiedot ja data siiloissa Tiedot kuvattu, Siilojen mäppäys Bisnestarpeet mäpätty tietoon Päättely ja analytiikka, Säännöt Strateginen johtamisväline Ennusteet Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys Kyvykkyys Vertikaali ratkaisu Tietämyksen integrointi palvelu Ei tarvitse olla täydellistä ollakseen hyödyllistä Sanasto
  • 36. Tyypillisiä käyttötapauksia • Automatisoida operaattori-portaalin sisällönhallintaa – Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio • Hallita tietoa & mainoksia portaalissa – uutiset eri lähteistä reititetään, mainosten täsmäys • ”Älykkäät” asiantuntijan apuvälineet – Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen • Tietämystason tiedon integrointi – EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio • Tärkeän tiedon uuttaminen isoista datamääristä – Telco operaattoreiden BSS/OSS datan louhinta • Globaali avoin tieto (julkishallinto, bisnes) – Tiedon yhdistely ja käyttö Web APIn kautta – Programmableweb.com (MuleSoft) – http://www.bbc.co.uk/ontologies/
  • 37. Opiskele lisää semanttista tiedonkäsittelyä • Suomessa: – http://data.aalto.fi/ – http://jhsmeta.fi/sanasto/ – http://informationthinker.blogspot.fi/ (Heimon blogi) • W3C: – http://www.w3.org/standards/semanticweb/ – http://www.w3schools.com/web/web_semantic.asp • Toimittajien valitut palat (MBS warning!): – http://www.cambridgesemantics.com/semantic-university/ – http://www.poolparty.biz/videos/ – http://www.fluidops.com/publications/ – http://www.ontology.com/resources/ – http://www.programmableweb.com/ (Web API) The Semantic Web = a Web with a meaning.
  • 39. Yhteenveto • Semanttinen teknologia tarjoaa joustavaa ja tehokasta informaation hallintaa: – Tehokkaampia keinoja hallita tieto-tsunamia – Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan – Tehostaa tiedon hakua – Automatisoi metatiedon luontia (auto tagging) – Tuo ei-rakenteisen tiedon analytiikan saataville – Metatasolla on kettärämpää mallintaa liiketoimintaa • Vaikka iso asia - liikkeelle pääsee helposti • Semanttinen netti = Linked Open Data (web of data) • Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)