온톨로지 모델링시 고려해야할 데이터 공유 문제와 인스턴스 생성시 URI를 생성하고 관리하기 위한 시스템을 통해서 개체 식별 방법 및 이를 평가하기 위한 테스트셋 소개, 그리고 sameAs 현황 및 문제점, 이를 효과적으로 지원하고 관리하기 위한 KISTI의 접근 방법에 대해서 소개한다. 기존의 학술정보를 대상으로 구축된 온톨로지와 온톨로지 인스턴스 생성시 발생하는 문제점, 개체 식별 방법, sameAs 문제와 이를 해결하기 위한 노력들을 사례를 중심으로 살펴보도록 하겠다.
Continual Active Learning for Efficient Adaptation of Machine LearningModels ...
온톨로지 모델링 및 URI 관리 방법
1. 시맨틱 웹
온톨로지 모델링 및 URI 관리 방법
2009. 12.4
김 평
(kimpyung@gmail.com)
Department of
KISTI
(Korea Institute of Science and Technology Information)
Information
Technology
Research Korean Semantic Web Conference 2009
2. 목차
n 정보서비스의 진화
n 웹 검색 포탈의 진화
n 차세대 정보서비스
n 시맨틱 웹
n 온톨로지 모델링
o 온톨로지, 온톨로지 구축 방법론, KISTI 온톨로지
o 추론
n URI 관리 방법
o URI , sameAs
o OntoURI
n 시맨틱 웹의 활용
o Semantic Web Challenge, BTT
o W3C Use Case
Department of
Information
Technology
Research 2 Korean Semantic Web Conference 2009
3. 목차
n 정보서비스의 진화
n 웹 검색 포탈의 진화
n 차세대 정보서비스
n 시맨틱 웹
n 온톨로지 모델링
o 온톨로지, 온톨로지 구축 방법론, KISTI 온톨로지
o 추론
n URI 관리 방법
o URI , sameAs
o OntoURI
n 시맨틱 웹의 활용
o Semantic Web Challenge, BTT
o W3C Use Case
Department of
Information
Technology
Research 3 Korean Semantic Web Conference 2009
4. 웹 검색 포탈의 진화
Department of
Information
Technology
Research 4 Korean Semantic Web Conference 2009
5. 웹 검색 포탈의 진화
Department of
Information
Technology
Research 5 Korean Semantic Web Conference 2009
6. 웹 검색 포탈의 진화
Department of
Information
Technology
Research 6 Korean Semantic Web Conference 2009
7. 웹 검색 포탈의 진화
Department of
Information
Technology
Research 7 Korean Semantic Web Conference 2009
8. 차세대 정보 서비스
Department of
Information
http://petitinvention.wordpress.com/
Technology
Research 8 Korean Semantic Web Conference 2009
9. 차세대 정보 서비스
Department of
Information
http://petitinvention.wordpress.com/
Technology
Research 9 Korean Semantic Web Conference 2009
10. 목차
n 정보서비스의 진화
n 웹 검색 포탈의 진화
n 차세대 정보서비스
n 시맨틱 웹
n 온톨로지 모델링
o 온톨로지, 온톨로지 구축 방법론, KISTI 온톨로지
o 추론
n URI 관리 방법
o URI , sameAs
o OntoURI
n 시맨틱 웹의 활용
o Semantic Web Challenge, BTT
o W3C Use Case
Department of
Information
Technology
Research 10 Korean Semantic Web Conference 2009
11. 시맨틱 웹
The Semantic Web is an evolving development of the World Wide
Web in which the meaning (semantics) of information and services
on the web is defined, making it possible for the web to
"understand" and satisfy the requests of people and machines to
use the web content. It derives from World Wide Web Consortium
director Sir Tim Berners-Lee's vision of the Web as a universal
medium for data, information, and knowledge exchange.
Department of
Information http://en.wikipedia.org/wiki/Semantic_Web
Technology
Research 11 Korean Semantic Web Conference 2009
12. 시맨틱 웹
Image from Trey Ideker via Enoch Huang
Semantic Web technologies are not a ‘magic crank’ for discovering new
Department of
Information
drugs (or solving other problems, for that matter)!
Technology
Research 12 Korean Semantic Web Conference 2009
13. 온톨로지
n 컴퓨터를 위한) 지식의 표현
n 개념(Class) 및 개념들 사이의 관계 혹은 개념이 갖는 속성
(Property)
n 개념에 속하는 사례(Instance)
n 사례들 사이의 관계 혹은 사례가 갖는 속성
Thing
성과물 제목
string subPropertyOf
string
사람
이름 subClassOf subClassOf
subClassOf
Schema
기관
논문 특허 보고서
“홍길동” type
“KISTI” 이름 type
사람1 저작 논문1
type
이름 제목
Instance
기관1
“OntoFrame …”
Department of
Information
Technology
Research 13 Korean Semantic Web Conference 2009
14. 온톨로지
n 개념의 명확화, 컴퓨터가 이해, 표준화된 언어, 추론…
배
Department of
Information
Technology
Research 14 Korean Semantic Web Conference 2009
15. 온톨로지
n OWL
n OWL Lite
o 클래스 분류 계층과 간단한 제약 사항 표현에 적합
o 유의어 사전이나 여타 분류 체계의 표현 언어를 빠르고 손쉽게 OWL화하기 위한
용도로 적합
n OWL DL
o 계산학적 완전성(Computational Completeness)과 결정 가능성 (Decidability)을
유지하면서 최대의 표현력을 활용하고자 하는 사용자에게 적합
o 완전성은 모든 결론이 계산될 수 있다는 특성
o 결정가능성은 모든 계산이 유한한 시간 안에 끝난다는 특성
o 어휘의 사용에 있어 정해진 제약 사항을 준수해야 함
n OWL Full
o 계 산 학 적 인 어 떤 보 장 없 이 최 대 의 표 현 력 과 RDF의 유 연 한 문 법 을 모 두
활용하고자 하는 사용자에게 적합
o 클래스는 개체의 집합인 동시에 그 자체가 하나의 개체가 될 수 있음
o 이를 지원할 수 있는 SW의 현실적인 개발이 어려움
Department of
Information
Technology
Research 15 Korean Semantic Web Conference 2009
16. 온톨로지
n OWL Lite, DL, FULL
Department of
Information
Technology
Research 16 Korean Semantic Web Conference 2009
19. 온톨로지 구축
OTK CommonKADS
단계 작업 단계 작업
타당성 -문제점 및 가능성 확인 지식의 -영역 파악(정보원, 용어 사전, 어휘 목록)
조사 -지식관리 어플리케이션 초점 확인 - 재사용을 위한 잠재적 모델 요소 목록(작
-도구 및 포함 대상 확인 업 및 영영 관련 요소)
시작 -요구명세서 작성 지식의 -작업 템플릿 선택(초기 작업 분해)
-지식정보원 분석 상세 -초기 영역 개념 구성(주요 영역 정보형태)
-초기 온톨로지 개발 -지식 모델 상세 완성 (부분적 지식기반을
정제 -초기 온톨로지 검증 및 정제 가진 지식 모델)
-공식 온톨로지 생성
지식의 -지식 모델 검증 (문서 시뮬레이션, 추론 시
평가 -질의 분석 정제 스템 원형)
-지식 기반 정제 (지식 기반 완성
유지 및 -계속적인 유지, 개선 과정
개선
ONIONS Ontology Development 101
단계 작업 단계 작업
1단계 -검증된 언어 자료의 수집 1단계 -온톨로지의 영역과 범위 결정
2단계 -분류구조 분석 2단계 -기존 온톨로지를 활용하는 방안
3단계 -단어의 개념 분석 3단계 -중요 단어의 열거
4단계 -정의된 개념 도식화 4단계 -클래스와 클래스의 계층 정의
Department of 5단계 -온톨로지 라이브러리 구성 5단계 -클래스의 속성(슬롯) 정의
Information
6단계 -온톨로지 라이브러리 분류 실행 6단계 -인스턴스 생성
Technology
Research 19 Korean Semantic Web Conference 2009
20. 온톨로지 구축
n 목적 명확화 – 온톨로지 구축하는 목적 (서비스, 도메인)
n 핵심 개념 추출 – 핵심 개념과 관계 도출
n 상하위 개념 도출 – 개념의 구조화
n 개념 구체화 – 주요 속성 도출 및 개념과 관계 형성
n 표현 – 온톨로지 표현언어로 기술
n 평가 – 목적의 부합성, 지식의 완전성, 서비스의 효율성, …
n 온톨로지 수정 및 보완
n 개체 생성 – 실제 데이터 연계
현상 추상화 구체화 표준화 실용화
Department of
Information
Technology
Research 20 Korean Semantic Web Conference 2009
21. 온톨로지 저작툴
n Oiled, Protégé, Swoop, TopBraid, Ontotrack, …
Department of
Information
Technology
Research 21 Korean Semantic Web Conference 2009
22. 온톨로지 저작툴
n Protégé
n Load and save OWL and RDF ontologies.
n Edit and visualize classes, properties, and SWRL rules.
n Define logical class characteristics as OWL expressions.
n Execute reasoners such as description logic classifiers.
n Edit OWL individuals for Semantic Web markup.
Department of
Information
Technology
Research 22 Korean Semantic Web Conference 2009
25. 추론
사람 brother
brother
홍삼촌 홍대감
남자
father son
uncle
홍길동
rdfs9 (x rdf:type y) & (y rdfs:subClassOf z) à (x rdf:type z)
rdfs2 (p rdfs:range x) & (y p z) à (z rdf:type x)
(x father y) & (y brother z) à (x uncle z)
Department of (x father y) & (x rdf:type 남자) à (y son x)
Information
Technology
Research 25 Korean Semantic Web Conference 2009
27. 목차
n 정보서비스의 진화
n 웹 검색 포탈의 진화
n 차세대 정보서비스
n 시맨틱 웹
n 온톨로지 모델링
o 온톨로지, 온톨로지 구축 방법론, KISTI 온톨로지
o 추론
n URI 관리 방법
o URI , sameAs
o OntoURI
n 시맨틱 웹의 활용
o Semantic Web Challenge, BTT
o W3C Use Case
Department of
Information
Technology
Research 27 Korean Semantic Web Conference 2009
28. URI
n In computing, a Uniform Resource Identifier (URI) is a string
of characters used to identify or name a resource on the
Internet. Such identification enables interaction with
representations of the resource over a network (typically
the World Wide Web) using specific protocols. Schemes
specifying a concrete syntax and associated protocols define
each URI.
n 예제
n http://example.org/absolute/URI/with/absolute/path/to/resource.txt
n ftp://example.org/resource.txt
Department of n urn:issn:1535-3613
Information
Technology
Research 28 Korean Semantic Web Conference 2009
29. sameAs
n Identity
n owl:sameAs vs. owl:differentFrom vs. owl:AllDifferent
n The built-in OWL property owl:sameAs links an individual to
an individual. Such an owl:sameAs statement indicates that
two URI references actually refer to the same thing: the
individuals have the same "identity".
n 예제
<rdf:Description rdf:about="#William_Jefferson_Clinton">
<owl:sameAs rdf:resource="#BillClinton"/>
</rdf:Description>
<owl:Class rdf:ID="FootballTeam">
<owl:sameAs rdf:resource="http://sports.org/US#SoccerTeam"/>
</owl:Class>
Department of
Information
Technology
Research 29 Korean Semantic Web Conference 2009
30. URI와 sameAs
n 데이터 집합 A, B
도서
ID Author Title Publisher Year
ISBN0-00-651409-X id_xyz The Glass Palace id_qpr 2000
저자
ID Name Home page
id_xyz Ghosh, Amitav http://www.amitavghosh.com
출판사
ID Publisher Name City
id_qpr Harper Collins London
A B D E
1 ID Titre Traducteur Original
ISBN0 2020386682 Le Palais A13 ISBN-0-00-651409-X
des
2
miroirs
3
6 ID Auteur
7 ISBN-0-00-651409-X A12
Department of
Nom
Information 11
12 Ghosh, Amitav
Technology Besse, Christianne
The 2009 Semantic Web Landscape
13
Research 30 Korean Semantic Web Conference 2009
35. URI와 sameAs
n Journal
n Annales d''anatomie pathologique
n Annales de biologie animale, biochimie, biophysique
n Annales de génétique
n Annales de l''Association internationale pour le Calcul analogique. Proceedings of the International Association for Analog Computation
n Annales de l''Institut Pasteur
n Annales de l''Institut Pasteur de Lille
n Annales de l''Institut Pasteur, Actualités
n Annales de l''Institut Pasteur. Immunology
n Annales de l''Institut Pasteur. Microbiologie
n Annales de l''Institut Pasteur. Microbiology
n Annales de l''Institut Pasteur. Virologie
n Annales de l''Institut Pasteur. Virology
n Annales de microbiologie
n Annales de pathologie
n Annales de virologie
n Institution
n Department of Physics, Tokyo Metropolitan University of Hachioji, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, 1-1 Minami-Osawa, Hachioji, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, 1-1, Minami-Ohsawa, Hachioji, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Hachi-oji 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Hachioji 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Hachioji, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Hachioji, Tokyo 192-0937, Japan
n Department of Physics, Tokyo Metropolitan University, Hachioji-shi, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Minami-Ohsawa 1-1, Hachioji-Shi, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Minami-Ohsawa 1-1, Hashioji, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Tokyo 192-0397, Japan
n Department of Physics, Tokyo Metropolitan University, Tokyo, Japan
n Department of Physics, Tokyo Metropolitan University,Tokyo 192-0397, Japan
Department of
Information
Technology
Research 35 Korean Semantic Web Conference 2009
36. URI와 sameAs
n sameAs 관리
n 웹서비스 기반 sameAs 관계 등록/삭제/획득
n 서비스
o sameAs 획득: sameAs 관계 획득 -> 연계 URI 서버의 sameAs 관계 획득 ->.. >
sameAs 기반 서비스 반영
o sameAs 반영: same 관계 변경시 또는 sameAs 관계 획득시
Trust sameAs (URL)
http://www.kats.go.kr/sameAs
http://www.moj.go.kr/sameAs
Web Services(URL)
set : setSameAsProperty (URI1, URI2)
get : getSameAsProperty (URI1)
delete : deleteSameAsProperty (URI1, URI2)
manager
http://isrl.kisti.re.kr/PER_0001
Date
11/28/2009
sameAs
http://isrl.kisti.re.kr/Per_001 owl:sameAs http://isrl.kisti.re.kr/Per_002
sameAs Manager sameAs Manager ……. sameAs Manager
Department of
Information
Technology
Research 36 Korean Semantic Web Conference 2009
39. OntoURI
Register Ontology Generate data store for instance Register authority data
Edit URI formatting rules Edit resolution rules
Register DB Edit information of target DB Edit DB-to-OWL mapping rules
Edit Scheduling rules
Location
Convert DB to RDF Monitor and gather DB
Convert DB to RDF Institution Authority data
Identify object and assign URI
Publication
Article Reasoner
Search engine
Person
Department of Law text
Information
Technology
Research 39 Korean Semantic Web Conference 2009
40. 목차
n 정보서비스의 진화
n 웹 검색 포탈의 진화
n 차세대 정보서비스
n 시맨틱 웹
n 온톨로지 모델링
o 온톨로지, 온톨로지 구축 방법론, KISTI 온톨로지
o 추론
n URI 관리 방법
o URI , sameAs
o OntoURI
n 시맨틱 웹의 활용
o Semantic Web Challenge, BTT
o W3C Use Case
Department of
Information
Technology
Research 40 Korean Semantic Web Conference 2009
41. Semantic Web Challenge
n Semantic Web Challenge (ISWC 2007)
n GroupMe!
n CHIP Demonstrator: Semantics-Driven Recommendations and
Museum Tour Generation
n Semantics-Based Framework for Personalized Access to TV
Content: The iFanzy Use Case
n Revyu.com: A Reviewing and Rating Site for the Web of Data
n Potluck: Semi-ontology Alignment for Casual Users
n Semantic Web Challenge (ISWC 2008)
n paggr
n DBpedia Mobile
n HealthFinland
n BTT (ISWC 2008)
n SemaPlorer
Department of n SearchWebDB
Information
Technology
n MaRVIN
Research 41 Korean Semantic Web Conference 2009
42. Semantic Web Challenge
n Semantic Web Challenge (ISWC 2009)
n TrialX
n VisiNav
n Sig.ma
n BTT (ISWC 2009)
n Scalable Reduction
Department of
Information
Technology
Research 42 Korean Semantic Web Conference 2009