1. СЕМАНТИЧЕСКИЙ ВЕБ
И
WEB KNOWLEDGE MINING
С.А. Яблонский, Т.А. Гаврилова
Высшая школа менеджмента Санкт-
Петербургского государственного университета
Санкт-Петербург
7. • Web 1.0 – объединение в сети информации
(этап пройден, информация постоянно
пополняется);
• Web 2.0 – объединение в сети людей – Social
Web (пройден, социальные сети стали
реальностью и стремительно растут);
• Web 3.0 – объединение в сети знаний
(начинается сейчас);
• Web 4.0 – такое объединение в сети людей и
компьютеров, когда и те и другие смогут
общаться и получать знания наравне с друг
другом (перспектива).
10. Языки представления
онтологий
RDF+ RDFS
OWL
Язык запросов к RDF/OWL
SPARQL
11. RDFS
• RDFS – язык описания словарей для
RDF
• RDF Schema определяет классы,
свойства и другие ресурсы.
• RDFS является семантическим
расширением RDF.
12. Перечень классов RDFS
Имя класса Пояснение
rdfs:Resource Класс ресурс, включает «всё».
rdfs:Literal Класс литеральных значений, текстовых строк
или чисел.
rdf:XMLLiteral Класс XML литералов
rdfs:Class Класс классов.
rdf:Property Класс RDF свойств.
rdfs:Datatype Класс типов данных RDF.
rdf:Statement Класс утверждений.
rdf:Bag Класс неупорядоченных контейнеров.
rdf:Seq Класс упорядоченных контейнеров.
rdf:Alt Класс контейнеров-альтернатив.
rdfs:Container Класс RDF контейнеров.
rdfs:ContainerMembershipProperty Класс свойств «членства» в контейнерах, rdf:_1,
rdf:_2, ..., все они являются подсвойствами
свойства member( член).
rdf:List Класс RDF списков.
13. Перечень свойств RDFS
Имя свойства Пояснение Домен Диапазон
rdf:type Субъект является экземпляром класса. rdfs:Resource rdfs:Class
rdfs:subClassOf Субъект является подклассом класса. rdfs:Class rdfs:Class
rdfs:subProperty Субъект является подсвойством свойства. rdf:Property rdf:Property
Of
rdfs:domain Домен свойства сеюъекта. rdf:Property rdfs:Class
rdfs:range Диапазон свойства субъекта. rdf:Property rdfs:Class
rdfs:label Человекочитаемое название субъекта. rdfs:Resource rdfs:Literal
rdfs:comment Текстовое описание ресурса rdfs:Resource rdfs:Literal
rdfs:member Член ресурса субъекта. rdfs:Resource rdfs:Resource
rdf:first Первый элемент списка. rdf:List rdfs:Resource
rdf:rest Оставшийся за первым элементом «хвост» rdf:List rdf:List
списка.
rdfs:seeAlso Дополнительная информация о субъекте. rdfs:Resource rdfs:Resource
rdfs:isDefinedBy Определение ресурса субъекта. rdfs:Resource rdfs:Resource
rdf:value Свойство, используемое для rdfs:Resource rdfs:Resource
структурированных значений
rdf:subject Субъект RDF утверждения (см.
реификация). rdf:Statement rdfs:Resource
rdf:predicate Предикат утверждения (см. реификация). rdf:Statement rdfs:Resource
rdf:object Объект RDF утверждения (см.
реификация). rdf:Statement rdfs:Resource
14. RDF
• RDF – язык описания метаданных в Сети
• Модель данных RDF – ориентированный
граф
• RDF граф строится на основе элементарных
высказываний (триплетов)
• Форма высказываний – бинарное
отношение (S,P,O)
• RDF чрезвычайно выразителен (кто угодно
может сказать что угодно о чем угодно)
• RDFS служит для определения словарей
RDF.
15. Ограничение языка
RDF + RDFS
Целостность и непротиворечивость.
RDF не запрещает делать бессмысленных
утверждений или утверждений не согласующихся с
другими.
Вся ответственность за проверку целостности ложится
на получателей (конечных пользователей)
метаданных, т.е. на разработчиков приложений
обрабатывающих RDF.
16. Дополнительно
• упрощенные встроенные в HTML-
страницы микроформаты (Microformats),
• RDFa,
• Embedded RDF (eRDF),
• и др., широко используемые в Facebook,
Yahoo! Local, блогах.
17. OWL
• OWL (Web Ontology Language) – язык
представления онтологий в Web.
Фактически это словарь расширяющий
набор терминов определенных RDFS.
• OWL-онтологии могут содержать
описания классов, свойств и их
экземпляров.
18. Три диалекта OWL
• OWL Lite (простота)
• OWL DL (полнота и разрешимость)
• OWL Full (выразительная мощь)
19. Языки запросов
к RDF хранилищам
Представление знаний в машинопонятном
формате не имело бы никакого смысла, если бы
к этим знаниям нельзя было обращаться,
автоматически их обрабатывать и пополнять.
Две близкие задачи:
• Извлечение имеющихся в хранилище знаний
запросами к RDF хранилищу - asking, querying.
• Применение логического вывода над
имеющимися знаниями (RDF-графами и
онтологиями) - reasoning, entailment.
20. SPARQL
Синтаксис запроса (упрощенный)
SELECT <v_list>
FROM <onologyURI>
WHERE { <template_list>.
FILTER <filter_expr>
}
- v_list – список имен переменных
- onologyURI – ссылка на онтологию
- template_list – список шаблонов
- filter_expr – ограничения на значения
переменных
25. RDF/OWL- ресурсы в сети (1)
• FOAF (Friend of a Friend) (http://www.foaf-
project.org/)
• SIOC (Semantically-Interlinked Online
Communities discussion
forums,weblogs,blogrolls/feed subscriptions,
mailing lists, shared bookmarks, image
galleries - http://sioc-project.org/)
26. RDF/OWL- ресурсы в сети (2)
• Open GUID (http://openguid.net/)
• SIMILE (Semantic Interoperability of Metadata
and Information in unLike Environments -
http://simile.mit.edu/)
• NextBio
(http://www.nextbio.com/b/nextbio.nb)
27. RDF/OWL- ресурсы в сети (3)
• Linking Open Data
(http://esw.w3.org/topic/SweoIG/TaskForces/
CommunityProjects/LinkingOpenData)
• Wikipedia (http://www.wikipedia.org/)
• Dbpedia (http://dbpedia.org/)
• YAGO (http://www.mpi-inf.mpg.de/yago-
naga/yago/)
29. Например, проект DBpedia нацелен на
извлечение структурированной
информации из многоязычной веб-
энциклопедии Wikipedia с помощью
SPARQL-запросов. На основе обработки
сниппетов (snippet) из Wikipedia построена
база знаний, где хранят RDF-тройки:
subject-predicate-object. Число RDF-троек
сегодня превышает 274 миллиона на 30
языках, включая 415,000 категорий
Wikipedia и 75,000 категорий YAGO.
Онтология YAGO основана на Wikipedia и
WordNet.