SlideShare una empresa de Scribd logo
1 de 31
Descargar para leer sin conexión
СЕМАНТИЧЕСКИЙ ВЕБ
          И
 WEB KNOWLEDGE MINING

        С.А. Яблонский, Т.А. Гаврилова
     Высшая школа менеджмента Санкт-
Петербургского государственного университета
               Санкт-Петербург
Этапы развития WWW
• Web 1.0 – объединение в сети информации
  (этап пройден, информация постоянно
  пополняется);
• Web 2.0 – объединение в сети людей – Social
  Web (пройден, социальные сети стали
  реальностью и стремительно растут);
• Web 3.0 – объединение в сети знаний
  (начинается сейчас);
• Web 4.0 – такое объединение в сети людей и
  компьютеров, когда и те и другие смогут
  общаться и получать знания наравне с друг
  другом (перспектива).
Tim Berners-Lee
Языки представления
         онтологий
 RDF+ RDFS
 OWL
 Язык запросов к RDF/OWL
  SPARQL
RDFS
• RDFS – язык описания словарей для
  RDF
• RDF Schema определяет классы,
  свойства и другие ресурсы.
• RDFS является семантическим
  расширением RDF.
Перечень классов RDFS
Имя класса                       Пояснение
rdfs:Resource                    Класс ресурс, включает «всё».
rdfs:Literal                     Класс литеральных значений, текстовых строк
                                 или чисел.
rdf:XMLLiteral                   Класс XML литералов
rdfs:Class                       Класс классов.
rdf:Property                     Класс RDF свойств.
rdfs:Datatype                    Класс типов данных RDF.
rdf:Statement                    Класс утверждений.
rdf:Bag                          Класс неупорядоченных контейнеров.
rdf:Seq                          Класс упорядоченных контейнеров.
rdf:Alt                          Класс контейнеров-альтернатив.
rdfs:Container                   Класс RDF контейнеров.
rdfs:ContainerMembershipProperty Класс свойств «членства» в контейнерах, rdf:_1,
                                 rdf:_2, ..., все они являются подсвойствами
                                 свойства member( член).
rdf:List                         Класс RDF списков.
Перечень свойств RDFS
Имя свойства       Пояснение                                  Домен           Диапазон
rdf:type           Субъект является экземпляром класса.       rdfs:Resource   rdfs:Class
rdfs:subClassOf    Субъект является подклассом класса.        rdfs:Class      rdfs:Class
rdfs:subProperty   Субъект является подсвойством свойства.    rdf:Property    rdf:Property
Of
rdfs:domain        Домен свойства сеюъекта.                   rdf:Property    rdfs:Class
rdfs:range         Диапазон свойства субъекта.                rdf:Property    rdfs:Class
rdfs:label         Человекочитаемое название субъекта.        rdfs:Resource   rdfs:Literal
rdfs:comment       Текстовое описание ресурса                 rdfs:Resource   rdfs:Literal
rdfs:member       Член ресурса субъекта.                      rdfs:Resource   rdfs:Resource
rdf:first         Первый элемент списка.                      rdf:List        rdfs:Resource
rdf:rest          Оставшийся за первым элементом «хвост»      rdf:List        rdf:List
                 списка.
rdfs:seeAlso      Дополнительная информация о субъекте.       rdfs:Resource   rdfs:Resource
rdfs:isDefinedBy Определение ресурса субъекта.                rdfs:Resource   rdfs:Resource
rdf:value           Свойство, используемое для                rdfs:Resource   rdfs:Resource
                   структурированных значений
rdf:subject         Субъект RDF утверждения (см.
                                               реификация).   rdf:Statement   rdfs:Resource
rdf:predicate      Предикат утверждения (см. реификация).     rdf:Statement   rdfs:Resource
rdf:object         Объект RDF утверждения (см.
                                             реификация).     rdf:Statement   rdfs:Resource
RDF
• RDF – язык описания метаданных в Сети
• Модель данных RDF – ориентированный
  граф
• RDF граф строится на основе элементарных
  высказываний (триплетов)
• Форма высказываний – бинарное
  отношение (S,P,O)
• RDF чрезвычайно выразителен (кто угодно
  может сказать что угодно о чем угодно)
• RDFS служит для определения словарей
  RDF.
Ограничение языка
           RDF + RDFS
Целостность и непротиворечивость.
 RDF не запрещает делать бессмысленных
 утверждений или утверждений не согласующихся с
 другими.
 Вся ответственность за проверку целостности ложится
 на получателей (конечных пользователей)
 метаданных, т.е. на разработчиков приложений
 обрабатывающих RDF.
Дополнительно
• упрощенные встроенные в HTML-
  страницы микроформаты (Microformats),
• RDFa,
• Embedded RDF (eRDF),
• и др., широко используемые в Facebook,
  Yahoo! Local, блогах.
OWL
• OWL (Web Ontology Language) – язык
  представления онтологий в Web.
  Фактически это словарь расширяющий
  набор терминов определенных RDFS.
• OWL-онтологии могут содержать
  описания классов, свойств и их
  экземпляров.
Три диалекта OWL

• OWL Lite (простота)
• OWL DL (полнота и разрешимость)
• OWL Full (выразительная мощь)
Языки запросов
          к RDF хранилищам
Представление знаний в машинопонятном
  формате не имело бы никакого смысла, если бы
  к этим знаниям нельзя было обращаться,
  автоматически их обрабатывать и пополнять.
Две близкие задачи:
• Извлечение имеющихся в хранилище знаний
  запросами к RDF хранилищу - asking, querying.
• Применение логического вывода над
  имеющимися знаниями (RDF-графами и
  онтологиями) - reasoning, entailment.
SPARQL
Синтаксис запроса (упрощенный)

SELECT      <v_list>
FROM        <onologyURI>
WHERE       {     <template_list>.
                  FILTER <filter_expr>
            }
- v_list – список имен переменных
- onologyURI – ссылка на онтологию
- template_list – список шаблонов
- filter_expr – ограничения на значения
  переменных
OWL-S
(http://www.w3.org/Submission/OWL-S/)

 Семантический язык разметки веб-
 сервисов (Web Services).
 Позволяет создавать семантические
 описания веб-сервисов, понятные для
 семантических веб-агентов (web agents).
RDF/OWL- ресурсы в сети (1)
• FOAF (Friend of a Friend) (http://www.foaf-
  project.org/)
• SIOC (Semantically-Interlinked Online
  Communities discussion
  forums,weblogs,blogrolls/feed subscriptions,
  mailing lists, shared bookmarks, image
  galleries - http://sioc-project.org/)
RDF/OWL- ресурсы в сети (2)
• Open GUID (http://openguid.net/)
• SIMILE (Semantic Interoperability of Metadata
  and Information in unLike Environments -
  http://simile.mit.edu/)
• NextBio
  (http://www.nextbio.com/b/nextbio.nb)
RDF/OWL- ресурсы в сети (3)
• Linking Open Data
  (http://esw.w3.org/topic/SweoIG/TaskForces/
  CommunityProjects/LinkingOpenData)
• Wikipedia (http://www.wikipedia.org/)
• Dbpedia (http://dbpedia.org/)
• YAGO (http://www.mpi-inf.mpg.de/yago-
  naga/yago/)
Linked Open Data (LOD)
Например, проект DBpedia нацелен на
 извлечение структурированной
 информации из многоязычной веб-
 энциклопедии Wikipedia с помощью
 SPARQL-запросов. На основе обработки
 сниппетов (snippet) из Wikipedia построена
 база знаний, где хранят RDF-тройки:
 subject-predicate-object. Число RDF-троек
 сегодня превышает 274 миллиона на 30
 языках, включая 415,000 категорий
 Wikipedia и 75,000 категорий YAGO.
Онтология YAGO основана на Wikipedia и
 WordNet.
Спасибо!
 Сергей Яблонский
serge_yablonsky@hotmail.com

Más contenido relacionado

Destacado

La2 Motherboard
La2 MotherboardLa2 Motherboard
La2 MotherboardCma Mohd
 
20070909 Remember Your Vowels Kingdom Principles
20070909 Remember Your Vowels Kingdom Principles20070909 Remember Your Vowels Kingdom Principles
20070909 Remember Your Vowels Kingdom Principlesguest1411f0
 
Martin karlssons vykortssamling rådhuset
Martin karlssons vykortssamling   rådhusetMartin karlssons vykortssamling   rådhuset
Martin karlssons vykortssamling rådhusethembygdsigtuna
 
Kakak And Paneeraq
Kakak And PaneeraqKakak And Paneeraq
Kakak And Paneeraqeka
 
CW Quiz #27 & 31
CW Quiz #27 & 31CW Quiz #27 & 31
CW Quiz #27 & 31ricmac25
 
Charlotte
CharlotteCharlotte
Charlotteeka
 
ExtJSで作るAIRアプリケーション
ExtJSで作るAIRアプリケーションExtJSで作るAIRアプリケーション
ExtJSで作るAIRアプリケーションDaisaku Yamamoto
 
LOCAL DEVELOPER DAY ’09/Winter
LOCAL DEVELOPER DAY ’09/WinterLOCAL DEVELOPER DAY ’09/Winter
LOCAL DEVELOPER DAY ’09/WinterAtsushi Nakatsugawa
 
Juliane
JulianeJuliane
Julianeeka
 
Nina
NinaNina
Ninaeka
 
Knowledge Management thought starters
Knowledge Management thought startersKnowledge Management thought starters
Knowledge Management thought startersMattthewParsons
 
Jens And Levi
Jens And LeviJens And Levi
Jens And Levieka
 
Michael
MichaelMichael
Michaeleka
 

Destacado (15)

La2 Motherboard
La2 MotherboardLa2 Motherboard
La2 Motherboard
 
Super Team
Super TeamSuper Team
Super Team
 
20070909 Remember Your Vowels Kingdom Principles
20070909 Remember Your Vowels Kingdom Principles20070909 Remember Your Vowels Kingdom Principles
20070909 Remember Your Vowels Kingdom Principles
 
Martin karlssons vykortssamling rådhuset
Martin karlssons vykortssamling   rådhusetMartin karlssons vykortssamling   rådhuset
Martin karlssons vykortssamling rådhuset
 
Kakak And Paneeraq
Kakak And PaneeraqKakak And Paneeraq
Kakak And Paneeraq
 
CW Quiz #27 & 31
CW Quiz #27 & 31CW Quiz #27 & 31
CW Quiz #27 & 31
 
Charlotte
CharlotteCharlotte
Charlotte
 
ExtJSで作るAIRアプリケーション
ExtJSで作るAIRアプリケーションExtJSで作るAIRアプリケーション
ExtJSで作るAIRアプリケーション
 
Web20anwendungen
Web20anwendungenWeb20anwendungen
Web20anwendungen
 
LOCAL DEVELOPER DAY ’09/Winter
LOCAL DEVELOPER DAY ’09/WinterLOCAL DEVELOPER DAY ’09/Winter
LOCAL DEVELOPER DAY ’09/Winter
 
Juliane
JulianeJuliane
Juliane
 
Nina
NinaNina
Nina
 
Knowledge Management thought starters
Knowledge Management thought startersKnowledge Management thought starters
Knowledge Management thought starters
 
Jens And Levi
Jens And LeviJens And Levi
Jens And Levi
 
Michael
MichaelMichael
Michael
 

Similar a Yablomsky

Технологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDFТехнологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDFAlik Kirillovich
 
построение хранилищ
построение хранилищпостроение хранилищ
построение хранилищYury Katkov
 
Л1 Введение в ROS.pdf
Л1 Введение в ROS.pdfЛ1 Введение в ROS.pdf
Л1 Введение в ROS.pdfAlekseyKabanov3
 
Прагматическое введение в Linked Data. Стандарты.
Прагматическое введение в Linked Data. Стандарты.Прагматическое введение в Linked Data. Стандарты.
Прагматическое введение в Linked Data. Стандарты.Yury Katkov
 
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИITMO University
 
Создание электронной библиотеки научных трудов на платформе Dspace
Создание электронной библиотеки научных трудов на платформе DspaceСоздание электронной библиотеки научных трудов на платформе Dspace
Создание электронной библиотеки научных трудов на платформе Dspacebntulibrary
 
разработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSwразработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSwYury Katkov
 
Использование данных семантического веба поисковыми системами
Использование данных семантического веба поисковыми системамиИспользование данных семантического веба поисковыми системами
Использование данных семантического веба поисковыми системамиIrene Pochinok
 
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...ITMO University
 
Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.
Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.
Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.bntulibrary
 
Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...Ontico
 
Linked data, semantic web и семантические вики
Linked data, semantic web и семантические викиLinked data, semantic web и семантические вики
Linked data, semantic web и семантические викиYury Katkov
 
Devconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataDevconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataLeonid Yuriev
 
РИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigDataРИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigDataLeonid Yuriev
 
сравнительный анализ
сравнительный анализсравнительный анализ
сравнительный анализkaspar1488
 
сравнительный анализ
сравнительный анализсравнительный анализ
сравнительный анализkaspar1488
 
сравнительный анализ
сравнительный анализсравнительный анализ
сравнительный анализkaspar1488
 
Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...
Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...
Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...Marcus Akoev
 
локализация и маршрутизация презентация
локализация и маршрутизация   презентациялокализация и маршрутизация   презентация
локализация и маршрутизация презентацияsivorka
 

Similar a Yablomsky (20)

Технологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDFТехнологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDF
 
построение хранилищ
построение хранилищпостроение хранилищ
построение хранилищ
 
Л1 Введение в ROS.pdf
Л1 Введение в ROS.pdfЛ1 Введение в ROS.pdf
Л1 Введение в ROS.pdf
 
I M S Rubashkin
I M S RubashkinI M S Rubashkin
I M S Rubashkin
 
Прагматическое введение в Linked Data. Стандарты.
Прагматическое введение в Linked Data. Стандарты.Прагматическое введение в Linked Data. Стандарты.
Прагматическое введение в Linked Data. Стандарты.
 
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
 
Создание электронной библиотеки научных трудов на платформе Dspace
Создание электронной библиотеки научных трудов на платформе DspaceСоздание электронной библиотеки научных трудов на платформе Dspace
Создание электронной библиотеки научных трудов на платформе Dspace
 
разработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSwразработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSw
 
Использование данных семантического веба поисковыми системами
Использование данных семантического веба поисковыми системамиИспользование данных семантического веба поисковыми системами
Использование данных семантического веба поисковыми системами
 
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
 
Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.
Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.
Автоматизация библиотек уво РБ(состояние и перспективы) Лапо П.М.
 
Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...
 
Linked data, semantic web и семантические вики
Linked data, semantic web и семантические викиLinked data, semantic web и семантические вики
Linked data, semantic web и семантические вики
 
Devconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataDevconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigData
 
РИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigDataРИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigData
 
сравнительный анализ
сравнительный анализсравнительный анализ
сравнительный анализ
 
сравнительный анализ
сравнительный анализсравнительный анализ
сравнительный анализ
 
сравнительный анализ
сравнительный анализсравнительный анализ
сравнительный анализ
 
Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...
Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...
Масштабирование от клиента к серверу. От РМД к хранилищам и от хранилищ к sem...
 
локализация и маршрутизация презентация
локализация и маршрутизация   презентациялокализация и маршрутизация   презентация
локализация и маршрутизация презентация
 

Más de Lidia Pivovarova

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Lidia Pivovarova
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classificationLidia Pivovarova
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesLidia Pivovarova
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovLidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyLidia Pivovarova
 

Más de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 

Yablomsky

  • 1. СЕМАНТИЧЕСКИЙ ВЕБ И WEB KNOWLEDGE MINING С.А. Яблонский, Т.А. Гаврилова Высшая школа менеджмента Санкт- Петербургского государственного университета Санкт-Петербург
  • 2.
  • 3.
  • 4.
  • 5.
  • 7. • Web 1.0 – объединение в сети информации (этап пройден, информация постоянно пополняется); • Web 2.0 – объединение в сети людей – Social Web (пройден, социальные сети стали реальностью и стремительно растут); • Web 3.0 – объединение в сети знаний (начинается сейчас); • Web 4.0 – такое объединение в сети людей и компьютеров, когда и те и другие смогут общаться и получать знания наравне с друг другом (перспектива).
  • 8.
  • 10. Языки представления онтологий  RDF+ RDFS  OWL  Язык запросов к RDF/OWL SPARQL
  • 11. RDFS • RDFS – язык описания словарей для RDF • RDF Schema определяет классы, свойства и другие ресурсы. • RDFS является семантическим расширением RDF.
  • 12. Перечень классов RDFS Имя класса Пояснение rdfs:Resource Класс ресурс, включает «всё». rdfs:Literal Класс литеральных значений, текстовых строк или чисел. rdf:XMLLiteral Класс XML литералов rdfs:Class Класс классов. rdf:Property Класс RDF свойств. rdfs:Datatype Класс типов данных RDF. rdf:Statement Класс утверждений. rdf:Bag Класс неупорядоченных контейнеров. rdf:Seq Класс упорядоченных контейнеров. rdf:Alt Класс контейнеров-альтернатив. rdfs:Container Класс RDF контейнеров. rdfs:ContainerMembershipProperty Класс свойств «членства» в контейнерах, rdf:_1, rdf:_2, ..., все они являются подсвойствами свойства member( член). rdf:List Класс RDF списков.
  • 13. Перечень свойств RDFS Имя свойства Пояснение Домен Диапазон rdf:type Субъект является экземпляром класса. rdfs:Resource rdfs:Class rdfs:subClassOf Субъект является подклассом класса. rdfs:Class rdfs:Class rdfs:subProperty Субъект является подсвойством свойства. rdf:Property rdf:Property Of rdfs:domain Домен свойства сеюъекта. rdf:Property rdfs:Class rdfs:range Диапазон свойства субъекта. rdf:Property rdfs:Class rdfs:label Человекочитаемое название субъекта. rdfs:Resource rdfs:Literal rdfs:comment Текстовое описание ресурса rdfs:Resource rdfs:Literal rdfs:member Член ресурса субъекта. rdfs:Resource rdfs:Resource rdf:first Первый элемент списка. rdf:List rdfs:Resource rdf:rest Оставшийся за первым элементом «хвост» rdf:List rdf:List списка. rdfs:seeAlso Дополнительная информация о субъекте. rdfs:Resource rdfs:Resource rdfs:isDefinedBy Определение ресурса субъекта. rdfs:Resource rdfs:Resource rdf:value Свойство, используемое для rdfs:Resource rdfs:Resource структурированных значений rdf:subject Субъект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:predicate Предикат утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:object Объект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource
  • 14. RDF • RDF – язык описания метаданных в Сети • Модель данных RDF – ориентированный граф • RDF граф строится на основе элементарных высказываний (триплетов) • Форма высказываний – бинарное отношение (S,P,O) • RDF чрезвычайно выразителен (кто угодно может сказать что угодно о чем угодно) • RDFS служит для определения словарей RDF.
  • 15. Ограничение языка RDF + RDFS Целостность и непротиворечивость. RDF не запрещает делать бессмысленных утверждений или утверждений не согласующихся с другими. Вся ответственность за проверку целостности ложится на получателей (конечных пользователей) метаданных, т.е. на разработчиков приложений обрабатывающих RDF.
  • 16. Дополнительно • упрощенные встроенные в HTML- страницы микроформаты (Microformats), • RDFa, • Embedded RDF (eRDF), • и др., широко используемые в Facebook, Yahoo! Local, блогах.
  • 17. OWL • OWL (Web Ontology Language) – язык представления онтологий в Web. Фактически это словарь расширяющий набор терминов определенных RDFS. • OWL-онтологии могут содержать описания классов, свойств и их экземпляров.
  • 18. Три диалекта OWL • OWL Lite (простота) • OWL DL (полнота и разрешимость) • OWL Full (выразительная мощь)
  • 19. Языки запросов к RDF хранилищам Представление знаний в машинопонятном формате не имело бы никакого смысла, если бы к этим знаниям нельзя было обращаться, автоматически их обрабатывать и пополнять. Две близкие задачи: • Извлечение имеющихся в хранилище знаний запросами к RDF хранилищу - asking, querying. • Применение логического вывода над имеющимися знаниями (RDF-графами и онтологиями) - reasoning, entailment.
  • 20. SPARQL Синтаксис запроса (упрощенный) SELECT <v_list> FROM <onologyURI> WHERE { <template_list>. FILTER <filter_expr> } - v_list – список имен переменных - onologyURI – ссылка на онтологию - template_list – список шаблонов - filter_expr – ограничения на значения переменных
  • 21. OWL-S (http://www.w3.org/Submission/OWL-S/) Семантический язык разметки веб- сервисов (Web Services). Позволяет создавать семантические описания веб-сервисов, понятные для семантических веб-агентов (web agents).
  • 22.
  • 23.
  • 24.
  • 25. RDF/OWL- ресурсы в сети (1) • FOAF (Friend of a Friend) (http://www.foaf- project.org/) • SIOC (Semantically-Interlinked Online Communities discussion forums,weblogs,blogrolls/feed subscriptions, mailing lists, shared bookmarks, image galleries - http://sioc-project.org/)
  • 26. RDF/OWL- ресурсы в сети (2) • Open GUID (http://openguid.net/) • SIMILE (Semantic Interoperability of Metadata and Information in unLike Environments - http://simile.mit.edu/) • NextBio (http://www.nextbio.com/b/nextbio.nb)
  • 27. RDF/OWL- ресурсы в сети (3) • Linking Open Data (http://esw.w3.org/topic/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData) • Wikipedia (http://www.wikipedia.org/) • Dbpedia (http://dbpedia.org/) • YAGO (http://www.mpi-inf.mpg.de/yago- naga/yago/)
  • 29. Например, проект DBpedia нацелен на извлечение структурированной информации из многоязычной веб- энциклопедии Wikipedia с помощью SPARQL-запросов. На основе обработки сниппетов (snippet) из Wikipedia построена база знаний, где хранят RDF-тройки: subject-predicate-object. Число RDF-троек сегодня превышает 274 миллиона на 30 языках, включая 415,000 категорий Wikipedia и 75,000 категорий YAGO. Онтология YAGO основана на Wikipedia и WordNet.
  • 30.