Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

Klimenko

510 visualizaciones

Publicado el

  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Klimenko

  1. 1. ПРАКТИЧЕСКИЕ АСПЕКТЫ РАЗРАБОТКИ ОНТОЛОГИЧЕСКОЙ СЕМАНТИКИ ГЛАГОЛОВ ДВИЖЕНИЯ Е.Н. Клименко Е.Ф. Силина Санкт-Петербургский экономико-математический институт РАН
  2. 2. Цель проекта <ul><li>Целью проекта является представление связного повествовательного текста семантической сетью отношений между упоминаемыми в тексте объектами. Проект ориентируется на анализ сравнительно простых текстов общественно-политической тематики. Решение общей задачи базируется на формальном описании лексики русского языка в семантическом словаре. </li></ul><ul><li>Цель данной работы – практическая отработка технологии построения формальных толкований лексики. </li></ul>
  3. 3. Особенности отрабатываемой технологии <ul><li>В качестве основы для представления семантики текстов выбрана система языков RDF / OWL . Семантическая информация о естественном языке представляется совокупностью трех информационных комплексов: </li></ul><ul><li>базовой онтологии ; </li></ul><ul><li>информационной базы форматов толкований ; </li></ul><ul><li>лексикона. </li></ul><ul><li>Семантическая сеть описывается конъюнкцией RDF -триплетов. Узлами семантической сети могут быть: </li></ul><ul><li>имена классов базовой OWL -онтологии; </li></ul><ul><li>имена классов – лексических значений слов текста, полученные из лексикона; </li></ul><ul><li>имена-референты , автоматически сформированные в процессе анализа текста; </li></ul><ul><li>узлы-переменные, сформированные в соответствии с модельной семантикой RDF . </li></ul>
  4. 4. Процедура разработки толкований лексических значений слов <ul><li>Разработка в составе OWL -онтологии системы общих классов. </li></ul><ul><li>Разработка форматов толкований. </li></ul><ul><li>Разработка толкований для конкретных лексических значений слов лексикона. </li></ul>
  5. 5. Отображение времени текста <ul><li>Параметры времени в тексте: </li></ul><ul><li>время текста; </li></ul><ul><li>точка отсчета ; </li></ul><ul><li>момент (интервал) наблюдения. </li></ul><ul><li>Сведения о времени протекания ситуации, привносимые морфологией: </li></ul><ul><li>ont :В_прошлом - ситуация началась в момент времени, предшествующий моменту наблюдения ; </li></ul><ul><li>ont :В_будущем – ситуация продолжается в момент наблюдения и завершится в будущем ; </li></ul><ul><li>ont :НачалоСитуации-значение текущего времени текста, фиксируется как ее начало ; </li></ul><ul><li>ont :КонецСитуации - конец интервала времени существования ситуации ; </li></ul><ul><li>ont :Кратковременная_Ситуация – точечный интервал времени . </li></ul>
  6. 6. Времязависимые классы СостоянияСитуации ИзменениеПараметра УвеличениеПараметра УменьшениеПараметра СостояниеОбъект НеагентивноеДвижение НемаркированныйРезультат СостояниеСовокупность Нахождение Место Событие Бросание Удар Агентивный Процесс СостояниеЗнания ФазыСостояния ДвижениеПроцесс Бег Полет Висение Контакт ПолныйОхват Ерзание Процесс с Результатом НачалоСостояния ЗавершениеСостояния . . . . . . . . .
  7. 7. <ul><li>< script > </li></ul><ul><li>< header > </li></ul><ul><li>_: X rdf : type ont :Вверх; ont :рольИточка _: Y 6; ont :рольКточка :_ Y 5; </li></ul><ul><li>ont :рольКаузатор _: Y 1; ont :рольОбъект _: Y 2; ont :рольМесто _ Y 3; </li></ul><ul><li>ont :рольНачало _:T1; ont :рольОкончание _:T2. </li></ul><ul><li></header> </li></ul><ul><li><body> </li></ul><ul><li>_:X1 rdf:type ont: Нахождение _ Место - Исходная точка </li></ul><ul><li>_: X 2 rdf : type ont :ДвижениеПроцесс </li></ul><ul><li>_: X 2 rdf : type ont :Нахождение_Место - Место движения </li></ul><ul><li>_: X 3 rdf : type ont :Нахождение_Место - Конечная точка </li></ul><ul><li>_: Y 8 rdf : type ont :РазмерДистанции; </li></ul><ul><li>_: X 2 rdf : type ont :УвеличениеПараметра </li></ul><ul><li></ body > </li></ul><ul><li></ script > </li></ul>Пример структуры сценария ont :Вверх
  8. 8. Форматы толкований Сценарии АгентивноеДействие Действие с Результатом ЗамедлениеПроцесс ЗамедлениеРезультат СценарийРазмещения СценарийПеремещения СНемаркРезультатом СценарийУдаления Вверх Вниз ОбъединенСовокупность РазъединенСовокупность СобытиеДвижение ОтражениеДействия УскорениеПроцесс УскорениеРезультат КраткоеДвижение СобытиеРазмещение ОтражениеСобытия Событие с Намерением ОтражениеДвижения МногократноеКраткое МногократСобытРазмещение СобытиеПеремещение МногократСобытПеремещение СобытВверх СобытВниз
  9. 9. Пример толкования видовой пары глаголов поднять/поднимать (в значении перемещения вверх) <ul><li>ПОДНЯТЬ20 (20-е значение слова в словаре В.А. Тузова) </li></ul><ul><li>Синтактика: </li></ul><ul><li>Z 1: !Им, Z 2: !Вин, Z 3: !поДат, Z 4: !Откуда, Z 5: !Куда, Z 6: !Тв!наПред </li></ul><ul><li>Семантика : </li></ul><ul><li><interpret voc:input=&quot;_: X&quot; voc:instance=&quot;_:X&quot; > </li></ul><ul><li>_:X rdf:type ont: Вверх ; ont: рольИточка _:Z4; ont: рольКточка _:Z5; </li></ul><ul><li>ont: рольКаузатор _:Z1; ont: рольОбъект _:Z2; ont: рольМесто _:Z3; </li></ul><ul><li>ont :рольНачало _:T1; ont :рольОкончание _:T2. </li></ul><ul><li>_ T 1 rdf : type ont :НачалоСитуации. _ T 2 rdf : type ont :КонецСитуации . </li></ul><ul><li></ interpret >. </li></ul><ul><li>ПОДНИМАТЬ13 </li></ul><ul><li>Синтактика: … . Семантика : … </li></ul><ul><li>_ T 1 rdf : type ont :В_прошлом. _ T 2 rdf : type ont :В_будущем. </li></ul>
  10. 10. Заключение <ul><li>Серьезным, если не решающим, подспорьем в решении нашей задачи явилась таксономия лексики русского языка, разработанная В.А. Тузовым. Построенные им семантические классы оказались достаточно семантически однородными, что существенно упростило разработку методов форматирования толкований. </li></ul><ul><li>Практика показала, что для описания примерно 2000 глаголов движения (более 60% от общего количества) хватает сравнительно небольшого количества сценариев (27). </li></ul><ul><li>Механизм форматирования толкований оказался достаточно практичным технологическим приемом, позволяющим: </li></ul><ul><li>– формировать критерии выявления общих таксономических характеристик определяемых смысловых значений слов; </li></ul><ul><li>– существенно автоматизировать процесс построения толкований лексики. </li></ul>
  11. 11. Спасибо за внимание!

×