SlideShare una empresa de Scribd logo
1 de 20
Опыт использования продукционных
правил в задаче извлечения
онтологической информации из
терминологических словарей
Е.Н. Клименко
Е.Ф. Силина
Санкт-Петербургский экономико-математический
институт РАН
Три этапа решения задачи
1. Семантико-синтаксический анализ исходного
варианта вербальных определений. В основе
системы лежит анализатор и семантический
словарь В. А. Тузова.
2. Разработка системы правил, вычленяющих из
вербального определения онтологически
значимую информацию.
3. Применение правил к вербальным
определениям.
Список структурных связей между терминами
1. Это – субъект этой связи объявляется классом.
2. subClassOf – субъект этой связи объявляется
подклассом класса, заданного объектом.
3. этоПараметр – субъект этой связи является
параметром некоторого далее конкретизируемого
свойства класса, заданного объектом связи.
4. с_Параметром – объект этой связи является
параметром субъекта.
Продукционные правила
Продукционное правило - правило вида
"УСЛОВИЕ – ДЕЙСТВИЕ".
Структура правил состоит из двух частей:
– условие, которому должен удовлетворять
фрагмент дерева синтаксического разбора;
– действие, выполняемое над заданным
фрагментом дерева, если правило оказалось
применимым к этому фрагменту.
Основные приемы определения правил
УСЛОВИЕ содержит:
– указание опорного узла дерева разбора, к
которому применимо данное правило;
– указание, если это необходимо, контекста этого
опорного узла,
– указание, если это необходимо, свойств
(морфологических и семантических) которым
должны удовлетворять узлы (все или некоторые)
из заданного контекста.
ДЕЙСТВИЕ содержит инструкции о вставке,
уничтожении или преобразовании триплетов и
узлов.
Синтаксически правило оформляется в виде
именованного блока информации, атрибутом
которого определяется T- или N-тип этого
правила:
<имя_правила ТИП={T|N} >
условие => действие
</ имя_правила>
Склонение - одна из двух координат
экваториальной системы координат.
{СКЛОНЕНИЕ - Это - Class
СКЛОНЕНИЕ - этоПараметр -
ЭКВАТОРИАЛЬНЫЙ_СИСТЕМА_КООРДИНАТА
СКЛОНЕНИЕ - subClassOf - КООРДИНАТА}
Правило РодЗн
<РодЗн ТИП = "T">
#W1 Род #W2 & ЗНАЧАЩИЙ (#W1) != 0 &
ЗНАЧАЩИЙ (#W2) != 0 =>
ВСТАВИТЬ (#W1 этоПараметр #W2);
УДАЛИТЬ (#W1 Род #W2)
</РодЗн>
Правило РодНезн
<РодНезн ТИП = "T">
#W1 Род #W2 & ЧАСТЬРЕЧИ (#W1) = Сущ &
ЧАСТЬРЕЧИ (#W2) = Сущ &
ЗНАЧАЩИЙ (#W2) = 0 =>
УДАЛИТЬ (#W1 Род #W2)
</РодНезн>
Правило РодПар2
<РодПар2 ТИП = "T">
#W1 Род #W2 & (КЛАСС(#W1) = Параметры &
ЗНАЧАЩИЙ(#W2) != 0) =>
ЗАМЕНИТЬ (#W1 Род #W2,
#W1 этоПараметр #W2)
</РодПар2>
Результаты эксперимента
• Всего в определениях терминологического
словаря использовано 237 различных слов.
Указание класса потребовалось для 48 слов.
Общее количество востребованных классов
равно 16.
• В определениях терминологического словаря
(после применения программы унификации
связей) используется 38 различных типов связей.
• Для построения онтологии по исходному
терминологическому словарю пришлось
определить 123 правила. Из них 51 правило
использовано два и более раз; 72 правила были
Общее количество связей в «эталонной
онтологии» - 93:
связи вида класс/подкласс - 62,
связи вида свойства классов - 31.
Общее количество выявленных связей - 61:
связи класс/подкласс – 29,
связи свойства классов - 32.
Конечным результатом этой работы является
формальный текст онтологии, связывающей
исходный набор терминов в сеть отношений
между терминами.
• Подтвердилась зависимость семантической
интерпретации синтаксических связей от
контекста на дереве разбора.
• Важной характеристикой является степень
общности правил и возможность их
многократного использования.
• Все правила, будучи ориентированными на
задачу онтологического анализа
терминологических словарей, вместе с тем
имеют достаточно общий характер и не зависят
от специфики конкретной предметной области (в
нашем случае это задача межзвездного
поглощения).
• Спасибо за внимание !!!

Más contenido relacionado

Destacado

修心 青山無所爭.福田用心耕(Nx)
修心  青山無所爭.福田用心耕(Nx)修心  青山無所爭.福田用心耕(Nx)
修心 青山無所爭.福田用心耕(Nx)nonnon
 
Webpage07 Sept07
Webpage07 Sept07Webpage07 Sept07
Webpage07 Sept07mapasy
 
Quiz 2
Quiz 2Quiz 2
Quiz 2jkohn2
 
B24 t043 good_tests
B24 t043 good_testsB24 t043 good_tests
B24 t043 good_testsGlen Gatin
 
Motivation Movie P P T Version Sample
Motivation  Movie  P P T  Version  SampleMotivation  Movie  P P T  Version  Sample
Motivation Movie P P T Version SampleAndrew Schwartz
 
Hello Australia Positive Vibrations BBQ - 22/09/07
Hello Australia Positive Vibrations BBQ - 22/09/07Hello Australia Positive Vibrations BBQ - 22/09/07
Hello Australia Positive Vibrations BBQ - 22/09/07Diego Costa
 
Institutions To Community
Institutions To CommunityInstitutions To Community
Institutions To CommunityFireflyCN
 
Una Ventana A La Historia
Una Ventana A La HistoriaUna Ventana A La Historia
Una Ventana A La HistoriaClota
 
ニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えします
ニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えしますニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えします
ニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えしますAtsushi Nakatsugawa
 
Slovakia PowerPoint Content
Slovakia PowerPoint Content Slovakia PowerPoint Content
Slovakia PowerPoint Content Andrew Schwartz
 
Fair Vote2
Fair Vote2Fair Vote2
Fair Vote2etnader
 
FATC UK - Real time collaborative Flex apps
FATC UK - Real time collaborative Flex appsFATC UK - Real time collaborative Flex apps
FATC UK - Real time collaborative Flex appsMichael Chaize
 
How a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged ElectionHow a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged ElectionSelena Deckelmann
 
Pocket Philippines presentation
Pocket Philippines presentationPocket Philippines presentation
Pocket Philippines presentationyocard
 

Destacado (19)

修心 青山無所爭.福田用心耕(Nx)
修心  青山無所爭.福田用心耕(Nx)修心  青山無所爭.福田用心耕(Nx)
修心 青山無所爭.福田用心耕(Nx)
 
VESI
VESIVESI
VESI
 
Webpage07 Sept07
Webpage07 Sept07Webpage07 Sept07
Webpage07 Sept07
 
Quiz 2
Quiz 2Quiz 2
Quiz 2
 
B24 t043 good_tests
B24 t043 good_testsB24 t043 good_tests
B24 t043 good_tests
 
Motivation Movie P P T Version Sample
Motivation  Movie  P P T  Version  SampleMotivation  Movie  P P T  Version  Sample
Motivation Movie P P T Version Sample
 
Hello Australia Positive Vibrations BBQ - 22/09/07
Hello Australia Positive Vibrations BBQ - 22/09/07Hello Australia Positive Vibrations BBQ - 22/09/07
Hello Australia Positive Vibrations BBQ - 22/09/07
 
Institutions To Community
Institutions To CommunityInstitutions To Community
Institutions To Community
 
Una Ventana A La Historia
Una Ventana A La HistoriaUna Ventana A La Historia
Una Ventana A La Historia
 
大家行06
大家行06大家行06
大家行06
 
Oh to be 2
Oh to be 2 Oh to be 2
Oh to be 2
 
ニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えします
ニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えしますニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えします
ニフティクラウド mobile backendを使う上での良くある質問、疑問にお答えします
 
1stweek
1stweek1stweek
1stweek
 
Slovakia PowerPoint Content
Slovakia PowerPoint Content Slovakia PowerPoint Content
Slovakia PowerPoint Content
 
Fair Vote2
Fair Vote2Fair Vote2
Fair Vote2
 
FATC UK - Real time collaborative Flex apps
FATC UK - Real time collaborative Flex appsFATC UK - Real time collaborative Flex apps
FATC UK - Real time collaborative Flex apps
 
How a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged ElectionHow a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged Election
 
Pocket Philippines presentation
Pocket Philippines presentationPocket Philippines presentation
Pocket Philippines presentation
 
Ivan Derganskyi
Ivan DerganskyiIvan Derganskyi
Ivan Derganskyi
 

Similar a силина2010

Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаIrene Pochinok
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстаYury Katkov
 
Максим Литвинов
Максим ЛитвиновМаксим Литвинов
Максим ЛитвиновLidia Pivovarova
 
Основные принципы и подходы к составлению заданий в тестовой форме
Основные принципы и подходы к составлению заданий в тестовой формеОсновные принципы и подходы к составлению заданий в тестовой форме
Основные принципы и подходы к составлению заданий в тестовой формеМобильная Электронная Школа
 
Михаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеМихаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеLidia Pivovarova
 

Similar a силина2010 (7)

Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текста
 
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииАвтоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
 
Unit tests
Unit testsUnit tests
Unit tests
 
Максим Литвинов
Максим ЛитвиновМаксим Литвинов
Максим Литвинов
 
Основные принципы и подходы к составлению заданий в тестовой форме
Основные принципы и подходы к составлению заданий в тестовой формеОсновные принципы и подходы к составлению заданий в тестовой форме
Основные принципы и подходы к составлению заданий в тестовой форме
 
Михаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеМихаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделирование
 

Más de Lidia Pivovarova

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Lidia Pivovarova
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classificationLidia Pivovarova
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesLidia Pivovarova
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovLidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyLidia Pivovarova
 

Más de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 

силина2010

  • 1. Опыт использования продукционных правил в задаче извлечения онтологической информации из терминологических словарей Е.Н. Клименко Е.Ф. Силина Санкт-Петербургский экономико-математический институт РАН
  • 2. Три этапа решения задачи 1. Семантико-синтаксический анализ исходного варианта вербальных определений. В основе системы лежит анализатор и семантический словарь В. А. Тузова. 2. Разработка системы правил, вычленяющих из вербального определения онтологически значимую информацию. 3. Применение правил к вербальным определениям.
  • 3. Список структурных связей между терминами 1. Это – субъект этой связи объявляется классом. 2. subClassOf – субъект этой связи объявляется подклассом класса, заданного объектом. 3. этоПараметр – субъект этой связи является параметром некоторого далее конкретизируемого свойства класса, заданного объектом связи. 4. с_Параметром – объект этой связи является параметром субъекта.
  • 4. Продукционные правила Продукционное правило - правило вида "УСЛОВИЕ – ДЕЙСТВИЕ". Структура правил состоит из двух частей: – условие, которому должен удовлетворять фрагмент дерева синтаксического разбора; – действие, выполняемое над заданным фрагментом дерева, если правило оказалось применимым к этому фрагменту.
  • 5. Основные приемы определения правил УСЛОВИЕ содержит: – указание опорного узла дерева разбора, к которому применимо данное правило; – указание, если это необходимо, контекста этого опорного узла, – указание, если это необходимо, свойств (морфологических и семантических) которым должны удовлетворять узлы (все или некоторые) из заданного контекста. ДЕЙСТВИЕ содержит инструкции о вставке, уничтожении или преобразовании триплетов и узлов.
  • 6. Синтаксически правило оформляется в виде именованного блока информации, атрибутом которого определяется T- или N-тип этого правила: <имя_правила ТИП={T|N} > условие => действие </ имя_правила>
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13. Склонение - одна из двух координат экваториальной системы координат. {СКЛОНЕНИЕ - Это - Class СКЛОНЕНИЕ - этоПараметр - ЭКВАТОРИАЛЬНЫЙ_СИСТЕМА_КООРДИНАТА СКЛОНЕНИЕ - subClassOf - КООРДИНАТА}
  • 14. Правило РодЗн <РодЗн ТИП = "T"> #W1 Род #W2 & ЗНАЧАЩИЙ (#W1) != 0 & ЗНАЧАЩИЙ (#W2) != 0 => ВСТАВИТЬ (#W1 этоПараметр #W2); УДАЛИТЬ (#W1 Род #W2) </РодЗн>
  • 15. Правило РодНезн <РодНезн ТИП = "T"> #W1 Род #W2 & ЧАСТЬРЕЧИ (#W1) = Сущ & ЧАСТЬРЕЧИ (#W2) = Сущ & ЗНАЧАЩИЙ (#W2) = 0 => УДАЛИТЬ (#W1 Род #W2) </РодНезн>
  • 16. Правило РодПар2 <РодПар2 ТИП = "T"> #W1 Род #W2 & (КЛАСС(#W1) = Параметры & ЗНАЧАЩИЙ(#W2) != 0) => ЗАМЕНИТЬ (#W1 Род #W2, #W1 этоПараметр #W2) </РодПар2>
  • 17. Результаты эксперимента • Всего в определениях терминологического словаря использовано 237 различных слов. Указание класса потребовалось для 48 слов. Общее количество востребованных классов равно 16. • В определениях терминологического словаря (после применения программы унификации связей) используется 38 различных типов связей. • Для построения онтологии по исходному терминологическому словарю пришлось определить 123 правила. Из них 51 правило использовано два и более раз; 72 правила были
  • 18. Общее количество связей в «эталонной онтологии» - 93: связи вида класс/подкласс - 62, связи вида свойства классов - 31. Общее количество выявленных связей - 61: связи класс/подкласс – 29, связи свойства классов - 32. Конечным результатом этой работы является формальный текст онтологии, связывающей исходный набор терминов в сеть отношений между терминами.
  • 19. • Подтвердилась зависимость семантической интерпретации синтаксических связей от контекста на дереве разбора. • Важной характеристикой является степень общности правил и возможность их многократного использования. • Все правила, будучи ориентированными на задачу онтологического анализа терминологических словарей, вместе с тем имеют достаточно общий характер и не зависят от специфики конкретной предметной области (в нашем случае это задача межзвездного поглощения).
  • 20. • Спасибо за внимание !!!