Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Об’єднання знань про синтаксис і семантику



Семантичний інтерпретатор будує представлення значення вхідного рядка, переміщуючись по дереву граматичного розбору від кореневого вузла sentence. У кожному вузлі він рекурсивно інтерпретує його дочірні вузли та поєднує отримані результати в загальному концептуальному графі. Наприклад, семантичний інтерпретатор будує представлення символу verb_phrase, формуючи рекурсивні представлення дочірніх вузлів verb і noun_phrase, і поєднуючи їх для представлення дієслівної конструкції. Результат передається вузлу sentence і поєднується символу subject.

Рекурсія припиняється при досягненні термінальних елементів дерева розбору. Деякі з них, у тому числі такі, що відповідають іменникам, дієсловам і прикметникам, потребують вилучення з бази знань. Інші, зокрема артиклі, не мають прямої відповідності з поняттями бази знань, але визначають інші поняття на графі.

У розглянутому прикладі семантичний інтерпретатор використовує базу знань про “світ собак”. До понять цієї бази знань відносяться об'єкти dog і man, а також дії like і bite. Ці поняття описуються за допомогою ієрархії типів, представленої на рис. 13.10.

Рисунок 13.10 – Ієрархія типів для прикладу зі “світу собак”

Крім понять необхідно визначити відношення, які будуть використані в концептуальних графах. В нашому прикладі беруть участь наступні поняття:

− символ agent (агент) зв'язує поняття act (дія) з поняттям типу animate (живий). Агент визначає відношення між дією та живим об'єктом, що ініціює цю дію;

− символ experiencer (носій стану) зв'язує поняття state (стан) з поняттям типу animate (живий). Він визначає відношення між психічним станом і його носієм;

− символ instrument (інструмент) зв'язує поняття act (дія) з поняттям entity (сутність) і визначає інструмент, що використовується для виконання дії.;

− символ object (об'єкт) зв'язує поняття event (сутність) або state (стан) з поняттям entity (сутність) і представляє відношення “дія-об'єкт”;

− символ part (частина) зв'язує поняття типу psysobj (фізичний об'єкт) і визначає відношення між цілим і його частиною.

При побудові інтерпретації особливо важлива роль приділяється дієсловам, оскільки вони визначають відношення між підметом, доповненням та іншими компонентами речення. Кожне дієслово можна представити за допомогою відмінкового фрейму (case frame), що визначає наступні дані.

1. Лінгвістичні відношення (агент, об'єкт, інструмент і т.д.), що відповідають даному дієслову. Наприклад, транзитивні дієслова пов'язані з об'єктом, а нетранзитивні - ні.

2. Обмеження на значення, які можуть привласнюватися будь-якому компоненту відмінкового фрейму. Наприклад, у відмінковому фреймі для дієслова “bites” стверджується, що агент повинен відноситись до типу dog. Тоді речення “Man bites dog” буде відхилено як семантично некоректне.

3. Значення компонентів відмінкового фрейму, що використовуються за умовчанням. У фреймі дієслова “bites” для поняття, зв'язаного з відношенням instrument, за умовчанням використовується значення teeth.

Відмінкові фрейми для дієслів like і bite показані на рис. 13.11.

Рисунок 13.11 – Відмінкові фрейми для дієслів like і bite

Визначимо дії, що дозволяють будувати семантичне представлення правил або процедур для кожного потенційного вузла дерева граматичного розбору. У нашому прикладі правила описуються у вигляді процедур мовою псевдокоду. У кожній процедурі при неуспішному завершенні конкретного тесту або об'єднання дана інтерпретація відхиляється як семантично некоректна.

procedure sentence;

begin

викликати процедуру noun_phrase для одержання представлення підмета;

викликати процедуру verb_phrase для одержання представлення присудка

з залежними словами;

за допомогою об'єднання та обмеження зв'язати поняття іменника;

те, що повертається для підмета, з агентом графа для дієслівної

конструкції

end

procedure noun_phrase;

begin

викликати процедуру noun для одержання представлення іменника;

case

невизначений артикль і однина: поняття, визначене іменником,

є загальним;

визначений артикль і однина: зв'язати маркер з поняттям,

обумовленим іменником;

множина: указати, що іменник знаходиться у множині

end case

end.

procedure verb_phrase;

begin

викликати процедуру verb для одержання представлення дієслова;

if з дієсловом зв'язане доповнення

then begin

викликати процедуру noun_phrase для одержання представлення

доповнення;

за допомогою об'єднання та обмеження зв'язати поняття,

визначене доповненням, що відповідає присудку

end

end

procedure verb;

begin

одержати відмінковий фрейм для дієслова

end

procedure noun;

begin

одержати поняття для дієслова іменника

end

Артиклі не відповідають поняттям у базі знань, але дозволяють визначити, яким є поняття, зв'язане з даним іменником: загальним або конкретним. Представлення понять у множині ми не будемо розглядати. Їх обробка за допомогою концептуальних графів описується в [Sowa, 1984].

За допомогою цих процедур для ієрархії понять, показаної на рис. 13.10, і відмінкових фреймів, представлених на рис. 13.11, можна описати дії семантичного інтерпретатора, що вживаються для побудови семантичного представлення речення “The dog like a man” на основі дерева граматичного розбору, зображеного на рис. 13.12.

Рисунок 13.12 – Побудова семантичного представлення на основі дерева граматичного розбору

Числа в дужках у наступному списку відповідають порядковим номерам на рис. 13.12.

1. Спочатку для вузла, що відповідає реченню, викликається процедура sentence.

2. Процедура sentence викликає процедуру noun_phrase.

3. Процедура noun_phrase викликає процедуру noun.

4. Процедура noun викликає поняття, зв'язане з іменником dog (1 на рис. 13.12).

5. Оскільки артикль визначений, процедура noun_phrase зв'язує маркер #1 із цим поняттям (2) і повертає дане поняття процедурі sentence.

6. Процедура sentence викликає процедуру verb_phrase.

7. Процедура verb_phrase викликає процедуру verb, що дозволяє одержати відмінковий фрейм для дієслова like (3).

8. Процедура verb_phrase викликає процедуру noun_phrase, що у свою чергу викликає процедуру noun для одержання поняття, пов'язаного з іменником man (4).

9. Оскільки артикль є невизначеним, процедура noun_phrase визначає це поняття як загальне (5).

10. Процедура verb_phrase обмежує поняття entity у відмінковій рамці та об’єднує його з поняттям, що відповідає іменнику man (6). Ця структура повертається процедурі sentence.

11. Процедура sentence об’єднує поняття dog: #1 з вузлом experiencer відмінкової рамки (7).

Отриманий концептуальний граф представляє значення речення.

Генерація мовних конструкцій – це зв'язана задача, що вирішується за допомогою програм розуміння природної мови. Генерація англійських виражень вимагає побудови семантично коректного виходу на основі внутрішнього представлення значення. Наприклад, відношення agent означає зв'язок підмет-присудок між двома поняттями. За допомогою простих підходів відповідні слова приєднуються до готових шаблонів (template) речень. Ці шаблони можна розглядати як зразки речень або їхніх фрагментів, зокрема як дієслівну та іменну конструкції. Вихідний результат будується шляхом проходу по концептуальному графу та комбінування цих фрагментів. Більш складні підходи до генерування мовних конструкцій пов'язані з використанням граматик перетворення для відображення значення в діапазон можливих речень [Winograd, 1972], [Allen, 1987].

У розділі 13.5 буде описано спосіб програмної побудови внутрішнього представлення тексту природною мовою. Це представлення може використовуватись у різноманітних прикладаннях, два з яких будуть представлені в розділі 13.5. Однак спочатку в розділі 13.4 будуть описані стохастичні підходи виявлення шаблонів та загальних закономірностей мови.

10.3 Контрольні запитання і завдання

10.4 Приклади аудиторних і домашніх задач





Дата публикования: 2015-04-07; Прочитано: 351 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...