Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Технологии анализа и синтеза естественного языка



Системой АОТ, т.е. системой переработки одного вида текста в другой в памяти компьютера различается по выполняемым функциям и по входной и выходной информации.

Язык входного текста Язык выходного текста
1 ЕЯ1 машинный переводчик 1ЕЯ2
2 ИЯ 2 ЕЯ
3 ЕЯ 3 ИЯ
4 ЕЯ 4 ЕЯ+ИЯ

Примером систем 2-го типа является система генерации (синтеза) текста на основе некоторого формального описания.

К системам 3-го типа могут относиться системы автоматического реферирования информации или ее индексирования.

К 4-му типу относятся программы, которые занимаются проверкой текста на ЕЯ и в результате своей работы они исправляют входной текст либо автоматически либо составляют протокол замечаний (орфография, стилистика).

Для создания систем обрабатывающих ЕЯ необходимы сложные лингвистические процессы и богатая техническая база, которой часто не хватает. Для того до сих пор не разработана лингвистическая теория текста: нет единой схемы непротиворечивого описания семантики языка. Возникают проблемы синтаксического анализа.

В настоящее время наиболее активно разрабатывают АОТ, решающие следующие прикладные задачи:

1. Гипертекстовые системы и технологии.

2. Машинный перевод по уровням языка (очень много подзадач, начиная с анализа символов, морфологического анализа, лексического анализа, синтаксического анализа, семантического анализа и синтеза текста).

3. Система генерации текста / синтеза текста.

4. Локализация и интернационализация текста. Приспособление программных продуктов и различных технических текстов к культурным и языковым нормам покупателей других стран мира (руссификация).

5. Создание текстовых документов на основе их ввода, редактирования и проверки орфографии (текстовые редакторы или издательские системы).

6. Работа на ограниченном языке, т.е. использование некоторого упрощенного варианта языка для технического описания или иных продуктов.

7. Информационный поиск с задачами индексирования информации.

В проблематику гипертекста включают 2 резко-контрастирующие части:

1) Когда речь идет о ФОРМЕ представленного текста, о его нелинейной организации, о его элементах (часто мультимедийных), о характере взаимосвязей между ними и способе его чтения и осмысления. В этом случае он противопоставлен обычному линейному тексту.

2) С другой стороны гипертекст это вопрос технологии, которая делает возможным такое представление текста (часто текста больших объемов) и в этом случае гипертекст понимается как новая компьютерная информационная технология.





Дата публикования: 2015-02-20; Прочитано: 678 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...