Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Системой АОТ, т.е. системой переработки одного вида текста в другой в памяти компьютера различается по выполняемым функциям и по входной и выходной информации.
Язык входного текста | Язык выходного текста |
1 ЕЯ1 машинный переводчик | 1ЕЯ2 |
2 ИЯ | 2 ЕЯ |
3 ЕЯ | 3 ИЯ |
4 ЕЯ | 4 ЕЯ+ИЯ |
Примером систем 2-го типа является система генерации (синтеза) текста на основе некоторого формального описания.
К системам 3-го типа могут относиться системы автоматического реферирования информации или ее индексирования.
К 4-му типу относятся программы, которые занимаются проверкой текста на ЕЯ и в результате своей работы они исправляют входной текст либо автоматически либо составляют протокол замечаний (орфография, стилистика).
Для создания систем обрабатывающих ЕЯ необходимы сложные лингвистические процессы и богатая техническая база, которой часто не хватает. Для того до сих пор не разработана лингвистическая теория текста: нет единой схемы непротиворечивого описания семантики языка. Возникают проблемы синтаксического анализа.
В настоящее время наиболее активно разрабатывают АОТ, решающие следующие прикладные задачи:
1. Гипертекстовые системы и технологии.
2. Машинный перевод по уровням языка (очень много подзадач, начиная с анализа символов, морфологического анализа, лексического анализа, синтаксического анализа, семантического анализа и синтеза текста).
3. Система генерации текста / синтеза текста.
4. Локализация и интернационализация текста. Приспособление программных продуктов и различных технических текстов к культурным и языковым нормам покупателей других стран мира (руссификация).
5. Создание текстовых документов на основе их ввода, редактирования и проверки орфографии (текстовые редакторы или издательские системы).
6. Работа на ограниченном языке, т.е. использование некоторого упрощенного варианта языка для технического описания или иных продуктов.
7. Информационный поиск с задачами индексирования информации.
В проблематику гипертекста включают 2 резко-контрастирующие части:
1) Когда речь идет о ФОРМЕ представленного текста, о его нелинейной организации, о его элементах (часто мультимедийных), о характере взаимосвязей между ними и способе его чтения и осмысления. В этом случае он противопоставлен обычному линейному тексту.
2) С другой стороны гипертекст это вопрос технологии, которая делает возможным такое представление текста (часто текста больших объемов) и в этом случае гипертекст понимается как новая компьютерная информационная технология.
Дата публикования: 2015-02-20; Прочитано: 728 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!