Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Рассмотрим типологию систем индексирования по пяти наиболее важным основаниям.
1. По степени автоматизации процесса индексирования можно различать системы:
а) ручного индексирования;
б) автоматического индексирования;
в) автоматизированного индексирования.
Наиболее широко распространены автоматизированные СИ.
2. По степени контролируемости различают СИ:
а) без словаря (может быть факультативное использование словарей);
в) со свободным словарем.
Данное разбиение СИ определяется типом используемого ИПЯ.
3. По характеру алгоритма отбора слов текста могут быть СИ:
а) с последовательным просмотром текста;
б) с эвристическими процедурами выбора слов текста;
в) со статистическими процедурами выбора слов.
В случае а) отбираются все полнозначные слова; в случае в) только информативные слова в соответствии с распределением частот их употребления, в случае б) слова отбираются интуитивно или по заданной процедуре.
4. По характеру лексикографического контроля существуют системы:
а) без лексикографического контроля;
б) с полным контролем;
в) с промежуточным контролем.
Лексикографический контроль предусматривает устранение синонимии, полисемии и омонимии на основе нормативных словарей лексических единиц с парадигматическими отношениями между ними; приведение всех слов к нормальному виду на основе морфологических нормативных словарей.
В системах с полным контролем реализуются обе функции лексикографического контроля. В СИ с промежуточным контролем эти функции реализуются частично.
5. По характеру морфологического анализа слов различают СИ с использованием:
а) морфологических словарей;
б) основных лексических словарей;
в) морфологического анализа с усечением слов.
Возможны системы индексирования без морфологического анализа.
Дата публикования: 2015-02-03; Прочитано: 426 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!