![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Как правило, возникновение ошибок идентификации начинается на этапе поиска информации.
Исследования, связанные с изучением различных указателей документальных источников информации, свидетельствуют о том, что значительные искажения вводятся составителями документов за счет ошибок в написании имен авторов (коллективных и индивидуальных, а также наименований объектов. Например:
Особо следует рассмотреть вопросы, связанные с идентификацией марок изделий и наименований фирм и предприятий.
В ряде технических заданий на разработку баз данных по изделиям и организационным единицам обычно используются следующие посылки:
Приведенные утверждения некорректны. В действительности идентификация изделий, фирм и предприятий по их наименованиям является достаточно сложной проблемой. Это обусловлено следующими причинами:
Трудности идентификации объектов по их наименованиям пытаются обойти с помощью использования "записи их имен на языке оригинала".
Но такой подход реально осуществить далеко не просто, т.к. он не может быть реализован без наличия в системах полного алфавита ВСЕХ языков, на которых ведется обработка информации.
Но и это не избавит от ложных отождествлений объектов. Ибо абсолютно идентичное по написанию имя собственное, может принадлежать принципиально различным объектам.
Поэтому утверждения типа: в настоящее время в информационных изданиях (например, ВИНИТИ, система МОСФИтракторостроения (одна из подсистем бывшего МЦНТИ стран-членов СЭВ)) сложилась традиция записи названий предприятий и фирм на языке оригинала; -необходимо рассматривать как прием, используемый в действующих системах, но одновременно необходимо понимать, что данный прием в действительности не дает решения проблемы однозначной идентификации объектов по их именам.
Одним из методов повышения качества идентификации имен собственных (принадлежащих самым различным объектам: фамилий, географических наименований, наименований фирм) является транслитерация.
Именно этим вызвана разработка систем и правил транслитерации различных имен (географических наименований, наименований фирм, предприятий, имен собственных), представленных на различных языках, использующих различные алфавиты на основе латиницы, кириллицы и других графических представлений символов.
Создание правил, соответствующих зачастую противоречивым, сложившимся под воздействием различных факторов традициям передачи иноязычных имен собственных в русских текстах крайне затруднительно. В нашей стране этой проблеме не уделялось должного внимания, что существенно затрудняло обработку данных в полиязычных информационных системах. Проведенные в 80-х годах работы по разработке стандартов по транслитерации латиницы в кириллицу создавали определенную базу нормирования представления латинизированных текстов русским алфавитом.
Однако процессы суверенизации республик разрушили достигнутые договоренности, а их переход на национальные языки еще более осложнил вопросы однозначной идентификации имен объектов.
Сложность идентификации усиливается рядом дополнительных факторов:
В принципе, перед разработчиками информационных систем республик возникла еще более сложная проблема создания многоязычных и многоалфавитных перечней наименований изделий, фирм, предприятий и других имен собственных, и каждая республика теперь будет решать эти проблемы самостоятельно и далеко не всегда успешно, что существенно осложнит проблемы идентификации объектов по их именам.
=
Дата публикования: 2015-01-10; Прочитано: 299 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!