Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Сховища даних та методологія корпоративного документообігу



Суперечність між зростаючим обсягом знань й обмеженими можливостями системи документних комунікацій на традиційних носіях зумовлює необхідність введення в бібліотечний фонд електронних інформаційних ресурсів. Одним із напрямів діяльності сучасних бібліотек має стати формування у них зібрань електронних документів, надання до них локального або онлайн-доступу користувачам. Із впровадженням електронних інформаційних технологій бібліотеки одержали додаткові широкі можливості розкривати зміст наявних ресурсів шляхом створення сучасної системи каталогів та картотек, бібліографічних баз даних, що значно скорочують користувачам шлях до інформації. На сьогодні дедалі більша частина інформації, особливо наукової, з’являється, використовується та зберігається в електронному вигляді. Це дає змогу зберігати документну інформацію в компактному вигляді, оперативно й широко її поширювати.

Для вітчизняної бібліотечної діяльності, крім урахування цієї тенденції, інтернет-технології мають особливе значення ще й у зв’язку з традиційною проблемою фінансування, необхідною для комплектування бібліотечних фондів. І тому Інтернет дедалі більше стає джерелом бібліотечного комплектування. У зв’язку з цим постає не лише теоретична, а й практична необхідність вирішення технологічних питань, пов’язаних із залученням до бібліотечних фондів електронної інформації.

Г. Асєєв у статті «Методологія корпоративного документообігу: схеми і вимоги до них» розглянув схему типової системи електронного документообігу (СЕД), що складається із підсистеми збереження, яка здійснює занесення інформації про документи в систему, пошук документів за їхніми атрибутами, модифікацію інформації (поточне місце розміщення, статус виконання та ін.) та управління даними, систему розпізнавання текстів і друкованих форм та модуль маршрутизації. Зроблений аналіз загальних вимог СЕД: масштабованість, розподіленість, безпека і захищеність, зовнішній доступ до інформаційної системи збирання даних і управління та організація прав доступу до інформаційних ресурсів, модульність, відкритість, сутність тощо.

Основною системою документообігу є підсистема збереження. У першому наближенні це може бути база даних обліку документів у системах автоматизації діловодства. Клієнтське робоче місце забезпечує можливість занесення інформації про документи в систему, пошук документів за їхніми атрибутами, модифікацію інформації (поточне місце розташування, статус виконання та ін.) і управління даними.

У тому разі, якщо система документообігу містить документи або їхні образи, необхідне спеціальне середовище їхнього збереження. У найпростішому варіанті для збереження може виконуватися файлова система, у складнішому – спеціалізована система побудови архіву документів. База даних має містити інформацію про права доступу до документів, блокування та ін. При цьому можлива присутність систем мінімізації вартості збереження документів і оптимізації системи підтримки повнотекстового індексування. Клієнтські додатки, відповідно, повинні виконувати такі додаткові функції, як доступ до документів в архіві, підтримку блокування і зміни атрибутів документів, а також здійснювати повнотекстовий пошук.

Для введення документів у СЕД можна використовувати систему розпізнавання текстів і друкованих форм. При наявності в системі засобів маршрутизації, база даних зберігає додаткову інформацію про маршрути руху документів, поточний стан маршрутів тощо. Модуль маршрутизації здійснює безпосередню доставку документів на робочі місця користувачів і внесення інформації про зміну статусу документів у бази даних. Клієнтське робоче місце системи маршрутизації може безпосередньо не взаємодіяти з базою даних й архівом документів, а отримувати доступ до документів за допомогою засобів маршрутизації, зокрема, електронної пошти [29].

У статті (назвати автора) «Методологія корпоративного документообігу: побудова CASE-моделей офісних інформаційних систем» викладені принципи створення інформаційної системи документообігу офісу, орієнтовані на творче використання і модернізацію існуючих бізнес-процесів документопотоків. Описано існуючі CASE-засоби, що забезпечують можливість не розробляти заново різноманітні компоненти документообігу електронного офісу [29].

Володіючи інформацією про особливості організації бізнес-процесів компанії-замовника, можна дійти висновків, що при побудові CASE-моделей бібліотечних інформаційних систем варто враховувати такі фактори:

– впровадження інформаційних технологій має базуватися на аналізі та реорганізації бізнес-процесів документообігу;

– необхідне використання спеціальних методологій та інструментальних засобів, що дають змогу установити порядок створення інформаційної системи документообігу, визначити вимоги до необхідних ресурсів і розподілу робіт між розроблювачами на етапах життєдіяльності системи, а також оцінити ефективність пропонованих рішень [32].

Але питання розробки бібліотечних інформаційних систем не можна до кінця зрозуміти, якщо не будуть висвітлені основні фази CASE-методології концептуального проектування систем електронного документообігу (СЕД). У іншій статті автор аналізує такі фази: передпроектне обстеження об’єкта; функціональна декомпозиція процесів; розроблення функціональної структури системи управління процесами в об’єкті діяльності, єдиної структури управління автоматизованим комплексом, обсягу управляючих впливів і вимог до інтерфейсів користувачів, виявлення складу користувачів та їхніх узагальнених функцій і розроблення технічного завдання на апаратно-програмний комплекс системи.

У статті «Методологія створення сховищ даних: проблема виявлення нового знання методами Knowledge Discovery in Databases» розглянуті проблеми виявлення нового знання у сховищах даних електронних документів – Knowledge Discovery in Databases і основний крок цього процесу – Data Mining – розробка даних або, дослівно, «добування даних».

Knowledge Discovery in Databases – аналітичний процес дослідження людиною великого обсягу інформації із залученням засобів автоматизованого дослідження даних з метою виявлення прихованих у них структур або залежностей. У статті зрозглянуто процеси дослідження великого обсягу інформації із залученням засобів Knowledge Discovery in Databases, що містять у собі проблеми використання джерел даних, збереження даних, підготовки вихідного набору даних, трансформації і нормалізації даних, висування гіпотез, що служитимуть базою застосування методів Data Mining (побудова моделей аналізу, використання моделі, спостереження за нею, постопрацювання даних та інтерпретація отриманих результатів, висновки систем звітності). Запропонована послідовність дій не залежить від предметної області, тому її можна використовувати для будь-якої сфери діяльності [26]. Наведено також деякі рекомендації, дотримуючись яких, можна підготувати якісні відомості в потрібному для аналізу обсязі. Послідовність дій при їхньому підборі досить проста і логічна, однак користувачі найчастіше допускають одні й ті самі тривіальні помилки [23].

У статті «Концепція електронного сховища даних» автор (хто?) наголошує, що у зв’язку з появою величезної кількості оперативної і довідкової інформації погіршується якість управління електронними документами. Виходячи з цих умов, для своєчасного прийняття непередбачених та нестандартних рішень і прискорення доступу до даних, подається концепція оптимально організованого сховища даних, що забезпечує максимально швидкий і комфортний доступ до необхідної інформації [28].

До проектування сховища даних ставляться такі вимоги:

– структура даних сховища має бути зрозуміла користувачам;

– повнота і ймовірність збереження даних;

– потрібно виділити інформацію, що регулярно модифікується: щодня, щотижня, щокварталу;

– підтримка внутрішньої несуперечності даних;

– слід спростити вимоги до запитів з метою вилучення тих, що могли б потребувати множинних тверджень у традиційних реляційних систем управління базами даних;

– підтримка високої швидкості одержання даних зі сховища;

– потрібно забезпечити підтримку складних запитів, що вимагають послідовного опрацювання тисяч або мільйонів записів;

– можливість одержання і порівняння так званих зрізів даних;

– наявність зручних утиліт перегляду даних у сховищі;

– підтримка якісного процесу поповнення даних [30].

У черговій статті (хто автор?) «Методологія створення сховищ даних: стандарти та моделювання» представлено основну частину термінології, уживаної при створенні електронних сховищ даних. Розглянуто стандарти моделей сховищ даних, названих схемами «зірка» і «сніжинка», подано рекомендації щодо їхнього використання [30]. Технологія багатомірних баз даних все частіше буде застосовуватися там, де результати аналізу прямо передаються в інші системи, тим самим виключаючи участь людини в цьому процесі. Цей контекст у сукупності з необхідністю постійного відновлення висуває жорсткіші вимоги до продуктивності, яким не відповідає сучасна технологія [33]. Ці питання розглянуті у наступній публікації «Архітектура корпоративного сховища даних». Загальну ідею можна змалювати у такий спосіб: організовується розгортання високопродуктивної мережі, що включає графічні робочі станції й потужні сервери введення та опрацювання інформації. Для введення документів з паперових носіїв низької якості використовуються промислові сканери потокового ведення й відповідні українізовані (або русифіковані) програмні засоби. Система забезпечує ефективне індексування й повнотекстовий пошук неструктурованої інформації великого обсягу. Дані, необхідні для пошуку документів, зберігаються у високопродуктивній відмовостійкій системі пам’яті, а графічні образи документів – у вигляді зображень на носіях, що характеризуються тривалим часом зберігання й дешевизною. Автор розглядає основні функції сховища даних: сканування; розпізнавання й коректування помилок; створення та міграція електронних документів й образів; індексування документів; оперативний пошук і відображення документів; їхній аналіз; управління функціонування системи [20].

Для реалізації цих функцій у сховищах даних необхідні компоненти введення, зберігання, індексування, пошуку і відображення інформації, аналізу, управління потоками, адміністрування й науково-технічного супроводу. Специфіка впровадження системи електронного архівування полягає в тому, що, насамперед, необхідно ввести в базу даних системи повний обсяг документів. Це надзвичайно тривалий і трудомісткий процес, що потребує максимальної автоматизації – відсторонення оператора від будь-якої участі в процесі введення, розпізнавання, коректування та індексування документів. Із цим пов’язана інша специфічна риса сховища даних – забезпечення повнотекстового пошуку. Побудова і підтримка систем атрибутивного пошуку, характерного для систем управління документообігом, виявляються неприйнятними через тимчасові та цінові обмеження.

Розглянуто такий приклад. Припустимо, паперовий архів нараховує 50 млн документів. На перевірку одного розпізнаного документа, класифікацію-рубрикацію, введення атрибутів оператор, у середньому, витрачає дві хвилини. Отже, для введення всіх документів у режимі стандартного робочого тижня потрібно 1112 років. З іншого боку, при автоматичному введені документів основною вузькою ланкою системи буде продуктивність сканерів і потужність сервера, що виконує розпізнавання й індексування. З урахуванням оптимізації потоків підсистеми введення можна чекати, що аналогічний обсяг буде повністю виконаний за 5-15 років, тобто ще за життя оператора.

Іншою відмінністю й важливою особливістю сховища даних є те, що воно включає як засоби оперативного пошуку інформації, так і засоби оперативного аналізу інформації. Функціонування засобів оперативного пошуку базується на використанні ідеології багатомірних кубів, тобто кожне значення відповідає декільком вимірам. Таким чином, стає можливим одержання інформації «у декількох вимірах», що вкрай важливо у випадку запиту складного виду [21].

Звичайно, бібліотеки змінюються швидко й електронні інформаційні ресурси займають у них домінуюче місце. Це неминуче приводить до змін у бібліотечній роботі, бо електронні форми об’єднують процеси бібліотечної роботи – комплектування, обробку, зберігання й обслуговування – в один, ставлячи перед бібліотекарем нові завдання, серед яких уміння орієнтуватися та керувати інформаційними потоками, створити можливості для користувачів оперативно отримувати необхідну інформацію з будь-якої точки земної кулі. Але за умови активного впровадження новітніх інформаційних технологій у практику роботи бібліотек у жодному разі не повинна застосовуватися практика повної заміни друкованих видань електронними аналогами. Сьогодні є очевидним, що електронне й друковане середовище мають різні цільові орієнтації. Бібліотека ж має можливість об’єднати і те, і друге, хоча електронні ресурси дають їй змогу не тільки виконувати функції зберігання, але й орієнтувати читачів в інформаційному середовищі, надавати допомогу в пошуку необхідних знань. Але лише з поєднанням традиційної бібліотечної практики та інноваційних технологій інформаційного обслуговування всіх категорій сучасних користувачів працівники бібліотеки зможуть задовольнити запити суспільства в повному, оперативному та достовірному отриманні інформації.





Дата публикования: 2015-07-22; Прочитано: 799 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...