модель представлення
ПРОБЛЕМА ЗАБЕЗПЕЧЕННЯ повинні суперечити одна одній,
ПОВНОТИ І ЦІЛІСНОСТІ ДАНИХ У базах ДАНИХ
АСУ ЗВ'ЯЗКОМ ТА ШЛЯХИ ЇЇ ВИРІШЕННЯ
С.В. Березін, І.Б. Саєнко
Військовий університет зв'язку
Abstract - At mapping in relational database management systems of such structurally difficult object of handle as a territorial communication system, which during operation is capable dynamically to change not only value of attributes of the registration, but also structure of internal links, physical structure, with high probability there can be a situation, when the information from a DBMS received by the person, accepting solutions, not adequately mirrors the controlled object.
Thus, a urgent problem of the relational databases used in atomized control systems, is the problem of support of quality of the data necessary for acceptance of adequate administrative solutions.
Сучасна територіальна система зв'язку (ТСС) з точки зору управління являє собою складний ієрархічний об'єкт, який характеризується високою динамікою зміни свого стану. Під иерархичностью ТСС розуміється багатоступінчастий, пірамідальний принцип її побудови з підпорядкуванням нижчих щаблів, підсистем, вищим.
Специфіка структури ТСС, наявність великої кількості підсистем призводить до того, що автоматизована система управління (АСУ) зв'язком будується по багатоступінчатому принципом з розгалуженою системою інформаційних зв'язків як всередині окремих підсистем ТСС, так і між ними. Функції контролю та управління при цьому розподіляються на кілька рівнів з пріоритетом керуючих впливів старших рівнів.
Автоматизована система управління зв'язком як інформаційна система реалізує розподілений підхід в управлінні і базується на застосуванні концепції баз даних.
Оперативне забезпечення посадових осіб, які приймають рішення з управління ТСС актуальною, достовірною інформацією є найважливішою функціональною завданням АСУ зв'язком. Ефективність управління, таким чином, безпосередньо залежить від якості даних в базах даних АСУ зв'язком.
Сучасне покоління систем управління базами даних (СКБД), що застосовуються в АСУ зв'язком, практично повністю базується на класичній реляційної моделі представлення даних, яка в тій чи іншій мірі розвивається і модифікується в різних інформаційних системах.
Як відомо, реляційна модель даних має ряд переваг і недоліків. До достоїнств можна віднести математичну основу реляційної моделі представлення даних, що базується на апаратах теорії множин і формальної логіки першого порядку. Реляційна модель являє собою добре збалансоване рішення з точки зору відповідності застосовуваного математичного апарату одержуваних від цього переваг. Інтуїтивна зрозумілість реляційного підходу рядовому оператору автоматизованої системи управління системи. Користувачеві інформаційної системи в ході експлуатації немає необхідності вивчати і глибоко вникати в математичні принципи, що лежать в основі функціонування системи.
Основу реляційної моделі складають досить прості і зрозумілі об'єкти: таблиць (відносини), записи (кортежі), поля (атрибути). Ці об'єкти плоскі, операції над ними зрозумілі пересічному користувачеві на побутовому рівні.
Недоліки реляційного підходу є зворотним боком його достоїнств. Представляти інформацію у вигляді регулярних плоских таблиць, в яких кожен рядок має одну і ту ж структуру, а в стовпчиках можуть зберігатися тільки прості дані атомарної структури - досить просто. Але для зберігання складнострукурованих інформації при використанні реляційних баз даних виникають складності. Вимога нормалізації відносин призводить до того, що складні об'єкти відображаються набором плоских таблиць і при виконанні складного запиту СУБД виконує велику кількість операцій об'єднання для побудови універсального відносини. Як відомо, операція об'єднання є найбільш трудомісткою і ресурсномісткої в СУБД. Отже при відображенні в реляційних СУБД такого структурно складного об'єкта управління як ТСС, який в процесі функціонування здатний динамічно змінювати не тільки значення атрибутів обліку, але і структуру внутрішніх зв'язків, фізичну структуру, з високою ймовірністю може виникнути ситуація, коли інформація від СУБД, що отримується особою , які приймають рішення, які не адекватно відображає керований об'єкт.
Таким чином, актуальною проблемою реляційних СУБД, що застосовуються в АСУ зв'язком, є проблема забезпечення якості даних, необхідних для прийняття адекватних управлінських рішень.
Традиційно для оцінки якості даних в СУБД використовуються наступні показники: несуперечливість, повнота і цілісність. В даний час не існує єдиного підходу як до оцінки надійності автоматизованих систем управління, так і до оцінки цілісності, повноти і несуперечності даних.
Поняття цілісності, повноти і несуперечності можуть тлумачитися по-різному стосовно до різних об'єктів, оскільки вони суттєво залежать від природи об'єкта.
Несуперечливість даних визначається як в класичній логіці (неможливість виведення в одній системі двох взаємовиключних тверджень) і означає, що однакові атрибути одних і тих же об'єктів збігаються. Отже, наприклад, дублювання даних в базі підвищує ризик суперечливості.
Несуперечливість - комплексний показник якості бази даних, що виявляється в динаміці її ведення, коли виникають ланцюжки коригувань, в процесі виконання яких база даних знаходиться в суперечливому стані. Цей показник безпосередньо пов'язаний з обмеженнями цілісності бази даних, складністю схеми даних. Підвищення несуперечності бази даних призводить до підвищення показника захищеності інформаційної системи, в якій ця база застосовується. Фактично, в динаміці ведення, база даних автоматизованої системи управління постійно знаходиться в суперечливому стані. Тоді, як показник несуперечності бази даних в даний момент часу може бути вибрано відношення кількості несуперечливих даних (записів таблиць бази даних) до загальної кількості даних в базі (записів в таблицях бази даних). Метою досліджень, що проводяться в цьому напрямку, є пошук рішень по мінімізації часу знаходження бази даних в суперечливому стані.
Особливої актуальності питання забезпечення несуперечності бази даних набувають в тому випадку, коли база даних автоматизованої системи управління зв'язком будується по розподіленої технології, тобто коли існує безліч незалежних і рознесених територіально джерел оновлення та зберігання даних.
Повнота даних в базі визначається як ступінь відповідності кількості об'єктів обліку реально необхідного для прийняття адекватного рішення і передбачає, що всі запити користувача в рамках вирішення завдання ефективного управління системою повинні бути задоволені. Щоб формалізувати цей критерій має бути поданий вимоги до галузі використання також в термінах формальної логіки, мова предикатів цілком прийнятний для цих цілей.
У реляційних СУБД існують механізми підтримки несуперечності, повноти і цілісності даних (наприклад, механізм транзакцій і блокувань). Транзакція або логічна одиниця роботи зі зміни даних в декількох зв'язаних таблицях - це в загальному випадку послідовність ряду таких операцій, які перетворять деякий несуперечливе, повне і цілісне стан бази даних в інше несуперечливе, повне і цілісне стан, але не гарантують збереження якості за цими показниками до всіх проміжних моменти часу.
Ніхто, крім користувача, що генерує ту чи іншу послідовність SQL-пропозицій, не може знати про те, коли може виникнути стан бази даних, що не відповідає вимогам за вказаними вище показниками і після виконання яких SQL-пропозицій воно зникне, тобто база даних знову стане актуальною. Крім того, застосування механізму транзакцій і блокувань призводить до зниження якості за іншими показниками, не менш важливим з точки зору управління (оперативність і достовірність, наприклад).
Почасти, таке положення справ складається через обмеження реляційної моделі представлення даних. Воно посилюється в разі розподілених баз даних, де до зазначених проблем додається ще й необхідність вирішення завдання оптимізації розподілу даних по вузлах розподіленої бази. Неоптимальний розміщення даних призводить до підвищення службового трафіку по підтримці бази в актуальному, тобто несуперечливому, повному і цілісному стані, що також призводить до зниження продуктивності системи в цілому. Більш ефективно проблему забезпечення несуперечності бази даних можна вирішити за рахунок застосування розширеної реляційної моделі представлення даних для побудови баз даних інформаційних систем. Дослідження в цій області показують, що алгоритми забезпечення цілісності і несуперечності даних в розширених реляційних моделях представлення даних дозволяють забезпечити високі показники по несуперечності без зниження якості інших показників.