Статус, категорії і побудова класифікаторів; методи класифікації та кодування інформації
Класифікатор являє собою систематизований звід стандартних кодів і найменувань класифікаційних угруповань і (або) об'єктів інформації, побудованих відповідно до встановлених системами класифікації та кодування інформації.
За своїм статусом класифікатори є нормативними документами по стандартизації, які розробляються за певними правилами, затверджуються (приймаються) в установленому порядку і є обов'язковими для застосування у відповідних сферах управління.
Загальноукраїнські класифікатори затверджуються (приймаються) ГосстандартомУкаіни і застосовуються, як правило, в загальноукраїнських уніфікованих формах документів, які згруповані в такі уніфіковані системи:
§ організаційно-розпорядчої документації (02);
§ первинної облікової документації (03);
§ банківської документації (04);
§ фінансової, облікової та звітної бухгалтерської документації бюджетних установ і організацій (05);
§ звітно-статистичної документації (06);
§ облікової та звітної бухгалтерської документації підприємств (07);
§ документації з праці (08);
§ документації Пенсійного фонду України (09).
Після назв уніфікованих систем документації в дужках наведені їх коди за Загальноукраїнського класифікатора управлінської документації (ОКУД), в якому вони в установленому порядку проходять державну реєстрацію.
Галузеві класифікатори затверджуються відповідними федеральними органами виконавчої влади і застосовуються, як правило, в галузевих уніфікованих формах документів.
Класифікатори підприємств затверджуються підприємствами і застосовуються, як правило, в уніфікованих формах документів підприємств.
Для оцінки максимального обсягу інформації в класифікаторі використовується показник ємності класифікатора. Цей показник характеризує найбільшу кількість позицій, яке може містити класифікатор, і дозволяє оцінити обсяг інформації, який може бути закодований в класифікаторі, виходячи з усіх можливих кодових комбінацій з урахуванням прийнятої системи кодування і структури коду. Крім того, використовується показник резервної ємності, тобто кількості вільних позицій у класифікаторі, який відображає можливість розширення класифікатора за рахунок включення в нього нових позицій.
Кожна позиція класифікатора складається, як правило, з найменування та коду класифікаційної угруповання або об'єкта класифікації. До складу позиції класифікатора можуть включатися лише великі червоні літери (КЧ) для контролю правильності проставлених знаків коду і додаткові ознаки для характеристики класифікаційної угруповання.
Використання загальноукраїнських класифікаторів в статистичній практиці дозволяє здійснювати збір та обробку статистичної інформації в строго заданих розрізах відповідно до меж і обсягами змістовного наповнення класифікаційних угруповань.
Класифікація (класифікація) об'єктів інформації (продукція, послуги, об'єкти адміністративно-територіального поділу та ін.) Проводиться за властивим об'єктам істотним характеристикам і властивостями, які називаються ознаками класифікації. Ознаки класифікації можуть мати кількісне (обсяг, питома вага, стаж, вік) або якісне (вид діяльності, спеціальність, професія) вираз.
Сукупність методів, правил і ознак класифікації утворює систему класифікації.
В ОКП, наприклад, система класифікації продукції побудована з використанням ієрархічного методу класифікації.
Цей метод являє собою послідовне поділ безлічі об'єктів на підлеглі класифікаційні угруповання. Спочатку безліч об'єктів ділиться по деякому обраною ознакою (підставі поділу) на великі угруповання, потім кожна з цих угруповань ділиться на ряд наступних угруповань за іншою ознакою, з метою подальшої конкретизації об'єкта класифікації. Таким чином, між класифікаційними угрупованнями встановлюється підпорядкованість (ієрархія).
Для класифікації продукції використовуються, зокрема, такі ознаки: галузева приналежність, призначення, область застосування, принцип дії, конструктивні особливості, що використовується для виготовлення спосіб і матеріал.
Кожен етап класифікації, в результаті якого за певною ознакою утворюється сукупність класифікаційних угруповань, називається щаблем класифікації.
Число ступенів (рівнів) класифікації характеризує глибину класифікації і залежить від ступеня конкретизації угруповань і числа ознак, необхідних для вирішення конкретних завдань.
При ієрархічному методі класифікації необхідно дотримуватися певних правил:
§ розподіл кожної класифікаційної угруповання має проводитися тільки по одній підставі;
§ одержувані в результаті поділу угруповання не повинні перетинатися за своїм змістом, щоб не дублювалася інформація;
§ класифікація має забезпечувати підсумовування нижчестоящих угрупувань.
Основні переваги ієрархічної класифікації полягають в її значною інформаційною ємності, традиційності і в можливості створення для об'єктів класифікації мнемонічних кодів, що несуть смислове навантаження.
Істотним недоліком ієрархічної системи класифікації є слабка гнучкість структури, обумовлена фіксованістю постійних ознак (підстав розподілу) і заздалегідь встановленим порядком їх слідування, що не допускає включення при відсутності резервної ємності нових об'єктів і класифікаційних угруповань. Внаслідок цього зміна хоча б однієї ознаки веде до перерозподілу класифікаційних угруповань. Тому в класифікаторах, побудованих за ієрархічним методом, повинні передбачатися значні резервні ємності. Крім того, цей метод класифікації не дозволяє агрегувати об'єкти і здійснювати інформаційний пошук по будь-якому довільній комбінації ознак, а також ускладнює машинну обробку інформації через нестандартного виділення і розташування конкретних ознак в різних гілках класифікації.
Іншим методом, використовуваним для побудови класифікаційної структури класифікаторів, є Фасетноє метод, що полягає в паралельному поділі множини об'єктів на незалежні класифікаційні угруповання. У цьому методі класифікаційне безліч об'єктів інформації описується набором незалежних ознак (фасетів), які не мають жорсткої взаємозв'язку один з одним і можуть використовуватися окремо для вирішення різних завдань.
Наприклад, в загальноукраїнському класифікаторі інформації про населення (ОКИН) використовуються наступні фасети: стать, громадянство, національність, мову, спорідненість і ін. При цьому назва фасета збігається з назвою ознаки, за значеннями якого в фасеті представлений перелік відповідних об'єктів класифікації - елементів классифицируемого безлічі .
Ємність такої класифікації залежить від числа фасетів і від кількості значень ознак в фасеті.
При побудові фасетної класифікації необхідно дотримуватися таких основних правил:
§ значення різних фасетів не повинні перетинатися (принцип виключення фасетів);
§ зі всіляких фасетів, що характеризують классифицируемое безліч об'єктів, повинні відбиратися і фіксуватися тільки. істотні для вирішення конкретних завдань.
Основна перевага фасетной класифікації обумовлено гнучкістю структури її побудови. Зміни в будь-якому з фасетів не роблять істотного впливу на інші фасети. Більша гнучкість фасетной класифікації обумовлює її пристосованість до змін характеру завдань, для вирішення яких вона створюється. Фасетная класифікація дозволяє не тільки утворювати нові класифікаційні угруповання в наявних фасетах, але і включати нові і виключати старі фасета. Гнучкість фасетной класифікації дає можливість агрегувати об'єкти і здійснювати інформаційний пошук по будь-якому поєднанню фасетів.
Застосування фасетной системи дозволяє здійснювати блокове побудова класифікаторів з виділенням ідентифікаційного блоку.
Недоліки фасетной класифікації - неповне використання ємності, обумовлене відсутністю на практиці багатьох з можливих поєднань фасетів, і нетрадиційність в застосуванні.
Залежно від специфіки інформації і області застосування класифікаторів в них можливе застосування різних сполучень методів класифікації.
У процесі кодування об'єктам класифікації та їх угрупованням за певними правилами привласнюються цифрові, літерні або буквено-цифрові коди (кодові позначення), що забезпечують їх однозначну ідентифікацію за допомогою знаків (символів).
Кодування призначене для формалізованого опису заданої множини об'єктів, яке дозволяє виробляти автоматизовану обробку інформації. При описі процесу кодування інформації використовують певні терміни і поняття.