Кодування інформації

У процесі кодування об’єктів класифікації їх групуванням і ознакам за певними правилам присвоюють цифрові, літерні чи літерно-цифрові коди.

Кодування – утворення і присвоєння коду класифікаційному групуванню чи об’єкту класифікації.

Система кодування – це сукупність методів і правил кодування класифікаційних групувань і об’єктів класифікації заданої множини.

Код – це знак чи сукупність знаків, прийнятих для позначення класифікаційного групування чи об’єкта класифікації.

Код і його структура характеризуються алфавітом, основою і довжиною.

Структура коду – це умовне позначення складу і послідовності розміщення знаків у коді.

Розряд коду – позиція знаку в коді.

Алфавіт коду – система знаків, яка прийнята для утворення коду.

Основа коду – кількість знаків у алфавіті коду.

Довжина коду – кількість знаків у коді без урахування пропусків.

За державним стандартом (ГОСТ 6.01.–87 «Единая система класси-фикации и кодирования технико-экономической информации. Основные положения».– М.: Изд-во стандартов, 1987) є чотири методи кодування: порядковий, серійно-порядковий, послідовний і паралельний.

Усі ці методи розглянемо на прикладі кодування студентів академічної групи з визначенням ознаки статі. Дані розмістимо в табл. 7.1.

Таблиця 7.1

Кодування академічної групи з визначенням ознаки статі

Список групи	Порядковий	Серійно-порядковий	Послідовний	Паралельний
1. Абрамов 2. Сидорова 3. Рогачова 4. Борисов . . . 24. Шутов 25. Юрова
26. Волошин

Порядковий метод кодування – створення коду із чисел натурального ряду і його привласнення. Найбільш простий і повний, однозначний.

На основі максимальної кількості об’єктів, які класифікуються, визначається кількість розрядів для ознаки і всього коду.

Так, у групі 25 студентів – потрібна довжина коду при десятковій основі у два розряди. Присвоїмо коди студентам у таблиці.

Серійно-порядковий метод кодування – створення коду із чисел натурального ряду, із закріпленням окремих серій чи діапазонів цих чисел за об’єктами класифікації з однаковими ознаками і його привласнення. Використовується для двоознакових номенклатур.

При визначенні кількості розрядів для коду беруть до уваги максимальну кількість об’єктів для найбільшої серії чи діапазону і добавляють резервні позиції для кодування нових об’єктів. Їх кількість визначають на основі обстеження проблемної сфери чи беруть 25 % найбільшої кількості об’єктів.

У групі 17 дівчат і 8 хлопців. Для кодування найбільшої серії (дівчата) потрібен код із двух розрядів.

8 – хлопців 01 – 08, 3 розряди резервні. Тому 01 – 11.

17 – дівчат 12 – 29, 4 розряди резервні. Тому 12 – 33.

Присвоїмо коди студентам у таблиці.

Ці два коди повністю ідентифікують об’єкт, але не віддзеркалюють ознакову інформацію про нього в коді і здебільшого використовуються для передавання інформації на відстані. Їх особливість – незалежність від методів класифікації, які використовуються, і суті розв’язуваних задач, складність при автоматизованій обробці (групування з подібними ознаками, підсумовування за групою об’єктів).

Послідовний метод кодування – це створення коду класифіка-ційного групування і (чи) об’єкта класифікації з використанням кодів послідовно розміщених підпорядкованих групувань, які отримані при ієрархічному методі класифікації, і його привласнення.

Переваги послідовного методу: простота побудови коду, велика місткість при великій інформативності, можливість отримання результатів по вищих (старших) розрядах.

Недоліки: велика кількість знаків у коді і складність побудови задач.

Паралельний метод кодування – це створення коду класифіка-ційного групування і (чи) об’єкта класифікації з використанням кодів незалежних групувань, які отримані при фасетному методі класифікації, і його привласнення.

Переваги паралельного методу: добра пристосованість для автоматизованої обробки і розв’язання техніко-економічних задач, характер яких постійно змінюється, фасетна побудова уможливлює стандартизацію.

Недоліки: обмежені можливості ідентифікації об’єктів, велика надмірність, неповне використання обсягу створеної класифікації.

Ці методи дають істотну ознакову інформацію про об’єкт, але мають обмежені можливості ідентифікувати їх.

Як методи класифікації, так і методи кодування самостійно практично не застосовуються. Аби скористатися перевагами різних методів, на практиці використовують різні комбінації методів класифікації та кодування.

Можливі комбінації визначаються їх взаємозв’язком, який дає певні конкретні структури, що використовуються у відповідних класифікаторах. Вибір тієї чи іншої комбінації залежить від призначення класифікатора і конкретних задач, у яких він буде використовуватись.

У документації з інформаційного забезпечення РД 50–34.698–90 (розділ 5 «Требования к содержанию документов с решениями по инфор-мационному обеспечению») складається документ «Побудова системи класифікації і кодування» і «Опис систем класифікації і кодування», в якому по кожному об’єкту, який класифікується, має бути наведено опис методу кодування, структуру і довжину коду, вказівки про систему класифікації та інші відомості на вибір розробника.

Вимоги до кодів:

1. Забезпечення розв’язання всіх задач системи при мінімумі їх довжини.

2. Єдність кодів на всіх рівнях управління.

3. Структура коду має забезпечувати групування інформації у необхідних розрізах.

4. Зміст номенклатур повинен відповідати вимогам державних стандартів чи керівних методичних матеріалів.

5. Забезпечення інформаційного сполучення взаємопозв’язаних систем.

6. Автоматичний контроль помилок.

Кодування інформації виконується такими способами:

1) ручним проставленням у повідомленнях того чи іншого коду поряд з назвою об’єктів номеклатур;

2) друкарським – ряд номенклатур кодується в процесі виготов-лення бланків носіїв інформації (код складу, код операції руху матеріалів, код документа і т.п.);

3) автоматизованим – виведенням коду на екран з масиву;

4) на спеціальному обладнанні, яке дає змогу автоматично кодувати інформацію.

Потрібно створювати спеціальні програмні засоби, які автома-тизують процес їх побудови і використання.