Типи інформаційно-пошукової мови

Типи і види ІПМ

Спосіб завдання лексичних одиниць

Контрольовані - мови, словниковий склад яких задається і контролюється за допомогою словників і таблиць. До них відносять різні системи класифікації (УДК, ББК, класифікація Дьюї).

Мова предметних рубрик. На основі ієрархічної класифікації будують систематичні каталоги. На основі мови предметних рубрик будують предметні каталоги. Алфавітні каталоги - ручний пошук.

Дескрипторного ІПМ, а також мову ключових слів - автоматичний пошук.

Неконтрольовані - лексика не ставить словником, а будується на основі вибору термінів природної мови. Такі ІПМ широко почали застосовуватися останнім часом.

Порядок запису лексичних одиниць [ред | правити вікі-текст]

Некоордініруемие мови - що не допускають координації своїх лексичних одиниць (немає зв'язку між ними) ні в процесі індексування, ні в процесі пошуку. (Система розстановки книг в бібліотечному фонді, за інвентарними номерами).

Координовані ІПМ - мови, в яких лексичні одиниці зв'язується, координуються між собою або в процесі індексування або в процесі використання.

Предкоордініруемие - зв'язку між лексичними одиницями встановлюються перед пошуком.

Посткоордініруемие - коли зв'язки між лексичними одиницями встановлюються тільки при пошуку.

43. Правовий тезаурус.

правової тезаурус - це логіко-семантичне зібрання ключових слів і дескрипторів, що застосовуються в якості лінгвістичного забезпечення і використання АІПС правової інформації.

Інформаційно-пошукова мова. Правовий тезаурус.

Однією з важливих завдань правової інформатики є лінгвістичне забезпечення правотворчого процесу. Право не існує поза мовою.

Ст.2 Закону про інформацію відносить до засобів забезпечення автоматизованих інформаційних систем також і лінгвістичні засоби.

В системі лінгвістичних засобів забезпечення АІПС перше місце займає інформаційно-пошукова мова (ІПМ).

У широкому сенсі мова - це знакова система, яка використовується для збору, зберігання, обробки і передачі інформації.

ІПМ - це формалізований штучний мова, призначена для індексування документів, інформаційних запитів та опису фактів з метою їх подальшого зберігання та пошуку.

ІПМ по законодавству повинен забезпечувати:

Ефективну формалізацію правових норм і нормативних актів

Високу швидкість пошуку на комп'ютері інформації

Оптимальний переклад нормативного тексту з юридичної мови на мову, доступний ЕОМ

Мінімальний «шум», тобто зведення до мінімуму видачу комп'ютером зайвої інформації

Повноту інформаційного пошуку, тобто отримання всієї необхідної інформації для вирішення конкретних завдань правотворчості

Будь-яка інформація для того, щоб бути переробленої, повинна відповідним чином кодуватися, тобто переводитися на мову спеціальних символів або сигналів.

Теорія інформаційного пошуку розрізняє такі типи ІПМ:

Мови предметного типу - це алфавітно-предметні покажчики до збірок і окремих нормативних актів і широко поширені алфавітно-предметні рубрикатори.

При використанні цієї мови основна тема документа виражається одним або декількома типовими словами - рубриками. Наприклад, існують предметно-алфавітні покажчики до Конституції РФ, до ГК РФ.

Мова класифікаційного типу - являє собою класифікатор галузей законодавства.

Мова дескрипторного типу - має велику «семантичної силою», тобто здатний повністю передавати зміст нормативних актів, висловити комбінацією дескрипторів (ключове слово - об'єднує групу ключових слів) будь-яке поняття, характеризуються високим ступенем відображення змісту документів, наявністю ключових слів.

Дескрипторного ІПМ діляться на:

мови, в яких не розрізняються логіко-смислові відносини між поняттями

мови, які містять в своєму складі логіко-смислові відносини.

(Особливо) правової тезаурус - це логіко-семантичне зібрання ключових слів і дескрипторів, що застосовуються в якості лінгвістичного забезпечення і використання АІПС правової інформації.

Завдання - впорядкувати і привести в систему лексичні засоби, що використовуються в правотворчому процесі.

В інформатиці тезаурус виконує наступні функції:

використовується для організації інформаційного пошуку (інформаційно-пошуковий тезаурус)

використовується як засіб, що вимірює зміст повідомлення (тезаурус користувача - сукупність відомостей, якими володіє користувач)

виступає в якості найважливішого засобу пошуку латентної інформації

Існують тезауруси різних типів:

общеправовой (102 тисячі слів і словосполучень). Зараз не застосовується.

Тезаурус, спеціалізований по галузях права. (Наприклад, Eurovoc).

44. Індексація та рубріцірованіе правової інформації. 45. Нормування і кодування.

Підготовка правової інформації до машинної обробці:

нормування; кодування; індексування та рубріцірованіе.

У широкому сенсі під нормування розуміється опис певною сукупністю числових характеристик. Залежно від того, що використовується в якості характеристик виділяють два типи метризації: а) підрахунок; б) вимір.

При вимірі і підрахунку як засіб вираження використовуються натуральні числа. При вимірюванні використовуються одиниці міри.

Об'єктами вимірювання можуть виступати будь-які предмети матеріального світу, що володіють будь-якими властивостями, які можуть бути виміряні або характеризуються кількісними даними.

Під нормування правової інформації слід розуміти таку процедуру її обробки в результаті якої суб'єкт юридичної діяльності отримує кількісні характеристики тих чи інших параметрів об'єкта пізнання.

Характеристики, отримані в результаті вимірювання, можуть виражатися як в абсолютних величинах, так і у відносних.

Кодування правової інформації - це така операція, при якій певні дані замінюються скороченими умовними позначеннями (цифри, числа). Зворотна операція називається декодуванням.

Комбінацію символів називають кодом, а кількість символів, що входять в кодову операцію називають довжина коду.

Для кодування правової інформації використовується кілька способів: точковий, контурний, точково-зональний.

Рубріцірованіе - це процедура присвоєння певної теми нормативного акта або запиту відповідного індексу з рубрикатора, в якому за кожною темою закріплений свій індекс.

45. Нормування і кодування.

Нормування. У широкому плані під нормування зазвичай розуміється опис будь-якого об'єкта певною сукупністю числових характеристик. Безпосереднім об'єктом метризації, зокрема вимірювання, завжди є та чи інша фізична величина, зазвичай іменована параметром об'єкта пізнання. Ось чому дані, одержувані в результаті цієї процедури, правомірно називати параметричної або вимірювальної інформацією.

З огляду на це під нормування правової інформації слід розуміти таку процедуру її обробки, в результаті якої суб'єкт юридичної діяльності отримує кількісні характеристики тих чи інших параметрів об'єкта пізнання.

Залежно від того, що обирається в якості такої характеристики і що нею бажають висловити, розрізняють два види метризації:

- Підрахунок. При підрахунку як засіб вираження цікавлять нас даних використовують натуральні числа (наприклад, вказують, що в даному регіоні за названий період було виявлено 20 випадків порушення законності при розгляді цивільних справ в судах).

- Вимірювання. При вимірах як засіб вираження отриманих даних поряд з натуральним числом використовуються прийняті для даного виду вимірювань відповідні одиниці міри.

Нормування здійснюється за допомогою вимірювальних приладів [2].

- Кодування. У широкому сенсі під кодуванням розуміються операції заміни будь-яких даних (наприклад, текстових) скороченими умовними позначеннями, як правило, цифровими або символами [9, с. 251]. Зворотна операція називається декодуванням. Зазвичай ці операції використовуються як засіб представлення інформації, що характеризує індивідуальні особливості об'єкта або досліджуваної події, у вигляді послідовно розташованих символів абстрактного алфавіту. Комбінацію таких символів називають кодом, а їх кількість, що входить в певну кодову комбінацію, - її довжиною. Кодові символи можуть мати різну форму. Найчастіше це цифри, букви будь-якого алфавіту, а також різного роду умовні знаки і їх поєднання (точка і тире, математичні символи і т. П.).

Схожі статті