Типи інформаційно-пошукової мови
Типи і види ІПМ
Спосіб завдання лексичних одиниць
Контрольовані - мови, словниковий склад яких задається і контролюється за допомогою словників і таблиць. До них відносять різні системи класифікації (УДК, ББК, класифікація Дьюї).
Мова предметних рубрик. На основі ієрархічної класифікації будують систематичні каталоги. На основі мови предметних рубрик будують предметні каталоги. Алфавітні каталоги - ручний пошук.
Дескрипторного ІПМ, а також мову ключових слів - автоматичний пошук.
Неконтрольовані - лексика не ставить словником, а будується на основі вибору термінів природної мови. Такі ІПМ широко почали застосовуватися останнім часом.
Порядок запису лексичних одиниць [ред | правити вікі-текст]
Некоордініруемие мови - що не допускають координації своїх лексичних одиниць (немає зв'язку між ними) ні в процесі індексування, ні в процесі пошуку. (Система розстановки книг в бібліотечному фонді, за інвентарними номерами).
Координовані ІПМ - мови, в яких лексичні одиниці зв'язується, координуються між собою або в процесі індексування або в процесі використання.
Предкоордініруемие - зв'язку між лексичними одиницями встановлюються перед пошуком.
Посткоордініруемие - коли зв'язки між лексичними одиницями встановлюються тільки при пошуку.
43. Правовий тезаурус.
правової тезаурус - це логіко-семантичне зібрання ключових слів і дескрипторів, що застосовуються в якості лінгвістичного забезпечення і використання АІПС правової інформації.
Інформаційно-пошукова мова. Правовий тезаурус.
Однією з важливих завдань правової інформатики є лінгвістичне забезпечення правотворчого процесу. Право не існує поза мовою.
Ст.2 Закону про інформацію відносить до засобів забезпечення автоматизованих інформаційних систем також і лінгвістичні засоби.
В системі лінгвістичних засобів забезпечення АІПС перше місце займає інформаційно-пошукова мова (ІПМ).
У широкому сенсі мова - це знакова система, яка використовується для збору, зберігання, обробки і передачі інформації.
ІПМ - це формалізований штучний мова, призначена для індексування документів, інформаційних запитів та опису фактів з метою їх подальшого зберігання та пошуку.
ІПМ по законодавству повинен забезпечувати:
Ефективну формалізацію правових норм і нормативних актів
Високу швидкість пошуку на комп'ютері інформації
Оптимальний переклад нормативного тексту з юридичної мови на мову, доступний ЕОМ
Мінімальний «шум», тобто зведення до мінімуму видачу комп'ютером зайвої інформації
Повноту інформаційного пошуку, тобто отримання всієї необхідної інформації для вирішення конкретних завдань правотворчості
Будь-яка інформація для того, щоб бути переробленої, повинна відповідним чином кодуватися, тобто переводитися на мову спеціальних символів або сигналів.
Теорія інформаційного пошуку розрізняє такі типи ІПМ:
Мови предметного типу - це алфавітно-предметні покажчики до збірок і окремих нормативних актів і широко поширені алфавітно-предметні рубрикатори.
При використанні цієї мови основна тема документа виражається одним або декількома типовими словами - рубриками. Наприклад, існують предметно-алфавітні покажчики до Конституції РФ, до ГК РФ.
Мова класифікаційного типу - являє собою класифікатор галузей законодавства.
Мова дескрипторного типу - має велику «семантичної силою», тобто здатний повністю передавати зміст нормативних актів, висловити комбінацією дескрипторів (ключове слово - об'єднує групу ключових слів) будь-яке поняття, характеризуються високим ступенем відображення змісту документів, наявністю ключових слів.
Дескрипторного ІПМ діляться на:
мови, в яких не розрізняються логіко-смислові відносини між поняттями
мови, які містять в своєму складі логіко-смислові відносини.
(Особливо) правової тезаурус - це логіко-семантичне зібрання ключових слів і дескрипторів, що застосовуються в якості лінгвістичного забезпечення і використання АІПС правової інформації.
Завдання - впорядкувати і привести в систему лексичні засоби, що використовуються в правотворчому процесі.
В інформатиці тезаурус виконує наступні функції:
використовується для організації інформаційного пошуку (інформаційно-пошуковий тезаурус)
використовується як засіб, що вимірює зміст повідомлення (тезаурус користувача - сукупність відомостей, якими володіє користувач)
виступає в якості найважливішого засобу пошуку латентної інформації
Існують тезауруси різних типів:
общеправовой (102 тисячі слів і словосполучень). Зараз не застосовується.
Тезаурус, спеціалізований по галузях права. (Наприклад, Eurovoc).
44. Індексація та рубріцірованіе правової інформації. 45. Нормування і кодування.
Підготовка правової інформації до машинної обробці:
нормування; кодування; індексування та рубріцірованіе.
У широкому сенсі під нормування розуміється опис певною сукупністю числових характеристик. Залежно від того, що використовується в якості характеристик виділяють два типи метризації: а) підрахунок; б) вимір.
При вимірі і підрахунку як засіб вираження використовуються натуральні числа. При вимірюванні використовуються одиниці міри.
Об'єктами вимірювання можуть виступати будь-які предмети матеріального світу, що володіють будь-якими властивостями, які можуть бути виміряні або характеризуються кількісними даними.
Під нормування правової інформації слід розуміти таку процедуру її обробки в результаті якої суб'єкт юридичної діяльності отримує кількісні характеристики тих чи інших параметрів об'єкта пізнання.
Характеристики, отримані в результаті вимірювання, можуть виражатися як в абсолютних величинах, так і у відносних.
Кодування правової інформації - це така операція, при якій певні дані замінюються скороченими умовними позначеннями (цифри, числа). Зворотна операція називається декодуванням.
Комбінацію символів називають кодом, а кількість символів, що входять в кодову операцію називають довжина коду.
Для кодування правової інформації використовується кілька способів: точковий, контурний, точково-зональний.
Рубріцірованіе - це процедура присвоєння певної теми нормативного акта або запиту відповідного індексу з рубрикатора, в якому за кожною темою закріплений свій індекс.
45. Нормування і кодування.
Нормування. У широкому плані під нормування зазвичай розуміється опис будь-якого об'єкта певною сукупністю числових характеристик. Безпосереднім об'єктом метризації, зокрема вимірювання, завжди є та чи інша фізична величина, зазвичай іменована параметром об'єкта пізнання. Ось чому дані, одержувані в результаті цієї процедури, правомірно називати параметричної або вимірювальної інформацією.
З огляду на це під нормування правової інформації слід розуміти таку процедуру її обробки, в результаті якої суб'єкт юридичної діяльності отримує кількісні характеристики тих чи інших параметрів об'єкта пізнання.
Залежно від того, що обирається в якості такої характеристики і що нею бажають висловити, розрізняють два види метризації:
- Підрахунок. При підрахунку як засіб вираження цікавлять нас даних використовують натуральні числа (наприклад, вказують, що в даному регіоні за названий період було виявлено 20 випадків порушення законності при розгляді цивільних справ в судах).
- Вимірювання. При вимірах як засіб вираження отриманих даних поряд з натуральним числом використовуються прийняті для даного виду вимірювань відповідні одиниці міри.
Нормування здійснюється за допомогою вимірювальних приладів [2].
- Кодування. У широкому сенсі під кодуванням розуміються операції заміни будь-яких даних (наприклад, текстових) скороченими умовними позначеннями, як правило, цифровими або символами [9, с. 251]. Зворотна операція називається декодуванням. Зазвичай ці операції використовуються як засіб представлення інформації, що характеризує індивідуальні особливості об'єкта або досліджуваної події, у вигляді послідовно розташованих символів абстрактного алфавіту. Комбінацію таких символів називають кодом, а їх кількість, що входить в певну кодову комбінацію, - її довжиною. Кодові символи можуть мати різну форму. Найчастіше це цифри, букви будь-якого алфавіту, а також різного роду умовні знаки і їх поєднання (точка і тире, математичні символи і т. П.).