Тема 14 - сайт informatikaqw!
Тема 14 Дискретні моделі даних в комп'ютері.
Подання тексту, графіки, звуку
У цьому параграфі обговоримо способи комп'ютерного кодування текстової, графічної та звукової інформації. З текстової та графічної інформацією конструктори ЕОМ «навчили» працювати машини, починаючи з третього покоління (1970-ті роки). А роботу зі звуком «освоїли» лише машини четвертого покоління, сучасні персональні комп'ютери. З цього моменту почалося поширення технології мультимедіа.
Принципово важливо, що текстова інформація вже дискретна - складається з окремих знаків. Тому виникає лише технічне питання, як розмістити її в пам'яті комп'ютера.
Модель представлення тексту в пам'яті вельми проста. За кожною буквою алфавіту, цифрою, знаком пунктуації та іншим загальноприйнятим при записі тексту символом закріплюється певний двійковий код, довжина якого фіксована. У популярних системах кодування (ASCII, KOI8 і ін.) Кожен символ замінюється на 8-розрядне ціле позитивне двійкове число; воно зберігається в одному байті пам'яті. Це число є порядковим номером символу в кодової таблиці. Згідно головною формулою інформатики, визначаємо, що розмір алфавіту, який можна закодувати, дорівнює: 28 = 256. Цієї кількості цілком достатньо для розміщення двох алфавітів природних мов (англійської та української) і всіх необхідних додаткових символів.
Оскільки в світі багато мов і багато алфавітів, то поступово відбувається перехід на міжнародну 16-бітову систему кодування Unicode. У ній кожен символ займає 2 байта, що забезпечує 216 = 65 536 кодів для різних символів.
При роботі з електронною поштою поштова програма іноді нас запитує, чи не хочемо ми вдатися до кодуванні Unicode для повідомлень, що пересилаються. Таким способом можна уникнути проблеми невідповідності кодувань, через яку іноді не вдається прочитати український текст.
Не слід уявляти собі текст, що зберігається в пам'яті комп'ютера або на зовнішньому носії, лише як потік байтів, кожен з яких є лише кодом символу тексту. Формати зберігання текстової інформації визначаються форматами текстових файлів, які використовуються тією чи іншою програмою обробки текстів. Файли, що створюються за допомогою текстових процесорів (наприклад, Microsoft Word), включають в себе не тільки коди символів алфавіту, але і дані формату: тип і розмір шрифту, положення рядків, поля і відступи та іншу додаткову інформацію.
Дискретне представлення зображення
Зображення на екрані монітора дискретно. Воно складається з окремих точок, які називаються пікселями (picture elements - елементи малюнка). Це пов'язано з технічними особливостями будови екрану, незалежно від його фізичної реалізації, будь то традиційний дисплей на електронно-променевої трубки, рідкокристалічний або плазмовий. Ці «точки» настільки близькі один одному, що око не розрізняє проміжків між ними, тому зображення сприймається як безперервне, суцільне. Якщо виведене з комп'ютера зображення формується на папері (принтером або плоттером), то лінії на ньому також виглядають безперервними. Однак в основі все одно лежить печать близьких один до одного точок.
Залежно від того, на яке графічне дозвіл екрану налаштована операційна система комп'ютера, на екрані можуть розміщуватися зображення, що мають розмір 640x480, 800x600, 1024x768 і більше пікселів. Така прямокутна матриця пікселів на екрані комп'ютера називається растром.
Якість зображення залежить не тільки від розміру растра, а й від розміру екрана монітора, який зазвичай характеризується довжиною діагоналі. Існує параметр дозволу екрану. Цей параметр вимірюється в точках на дюйм (по-англійськи dots per inch - dpi). У монітора з діагоналлю 15 дюймів розмір зображення на екрані складає приблизно 28x21 см. Знаючи, що в одному дюймі 25,4 мм, можна розрахувати, що при роботі монітора в режимі 800x600 пікселів дозвіл екранного зображення дорівнює 72 dpi.
При друку на папері дозвіл має бути набагато вище. Поліграфічний друк повноколірного зображення вимагає дозволу 200-300 dpi. Стандартний фотознімок розміром 10x15 см повинен містити приблизно 1000x1500 пікселів.
Дискретне уявлення кольору
Відновимо ваші знання про кодування кольору, отримані з базового курсу інформатики. Основне правило звучить так: будь-який колір точки на екрані комп'ютера виходить шляхом змішування трьох базових кольорів: червоного, зеленого, синього. Цей принцип називається колірною моделлю RGB (Red, Green, Blue).
Двійковий код кольору визначає, в якому співвідношенні знаходяться інтенсивності трьох базових кольорів. Якщо всі вони змішуються в однакових частках, то в підсумку виходить білий колір. Якщо всі три компоненти «вимкнені», то колір пікселя - чорний. Всі інші кольори лежать між білим і чорним.
Дискретність кольору полягає в тому, що інтенсивності базових квітів можуть приймати кінцеве число дискретних значень.
Нехай, наприклад, розмір коду кольору пікселя дорівнює 8 бітам - 1 байту. Між базовими кольорами вони можуть бути розподілені так:
Узагальнення цих приватних прикладів призводить до наступного правила. Якщо розмір коду кольору дорівнює b бітів, то кількість квітів (розмір палітри) обчислюється за формулою:
Величину b в комп'ютерній графіці називають бітової глибиною кольору.
Ще один приклад. Бітова глибина кольору дорівнює 24. Розмір палітри буде дорівнює:
К = 224 = 16 777 216
У комп'ютерній графіці використовуються різні колірні моделі для зображення на екрані, одержуваного шляхом випромінювання світла, і зображення на папері, який формується за допомогою відбиття світла. Першу модель ми вже розглянули - це модель RGB. Друга модель носить назву CMYK.
Колір, який ми бачимо на аркуші паперу, - це відображення білого (сонячного) світла. Завдана на папір фарба поглинає частину палітри, що становить білий колір, а іншу частину відображає. Таким чином, потрібний колір на папері отримують шляхом «віднімання» з білого кольору «непотрібних фарб». Тому в кольоровій поліграфії діє не правило складання квітів (як на екрані комп'ютера), а правило віднімання. Ми не будемо заглиблюватися в механізм такого способу цветообразования. Розшифруємо лише абревіатуру CMYK: Cyan - блакитний, Magenta - пурпурний, Yellow - жовтий, BlacK - чорний.
Растрова і векторна графіка
У растровій графіці графічна інформація - це сукупність даних про колір кожного пікселя на екрані. Це те, про що говорилося вище. У векторній графіці графічна інформація - це дані, математично описують графічні примітиви, складові малюнок: прямі, дуги, прямокутники, овали і ін. Положення і форма графічних примітивів представляються в системі екранних координат.
Гідність растрової графіки - ефективне представлення зображень фотографічної якості. Основний недолік реєстрового способу представлення зображення - великий обсяг займаної пам'яті. Для його скорочення доводиться застосовувати різні способи стиснення даних. Інший недолік растрових зображень пов'язаний з спотворенням зображення при його масштабуванні. Оскільки зображення складається з фіксованого числа точок, то збільшення зображення призводить до того, що ці точки стають більшими. Збільшення розміру точок растра візуально спотворює ілюстрацію і робить її грубою.
Переваги векторної графіки - порівняно невеликий обсяг пам'яті, займаної векторними файлами, масштабування зображення без втрати якості. Однак засобами векторної графіки проблематично отримати високоякісне художнє зображення. Зазвичай кошти векторної графіки використовують не для створення художніх композицій, а для оформлювальних, креслярських і проектно-конструкторських робіт.
Графічна інформація зберігається в файлах на диску. Існують різноманітні формати графічних файлів. Вони діляться на растрові і векторні.
Растрові графічні файли (формати JPEG, BMP, TIFF і інші) зберігають інформацію про колір кожного пікселя зображення на екрані. У графічних файлах векторного формату (наприклад, WMF, CJM) містяться описи графічних примітивів, що становлять малюнок.
Принципи дискретизації звуку ( «оцифровки» звуку) відображені на рис. 4.13.
Введення звуку в комп'ютер проводиться за допомогою звукового пристрою (мікрофона, радіо та ін.), Вихід якого підключається до порту звукової карти. Завдання звукової карти - з певною частотою проводити вимірювання рівня звукового сигналу (перетвореного в електричні коливання) і результати вимірювання записувати в пам'ять комп'ютера. Цей процес називають оцифруванням звуку.
Проміжок часу між двома вимірами називається періодом вимірювань - t с. Зворотній величина називається частотою дискретизації - 1 / t (герц). Чим вище частота вимірювань, тим вище якість цифрового звуку.
Результати таких вимірювань подаються цілими позитивними числами з кінцевим кількістю розрядів. Ви вже знаєте, що в такому разі виходить дискретне кінцеве безліч значень в обмеженому діапазоні. Розмір цього діапазону залежить від розрядності комірки -регістри пам'яті звукової карти. Знову працює формула 2i де i - розрядність регістра. Число i називають також розрядністю дискретизації. Записані дані зберігаються в файлах спеціальних звукових форматів.
При зберіганні оцифрованого звуку доводиться вирішувати проблему зменшення обсягу звукових файлів. Для цього крім кодування даних без втрат, що дозволяє здійснювати стовідсоткове відновлення даних з стиснутого потоку, використовується кодування даних з втратами. Мета такого кодування - домогтися схожості звучання відновленого сигналу з оригіналом при максимальному стисканні даних. Це досягається шляхом використання різних алгоритмів, що стискають оригінальний сигнал шляхом викидання з нього слабослишімих елементів. Методів стиснення, а також програм, що реалізують ці методи, існує багато.
Для збереження звуку без втрат використовується універсальний звуковий формат файлів WAV. Найбільш відомий формат «стисненого» звуку (з втратами) - MP3. Він дозволяє стискати звукові дані в 10 разів і більше.
Система основних понять