мови розмітки
Мови розмітки використовуються для структурування документів в комп'ютерних середовищах. Структурування - виділення частин (елементів) документа, якими можуть бути глави, параграфи, абзаци тексту, рядки і стовпці таблиць, графічні примітиви і т.п. У телекомунікаційних технологіях потрібні стандартні способи розмітки для вираження структури документів.
Розмітку доцільно відокремлювати від форматування, що визначає форму подання структурованих документів на екрані дисплея або в твердих копіях. Для форматування служать додаткові кошти - мови форматування.
Універсальна мова розмітки SGML (Standard Generalized Markup Language), затверджений в якості стандарту ISO 8879 ще в 80-х роках, більш універсальний, але досить складний для освоєння і використання. Для SGML мовою форматування є DSSSL (Document-Style Semantics and Specification Language) - також стандарт ISO.
Поява Web-технології пов'язано з мовою HTML (HyperText Markup Language). У цій мові засоби розмітки і форматування розділені нечітко. Розмітка представляється, як і в SGML, спеціальними символами - тегами (tag) в потрібних місцях документа. У тегах можливе зазначення атрибутів (параметрів), які задають, наприклад, такі властивості форматування, як розмір, тип і колір символів тексту. Списки можливих атрибутів і їх значень представлені в каскадних таблицях стилів CSS (Cascding Style Sheet).
Однак HTML не у всіх додатках виявився зручним мовою. Надежли на подолання обмеженості HTML пов'язані з порівняно новою мовою XML (eXtensible Markup Language), побудованим, як і HTML, на ідеях SGML, але XML більш зручний для практичних застосувань, ніж SGML. Зручність XML обумовлено можливістю створення на його базі різних нових мов розмітки, які враховують особливості конкретних програм. У цьому смсисле XML можна розглядати як метамова розмітки. Так, до числа приватних мов розмітки, званих словниками XML [1], можна віднести мову HTML. В даний час XML претендує на роль основного мови подання документів в інформаційних технологіях.
HTML - гіпертекстова мова для заповнення інформаційних сторінок Web-серверів. З його допомогою описуються структура і зв'язку документа, вид якого на екрані визначається браузером. Власне змістовна текстова інформація може надаватися в форматі ASCII, а вставляються в документ графічні і мультимедійні фрагменти - в своїх специфічних форматах.
Іншими словами, опис на мові HTML - це текст у форматі ASCII разом з включеними в нього HTML-командами (керуючими кодами, званими також тегами, дескрипторами, або ярликами). Ці команди розставляються в потрібних місцях тексту, визначаючи межі елементів документа, тип шрифту, місця розміщення вставляються графічних і мультимедійних фрагментів, гіперпосилання і т.п.
Розрізняють теги парні (контейнерні)
<___> текст елемента
і поодинокі (бесконтейнерние) <___>. Замість підкреслення записується ім'я тега. Парні теги обрамляють фрагмент тексту і утворюють разом з ним елемент документа. Бесконтейнерние теги можуть використовуватися для вказівки місця вставки фрагмента, почала елемента списку, переведення каретки і т.п.
Структура тексту в WWW має вигляд:
Команди структурування та форматування тексту (дескриптори компонування):
- кінець абзацу;
- переклад рядка;
- переклад рядка з печаткою горизонтальної лінії, що розділяє частини тексту;
текст або текст - для виділення тексту, тобто текст в контейнері стає більш помітним у порівнянні з навколишнім текстом.
текст- для виділення цитат.
Команди форматування заголовків (дескриптори стилю):
- текст друкується найбільшим шрифтом, використовується для заголовків верхнього рівня;
текст
- для наступного рівня і т.д. аж до команди;
текст- зазначений текст представлений заданим при його записи шрифтом.
Команди форматування символів представлені парними символами B, I, U; текст між відкриває і закриває командами буде виділено відповідно напівжирний, курсивом, підкресленням.
Парні теги форматування списків
- і
- і буде при візуалізації позначений номером (у разі OL) або спеціальним символом (наприклад, * в разі UL). У словниках і глосаріях зручно застосовувати команди
- - початок списку,
- - перед кожним новим терміном словника і
- - перед текстом визначення кожного терміна.
Таблиці знаходяться в контейнерах, обмежених тегами
. Розмітку пояснює наступний приклад:
верхній колонтитул нижній колонтитул перший рядок таблиці другий рядок таблиці Усередині кожного рядка (між тегами TR) розкривається вміст осередків цього рядка, що записується між ткгамі
і . У тегах можна задавати форматування таблиці у вигляді атрибут = "значення атрибута", наприклад, в- готівка ічіе рамки (атрибут border), ширину таблиці (width), відстань між ячейкамсі таблиці і т.п.
Для прикладу розглянемо просту таблицю:
Це перший рядок
Це другий рядок Це третій рядок Команда вставки графіки
ALIGN - параметр вирівнювання, вказує місце у вікні для розташування малюнка; ALT - задає текст, який виводиться на екран замість малюнка в текстових браузерах типу Lynx. Самі зображення повинні бути в певному форматі (зазвичай це. Gif або. Jpeg).
Екран може бути розділений на декілька вікон (областей, фреймів) за допомогою парного тега
- використовуються для виділення списків, кожен пункт списків поміщається в контейнер з тегами