Пошуковий індекс
Пошуковий індекс - це структура даних, що містить інформацію про всіх відомих пошуковій системі веб-документах. Він служить для скорочення часу, що витрачається на пошук в сховище даних певної послідовності символів.
Найпоширенішим типом є повнотекстовий пошуковий індекс. Його утворює список всіх слів, що зустрічаються в проіндексованих документах, із зазначенням їх джерел. При такому підході пошукові роботи можуть швидко відшукати в базі даних практично будь-яку фразу.
Що таке індексування?
Індексування - це процес збору, сортування та зберігання в базі даних відомостей про сайти, здійснюваний пошуковою машиною, з метою забезпечення швидкого і точного пошуку інформації.
До важливих відомостей про сайти відносяться статті, прикріплені документи, зображення, посилання, аудіо файли і, звичайно ж, ключові слова. Алгоритм виявлення ключових слів залежить від особливостей конкретної пошукової системи.
Індексування нових сайтів в Google відбувається за 1-7 днів, а в Яндексі - приблизно за 7-30 днів.
Як відбувається індексування?
Пошук в Мережі проходить в 2 етапи. На першому етапі пошукові системи сканують Інтернет і зберігають його відображення в базі даних на своїх серверах. На другому - пошуковики витягують з бази даних відповіді на запитання користувачів.
Пошукові боти постійно досліджують Інтернет, скачують і обробляють веб-сторінки. Зліпок Мережі зберігається на серверах пошукової системи і оновлюється слідом за кожним обходом.
Таким чином, пошукова база - це сукупність пошукового індексу, відомостей про документи та їх копії. Пошукова база регулярно оновлюється. Оновлення доступні користувачам після перенесення даних в «базовий пошук», який представляє собою корисну частину пошукової бази, очищену від спаму і дублів.
Пошукова база зі сховища основного робота вивантажується в пошук з періодичністю в кілька днів. Процедура проходить вночі, оскільки вона призводить до додаткових навантажень на сервера.
Orange шукає в режимі реального часу нові документи і вибирає з величезної маси сторінок найцікавіші. Кожен знайдений швидко-роботом документ швидко обробляється і потрапляє в базовий пошук. Оскільки термінових документів щодо мало, база оновлюється і вдень.
Як додати сайт / сторінку в індекс пошукової системи?
Використання аддурілок потрібно тільки на першому етапі життя сайту, в подальшому пошуковики самі будуть заходити на сайт і індексувати його вміст.
Що робити для полегшення індексації всіх сторінок сайту в пошукових системах?
Для того щоб сайт успішно індексувався, потрібно дотримуватися кількох правил внутрішньої оптимізації.
Повні відомості про внутрішні фактори, які враховуються пошуковими алгоритмами під час індексації та ранжирування сторінок, розробники пошукових систем тримають в глибокому секреті. Залишається тільки спиратися на офіційну інформацію і експериментувати на практиці.