Збираємо бази трастів самостійно і безкоштовно
Доброго всем времени суток # 33; Сьогодні мова піде про головну помилки новачків при зборі трастових баз сайтів.
Новачки, велика частина, думає що краще взяти кількістю, а не якістю. Нижче опишу процес збору самих баз і якщо Ви все ж дочитаєте тему до кінця, отримаєте приємний подарунок.
Виходячи з цього, варто збирати тематичні бази. Отже, тепер безпосередньо про збір баз.
Вибираємо який тип бази будемо збирати (посилання з профілів форумів або з профілів сайтів). Збирати базу форумів набагато легше, але як показує досвід, посилання з профілів сайтів передають більше ваги.
На другому етапі ми переходимо безпосередньо до пошуку сайтів, палити движки не буду, з цього покажу на прикладі відомої всім DLE (Data Life Engine). Для пошуку сайтів нам необхідні ознаки движка, за якими і буде проводитися пошук. Для того що б відсіяти в серп сайти за ознакою, потрібно ввести в пошуковій рядку inurl: "ознака" або ж intext: "ознака". даних команд нам вистачить з головою.
Ознаки на сайті шукати досить легко, ось наприклад, у DLE найпоширеніші ознаки:
Запити будуть виглядати так:
До речі після запиту можна написати, припустимо "автомобілі", для більш коректного пошуку тематичних баз.
Тепер у нас все готово для парсинга. Я спочатку збираю сайти з Я.Каталога, потім вже з загального пошуку.
Ось, Напарс ви сайти з ЯКА і серпа, але це ще не означає що база готова, це тільки початок. Але тепер варто підготувати саму базу.
Найпершим справою треба почистити її від дублів, можна скористатися програмою ListEdit:
Видалили дублі? - Добре. Тепер другий крок який дуже часто пропускають, видаляємо сайт яких немає в індексі Яндекса. Ми залишаємо тільки сайти з кількістю сторінок в індексі> 50. Це можна зробити демо-версією Allsubmitter. Як це зробити прочитайте в гайдах до програми.
Отже, що ми маємо, зібрану базу ДЛЕ сайтів, в індексі Яндекса і почищену від дублів.
В налаштуваннях треба буде виставити перевірку noindex # 092; nofollow:
YaParser - Link_Parser.zip (732 кілобайт) Кількість завантажень: 768
Сподіваюся інформація була корисною і пам'ятайте, шукайте не заспамленності движки.