Как анализировать перелинковку сайта

Существуют сотни теорий как правильно делать перелинковку проекта. Понапридумывали разные там «кольца» , «звезды» , «кубы» и прочие методы. Теоретизировать о плюсах и минусах можно много и долго — язык, авось, не отваливается, а бумага стерпит. Ни один из теоретиков вам не скажет — поставь 100 ссылок с такими-то анкорами с таких-то страниц на такую-то и гарантировано обретешь счастье в виде могучего потока трафика. Они лишь будут рассуждать о преимуществах одной схемы перед другой и кичиться теориями, ссылаясь на авторитетов.

Единственным, окончательным, решающим мерилом правильности перелинковки является нахождение в ТОПах поисковых систем. Поэтому мы и будем анализировать лидеров ТОПов.

Для работы нам потребуется Screaming Frog SEO Spider. У меня корпоративная лицензия, а вы можете найти ключ, сами знаете где. Впрочем если анализируемый сайт до 500 страниц, можно пользоваться и триальной версией.

Далее выбираем лидера ТОПа по интересующим ключам и начинаем его препарировать. Наша задача — понять, как устроена перелинковка на его сайте, вычленить все страницы с исходящими внутренними ссылками, понять на какие страницы он ссылается и собрать базу анкоров для внутренней перелинковки. Повторив и расширив его перелинковку на своем проекте, мы сильно продвинемся к вершинам ТОПов.

В качестве пациента возьмем абсолютно любой сайт, ну например по запросу «Как купить дешевые авиабилеты» в Гугле. Получаем в выдаче вот такую красоту

Как купить дешевые авиабилеты - запрос в Гугле

Поскольку я увидел по запросу красивый блок с ответами Гугла, то естественно для препарирования выбираем сайт travelq.ru. Соберем немного информации о нем. Во первых сайтик собран на WordPress, поскольку есть вход в админку по урлу travelq.ru/wp-login.php. Во-вторых, не смотря на отсутствие счетчиков, трафик на нем есть и по Semrush составляет 6,5 тыс (что в уникальных посетителях с Гугла составит 2-2,5 тыс в день):

Число посетителей

В-третьих, сайт плотно сидит в верхних позициях по 1,5 тыс запросах

ТОП запросов сайта

Итак, сайт неплохой, приступаем к препарированию. Спарсим сайт упомянутым Screaming Frog SEO Spider. Вот настройки его конфигурации:

conf

Видим что на сайте 587 страниц и под тысячу других элементов в виде картинок, скриптов и так далее.

Выбираем вкладку Internal и ставим фильтр «Html» :

Отбор результатов в Лягушке

Чуть ниже мы видим непосредственно все страницы сайта. Теперь разберемся с 2 важными вкладками в нижней части «Inlinks» и «Outlinks». Щелкнем любую страницу в списке:
Вкладки в SEO Frogs

Как следует из названия, «Inlinks» — все входящие ссылки на страницу, включая ссылки с изображений, ссылки со скриптов, ссылки с CSS и т.д.
«Outlinks» — все исходящие с данной страницы ссылки, включая ссылки с картинок, скриптов и внешние ссылки за пределы сайта.

Теперь у нас все готово для анализа. Мы можем посмотреть ссылки на страницу непосредственно в SEO Frogs, но придется анализировать страницы по отдельности, либо выгрузить все ссылки сайта и провести комплексный анализ ссылочного.

Как найти ссылки от шаблона и меню

Теперь самое главное: нам нужно зачистить ссылочное от шаблона и главного меню. Я имею ввиду сквозное меню и шаблон, ссылки в котором практически не имеют вес из-за их значительного числа. ПС умеют ловко отделять контент от шаблона и мы сейчас повторим это за ними.

Чем характеризуется главное меню? Это анкор + ссылка на определенную страницу. Зачистив весь массив спарсенного с сайта ссылочного от этой пары, мы получим ссылочное из контента + ссылочное от второстепенных меню (которые разные на отдельных страницах и образуют небольшие по численности пары).

Чтобы найти все ссылочное из шаблона, посмотрим какая страница обладает наименьшим числом контента, в том числе и генерируемого динамически. Как правило, это страница контактов, страница о сайте. Найдем страницу контактов travelq.ru/kontaktyi в SEO лягушке и скопируем в Excell данные закладки «Outlinks». Все исходящие с этой страницы мы примем за исходящие из шаблона + главного меню.

Копируем ссылочное со страниц контакты

Вставляем все значения в Эксель и видим следующую картину:

В столбце А — тип ссылочного (текстовая, картинка, скрипт)
В столбце C — на какую страницу ведет ссылка
В столбце D — анкор ссылки
В столбце E — alt ссылки-картинки

Теперь сцепляем столбцы С и D формулой
Формула сцепления строк

Мы получили массив строк в столбце G, по которым мы будем чистить все ссылки, выгруженные с сайта.

Как зачистить все ссылки сайта от шаблона

В SEO лягушке выгружаем отчет Bulk Export — All Anchor Text. Открываем его в Excell. Мы получили более 35,7 тыс. ссылок. Теперь зачищаем это ссылочное от шаблона. Вставляем подготовленные «сцепленные» строки в виде значения (Правка — специальная вставка — значения), например в столбец K .

Далее повторяем сцепление на выгруженных ссылках столбцов Destination и Anchor в столбце I ( =СЦЕПИТЬ(E2;C2) )и копируем на весь диапазон.

Сейчас мы проверим каждое значение столбца I на данные шаблона из столбца K. Для этого введем в столбце J формулу =ПОИСКПОЗ(I2;$K$2:$K$99;0)
Скопировав формулу вниз на весь диапазон получаем при цифровом значении — ссылка с таким анкором и таким урлом — есть в шаблоне, #Н/Д — отличная от шаблона ссылка, которые нам и нужны.

Делаем автофильтр по всем значениям кроме #Н/Д.

Фильтруем от шаблона

Удаляем их. Снимаем фильтр.
Мы получили ссылочный профиль сайта без учета шаблона. Всего в нем сейчас 18 тыс значений. Эти 18 тыс ссылок как то участвуют в передаче веса и перелинковке. Сейчас мы с Вами проделали то, что делают ПС с каждым сайтом — дешаблонизировали его.

Удаляем все столбцы с формулами, оставляем только столбцы A-H.

Не смотря на наши настройки, у нас спарсились домены 3 уровня (sodyba.travelq.ru, guide.travelq.ru и пр). Они жестко перелинкованы с доменом второго уровня и с одной стороны нужно их, конечно, учитывать в перелинковке самого travelq.ru, а с другой стороны речь не стоит в учебной статье о комплексном анализе.

Проанализировать их просто:
в Столбце B делаем текстовый фильтр не содержит .travelq.ru и тут же
в Столбце C делаем текстовый фильтр содержит .travelq.ru .

Мы видим 65 ссылок, которые ведут с домена 2 уровня на домены 3 уровня со всеми анкорами.

Поменяв содержит и не содержит местами мы увидим ссылки, которые ведут на наш домен 2 уровня.

В ячейку F2 вводим формулу =ЕСЛИ(E2=»»;D2;E2) и копируем ее вниз. Логика формулы такова, если анкор пустой (столбец E), то берем значение из alt (столбец D). Переименовываем этот столбец в Anchor2

altanchor

Приступаем к анализу

Строим первую сводную таблицу, выделив весь диапазон данных. Для начала смотрим весь анкор лист и откуда и куда идут ссылки.

Мы можем посмотреть данные в разрезе всех входящих анкоров и страниц на конкретную страницу. Давайте посмотрим что именно входит на страницу, из которой Гугл сделал красивый блок с ответами:

Таким образом, используя всю мощь сводных таблиц Экселя мы можем выстроить какую угодно структуру отчета по ссылкам.

В данном примере перелинковка, в основном, находится в меню второго уровня, которые генерируются динамически и выводятся на части страниц а не на всех, как главное меню. А представьте что перед вами сайт с 10 тыс. страниц, в котором перелинковка построена из контента с разными анкорами. Тут то и придет на помощь могучая SEO лягушка.

Экспериментируйте.

15
Ноя
2016

Об авторе:

DrMax. Занимаюсь аудитами, оценкой качества YMYL проектов и SEO сайтов более 20 лет. В настоящее время провожу аудиты и реанимирую трафик сайтов, восстанавливаю позиции в органической выдаче сайтов, помогаю снять алгоритмические и ручные штрафы Google. В портфолио - продвижение несколько десятков проектов как региональных частников, так и крупнейших мировых компаний. Владелец SEO блога Drmax.su. Автор 22 книг по продвижению и аудиту сайтов.

Дерзость Намеренья 18 апреля, 2017
Новичку мало понятно. Изучаю первую книгу Сео Монстр 2011. Наверное много устарело, но не всё. Покупал много лет назад, вот её время пришло:)
ответ
DrMax 16 июня, 2017
Это похвально. В принципе там много нужного и полезного, что не устаревает.
Кстати, на днях выйдет новый интереснейший мануал именно по внутренней перелинковке. Наверное уже сегодня выкачу пост про это. Тема практически не раскрыта в интернете, везде общие фразы и пр.
ответ
sex 30 октября, 2017
Проверил мой топ ВЧ запросов по конкурентам. Топ 5 вч запроса — обязательно стоит сквозная ссылка ВЧ на всех страницах сайта. Обязательно указан титл в ссылке.
Однако, если анкора ВЧ в скозняке не присутствует, с жирных страниц (контакты, регистрация), то сайт позиции ниже занимает.
Если анкор два слова, а титл одно слово, то именно по этому одному ВЧ слову сайт в топе лучшие позиции занимает. Пример на вашей странице: Перелинковка сайта По запросу «Перелинковка» будут лучшие позиции.
Сайты конкуренты сидят в ТОПЕ более 3-5 лет. И у них шикарные поведенческие.
Почему сквозняки у них работают? (Сквозняки — сквозная ссылка со всех страниц сайта на главную по одному анкору). Только из за возраста? Тогда встает вопрос -почему все утверждают, что они не работают?
У меня был опыт по ВЧ. Поднял сайт с помощью сч и нч запросов. Поставил ВЧ анкор со всех страниц. Потерял в трафике 30%, увеличил зато доход на 50%. 3 года никто не мог выжать из топ1 по вч запросу, пока роскомнадзор черную метку не прислал…
ответ
Иван Доброславин 13 декабря, 2017
DrMax, в каких случаях стоит делать ссылку из меню в шапке в раздел с сылками на материалы этого контента? У Вас вот в раздел «материалы» нельзя «провалиться», зато в другие разделы — аудит сайта и seo консультации — можно.
P.S. Спасибо за ответы!
ответ
- DrMax 14 декабря, 2017
  Иван, вы не смотрите как у меня организовано — просто у меня пока очень и очень мало страниц — всего штук 15, тут структуру делать в принципе рано.
  Итак, ссылку на подраздел делать можно и нужно, ежели страница раздела оформлена и несет дополнительную ценность какую то.
  https://drmax.su/category/se/
  Есть небольшая текстовка, прописан тайтл, прописан дескрипшен.
  в принципе если бы я не ленился, то прописал к каждой статье уникальный эксцерпт, вставил бы счетчик статей в категорию и назвал бы страницу (рубрику), ну там «35 статей по работе поисковой системы». И пользователи и поисковики такие списки любят. Так бы я преобразовал простую и унылую категорию в мощный список и ловил бы траф на эту страницу (фактически категорию), чего никогда не будет если это обычная категория вордпресса.
  Как вы думаете будет такая страница ценна? конечно будет. Поэтому в шапке на нее ссылка и должна стоять.
  Что касается аудита, то там организована иная стратегия — SILO. По сути это страница главная (аудит), которая имеет поддержку страницами с под-анкорами (онлайн аудит, ссылочный аудит и пр), каждая из которых (подстраниц) будет иметь свои субстраницы. Например:
  https://drmax.su/website-audit/technical_audit/factors/
  Страница «факторы технического аудита». Это страница 4 уровня, которая тянет вверх страницу «технический аудит», которая в свою очередь тянет вверх страницу «аудит».
  Получается этакая башня. Ссылку из меню получат только страницы 3 уровня, но никак не 4. В идеале ссылку должен получить только «аудит». Но опять — таки, у меня материалов пока мало на сайте. За зиму я думаю построю эту SILO башню по аудиту )).
  Внизу эту башню еще должны подпирать ссылки из новостей или других материалов.
  Подробнее, в целом, читайте в книжке новой — которая SEO Монстр 2018.
  Технически отличие еще есть, что аудит и пр — это page, а вот всякие материалы — это записи со своими рубриками.
  Как то так )
  ответ
  - Иван Доброславин 20 декабря, 2017
    Спасибо, очень информативно. Насколько ВАЖНО скрывать ссылки в меню на посредственные поддерживаемые страницы?
    Записи и страницы в WordPress — насколько это существенно для сайта и сео?
    ответ
Иван Доброславин 29 января, 2018
Собираюсь старые общие (поддерживающие) статьи подредактировать, кое-где в тексте проставить ссылки на более значимые страницы. НО! Будет получаться, что на акцептора будет идти две ссылки — одна со статьи, другая с шапки. Из книги SEO Монстр 2017 по перелинковке сказано, что «1 статья — 1 ссылка». Можете прокомментировать этот момент. (возможно уже спрашивали, но я не видел)
ответ
- DrMax 29 января, 2018
  Иван, у вас же не все статьи в шапке есть? Или речь про наиболее значимые страницы.
  В принципе, если стоит ссылка в шапке и ссылка в тексте с донора на акцептор, то какая из них учтется — никто не знает.
  Именно по этому есть рекомендация ставить по 1 ссылке со страницы- донора на страницу-акцептора, чтобы четко контролировать и передаваемый вес и, что еще важней, текстовую составляющую ссылки.
  Отсюда вывод, ставьте спокойно ссылку из текста с нужным анкором — это полезно. Есть большая доля вероятности что учтется именно нужный анкор. Ну а то что потеряете немного в весе ссылки — не беда. Эта потеря перекроется (возможно) именно пользой текстовой составляющей ссылки.
  ответ
  - Иван Доброславин 29 января, 2018
    Спасибо, применю.
    ответ
Илья 5 февраля, 2018
Небезызвестный Арбайтен (blogarbik) помню писал, что внутренняя перелинковка в тексте работает только если по ним есть переходы, то есть поведенческие, значит эта ссылка полезная . Иначе это как спам воспринимается, а вообще он говорит, блока похожих статей достаточно для перелинковки
ответ
Александр 11 февраля, 2018
DrMax, вопрос по текстам Карточки товаров.
Целесообразно начинать описание Карточки с коммерческих фраз? Например:
«Купить «Товар» в интернет-магазине «Бренд» с доставкой по России, удобными способами оплаты, гарантией.»
И не будет ли это негативно влиять на продвижение всего сайта, если Карточка каждого товара будет начинаться с одинакового описания, с заменой в тексте названия самого «Товара»?
ответ
- DrMax 2 марта, 2018
  Александр, если вы про SEO текст на карточке товаров, то вовсе нет никакой нужды транзакционные составляющие «купить», «заказать», «в корзину» и прочие пихать в самое начало. Они должны присутствовать в SEO тексте. Если вы говорите про H1 и текст для него, то транзакционную составляющую лучше не употреблять. Просто выводить название товара. Если Вы говорите про тег title — то ставьте эти слова во вторую часть текста — например «Принтер HP 1000. Купить МФА Хьюлит Паккард 1000 в Москве со скидкой 99%. Доставка бесплатно по территории земного шара. » Как то так.
  Ну а дескрипшен, как известно, на ранжирование влияние не оказывает.
  ответ
Виталий 12 апреля, 2018
А можно поподробнее про сводную таблицу. Вообще никогда подобных действий не делал в экселе — немного сложновато всё уловить интуитивно и сделать самому.
Как её строить? Что настраивать при этом?
Как дальше анализировать данные? Ну вот получили их, и?
Статья хорошая, но как по мне не совсем законченная.
ответ
Сергей 25 августа, 2022
Крутейший мануал, конечно. Учитывая возможности автоматизации и то, как мало ими пользуются конкуренты. Вот бы ещё обновить…
ответ