Пошаговый аудит контента

Впервые статью про SEO ориентированный аудит контента я написал в 2017 году. С тех пор произошли потрясающие по требовательности изменения в алгоритмах Google. Например, ориентированные на качество «медицинские обновления» поисковой системы, требования к E-A-T для контента сайта. Все это привело к деиндексации и падении в ранжировании значительного числа сайтов, переполненных некачественным контентом. Таким образом, пришло время обновить и актуализировать стратегию аудита контента.


Впервые опубликовано: 26/10/2017
Обновлено и дополнено: 13/10/2020

1. Что такое качество контента и как его измерять

1.1. Понятие качества контента

Качество контента — это синтетический показатель, выражающий степень удовлетворенности пользователя предоставляемыми данными.

В соответствии с QRG (Руководство по качеству для асессоров Google) оценка качества страницы основана на том, насколько хорошо она соответствует своему назначению. Для этого крайне необходимо понять назначение страницы. Веб-сайты или страницы, созданные без какой-либо конкретной цели, включая страницы, которые не могут быть полезны посетителям, или страницы, распространяющие ненависть, причиняющие вред, дезинформирующие или обманывающие пользователей, имеют очень низкую оценку качества.

Чтобы контент отвечал требованиям по качеству поисковых систем он должен быть:

  • Полезным и информативным.
  • Более интересным, чем конкурирующие ресурсы.
  • Достоверным. Чтобы посетители доверяли сайту, добавляйте на него собственные аналитические материалы, а также используйте цитаты, обзоры и ссылки на другие материалы.
  • Качественным. Публикуйте только оригинальный и полезный контент. Не стремитесь компенсировать количеством материалов недостаток их качества.
  • Привлекательным. Разнообразьте содержание сайта – добавьте фотографии товаров, сотрудников и свои собственные. Не допускайте орфографических, стилистических и фактических ошибок – они отталкивают пользователей. Чрезмерное количество рекламы также может отвлекать посетителей. Привлекайте аудиторию, периодически публикуя новые материалы, используя функцию комментирования и виджеты социальных сетей.

1.2. Как оценить качество контента

Качество контента и сайта в целом можно измерить степенью удовлетворенности посетителей, которое выражается:

  1. Процентом конвертацией пользователя. Конвертация зависит от типа сайта и может выражаться в покупках, подписке на рассылку, отзывах, ссылках на материал и пр.
  2. Временем проведенном на сайте.
  3. Возвратом тех же самых пользователей, перевод их в постоянных посетителей и потребителей контента.

В соответствии с QRG, важнейшие факторы влияющие на оценку качества страницы таковы:

Кроме того, на качество отдельных страниц влияет общее качество сайта, которое характеризуется:

  • информацией на сайте о том, кто несет ответственность за контент;
  • репутацией сайта в целом и репутацией авторов контента/

Поисковые системы оценивают качество страниц сайта и выставляют комплексную оценку, выражающуюся числом запросов в ТОПе выдачи и, как результат, в трафике на отдельные страницы вашего сайта.

Таким образом, подстраиваясь под поисковые системы, мы легко узнаем, какие страницы вашего сайта Google считает качественными, а какие нет, опираясь на показатели в аналитике «страницы» и количество посетителей на них из органической выдачи за определенный период..

Если за продолжительный период (например, три месяца) с поисковой системы на отдельную страницу не зашел ни один посетитель или их число пренебрежительно мало,  то никакой ценности в глазах Google эта страница не представляет, а суммарный (скорее средневзвешенный) показатель качества сайта в целом будет уменьшен.

Что бы вы не думали о своей странице, как бы ни насыщали её ключами, делали релевантной запросу — если на странице нет трафика, то в глазах Поисковых систем ваша страница является некачественной. Такая страница никогда не получит трафика без значительных финансовых вливаний на качественное ссылочное.

1.3. Особенности страниц высокого качества

Страницы, содержащие высококачественный контент могут иметь любое назначение: от предоставления информации до развлечения, от художественного самовыражения до покупки товаров или услуг в Интернете.

В чем особенность таких страниц? Страница высокого качества должна иметь некое назначение и хорошо ему соответствовать. Например, информационные страницы высокого качества должны быть достоверными, понятно написанными и исчерпывающими. Контент высокого качества онлайн-магазинов должен позволять пользователям находить нужные продукты и легко совершать покупки. Контент высокого качества юмористических страниц должно быть в первую очередь развлекательным, в то время как фактическая точность не является обязательной.

Кроме того, страницы высокого качества имеют следующие особенности:

  • Высокий уровень E-A-T (экспертность, авторитет, достоверность). Для всех типов веб-страниц создание контента высокого качества требует значительного количества времени, усилий, опыта и таланта и умения. Для новостных статей и информационных страниц контент высокого качества должен быть фактически точным и представлять собой устоявшийся научный консенсус по вопросам, где таковой существует. Контент также включает в себя различные функциональные возможности страницы. Например, если речь идет о веб-сайте магазина, нужно убедиться что работает корзина и доступно оформление покупки.
  • Достаточный объем контента высокого качества, включая информативный или полезный заголовок. Необходимый объем контента зависит от темы и назначения страницы. Чем шире тематика страницы, тем больший объем доступной информации она будет содержать. И наоборот, на страницах, посвященных более узкой тематике, контент будет представлен в меньшем объеме.
  • Удовлетворительная информация о сайте и о том, кто несет за него ответственность. Страницы высокого качества должны содержать четкую информация о веб-сайте, чтобы пользователи чувствовали себя на нем комфортно. Количество информации, необходимой для определения уровня E-A-T, зависит от типа веб-сайта. Например, веб-сайты типа YMYL требуют высокой степени доверия, поэтому они содержат более подробную информацию о том, кто несет ответственность за содержание сайта.
  • Положительная репутация сайта, отвечающего за контент. Репутация является важным критерием для присвоения высокой оценки качества. Если веб-страница, не имеющая репутации, может заслужить высокую оценку качества, наличие убедительных негативных отзывов полностью исключают такую возможность. При проведении исследования необходимо учитывать не сам факт отрицательных отзывов, а их причину.
  • Положительная репутация автора контента

Страницы и веб-сайты высокого качества нуждаются в достаточном уровне эксперности, чтобы быть авторитетными и заслуживающими доверия.

Существуют самые разные типы «экспертных» сайтов, будь то сайты о сплетнях, моде, юморе, форумы, сайты с вопросами и ответами и т. д. Фактически, некоторые данные можно найти только на форумах, где эксперты выражают свое ценное мнение на ту или иную тему.

Итак, высококачественный контент может быть создан экспертами, любителями и даже обычными людьми, имеющими опыт в определенной сфере. Критерии оценки качества контента, принятые Google, зависят от назначения страницы и типа контента. Однако для YMYL страниц существует высокий стандарт точности и общепризнанного медицинского, научного, исторического консенсуса по тем вопросам, где таковой существует.

Отличительным признаком очень высокого качества является наличие уникального и оригинального контента, специально созданного для того или иного сайта. Тем не менее, его характеристики могут существенно отличаться в зависимости от типа сайта. Вот несколько примеров:

  • Для новостей: контент очень высокого качества – это уникальная информация о событиях, которую пользователь может получить только на данном ресурсе. Оригинальные и подробные новостные сообщения требуют высокой квалификации, а также времени и усилий. Часто такие статьи могут содержать ссылки на первоисточники или другие новостные ресурсы. Высококачественный новостной контент должен быть достоверным и соответствовать профессиональным журналистским стандартам.
  • Для художественного контента (видео, изображения, фотографии, тексты и т. д.): контент высокого качества — это уникальный контент, созданный высококвалифицированными и талантливыми художниками, писателями или фотографами. Все это требует высокой квалификации или таланта, а также времени и усилий. Если художественный контент связан с YMYL тематикой, к нему должны применяться соответствующие высокие стандарты.
  • Для информационного контента: он должен быть оригинальным, точным, исчерпывающим, четко изложенным, профессионально представленным, а также отражать консенсус экспертного сообщества. Ожидания для разных типов информации могут различаться. Например, научные статьи имеют совершенно иной набор характеристик, чем статьи о хобби, таком как коллекционировании марок. Тем не менее, все типы высококачественного информационного контента имеют общие стандарты точности, полноты предоставляемой информации и ясности изложения, а также должны четко соответствовать заявленной теме.

Однако, эта публикация не о том, что такое хороший контент, а о том, как найти и удалить некачественный контент.

1.4. Примеры некачественного контента

Под некачественным контентом или некачественными страницами сайта понимаются не только отдельные информационные записи или статьи в блоге. К некачественному, бесполезному контенту или по другому Thin Content можно отнести:

  • Устаревшие страницы продуктов / услуг
  • Автоматически созданные страницы ( например теговые страницы или страницы фильтров)
  • Страницы, которые не связаны с основной архитектурой вашего сайта
  • Поддомены, форумы, и т. д.

Признаками некачественной страницы могут быть:

  • Переоптимизация страницы ключевыми словами. Страница написана для поисковиков, содержит грамматические ошибки. Для конечного пользователя выдается неточная или бесполезная информация.
  • Нерелевантный контент. В небольших количествах он допустим на сайте. Но когда сайт переполнен нерелевантными статьями (например сайт размещает платные статьи) — это плохо.
  • Неинформативный контент. Возможно всего лишь несколько опубликованных предложений на странице, возможно есть медиаматериалы. Контент не приносит дополнительной ценности сайту.
  • Весь контент страницы основан на изображениях.
  • Компиляция контента — состоит из отдельных обрывков контента, расположенных в другом месте на сайте или за его пределами.
  • Ошибочная оптимизация контента. Ключевые слова в заголовках, титле, дескрипшены не подтверждаются текстом контента. Пользователь не может найти информацию на странице, о которой говориться в заголовках контента.
  • Дублированный контент. Дублируется с других страниц сайта, например в рубриках, категориях, архивах, вариантах продукции.
  • Плагиат. Контент взятый с других сайтов.
  • Страницы — заглушки (например «раздел на реконструкции»)
  • Индексируемые результаты поиска
  • Индексируемые теги блога

и многое другое.

2. Стратегия удаления некачественного контента

Удаление некачественного контента — это поиск, анализ и удаление наиболее некачественных страниц сайта, консолидация однородных страниц и обновление (редактирование) страниц недостаточного качества.

Конечная цель такого аудита контента — принятие решение о том, что делать с каждым URL-адресом на вашем веб-сайте — удалить, перенаправить, обновить или оставить как есть.

2.1. Теоретическое обоснование стратегии удаления контента

Как известно, асессоры Google выставляют оценку качества страницы по собственной шкале от Lowest до Highest.

Примем для образовательных целей, что Google оценивает качество контента по 100-бальной шкале (это не так, но зато удобно для наших расчетов).

Предположим у нас есть сайт с 600 страницами. Примем, что у него 100 статей с индексом качества 50, 200 статей с индексом качества 40 и 300 статей с индексом качества 30.

Тогда наш сайт можно будет представить в виде пирамиды.

Оценка качества контента

Средний уровень качества всего сайта составляет 36,3. В целом наш сайт не дотягивает даже до среднего уровня качества. Соответственно отношение Поисковых систем к нему будет неважным.

Эффективным методом повышения качества всего сайта в целом, хорошо масштабируемым и неоднократно проверенным на практике является ОБРЕЗАНИЕ НЕКАЧЕСТВЕННОГО КОНТЕНТА.

Продолжим наш эксперимент, удалив на рассматриваемом сайте самые некачественные страницы. После этого рассчитаем коэффициент качества всего сайта.

Повышение качества сайта

Простым удалением «некачественных» страниц сайта мы добились роста среднего качества всего проекта на 6,67 пунктов или 13,4%.

На практике, даже незначительный рост качества сайта приводит к значительному приросту трафика, о чем мы и поговорим дальше.

Западными оптимизаторами были проведены несколько десятков экспериментов по обрезке некачественного контента сайта. Результаты подтверждают надежность такого метода и долговременный прирост посещений сайта.

2.2. Кейс № 1. Рост трафика на 96%

Есть западная компания по продаже дверных звонков и всяческой фурнитуры для дома. Как и многие они успешно вели свой бизнес в интернете, продавали через сайт свои товары. Не гнушались они всяческими SEO манипуляциями, в том числе полюбили размещать недостаточно качественные статьи на своем сайте, для продвижения отдельных НЧ и длинного хвоста запросов.

С течением времени все это обросло всевозможными битыми ссылками, несуществующими страницами, раздутым числом проиндексированных страниц в Гугле, при этом контент был довольно низкого качества.

А потом пришел Пингвин и Панда, трафик после которых резко просел, доходы упали и народ начал паниковать.

На помощь гибнущей компании пришли ловкие умельцы из SEO компании Inflow и проделали ряд работ над сайтом. Они провели технический аудит сайта и нащупали наиболее проблемные места. Негодные страницы они удалили или объединили, прописали везде где нужно редиректы, значительно снизили число страниц в индексе Гугла.

Как результат — в течении года трафик вырос на 96%, прибыль тоже возросла и вырос средний чек заказа. Все были довольны. Двернозвонковая компания тем, что не разорилась, ну а товарищи с Inflow тем, что в течении года получали бабки с этого клиента.

График роста трафика. Пример№ 1.

Полный текст кейса с применяемыми приемами можете посмотреть здесь.

Там же найдете еще несколько кейсов с примерами обрезки, которые повлекли за собой рост трафика, а главное, конверсии, продаж.

2.3. Кейс № 2. Рост трафика на 89%

Известная компания Ahrefs на собственном сайте применила технику «Обрезания некачественного контента». Прирост органического трафика составил 89%.

В свое время они так же увлеклись стратегией продвижения контентом. Вот что они делали:

Post frequent, decent quality, 500 word+ blog posts, targeting a broad spread of keywords and watch the traffic roll in! More content = better!

Переводя на великорусский — они часто публиковали «хорошего» качества посты в блоге, от 500 слов. В постах были внедрены ключевые фразы + видеоролик. Чем больше контента — тем лучше!

Это типичная стратегия продвижения контентом. Но при этом они забыли что релевантность контента не равна качеству. И про то, что качество статей с точки зрения автора и с точки зрения Поисковых машин — две разные вещи.

В целом, они удалили более половины контента, которые признали некачественным, провели технический аудит сайта  и устранили фатальные проблемы с контентом.

Пример роста трафика.

За полгода трафик практически удвоился.

Почитайте этот кейс от ahrefs, там приведены примеры как они отбирали и оценивали контент, что конкретно делали.

Думаю примеров достаточно. На самом деле, хоть стратегия и не особо известная и прямо говоря — необычная, отчеты о её применении в интернете есть. Более того летом этого года я видел курсы по обучению этой стратегии ценой в….. $1000. В принципе, для компаний это небольшие деньги, а пользы от применения стратегии — масса, срок окупаемости порой составляет менее суток.

А мы продолжим знакомство со стратегией.

3. Аудит качества контента

Аудит качества контента — это полная инвентаризация всего индексируемого контента сайта, который анализируется с использованием показателей посещаемости, конверсии, обратных ссылок, чтобы определить, какой контент следует сохранить, улучшить, объединить или удалить.

Целью аудита контента для нужд SEO является повышение доверия и общего качества сайта, оптимизация индексирования сайта, рост положительных факторов ранжирования и удаление фильтров.

3.1. Подготовка к сбору информации для аудита

Сбор информации будем осуществлять, используя Screaming Frog Seo Spider. Данных, консолидируемых «Лягушкой» нам будет достаточно для полноценного аудита контента.

Вы можете воспользоваться бесплатным аналогом » Site Analyzer «, но в этом случае некоторые данные вам придется выбирать вручную из Google Аналитикса, Ahrefs, Majestic SEO и потом сводить данные воедино в Excel.

Чем больше сайт, тем лучший результат может принести аудит контента. Нередко объем сайта исчисляется сотнями тысяч страниц. Все ли они нам нужны для аудита?

Нет. Явно запрещенные в robots.txt и метатегами robots (noindex) страницы с контентом должны быть отброшены. Кроме того, нет нужды рассматривать канонизированные копии контента. Для анализа нам нужны только открытые для индексации html страницы, а, например, изображения, CSS, JavaScript и SWF-файлы мы должны опустить.

Сканирование сайта можно разделить на части и проводить его, например, по отдельным разделам, добавляя или исключая их в настройках.

Добавление или исключение диапазонов урлов при сканировании.

3.2. Настройка поиска дублей контента

Последние версии Screaming Frog позволяют обнаруживать дубли контента в пределах сайта. Но это дело крайне затратное по вычислительным возможностям. Поэтому давайте прямо укажем программе в каком куске кода находится основной контент, который мы будем сравнивать постранично друг с другом.

Для этого необходимо в Configuration > Content > Area переключится на режим Include и прописать теги, классы или ID блоков, в которых расположен основной контент.

Откроем исходный код страницы и посмотрим, какие теги или блоки включают в себя основной контент. Напомню еще раз, что нам не нужны шапка, основное меню, реклама, футеры, сайдбары и прочие повторяющиеся элементы.

Определяем где расположен основной контент

Как мы видим, в шаблоне присутствует HTML-элемент main (1), что согласно HTML-5 должен включать в себя уникальный контент страницы.

Содержимое элемента main должно быть уникальным для документа. Содержимое, которое повторяется в наборе документов или разделах документа, такое как боковые панели, навигационные ссылки, информация об авторских правах, логотипы сайта и поисковые формы, не должно добавляться, за исключением формы поиска, если она является основной функцией страницы.

Если бы такого элемента я не обнаружил бы, то опирался div с классом «main-area» (2).

Обратите внимание, что в пределах сайта может быть несколько различных шаблонов, а то и несколько десятков шаблонов. И основной контент в них может размещаться в совершенно разных частях. Вам необходимо последовательно проинспектировать все вариации используемых шаблонов так, как это было описано выше.

Добавим main в настройки «Content Area» и обратим внимание на такую конфигурацию: Configuration > Content > Duplicates.

По умолчанию обнаруживаются только полностью повторяющиеся страницы. Чтобы проверить наличие «неточных дубликатов», настройте конфигурацию следующим образом, чтобы позволить SEO Spider хранить содержимое каждой страницы.

Поиск неточных дубликатов страниц

При такой настройке «Лягушка» будет искать неточные дубликаты с порогом совпадения в 90%, используя алгоритм minhash. Если кто не знает, то этот алгоритм был изобретен создателями одной из первой поисковой машины — Alta Vista и применялся именно для поиска и удаления дублей контента.

Обратите внимание, что проверяться будут исключительно открытые для индексации страницы. Например, если у вас на сайте есть два дубля контента на разных страницах, но одна из них канонизирована на другую, то «Лягушка» не сообщит о наличии таких дублей.

Второе, что необходимо помнить, что расчеты и поиск дублей — это длительный и ресурсоёмкий процесс. Он запускается после полного сканирования сайта, используя Crawl Analysis (проверьте, что в конфигурации Crawl Analysis подключен поиск дубликатов). Возможно, стоит анализировать ваш сайт по отдельным частям.

3.3. Подключение и настройка API

Следующим этапом является подключение к API Google Аналитикса, Search Console и Majestic SEO (либо Ahrefs). Это делаем в Configuration > Api Access, где последовательно предоставляем доступы к аналитике. На что тут важно обратить внимание.

После подключения к Google Analytics на вкладке Date Range  выбираем период, как минимум в 3 месяца.

Далее переходим во вкладку Metrics и выбираем нужные нам метрики.

Как минимум нам нужны:

  • ga:user — количество пользователей за период;
  • ga:sessions — число сессий за период;
  • ga:bounceRate — показатель отказов BounceRate;
  • Goals — если у вас настроены цели в аналитике (выбирайте сами).

Вы можете подключить и иные аналитики — пойдет только на пользу при анализе, почему у той или иной страницы нет трафика.

Обязательно подключайте Majestic или Ahrefs. Нам необходимы данные о количестве входящих ссылок для каждой страницы.

Настройка API Majestic SEO

Абсолютно нелишними будут данные Trust и Citation Flow, позволяющие примерно оценить качество входящих ссылок.

4. Массовая проверка качества контента

После завершения работы Screaming Frog мы получаем список страниц сайта с необходимыми данными для анализа:

  • Показатель органического трафика за период;
  • Показатель отказов;
  • Коэффициент конверсии;
  • Число обратных ссылок и примерный уровень их качества.

Ниже представлена блок-схема алгоритма, позволяющая исключить просмотр значительных массивов данных вручную.

4.1. Оценка качества контента

Перед вами дерево решений для автоматизации оценки качества контента. Вы можете выгрузить данные о страницах из Screaming Frog в Excel и несколькими нехитрыми формулами автоматически выработать решение.

Наше дерево решений имеет одно из 4 результатов:

  • Оставьте все как есть (он же 200). Если страница действительно получает органический трафик, имеет низкий показатель отказов и высокий коэффициент конверсии, мы должны оставить эту страницу в покое.
  • Проверка качества. Если страница получает органический трафик, имеет высокий показатель отказов и низкий коэффициент конверсии, мы должны проверить эту страницу на соответствие содержания. После проверки качества вручную вы должны либо удалить (404), либо перенаправить (301) или переписать контент, чтобы его улучшить.
  • Удалить (404). Если на странице нет органического трафика и обратных ссылок, возможно она не имеет большого значения для вашего сайта. Вы должны вручную просмотреть страницу и удалить со своего сайта (иногда следует перенаправлять на похожий контент).
  • Перенаправить на похожий контент (301). Если на странице нет органического трафика, но есть обратные ссылки, вы можете сохранить ссылочный вес, установив перенаправление 301 на аналогичную страницу.

Данные API дают нам огромное число метрик, используя которые можно более достоверно оценивать качество контента. Кроме того, желательно все же просматривать все приговоренные к удалению или перенаправлению страницы вручную.

Просматривая и оценивая качество страниц внимательно прочтите их. Убедитесь в актуальности и значимости контента. Убедитесь что тема контента соотносится с нашим брендом (тематичность контента). Тогда более сложная схема обработки страниц может выглядеть следующим образом.

Переписать и улучшить нужно страницы:

  • С трафиком, но низкой конверсией, малым временем, проведенном на сайте, высокими показателями отказов, малым числом просмотре страниц за сеанс.
  • Ключевые страницы после ручного анализа содержимого.

Обновите и актуализируйте контент, брендинг, ключевые слова и т. д.

Объединить (консолидировать) необходимо страницы:

  • с перекрывающимися темами, которые не являются по отдельности достаточно ценными, но при объединении могут создать качественный контент;
  • сезонные темы (например лучшие товары лета 2019 года, лучшие товары осени 2019 года — в лучшие товары 2020 года).

Удаляем страницы:

  • с контентом низкого качества, без входящих ссылок на него, без трафика за последние 90 дней из органической выдачи, без значительных социальных метрик;
  • полностью нерелевантный контент;
  • полностью устаревший контент, который не стоит усилий по его модификации (например стратегии продвижения 2010 года).

Оставляем «как есть» страницы с хорошим трафиком, уникальным, качественным контентом, хорошей конверсией и поведенческими показателями.

Теперь все эти решения по контенту заносим в Excel — таблицу и приступаем к удалению или модификации контента.+

4.2. Удаление дубликатов контента

Отдельной работой является избавление сайта от полных или частичных дубликатов контента. Нет ничего хуже, чем наличие на сайте нескольких копий контента.

Избавляемся от частичных и полных дублей в пределах сайта. Здесь могут быть следующие сценарии ваших действий.

Удалить дубликаты страниц:

  1. Малоценные, не приносящие трафика копии контента за последние 90 дней, без внешних ссылок.
  2. Плагиат контента с иных сайтов.
  3. Разнообразные «гостевые посты», если они были опубликованы еще где-то.

Прописать каноническую страницу для дубликатов:

  • Где есть хорошая социальная метрика, приводящая посетителей;
  • Адреса с параметрами в урл (например /?sort=weight&size=low). В robots.txt настраиваем Disallow /?sort*
  • Страницы пагинации.

Переписать и отредактировать контент необходимо для:

  1. Главной страницы, важных разделов, самых продающихся продуктов.
  2. Страниц, на которые ведут внешние ссылки.
  3. Дубли страниц с трафиком из органической выдачи.

Заключение

После удаления наиболее некачественного содержимого вашего сайта и редактирования или объединения контента для повышения его качества, должен наблюдаться рост трафика.

Это связано с тем, что средневзвешенный уровень качества сайтов в Интернете довольно низок. В Топах органической выдачи сидят,  в основном, старые сайты. За время их жизни оптимизаторы использовали десятки различных стратегий продвижения, нередко противоречащих друг другу. За долгие годы на сайтах накопился балласт статей ненадлежащего качества и просто устарелого контента, не несущего никакой пользы. Просто избавившись от груза старого, ненужного контента, вы поднимете уровень качества сайта и сможете улучшить ваши позиции в органике.

Немаловажным фактором является также избавления от массы алгоритмических штрафов, которые наверняка были наложены на сайт за некачественный, неуникальный контент.

Следите за своими страницами. Пусть сверхдлинные НЧ, пусть по 10 посетителей в квартал, но основная масса страниц должна приносить трафик.

Если вам до слез жалко удалять контент — перенесите его в отдельную рубрику (архив), закрытую от индексирования. Измените урлы контента. Проверьте чтобы контент по новым адресам не индексировался. Удалите все внутренние ссылки сайта на старые адреса контента.

Аудит контента проводите периодически, раз в год. Новый контент создавайте с учетом требований Поисковых систем к качеству контента.

Не забывайте заниматься постоянным улучшением контента. Делайте внутреннюю перелинковку, стройте ссылочное, привлекайте трафик из социальных сетей.

Не замыкайтесь только на улучшении качества контента.

Существуют десятки проверенных стратегий развития сайта, которые помогут Вам занять достойные места в ТОПах поисковой выдачи.

34

Об авторе:

DrMax. Занимаюсь аудитами, оценкой качества YMYL проектов и SEO сайтов более 18 лет. В портфолио несколько десятков проектов как региональных частников, так и крупнейших мировых компаний. Владелец SEO блога Drmax.su. Автор более 20 книг по продвижению и аудиту сайтов.
  Посмотрите еще

Комментарии

  1. Денис  29 октября, 2017

    «Примеры некачественного контента — Индексируемые теги блога.» Ты тут не ошибся?

    ответ
    • DrMax  30 октября, 2017

      Денис, абсолютно не ошибся.
      Вот например 2 страницы тегов:
      https://drmax.su/tag/seo/ — тег seo
      https://drmax.su/tag/onsite-seo/ — тег внутренняя оптимизация.
      Эти страницы фактически совпадают. Что есть очень плохо. Более того, они не несут абсолютно никакой добавочной пользы в глазах поисковых машин, если представлены в таком вот виде.
      Кроме того, они снижают уникальность отдельных статей (за счет куска контента из статьи).
      Более того эти теги весьма и весьма пересекаются с рубриками.
      В большинстве (95%) блогов будет все тоже самое. Вариант тут один — закрыть от индексирования.

      Есть, в принципе вероятность, что мне придет в голову фантазия отойти от «плоской структуры» сайта в виде «рубрика —> статья» и сделать шахматную структуру, опираясь на теги.
      В принципе, они для этого и были задуманы. Как пример: рубрики — производители игр, тэги — типы игр (аркады, РПГ, стрелялки, бродилки… )
      Но в этом случае, я для каждого тега пропишу:

      1. Тайтл, на который захочется нажать, отличный дескрипшен.
      2. На страницу тега я сделаю статью, поясняющую что это за тег. Добавлю туда уникальное медиа.
      3. Вывод статей сделаю просто списком или еще как, но не снижая уникальность самих статей (например пропишу эксцерпты к статьям, что я не делаю из за ленности)

      и другого варианта тут, без снижения качества сайта — нет. Вот таки страницы с тэгами будут нести дополнительную ценность для сайта.
      А в противном случае — только disallow в роботсе 😉

      ответ
      • Денис  9 ноября, 2017

        «Вот таки страницы с тэгами будут нести дополнительную ценность для сайта.» — я это и имел ввиду в своем вопросе. Не подумал, что кто-то может безграмотно использовать теги. Это ведь шикарный инструмент для продвижения.

        ответ
      • Михаил  7 декабря, 2017

        Вы поэтому вообще удалили теги с вашего сайта, drmax? Понравились статьи в вашем блоге, подписался по емейл. Хороший контент, но у вас мало трафика, в чем может быть причина?

        ответ
        • DrMax  7 декабря, 2017

          Да, тэги пока не нужны. Чтобы ими воспользоваться по уму, их (страницу каждого тэга), нужно оформлять, писать контент для них, дескрипшены, тайтлы придумывать и пр. Пока это не интересно.

          Михаил, все просто по трафику:
          1. Нет ни одной покупной ссылки. Более того, проект пока никак не продвигался внешними, от слова совсем (пяток форумов не в счет)
          2. Мало контента. Сейчас опубликовано всего 15 статей 😉 Сотня посетителей в день на такое количество контента — это хорошо.
          3. Нет структуры, нет поддерживающих страниц. Сейчас потихоньку начал писать заготовки. Смотрите раздел «аудита». Буду строить SILO — структуру, посмотрим что это даст.
          Вот и все тайны 😉
          З.Ы. ну и главное — это некоммерческий проект, пишу больше для своего интереса.

          ответ
      • Cloud Broker  8 мая, 2019

        Ну прям всем советовать не индексировать Теги конечно не стоит. Да в большинстве моих проектах, теги убираю с индекса и они нужны только для навигации + по ключам в самой статье иногда помогают.

        Но! Прямо сейчас для одного мобильного приложения делаю сайтец, только для трафика с картинок и там интересная структура сайта получилась, в которой не хило все завязалось на тегах. Просто нужно не добавлять одну статью в 10 тегов, а правильно планировать контент план. Короче закрывать нужно если не думаешь, а если подумаешь, то иногда и не нужно ))

        ответ
        • DrMax  12 мая, 2019

          Полностью согласен.
          Но 99% товарищей абсолютно не продумывает тегирование.

          ответ
  2. Андрей  30 октября, 2017

    Привет, спасибо за статью.
    Три вопроса:
    1) » Адреса с параметрами в урл (например /?sort=weight&size=low). Здесь прописываем мета тэг canonical к базовой странице продукта. В robots.txt настраиваем Disallow /?sort*» — Зачем прописывать Disallow /?sort в robots, разве сам canonical не решит проблему?

    2) Если у меня интернет-магазин и есть страницы с товарами заточенные под НЧ «зеленые кресла на колесиках из экокожи» например, трафа 0, но и частотность у него 0, удалять или нет? Хотелось бы ответ в двух вариантах: 1. Позиции запроса в топе, 2. Позиции запроса не в топе.

    3) Новое руководство будет полезно владельцам Интернет магазинов? Может планируешь руководство конкретно по работе интернет магазинов ну или хотя бы серию статей?

    Заранее спасибо.

    ответ
    • Андрей  15 ноября, 2017

      А почему меня игнорят?

      ответ
      • DrMax  16 ноября, 2017

        Прошу прощения, Андрей, проглядел 😉

        1. См что говорит Яндекс «Робот считает ссылку с атрибутом rel=»canonical» не строгой директивой, а предлагаемым вариантом, который учитывается, но может быть проигнорирован.» https://yandex.ru/support/webmaster/controlling-robot/html.xml

        2. мммм… карточки товаров то зачем резать? Если есть этот реальный товар, то он может продаваться не только из органик выдачи, апоетитель может попасть: по внутренним переходам, по ссылкам из соцсетей и пр и т.д.
        или речь идет о том что товар один (кресла из экокожи на колесиках), и есть несколько их вариантов расцветки? тогда давим все дубли кроме базового (см п.1.)
        Уточните этот вопрос, пожалуйста.

        3. Будет полезно новое руководство. В принципе хочу еще сделать не отдельное руководство по инет магазинам, а просто большую статью по основным ошибкам, допускаемыми владельцами магазинов. Особо много ошибок с пагинацией допускают.

        ответ
  3. товары  10 ноября, 2017

    А если это ИМ и на сайте много товарных страниц, на которых кроме харк-к ничего нет.
    Какое колв-о текста по вашему мнению оптимально будет писать для карточки товара ? 500 символов достаточно?

    ответ
    • DrMax  10 ноября, 2017

      Буржуи рекомендуют от 2000 слов писать на карточке 🙂
      Но мы то понимаем что они зарвались. Посему объем текста на карточке нужен тот, чтобы удовлетворить информационную потребность покупателя. Характеристик и описания в пару абзацев — за глаза.
      Остальное — добирайте отзывами.

      ответ
  4. Внимательный читатель  17 ноября, 2017

    Если позволите, задаи пару вопросов.
    «Поисковые системы оценивают качество страниц сайта и выставляют комплексную оценку, выражающуюся числом запросов в ТОПе выдачи и, как результат, в трафике на отдельные страницы вашего сайта.» Начем основан этот вывод?
    Второй вопрос. «Средний уровень качества всего сайта составляет 36,3. В целом наш сайт не дотягивает даже до среднего уровня качества.» Каков он средний уровень качества и где прописан этот расчёт?

    ответ
    • DrMax  20 ноября, 2017

      Вячеслав, на первый вопрос даже смысла нет отвечать, на второй — см такие слова как ..Предположим … Примем.. и пр.

      ответ
  5. Enemy  16 декабря, 2017

    Спасибо, статья понравилась и решил попробовать на своем проекте эти рекомендации. Удалил 30 статей из 147. Переписал их и добавил с новыми адресами. Общий трафик этих старых 30 статей = 869-893 в день, после изменений эти 30 статей приносят трафик = 1300 в день. Общий трафик статей которые не трогал вырос на 2.6%, сезонность учитывалась. СУПЕР!

    ответ
    • DrMax  17 декабря, 2017

      Хорошие результаты, но это только начало.
      Отпишите по сайту, пожалуйста, через пару месяцев. Как видите из примеров, рост трафика занимает до полугода — связано с переиндексацией и постоянными пересчетами показателей сайта.

      ответ
  6. Олег  24 января, 2018

    Здравствуйте!
    Если около 70 процентов страниц нужно удалить, так как информация либо не уникальна и по сути не интересна аудитории (перепечатка новостей), либо устаревшие данные (на сайте есть более актуальная информация). Как это может сказаться на сайт ввиду большого удаления документов ?

    ответ
    • DrMax  24 января, 2018

      Скорее всего плюсанут поисковые системы.
      Если опасаетесь, то:
      1. Проверьте есть ли на них трафик. Если есть — не трогайте.
      2. Где трафика нет — пропишите мета-тег noindex в заголовке

      ответ
      • Олег  24 января, 2018

        Спасибо за ответ!
        Там трафика вообще нет.
        Вы рекомендуете физически не удалять, а просто запретить к индексированию?

        ответ
        • DrMax  24 января, 2018

          ну для страховки сделайте так.
          в принципе, всегда перед удалением надо делать деиндексацию. Для этого на 2-3 недели ставим ноиндекс, только потом физически удаляем, не заабывая убирать ссылки на удаленные страницы.
          трафика нет — это плохо. Дело не только в некачественном контенте. Это всего лишь составляющая в системе качества сайта.
          тут просто удаление не поможет. надо рыть глубже.

          ответ
          • Олег  24 января, 2018

            Спасибо за деиндексирование, не придавал этому большого значения.
            По-поводу качества страниц: это сайт более новостного направления, хотя и не новостник. То есть информция 2014-2015 года вообще никак не помогает. А таких страниц довольно большое количество.
            Попробую постепенно проводить деиндексацию и смотреть на результат.

            ответ
  7. Иван Доброславин  4 апреля, 2018

    Удалил 7 страниц, на которых был блок с формой отправки заявки и немного текста — буквально очень краткое описание с ключевыми словами. 7 разных страниц с разными текстами, форма одинаковая. Закрыл от индексации в robots и указал на удаление в вебмастерах Яши и Гоши. Сайт сильно просел по посетителям. Может ли это быть связано?

    ответ
    • DrMax  5 апреля, 2018

      Если сайт небольшой и на страницах этих был трафик — то запросто. Но скорее всего дело не в этом, ибо даже для 100-страничника 7 страниц ничего особого не дают, тем более неинформативные. Ссылки были на эти страницы ? Если да, то нужно 301 редиректом их перенаправить куда нибудь, а не оставлять на откуп 404 странице.
      Ну и проверить еще надо, нет ли из контент на сайте ссылок на эти страницы, не расплодились ли из за этого «битые» страницы. Ну и напоследок еще раз нужно проверить корректность закрытия в роботсе — не попали -ли под замес не страницы эти удаленные, а целые группы страниц.

      ответ
  8. Ник  27 февраля, 2019

    А как правильно ставить canonical в категориях, где пагинация? Нужно ли на последующих страницах ставить canonical все на первую страницу категории?

    Смотрел пару десятков сайтов, но каждый делает по-разному. Читал в Яндексе лучше указывать canonical первой страницы, а для google вроде как не очень и лучше дополнительно указывать rel=»next», rel=»prev».

    Сайт на joomla и все не могу прийти к конечному решению как сделать canonical для категорий и тегов. Как Вы думаете лучше? Спасибо.

    ответ
    • DrMax  27 февраля, 2019

      День добрый.
      1. Метатег canonical для 2-n страниц указываем на рубрику
      2. Обязательно «сшиваем» пагинацию prev и next
      3. Не забываем первую страницу приклеить к рубрике (это дубликаты)
      4. Со второй страницы не забываем ставить prev на рубрику (а не на первую)
      Писал вроде как неоднократно про это )))

      ответ
  9. Александр  12 апреля, 2019

    Здравствуйте. Меня интересует вопрос про возраст урлов. Есть ли такой параметр? Вы советуете удалять контент. А если например есть статья про оптимизацию сайтов в 2010 году, а я хочу на основе ее урла (оптимизация сайтов) переписать полностью статью под 2019 год. Как поисковики отреагируют на такое изменение?

    ответ
    • DrMax  12 апреля, 2019

      Александр, спасибо за вопрос.
      Тут не как с доменом, чем старше статья — тем больше шансов, что она устарела, данные стали неактуальными, не отвечает требованиям к качеству. Поэтому время — от времени статьи надо обновлять и актуализировать. При этом менять дату модификации статьи.
      Если статья будет совершенно иной, то лучше, конечно, выложить её на новом URL. Однако, если тематика та же, плюс есть ссылочное или соц/сигналы, то разместите новую статью на старом URL

      ответ
      • Александр  15 апреля, 2019

        Спасибо за ответ. Да, я заметил, что на многих англоязычных сайтах стоит дата обновления статьи и обычно рядом с данными по автору статьи. На наших такого не замечал. Тогда возникает следующий вопрос. Как менять дату модификации статьи? Например в вордпресс. В нем можно обновить контент, но дата публикации не меняется.

        ответ
  10. Александр  16 апреля, 2019

    Спасибо за ответ. Да, я заметил, что на многих англоязычных сайтах стоит дата обновления статьи и обычно рядом с данными по автору статьи. На наших такого не замечал. Тогда возникает следующий вопрос. Как менять дату модификации статьи? Например в вордпресс. В нем можно обновить контент, но дата публикации не меняется.

    ответ
    • DrMax  12 мая, 2019

      Если говорить о WordPress, то как правило, там все на автомате настроено (дата модификации в сайтмапе Lastmod). Но, проверьте что отдает и сервер в заголовке Last modified.
      И руками все равно я бы рекомендовал писать — это юзер френдли 😉

      ответ
  11. Ксения Солнечная  13 октября, 2020

    Большое спасибо! Понятно, полезно, доступно.

    ответ
  12. АРТЕМ  13 октября, 2020

    http://joxi.ru/KAgPjqKfEDaNer
    API наверное имелось ввиду?

    ответ
    • DrMax  14 октября, 2020

      Артем, большое спасибо что заметили. Ошибся, поправлю.

      ответ
  13. Юрий Бедулин  17 октября, 2020

    Спасибо, вновь перечитал Вашу статью

    ответ

Добавить комментарий