Теги Canonical существуют с 2009 года. То есть, почти десять лет. Цель, для которой их создали — помочь вебмастерам решить проблему дублирующегося контента.
- Что такое тег canonical
- Как выглядит тег canonical
- Важность канонических тегов для SEO
- ...но у меня же нет дублирующегося контента!
- Основы применения тега canonical
- Как применять канонические адреса
- Распространенные ошибки и их профилактика
-
Как найти и решить проблемы с каноническими адресами на сайте
- 1. Проблемы с 4XX
- 2. Проблемы с 5ХХ
- 3. Проблемы с редиректами
- 4. Дублирующие страницы без канонизации
- 5. Hreflang и non-canonical
- 6. Канонический URL не имеет входящих ссылок
- 7. Неканонические страницы в sitemap
- 8. Неканоническая страница определена как каноническая
- 9. Open Graph URL не соответствует каноническому
- Заключение
Что такое тег canonical
Это фрагмент HTML-кода, который определяет основную версию для нескольких страниц с похожим или полностью дублирующимся контентом. Другими словами, если по разным адресам есть одинаковый контент, вы можете использовать этот тег, чтобы указать, какая страница является основной, и следовательно, которую нужно проиндексировать.
Как выглядит тег canonical
Теги используют простой и согласованный синтаксис, размещаются в разделе
веб-страницы:
<link rel="canonical" >
Что значит каждая часть:
- link rel=”canonical”: ссылка является основной (канонической) версией этой страницы;
- href=": каноническую версию можно найти по этому URL.
Важность канонических тегов для SEO
Google не любит дублирующийся контент, потому что сложно выбирать оригинал:
- Какую версию страницы надо проиндексировать?
- Какая версия страницы подходит для ранжирования по релевантным запросам?
- Нужно ли объединять ссылочный профиль на одной странице или разбивать его на несколько версий?
Слишком большое количество дублирующегося контента также может повлиять на бюджет сканирования. Это значит, что Google будет тратить время на сканирование нескольких версий одной и той же страницы вместо поиска другого важного материала на вашем сайте.
Канонические теги решают все эти проблемы. Они позволяют вам сообщить, какую версию страницы следует сканировать и ранжировать, где консолидировать любые ссылки.
Если вы не укажите канонический адрес, Google все решит за вас. Самостоятельно.
А полагаться на его грамотный выбор — опрометчиво. Система может выбрать в качестве основной страницы ту, которая в действительности таковой не является.
...но у меня же нет дублирующегося контента!
Да, наверняка вы не стали публиковать одну и ту же статью несколько раз. Но поисковые системы обходят URL, а не страницы.
Это значит, что они воспринимают адреса example.com/product и example.com/product?color=red как уникальные, даже если на них содержится, по факту, один и тот же контент.
Это — параметрические адреса. Они — частая причина возникновения дублирующегося контента. Особенно, если у вас интернет-магазин с фасетной или фильтрованной навигацией.
Например, Brown Bag Clothing продает рубашки. Вот адрес для основной категории товаров:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html
Если в фильтре выбрать показы только рубашки размером XL, в адрес добавится параметр:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL
А если нам нужны вдобавок только рубашки голубого цвета, увидим еще один параметр:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue
Это все отдельные страницы для Гугла, а содержание практически одно и то же.
Однако, такая проблема встречается не только для сайтов электронной коммерции. Вот еще несколько случаев:
- Параметры поисковых запросов в URL (example.com?q=search-term)
- Параметры сессии (https://example.com?sessionid=3)
- Наличие раздельных версий страницы для просмотра и для печати ( example.com/page и example.com/print/page)
- Уникальный url для постов в разных категориях (example.com/services/SEO/ и example.com/specials/SEO/)
- Отдельные адреса для версий страниц для разных девайсов.
- Наличие версий страницы с AMP и без нее.
- Наличие одинакового контента по адресу с www и без него.
В этих случаях использование канонических тегов имеет решающее значение. Кроме того, важны проблемы дублирования контента на разных доменах. Например, при синдикации контента: газета хочет процитировать ваш текст. В таком случае вам надо попросить разместить на вас каноническую ссылку.
Во-первых, вы будете получать реферальный трафик. Во-вторых, обезопасите уникальность вашего контента.
Основы применения тега canonical
Применять легко. Мы рассмотрим четыре способа это сделать далее. Пока — пять основным правил, которые нужно знать и соблюдать.
Правило 1. Использовать абсолютные URL
Джон Мюллер из Google утверждает, что не рекомендуется использовать относительные ссылки вместе с тегом canonical. Чтобы они точно корректно обработались, используйте абсолютные URL.
То есть, вот так:
<link rel=“canonical” >
Вместо:
<link rel=“canonical” href=”/sample-page/” />
Правило 2: Соблюдать нижний регистр
Google может обработать и нижний, и верхний регистры как два разных адреса. Поэтому вначале установите принудиттельно строчные адреса на своем сервере, а затем используйте нижний регистр для написания адресов в ссылках с каноническим тегом.
Правило 3: Правильно использовать версию домена
Если переходите на SSL-сертификат, проверьте, что используете верный протокол передачи данных в адресе, то есть, HTTPS. Теоритически, это тоже может привести к путанице и неожиданным результатам.
Вот так правильно:
<link rel=“canonical” >
А вот так — нет:
<link rel=“canonical” href=“http://example.com/sample-page/” />
Правило 4: Использовать самоссылочные канонические теги
Джон Мюллер говорит, что это — рекомендация, а не обязательство.
Это — каноническая ссылка сама на себя.
Располагаться она будет на этой же странице.
Большинство популярных CMS делают это автоматически. Но на всякий случай проверьте.
Правило 5: Использовать один канонический тег на странице
В противном случае Googlebot проигнорирует вообще все канонические теги на странице.
Как применять канонические адреса
Всего есть 4 способа:
- HTML-тег;
- HTTP header;
- Карта сайта;
- 301 редирект.
Для подробностей можно посмотреть официальную справку.
1. Установка в HTML-тегах
Самый простой способ — указать тег rel-canonical в адресе. Добавьте нижеследующий код в раздел header:
<link rel=“canonical” href=“https://example.com/canonical-page/” />
Пример
Предположим, у вас есть интернет-магазин футболок. Вы хотите установить адрес каноническим. Учтем, что по разным адресам доступен одинаковый контент.
Можно просто на все дублирующиеся страницы добавить такую строку кода:
<link rel=“canonical” >
Обратите внимание, что если вы используете CMS, возиться с кодом не нужно. Есть более простой способ.
Настройка канонических тегов в WordPress
Установите плагин Yoast SEO. Сможете автоматически добавлять канонические адреса. Используйте вкладку “Дополнительно”.
Установка канонических тегов в Shopify
Shopify добавляет по умолчанию канонические адреса для продуктов и блогов. Чтобы установить пользовательские каноничные URL, отредактируйте файлы шаблона напрямую.
Установка канонических тегов в Squarespace
Squarespace добавляет рекурсивные URL-адреса также по умолчанию. Как и в случае со Shopify, придется редактировать код напрямую, если нужно добавить пользовательский канонический тег.
2. Установка канонических тегов в HTTP header
Для документов — например, PDF — нет возможности разместить канонические теги в заголовке страницы, потому что нет раздела. В таких случаях нужно использовать заголовки HTTP.
Пример
Например, представим, что создаем PDF-версию поста в блоге Ahrefs.
HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://ahrefs.com/blog/canonical-tags/>; rel="canonical"
3. Установка канонических адресов через карту сайта
Google заявляет, что неканонические страницы не нужно включать в карту сайта. Т. е. все страницы из карты сайта Google считает каноническими.
Но тем не менее, система не всегда воспринимает все адреса из sitemap должным образом: “Мы не гарантируем, что размещение адреса в sitemap — подтверждение его каноничности. Карта сайта — способ сказать Google, какие страницы сайта владелец считает наиболее важными”.
4. Настройка канонических тегов при помощи 301 редиректа
Используйте 301 редирект в случае, если вам надо перенаправить трафик с дубликата URL-адреса на каноническую версию.
Пример
Ваша страница доступна по адресам:
- example.com
- example.com/index.php
- example.com/home/
Выбираем страницу, которая будет основной. На остальных размещаем редирект на нее.
Обратите внимание: обязательно должно быть соответствие протоколов передачи данных (HTTPS/HTTP и наличие/отсутствие www).
Распространенные ошибки и их профилактика
Есть много недоразумений и неправильных представлений о том, как правильно устанавливать каноничные адреса. Вот некоторые распространенные ошибки.
Ошибка 1: Блокирование канонического адреса через robots.txt
Блокировка URL-адреса в файле robots.txt не позволит Google его просканировать. А значит, он не увидит канонический тег на этой странице. В свою очередь, он не сможет определить отношение между страницами с одинаковым или схожим контентом.
Ошибка 2: Канонический URL и тег noindex
Никогда не смешивайте теги noindex и rel=canonical. Они противоречат друг другу.
Google обычно отдает приоритет каноничности, а не noindex, по словам Джона Мюллера. Но это все равно плохая практика. Если вам нужно запретить индексировать канонический URL, воспользуйтесь 301 редиректом.
Ошибка 3: Установка 4XX статуса HTTP для канонического URL
Установка состояния 4XX для канонизированного URL имеет те же последствия, что и использование тега noindex. Google не сможет увидеть канонический адрес и передать вес ссылок нужной версии страницы.
Страницы навигации не нужно канонизировать относительно первой странице в цепочке. Вместо этого нужно использовать канонические ссылки на саму страницу.
Джон Мюллер заявил, что иной способ канонизации нецелесообразен.
Ошибка 5: Не использование hreflang при канонизации
Hreflang используют, когда нужно указать языковую версию страницы.
Google утверждает, что при использовании hreflang вам также нужно указывать каноническую страницу на том же языке.
Как найти и решить проблемы с каноническими адресами на сайте
1. Проблемы с 4XX
Возникает, когда вебмастер на страницах указывает канонический URL с кодом ответа вида 4ХХ.
Поисковые системы не индексируют страницы 4ХХ, потому что они — не рабочие. В результате поисковик игнорирует любые канонические теги, которые указывают на такие страницы. В итоге в индекс попадает неверная версия страницы.
Поэтому проверьте канонические ссылки, и если в них указан адрес с подобным кодом ответа — исправьте.
2. Проблемы с 5ХХ
Аналогично предыдущему пункту.
Коды ответа такого вида сигнализируют о проблемах на сервере. В результате каноническая страница все равно оказывается недоступна (как и в предыдущем случае).
Нужно, опять-таки, заменить все канонизированные урлы с кодом ответа 5ХХ на доступные. Однако отметим, что код ответа 5ХХ может быть временной проблемой на сервере — например, когда сервер перегружен. В таком случае ничего делать не нужно.
3. Проблемы с редиректами
Предупреждение срабатывает, когда на канонизированном адресе стоит перенаправление на другой URL.
Канонические урлы всегда должны указывать на самую авторитетную версию страницы. Сами понимаете, если на этой “авторитетной” странице стоит редирект, ее надежность под сомнением.
Замените канонические ссылки прямыми линками на наиболее авторитетную версию страницы, которая возвращает код 200.
4. Дублирующие страницы без канонизации
Возникает, когда существует одна или несколько дублирующихся страниц, для которых не указана каноническая версия.
Google будет пытаться самостоятельно определить наиболее подходящую страницу для показа в результатах поиска. В итоге он может выбрать не ту версию, которую хотите увидеть в выдаче вы.
Посмотрите группы дублирующихся страниц. Выберите одну каноническую версию, на остальных укажите ее в качестве основной версии. А на канонической странице установите рекуррентную каноническую ссылку.
5. Hreflang и non-canonical
Срабатывает, когда одна или несколько страниц содержат неканонический URL в аннотациях hreflang.
Ссылки в теге hreflang всегда должны указывать на канонические страницы. Ссылки на неканоническую версию могут ввести в заблуждение поисковую систему.
Поэтому проверьте и замените.
6. Канонический URL не имеет входящих ссылок
Проблема возникает, когда один или несколько указанных канонических адресов не имеет внутренних входящих ссылок.
Канонические адреса без внутренних ссылок недоступны для пользователей сайта. Вместо этого человек попадает на неканоническую версию страницы.
Поэтому проверьте на сайте внутренние ссылки на канонические адреса.
7. Неканонические страницы в sitemap
Возникает, когда в карте сайта указаны неканонические страницы.
Google утверждает, что указывать в картах сайта неканонические страницы не следует. Поэтому он предполагает, что все страницы в файле — те, которые вы хотите проиндексировать.
Не канонические страницы из карты сайта уберите.
8. Неканоническая страница определена как каноническая
Проблема возникает, когда на одной или нескольких страницах указывается канонический URL, который одновременно является каноническим для другой страницы.
Такие цепочки могут ввести в заблуждение поисковик.
Замените неканонические ссылки в канонических тегах затронутых страниц прямыми ссылками на канонические версии. Например, если для страницы А канонической страницей указана В, а для В — страница С, замените каноническую страницу для А с В на С.
9. Open Graph URL не соответствует каноническому
Возникает при несоответствии между указанным каноническим и URL-адресом Open Graph на одной или нескольких страницах.
Если URL-адрес Open Graph не совпадает с каноническим, то неканоническая версия страницы будет опубликована в социальных сетях.
Замените в OpenGraph адрес на канонический, чтобы в соцсети попадала правильная версия страницы.
Заключение
Canonical — это не сложно, если как следует разобраться в логике их работы.
Просто помните, что канонические теги — это не директива, а сигнал для поисковых систем. Другими словами, они могут выбрать каноническую страницу отличную от той, которую укажете вы.
Можно использовать URL Inspection Tool в GSC, чтобы понимать всю картину.
На сайте компании SEMANTICA вы можете заказать продвижение сайта юридических услуг. Оставьте заявку, и мы вам перезвоним в ближайшее время.