Стандарты SEO

Данный документ является краткой выдержкой из гайдлайнов поисковых систем по верстке. Соблюдение указанных ниже гайдлайнов обеспечит нам нормальную индексацию поисковиками и красивые сниппеты в поисковой выдаче.

Метаинформация

Что писать в <title>

Тег <title> используется поисковиками в качестве текста ссылки на страницу из выдачи. Поэтому от того насколько хорошо сформирован заголовок во многом зависит то насколько часто на него будут щелкать. Хороший заголовок отличается от полого в первую очередь тем что он как минимум есть и как максимум в нем осмысленная часть стоит перед названием сайта и прочими вещами.

Что писать в <meta>

Есть несколько метатегов которые влияют на индексацию и выдачу, нас в первую очередь интересует возможность задавать для каждой страницы с контентом теги keywords и description. Первый используется при индексации, второй может использоваться в качестве сниппета текста при поисковой выдаче.

Эти теги нужно писать всегда:

<meta name="Keywords" content="">
<meta name="Description" content="">

Также есть еще некоторый набор тегов robots которые говорят поисковику что и как можно индексировать, но про них будет написано отдельно.

Подробнее про метатеги на Яндекс.Вебмастере.

Что писать в <link>

Тут нас интересует следующий тег:

<link rel="canonical" href="http://www.examplesite.ru/blog">

Первый из них более важный. В случае когда страница выводится на сайте по нескольким URL (например когда мы добавляем в них свои GET-параметры для отслеживания статистики через GA и Метрику) canonical говорит поисковику какая версия страницы является оригиналом. В таком случае поисковик индексирует только её и не индексирует другие варианты написания её адреса. Это помогает поддерживать статистику актуальной и не загаживать поисковик кучей лишних ссылок для индексации.

Тег являются обязательными для всех индексируемых страниц.

Описание link rel=canonical на Google Webmasters

Скрытие информации от поисковиков

Есть некоторый набор метатегов, тегов и атрибутов которые используются поисковиками для выбора того что нужно и что ненужно индексировать.

  1. <meta name="robots" content="all"> — разрешено индексировать текст и ссылки на странице, аналогично <meta name="robots" content="index, follow">
  2. <meta name="robots" content="noindex"> — не индексировать текст страницы,
  3. <meta name="robots" content="nofollow"> — не переходить по ссылкам на странице и не индексировать их,
  4. <meta name="robots" content="none"> — запрещено индексировать и текст, и ссылки на странице, аналогично <meta name="robots" content="noindex, nofollow">
  5. <meta name="robots" content="noarchive"> — не показывать ссылку на сохраненную копию на странице результатов поиска.

Из них нас в первую очередь интересует noindex. Есть ряд страниц на которые поисковики могут зайти и проиндексировать, но которые мы не хотим чтобы в поисковый индекс попадали и там сохранялись. В первую очередь это касается защищенных частей сайта которые видны только после ввода пароля, а также динамически генерируемых на короткое время страниц вроде поисковой выдачи или выборки по фильтрам. В шапке подобных страниц нужно прописывать запрет индексирования.

Список страниц на которых нужно обязательно это делать:

  1. Результаты поисковой выдачи.
  2. Результаты выборки по фильтрам.
  3. Страницы личного кабинета пользователя.
  4. CMS.
  5. Возможно какие-то еще специфично для данного сайта.

Кроме мета-тегов есть другие способы запретить поисковику индексировать те или иные страницы — это тег <noindex> и атрибут ссылок rel=”nofollow”.

Первым можно закрывать части страниц которые мы не хотим чтобы попадали в индекс (например длинные служебные тексты с подсказками).

Для прохождения HTML-валидации можно записывать тег <noindex> как комментарий. Пример:

<!--noindex-->текст, индексирование которого нужно запретить<!--/noindex-->

Атрибут rel=”nofollow” нужно ставить на всех ссылках которые ведут на страницы которые не надо индексировать (смотри список выше).

<a href="url" rel="nofollow">текст ссылки</a>

Контент-зона

Заголовки

У контента на странице должна быть четкая структура, по которой поисковик и пользователи смогут ориентироваться в том что и где находится. Для описания структуры можно и нужно использовать теги <section> и <h1>-<h6>.

Проверяется в FF через плагин Web Developer → Information → View Document Outline. Красных строк быть не должно!

Картинки

У всех контент-картинок которые используются на странице сайта должны быть указаны alt. alt использует поисковиками по картинкам при их индексации. Также при индексации используется название файлов картинок, поэтому оно по возможности тоже должно быть осмысленным.

Теги

Поисковики до некоторой степени понимают семантику новых HTML5-тегов вроде <header>, <footer>, <nav>, <address> и прочих. Поэтому стоит по возможности использовать их для того чтобы им помочь с парсингом и индексацией.

Микродата

В HTML5 появился формат для дополнительного описания семантики документа под названием microdata. При помощи этого формата можно помогать поисковикам и другим роботам более точно индексировать документы, специальным образом размечая выводящуюся на страницу информацию.

Чтобы все заработало нужно добавить для некоторых тегов на определенных страницах несколько дополнительных атрибутов. На блок с описываемым контентом на странице нужно поставить атрибуты itemscope и itemtype (url в последнем должен указывать на страницу с описанием формата). например:

<div itemscope itemtype="http://schema.org/Organization" >
...
</div>

А на элементы внутри блока нужно добавить фтрибут itemprop с правильным значением. Например:

<span itemprop="streetAddress">Льва Толстого, 16</span>

Список понимаемых всеми крупными поисковиками форматов находится по адресу schema.org , туда можно сходить и прочитать про этот формат поподробнее. Нас же больше всего интересуют следующие форматы, понимаемые Яндексом и Google и влияющие на вид выдачи:

  1. Информация об изображении (дляя фотогаллерей и отдельных фотографий):
    Яндекс.Вебмастер

  2. Информация о видео (для встроенного видео):
    Яндекс.Вебмастер | Google Webmasters

  3. Словарная статья:
    Яндекс.Вебмастер

  4. Адрес организации (адрес в футере должны быть описан этим микроформатом, в идеале на странице о компании тоже):
    Яндекс.Вебмастер | Google Webmasters

  5. Рецепт (рецепты еды):
    Яндекс.Вебмастер | Google Webmasters

  6. Рецензия (отзыв на фильм, машину, товар в интернет магазине и прочее.):
    Google Webmasters

  7. Персона (карточка отдельного человека, например в разделе сотрудников или на новостном сайте):
    Google Webmasters

  8. Карточка товара (карточка товара в интернет-магазине):
    Google Webmasters

  9. Событие (концерты, митинги, собрания и прочее, то что можно поставить в календарь):
    Google Webmasters

  10. Информация о музыкальном треке:
    Google Webmasters

Информацию которая попадает под эти категории нужно обязательно размечать через микродаты. Другие виды разметки информации поисковики тоже понимают, но они на выдачу влияют не так сильно.

Ссылки по теме:

  1. Статья на Яндекс.Вебмастер
  2. Статья на Google Webmasters
  3. http://schema.org

Микроформаты

Микрофрматы это альтернативный способ описание контента страницы понятным для поисковиков способом. В данном случае используются стандартные названия css-классов. По общему правилу если мы описали какой-то кусок данных через микродату, повторять её в виде микроформатов необязательно. Исключение ситуации когда какой-то поисковик для разметки какого-то типа контента понимает только микроформаты.

Пока таких исключений два:

  1. hProduct — используется Яндексом для индексации машин в Яндекс.Авто.
  2. hReview — используется Яндексом для индексации отзывов на машины на Яндекс.Авто.

Для автосайтов нужно использовать в разметка данные два формата.

ВАЖНО: Названия классов используемые для микроформатов НЕ должны использоваться для оформления.

Статус: Черновик

Планируемый пересмотр: Декабрь 2012 года

Материалы по теме:

  1. Яндекс.Вебмастер
  2. Google Webmasters