Пожалуй, лучшим заголовком для данного материала стала бы одна из любимых присказок военрука (был когда-то в школе такой предмет – НВП, начальная военная подготовка):
«Лучшее – враг хорошего».
Но это явно оценочное суждение, что с точки зрения все тех же Новостей Яндекса (далее – ЯН) – заголовок плохой.
А теперь – по существу. И, надеюсь, дополнительно разъяснять, что такое «ЧПУ» и «CMS», упомянутые в заголовке, не нужно.
Заглянул как-то в очередной раз в ленту источника ЯН и чуть не опешил, дубли! (ЯН их «засвечивает», бросаются в глаза сразу) При чем дубли – на материалах, которые не только плагиатом, но и рерайтом быть не могут!
Задело! Перешел у «Анкету» партнера ЯН, там есть вкладка – как раз для поиска дублей с указанием, что сервис посчитал первоисточником публикации.
Сюрприз! Первоисточник – наш сайт. Но как же так?! Ведь приходило же письмо от ЯН, где было сказано, что перестают считать дублями пусть и похожие, но разные публикации из одного и того же источника!
Что обычно делают, не понимая и не разобравшись? Как вы, не знаю, а я написал в поддержку.
Ответ пришел достаточно быстро.
Чуть позже понял, что еще и очень вежливый ответ.
А ведь могли бы просто написать примерно следующее:
«А на фига вы, … , под новым URL старую новость опубликовали? Только заголовок поменяли, остальное – до буквы, пробела и запятой совпадает! И после этого ее дублем не считать? Даже не похожи две новости, а аутентичные!»
А что произошло на самом деле…
Была на сайте опубликована новость.
Через некоторое время шеф-редактор осознал, что новость опубликована с «рабочим» названием. И не то, чтобы оно, название, не такое, но как-то, подумал шеф-редактор, на заголовок не похожее. И попросил редактора сайта поправить.
А CMS то тоже «умная», она же в курсе, что ЧПУ должен совпадать с заголовком…
И с нашей точки зрения, просто поменяли заголовок.
А ЯН в RSS увидели новый URL, т.е. новую новость. Ведь четко сказано в Партнерской программе:
Уникальным идентификатором каждого сообщения (новости) является ее URL (адрес в интернете). Каждый URL должен вести на отдельную страницу с полным текстом сообщения (ссылка на список новостей или на главную страницу сайта — нарушение этого условия), при этом заголовок и начало текста должны быть видны на первом экране.
Робот ведь как работает? Как американец на таможне у Михаила Задорнова – никакой «соображалки». Увидел новый URL – проиндексировал новый URL, сопоставил текст нового URL – либо в сюжет новый URL, либо, как в нашем в случае, в «дубль», за абсолютное, кроме title, совпадение с ранее проиндексированным URL.
А новость с прежним URL тоже из ЯН попала. Но уже из-за нюанса, описанного в Технической документации:
Элемент yandex:full-text должен содержать полный актуальный текст новости… Если текст новости на сайте был изменен после публикации, его необходимо обновить и в yandex:full-text.
А на прежнем URL уже 404-я ошибка! И как тут full-text изменить? Вернуть прежнее название (или хотя бы URL) сразу не догадались. И что из этого получилось бы или не получилось – точно сказать не могу.
И ладно бы на чем-то ином «проколоться». Обидно, что в тот день именно эта новость одной из самых «горячих» была.
С того случая – стал читать «мануалы» повнимательнее, не только перед тем, как написать в поддержку.
Чего и вам советую.
И поаккуратнее с «умными» CMS и не менее «умными» роботами. Это мы умеем микроволновкой и всяким прочим без инструкции пользоваться. Они (CMS и роботы) – только и строго по документации. Нам этому еще:
Учиться! Учиться! Учиться!
Спасибо поддержке ЯН, что терпят (сколько подобных, от недочтения «мануалов», вопросов к ним – страшно даже представить) и подробно объясняют!
И раз уж начал с присказки военрука, завершаю его же загадкой.
В каком слове семь гласных и все «О»?
Он нам, ученикам старших классов, задал ее, чтоб некий снобизм по отношению к его предмету сбить, чтоб не считали себя самыми умными…
В отличие от нашего военрука долго томить не буду – ОбОрОнОспОсОбнОсть.
И где про такое (в каком слове семь гласных и все «О»), кроме как на НВП, узнаешь?