Как Google обрабатывает в выдаче страницы с ошибками 404 и 410
В Сети появилось новое обучающее видео от Мэтта Каттса, возглавляющего команду, борющуюся с поисковым спамом Google. В нем он доходчиво разъясняет, чем отличаются коды состояния 410 (Gone) и HTTP 404 (Not Found), как их определяет поисковая система и одинаково ли она их обрабатывает.
Оба кода сигнализируют об ошибке веб-страницы. Они показывают, что она недоступна. Но в данных кодах есть и некоторое отличие.
Если запрошенному URL ни одна страница сайта не соответствует, выдается ошибка 404. На это могут быть следующие причины: искомая страница удалена или ссылка не является верной. При этом код 404 не уведомляет пользователя, исчезла эта страница навсегда или в дальнейшем появится. Например, если вы продвигали страницу сайта по запросу грузовые шины, а затем изменили структуру сайта и сменили URL страниц, то сервер, по-умолчанию, будет выдавать 404-ю ошибку. В этом случае лучше поставить 301-й редирект со старого адреса на новый.
Код 410 определяет состояние сервера, как «удаленный». Он означает, что ранее затребованный URL был, но теперь он не существует, так как с сервера удален.
Этим определяется несколько различное отношение Google к двум описанным кодам.
При коде 404 поисковая система некоторое время «защищает» страницу. В течение суток Google не помечает ее, как удаленную. Через некоторое время поисковый робот обращается к странице опять и проверяет ее состояние.
В случае, если Google находит на странице ошибку 410, она им автоматически помечается в выдаче, как удаленная.
Код ошибки 404 следует использовать в случае, если страница отсутствует, но вы предполагаете, что это временно.
Если же вы не знаете, чем отсутствующую страницу заменить и уверены, что данная страница больше не появится никогда, следует использовать код 410.