banner_nika_hozyaike      banner_pos_bekker     banner_specpredl_roznica_2

Избегайте SEO Spider Trap: как выйти из неприятной ситуации

  1. Что такое ловушка для пауков?
  2. Как выглядит ловушка для пауков?
  3. Бесконечный URL
  4. Смешивать и сочетать ловушку
  5. Календарь Ловушка
  6. Ловушка идентификатора сессии
  7. Что может сделать ловушка для пауков с вашим SEO?

Как консультант по SEO, я слышу всевозможные опасения, связанные с рейтингом сайта. Тем не менее, одна из последних, которую следует упомянуть, - это «ловушка для пауков». С таким большим вниманием, которое уделяется хорошему контенту, приобретению ссылок и созданию динамической социальной сети, важность поискового робота часто упускается из виду.

Мы не должны зацикливаться на этом конкретном вопросе
Мы не должны зацикливаться на этом конкретном вопросе. Да, это сложно и широко неправильно понято, но есть вероятность, что у вас есть сайт электронной коммерции или вы заканчиваете аудит установленного сайта с функцией поиска по ключевым словам, скорее всего, эта проблема уже существует. А ловушка для пауков может означать плохие новости для вашего профиля SEO.

Часто сложно распутать паутину (каламбур); Тем не менее, выявление и исправление ловушек для пауков возможно и является необходимым шагом, чтобы убедиться, что ваш сайт получает то внимание, которого он заслуживает.

Что такое ловушка для пауков?

Ловушка для пауков (или ловушка для гусеничных лент) - это набор веб-страниц, которые могут быть преднамеренно или непреднамеренно использованы для веб-сканер делать бесконечное количество запросов или вызывать сбой плохо сконструированного сканера.

Это происходит, когда сайт создает систему, которая создает неограниченные URL-адреса или ненужные страницы. Эта структурная проблема приведет к тому, что веб-сканер застрянет или окажется в ловушке на ваших «нежелательных» страницах.

Мы знаем, что эти «пауки» или «роботы» необходимы для сканирования наших сайтов, индексации нашего контента и, в конечном итоге, его отображения нашей целевой аудитории. Таким образом, если веб-сайт не позволяет пауку беспрепятственно перемещаться по нему, он достигнет выделенной полосы пропускания и перейдет к следующему веб-сайту.

В этом случае сайт будет считаться «менее чем оптимальным» и будет понижен в рейтинге конкурента. Если проблема обширная, некоторые страницы сайта могут никогда не попасть в поисковую систему и, следовательно, никогда не будут видны.

Как выглядит ловушка для пауков?

Существует четыре основных типа ловушек для пауков - каждый из них выглядит по-разному и требует различных методов идентификации. Они включают:

1. Бесконечный URL : бесконечные разные URL, которые указывают на одну и ту же страницу с дублированным контентом.

2. Смешивание и сопоставление : одна и та же информация представлена ​​бесконечно разными способами (например, миллионы различных способов сортировки и фильтрации списка из тысяч продуктов).

3. Календарная ловушка : страницы, которые технически уникальны, но не содержат полезной информации (например, календарь событий, который уходит на тысячи лет в будущее).

4. Ловушка идентификатора сеанса : почти дублирует страницы, которые отличаются бесконечной детализацией.

Бесконечный URL

Что вызывает это?

Работа с бесконечной URL-ловушкой так же раздражает, как и песня школьного двора. Он может быть скрыт практически на любом веб-сайте и, как правило, является результатом плохо сформированного относительный URL или плохо построенный правила перезаписи URL на стороне сервера ,

Как вы это идентифицируете?

Редко можно увидеть результаты этой ловушки в веб-браузере, поскольку она скрыта глубоко на страницах навигации сайта. Однако, чтобы найти его, вам понадобится сканер веб-сайта. Если у сайта есть именно эта проблема, когда используется инструмент на основе искателя, произойдет следующее:

  • Сканирование на мгновение будет работать нормально, так как ловушка для пауков невидима, пока сканер не достигнет «ненужных» страниц на сайтах.
  • В какой-то момент список просканированных URL-адресов начнет принимать странную форму, где каждый новый URL является просто более расширенной версией предыдущего.
  • По мере продолжения сканирования URL будет становиться все длиннее и длиннее, потому что «он просто продолжается и идет на моего друга…» (вы меня поняли).

Например:

http://yourdomain.com/yourpage.php
http://yourdomain.com/abcd/yourpage.php
http://yourdomain.com/abcd/abcd/yourpage.php
http://yourdomain.com/abcd/abcd/abcd/yourpage.php
http://yourdomain.com/abcd/abcd/abcd/abcd/yourpage.php
http://yourdomain.com/abcd/abcd/abcd/abcd/abcd/yourpage.php
http://yourdomain.com/abcd/abcd/abcd/abcd/abcd/abcd/yourpage.php
Http: //yourdomain/abcd/abcd/abcd/abcd/abcd/abcd/abcd/yourpage.php...

Как вы это исправите?

Используя инструмент сканирования, используемый для поиска ловушки, настройте инструмент функциональности для сортировки по длине URL. После этого выберите самый длинный URL, и вы найдете корень проблемы. После этого важно проанализировать исходные коды рассматриваемой страницы в поисках дальнейших аномалий.

Если вы разбираетесь в программировании, есть техническое решение для решения проблемы. Запретите неверный параметр в файле robot.txt или добавьте правила на стороне сервера, которые гарантируют, что строка URL-адреса не превышает максимальное ограничение.

Смешивать и сочетать ловушку

Что вызывает это?

Эта ловушка возникает, когда на сайте есть несколько элементов, которые отсортированы и отфильтрованы множеством способов.

Когда пауку становится очевидным, что можно смешивать, сочетать и комбинировать различные типы фильтров, он будет отправлен по бесконечному, бесконечному циклу через серию фильтров в результате всех доступных ему опций.

Использование общих фильтров, таких как цвет, размер, цена или количество товаров на странице, - вот некоторые из многих тегов, которые могут создавать проблемы для сканера.

Как вы это идентифицируете?

Ищите удлиненные строки URL и различные повторяющиеся теги фильтрации. Бесконечный цикл в инструменте сканирования - это снова красный флаг, подчеркивающий, что ваш сайт может быть не настроен для обработки граненой навигации в SEO-дружественной манере.

Бесконечный цикл в инструменте сканирования - это снова красный флаг, подчеркивающий, что ваш сайт может быть не настроен для обработки граненой навигации в SEO-дружественной манере

Обратите внимание, как эта ловушка для пауков привела к индексации отфильтрованных страниц, что может снизить рейтинг сайта.

Как вы это исправите?

Это одна из самых трудных ловушек, которые нужно исправить, и, кроме того, что она крайне бесполезна, мой лучший совет - не создавать проблему в первую очередь. При настройке вашего сайта старайтесь ограничивать количество фильтров, которые вы предлагаете. Некоторые советы включают в себя:

  • Сначала рассмотрите возможность фильтрации смешивания и сопоставления в JavaScript.
  • Ограничьте размер ловушки, используя robots.txt, чтобы заблокировать страницы со слишком большим количеством фильтров. При этом соблюдайте баланс - заблокируйте слишком много, и сканер больше не сможет найти ваши продукты.

Календарь Ловушка

Что вызывает это?

Возникновение календарной ловушки не является результатом технического упущения. Скорее, это законные URL-адреса, которые относятся ко времени, что как бесконечное свойство может создавать бесчисленные URL-адреса. И, как мы уже знаем, это может вызвать серьезные проблемы.

Как вы это идентифицируете?

Это относительно простой тип ловушки для пауков, чтобы понять, определить и адрес. Если на вашем сайте есть календарь, позволяющий зрителям перемещаться и регистрировать событие, и он распространяется вплоть до 3016, скорее всего, ваш сайт попал в ловушку календаря.

Если на вашем сайте есть календарь, позволяющий зрителям перемещаться и регистрировать событие, и он распространяется вплоть до 3016, скорее всего, ваш сайт попал в ловушку календаря

Как вы это исправите?

В качестве опции используйте метатег noindex, nofollow для годов с превышением допустимой даты. Или используйте файл robots.txt, чтобы запретить URL-адреса с определенной датой за пределами определенного периода времени. В наши дни это несколько необычно, так как большинство плагинов для сайтов и сайтов, созданных самостоятельно, учитывают эти соображения, уже заложенные в их инфраструктуру.

Ловушка идентификатора сессии

Что вызывает это?

Идентификатор сеанса Паучьи ловушки распространены на крупных сайтах электронной коммерции. Они встроены в URL-адрес веб-сайта и в основном используются для отслеживания клиентов при совершении покупок со страницы на страницу.

Однако идентификаторы вызывают проблемы, когда они создают огромное количество ссылок для сканирования пауком. Поисковая система будет индексировать одну и ту же страницу снова и снова с небольшим изменением URL.

Как вы это идентифицируете?

Ищите теги, такие как «jsessionid», «sid», «affid» или что-либо подобное в строках URL-адресов при развертывании сканирования, с теми же идентификаторами, повторяющимися после точки, в которой паук может успешно перейти к следующей строке URL-адреса, загруженной идентификатором ,

http://example.com/somepage?jsessionid=E8B8EA9BACDBEBB5EDECF64F1C3868D3

http://example.com/otherpage?jsessionid=E8B8EA9BACDBEBB5EDECF64F1C3868D3

http://example.com/somepage?jsessionid=3B95930229709341E9D8D7C24510E383

http://example.com/otherpage?jsessionid=3B95930229709341E9D8D7C24510E383

http://example.com/somepage?jsessionid=85931DF798FEC39D18400C5A459A9373

http://example.com/otherpage?jsessionid=85931DF798FEC39D18400C5A459A9373

Как вы это исправите?

Чтобы устранить проблему, важно удалить идентификаторы сеанса из всех доступных перенаправлений и ссылок.

Что может сделать ловушка для пауков с вашим SEO?

Следует избегать ловушек пауков любой ценой, так как это снижает способность вашего сайта сканироваться и индексироваться, что, в свою очередь, значительно повлияет на вашу общую органическую видимость и рейтинг.

Ловушки пауков случаются по разным причинам, но все они имеют одинаковые результаты в вашем SEO, в том числе:

  • Вынуждая поисковые системы тратить большую часть своего бюджета на сканирование, загружая бесполезные, почти дублированные страницы. В результате, поисковые системы часто настолько заняты этим, что не могут загрузить все реальные страницы, которые в противном случае могли бы занять хорошее место.
  • Если сгенерированные ловушкой страницы являются дубликатами «реальной» страницы (например, страница продукта, запись в блоге и т. Д.), То это может помешать правильному ранжированию исходной страницы за счет ослабления равенства ссылок.
  • Алгоритмы ранжирования по качеству, такие как Google Panda, могут дать сайту плохую оценку, потому что сайт, по-видимому, состоит в основном из некачественных или дублирующих страниц.

Итак, вот оно: полное руководство по поиску и удалению ловушек для пауков. Они вытекают из множества причин и различаются по степени тяжести.

Однако все они оказываются основным сдерживающим фактором для успеха любого веб-сайта. Удостоверьтесь, что вы делаете свое исследование, прежде чем окажетесь в этой липкой сети.

Примечание . Мнения, выраженные в этой статье, являются мнением автора, а не обязательно мнением Caphyon, его сотрудников или партнеров.

Что такое ловушка для пауков?
Как выглядит ловушка для пауков?
Что такое ловушка для пауков?
Как выглядит ловушка для пауков?
Как вы это исправите?
Как вы это идентифицируете?
Как вы это исправите?
Как вы это идентифицируете?
Как вы это исправите?
Как вы это идентифицируете?

Наш магазин

Сезонные товары

Icon    Доставка в течение дня
Icon    Работаем с 09:00 до 18:00 кроме выходных
Icon    Возврат в течении 14 дней
Icon    Гарантия на все товары