Содержание

Редактирование файла Robots.txt вашего сайта | Центр Поддержки

Файл robots.txt сообщает поисковым системам, какие страницы вашего сайта следует включать или пропускать в результатах поиска. Поисковые системы проверяют файл robots.txt вашего сайта при сканировании и индексировании вашего сайта. Это не гарантирует, что поисковые системы будут сканировать страницу или файл, но может помочь предотвратить менее точные попытки индексирования.

Если вы хотите повысить точность запросов на сканирование сайта, вы можете отредактировать файл robots.txt.

Содержание

Общее представление о файле robots.txt

Файл robots.txt содержит инструкции, позволяющие разрешить или запретить определенные запросы от поисковых систем. Команда «разрешить» сообщает сканерам ссылки, по которым они могут переходить, в то время как команда «запретить» сообщает сканерам ссылки, по которым они не могут перейти. Он также включает URL-адрес файла карты сайта.

Вы можете просмотреть файл robots.txt своего сайта, добавив «/robots.txt» в корневой домен. Например, https://www.mystunningwebsite.com/robots.txt

Редактирование файла robots.txt

Вы можете отредактировать файл robots.txt своего сайта с помощью редактора Robots.txt в панели SEO вашего сайта. Файл robots.txt сайта по умолчанию разрешает роботам поисковых систем доступ ко всем страницам вашего сайта. Боты могут не получить доступ к определенным страницам: 

Прежде чем вносить изменения в файл robots.txt, мы рекомендуем ознакомиться с рекомендациями и ограничениями Google для файлов robot.txt.

Чтобы отредактировать файл robots.txt:

  1. Перейдите в панель управления SEO.
  2. Выберите Перейти в редактор Robots.txt в разделе Инструменты и настройки.
  3. Нажмите Смотреть индекс sitemap.
  4. Добавьте информацию о файле robots.txt, написав директивы в разделе Это ваш текущий файл.
  1. Нажмите Сохранить изменения
  2. Нажмите Сохранить.

Сброс файла robots.txt

Если вы изменили файл robots.txt на своем сайте и хотите вернуть его обратно, вы можете сбросить его до состояния по умолчанию с помощью редактора Robots.txt в панели управления SEO вашего сайта.

Чтобы сбросить файл robots.txt:

  1. Перейдите в панель управления SEO.
  2. Выберите Перейти в редактор Robots.txt в разделе Инструменты и настройки.
  3. Нажмите Смотреть индекс sitemap.
  4. Нажмите Восстановить значения по умолчанию.
  1. Нажмите Сбросить (Reset).

Ошибка robots.txt в инструменте Проверка сайта Wix или Google Search Console

Иногда вы можете видеть ошибки, такие как Заблокировано файлом robots.txt в отчете Проверки сайта Wix или в аккаунте Google Search Console.  

Если вы видите такую ошибку, вам не нужно редактировать файл robot.txt, особенно если вы никогда не редактировали его раньше. Вместо этого вам следует проверить свои страницы на наличие следующих настроек:

  • Поисковым системам запрещено индексировать страницу в:
    • Редакторе сайта
    • Настройках SEO сайта для этого типа страниц
    • Настройках SEO сайта
  • Страница защищена паролем
  • Страница предназначена только для пользователей

Если вам нужно обновить страницу, Wix автоматически обновит ваш robots.txt после публикации страницы. Если вы измените настройки сайта, файл robots.txt будет обновлен немедленно.

После того, как вы внесете изменения, поисковые системы обновят свою кэшированную версию файла robots.txt при следующем сканировании вашего сайта. Если вам нужно обновить его раньше, вы можете попробовать отправить свою домашнюю страницу в поисковые системы для переиндексации.

Использование данных журнала сайта в отчетах Wix по маркетингу и SEO | Центр Поддержки

Данные журнала (или файлы журнала) для вашего сайта содержат информацию обо всех запросах, которые ваш сайт получает от посетителей и поисковых роботов. Запрос представляет собой попытку просмотреть определенную страницу, изображение, документ или любой другой тип файла на вашем сайте.

Он также записывает другие данные запроса, такие как:

  • Дата и время каждого запроса
  • Ответ на запрос (успешный или неуспешный)
  • Запрошенная страница

Отчеты по данным журнала в Wix Analytics

Вы можете использовать Маркетинговые отчеты и SEO-отчеты Wix, чтобы просмотреть полезную информацию из данных журнала вашего сайта.

Отчеты «Трафик ботов за период», «Трафик ботов по страницам» и «Статус отклика за период» сосредоточены только на поисковых роботах и не включают посетителей сайта. Это позволяет вам видеть, как ведут себя боты, когда они посещают ваш сайт.

Вы можете использовать эти отчеты, чтобы помочь вам оптимизировать свой сайт для SEO:

  • Количество и частота запросов к вашим страницам
  • Выявление страниц с такими проблемами, как ошибка 404 или ошибка 500
  • Поиск страниц, которые боты сканируют не часто
  • Определение страниц, которые боты сканируют слишком часто

Использование отчетов по данным журнала для оптимизации сайта

Вы можете использовать каждый из отчетов для анализа различных аспектов SEO вашего сайта и выявления проблем и возможностей.

Трафик ботов за период

Этот отчет позволяет увидеть, какие боты сканируют ваш сайт и как часто они его сканируют.

Вы можете использовать эту информацию, чтобы:

  • Узнать, как определенные боты взаимодействуют с вашим сайтом, выбрав их на линейной диаграмме с разделением
  • Определить потенциальные проблемы с сайтом с помощью расширенных фильтров.
  • Принимайте решения об обновлении страниц сайта для управления бюджетом сканирования 

Подробнее об отчете «Трафик ботов за период»

Трафик ботов по страницам

Этот отчет позволяет увидеть, какие страницы вашего сайта сканируются ботами. Вы можете использовать отчет для определения страниц, которые сканируются слишком часто или недостаточно часто.

Выберите гистограмму или таблицу, чтобы увидеть общий трафик по коду ответа для каждой страницы сайта.

Подробнее об отчете «Трафик ботов по страницам»

Статус отклика за период

Этот отчет поможет определить страницы сайта, на которых есть потенциальные проблемы, по статусу отклика. Вы также можете использовать его, чтобы убедиться, что любые переадресации URL-адресов, которые вы настроили на своем сайте, работают правильно.

Используйте режим «Линия» для определения тенденций, а в виде таблицы — для получения сведений о конкретных страницах.

Подробнее об отчете о статусе ответов за период

Условия анализа данных журнала

Ниже приведены некоторые термины, которые вы можете увидеть в своих отчетах Wix по маркетингу и SEO:

Слово

Описание

Бот

Автоматизированные программы, которые поисковые системы используют для непрерывного сканирования (или «обхода») сайтов в интернете.


Боты добавляют информацию, которую они находят, в базы данных поисковых систем в процессе, известном как «индексация». Подробнее

Хит

Хит представляет собой отдельный запрос, сделанный посетителем сайта или ботом на веб-сервер. Это может быть запрос определенной страницы, изображения, документа или другого типа файла.

Статус отклика

Это ответ, полученный ботом на свой запрос. Он указывает, был ли запрос успешным или нет.

Существуют разные статусы ответов разных типов, которые обычно делятся на следующие категории:

  • 2XX: бот успешно запросил страницу. Обычно это отображается как 200.
  • 3XX: Бот был перенаправлен на другую страницу. Например, статус 301 представляет собой постоянную переадресацию, а статус 302 — временную переадресацию.
  • 4XX: страница не найдена. Его можно удалить или переименовать. Эти типы ошибок должны быть исправлены пользователем. Статус 404 — самая распространенная ошибка.
  • 5XX: это ошибка сервера.

Редактирование файла robots.txt вашего сайта | Справочный центр

Файл robots. txt сообщает поисковым системам, какие страницы вашего сайта включать или пропускать в результатах поиска. Поисковые системы проверяют файл robots.txt вашего сайта, когда сканируют и индексируют ваш сайт. Это не гарантирует, что поисковые системы будут или не будут сканировать страницу или файл, но может помочь предотвратить менее точные попытки индексации.

Если вы хотите лучше контролировать запросы на сканирование вашего сайта, вы можете отредактировать файл robots.txt.

Из этой статьи вы узнаете больше о:

Что такое файл robots.txt

Файл robots.txt содержит инструкции по разрешению или запрещению определенных запросов от поисковых систем. Команда «разрешить» сообщает сканерам ссылки, по которым они могут переходить, а команда «запретить» сообщает сканерам ссылки, по которым они не могут переходить. Он также включает URL-адрес файла карты сайта вашего сайта.

Вы можете просмотреть файл robots.txt своего сайта, добавив «/robots. txt» к корневому домену. Например: https://www.mystunningwebsite.com/robots.txt .

Редактирование файла robots.txt

Вы можете редактировать файл robots.txt своего сайта с помощью редактора Robots.txt на панели SEO вашего сайта. Файл robots.txt вашего сайта по умолчанию позволяет роботам поисковых систем получать доступ ко всем страницам вашего сайта. Боты могут не иметь доступа к определенным страницам, если они: 

Прежде чем вносить изменения в файл robots.txt, рекомендуем ознакомиться с рекомендациями и ограничениями Google для файлов robot.txt.

Чтобы отредактировать файл robots.txt:

  1. Перейдите на панель инструментов SEO.
  2. Выберите Перейдите в редактор Robots.txt в разделе Инструменты и настройки .
  3. Нажмите Просмотреть файл .
  4. Добавьте информацию о файле robots.txt, написав директивы под Это ваш текущий файл .
  1. Нажмите  Сохранить изменения .
  2. Щелкните Сохранить .

Сброс файла robots.txt

Если вы изменили файл robots.txt своего сайта и хотите вернуть его обратно, вы можете восстановить его состояние по умолчанию с помощью редактора Robots.txt на панели инструментов SEO вашего сайта.

Чтобы сбросить файл robots.txt:

  1. Перейдите на панель инструментов SEO.
  2. Выберите Перейдите в редактор Robots.txt в разделе Инструменты и настройки .
  3. Нажмите Просмотреть файл .
  4. Нажмите Восстановить настройки по умолчанию .
  1. Нажмите Сброс .

Ошибка robots.txt в Wix Site Inspection или Google Search Console

Иногда вы можете видеть такие ошибки, как Blocked by robots.txt , в своем отчете Wix Site Inspection или в своей учетной записи Google Search Console.

Если вы видите подобную ошибку, вам не нужно редактировать файл robot.txt, особенно если вы никогда не редактировали его раньше. Вместо этого вы должны проверить свои страницы на наличие следующих настроек:

Если вам нужно обновить страницу, Wix автоматически обновит файл robots.txt после публикации страницы. Если вы измените настройки своего сайта, ваш файл robots.txt будет немедленно обновлен.

После внесения изменений поисковые системы обновят свою кешированную версию файла robots.txt при следующем сканировании вашего сайта. Если вам нужно обновить ее раньше, вы можете попробовать отправить свою домашнюю страницу в поисковые системы для переиндексации.

Что такое файл robots.txt? (2022)

Имя robots.txt звучит немного необычно, особенно если вы новичок в SEO. К счастью, это звучит куда страннее, чем есть на самом деле. Владельцы веб-сайтов, такие как вы, используют файл robots.txt, чтобы дать веб-роботам инструкции относительно своего сайта .

В частности, он сообщает им, к каким частям вашего сайта вы не хотите, чтобы к ним обращались поисковые роботы.

Первое, на что обращает внимание поисковый робот при посещении страницы, это файл robots.txt.

 

Не обращайте внимания на сумасшедшие глаза, с этим роботом все в порядке! Анимация Мэтта Барнса

 

  • Чем важен файл robots.txt?
  • Что считается неправильным использованием файла robots?
  • Как выглядит задание robots.txt на marketgoo?
  • Файл Robots.txt на сайтах Weebly
  • Файл Robots.txt на сайтах Wix
  • Файл Robots.txt на сайтах Squarespace
  • Файл Robots.txt на сайтах WordPress
  • Файл Robots.txt на сайтах Shopify
  • Передовой опыт
  • Я просто хочу знать, есть ли на моем сайте файл robots.txt!!

Чем важен файл robots.txt?

 

Обычно используется, чтобы запретить поисковым системам, таким как Google, «видеть» определенные страницы на вашем веб-сайте — либо потому, что вы не хотите, чтобы ваш сервер был перегружен сканированием Google, либо чтобы он сканировал неважные или дублированные страницы на вашем веб-сайте. сайт.

Возможно, вы думаете, что это также хороший способ скрыть страницы или информацию, которые вы предпочитаете сохранять конфиденциальными и не хотите показывать в Google. Файл robots.txt предназначен не для этого, так как эти страницы, которые вы хотите скрыть, могут легко появиться в обход инструкций robots.txt, если, например, другая страница вашего сайта ссылается на страницу, которую вы не хотите показывать. .

Несмотря на то, что этот файл очень важен, ваш сайт будет работать и без него, а также будет обычно сканироваться и индексироваться. Важная причина, по которой это имеет отношение к SEO вашего сайта, потому что неправильное использование может повлиять на рейтинг вашего сайта .

Что такое неправильное использование?

  • Пустой файл robots.txt
  • Использование неправильного синтаксиса
  • Ваш robots.txt конфликтует с вашим файлом sitemap.xml (ваш файл robots.txt противоречит вашей карте сайта — если что-то есть в вашей карте сайта, оно не должно блокироваться вашим файлом robots).
  • Использование для блокировки личных или конфиденциальных страниц вместо их защиты паролем
  • Случайное запрещение всего
  • Ваш файл robots.txt превышает ограничение в 500 КБ 
  • Файл robots не сохраняется в корневом каталоге

 

         Иллюстрация Юстаса Галабурды

 

Как выглядит задание на marketgoo?

В marketgoo задача относится к категории «Проверить свой сайт». Задача проста, потому что, если мы обнаружим файл robots.txt на вашем сайте, мы просто убедимся, что вы знаете, для чего он нужен и что его нужно правильно настроить.

 

robots.txt на Weebly

 

Если вы используете Weebly, ваш сайт автоматически включает файл robots.txt, который вы можете использовать для управления индексацией поисковыми системами отдельных страниц или всего сайта. Вы можете просмотреть файл robots, перейдя по адресу www.yourdomain.com/robots.txt или yourdomain.

weebly.com/robots.txt (используя название своего веб-сайта вместо «ваш домен»).

По умолчанию поисковым системам разрешено индексировать весь сайт. Если вы хотите, чтобы ваш сайт не индексировался поисковыми системами, сделайте следующее:

  1. Перейдите на вкладку Настройки в редакторе и нажмите на раздел SEO
  2. Прокрутите вниз до переключателя « Скрыть сайт от поисковых систем »
  3. Переключите его в положение On
  4. Повторная публикация вашего сайта

Если вы хотите защитить от индексации только некоторые из своих страниц, выполните следующие действия:

  1. Перейдите в меню Настройки SEO
  2. Убедитесь, что переключатель «Скрыть сайт от поисковых систем» установлен на Выкл. .
  3. Перейдите на вкладку Страницы и щелкните страницу, которую хотите скрыть
  4. Нажмите кнопку Настройки SEO
  5. Установите флажок, чтобы скрыть страницу от поисковых систем
  6. Нажмите на стрелку назад вверху, чтобы сохранить изменения

Вы можете изменять это сколько угодно раз, но помните, что поисковым системам требуется время, чтобы понять это и отразить в своих результатах.

Есть некоторые вещи, которые заблокированы, и вы не можете изменить их на Weebly, например каталог, в котором хранятся загруженные файлы для цифровых продуктов. Это не окажет негативного влияния на ваш сайт или его рейтинг в поисковых системах.

Примечание. Google Search Console может выдать вам предупреждение о «серьезных проблемах со здоровьем» в отношении файла robots вашего сайта Weebly. Это связано с заблокированными файлами, описанными выше, так что не волнуйтесь.

Square Websites

Обратите внимание, что возможность вручную редактировать файл robots.txt в настоящее время недоступна в интернет-магазинах Square.

Если вы хотите скрыть страницу от поисковых систем: зайдите в редактор сайта и откройте страницу, которую хотите скрыть.

  • Выберите значок шестеренки в левом верхнем углу и выберите Просмотр настроек страницы.
  • Во всплывающем окне найдите раздел SEO и измените Search Visibility на «Скрытый от результатов поиска».
  • Завершите и нажмите «Сохранить».

robots.txt на Wix

 

Если вы используете Wix, вы должны знать, что Wix автоматически создает файл robots для каждого сайта, созданного на его платформе. Вы можете просмотреть этот файл, добавив «/robots.txt» к своему корневому домену ( www.domain.com/robots.txt ) (заменив domain.com на ваше фактическое доменное имя). Если вы посмотрите, что находится в вашем файле robots.txt, вы поймете, что могут быть определенные инструкции для предотвращения сканирования областей, которые , а не способствуют SEO вашего сайта.

Можно для редактирования файла robots.txt вашего сайта Wix, но, как отмечает Wix в своих инструкциях, это расширенная функция, и вам следует действовать с осторожностью.

Чтобы отредактировать:

  1. Перейдите в панель управления вашего сайта.
  2. Нажмите на Маркетинг и SEO.
  3. Нажмите Инструменты SEO .
  4. Щелкните Редактор файла Robots.txt .
  5. Щелкните Просмотр файла .
  6. Добавьте информацию о файле robots.txt, написав директивы в поле под текстом «9».0120 Это ваш текущий файл:” 

Не забудьте сохранить изменения и прочитать собственную документацию поддержки Wix относительно редактирования файла robots.

Если вы не хотите, чтобы определенная страница вашего сайта отображалась в результатах поиска, вы можете скрыть ее в разделе

Редактора страниц :

  1. Нажмите Меню и страницы в верхней левой панели. редактора
  2. Нажмите на страницу, которую хотите скрыть
  3. Нажмите на […] значок
  4. Нажмите SEO (Google)
  5. Щелкните переключатель рядом с Показать эту страницу из результатов поиска . Это означает, что люди не могут найти вашу страницу при поиске по ключевым словам и фразам в поисковых системах.
  6. Не забывайте сохранять и публиковать любые изменения.

Примечание. Если вы используете WIX ADI для создания своего сайта, инструкции для вас немного отличаются.

Если вы решите защитить страницу паролем, это также не позволит поисковым системам сканировать и индексировать эту страницу. Это означает, что защищенные паролем страницы не отображаются в результатах поиска.

Наконец, следуйте этим инструкциям, чтобы скрыть весь ваш сайт от поисковых систем.

 

robots.txt на Squarespace

 

Это еще одна платформа, которая автоматически создает файл robots для каждого сайта. Squarespace использует файл robots.txt, чтобы сообщить поисковым системам, что часть URL-адреса сайта ограничена. Они делают это, потому что эти страницы предназначены только для внутреннего использования или потому что они представляют собой URL-адреса, которые показывают дублированный контент (что может негативно повлиять на вашу поисковую оптимизацию). Если вы используете такой инструмент, как Google Search Console, он покажет вам предупреждение об этих ограничениях, которые Squarespace установила в файле.

Squarespace показывает нам в качестве примера, что они просят Google не сканировать такие URL-адреса, как /config/ , который является вашей страницей входа администратора, или  /api/ , который является файлом cookie отслеживания Analytics. Это имеет смысл.

Кроме того, если вы видите много запретов в файле robots.txt, это также нормально для Squarespace, чтобы предотвратить дублирование содержимого (которое может появиться на этих страницах):

Чтобы скрыть содержимое на вашем Сайт Squarespace, вы можете добавьте тег noindex через Code Injection или установите флажок Скрыть эту страницу из результатов поиска на вкладке SEO настроек вашей страницы. Видео этих инструкций смотрите здесь.

Если вы получаете предупреждения от Google Search Console, например, о том, что страница «проиндексирована, хотя и заблокирована robots.txt», вы можете обратиться к этому удобному руководству, чтобы понять, что означают некоторые из этих ошибок и следует ли их игнорировать или действовать.

robots.txt на WordPress

 

Если вы используете WordPress, ваш файл robots.txt обычно находится в корневой папке вашего сайта. Вы можете проверить это, добавив «/robots.txt» к своему корневому домену ( www.domain.com/robots.txt — заменив domain.com на ваше фактическое доменное имя).

Вам нужно будет подключиться к вашему сайту с помощью FTP-клиента или файлового менеджера cPanel для просмотра и редактирования файла. Вы можете открыть его с помощью простого текстового редактора, такого как Блокнот или TextEdit.

Если у вас нет файла robots.txt в корневом каталоге вашего сайта, вы можете создать его:

  1. Создайте новый текстовый файл на своем компьютере и сохраните его как robots.txt
  2. Загрузите его в корневую папку вашего сайта

Этот процесс может быть немного громоздким, и есть еще один вариант — вместо этого вы можете создать и отредактировать файл robots с помощью плагина, такого как Robots. txt Editor.

Если вы используете плагины SEO Yoast или All in One, вы можете создать и/или отредактировать файл robots.txt из плагина.

Вы можете использовать тестер robots.txt в Google Search Console, чтобы убедиться в отсутствии ошибок и проверить, какие URL-адреса с вашего сайта заблокированы.

robots.txt на Shopify

  • Shopify автоматически создает файл robots.txt для вашего сайта.
  • невозможно редактировать файл Robots.txt для магазинов Shopify.
  • Если вы хотите скрыть определенные страницы от индексации Google, вам необходимо настроить раздел файла макета вашего магазина theme.liquid. Для этого следуйте этим инструкциям.
  • Иногда можно получить предупреждение из Google Search Console 9. Это нормально.0008 , говоря вам, что некоторые элементы заблокированы. Shopify блокирует индексацию определенных страниц, таких как ваша фактическая страница корзины или отфильтрованная коллекция, у которой есть + в URL-адресе. Поэтому, если вы видите что-то вроде следующего, это нормально:
    • Запретить: /коллекции/+
    • Запретить: /коллекции/%2B

Robots.txt Best Practices
  • Если вы хотите запретить поисковым роботам доступ к любому частному контенту на вашем веб-сайте, вам необходимо  пароль защищает область, где они хранятся. Robots.txt — это руководство для веб-роботов, поэтому технически они не обязаны следовать вашим рекомендациям.
  • Google Search Console предлагает бесплатный тестер роботов, который сканирует и анализирует ваш файл. Вы можете проверить свой файл там, чтобы убедиться, что он правильно настроен. Войдите в систему и в разделе «Сканирование» нажмите «тестер robots.txt». Затем вы можете ввести URL-адрес, и вы увидите зеленый Разрешено , если все выглядит хорошо.
  • Вы можете использовать robots.txt для блокировки таких файлов, как неважные файлы изображений или стилей. Но если их отсутствие затрудняет понимание вашей страницы поисковыми роботами, не блокируйте их, иначе Google не сможет полностью понять ваш сайт так, как вы этого хотите.
  • Всем блоггерам, владельцам сайтов и веб-мастерам следует соблюдать осторожность при редактировании файла robots; если вы не уверены, будьте осторожны!

Если вы хотите углубиться в детали, добавьте в закладки эти руководства от ContentKing и Search Engine Journal.

Я просто хочу знать, есть ли на моем сайте файл robots.txt или нет!

Просто зайдите в браузер и добавьте «/robots.txt» в конце имени вашего домена! Таким образом, если ваш сайт называется myapparelsite.com, вы введете в браузере адрес www.myapparelsite.com/robots.txt, и вы увидите что-то вроде этого (этот пример для сайта WordPress):

.

 

Robots.txt Tester

Если вы являетесь пользователем marketgoo, marketgoo автоматически сообщит вам, обнаружит он это или нет. Вы можете дополнительно протестировать его в Google Search Console.