Проверка количества проиндексированных на сайте страниц в поисковых системах Яндекс и Google
Проверка количества проиндексированных страниц сайта и получение их списка может показаться на первый взгляд достаточно простой задачей, но есть некоторые нюансы, о которых расскажем ниже.
Самые простые способы посмотреть индексацию любого сайта – операторы в поисковых системах Яндекс и Google. В Google это оператор site:site.ru (где вместо site.ru нужно указать анализируемый сайт). В Яндексе последнее время оператор site:site.ru перестал корректно работать, поэтому на данный момент количество страниц можно проверить с помощью оператора url:http://www.site.ru/* (с указанием www если сайт индексируется с www и наоборот).
Примеры:
Как узнать число новых страниц на сайте или число страниц, проиндексированных за определенный период
В Яндексе можно нажать на иконку расширенного поиска и выбрать диапазон дат:
В Google аналогичные настройки можно сделать через “инструменты->за период”:
Но не все так просто как кажется на первый взгляд. Рассмотрим более точные методы проверки способы как получить больше информации для каждой поисковой системы.
Google Search Console
Часто в Google число страниц, выдаваемое через оператор site: сильно отличается от реального числа проиндексированных страниц. Сотрудники Google отвечают по этому поводу что конструкция site:site.ru всего лишь результат пустого поиска по сайту и не обязана выдавать все страницы сайта.
Также в поиске отображаются неиндексируемые страницы, запрещенные в robots.txt, на которые есть внешние ссылки. Это тоже искажает результат.
Более точно узнать число проиндексированных страниц в Google можно имея доступ к Google Search Console в разделе “статус индексирования”.
К сожалению, в данном отчете данные также могут не совпадать с реальными из-за применения фильтров. Разница может доходить до десятков-ста процентов.
Еще один способ, который считается одним из наиболее точных – отчет “Файлы Sitemap”.
Яндекс Вебмастер
В Яндекс.Вебмастере содержатся достаточно точные данные по индексации сайта. Количество страниц, с динамикой можно посмотреть в разделе “страницы в поиске”.
Также в Яндекс.Вебмастере можно получить выгрузку страниц со статусами, включая индексацию, которая, правда ограничена 50.000 страницами. Пример выгрузки:
Выгрузку можно скачать в уже описанном выше отчете “страницы в поиске”.
Альтернативные способы проверки индексации сайта
Иногда перечисленные методы не подходят, тогда можно использовать альтернативные.
- Парсинг сайта (например, через программу Screaming Frog) и постраничная проверка индексации в Google/Yandex. Например, через сервис https://www.rush-analytics.ru/ -> “проверка индексации”. Минусы: не все страницы в индексе могут иметь ссылки из меню или страниц сайта, можно как дополнение использовать способы описанные в пунктах 2,3 ниже.
- Страницы, на которые есть органический трафик из перечисленных операционных систем (можно посмотреть через системы статистики Яндекс.Метрика и Google.Analytics).
- Страницы на которые есть внешние ссылки. Внешние ссылки можно получить через такие сервисы как Ahrefs.com.
Как определить количество проиндексированных страниц в Яндексе и Google, как проверить индексацию страницы в поисковых системах
- Eye 36 029
- Chatbubbles 0
- CategoriesSEO
Содержание
Определяем количество проиндексированных страниц сайта с помощью специального запроса (документный оператор)
Для Яндекса: site:o-es. ru
Аналогично и для Google: site:o-es.ru
Видно, что в Google проиндексировано больше страниц. Это связано с тем, что поисковая система Google индексирует сайты и добавляет страницы в основной индекс быстрее Яндекса.
При помощи Яндекс.Вебмастер (Google Вебмастер)
Данные по сайту o-es.ru в панели Яндекс.Вебмастер.
Страниц в поиске – 126. Данное значение отличается от значений полученных оператором (site).
Официальный ответ поддержки Яндекса:
Я бы рекомендовал Вам ориентироваться на результаты поиска.
Соответственно ориентируемся на значения, полученные запросом site:o-es. ru.
Почему Загруженных страниц в Яндекс.Вебмастере больше чем Страниц в поиске?
В разделе Загруженные страницы
Причин, по которым загруженные страницы могут не участвовать в поиске, много:
- Они могут быть дубликатами уже показанных страниц.
- Содержать поисковый спам.
- Содержать ненужный пользователям контент.
- Либо при их загрузке произошла ошибка. Те страницы, при загрузке которых произошли ошибки, можно посмотреть в разделе Исключенные страницы.
Необходимо добиться, чтобы количество проиндексированных страниц в Яндексе и Google были одинаковыми, допускается погрешность в 10-15%. Разница может означать дублирование проиндексированных страниц или наоборот, что какие-то из них еще не проиндексированы поисковой системой.
Как проверить индексацию конкретной страницы сайта в Яндексе и Google?
Для Яндекса.
Используем оператор Url
Синтаксис: url:полный URL
Пример:
О документарных операторах Яндекса: https://yandex.ru/support/search/query-language/search-operators.xml
Используем оператор Site
Синтаксис: site:полный URL
Пример:
Массовая проверка индексации страниц сайта в Яндекс и Google онлайн.
5 простых приемов для ускорения индексации новых страниц (сайта) в Яндексе:
- Используем сервис Переобходчик страниц (Яндекс.Вебмастер).
- Используем сервис Сообщить о новом сайте https://webmaster.yandex.ru/addurl.xml.
- В рамках структуры сайта, должны быть ссылки на все страницы.
- Внешние ссылки на новые страницы.
- Устраняем технические ошибки (SEO-аудит сайта: дубли, битые ссылки, ошибка 404 и др.).
Необходимо дождаться индексации изменений и обновление поисковой базы (апдейт). За апдейтами можно следить тут — http://tools.promosite.ru/
Если, скажем, через месяц после исправления всех ошибок и недочетов ситуация не изменилась, можно попробовать написать в техподдержку Яндекса о проблемах индексации сайта, чтобы выявить причины. Делать это нужно обязательно, так как напрямую влияет на продвижение сайта по трафику.
Как написать в тех. поддержку Яндекса?
- Добавляем сайт в Яндекс.Вебмастер (подтверждаем права на сайт).
- Переходим в панель управления вашим сайтом.
- В нижней части страницы (footer), находим ссылку
- Открывается страница службы поддержки, выбираем Индексирование сайта.
- Выбираем Мой сайт плохо индексируется.
- Выбираем Новые страницы сайта долго не попадают в поиск.
- Ставим чекбокс Рекомендации не помогли.
- Заполняем поля и отправляем форму.
Какие поля заполнять:
- Из списка сайтов, выбираете соответствующий сайт.
- Указываете 2-3 примера страниц, которые не проиндексированы поисковой системой.
- В поле Сообщение укажите проблему и действия, которые были сделаны для устранения проблемы. Как долго не решается вопрос.
- Указываете ваше имя и email.
Переобход страниц – новый инструмент Яндекс.Вебмастер
Контролируйте процесс индексации вашего сайта, добивайтесь успеха в продвижении!
Магомед Чербижев
Поделиться:
Об авторе
Никита Пасечник
Эксперт в области продвижения и интернет-маркетинга. Специалист по бизнес-решениям. Опыт работы более 10 лет. Более 5 000 часов активных тренингов и практик.
ПодробнееИндексная страница — Проверка в Интернете Проиндексированные страницы Бесплатно
Улучшите свой рейтинг!
Зарегистрируйтесь сейчас на Semrush и узнайте больше о своем веб-сайте и отслеживайте своих конкурентов, как и откуда они получают обратные ссылки и трафик.
Получите бесплатную 30-дневную пробную версию прямо сейчас!Используйте Google Index Checker, чтобы узнать, проиндексирован ли ваш сайт
Большая часть наших усилий по SEO при оптимизации наших веб-сайтов для поисковых систем явно направлена на повышение рейтинга веб-сайта в поисковой выдаче Google. Однако есть еще одна вещь, которая определяет успех SEO, и это индексная страница Google.
У вас может быть лучший сайт с высоким рейтингом, высоким трафиком и отличным содержанием, но если Google не сможет его проиндексировать, все пойдет напрасно. Почему? Ну никто не увидит. Проще говоря, индексация — это процесс чтения или проверки вашей страницы Google на наличие последнего контента и других обновлений. Не будет ошибкой сказать, что индексация — это первый шаг в процессе SEO-аудита.
«Как я могу заставить Google просканировать мой сайт » и «как узнать, проиндексированы ли мои страницы» — это те вопросы, с которыми обычно сталкиваются специалисты по SEO. Наряду со сложностями, которые Google создает для ранжирования и фильтрации лучших результатов для своей аудитории, он также обеспечивает наличие одинаково доступных решений. Если вы не уверены, сканирует ли Google веб-сайт и индексирует ли ваши веб-страницы, вы можете воспользоваться помощью средства массовой проверки индекса.
В Small SEO Tools мы сделали это очень удобным для вас с нашим инструментом индексации Google .
( Помните: Без индексации нет ранжирования.)
Проиндексированные страницы снижаются? Используйте средство проверки проиндексированных страниц Google!
Очень важно, чтобы все ваши веб-страницы были проиндексированы всеми поисковыми системами (не только Google). Страницы, которые не удалось проиндексировать, не ранжируются. Самый простой способ узнать, проиндексирована ли ваша страница, — это использовать оператор «сайт:» с поиском Google. Однако для ручной проверки индексации всех страниц потребовалась бы целая вечность. В качестве альтернативы у нас есть более быстрый и лучший способ — средство массовой проверки Google.
Если количество ваших проиндексированных страниц уменьшается, это может означать:
- Google не может сканировать ваши веб-страницы
- Google считает ваши страницы нерелевантными
- Ваши веб-страницы оштрафованы уменьшается и почему вы должны использовать Index Pages Checker . Существует множество инструментов, которые помогут вам проверить неиндексированную или индексную страницу. Мы предоставляем вам средство массовой проверки индексов с удобным интерфейсом и простой процедурой.
( Совет: Отсутствие индексации также может быть одной из причин, по которой ваши усилия по поисковой оптимизации окупаются. Поэтому, если вы хотите попасть в рейтинг, убедитесь, что ваш сайт проиндексирован.) больше потенциальных клиентов по сравнению с компаниями без веб-сайта или с меньшим количеством проиндексированных страниц.
согласно исследованию, количество страниц, проиндексированных Google , прямо пропорционально количеству созданных лидов. Компаниям, имеющим большее количество проиндексированных страниц, удается генерировать больше лидов. Функциональный веб-сайт для любой компании действует как ее онлайн-представитель, который с помощью правильного контент-маркетинга и SEO может привлечь больше трафика и, следовательно, больше потенциальных клиентов.
Заставьте Google сканировать сайт: как использовать Google Indexing Tool
Если вы считаете, что ваши страницы не сканируются и не индексируются Google, то первым делом нужно избавиться от сомнений. Для этого есть несколько способов проверить, проиндексирован ли ваш сайт или нет. Вы можете сделать это вручную, что может занять много времени и является не очень практичным и обычно рекомендуемым способом. Еще один способ проверить индексацию страниц — использовать средство проверки индекса страниц.
С помощью средства массовой проверки индекса становится проще проверить, сколько и какие страницы проиндексированы Google. Знание числа имеет решающее значение для направления ваших усилий в правильном направлении.
Чтобы следовать нашей бесплатной программе проверки проиндексированных страниц, нет сложной процедуры, всего несколько простых шагов:- Начните с посещения: https://smallseotools.com/indexed-pages/, возможно, там, где вы уже находитесь.
- Далее вам нужно ввести домен d, для которого вы хотите проверить проиндексированные веб-страницы.
- После этого нажмите кнопку «Проверить проиндексированные страницы» и дайте инструменту выполнить свою работу.
- Через несколько секунд после нажатия кнопки вы получите подробный отчет о проиндексированных Google страницах.
Простые советы, как заставить Google сканировать мой сайт
Как только веб-сайт запущен и работает, большинство веб-мастеров перестают беспокоиться о сканировании и индексировании (что является большой ошибкой). Чтобы поддерживать SEO и общее состояние вашего сайта, вы должны регулярно проверять индексацию Google. В конце концов, имея миллиарды страниц в индексе Google, вы не можете позволить себе упустить свою. Время от времени используйте Google Index Checker .
Если у вас возникли проблемы с индексацией ваших страниц Google, возможно, эти простые советы для вас:
- С момента введения индекса Mobile-First стало необходимым иметь веб-сайт, оптимизированный для мобильных устройств для мобильного индекса. Наличие адаптивного дизайна, минимизация JS или CSS, оптимизация изображений и минимизация размера элементов пользовательского интерфейса на странице — это лишь некоторые из вещей, которые следует учитывать.
- Сколько раз вы слышали фразу «Контент важнее всего»? Возможно, во многом потому, что это действительно так. Обязательно регулярно обновляйте свой контент, потому что поисковая система чаще предпочитает сайты с регулярным обновлением контента.
- Создайте согласованную и оптимизированную схему перелинковки, чтобы обеспечить правильную организацию и индексацию вашего веб-сайта.
- Не забудьте отправить карту сайта в поисковые системы. Одним из основных советов по улучшению индексации по сей день является отправка карты сайта.
- Если существуют страницы с тегом no-index (на которых их быть не должно), найдите их и исправьте.
- В случае большого количества дублированного контента избавьтесь от него. Дублированный контент означает замедление скорости сканирования.
- Наоборот, если есть страницы, которые вы не хотите сканировать поисковыми роботами, заблокируйте их. Поставьте тег no-index или вообще удалите страницу.
Индекс Google меньше, чем мы думаем
Отчет о росте
Размер индекса Google не так прост, как может показаться, и это важно понимать специалистам по поисковой оптимизации.
Кевин Индиг
• 4 мин чтения
Размер индекса Google не так прост, как может показаться, и это важно понимать специалистам по поисковой оптимизации.
В Интернете много ложных заявлений о том, что Google имеет триллионы страниц в своем индексе (пример: https://www.tennessean.com/story/money/tech/2014/05/02/jj-rosen-popular-search-engines-skim-surface/8636081/). Это неправильно.
Проблема заключается в небольшой, но важной детали: разница между страницами, которые Google знает, и страницами, которые Google фактически индексирует.
Сканирование по сравнению с индексированием
Google обнаружил 130 000 000 000 (130 триллионов) веб-страниц в 2016 году. На самом деле, я также нашел данные о том, сколько страниц обнаружил Google за 2008 и 2013 годы. Теперь, когда мы наносим это на график, мы видим, что количество обнаруженных страниц, кажется, увеличивается экспоненциально.
Количество веб-страниц, которые Google обнаруживает каждый годGoogle обнаруживает много ссылок, но не сканирует их все.
» Недавно даже наши поисковые инженеры пришли в трепет от того, насколько велика сеть в наши дни, когда наши системы, обрабатывающие ссылки в сети для поиска нового контента, достигли вехи: 1 триллион (как в 1 000 000 000 000) уникальных URL-адресов в сети одновременно!
Мы не индексируем каждую из этих триллионов страниц — многие из них похожи друг на друга или представляют собой автоматически сгенерированный контент, похожий на пример календаря, который не очень полезен для пользователей, выполняющих поиск. Но мы гордимся тем, что у нас есть самый полный индекс среди всех поисковых систем, и нашей целью всегда было индексировать все данные в мире. »
https://googleblog.blogspot.com/2008/07/we-knew-web-was-big.htmlЭто проблема, которую я описал в статье «Проблема со спамом и поиском»: Интернет полон мусора. миллиарды запросов каждый день, возможно, неудивительно, что по-прежнему существуют злоумышленники, которые пытаются манипулировать поисковым рейтингом. Фактически, мы заметили, что более 25 миллиардов страниц, которые мы обнаруживаем каждый день, являются спамом. »
В посте я пришел к выводу, что примерно 30% страниц, обнаруженных Google, являются спамом.
Таким образом, мы можем согласиться с тем, что «найденные ссылки» не равны «размеру индекса». Индекс Google на самом деле намного меньше, чем количество обнаруженных ссылок.
Индекс поиска Google содержит сотни миллиардов веб-страниц и значительно превышает 100 000 000 гигабайт. Это похоже на индекс в конце книги — с записью для каждого слова, встречающегося на каждой веб-странице, которую мы индексируем. Когда мы индексируем веб-страницу, мы добавляем ее к записям для всех слов, которые она содержит. https://www.google.com/search/howsearchworks/crawling-indexing/
Но как быстро растет его индекс? И растет ли он вообще?
Размер индекса больше не является целью
Я взял данные из 3 источников, чтобы реконструировать рост индекса Google за последние 20 лет. Кажется, что он растет не быстро, а линейно (не экспоненциально).
Размер индекса Google за годыИсточники:
- https://googleblog.blogspot.com/2008/07/we-knew-web-was
- big.htmlhttps://webmasters.googleblog.com/2020/06/how-we-fought-search
- spam-on-google.htmlhttp://blogoscoped.com/archive/2006-01-29-n14.html
Однако я не думаю, что индекс Google может масштабироваться бесконечно. Его темпы роста с 2000 по 2006 год составили 26x. Однако, если общедоступные данные Google верны, с 2008 по 2017 год он вырос всего в 3,8 раза. Таким образом, рост неизбежно замедляется. Google видит убывающую отдачу (может быть, намеренно, а может и нет).
Как я писал в разделе «Конец сканирования и начало API-индексирования» Google необходимо, чтобы индекс был как можно меньше, но при этом он должен включать только лучшие результаты. Подумайте об этом. Иметь огромный индекс — это просто тщеславная цель. Важно качество проиндексированных результатов. Все остальное неэффективно. »
Похоже, это подтверждается в статье 2016 года под названием «Оценка изменчивости размера индекса поисковой системы: 9-летнее продольное исследование». В ходе исследования исследователи потратили 9 лет (!) на наблюдение за индексом Google и других поисковых систем. Они обнаружили, что индекс поисковых систем не растет линейно. Он может не расти вообще. пик в оценках индекса Google составляет около 49,4 миллиарда документов, измеренных в середине декабря 2011 года.