Что такое поисковая машина?

Что такое поисковая машина?

Поисковая машина – это веб-сервер, основной задачей которого является пессимизация, осуществление поиска и индексации информации в Интернете релевантной запросу пользователя, задаваемого текстовой фразой или изображением.

Получая текстовый запрос, поисковая машина выдает список ссылок и документов с соответствующим контентом. До получения данного контента пользователем, поисковой робот индексирует страницы (например, по title, h2 и так далее) и ранжирует их в соответствии с релевантностью запросу пользователя.

Поисковой машиной или движком называют основу, программную часть любой поисковой системы, применяемую для сбора, обработки и передачи данных пользователю. Именно этой частью одна поисковая система отличается от другой.

Каждая поисковая машина имеет составляющие элементы, которые гарантируют ее бесперебойную и точную работу совместно с аппаратной частью и интерфейсом пользователя.

  • Поисковый робот или бот.
    Также его называют пауком или краулером. Задача бота — находить ссылки на новые, неизвестные страницы на запущенных сайтах. Робот выполняет две основные функции: вносит в кеш системы новые созданные веб-страницы; регистрирует и передает на сервер изменения на уже известных страницах. Поисковой робот корректно отражает элементы для правильного ранжирования сайтов. К примеру, именно боты работают с обратными ссылками и ссылками внутри сайта. Выделяют «быстроботы» или роботы, находящие ограниченное количество обновляющихся сайтов. Благодаря им поисковая система выдает самые актуальные новости и документы.
  • Алгоритм ранжирования не элемент, а формула. Она необходима поисковой системе для того, чтобы находить максимально корректную информацию на запрос пользователя. Формула учитывает огромное количество параметров запроса. Современные поисковые машины используют самообучающийся алгоритм, который способен учитывать факторы в динамике, самостоятельно присваивая им большое или меньшее значение.

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь спрашивать, мы не кусаемся!

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь спрашивать, мы не кусаемся!

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь спрашивать, мы не кусаемся!

  • Беларусь

  • Россия

  • Другие

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь спрашивать, мы не кусаемся!

  • Беларусь

  • Россия

  • Другие

При нахождении на сайте Вы соглашаетесь с политикой обработки персональных данных.

Всё понятно!

Как работают поисковые машины Интернета

Главный элемент современного Интернета – это поисковые машины или поисковики, Yandex, Rambler, Google и прочие. В Интернете находится море различной информации, и именно поисковики помогают пользователю быстро найти необходимую информацию.

В учебниках или научных книгах есть список важных терминов – алфавитно-предметный указатель или индекс. В индексе перечислены наиболее важные термины данной книги (ключевые слова) и номера страниц на которых они встречаются.

Работа поисковиков основана на подобном принципе. По сути, когда пользователь вводит поисковой запрос (ключевое слово), он обращается к предметному указателю Интернета или индексу – списку всех ключевых слов Интернета, с указанием страниц, где они встречаются.

Поисковая машина – это программа, которая составляет и хранит предметный указатель Интернета (индекс), а также находит в нем заданные ключевые слова.

Этапы составления индекса и поиска по нему:

Сбор адресов веб-страниц в Интернете

В поисковую машину загружают первоначальный список адресов страниц сайтов. Затем поисковая машина, а точнее ее составная часть – поисковый робот, собирает все гипертекстовые ссылки с каждой из заданных страниц на другие страницы и добавляет все, найденные в ссылках адреса, к своему первоначальному списку адресов. Таким образом, первоначальный список быстро увеличивается.

Страница, на которую не ведет ни одна ссылка, не попадет в индекс поисковика никогда, поэтому если вы сделали новый сайт его необходимо зарегистрировать в поисковых системах, чтобы он попал в индекс.

Выкачивание страниц

Поисковой робот  или паук обходит страницы, скачивает с них текстовый материал и хранит на дисках своих компьютеров, затем передает на индексирование индексному роботу.

Составление индекса

Для начала текст индексируемой страницы очищается от всяких нетекстовых элементов (графики, разметки языка HTML и пр.). Далее слова, выбранные из текста, приводятся к своим основам или именительному падежу. Собранные основы слов выстраивают в алфавитном порядке с указанием

номера страницы, где взята основа, и номера вхождения, где стояла основа на данной странице.

Поиск

Когда пользователь вводит слово в строку запроса, поисковая машина обращается к индексу. Находит все номера страниц, относящиеся к заданному слову, и показывает пользователю результат поиска (список страниц).

Качество поисковой машины

Синонимом качества поиска считается его

релевантность. В отношении поисковых машин слово релевантный ( относящийся к делу) – чуть ли не главный термин. Релевантность результатов поиска поисковой машины означает, что эти результаты содержат страницы, которые относятся к смыслу поискового запроса. Релевантность или качество поиска – довольно сложная вещь.

Еще одним важным критерием  качества работы поисковика является точность.

Точность – это мера качества выданных результатов, она вычисляется как количество релевантных страниц в общем объеме страниц, выданных в результатах поиска. Однако важна не только точность поиска, но и

ранжирование результатов поиска.

Ранжирование – расположение результатов поиска по релевантности.

Невозможно сказать какая поисковая машина лучше. Для пользователя лучше поисковик, выдающий наиболее релевантные и точные результаты. Для владельца сайта хороша, та машина, в которой хорошо виден сайт и которая приводит наибольшее количество целевых посетителей.

< Что такое CMS?   Что такое SEO оптимизация сайта? >

Что такое поисковая система? (и как они работают) – MakerHub

Опубликовано Автор: Yerain Abreu Опубликовано в рубрике Брендинг и маркетинг

Поисковые системы — что это такое? Они просто Google? И, возможно, что еще более важно, как вы появляетесь в Google? Когда кто-то ищет лучшие школы в Нью-Йорке, почему один веб-сайт отображается, а не другой? Это именно то, что мы рассмотрим в этом вводном посте о поисковой системе.

Что такое поисковая система?

Поисковая система — это инструмент, позволяющий быстро находить информацию в Интернете. С учетом сказанного вы можете представить, что Google — единственный поиск, но есть и много других. Вот несколько крупнейших поисковых систем.

Bing

Bing принадлежит Microsoft. Это главный конкурент Google.

Yahoo

Yahoo — одна из старейших поисковых систем.

DuckDuckGo

DuckDuckGo — одна из новейших поисковых систем. Их главная особенность — конфиденциальность.

Яндекс

Яндекс — основная поисковая система России.

Baidu

Baidu — основная поисковая система Китая.

Дело в том, что Google не единственная поисковая система. Ниже приведено изображение доли рынка для поисковой системы.

Google раньше доминировал на 94% рынка, теперь их 92. Таким образом, вы можете видеть, что конкуренты поднимаются вверх по рейтингу.

Независимо от того, какая поисковая система в настоящее время находится на вершине, Надлежащая практика SEO работает для каждой поисковой системы.

Результаты динамические

Вы когда-нибудь замечали, что когда вы вводите разные вопросы в Google, вся страница может изменить макет? Это потому, что результаты динамичны. Ниже у нас есть пример двух поисков: слева — воздуходувки, а справа — Клинт Иствуд.

На странице поисковой выдачи воздуходувки для листьев мы видим несколько рекламных объявлений. И здесь мы видим то, что называется текстовым модулем «адам люди также спросили» и органическим листингом.

Но если мы посмотрим на поисковую выдачу Клинта Иствуда (человека), то получим совершенно другой результат.

Поисковые системы умны. Они знают, что вы ожидаете увидеть. Они знают, что вы ожидаете увидеть продукты, если ищете линейку продуктов. Точно так же, если вы наберете «еда рядом со мной», они не будут показывать вам статьи о еде рядом с вами. Они покажут вам карту, чтобы помочь вам найти еду поблизости. Дело в том, что разные запросы вызывают разные результаты.

Как работают поисковые системы?

Хорошо, но как работают поисковые системы? Поисковые системы работают в три основных этапа. Сканирование, индексирование и ранжирование 

Сканирование

Поисковые системы отправляют в Интернет небольшие фрагменты исполняемого кода, которые мы обычно называем пауками (понятно? пауков в сети ). Эти пауки переходят по каждой ссылке на странице, затем по каждой ссылке на следующей странице, и так далее, и тому подобное.

Индексирование

Затем он индексирует эту информацию. Думайте об этом как о переносе этих данных на материнский корабль; домой. Он хранил эти данные в репозитории, называемом index.

Ранжирование

Наконец, он использует свой алгоритм для организации этих данных и ранжирования страниц на основе заданного запроса.

Заключение

Так работает поисковая система. Конечно, это еще не все, но это только основы, и для большинства маркетологов и владельцев бизнеса это все, что вам действительно нужно знать. Если вам нужна дополнительная информация о SEO, напишите MakerHub. Мы хотели бы услышать ваши мысли.

Что такое поисковая система?

Команда Neeva, 11.06.21

Пользоваться поисковой системой очень просто: вы открываете веб-страницу, вводите несколько слов в строку поиска, и вуаля — за доли секунды появляются миллионы результатов. Например, поиск в Google по запросу «поисковая система» дает 1,43 миллиарда результатов за 0,69 секунды. Но как именно ? Вот как дикая, дикая сеть стала полностью индексируемой, доступной для поиска и ранжированной менее чем за десять лет.

Что такое поисковая система?

Поисковая система — это программное обеспечение, предназначенное для поиска определенной информации. Тип поисковой системы, с которой знакомо большинство из нас, — это поисковая система в Интернете, представляющая собой веб-службу, которая находит информацию в Интернете (иногда называемую «всемирной паутиной») на основе запроса пользователя, который обычно представляет собой набор слова.

Сегодня многие люди думают, что поисковые системы являются синонимами интернет-браузеров — отчасти благодаря браузеру Google Chrome, встраивающему функции поисковой системы в строку веб-адреса. Но поисковые системы — это веб-службы, специально созданные для поиска информации. К ним можно легко получить доступ из браузера, но это разные технологии.

Как работают поисковые системы?

Хотя поисковые системы с годами стали более сложными, они по-прежнему следуют довольно простой формуле: сканировать и индексировать все данные в Интернете, чтобы при поиске чего-либо он мог предоставить вам набор результатов, ранжированных по актуальность. Вот как они это делают.

  1. Сканирование . Поисковые роботы, также известные как пауки, представляют собой программы, которые постоянно ищут в Интернете, находя новые сайты и идентифицируя новые ссылки. Краулеры также отправляют текст с каждого веб-сайта в индекс для анализа. Поисковые роботы могут даже хранить всю веб-страницу или ее часть, что называется кешем. Веб-мастера (люди, управляющие веб-сайтами) могут добавлять на свои сайты файл robots.txt, который сообщает сканеру, какие страницы следует просматривать, а какие игнорировать.
  2. Индекс . Данные, которые собирают сканеры, анализируются, систематизируются и сохраняются в индексе, чтобы механизм мог быстро находить информацию. Подобно указателю в конце книги, но гораздо более подробному, индекс поисковой системы включает запись для каждого слова на каждой проиндексированной веб-странице.
  3. Поиск . Когда вы запрашиваете поисковую систему, поисковая система должна сначала перевести ваши слова в термины, относящиеся к ее индексу. Это делается с помощью множества методов, включая обработку естественного языка (НЛП, которое использует машинное обучение, чтобы понять, что вы ищете). Результатом этого начального процесса перевода является переписанный запрос, в котором определяются важные части вашего запроса, исправляются орфографические ошибки и добавляются синонимы. Затем поисковая система обращается к своему индексу, чтобы найти веб-страницы, соответствующие переписанному запросу.
  4. Ранг. Поисковые системы используют алгоритмы, чтобы представить вам список результатов, ранжированных по тому, что, по их мнению, лучше всего ответит на ваш запрос. Для расплывчатых запросов, таких как «рамен», ваша поисковая система может предоставить ряд ответов, чтобы охватить свои основы, например, общую информацию о том, что рамен есть , наряду с другими популярными результатами, такими как рецепты, местные магазины рамэн и даже « люди также спрашивают», чтобы помочь вам сузить область поиска.

Как поисковые системы ранжируют результаты?

Один запрос может найти миллиарды релевантных веб-страниц, поэтому часть работы поисковой системы заключается в сортировке этих списков с использованием алгоритмов ранжирования. И хотя эти алгоритмы предназначены для предоставления вам наилучших ответов на ваши вопросы, они смещены в сторону определенных факторов. Поисковые системы хотят показать вам результаты, на которые вы нажмете, и они используют множество факторов для ранжирования результатов в соответствии с тем, с чем, по их мнению, вы будете взаимодействовать. К ним относятся, но не ограничиваются:

  • Использование ключевых слов. Результаты поиска должны соответствовать хотя бы некоторым словам в запросе. Поисковые системы отдают приоритет страницам, на которых эти ключевые слова появляются на видном месте, например в заголовке страницы, или часто по всей странице.
  • Содержание страницы. Поисковые системы отдают предпочтение высококачественному контенту, анализируя длину, глубину и широту веб-страниц.
  • Обратные ссылки . Обратные ссылки или упоминания одного веб-сайта на другом веб-сайте можно рассматривать как голосование в пользу авторитета этого сайта. Впервые созданный Google PageRank, ранжирование обратных ссылок ранжирует страницы в зависимости от того, сколько других сайтов ссылаются на этот сайт и насколько высоко рейтинг этих сайтов.
  • Информация о пользователе. Поисковые системы, такие как Google, используют вашу личную информацию, такую ​​как история поиска и местоположение, для предоставления результатов, которые являются уникальными для вас.

4 типа поисковых систем

Основные поисковые системы, такие как Google, могут быть первыми, когда мы думаем о поисковых системах, но есть и другие типы поисковых систем, которые позволяют нам перемещаться по Интернету.

  1. Основные поисковые системы . Основные поисковые системы, такие как Google, Bing и Yahoo! все они бесплатны для использования и поддерживаются онлайн-рекламой. Все они используют варианты одной и той же стратегии (сканирование, индексирование и ранжирование), чтобы вы могли осуществлять поиск по всему Интернету.
  2. Частные поисковые системы . В последнее время популярность частных поисковых систем возросла из-за проблем с конфиденциальностью, вызванных практикой сбора данных основных поисковых систем. К ним относятся анонимные поисковые системы с поддержкой рекламы, такие как DuckDuckGo, и частные поисковые системы без рекламы, такие как Neeva.
  3. Вертикальные поисковые системы . Вертикальный поиск или специализированный поиск — это способ сузить область поиска до одной тематической категории, а не всей сети. Примеры вертикальных поисковых систем включают:
    1. Панель поиска на торговых сайтах, таких как eBay и Amazon
    2. Google Scholar, которая индексирует научную литературу по публикациям
    3. Доступные для поиска сайты социальных сетей и приложения, такие как Pinterest
  4. Вычислительные поисковые системы . WolframAlpha — это пример вычислительной поисковой системы, предназначенной для ответов на вопросы, связанные с математикой и естественными науками.

Популярные поисковые системы

Технологии поиска сильно изменились с момента разработки первой поисковой системы в 1989 году. Вот основные игроки на сегодняшний день.

  1. Гугл . Есть только одна поисковая система, настолько популярная, что она стала синонимом глагола «искать». Имея 92,24 процента доли мирового рынка поисковых систем, Google на сегодняшний день является крупнейшей и самой популярной поисковой системой в мире. Чистый внешний вид Google и система ранжирования на основе обратных ссылок заслужили расположение пользователей в 99-м.0s, и он сохранил свое господство благодаря почти постоянным инновациям и множеству эксклюзивных соглашений с производителями устройств, операторами беспроводной связи и разработчиками браузеров, которые направляют около 60 процентов интернет-поиска прямо в Google.
  2. Бинг . На поисковую систему Microsoft Bing в настоящее время приходится 2,29 процента доли мирового рынка, что делает ее второй по величине поисковой системой в мире. С момента своего запуска в 2009 году Bing размещал фотографии на своей главной странице, что резко контрастировало со строгой целевой страницей Google.
  3. Yahoo! Комбинация веб-портала Yahoo!, новостного сайта и поисковой системы составляет 1,52 процента доли рынка поисковых систем. С момента своего скромного появления в качестве «Путеводителя Джерри и Дэвида по Всемирной паутине» Yahoo! стал крупной поисковой системой и был продан Verizon за 4,48 миллиарда долларов в 2017 году.
  4. Baidu . Baidu — китайская поисковая система, на долю которой приходится 1,48% мирового рынка поисковых систем. Как и Google, Baidu начиналась как поисковая система, а сейчас является одной из крупнейших технологических компаний Китая.
  5. DuckDuckGo . DuckDuckGo — это частная поисковая система с поддержкой рекламы, на долю которой в настоящее время приходится 0,58 процента доли мирового рынка.

В 2020 году Neeva объявила о создании первой в мире поисковой системы с частной подпиской без рекламы.

Краткая история поисковых систем

На заре Интернета было так мало веб-серверов (в основном, компьютеров, на которых размещались веб-сайты), что Тим Бернерс-Ли, создатель Всемирной паутины, держал их все на одном список. Используя этот список Бернерса-Ли, вы можете легко получить доступ к каждой существующей веб-странице — в основном к информационным сайтам, управляемым университетами или государственными организациями.

Сегодня существуют миллиарды веб-страниц и нет централизованной системы для их отслеживания, поэтому мы полагаемся на поисковые системы для поиска информации в Интернете.

  • 1989: Будучи аспирантом Университета Макгилла, Алан Эмтадж создал первую общедоступную поисковую систему ARCHIE (в архиве без буквы «V») в 1989 году. Программа Emtage позволила ему легче находить файлы на FTP-сайтах (протокол передачи файлов), которые появились раньше Интернета.
  • 1994 : Дэвид Фило и Джерри Янг основали Yahoo! как веб-каталог своих любимых сайтов. К концу 1990-х Yahoo! работал как веб-портал — целевая страница для доступа к различным функциям Интернета — и как поисковая система.
  • 1995 : AltaVista была запущена как первая поисковая система на естественном языке, что означает, что она принимала запросы, написанные на разговорном языке, а не только ключевые слова. В то время в Интернете было не менее 30 миллионов страниц, около 20 миллионов из которых были проиндексированы AltaVista.
  • 1996 : Запущен сервис Ask Jeeves, который побуждал пользователей формулировать свои запросы в виде вопросов. Ask Jeeves использовал редакторов-людей для сопоставления результатов с самыми популярными запросами. Сегодня около 8 процентов поисковых запросов записываются в виде вопросов, и Ask Jeeves (теперь Ask.com) больше не считается основной поисковой системой.
  • 1998 : Ларри Пейдж и Сергей Брин основали Google на основе своей поисковой системы 1996 года Backrub, которая использовала обратные ссылки как способ ранжирования результатов поиска. В то время у Google был очень простой интерфейс без рекламы с синими ссылками, за которыми следовало двухстрочное описание каждого сайта. (Реклама появится позже, в 2000 году.)
  • 2009 : Microsoft Bing был запущен как ребрендинг MSN/Live search, который первоначально был запущен в 1998 году. Вскоре после своего запуска Bing начал работать с Yahoo! поисковый движок.

Основные инновации в технологии поисковых систем

С момента запуска первых поисковых систем в 1990-х годах лидеры отрасли вносили инновации в поисковые технологии, чтобы обслуживать все больше и больше потребностей с помощью единого интерфейса. Теперь нам не обязательно покидать страницу результатов поисковой системы, чтобы получить ответы, которые мы ищем. Вот некоторые из основных моментов в эволюции технологии поисковых систем.

  • Машинное обучение : Microsoft разработала и запустила RankNet в 2005 году, которая использовала машинное обучение для ранжирования релевантных результатов поиска. Версия RankNet позже будет использоваться Microsoft Bing. Google представил свой собственный компонент машинного обучения, RankBrain, в 2015 году.
  • Универсальный поиск : В 2007 году Google запустил универсальный поиск, который интегрировал некоторые из своих различных инструментов вертикального поиска (таких как изображения, новости, видео, карты и книги). ) в одну страницу результатов поисковой системы мультимедиа (SERP). Когда вы ищете «изображения заката» на Google.com и видите коллекцию изображений в верхней части страницы результатов вместо списка ссылок, это универсальный поиск. До универсального поиска вам приходилось заходить в Google Images, чтобы найти изображения.
  • Локализованные результаты: В 2012 году Google начал показывать локальные результаты (на основе IP-адреса пользователя) для общих запросов. Это означало, что при поиске «футболки» Google мог предложить ближайший принтер футболок, тогда как раньше только поиск «футболки рядом с Бруклином» запускал интеграцию с Картами. В 2016 году Google начал использовать службы определения местоположения для смартфонов и Wi-Fi (которые используют местоположение ближайших точек доступа, чтобы точно определить ваше местоположение), чтобы предоставить вам локальные результаты на вашем устройстве.0057 точное местоположение.
  • Hummingbird : Google представил свой алгоритм Hummingbird в 2013 году, который выходит за рамки поисковых запросов пользователя, используя контекст, чтобы попытаться определить его намерения.