Русскоязычные поисковые механизмы в Интернет | Computerworld Россия

Многие популярные Web-узлы так и остались бы неизвестными, если бы не справочно-поисковые системы Это должно было произойти, и это произошло. Прошедший 1996 год стал годом появления и быстрого распространения поисковых систем, специализирующихся на выявлении, в первую очередь, русскоязычных материалов.

Многие популярные Web-узлы так и остались бы неизвестными, если бы не справочно-поисковые системы

Это должно было произойти, и это произошло. Прошедший 1996 год стал годом появления и быстрого распространения поисковых систем, специализирующихся на выявлении, в первую очередь, русскоязычных материалов. Закономерность этого процесса понятна, поскольку к данному моменту российский блок Интернет уже накопил обширный по объему и ценный по содержанию информационный массив, и стал полноправной составной частью всемирных киберресурсов. Образование поисковых систем явилось как бы еще одним доказательством реальной значимости накопленного информационного массива: как только сформировалось то, что нужно искать, появились инструменты, позволяющие это делать.

Русскоязычные поисковые средства возникли не на пустом месте. У их разработчиков было время собраться с мыслями и проанализировать многочисленные зарубежные аналоги (забегая вперед, отметим, что этой возможностью воспользовались далеко не все). Тем более, что принципиально новые решения изобрести было довольно сложно. Российские поисковые системы сохранили традиционное деление на электронные справочники, позволяющие последовательно знакомиться с материалами по определенным отраслям и темам, и поисковые системы в чистом виде, с помощью которых осуществляется поиск источников по узкому профилю.

Среди справочников на роль российского Yahoo! претендуют два программных продукта: «Паук» (

http://spider.raser.ru) и «Созвездие Internet» (http://www.stars.ru). «Паук», плетущий свои сети с 1995 года (единственный, обогнавший время) и уже ставший ветераном отечественного сетевого поиска, имеет интерфейс без особых изысков, но зато несколько иерархических уровней. Логичность отраслевой иерархии оставляет желать много лучшего, поэтому для его использования требуется порой нестандартное мышление, иначе трудно определить, в каком разделе могут находиться требуемые данные. Такая запутанность справочника уже сейчас затрудняет работу, а с ростом объемов информации эта проблема будет все более и более усугубляться. Выборочная проверка оперативности обновления разделов «Паука» показала, что система поддерживается в актуальном состоянии довольно слабо. В ней отсутствуют некоторые очень информативные серверы, появившиеся более полугода назад.

В своей нынешней версии «Паук» поддерживает все русские кодировки, а также дает возможность непосредственного поиска, который, как это часто бывает у справочников, ограничен названиями, первым строками текста (комментариями) и электронными адресами Web-страниц. Поисковый блок не позволяет употреблять в запросе даже простые операторы «и» и «или», поэтому розыск может вестись одновременно только по одному понятию, с возможностью усечения окончаний слов с помощью «*».

«Созвездие Internet», нашедшее пристанище на известном сервере «ИнфоАрт», относится к новейшим разработкам, что заметно по его интерфейсу, выполненному на высоком уровне с применением фреймов и качественной графики: функционально и одновременно внешне привлекательно. К сожалению, содержание «Созвездия» пока отстает от его внешнего вида. Справочник не имеет разветвленной иерархической структуры. Основной ряд включает разделы «Компьютеры и технологии», «Экономика и бизнес», «Медицина и здоровье», «СМИ», «Искусство и культура», «Образование и наука», «Техника и транспорт», «Отдых и развлечения» и «Разное». При раскрытии раздела идет непосредственное перечисление серверов данной тематики, число которых пока также невелико. В среднем оно составляет около 40, а памятуя о том, что в России число серверов давно превысило 3000, легко понять, что фрагмент, отраженный в «Созвездии», очень невелик. Один из немногих положительных моментов — то, что помимо названия сервера в справочник включается также краткая характеристика его содержания. Прямой же поиск в «Созвездии Internet» не выходит за пределы названий и аннотаций уже учтенных серверов.

Для ориентации в отечественном киберпространстве также может помочь электронная версия «Желтых страниц Интернет (русские ресурсы)» издательства «Питер», хранящаяся по адресу (

http://proxy. menatep.elcom.ru/yp/yp_about.htm).

Русскоязычные поисковые средства в чистом виде (search engines) предоставляют более широкие возможности выбора. К ним относятся Rambler (http://www.rambler.ru), «Новый русский поиск» (http://www.openweb.ru/koi8), «Апорт!» (http://russia.agama.com/aport), «Русская машина поиска» (http://search.interrussia.com) и Russian Internet Search (http://www.search.ru).

Наиболее мощным является Rambler. Эта система, поддерживаемая ТОО «Стек», создана специально для выявления материалов на серверах в пределах бывшего СССР. Она относится к числу самых молодых (время образования — осень 1996), поэтому ее разработчики имели возможность изучить опыт своих предшественников, что, безусловно, сказалось на качестве системы.

Rambler, поддерживающий все кодировки кириллицы, обеспечивает полнотекстовый поиск более чем на 350 тысячах страниц 3900 отечественных узлов, а количество проиндексированных страниц ежедневно увеличивается в среднем на 10 тысяч. Помимо этого, обследуется также недельный архив телеконференций РЕЛКОМ.

Система имеет простой дружественный интерфейс, позволяющий составить поисковое предписание без особого напряжения. Пользователям предлагается составить простой или углубленный запрос (Advanced query). Поиск при этом будет осуществляться в одном и том же информационном массиве, однако при простом запросе (основное меню) результат будет ограничен максимум 30 ссылками, и, кроме того, при углубленном запросе появляется возможность большей детализации.

Механизм поиска предусматривает использование операторов AND и OR, а также позволяет усекать окончания с использованием традиционных «*» или «?». При углубленном запросе, когда число возможных ссылок расширяется до 1000, можно также уточнить поисковое предписание по дате последнего обновления документа и указать термины, появление которых в источнике должно быть исключено (по сути, это дополнительный оператор NOT). Для удобства пользователя все манипуляции с терминами могут осуществляться и через меню формы запроса.

Одним из главных достоинств Rambler является близкий к образцовому вывод результатов поиска, превосходящий, на наш взгляд, все зарубежные аналоги. Даже в нормальной форме (а есть, кроме того, и детальная!) ссылка на найденный объект включает, помимо названия, электронного адреса, кодировки, размера и времени обновления документа, еще и внушительных размеров резюме, из которого можно получить представление о том, в каком контексте употреблены искомые термины (они выделены жирным шрифтом). Блок искусственного интеллекта Rambler производит ранжирование результатов в зависимости от частоты употребления и местоположения искомых терминов (термин, находящийся в title или head, «весит» больше, чем находящийся в body). Поэтому в начале списка представлены ссылки на источники, наиболее полно соответствующие запросу.

Данная система работает чрезвычайно быстро. Однако опытное ее опробование показало, что она не столь же оперативно обновляет свои индексы. При каждом «очередном» визите на сервер программа-робот отрабатывает только одну новую ссылку (индексирует один документ) и уходит на следующий узел.

Другие же документы остаются ждать следующего появления робота. Тестирование выявило также, что Rambler не всегда своевременно убирает ссылки на Web-страницы, снятые с серверов по каким-либо причинам. В ответ на некоторые запросы число ссылок, за которыми оказывается сообщение «File not found», составляет до 10%.

В целом же Rambler пока является безусловным лидером среди отечественных поисковых средств и в перспективе вполне может претендовать на роль одного из самых посещаемых узлов российского блока Интернет.

«Новый русский поиск» также является полнотекстовой системой, однако он ограничивает область просмотра шестидесятью наиболее информативными российскими серверами. Им также обследуется содержание всех некоммерческих конференций РЕЛКОМ за последние две недели. При этом система может вести розыск с использованием операторов AND, OR и NOT, допускает усечение окончаний и поиск подряд стоящих терминов, соединяемых знаком «+» (например, «поисковые+средства» будет равно словосочетанию «поисковые средства»).

Все инструктивные сведения, необходимые для работы с системой, выведены на ее основной интерфейс.

К сожалению, скорость работы «Нового русского» недостаточно высока, что объясняется его слабой аппаратной базой. Результаты поиска ранжированы в зависимости от степени соответствия запросу. Выявленные ссылки содержат название, электронный адрес, время последнего обновления документа и степень его соответствия запросу. Какое-либо подобие резюме отсутствует, что существенно снижает информативность представленных ссылок.

«Новый русский поиск» обладает также специальной функцией «Документы-образцы», позволяющей конкретизировать полученные результаты. Ее смысл заключается в отборе документов, схожих содержанием с конкретной Web-страницей. Так, например, при поиске сведений о А.И.Лебеде неминуемо обнаружатся ссылки на одноименного представителя семейства пернатых. Для того чтобы отсеять эти записи, надо на одной из ссылок, бесспорно относящихся к Лебедю-политику, указать названную функцию, т. е. щелкнуть мышью на специальную отметку (поставить галочку), а затем нажать на кнопку «Документы-образцы». Повторный поиск выдаст сведения только о нужных страницах.

К числу новейших поисковых средств принадлежит «Апорт», расположенный на сервере «Агама». Главная отличительная черта этой системы — искренняя забота об удобстве потребителя. Пока ею обследуется только 16 российских серверов, однако уровень сервиса и скорость работы заставляет отнести это поисковое средство к числу чрезвычайно перспективных.

«Апорт», понимающий все кириллические кодировки, предоставляет самые широкие возможности составления запроса. Помимо традиционных операторов «и» и «или», усечения окончаний («*») и поиска по целой фразе (двойные кавычки), система обладает способностью вычленять сочетания терминов только в случае, если они расположены в тексте рядом друг с другом. Насколько «рядом», каждый раз определяется пользователем. Так, запрос «{3, телекоммуникационные технологии}» выявит все документы, в которых указанные слова встречаются в пределах трех соседствующих предложений, а запрос «[4, географические карты]» отыщет только те страницы, где между искомыми словами промежуток составляет не больше двух других слов. Падежи и числа употребляемых лексических единиц в данном случае не имеют значения, система их самостоятельно отсекает. За счет этой возможности потребитель застрахован от значительной доли информационного шума, возникающего при случайном сочетании ключевых слов, например в начале и в конце документа.

Результаты поиска ранжированы в зависимости от частоты употребления на странице искомых терминов (документы с наибольшей частотой — впереди). При этом ключевое слово выводится в окружающем контексте, что позволяет сразу определить, насколько найденная ссылка соответствует запросу. Кроме этого, представлены сведения о времени обновления, размере и кодировке файла, а также электронный адрес.

Все инструкции «Апорт» расположены непосредственно под основным меню, и изложены очень кратко, четко, с необходимыми примерами.

«Русская машина поиска», несмотря на название, является зарубежной разработкой, ориентированной, тем не менее, исключительно на русскоязычные ресурсы по всему Интернету. Как показывают тесты, она бороздит русскоязычное киберпространство весьма выборочно. Вероятно, ориентиром выступает значимость того или иного узла, определяемая создателями «Машины». Пока же в ее арсенале выборочные страницы более чем с 900 русскоязычных узлов. Ее безусловным преимуществом является широкий арсенал средств формирования запроса. Разработчиками учтены многие достижения зарубежных систем, среди которых основные булевые операторы AND и OR, поиск по отдельной фразе и ограничение поиска определенными элементами Web-страниц (название, ключевые слова, автор, и т.д.). Помимо этого, меню запроса «Машины» предлагает пользователю возможность самому устанавливать или отменять чувствительность к написанию заглавных и строчных букв, а также указывать количество возможных ошибок в искомом слове, если нет уверенности в его написании. Последнее качество, кстати, весьма полезно и при многовариантности запроса типа «библиотека или библиотеки или библиотек», поскольку усекать термины «Машина» принципиально не позволяет.

«Русская машина поиска» обладает довольно непривычной формой выдачи результатов, определяемой используемым инструментом — Harvest. Перед пользователем предстают нагромождения из английских и русских слов и символов. После некоторого разбирательства удается понять, что все не так сложно, просто один длинный URL разбит зачем-то на несколько составных частей, привычный title назван «Description», а каждое вхождение искомого термина обозначено отдельной строкой. Единственной положительной стороной такой детализации является возможность сразу увидеть, в какой части Web-страницы содержится искомый термин, а иногда даже и в каком контексте он употреблен. Впрочем, такую пестроту результатов можно и отменить через меню, однако в этом случае информация в ссылке сократится до электронного адреса найденного объекта. К сожалению, система не ранжирует результаты поиска, поэтому зачастую приходится просматривать список до самого конца, ища наиболее ценные ссылки.

Russian Internet Search пока по праву занимает последнее место в перечне отечественных поисковых средств. Его разработка, похоже, превратилась в повинность для его создателей, не удосужившихся даже написать русскоязычный интерфейс. Поэтому с какой бы силой и продолжительностью пользователи ни давили на иконки перекодировок, перед ними будет все то же англоязычное меню и англоязычная «помощь». Из возможных инструментов формирования запроса в наличии лишь установка чувствительности к написанию строчных и прописных букв и способность указывать количество допустимых ошибок. Если к этому добавить не очень высокую скорость работы и вывод результатов в виде, аналогичном сокращенному варианту в «Русской машине поиска», получится и вовсе тоскливое зрелище, отпугивающее случайно забредших на сервер пользователей.

Помимо перечисленных, на некоторых наиболее значительных отечественных серверах представлены системы, осуществляющие поиск в пределах данного узла. Таковы, например, «Поиск по серверу» АОЗТ «Дукс» (http://www.dux.ru), Яndex (http://www.cti.ru/arcadia/solution.html) на сервере CompTek International (обследует также очень информативный сервер NNS), и некоторые другие.

Существует также пока единственная в своем роде региональная поисковая система Samara Info (http://www.ssau.samara.ru/cgi-bin/search/search), осуществляющая выявление материалов на 12 серверах, расположенных в Самарской области. Пока в ее активе сведения о более чем 3500 документах.

Говоря о русскоязычных поисковых средствах, нельзя не упомянуть Яndex, являющийся, по сути, не поисковой системой, а скорее русскоязычной лингвистической оболочкой для поисковых целей. Разработчики Яndex изрядно потрудились над анализом морфологии русского языка, в результате чего создана система, снимающая проблему многовариантности русского языка типа слов «идет — шел», «окно — окон «, а также чисел, родов, спряжений и склонений. Эта оболочка, в частности, применена для поиска русскоязычных материалов в знаменитой Alta Vista, через интерфейс, находящийся по адресу http://www.cti.ru/alta.html.

При работе с поисковыми серверами нелишне иметь в виду то, что некоторые из поисковых систем при запросе, содержащем несколько терминов, порой руководствуются известным принципом «на безрыбье и рак рыба», выдавая вначале сведения о документах, включающих все термины, а затем и ссылки на Web-страницы, содержащие два из трех или даже один из трех искомых терминов. Системы как бы «забывают» об условии сообщать данные только при условии сочетания всех слов, причем пользователи остаются в полном неведении относительно этой особенности. Таковы, например, «Новый русский поиск» и Russian Internet Search.

К общей черте, объединяющей многие русскоязычные поисковые средства, относится непонятная страсть программистов искусственно ограничивать число показываемых ссылок. В меню Rambler, «Нового русского поиска», «Русской машины поиска» и Russian Internet Search присутствует пункт, с помощью которого пользователь самостоятельно должен задать это число. По логике же поиска оно всегда должно быть максимальным, дабы не допустить потери данных.

В целом же потенциал российских поисковых средств пока еще уступает лучшим зарубежным аналогам, что объясняется даже не столько меньшей мощностью используемого аппаратного обеспечения, сколько тем, что их разработка и поддержка зиждятся более на энтузиазме создателей, нежели на серьезной коммерческой основе. Западные системы, и прежде всего американские, существуют главным образом за счет вкрапливаемой в интерфейс рекламы. Чем большими возможностями обладает система, тем большее число пользователей к ней обращаются, и, соответственно, тем в большей степени она привлекает рекламодателей. С развитием в России предпринимательской деятельности посредством Internet, значение поисковых систем как наиболее посещаемых серверов будет неминуемо возрастать, и поэтому мы вправе ожидать дальнейшего повышения их качества. Тем более что западная практика показывает: каждая вновь появившаяся система уже чем-то превосходит предыдущие, так как в ней учитывается и позитивный, и негативный опыт предшественников. Поэтому нет сомнений, что в ближайшем будущем отечественные поисковые средства значительно нарастят как аппаратно-программную мощность, так и свои искусственно-интеллектуальные способности. На наше общее благо.


Степанов Вадим Константинович — доцент Московского Государственного Университета Культуры. С ним можно связаться по электронной почте: [email protected]

Поиск в русской Сети

Настал момент, когда навигация в русской Сети стала невозможна без собственных машин поиска. Главным препятствием на пути вхождения «русскоязычного» раздела Интернет в общемировую систему стала кодировка букв русского алфавита, находящаяся во второй половине таблиц ASCII. Большинство зарубежных поисковых роботов попросту не воспринимают эти знаки, а значит, не индексируют страницы, написанные в «extended ASCII». Подобная проблема, видимо, стояла и перед программистами всех нелатиноязычных стран. Правда, была еще возможность самостоятельного занесения своих страниц в такие тематические каталоги, как Yahoo. Остается лишь гадать, почему эта возможность практически не использовалась российскими Web-мастерами. И на сегодняшний день русская Сеть очень слабо представлена в крупнейшем тематическом каталоге мира: туда заносят свои страницы лишь те, кто так или иначе связан с Западом либо ищет с ним деловых контактов.

Проблему частично решила «всеядная» Alta Vista, однако поиск в ней затруднен из-за случайного «засорения» выхода дальневосточными страницами: японцы, китайцы, корейцы используют для своих шрифтов те же extended ASCII. Еще одна сложность состоит в том, что в русском компьютерном мире существует целых четыре (!) альтернативных кодировки, и русские страницы далеко не всегда продублированы в каждой из них, поэтому результат поиска в Alta Vista может сильно зависеть от того, какая кодировка используется. Кроме того, Alta Vista не поддерживает тематического поиска.

Все эти неприятности сделали навигацию в русском Интернет делом крайне затруднительным: многие страницы оставались в безвестности. Поначалу русский Интернет пошел именно по пути создания каталогов, где царило «самообслуживание»: наткнувшемуся на каталог предлагалось внести в список свой URL. Первые каталоги возникли стихийно — так родилась страница Андрея Ражанского «Russian Yellow Pages». Поначалу эта страница была коллекцией русских URL, которые он собрал для себя, но удобный дизайн, возможность внесения своей ссылки и удачное название превратили ее в довольно популярный каталог в среде зарубежных (в том числе и не русскоязычных) пользователей, интересующихся русским отделом Интернет. Приблизительно тем же методом собираются и более серьезные русские каталоги. Знаменитый Yahoo тоже рос за счет своих посетителей.

Компания «Демос» предпочла действовать «макроспособом», может быть, более эффективным. «Наш сервер — коллекция баз данных ведущих информационных агентств России. Мы представляем эту информацию только в Интернет. Новые имена попадают в него после заключения договора с каким-нибудь новым информационным агентством», — пояснил представитель компании «Демос». В настоящее время это один из самых популярных российских каталогов — 3000 дневных обращений (данные «Демоса»).

Но ни один из «рукописных» каталогов не в состоянии охватить весь «русский» сектор Интернет. По-видимому, первую русскоязычную поисковую систему «Русская поисковая машина» запустила фирма «РусИнфОйл». Ее система поиска и индексации основана на известном программном продукте Harvest, созданном в университете Колорадо. Однако прежде чем «заговорить по-русски», он претерпел значительные изменения.

Создатели «Русской поисковой машины» индексируют сайты в России и на территории бывшего Советского Союза, а также русскоязычные и русско-ориентированные узлы в мировом Интернет. На сегодняшний день у них в среднем 11 тысяч посетителей в день. Кстати, по словам представителя фирмы, доля иностранцев среди пользователей «Русской Поисковой Машины» достигает 50-60%.

Осенью и зимой 1996 года появились еще три поисковые системы, основанные на автоматическом сборе информации. Такие системы, как «Рамблер», «ТЕЛА», «Русский Поиск», очень быстро завоевывают популярность среди пользователей русскоязычного Интернет. Тот факт, что они сфокусированы на относительно малом количестве серверов (их в России и за ее пределами около 4 тысяч), позволяет им индексировать практически все русские страницы, а также более оперативно обновлять свои базы данных. Кроме того, некоторые из них обеспечивают поиск с учетом морфологии русского языка, находя все формы заданного слова. Немного особняком в этом ряду стоит «Русская Альта Виста» фирмы CompTek, представляющая собой некую языковую надстройку к известной поисковой системе. Эта система находит все грамматические формы заданного слова и передает результат для поиска Alta Vista. Собственной базы данных она не имеет.

Создатели русских поисковых систем работают также и над решением другой проблемы — неоднозначности кодировок текста. Система «Рамблер» нормализует ввод, приводя его к однородной кодировке, что позволяет осуществлять поиск среди страниц, созданных с использованием различных кодировок.

Следующим этапом в развитии русских поисковых систем должна стать систематизация русскоязычных ресурсов по принципу тематических каталогов. Практически все поставщики машин поиска собираются решить эту проблему в ближайшем будущем. Интенсивный рост русскоязычного Интернет сулит хорошие перспективы рекламному бизнесу, и владельцы русских поисковых систем как никто другой заинтересованы в росте популярности своих узлов. Наиболее полный из известных нам списков русских поисковых средств находится на узле «Zhurnal.Ru».


Александр Шерман — http://www. zhurnal.ru

Таблица сравнительных характеристик русскоязычных поисковых систем

Название и адрес системы
Зоны поиска
Глубина поиска внутри документа
Элементы поискового предписания
Вывод результатов поиска, в том числе:
Rambler http://www.rambler.ru
WWW — весь экс-СССР (более 3500 серверов). Некоммерческие конференции Relcom за последнюю неделю.
Все слова в документе.
Операторы AND, OR, NOT. Возможность усечения терминов. Ограничения по дате.
Название документа, резюме, размер: файла, URL, дата последнего обновления, степень соответствия, кодировка.
Новый русский поиск http://www. openweb.ru
WWW — около 60 серверов. Некоммерческие конференции Relcom за последние две недели.
Все слова в документе.
Операторы AND, OR, NOT. Поиск по словосочетанию.
Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу.
Русская машина поиска http://search.interrussia.com
WWW (более 900 серверов)
Все слова в документе.
Операторы AND и OR. Поиск по фразе. Допуск возможного числа ошибок. Чувствительность к строчным и прописным бумагам.
Название документа, резюме, URL, степень соответствия запросу.
Паук http://spider.raser.ru
WWW
Название первые строки и электронный адрес документа.
Возможность усечения терминов.
Название сервера, URL.
Созвездие Internet http://www.stars.ru/
WWW
Название и краткая характеристика серверов
Возможность усечения терминов.
Название сервера, краткая характеристика содержания, кодировка.
Russian Internet Search http://www.search.ru
WWW
Все слова в документе.
Операторы AND и OR. Чувствительность к строчным и прописным буквам. Допуск возможного числа ошибок.
Название документа, URL.
Апорт! http://russia.agama.com/aport/
WWW — 16 российских серверов.
Все слова в документе.
Операторы AND и OR. Поиск по фразе. Возможность усечения терминов. Чувствительность к строчным и прописным буквам.
Название документа, резюме, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка.

Поисковые системы в России | Retail Online

Все поисковые системы в сети Интернет предназначены для обеспечения пользователей web удобными средствами нахождения необходимой информации среди миллионов нерелевантных страниц. Поисковики имеют схожие компоненты-составляющие и принципы действия: «пауки» (crawlers) собирают информацию, концентрирующуюся в базе данных поисковой машины и появляющуюся в выдаче на основании определенного поискового механизма.

Поисковые системы не только находят нужную информацию, но и помогают определиться с выбором товаров, которые действительно ищут. На сегодняшний день в Рунете представлено великое множество различных поисковых систем – как загранично-экспортных (плеяда поисковиков во главе с Google), так и собственно отечественного производства (яркий пример – Yandex, найдется все ©).

Самой популярной поисковой машиной русскоязычного Интернета на протяжении многих лет является именно Yandex, адекватную конкуренцию которому составляет разве что Google. Два этих поисковых гиганта совместно «держат» больше 80% «русской» Сети, оставляя далеко позади ближайших соперников.

По данным сервиса Liveinternet в октябре 2012 года пользователи отдавали предпочтение следующим поисковикам:

Согласно представленному графику Yandex – безусловный фаворит соперничества (52.7% — Яндекс и Яндекс картинки), Google занимает почетное второе место (36.2% — Google и Google картинки). В тройке лидеров и Mail.ru (8.5%), с отрывом оставивший позади Rambler (1.1%).

На первом месте – неудивительно – Yandex. Чем объясняется подобная популярность? Активной рекламной кампанией, удачным набором сервисов или действительно релевантным поиском? Рассмотрим каждую из лидирующих поисковых систем в отдельности, выделяя преимущества и недостатки каждого варианта.

Yandex

Самая популярная на сегодняшний день поисковая система Рунета открылась для пользователей в 1997 г. Яндекс сегодня – это сочетание удобного поиска и системы полезных сервисов (от прогноза погоды и расписания электричек до собственного почтового сервера).

Отличительные способности поискового механизма Яндекса – автоматическая проверка контента web-страниц на уникальность (исключение копий из результатов поиска), учет морфологии русского языка, расширенный поиск по заданным непосредственно пользователем критериям.

Google

Американская поисковая система Google – поисковик номер один в сети Интернет (около 80% мирового рынка). Лидер международного web обладает наиболее глобальной базой проиндексированных документов, а также высокой частотой обновления поисковой базы.

Google – это поисковая система, ориентированная на пользователей из разных стран – на момент 29 октября 2012 г. Google способен находить информацию на 195 языках.

Как и Яндекс, Google имеет собственный язык поисковых запросов, позволяющий пользователям задавать ограничения поиска определенными сайтами, страницами, типами файлов (расширенный поиск).

Помимо поисковой системы Google представляет широкий спектр различных сервисов как для вебмастеров, так и для рядовых пользователей Интернета.

Поиск Mail.ru

Поисковая система Mail.ru работает на поисковом движке Google, также используют и собственные алгоритмы, но в незначительной степени.

Rambler

Старейший русскоязычный поисковик, созданный в 1996 г. и некоторое время державший первую строчку в рейтинге поисковых систем Рунета. Рамбер различает русский, английский и украинский языки (язык можно задать в настройках пользовательского интерфейса поисковой системы), учитывает морфологию.

 

Поисковик Яндекс | Горилла Маркетинг

ООО «Яндекс» уже давно является крупнейшей поисковой системой в России. Это не только поисковая система, но и веб-браузер, который имеет отдельное название YaBrowser. Он выполняет в основном те же функции, что и Google, включая поиск текста, карт и новостей, а также запускает платный рекламный сервис.

Яндекс популярен не только в России, но и в Белоруссии, Украине, Казахстане и Турции.

В настоящее время компания и ее медиа-подразделение базируются в Москве.

 

История Яндекса

Компанию придумали два друга, Илья Сегалович и Аркадий Волож. Они придумали концепцию и название (которое удачно расшифровывается как «Еще один iINDEXer») в 1993 году. И Сегалович, и Волож занимались компьютерными науками и разработкой программного обеспечения.

 

Когда был официально запущен Яндекс?

Яндекс.ру был официально запущен 23 сентября 1997 года. Впечатляет то, что компания запустила таргетированную рекламу, именуемую контекстной рекламой, в 1998. Это было впереди Google.

 

Гугл популярнее Яндекса?

Компания продолжала расти на протяжении 2000-х годов. Из-за устойчивого успеха браузера запуск Google в России в 2006 году оказался не таким успешным, как предполагалось. В 2009 году Mozilla Firefox 3.5 заменил Google на Yandex в качестве веб-браузера по умолчанию для компьютеров в России. Это фактически лишило Google шансов занять первое место среди российских веб-браузеров.

В этом десятилетии влияние Яндекса также распространилось на соседей России с его запуском в Украине и последующим открытием центра разработки в Киеве в 2007 году. В 2010 году он также запустил англоязычную версию браузера в надежде укрепить свое присутствие. глобально.

Google так и не смог обогнать Яндекс, хотя стабильно остается на 2 месте с момента запуска в России. Сегодня Яндекс является поисковой системой по умолчанию на большинстве российских телефонов.

 

Значение поисковой системы Яндекс

Яндекс занимает третье место в мире по доле рынка и является основной поисковой системой во всей России. Поэтому, если вы хотите, чтобы ваши страницы занимали высокие позиции в России, вам нужно убедиться, что ваша SEO-стратегия соответствует требованиям Яндекса.

Кроме того, если у вас есть веб-страницы, содержащие русский язык, вы должны использовать Яндекс, чтобы повысить их рейтинг. Трудно получить сайты, написанные исключительно на русском языке, для ранжирования в Google. Поэтому, если вы хотите, чтобы ваши веб-страницы вообще ранжировались, вам нужно смотреть на Яндекс как на свою главную цель.

С точки зрения SEO Яндекс также важен благодаря следующим факторам:

 

Яндекс легче ранжировать, чем Google

Мало того, что русскоязычным сайтам легче ранжироваться на Яндексе, но там также меньше трафика, чем в Google и Bing, что упрощает попадание в верхние строчки рейтинга. Алгоритм Яндекса также намного менее продвинут, что не только упрощает ранжирование, но и снижает вероятность того, что ваш сайт будет наказан.

Даже если ваш сайт по какой-либо причине оштрафован, вы можете легко связаться со службой поддержки клиентов и узнать о причинах, по которым ваш сайт был оштрафован, и о том, как вы можете это исправить.

 

Яндекс помогает ранжироваться в других поисковых системах. Это означает, что, следуя рекомендациям, изложенным Яндексом, вы также одновременно соответствуете SEO-предпочтениям других поисковых систем. У Russia.ru еще меньше конкурентов, чем у Яндекса, что позволяет вам занимать еще более высокие позиции.

 

Российская электронная коммерция все еще развивается

В некоторых частях России и соседних странах, особенно в Кыргызстане и Казахстане, электронная коммерция остается нетронутой по сравнению с остальным миром. По этой причине повышение рейтинга ваших услуг в Яндексе может потребовать значительных инвестиций в бизнес.

Многие компании уже воспользовались преимуществами этого развивающегося рынка, но места еще много.

 

Какая доля рынка у Яндекса?

По данным Statista, на 2022 год компания занимает 60,98% доли российского рынка. В настоящее время Google занимает 37,79% рынка, а с 2019 года, когда он занимал 40,57% рынка, он неуклонно снижался. Хотя Facebook в настоящее время запрещен в России, Google Search, Maps и YouTube все еще доступны, поэтому Google удалось остаться на 2-м месте.

 

Доля рынка Яндекса в других странах

В соседних странах доля рынка Яндекса значительно сокращается. В Беларуси, например, компании принадлежит 16,23% доли рынка, тогда как Google принадлежит 82,19% по состоянию на июль 2022 года.

 

доля в мире по-прежнему значительна. По данным Statcounter, текущая доля Яндекса на мировом рынке составляет 1,49%. Это делает компанию третьей по величине поисковой системой в мире после Bing и Google. В настоящее время его доля больше, чем у Yahoo!, DuckDuckGo и Baidu.

 

Какие еще услуги предлагает компания Яндекс?

Компания подражала модели Google, предоставляя не только технологию поиска, но и несколько других полезных сервисов, доступных как в версии веб-браузера, так и в приложении.

К сервисам, к которым имеют доступ пользователи Яндекса, относятся:

  • Браузер
  • Ест
  • Алиса (виртуальный помощник)
  • Облако
  • Почта
  • Диск (служба хранения файлов)
  • Launcher (пусковая установка приложений)
  • Рынок
  • Карты
  • Метрика (используется для веб-аналитики)
  • Новости
  • Музыка
  • Перевести
  • Видео
  • Такси

 

Как работает Яндекс?

Хотя технически проще ранжироваться в Яндексе, чем в Google, все же существует ряд критериев, которым ваш сайт должен соответствовать, чтобы быть одобренным поисковой системой. Что-то похоже на Google, а что-то совершенно уникально для российского рынка.

Яндекс оценивает следующие факторы ранжирования:

 

Вовлеченность пользователей

Хотя Google утверждает, что не считает вовлеченность пользователей фактором ранжирования, это один из главных компонентов успешной SEO-кампании Яндекса. В частности, Яндекс смотрит, сколько времени пользователи проводят на вашей веб-странице, и ранжирует сайты на основе этого. Чем дольше браузер находится на вашей странице, будь то чтение контента или просмотр видео, тем выше рейтинг страницы.

Мы не рекомендуем использовать всплывающие окна как средство повышения вовлеченности пользователей, так как это часто наказывается Яндексом.

 

Контент

Ваш контент должен быть сильнее, чтобы ранжироваться в Яндексе, чем в Google. При оценке веб-страницы Яндекс особенно чувствителен к спаму в виде наполнения ключевыми словами и чрезмерной оптимизации. Обязательно заранее изучите ключевые слова и публикуйте только хорошо написанный и информативный контент.

Как и в большинстве поисковых систем, чем ближе ваш контент к четкому ответу на поисковый запрос, тем выше он будет ранжироваться.

Кроме того, ваш контент должен быть четко написан на русском языке — все, что читается как плохой перевод, скорее всего, будет проигнорировано. Вам также необходимо ознакомиться с Законом об ограничении доступа к Интернету в России, чтобы знать, что можно и что нельзя упоминать.

 

SEO на странице

Яндекс также оценивает SEO на странице, например метатеги, описания изображений, URL-адреса и заголовки страниц.

 

Обратный трафик

Количество обратных ссылок, которые у вас есть, не имеет значения для Яндекса — важен объем трафика, который эти обратные ссылки притягивают.

 

Коммерческая надежность

Вот уже более 10 лет благонадежность бизнеса играет важную роль в ранжировании веб-страниц на Яндексе. В 2013 году компания опубликовала документ «Рейтинг коммерческих запросов с учетом качества». В этом документе компания продемонстрировала, как коммерческая надежность влияет на ранжирование.

Согласно этому документу, наиболее важные подкатегории этого фактора ранжирования включают:

  • Надежность
  • Качество обслуживания
  • Удобство использования
  • Качество дизайна

 

Чтобы соответствовать всем этим категориям, вы должны убедиться, что ваши продукты снабжены подробным описанием и ценами. Кроме того, вам необходимо предоставить услугу доставки и политику возврата. Легкодоступная служба поддержки и стандартный контактный номер также помогут повысить общую надежность вашего сайта.

 

Возраст домена

Возраст домена, к сожалению, является одним из важнейших факторов ранжирования Яндекса. Если вы запускаете новый сайт, это не зависит от вас, если только вы не купите старый домен, который уже имеет рейтинг.

 

Удобство для мобильных устройств

Если ваш сайт создан в первую очередь для мобильных устройств, то он, скорее всего, будет иметь более высокий рейтинг в Яндексе. Этот браузер отдает предпочтение веб-сайтам, которые имеют самое быстрое время загрузки для мобильных телефонов и, как правило, предлагают мобильные экраны хорошего качества.

 

Заключительные мысли

Яндекс уже более 20 лет является главной поисковой системой России, и, будучи многопрофильной компанией, его доминирование, скорее всего, сохранится на долгие годы. Если вы хотите выйти на прибыльный российский рынок, соблюдение стандартов поисковой оптимизации Яндекса является обязательным, причем не только в Яндексе, но и в других российских поисковых системах, таких как Russia.ru.

Основными факторами ранжирования поисковой системы являются возраст домена, вовлеченность пользователей, качество контента, коммерческая надежность, трафик с обратных ссылок и SEO на странице.

Российская поисковая система «Яндекс» становится глобальной

«Яндекс», ведущая поисковая система в России, запустила глобальную поисковую систему на Yandex.com. И некоторые ранние отзывы пользователей довольно хороши. В своем объявлении (на русском языке) Яндекс называет это «альфа-сервисом» и «началом большого пути». В этом англоязычном пресс-релизе компания сообщает, что индексирует иностранные […]

Мэтт МакГи 19 мая 2010 г., 17:24 | Время считывания: 2 минуты

Яндекс, ведущая поисковая система в России, запустила глобальную поисковую систему на Yandex.com. И некоторые ранние отзывы пользователей довольно хороши.

В своем анонсе (на русском языке) Яндекс называет это «альфа-сервисом» и «началом большого пути». В этом англоязычном пресс-релизе компания сообщает, что последние два года она индексировала иностранные веб-сайты и добавляла их контент в свою поисковую систему.

В объявлении на русском языке Яндекс называет эту новую глобальную поисковую систему «платформой для тестирования новых алгоритмов [в] глобальном поиске, а не сервисом для аудитории». Но первые отзывы общественности о результатах Yandex.com были положительными.

Ник Уилсдон, маркетолог из России, написал сегодня:

«Это не стартап, а устоявшаяся компания с солидной технологической и финансовой базой для работы. На российском рынке они не только отбились от Google, но и увеличили долю рынка за последние 3 года. … Это явно выстрел из лука Google. И да, они должны волноваться».

Дункан Моррис из британского агентства поискового маркетинга Distilled изучил результаты поиска на Yandex.com и спросил, является ли он «лучшей поисковой системой в мире».

«После очень короткой игры я был невероятно впечатлен относительным отсутствием спама и качеством возвращаемых результатов. Не говоря уже о том, что нет никакой рекламы.

Возьмем, к примеру, запрос «купить виагру онлайн», рассадник всего плохого в Интернете. На момент написания статьи 3 из 5 лучших результатов, которые возвращает Google, относятся к взломанным доменам .