Поисковые системы
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, то есть уместность результата), полнота базы, учёт морфологии языка.
Индексация информации осуществляется специальными поисковыми роботами.
В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.
Улучшение поиска — это одна из приоритетных задач сегодняшнего Интернета.
1. Использование поисковых систем на Западе
По данным компании Net Applications в декабре 2007 года использование поисковых систем на Западе распределялось следующим образом:
Google — 77,04 %
Yahoo — 12,46 %
MSN — 3,33 %
AOL — 2,12 %
Ask — 1,38 %
AltaVista — 0,13 %
Excite — 0,07 %
Lycos — 0,02 %
All the Web — 0,02 %
В вышеприведенный отчёт не входят российские поисковики, такие как, например, Яндекс, Рамблер или Nigma.
По данным аналитической компании comScore все поисковые сайты в декабре 2007 года обработали 66 млрд 221 млн поисковых запросов.
Яндекс попал в статистику и находится на 9-ом месте.
2. История поисковых систем
Одним из первых инструментов поиска в интернете (до WWW) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993.
Первой полнотекстовой, то есть индексирующей ресурсы при помощи робота, поисковой системой стала «WebCrawler», запущенная в 1994.
В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах.
Кроме того, это был первый поисковик, о котором было известно в широких кругах.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista».
В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!».
Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность.
В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport.
23 сентября 1997 была открыта поисковая машина Яндекс.
Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo.
В 2005 году на российских просторах при поддержке МГУ запущен поисковик Nigma, поддерживающий автоматическую кластеризацию.
В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака ключевых слов.
Nigma тоже экспериментировала с визуальной кластеризацией.
3. Русскоязычные поисковые системы
Большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др.
Яндекс (46,3 % Рунета)
Mail.ru (8,9 % Рунета)
Rambler (3,3 % Рунета)
Nigma (0,5 % Рунета)
Генон (0,1 % Рунета)
Gogo.ru (<0,1 % Рунета)
Aport (<0,1 % Рунета)
Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм — так QIP.ru используют поисковый механизм Яндекса, Mail.ru использует Google, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
Русскоязычные поисковые системы.
Русскоязычные поисковые системы, в целом, не содержат информацию об иностранных сайтах, поэтому для поиска информации на иностранных языках лучше использовать англоязычные поисковые системы. Наиболее популярные русскоязычные поисковые сис
темы:
Яndex h t t p : / / y a n d e x . ru
Рамблер http://www.rambler.ru
Google h t t p : / / w w w . g o o g l e . r u
Апорт h t t p : / / w w w . a p o r t . r u
Если вас интересуют другие поисковые системы, вы легко найдете их в каталогах ресурсов, щелкнув на соответствующем разделе.
Простейший поисковый запрос.
Каждая поисковая система содержит на своей главной странице строку, помеченную словом «Поиск», «Найти» или каким-либо аналогичным. Слово или несколько слов,
внесенные в эту строку, называются поисковым запросом. Поисковые системы не требуют от пользователей специальных знаний. Представьте, что вы звоните по телефону в обычную справочную службу. Вы формулируете вопрос — вам дают ответ. Точно такой вопрос вы можете внести в строку запроса поисковой системы и получить ответ. Но эти два ответа будут существенно отличаться по качеству.
Хорошая поисковая система ищет слова с учетом русской морфологии, т.е. ищет не только само слово из запроса, но и его измененные формы. В зависимости от формулиров-ки запроса вы можете найти:
— то, что вам необходимо;
— найти очень много страниц, содержащих ненужные вам сведения;
— найти очень мало страниц;
— вообще ничего не найти.
Все зависит от того, насколько широко или узко сформулирован ваш запрос.
Если результат поиска вас не устраивает — попробуйте поискать еще раз, используя другое количество слов (большее или меньшее), либо используя в запросе синонимы.
Простой способ уточнения запроса.
Самый простой путь уточнения запроса, если найдено много бесполезных ссылок — воспользоваться флагом «искать в найденном» (у Google—«поиск среди результатов»).
Все перечисленные поисковые системы позволяют осуществлять поиск среди страниц, найденных в результате выполнения предыдущего запроса. Для этого найдите на странице отчета рядом со строкой запроса окошко с подписью «искать в найденном». Щелкнув на этом окошке, вы установите флаг или (у Google флаг не устанавливается — внизу страницы с результатами поиска имеется специальная кнопка «поиск среди результатов», открывающая окно уточняющего поиска).
Теперь новым, уточняющим запросом, вы сможете отсеять бесполезные ссылки. Если найденных страниц по прежнему слишком много, вы можете повторить процедуру, еще раз уточнив запрос. Однако не следует забывать, что, возможно, в результате уточняющего запроса за кадром останутся полезные вам сайты. Другая опасность: уточне-ние было в целом верным, но исходный запрос изначально излишне сузил границы поиска.
Почему найдено слишком мало страниц?
Типичная причина—наличие орфографических ошибок в запросе. В результате поисковая система либо вообще не находит подходящих страниц (если в результате ошибки
вы набрали слово, которого в русском языке нет), либо, что более вероятно, находит совсем не те страницы, которые вам нужны (ведь русский язык богат на слова).
Некоторые поисковые системы проверяют слова запроса на орфографические ошибки. Так, в случае обнаружения ошибки, Апорт помещает над таблицей результатов поиска строку «Возможно, вы имели в виду:».
Следует учитывать, что авторы сайтов тоже допускают орфографические ошибки. Если ваша ошибка совпала с ошибкой в текстах сайтов, поисковый отчет будет коротким, но не нулевым. Продолжая искать информацию с помощью других поисковых систем или каталогов, используя запрос с орфографической ошибкой, вы будете находить лишь те тексты, в которых содержится ваша ошибка. Поэтому важно предварительно проверить
орфографию запроса и только после этого осуществлять поиск.
Вторая причина неудовлетворительных результатов поиска — в запросе использованы слишком «узкие» слова. Переформулируйте запрос, используя синонимы. Например, можно искать «выращивание грибов», а можно — «производство» или «разведение».
Заглавные буквы в запросе.
Яndex и Рамблер различают заглавные (прописные) буквы и строчные. Если слова в запросе написаны с прописной буквы, то Яндекс найдет только те страницы, на кото
рых с данного слова начинается предложение, либо оно является именем собственным.
Рамблер учитывает заглавные буквы, если с них в запросе начинаются два и более слова.
Использование в запросе редких слов.
Если в запросе используются редкие слова, неологизмы и т.п., результаты поиска могут оказаться неудовлетворительными. В этих случаях следует применять в запросе морфологические формы слов.
Почему найдено слишком много страниц?
Апорт, Рамблер и Яndex ищут все словоформы, указанные в поисковом запросе. Например, указав в запросе слово «мыть», в результатах поиска вы обнаружите различные
формы глагола «мыть» и местоимения «мой». Чтобы исключить словоформы, можно воспользоваться специальными символами.
Поиск точной словоформы
Поисковая система Синтаксис Примеры
Апорт Нет —
Рамблер «» (двойные кавычки), «торговая»
Google по умолчанию —
Яndех ! перед словом !торговая
Оператор «ИЛИ »
Поисковая система Синтаксис Примеры
Апорт ИЛИ, OR, | выращивание ИЛИ разведение
Рамблер OR, | выращивание OR разведение
Google нет —
Яndех | выращивание | разведение
Оператор «И »
Поисковая система Синтаксис Примеры
Апорт И, AND, &, + приготовление И форели
Рамблер AND, & приготовлениеAND форели
Google по умолчанию —
Яndех & (в пределах предложения) приготовление & форели
&& (в пределах документа) приготовление && форели
Задание порядка действия операторов в запросе
Приоритет оператора «И» выше, чем приоритет оператора «ИЛИ». Это означает, что в запросе, включающем в себя оба этих оператора, сначала будет выполнен оператор «И», а только после него оператор «ИЛИ». Так, по запросу грибы and производство or разве-дение, будут найдены страницы, содержащие либо одновременно грибы и производство, либо только слово разведение. Чтобы задать иной порядок действия операторов, при
меняются скобки (). В Google скобки использовать нельзя.
Ограничение поиска с помощью оператора «НЕ» .
Если в результате поискового запроса найдено слишком много страниц, их количество можно сократить, исключив из результатов поиска документы, содержащие какое-то определенное слово. Этим целям служит логический оператор «НЕ». «НЕ» — указывает на необходимость искать те веб-страницы, в которых НЕ содержится следующее за оператором слово.
Оператор «НЕ»
Поисковая система Синтаксис Примеры
Апорт НЕ, NOT, — грибы НЕ рецепты
Рамблер NOT грибы NOT рецепты
Google — (минус) —
Яndех ~ (в пределах предложения) грибы~рецепты
~~ (в пределах документа) грибы~~рецепты
Если слово должно быть!
По умолчанию поисковые системы игнорируют в поисковом запросе союзы, предлоги, частицы, местоимения и другие частотные слова. В ряде случаев необходимо указать поисковой системе на необходимость учитывать такое слово в запросе. Для этого перед словом необходимо поставить знак «+». Из перечисленных нами поисковых систем данный оператор не используют Рамблер и Апорт.
Внимание! Операторы «+»,«-» не отделяются от слов запроса пробелом.
Дополнительные возможности языков запросов.
Кроме описанных выше операторов языка запросов, существуют и другие. Существуют операторы ограничивающие при поиске расстояние между ключевыми словами,операто-ры ограничения по дате, указывающие , на каком сайте осуществлять поиск , ограничива-ющие поиск отдельными элементами HTML файла или подписями к картинкам и т. д. Чтобы получить более подробную информацию о языке поисковых запросов той или иной поисковой системы, щелкните на пункте «Помощь» или «Справка» меню поисковой системы.
Задание к лабораторной работе
1. Цель работы: знакомство с методами и технологией сбора информации в сети; приобретение навыков поиска информации с использованием сетевых ресурсов.
2. Задание: составить обзор ЛЮБЫХ информационных источников по указанной теме. Объем результата поиска – не менее 80 источников с датой появления не старше 5 лет.
3. Тема информационного поиска: Обзор информационных источников «Современные концепции и системы автоматизированного проектирования электронной аппаратуры»
4. Инструментарий: по выбору (обосновать)
5. Отчет по работе, включающий, помимо стандартных разделов (цель, выбор инструментария, результаты и т.д.) примеры запросов, способов сужения пространства поиска, использования специальных символов.
6. Выводы по работе
Научные поисковые системы и базы данных ФГБОУ ВО «МГТУ»
Полезные ссылки на научные поисковые системы и базы данных, признанные научным сообществом
Scopus
http://www.scopus.com
Крупнейшая в мире единая реферативная база данных, индексирует более 22 000 научно-технических и медицинских журналов примерно 4000 международных издательств. Более 300 журналов на русском языке. В свободном доступе представлен только каталог авторов.
Интерфейс на английском языке. Русскоязычные источники не индексируются. Руководство пользователя (pdf, 6,13 Мб, на рус. яз.)
Web of Science (WOS)
http://www.isiknowledge.com/ — библиографическая база
EndNote — ресурс для организации и выгрузки библиографических данных
http://wokinfo. com/russian/ — русскоязычный сайт компании Thomson Reuters
Авторитетная политематическая реферативно-библиографическая и наукометрическая (библиометрическая) база данных. В ней индексируются около 12 500 журналов, из которых около 170 — российских. Эти ресурсы не содержат полных текстов статей, однако включают в себя ссылки на полный тексты в первоисточниках и списки всех библиографических ссылок, встречающихся в каждой публикации, что позволяет в краткие сроки получить самую полную библиографию по интересующей теме. (Глубина архива — с 1980 года).
Также на стартовой странице есть ссылка не ресурс EndNote, который представляет быстрый и лёгкий сбор информации для ссылок из широкого круга источников, таких как PubMed и Web of Knowledge – при помощи прямой выгрузки, онлайн-поиска и импорта текстовых файлов. Для работы с EndNote необходима индивидуальная регистрация в WOS или EndNote!
ScienceDirect
http://www.sciencedirect.com
ScienceDirect издательства «Elsevier» («Эльзевир») — крупнейший в мире электронный ресурс информации по науке, технологии и медицине. Разработан для удовлетворения информационных потребностей научных, образовательных, коммерческих и правительственных организаций. Часть журналов ScienceDirect находятся в свободном доступе. Интерфейс на английском языке. Индексирование русскоязычных источников. Краткое руководство пользователя (pdf, 6,62 Мб, на рус. яз.). Список журналов свободного доступа (doc, 52 Кб)
Science Research Portal
http://www.scienceresearch.com/scienceresearch/
Научная поисковая система, осуществляющая полнотекстовый поиск в журналах многих крупных научных издательств, таких как Elsevier, Highwire, IEEE, Nature, Taylor & Francis и др. Ищетстатьиидокументывоткрытыхнаучныхбазахданных: Directory of Open Access Journals, Library of Congress Online Catalog, Science. gov иScientific News. Интерфейс на английском языке. Индексирование русскоязычных источников.
GoogleScholar– Академия Google
http://scholar.google.ru/
Поисковая система научной литературы. Используя единую форму запроса, можно выполнять поиск по различным дисциплинам и источникам, включая рецензированные статьи, диссертации, книги, рефераты и отчеты, опубликованные издательствами научной литературы, профессиональными ассоциациями, высшими учебными заведениями и другими научными организациями. Академия Google позволяет найти исследование, наиболее точно соответствующее запросу. Интерфейс на русском и английском языках. Индексирование русскоязычных источников.
Scholar.ru
http://www.scholar.ru/
Поисковая система научных публикаций. Проект был создан для упрощения поиска документов научной тематики на русском языке, в первую очередь – выполненных в России. Основная цель проекта – сбор информации о свободно скачиваемых научных публикациях. Проект не рассчитан на хранение полных текстов статей в том или ином виде, вместо этого используется база ссылок на тексты документов с информацией о самих публикациях (аннотация, авторы и т. д.). Интерфейс на русском языке.
Scirus
http://scirus.com/
Специализированная система поиска научной информации. Предоставляет ученым, исследователям и студентам возможность поиска по более чем 370 миллионам проиндексированных страниц. Индексы включают не только научные журналы, но и персональные страницы ученых, ресурсы, препринты материалов, патенты, научные репозитарии и вебсайты.Интерфейс на английском языке. Индексирование русскоязычных источников.
CiteSeer Publications ResearchIndex
http://citeseer.ist.psu.edu/
Научная поисковая система, индексирующая статьи в PostScript и PDF формате с научных веб-сайтов. Многие статьи (по желанию авторов) доступны для бесплатного скачивания. Кроме полнотекстового поиска по статьям система также осуществляет поиск ссылок на данную публикацию или автора. Интерфейс на английском языке.
Ingenta
http://www.ingentaconnect.com/
Библиографическая база данных универсального профиля, включающая описания статей из англоязычных журналов и сборников. Ее наполнение ведется с 1988 года. Объем базы составляет более 13 миллионов записей. Интерфейс на английском языке. Русскоязычные источники не индексируются.
AGRIS (Agricultural Research Information System)
http://agris.fao.org/.
Международная информационная система по сельскому хозяйству и смежным с ним отраслям — создана в 1974 г. ФАО с целью координации усилий по сбору, обработке и распространению информации по сельскому хозяйству и продовольственной проблеме в странах мира. Система является как библиографической службой, так и международной сетью, объединяющей 240 национальных центров и международных центров обработки и ввода документов в базу данных (БД) AGRIS. В настоящее время функции национального центра AGRIS в Российской Федерации выполняет ЦНСХБ. За 2007-2015 гг. специалистами ЦНСХБ подготовлено и отправлено в БД AGRIS более 4800 записей, в 2015 г. — более 1100 записей.
Похожие новости
Поиск в Интернет. Русскоязычные системы поиска :: Федеральный образовательный портал
Опубликовано на портале: 28-05-2004
Ольга Владиславовна Леонова Университетское управление. 1997. № 3(3). С. 41-52.Тематический раздел:
Сегодня в России уже несколько десятков тысяч серверов, а число пользователей, работающих в режиме онлайн, превысило стотысячный рубеж.
Интернет предоставляет информационный сервис, которым могут воспользоваться как компании, так и отдельные граждане, как для работы, так и для повседневной жизни (например, поисковые системы и базы данных или электронные формы для заказа товаров). Основной вопрос, который сегодня стоит перед пользователями Интернет: как найти и получить необходимую информацию? В статье объясняется устройство и возможные варианты поиска нужной информации в Интернете.
О.В. Леонова
ведущий математик ЦКТ
Уральского государственного университета.
ПОИСК В ИНТЕРНЕТ.
РУССКОЯЗЫЧНЫЕ СИСТЕМЫ ПОИСКА.
Сегодня в России уже несколько десятков тысяч серверов, а число пользователей, работающих в режиме on-line, превысило стотысячный рубеж.
Все эти компьютеры предоставляют информационный сервис, который компании или отдельные граждане могут использовать в работе и повседневной жизни, например, поисковые системы и базы данных или электронные формы для заказа товаров. Основной вопрос, который сегодня стоит перед пользователями Интернет, — как найти и получить необходимую информацию.
За годы развития Интернет были разработаны различные средства доступа к информации. Это такие виды сетевого взаимодействия как
- FTP, Gopher — системы передачи информации
- Archie, WAIS, Veronica — системы поиска информации в сети
- Telnet, E-mail, UseNet, IRC — коммуникационные сервисы
- WWW (World Wide Web) — мультимедиа система
World Wide Web («Всемирная паутина») возникла в 1994 году в CERN (Европейская лаборатория физики элементарных частиц). Ее появление было вызвано необходимостью единообразного способа доступа к различным видам информации (текстам, графическим изображениям, звуковым фрагментам), не требуя при этом выполнения большого количества действий и специальной подготовки со стороны пользователя.
Для работы с системой WWW вам необходимо установить на своем компьютере WWW-browser (WWW-браузер) — специальную программу просмотра. Браузер — это программа — клиент, которая взаимодействует с системой WWW, получает затребованные вами документы и отображает их на экране. Документы, используемые системой WWW, называются гипертекстовыми документами. Гипертекст — это текст, который внутри себя содержит ссылки на другие документы. При подготовке документов для WWW используется специальный язык HTML (HyperText Markup Language — язык разметки гипертекста). HTML — стандарт, который представляет собой набор команд, описывающих структуру документа. Конкретный вид документа определяет программа-браузер, которая интерпретирует HTML-документ и отображает его на экране в отформатированном виде. Команды HTML вставляются в текст и определяют, наряду с внешним видом документа, логический статус отдельных фрагментов текста. Например, среди команд HTML есть команда для выделения названия документа (<TITLE>), есть команды для выделения заголовков различных уровней внутри документа (<h2>, <h3>, <h4>, ), есть команды, позволяющие вставить в документ другие объекты (изображения, звуки, анимацию), команды, с помощью которых устанавливаются гипертекстовые связи с другими документами — ссылки (<A>) и т.д.
С помощью WWW-браузера возможно пользоваться также другими сервисами Интернет. Например, два наиболее популярных сейчас браузера Netscape Navigator и Microsoft Internet Explorer позволяют обращаться к анонимным Gopher-, Wais-, FTP-серверам, серверам телеконференций UseNet, пользоваться электронной почтой (E-mail), а также дают возможность доступа к удаленному компьютеру по протоколу Telnet.
По мере развития Интернет увеличивается объем информации в ней содержащейся и вместе с этим возникает проблема поиска нужной информации. Таким образом, вероятность существования необходимой информации возрастает, а возможность ее нахождения уменьшается. Теоретически гипертекстовая природа WWW обеспечивает нахождение любой информации в процессе целенаправленного продвижения по ссылкам. Однако, среди более 60 млн. документов (а именно столько документов, по некоторым оценкам, существует сегодня в Интернет), найти нужный документ, продвигаясь от ссылки к ссылке, практически невозможно.
Перед тем как перейти к вопросу о том, как правильно искать в Интернет нужный вам документ, необходимо разобраться в том, где искать. Прежде всего, необходимо классифицировать информационные ресурсы Интернет.По способу представления информации все информационные ресурсы можно разделить следующим образом:
- Web-ресурсы
- Базы данных
- Файловые серверы
- Телеконференции (UseNet)
- Gopher-серверы
Все чаще WWW интерфейс используется как стандартный метод доступа к остальным ресурсам. Методы поиска информации могут быть различны. Как уже отмечалось, есть возможность искать необходимую вам информацию переходя от ссылки к ссылке, т.е. вручную. Однако, учитывая размеры Интернет, можно предположить, что вероятность найти нужный документ очень низкая. Лучший вариант — воспользоваться специально предназначенным для этого сервером Интернет. Сервер — это компьютер, программа, а также набор данных. Сервер (или сайт) обеспечивает определенный сервис в Интернет. Здесь можно провести аналогию с поиском книги в библиотеке. Для того, чтобы книгу или статью легко было найти, ей присваивается уникальный идентификатор, состоящий из букв и цифр. Таким образом, зная название книги, библиотекарь легко найдет ее среди бесчисленного множества других. Поисковый сервер занимается тем, что собирает данные в Интернет, а затем позволяет этими данными воспользоваться. Сегодня поисковых серверов насчитывается свыше 120. Наиболее полный их список есть по адресу http://ugweb.cs.ualberta.ca/~mentor02/search/search-all.html. Остается только выбрать, какому из них отдать предпочтение.
Чтобы определить, на каком поисковом сервере остановить свой выбор, необходимо знать, как организован сбор информации для этих серверов. Для того, чтобы поисковая система отвечала своему назначению, информация должна быть предварительно накоплена и просмотрена. Есть два основных способа сбора информации для систем поиска и связанных с ними способа организации собранной информации.
- Первый способ — ручной сбор информации — означает, что все документы последовательно
просматриваются группой специалистов.
Такой подход предполагает организацию поисковой системы как предметно-ориентированной, где информация по определенным темам собрана в соответствующих каталогах. Примерами таких каталогов являются: Yahoo! (http://www.yahoo.com/), Magellan (http://www.mckinley.com/) — среди зарубежных каталогов; Созвездие Интернет (http://www.stars.ru/), Russia on the Net (http://www.ru/), «Ау!» (http://www.rocit.ru/) — среди российских каталогов. - Сбор информации с помощью роботов (search robots). В этом случае поисковая система представляет собой Search Engine (SE) — машину поиска. Вся предварительная работа по просмотру документов выполняется поисковым роботом. Робот — это программа, которая автоматически просматривает структуру всех гипертекстовых ссылок и индексирует содержимое всех обнаруженных по ссылкам документов. При индексации фиксируются положения всех более или менее значащих слов, которые называются ключевыми (к «неключевым» словам относятся союзы, предлоги, местоимения и т.д.). После разбора документа робот включает его в свою базу данных. В данном случае пользователь будет иметь дело с SE, обращаться к базе данных которой можно только посредством специального интерфейса.
Этот подход требует очень большой доли труда квалифицированных специалистов. Однако документы, просмотренные и разобранные таким образом, более адекватны теме.
Информация, собранная роботом, имеет больший объем, чем при ручном сборе, поскольку количество документов, которые просматривает робот, может быть любым. Однако в этом случае формальным критерием оценки документов служат отдельные слова, а также то, как часто они встречаются в документе, в какой части документа они находятся и т.д. в зависимости от алгоритма, а не общий смысл документа. Поэтому, разные по смыслу документы могут быть объединены по формальным признакам. По этой причине среди найденных документов может быть много совершенно не относящихся к теме поиска. В этом отличие SE от ручного сбора информации.
Общее количество известных программ-роботов уже превышает 150. Каждый робот использует свой алгоритм просмотра и индексации документов, поэтому информация, накопленная двумя разными роботами, может быть различна. Это означает, что использование одних и тех же ключевых слов в различных SE приведет к разным результатам. Важно знать также, что с помощью SE возможен поиск как среди HTML-документов на WWW-серверах, так и среди других типов документов и на других типах серверов.
Рассмотрим самые популярные машины поиска. Качество, а значит, и популярность поисковой машины определяются несколькими параметрами:
- размером базы данных SE (т.е. пространством проиндексированных документов)
- процедурой создания запросов к данной SE
- характером выдаваемой информации (ранжирование, фрагменты текста, краткое содержание и т.п.)
- скоростью обработки запроса
- обратной связью (возможность уточнения результатов поиска)
Российские системы поиска.
Для поиска документа на русском языке лучше воспользоваться русской поисковой системой. Если известна тематика искомого документа или можно оценить, на каком сервере он может находиться, но неизвестен адрес этого сервера, тогда лучше будет использовать какой-нибудь тематический каталог (или, рубрикатор). Пользоваться таким предметным каталогом несложно. Рассмотрим один из каталогов в русской части Интернет.
«Созвездие Интернет»
(http://www.stars.ru/).
Слева на экране находятся темы, по которым рассортированы все ресурсы, зарегистрированные в каталоге: поисковые сервисы и каталоги, компьютеры и технологии, экономика и бизнес, политика и право, культура и искусство, образование и наука, средства массовой информации, техника и транспорт, медицина и здоровье, отдых и развлечения, разное. Кроме того, вы можете воспользоваться быстрым поиском. Дело в том, что при регистрации ресурса в этом каталоге для каждого ресурса вводятся слова с его описанием. На первой же странице каталога появляется строка для ввода с предложением ввести слово в описании ресурса. Наберите, например, в поле для ввода слово управление, и нажмите кнопку ПОИСК. На экране появится сообщение о том, сколько ресурсов, содержащих в описании слово управление имеется в данном каталоге. Ниже будет выведена таблица (по 10 ресурсов на страницу), в левой части которой название сервера и ссылки на первую страницу данного сервера, или несколько первых страниц для различных кодировок: Win (windows-1251), KOI (koi8-r — кодировки русского языка, Eng (english) — английского языка.
Теперь рассмотрим, как пользоваться поисковой машиной (SE). Для того чтобы эффективно пользоваться SE, необходимо помнить, что на каждой поисковой машине существует свой язык запросов к накопленной ею базе данных. Поэтому, зайдя на поисковый сервер, прежде чем формировать запрос, надо посмотреть ссылку «Помощь» (или «Help») с описанием порядка формирования запросов. В этой статье приводится описание языка запросов для нескольких поисковых машин. Отличием русских поисковых машин является то, что с их помощью, в отличие от иностранных SE, можно искать документы, набирая русские ключевые слова в поле запроса. Особенности морфологии русского языка накладывают определенные требования на SE, которые используются для индексации русской части Интернет. Если в английском языке достаточно поменять окончание, чтобы найти различные варианты одного и того же слова, то в русском языке может изменяться все слово целиком. С этим связаны трудности индексации и поиска русских документов в Интернет.
Машина поиска Rambler
(http://www.rambler.ru).
Данная система служит для поиска документов на серверах России и стран СНГ. В ее базе данных содержится более 2,000,000 документов (адресов URL1) с более чем 15,000 хостов (имен DNS2). Имеет развитый язык запросов и гибкую форму вывода результатов. Однако морфологический разбор слова не производится.
ПРОСТОЙ ЗАПРОС
В простом запросе вы можете использовать одно или несколько слов, разделенных пробелами. Могут быть использованы как русские, так и английские словосочетания. По умолчанию, если вы не используете расширенный поиск и не отметили в нем, что должно встретиться любое слово, считается, что в найденных документах должны содержаться все слова. После того, как вы ввели ключевые слова, нажмите правой кнопкой мыши на надписи «Поиск», которая расположена справа. Кроме простого ввода слов, вы можете использовать язык запросов, принятый для поиска документов на «Rambler». В этой таблице коротко описаны элементы этого языка.
Элементы | Пояснение | Примеры |
Логические связки: And, Or, Not. | Поисковые термины могут быть объеденены логическими операциями посредством служебных слов And, Or и Not. Символы ‘&’, ‘|’ и ‘!’ могут использоваться в сочетании со служебными словами или вместо них. | Управление and законодательство not бюджет Во всех найденных документах будут присутствовать слова управление и законодательство и отсутствовать слово бюджет. |
Регистр букв. | Любой поисковый термин может содержать в себе как заглавные, так и прописные символы. Индекс базы данных строится с приведением слов к прописным символам. | Федеральный бюджет или федеральный Бюджет Будут найдены одни и те же документы. |
Усечение слов. * и ? | Возможно использование метасимволов ‘*’ и ‘?’ для обозначения произвольной части слова и произвольного символа слова. По умолчанию система ищет документы с теми ключевыми словами, которые вы ввели. | орган?зация and управлен* and ВУЗ Знак ? используется, если нет уверенности в написании слова. Знак * заменяет несколько букв слова. |
Весовые коэффициенты. + и — | Вы можете использовать ‘+’ и ‘-‘ для увеличения/уменьшения весового значения любого слова. Возможно многократное использование данных символов. | —система and ++управлен* Слово система будет иметь меньший вес, поэтому документы с этим словом будут расположены после слов, начинающихся на управлен |
Поиск в части документа. $спец.слово | Для этого вы можете использовать специальные слова: $All (используется по умолчанию), $URL, $Title, $Header, $Essence, $Address. Специальные слова начинаются с символа ‘$’. | $TITLE: управление and $URL: virlib.eunnet.net Будут найдены документы, у которых в поле заголовка есть слово управление и они содержат ссылку на сервер с адресом http://virlib.eunnet.net/ |
Логические группы. ( ) | Термины могут быть сгруппированы посредством использования символов ‘(‘ и ‘)’. Возможна многократная вложенность скобок в сочетании с логическими операторами. | управленческие and(функции or полномочия) |
Вывод результатов поиска.
На одну страницу будет выведено15 первых из всех найденных документов, а внизу страницы (если общее число найденных документов больше 15) появится стока со ссылками на страницы с остальными найденными документами: по 15 документов на страницу. «Rambler»производит ранжирование найденных документов в зависимости от частоты употребления и местоположения искомых слов. В начале списка будут выведены документы, наиболее полно удовлетворяющие запросу. После заголовка документа, который одновременно является ссылкой на данный документ, в скобках будет стоять число — 1,0000, что означает максимальное соответствие запросу, и ниже. Далее следует несколько первых строк документа, его адрес в явной форме, дата его создания или модификации, объем файла, в скобках вид кодировки. Если адресов у документа несколько, это означает что, либо найдены полностью идентичные документы, либо это один и тот же документ, но в разных кодировках.
ДЕТАЛЬНЫЙ ЗАПРОС
Механизм составления детального запроса реализован через меню.
Ключевые слова набираются в поле запроса через пробел. Под строкой для ввода ключевых слов можно выбрать позиции для поиска.
- Поиск в: Российский Web, Российский Usenet, имена URL (адреса), название документов, заголовках документов, начале документов, поле адресов. Выбрав одно из полей, можно ограничить область поиска документа: www серверами; телеконференциями Usenet; адресами серверов Интернет; именами файлов; полями <TITLE> в гипертекстовых документах; первыми абзацами документов.
- Кол-во: 15, 30, 50. Количество результатов, которые будут выводиться на одну страницу.
- Слова. Логические операции над ключевыми словами. Опция «Все» означает, что в каждом найденном документе будут все ключевые слова (аналог and и &). «Любое» означает, что в каждом найденном документе будет присутствовать хотя бы одно из ключевых слов (аналог or и |).
- Форма вывода результатов. Нормальная форма (используется по умолчанию при простом запросе): заголовок, показатель соответствия запросу (числовой и в виде точек), первые строки документа, URL документа, дата создания, объем, кодировка. Краткая форма: заголовок, степень соответствия запросу. Детальная форма: более подробная информация о документе, например, перечислены все заголовки, а также когда документ последний раз проверялся роботом.
- Расширить слова. Опция «нет» означает, что искать надо строго по введенным ключевым словам, не добавляя окончаний. «Да» — добавить к введенным ключевым словам все возможные окончания (аналог *).
- От даты: До даты: Например, От даты: 21/Mar/96 До даты: 1/Jan/98. Будут найдены документы, созданные или модифицированные в период с 21 марта 1996 г. до 1 января 1998 г.
- Исключить документы, содержащие следующие слова. Слова, которые будут введены в этом поле, будут отсутствовать в найденных документах.
- Сайт или часть URL, в которых произвести поиск. Можно ограничить поиск только одним сервером (сайтом), набрав в этом поле его URL или несколькими сайтами, введя только часть URL, а не искать во всей базе данных поисковой машины. Например, www.stack.net, gopher://gopher.dux.ru/, ua.
Главный недостаток «Rambler» — невозможность осуществлять поиск по целой фразе или хотя бы указывать в запросах предельное расстояние между искомыми терминами. Случайное сочетание совершенно не связанных слов, например, в начале и конце текста, приводит к выдаче ссылок на документы, совершенно не релевантные запросу. Несовершенный метод ранжирования результатов по степени соответствия запросу приводит к тому, что искомые документы часто оказываются не в начале списка.
«Апорт!»
(http://www.aport.ru/).
Поиск ведется по 1 327 132 документам (2 759 935 URL, 10 971 сервер). Это данные на 1998-02-28. Вы можете набрать интересующие вас ключевые слова через пробел. Машина найдет все документы, в каждом из которых содержатся все введенные слова. Важное достоинство «Апорт» — поиск с учетом морфологии русского языка. Вы можете вводить слова в любой грамматической форме. Например, запрос университетское управление будет полностью эквивалентен запросу университетским управлением. Кроме того, английские слова могут указываться в запросе наравне с русскими.
В таблице — краткое описание языка запросов поисковой машины «Апорт».
Логические операторы: и, или | Оператор и подразумевается (т.е. действует по умолчанию), его можно опускать: запрос университетское управление полностью эквивалентен университетское и управление. По любому из этих запросов будут найдены документы, содержащие оба слова. По запросу университетское или управление будут найдены документы, содержащие хотя бы одно из указанных слов. |
Двойные кавычки » » | Двойные кавычки следует использовать, если вы хотите искать словосочетание. По запросу «университетское управление» будут выданы только документы, содержащие указанное словосочетание (возможно, в разных грамматических формах), тогда как по запросу университетское управление будут выданы и те документы, где заданные слова стоят далеко друг от друга и, может быть, даже в обратном порядке. |
Круглые скобки ( ) | Круглые скобки задают порядок действия логических операторов. По запросу быстрый или качественный поиск будут выданы документы, содержащие либо слово «быстрый«, либо одновременно слова «качественный» и «поиск» (оператор и действует первым). По запросу (быстрый или качественный) поиск будут выданы документы, где встречаются одновременно слова «быстрый» и «поиск«, либо «качественный» и «поиск«. |
Фигурные скобки { } | Фигурные скобки ограничивают расстояние между словами, задавая его числом предложений. Запросу {3, управленческие функции} будут соответствовать документы, где слова « управленческие» и «функции» встречаются в пределах трех соседних предложений. Цифра (вместе с запятой) может опускаться, тогда подразумевается 1, то есть слова должны встречаться в одном предложении: {управленческие функции. |
Квадратные скобки [ ] | Квадратные скобки аналогичны фигурным с той лишь разницей, что расстояние между словами измеряется не в предложениях, а в словах. По запросу [4, уголовные преступления] будут найдены документы, где между словами стоит не более двух посторонних слов. |
Для поиска по URL используйте оператор URL (в форме URL: или URL=). Если надо найти упоминания адреса сервера в текстах документов, рекомендуется использовать поиск в пределах предложения с заменой ‘/’ на пробелы.
Например, {UniMgmt.EUNnet.net unimng}.
Не используйте в запросе так называемые «стоп-слова». К «стоп-словам» относятся предлоги, союзы, междометия и т.д. Если вы укажете в запросе слово пожалуйста, то «Апорт» не найдет никаких документов.
Дополнительные возможности.
- Исправлять ошибки в запросе. Если вы не уверены в правильности написания ключевых слов, вы можете выбрать эту опцию. Машина автоматически исправит ошибки.
- Очистить историю запросов. Все предыдущие запросы сохраняются.
- Форма результата. Предлагается возможность гибкого указания формы выдачи результатов поиска.
- Перевод запроса. Автоматического перевода запроса с русского на английский и наоборот. В поисковую строку можно ввести термины на любом из двух языков и выбрать из меню условие: искать только на английском, на английском и русском, только на русском.
- Перевод результата. Возможно указать необходимость перевода результатов на английский, русский, либо не переводить.
Результат поиска.
По 10 на страницу. Название документа, дата создания, ссылка на документ в явном виде (URL документа), кодировка, степень соответствия запроса (в процентах), количество предложений, соответствующих запросу. Есть возможность посмотреть на реконструкцию текста (т.е. не весь текст, а только его реконструкция). «Апорт!» показывает фрагмент текста, который удовлетворяет искомому запросу.
Недостатком «Апорт!» является невозможность управлять ранжированием результатов.
Яndex
(http://yandex.ru/).
Проанализировано 12043 серверов. Накоплена информация о 2 402 168 ссылок (URL). Область поиска этой SE — «русская Интернет», т.е. домены верхнего уровня ‘su’ и ‘ru’, домены бывшего СССР (например, ‘ua’, ‘kz’) и Web-сайты в других доменах, содержащие русские тексты. «Яndex» «понимает» русскую морфологию и различные русские кодовые таблицы. Учитывает при разборе ключевых слов морфологию русского языка. В русском языке возможно изменение слова в целом, а не только его окончание.
ПРОСТОЙ ПОИСК.
При заходе на сервер этой SE в окне браузера появляется окошко для ввода запроса.
Естественный язык запросов.
Поскольку использование специального языка запросов требует некоторого навыка работы с SE, очень важно, что «Яndex» предоставляет возможность свободного запроса, то есть вы можете набрать запрос на естественном языке. В этом случае вы тоже получите документы в той или иной степени удовлетворяющие запросу.
Специальный язык запросов.
В том случае, если удовлетворяющие вас документы не найдены по запросу на естественном языке, вы можете воспользоваться специальными символами для формирования запроса. Внизу поля для ввода запроса имеется надпись: «строгий поиск (с языком запросов)». Если вы поставите флажок напротив этой надписи, то все символы этого языка запросов могут быть использованы.
Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова идти, идет, шел, шла и т. д. На запрос окно будет выдана информация, содержащая и слово окон, а на запрос отзывали — документы, содержащие слово отозвали.
Кроме того, возможен поиск с указанием желаемого расстояния между словами. Если все слова в тексте перенумеровать по порядку их следования, то расстояние между словами a и b — это разница между номерами слов a и b. Таким образом, расстояние между соседними словами равно 1 (а не 0), а расстояние между соседними словами, стоящими «не в том порядке», равно -1. То же самое относится и к абзацам. В таблице приведен язык запросов к поисковой машине «Яndex».
Элементы | Пояснение | Примеры |
Заглавные буквы | Если в запросе набрано слово с большой буквы, будут найдены только слова с большой буквы, в противном случае будут найдены как слова с большой, так и с маленькой буквы. | Например, запрос вуз (также как и ВУЗ) найдет любое упоминание этого слова. Запрос Вуз — только те случаи, когда слово написано с большой буквы. |
Точная словоформа ‘!’. | По умолчанию поиск учитывает все формы заданного слова согласно правилам русского языка. Однако существует возможность поиска по точной словоформе, для этого перед словом надо поставить восклицательный знак ‘!’. | Так по запросу ‘!управленческих‘ будут найдены все документы, содержащие словоформу управленческих, а по запросу ‘управленческие ~~ ! управленческих‘ — документы, в которых есть слово управленческие, кроме тех, которые были найдены по первому запросу. |
Логическое сложение & | Несколько набранных в запросе слов, разделенных пробелами, означают, что каждое из них должно входить в один абзац искомого документа. Тот же самый эффект произведет употребление символа ‘&’. | Например, при запросе ‘документооборот управление‘ (или ‘документооборот & управление‘), результатом поиска будет список документов, в которых в одном абзаце содержатся и слово ‘документооборот‘, и слово ‘управление‘. |
&& | Двойной оператор && ищет также как и &, но во всем документе. | По запросу ‘документооборот && управление’ будут найдены документы, содержащие где бы то ни было оба эти слова |
Логическое вычитание | или , | Между словами можно поставить знак ‘|’ (или запятую ‘,’), чтобы найти документы, содержащие любое из этих слов. | Запрос вида ‘функции | полномочия‘ или ‘функции, полномочия ‘ задает поиск документов, содержащих в одном абзаце хотя бы одно из слов функции или полномочия. |
Логическое отрицание ~ | Этот знак, тильда ~, позволит найти документы с абзацем, содержащим первое слово, но не содержащим второе. | По запросу ‘централизация ~ децентрализация‘ будут найдены все документы, содержащие слово ‘ централизация ‘, рядом с которым (в пределах абзаца) нет слова ‘децентрализация‘. |
~~ | Двойной оператор ~~ ищет в пределах документа. | Запрос ‘централизация ~~ децентрализация‘ выдаст все документы со словом ‘централизация‘, но без слова ‘децентрализация‘ |
/n | Если между двумя словами поставлен знак ‘/’, за которым сразу напечатано число, значит, требуется, чтобы расстояние между ними не превышало этого числа слов. | Например, задав фразу ‘система /2 управления‘, Вы требуете найти документы, в которых содержатся и слово ‘холодный’ и слово ‘вода’, причем расстояние между ними должно быть не более двух слов и они должны находиться в одном абзаце. |
/+n | Если порядок слов и расстояние точно известны, можно воспользоваться пунктуацией /+n. Так, например, задается поиск слов, стоящих подряд. | Запрос ‘система /+1 управления‘ означает, что слово ‘вода’ должно следовать непосредственно за словом ‘холодный’. (Кстати. к тому же результату приведет запрос «холодная вода») |
Ограничение по расстоянию /(n m) | В общем виде ограничение по расстоянию задается при помощи пунктуации вида ‘/(n m)’, где ‘n’ минимальное, а ‘m’ максимально допустимое расстояние. Отсюда следует, что запись ‘/n’ эквивалентна ‘/(-n +n)’, а запись ‘/+n’ эквивалентна ‘/(+n +n)’. | Запрос ‘система /(-2 4) управления‘ означает, что ‘управления‘ должна находиться от ‘система‘ в интервале расстояний от 2 слов слева до 4 слов справа. |
Практически все знаки можно комбинировать с ограничением расстояния. | Например, результатом поиска по запросу система ~ /+1 управления будут документы, содержащие слово ‘система‘, причем в этих документах слово ‘управления‘ не следует непосредственно за словом ‘система‘. | |
Когда знаки ограничения по расстоянию стоят после двойных операторов, то употребленные там числа — это расстояние не в словах, а в абзацах. Расстояние в абзацах определяется аналогично расстоянию в словах. | Запрос ‘ система && /1 управления‘ означает, что слово ‘вода’ должно находиться в том же самом, либо в соседнем со словом ‘холодный’ абзаце. | |
Круглые скобки ( ) | Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки. | Например, запрос ‘(организация,система) /+1 (управления|менеджмента)’ задает поиск документов, которые содержат любую из фраз ‘организация управления‘, ‘организация менеджмента‘, ‘система управления‘, ‘система менеджмента‘. |
$Title: | Можно искать информацию в заголовках (имя «зоны»: Title) и ссылках (имя «зоны»: A). Cинтаксис: $имя_зоны логический_множитель | Запрос ‘$Title КомпТек’ ищет в заголовках документов слово ‘КомпТек’. |
$A: | Можно искать информацию в ссылках. | |
$А логическое выражение или $Title логическое выражение | Можно использовать логические операторы после $A или $Title | Запрос ‘ $A (КомпТек | Dialogic)’ находит документы, в cсылках внутри которых есть одно из слов ‘КомпТек’ или ‘Dialogic’. |
Ранжирование результатов поиска.
При поиске для каждого найденного документа «Яндекс» вычисляет величину релевантности (соответствия) содержания этого документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.
Пользователь может повлиять на порядок сортировки, используя операторы веса и уточнения запроса. Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, cодержащих «взвешенное» выражение.
Синтаксис:
слово:число
или
(поисковое_выражение):число
Например, по запросу ‘поисковые механизмы:5’ будут найдены те же документы, что и по запросу ‘поисковые механизмы’. Разница состоит в том, что наверху списка найденного окажутся документы, где чаще встречается именно слово ‘механизмы’. Запрос ‘поисковые (механизмы|машины|аппараты):5 ‘ равнозначен запросу ‘поисковые (механизмы:5|машины:5|аппараты:5) ‘.
Задание уточняющего слова или выражения применяется для того, чтобы увеличить релеватность документов, cодержащих уточняющее выражение.
Синтаксис:
<- слово
или
<- (уточняющее_выражение)
Например, по запросу ‘компьютер <- телефон ‘ будут найдены все документы, содержащие слово ‘компьютер’, при этом первыми будут выданы документы, содержащие слово ‘телефон’. Если ни в одном документе со словом ‘компьютер’ нет слова ‘телефон’, результат запроса будет эквивалентен запросу ‘компьютер’.
Результаты поиска.
Результаты поиска появляются на экране по 10 на страницу по мере убывания степени соответствия запросу (максимальная степень соответствия — [1.000000]). Внизу каждой страницы находятся ссылки (по номерам) на другие страницы с найденными по запросу документами. Для каждого документа в списке найденного указан его заголовок, ссылающийся на размеченный документ, начало текста документа, кодировка, размер в байтах, дата и URL документа, ссылающийся на оригинальный документ. Если вы не хотите , чтобы результаты запроса пропадали с экрана, вы можете нажать на маленькие окошечки слева от явной ссылки на оригинальный документ. При этом документ загружается в новое окно браузера. При нажатии на явную ссылку оригинальный документ загрузится в текущее окно браузера.
Что означает разметка документа? Если в списке найденного нажать на заголовок документа, Вы увидите так называемую «подсветку». «Яndex» при индексации запоминает положение слова в документе, что дает возможность выделить (подсветить) слова, найденные в тексте. И не просто подсветить, а переходить с одного слова на другое. При этом подсвечиваются не все слова, входящие в запрос, а только те, которые удовлетворяют поисковому выражению.
Слова выделены угловыми стрелочками. Каждая стрелочка ссылается на следующее или предыдущее «найденное» слово. Чтобы увидеть первое найденное слово, нажмите на стрелочку влево , чтобы увидеть последнее — на стрелочку вправо . Переход на следующее слово — стрелочка > справа от слова, переход на предыдущее — слева <. Первое и последнее слова указывают на верхнюю и нижнюю таблицу соответственно. В начале размеченного документа помещается табличка с ссылками на первое и последнее найденное слово и на оригинальный документ. В конце документа — аналогичная табличка, где приводится статистика, то есть — сколько слов найдено (подсвечено) в данном документе. Если файлы были изменены, а индекс по ним не обновлен, об этом выдается соответствующее предупреждение.
Можно ограничить область поиска, отметив «искать в найденном» на странице результата.
Если же удовлетворяющий вас документ не найден, есть еще возможность воспользоваться поиском документов по образцу. Для этого нажмите на надпись «Найти похожие документы», которая находится под наиболее удовлетворяющим вас документом. При этом будет сформирован новый запрос к поисковой машине «Яndex» и найденные документы будут походить на исходный. Однако этой опцией надо пользоваться аккуратно, поскольку количество документов, найденных в результате может превысить разумный предел и, следовательно, не приведет ни к чему.
АКАДЕМИЧЕСКИЙ ПОИСК.
Нажав левой клавишей мыши на надпись «Advanced», расположенную в правой части экрана вместе с другими пунктами меню, на экране вы получите поле для ввода запроса и меню:
- Уточнение запроса. Если вы введете слова в этом поле, то первыми документами в списке результатов будут документы, содержащие эти слова.
- Выдача результатов.
Здесь можно выбрать краткую (заголовок и степень соответствия запросу) либо стандартную (которая была описана выше) форму выдачи результатов, а также количество документов, выводимых на страницу (10, 20 или 50). - Зона поиска. Искать во всем документе, только в заголовках, только в ссылках.
В остальном этот раздел ничем не отличается от простого поиска с «Яndex», т.е. в поле запроса можно использовать как естественный язык, так и специальный язык запросов, пометив пункт «строгий поиск (с языком запросов)».
Кроме прямого использования «Яndex», есть возможность сформировать с ее помощью запрос и отправить его на поисковые машины «AltaVista» или «Rambler». Для каждой из этих SE у «Яndex» есть специальный интерфейс, где пользователь набирает ключевые слова, отмечает необходимые для поиска опции. Нажав на кнопку «Обработка запроса», вы передаете свой запрос на «Яndex», которая обрабатывает его с учетом морфологии русского языка и отправляет на «AltaVista» или «Rambler» (в зависимости от выбранного вами интерфейса). Интерфейсы написаны для двух кодировок русского языка: Windows-1251 или KOI8-R
Интерфейс «Яndex» для «Rambler»
(http://www.comptek.ru/ramb.html).
- Учет словосочетаний. Если поле не помечено каждое слово заменяется на все свои формы, т.е. реализуется морфологический режим обработки запроса. Если поле помечено, по возможности учитываются синтаксические связи между словами в запросе, т.е. реализуется морфосинтаксический режим обработки запроса..
- Режим. Режим «Поиск» — запрос посылается на «Rambler». Если выбран режим «разбор запроса», то при нажатии на кнопку «ПОИСК!» на экран выдаётся протокол морфологического анализа всех слов запроса (из поля «Запрос»). Для каждого слова приводятся все варианты его морфологического разбора. Для каждого варианта разбора указаны все его грамматические характеристики. Если слово отсутствует в словарях системы, то она генерирует гипотетическую модель словоизменения этого слова. В конце протокола приводится расширенный запрос, сгенерированный словарным сервером.
- Поиск в WWW, UseNet, именах URLs (указывает на область поиска)
- Операции со словами. Все — означает логическую операцию И. Или — логическая операция ИЛИ.
- Количество результатов на страницу (10, 20 и т.д.)
- Форма вывода (нормальная, краткая, детальная)
Следующие поля не являются обязательными и применяются только для поиска в WWW (использование этих полей может замедлить поиск). (Вы не можете использовать мета-символы ‘*’ и ‘?’ в следующих полях)
- От даты: До даты: формат 21/Mar/96. Дата последнего изменения искомых документов.
- Исключить документы, содержащие следующие слова.
- Сайт или часть URLs, в которых произвести поиск. Примеры: ‘www.stack.net’ ‘gopher://gopher.dux.ru/’ ‘ua’
Запрос задается в формате детального запроса Rambler .
Морфологический режим обработки запроса.
В этом режиме каждое слово из запроса заменяется на все свои формы — с учётом родов, чисел, склонений, спряжений. Учитывается также омонимия (напр. по слову «раздел» будут даны все формы глагола «раздевать» и существительного «раздел»). Если Вы хотите искать слово только в той форме, в которой Вы его задали, поставьте его в кавычки. Слова, заключённые в квадратные скобки, трактуются как словосочетание, то есть часть запроса (их может быть несколько), взятая в квадратные скобки, обрабатывается в морфосинтаксическом режиме (как запрос при помеченном поле «Учет словосочетаний»). Вложенность квадратных скобок не допускается.
Морфосинтаксический режим обработки запроса.
Реализуется при помеченном поле «Учет словосочетаний» для всего запроса, или для частей запроса, взятых в квадратные скобки, когда это поле не отмечено. В этом режиме поисковый запрос трактуется как фраза на естественном языке. При этом поиск становится более релевантным, поскольку находится гораздо меньше «мусора», так как учитываются синтаксические связи между словами запроса. Также происходит частичное снятие омонимии: например, в случае задания поисковой фразы после проверки предлог после не будет считаться формой слова посол и последнее не будет дано для поиска во всех формах.
Запрос обрабатывается следующим образом.
- Все слова из запроса должны находиться в искомых документах, поэтому при генерации расширенного запроса применяется оператор and (&).
- Если слова в запросе синтаксически связаны, то расширенный запрос строится с учетом синтаксических связей.
- Знаки препинания игнорируются.
- Слова, набранные латиницей, в том числе and,or,near,not, считаются составной частью фразы (а не операторами языка запроса).
В данный момент учитываются два вида синтаксической связи:
1) Cогласование существительного с прилагательным или причастием в роде, числе и падеже.
Например, если задан запрос
информационные технологии, то расширенный запрос будет выглядеть следующим образом: ((информационная & технология) | (информационной & технологии) | (информационную & технологию) | ((информационной | информационною) & (технологией | технологиею)) | (информационные & технологии) | (информационных & (технологий | технологиях)) | (информационным & технологиям) | (информационными & технологиями)) , т.е. существительное и прилагательное согласованы в роде, числе и падеже.
«Морфологическое» расширение этого запроса выглядело бы так: (информационная or информационной or … /*далее по всем падежам и числам*/ ) & (технология or технологии or … /*по всем падежам и числам*/).
2) Управление предлога существительным или именной группой.
Например, запрос документооборот в управлении приводит к генерации расширенного запроса (документооборот or документооборота or … /*по всем падежам и числам*/) near в near (управлении or управлениях)
Интерфейс Яndex» для «AltaVista»
(http://www.comptek.ru/alta.html).
Используя этот интерфейс, «Яndex» посылает ваш запрос на поисковую систему «AltaVista», предварительно его обработав. «AltaVista» имеет русский интерфейс, но поиск с помощью этого интерфейса не учитывает морфологии русского языка. Однако эта SE обладает огромной базой данных проиндексированных документов, поэтому использование «Яndex» для формирования запроса в сочетании с большим количеством документов может дать хороший результат.
- Учет словосочетаний аналогичен такому же пункту для «Rambler».
- Область поиска: WWW, UseNet, Россия (домены ‘su’ и ‘ru’), Россия и США (домены ‘su’, ‘ru’, ‘com’, ‘edu’, ‘org’).
- Вывод результата. Стандартная, компактная, детализация, счетчик (будет указано только количество релевантных документов).
- Запрос:
- Наиболее значимые слова. Слова в этом поле будут восприняты как дополнительные ключевые, кроме того документы, в которых они встречаются, будут располагаться в начале списка результатов.
- Нач. дата: Конеч. дата: (напр.: 12/Янв/96)
- Режим («поиск» или «разбор запроса») аналогичен такому же пункту для «Rambler».
- Кодировка (Windows-1251 или KOI8-R)
В таблице приведен пример использования рассмотренных выше SE для поиска информации об университетском управлении.
Машина поиска | Запрос | Результат |
Яndex | университетский (менеджмент,управление) | Найдено 111 уникальных документов. |
университетский &/2 (менеджмент,управление) | Найдено 14 уникальных документов | |
Rambler | университетск* and (менеджмент or управление) | Найдено: 926 [676 уникальных] |
университетский and (менеджмент or управление) | Найдено: 130 [106 уникальных] | |
университетское & управление | Найдено: 36 [26 уникальных] | |
университетское & управление or университетский & менеджмент | Найдено: 53 [43 уникальных] | |
Апорт! | университетское (управление или менеджмент) | Найдено 989 документов |
{2,университетское управление} или {2,университетский менеджмент) | Найдено 233 документа | |
{1,университетское управление} или {1,университетский менеджмент} | Найдено 192 документа |
«Яndex»
Искомые документы находятся в начале списка. Кроме того, при большом количестве документов
возможно уточнение результатов («искать в найденном»).
«Rambler»
Необходимо отметить, что наличие * в конце слова позволяет «выловить» даже те документы,
в которых окончания этого слова были набраны ошибочно. В начале списка много документов,
мало относящихся к предмету поиска. Уточнение поиска невозможно.
«Апорт»
Находит слишком много документов, дальнейшее уточнение поиска не предусмотрено. Однако
среди первых документов есть документы, относящиеся к теме поиска.
Конечно, с другими ключевыми словами результаты поиска будут отличаться от результатов приведенных здесь.
1Uniform Resource Locator (универсальный указатель ресурса) — адрес документа в Интернет, включающий в себя имя протокола, имя компьютера, а также путь до документа. Например, http://www.usu.ru/eb-engl.htm . Здесь http — имя протокола передачи гипертекста, www.usu.ru — имя www-сервера Уральского государственного университета, eb-engl.htm — имя файла (документа). 2Domain Name System (доменная система имен) — устанавливает соответствие между компьютером в Интернет и его именем. Система служит для облегчения запоминания имен компьютеров в Интернет.
Полезная информация | Московский государственный институт физической культуры, спорта и туризма имени Ю.А. Сенкевича
Полезные ссылки
Научнык поисковые системы и базы данных
Google Scholar – Академия Google
http://scholar.google.ru/
Поисковая система научной литературы. Используя единую форму запроса, можно выполнять поиск по различным дисциплинам и источникам, включая рецензированные статьи, диссертации, книги, рефераты и отчеты, опубликованные издательствами научной литературы, профессиональными ассоциациями, высшими учебными заведениями и другими научными организациями. Академия Google позволяет найти исследование, наиболее точно соответствующее запросу. Интерфейс на русском и английском языках. Индексирование русскоязычных источников.
Scholar.ru – поисковая система научных публикаций
http://www.scholar.ru/
Проект был создан для упрощения поиска документов научной тематики
на русском языке, в первую очередь – выполненных в России. Основная цель
проекта – сбор информации о свободно скачиваемых научных публикациях.
Проект не рассчитан на хранение полных текстов статей в том или ином виде,
вместо этого используется база ссылок на тексты документов с информацией о
самих публикациях (аннотация, авторы и т. д.). Интерфейс на русском языке.
ScienceDirect
http://www.sciencedirect.com
ScienceDirect издательства «Elsevier» («Эльзевир») — крупнейший в мире электронный ресурс информации по науке, технологии и медицине. Разработан для удовлетворения информационных потребностей научных, образовательных, коммерческих и правительственных организаций. Часть журналов ScienceDirect находятся в свободном доступе. Интерфейс на английском языке. Индексирование русскоязычных источников. Краткое руководство пользователя (pdf, 6,62 Мб, на рус. яз.). Список журналов свободного доступа (doc, 52 Кб)
Science Research Portal
http://www.scienceresearch.com/scienceresearch/
Научная поисковая система, осуществляющая полнотекстовый поиск в журналах многих крупных научных издательств, таких как Elsevier, Highwire, IEEE, Nature, Taylor & Francis и др. Ищет статьи и документы в открытых научных базах данных: Directory of Open Access Journals, Library of Congress Online Catalog, Science.gov и Scientific News. Интерфейс на английском языке. Индексирование русскоязычных источников.
Scirus
http://scirus.com/
Специализированная система поиска научной информации. Предоставляет ученым, исследователям и студентам возможность поиска по более чем 370 миллионам проиндексированных страниц. Индексы включают не только научные журналы, но и персональные страницы ученых, ресурсы, препринты материалов, патенты, научные репозитарии и вебсайты. Интерфейс на английском языке. Индексирование русскоязычных источников.
CiteSeer Publications ResearchIndex
http://citeseer.ist.psu.edu/
Научная поисковая система, индексирующая статьи в PostScript и PDF формате с научных веб-сайтов. Многие статьи (по желанию авторов) доступны для бесплатного скачивания. Кроме полнотекстового поиска по статьям система также осуществляет поиск ссылок на данную публикацию или автора. Интерфейс на английском языке.
Ingenta
http://www.ingentaconnect.com/
Библиографическая база данных универсального профиля, включающая описания статей из англоязычных журналов и сборников. Ее наполнение ведется с 1988 года. Объем базы составляет более 13 миллионов записей. Интерфейс на английском языке. Русскоязычные источники не индексируются.
SciNet – Science search
http://www.scinet.cc/
Поисковая научная система и каталог научных ресурсов. Интерфейс на английском языке. Русскоязычные источники не индексируются.
Scopus
http://www.scopus.com
Крупнейшая в мире единая реферативная база данных, индексирует более 22 000 научно-технических и медицинских журналов примерно 4000 международных издательств. Более 300 журналов на русском языке. В свободном доступе представлен только каталог авторов. Интерфейс на английском языке. Русскоязычные источники не индексируются. Руководство пользователя (pdf, 6,13 Мб, на рус. яз.)
Живая карта : мультимедийный информационный ресурс
http://www.2r.ru/
Поисковые системы. часть первая. Русскоязычные поисковые системы
Dумаю, что Вы уже не раз слышали о том, как Всемирную Паутину сравнивали с огромной электронной энциклопедией. Общее число страниц (а точнее Web-страниц) в этой супер-энциклопедии уже превышает 320 миллионов. Совершенно ясно, что без специальных служб, называемых поисковыми машинами, найти что-либо в этом нагромождении информации практически невозможно. Поисковые машины представляют собой полностью автоматизированные системы, постоянно сканирующие сеть и работающие по определенному алгоритму, который держится в строжайшем секрете. Они могут обеспечить от 40% до 70% обращений к Вашему сайту, если он у Вас есть, конечно. Считается, что 95% трафика на сайты Рунета обеспечивают следующие поисковые системы (в алфавитном порядке).
Из них, скажем так, самая старая – MSN Search (дата регистрации домена 09.11.94), а самая молодая – Webalta (дата регистрации домена 28.07.05).
Кроме них существуют и другие поисковые системы, из которых я бы в первую очередь выделил региональные поисковые системы, то есть те, которые регистрируют сайты только в определенном регионе (или посвященные определенному региону), а также поисковики, работающие по оригинальному алгоритму, такие как Мамонт и Nigma.
МЕТА
Украинская поисковая система (добавить сайт можно здесь).
Поисковая система МЕТА предназначена для поиска по украинским интернет-ресурсам как на территории Украины, так и за ее пределами. Ресурс будет добавлен в поисковую базу в том случае, если он имеет региональное либо тематическое отношение к Украине.
Poisk.Com
Каталог + Поиск по белорусскому интернету (добавить сайт можно здесь).
Poisk.Com – белорусский проект. Поэтому к регистрации допускаются только белорусские сайты и сайты, имеющие отношение к Республике Беларусь. Проект состоит из каталога и поисковой системы. После регистрации вашего сайта в каталоге его посетит Паук Поиска и, пройдя по ссылкам, указанным на ваших страницах, проиндексирует содержание всего сайта. Таким образом, ваш сайт будет добавлен и в каталог, и в поисковую систему. При регистрации указывайте только главную страницу вашего сайта. Остальные будут проиндексированы автоматически.
1Piter.ru
Поисковая система и каталог (добавить сайт можно здесь).
В поисковую систему 1Piter.ru и TOP 100 принимаются только сайты Санкт-Петербурга и Ленобласти.
Euroseek
Поиск на 40 языках, в том числе и на русском. Новый российский поисковик
Мамонт
Система понимает запросы на русском, украинском и английском языках. Помимо стандартных текстовых и гипертекстовых форматов поиск производится по файлам xls, doc, rtf и pdf, что с положительной стороны отличает его от других новых игроков на поисковом рынке. Поиск на FTP сайтах: файлов в базе – 1 млрд. 251 млн. 835 тыс. 016. Отличительной особенностью «Мамонта», призванной исключить в выдаче поисковика спам и мусор, является тщательный отбор сайтов для включения в базу. В процессе работы из индекса вручную удаляются сайты, публикующие чужой контент, а также долгое время не обновляющиеся. Отрицательной стороной этой политики является малый размер индекса – в нем находится 950 тыс. документов, что значительно меньше показателей Nigma (1 млрд. ) и Webalta (300 млн.).
Nigma
Интеллектуальная поисковая система (добавить сайт можно здесь). Научный проект МГУ им.М.В.Ломоносова. Поиск среди примерно 1 052 227 229 русскоязычных документов по всему миру.
RA-GU
Поисковая система и каталог (добавить сайт можно здесь). Позволяет осуществлять поиск сразу в четырех поисковых системах: Яндекс, Гугл, Рамблер и Апорт.
Валерий Ермолаев, автор публикаций в области электронного бизнеса, ведущий популярной рассылки «E-commerce-статья недели» http://www.teleseminar.ru/newsletter.htm.
Библиотека ГИТИСа представляет список электронных ресурсов
Уважаемые студенты и преподаватели!
Научная библиотека ГИТИСа напоминает вам о возможности дистанционного доступа к следующим информационным ресурсам:
Российская государственная библиотека (РГБ) – крупнейшая российская публичная библиотека. Библиотека обладает универсальным по содержанию собранием отечественных и зарубежных документов на 367 языках мира. Имеются специализированные собрания из более чем 150 000 карт, 35 000 нот и звукозаписей, редких книг, изоизданий, диссертаций, газет и др.
Российская государственная библиотека искусств (РГБИ) – хранилище ценностей отечественной культуры и искусства, ведущее научно-информационное учреждение. Библиотека преобразована в 1991 году из старейшей театральной библиотеки и является главной библиотекой, собирающей фонды литературы по вопросам искусства и театра. Библиотека вошла в историю культурного прошлого и продолжает играть значительную роль в гуманитарных процессах нашего времени.
«Elibrary» – крупнейшая в России электронная библиотека научных публикаций, обладающая богатыми возможностями поиска и получения информации. Библиотека интегрирована с Российским индексом научного цитирования (РИНЦ), созданным по заказу Минобрнауки РФ бесплатным общедоступным инструментом измерения и анализа публикационной активности ученых и организаций.
На сайте «Электронная библиотека ИМЛИ РАН» в свободном доступе выложены более 600 сканов редких научных изданий. Доступны сотни электронных версий научных изданий разделенных по направлениям: «Теория литературы», «Русская литература», «Литература народов России и стран СНГ», «Зарубежная литература», «Фольклористика», «Периодика ИМЛИ», «Указатели и справочники». Издания доступны для просмотра и скачивания любому желающему. Регистрация на сайте не предусмотрена.
Театральная библиотека Сергея Ефимова представляет современные и классические пьесы, книги, учебники и литературу по театральной тематике. На ресурсе размещены произведения российских драматургов и переводы зарубежной драматургии на русский язык и др.
Библиотека Максима Мошкова – одна из первых и самых популярных русскоязычных электронных библиотек. Она открылась в 1994 году. Авторы и читатели ежедневно пополняют библиотеку на добровольной основе. Сервис не берет денег, читать бесплатно можно абсолютно все. Единственный минус – скачать книгу нельзя.
«Культура.РФ» – гуманитарный просветительский проект культурного наследия и традиций России. Портал рассказывает об интересных и значимых событиях в мире литературы, архитектуры, музыки, кино, театра, а также о народных традициях и памятниках нашей природы в формате просветительских статей, заметок, интервью, новостей и в любых современных интернет-форматах.
Театральная библиотека Сергеева – скачок в развитии науки о театре. Наше театроведение в 1920-е годы начиналось именно с источниковедения. Чем основательнее материал, тем достовернее исследование. Театроведению сто лет. Множество книг, изданных в предыдущие десятилетия, остались в единичных экземплярах в читальных залах. Коллекция электронной библиотеки сделала их доступными.
Проект «Русская справочная библиотека» призван помочь российским библиотечным работникам ориентироваться в ресурсах сети интернет. Сайт включает перечень материалов, которые могут быть эффективно использованы в различных библиотечных процессах. Каждый источник снабжен краткой аннотацией, позволяющей оценить его пригодность для выполнения той или иной задачи.
Вы можете обратиться к следующим разделам:
- Русскоязычные поисковые системы и справочники ресурсов интернет
- Электронные каталоги российских библиотек
- Электронные каталоги наиболее крупных зарубежных библиотек
- Библиографические базы данных
- Виртуальные энциклопедические и справочные издания
- Электронные каталоги издательств и книготорговых организаций
- Электронные библиотеки и полнотекстовые базы данных
Самым значительным электронным каталогом среди библиотек мира обладает Библиотека Конгресса США, предоставляющая доступ к сведениям о более чем 12 миллионах единиц хранения. Каталог, функционирующий на базе программного продукта Voyager компании Endeavor Information Systems, отражает сведения о книгах, периодических и продолжающихся изданиях, картах, рукописях и аудио записях. Из общего объема — 3.2 миллиона записей относятся к «старому каталогу», т.е. книгам и периодическим изданиям, поступившим в библиотеку с 1898 по 1980 годы и конвертированным из карточного каталога. В фондах Библиотеки Конгресса США, помимо прочих, содержится много русскоязычных материалов, описанных в транслитерации. Главное меню каталога предлагает выбрать из двух вариантов поиска: Basic Search и Guided Search. Наиболее эффективен Guided Search, позволяющий легко формировать поисковое предписание любой сложности с помощью меню всего из двух строк с дополнительными ограничениями (Search Limits). Помимо правильного ввода ключевых слов, максимально точно выражающих информационную потребность, существенное значение имеет правильное применение условий, задаваемых через выпадающие меню. Именно они обеспечивают правильную трактовку введенных терминов. Перечень результатов выдается в виде таблицы, представляющей описания в максимально сжатом виде. Щелчок мышью по конкретной записи делает ее более детальной (Brief record). Для получения полного представления о документе необходимо кликнуть на Full record (полная запись). Эта функция делает видимыми предметные рубрики, что весьма ценно при эвристическом поиске, когда область знания очерчена неточно. Система позволяет формировать список из общего перечня результатов. Сохранение записей может быть произведено разными способами, включая отправку отобранных описаний по электронной почте на любой адрес. Существует также функция заказа издания, однако, пока ею могут воспользоваться пока только конгрессмены и работники библиотеки.
Мультимедийная Всемирная история в 9 томах представляет тексты, 2000 иллюстраций и 300 видеофрагментов по искусству. Доступ к полезным ссылкам можно осуществить через электронный каталог библиотеки – в графе «Поиск» поле «Полезные ссылки», а также в рубрике «Информации о библиотеке».
Как «погуглить» или выполнить поиск в Интернете по-русски эффективно
Если вы пытаетесь улучшить свой русский язык, выполняя поиск контента на русском языке в Интернете, возможно, вам трудно найти то, что вы ищете. Если вы не рассматривали возможность просмотра / чтения русскоязычного контента в Интернете для улучшения своего русского языка, вам определенно следует это сделать. Погружение, погружение и… погружение — один из лучших способов выучить любой язык!
Ключевые проблемы в этом вопросе:
1.Использование правильных русских слов и
2. Иметь хоть какие-то знания о российских поисковых системах и основных агрегаторах контента.
Сегодня я дам вам несколько советов и ссылок, которые сделают задачу поиска нужного типа русскоязычного контента более плодотворной и интересной.
ИСПОЛЬЗОВАНИЕ ПРАВИЛЬНЫХ СЛОВ
Выбор подходящих слов для поиска может оказаться сложной задачей даже на вашем родном языке. Вы должны сделать свой запрос (слова, которые входят в строку поиска) как можно короче и конкретнее.
-Определите, какие слова вы хотите использовать в английском языке.
-Переведите слова на русский язык с помощью Google Translate (или другого аналогичного приложения).
-Скопируйте и вставьте русские слова в строку поиска.
-Перейти к результатам поиска.
Совет 1! Не пытайтесь использовать предложения, если вы не знаете, как правильно изменить окончания слов. Использование отдельных релевантных слов или нескольких слов может дать вам лучшие результаты.
Совет 2! Не используйте английские буквы для написания русских слов.Вы всегда можете скопировать / вставить переведенный русский текст в строку поиска, если у вас нет русской клавиатуры. Вы также можете использовать онлайн-клавиатуру, подобную этой, чтобы печатать именно то, что вы хотите, используя русские буквы.
ИСПОЛЬЗОВАНИЕ ПОИСКОВ И ОСНОВНЫХ АГРЕГАТОРОВ СОДЕРЖАНИЯ
Google, безусловно, проделал большую работу в России. Он становится все более популярным среди населения России. С учетом сказанного, я считаю, что вы можете положиться на google.ru в выполнении точного поиска на русском языке.Я бы не сказал того же о Bing, Yahoo или любой другой нерусской поисковой системе. Если вам достаточно удобно выполнять поиск через родной русский движок, я бы порекомендовал использовать yandex.ru или rambler.ru.
Агрегаторы контента, особенно с большим количеством видео, такие как rutube.ru, могут быть отличным местом для поиска всевозможных видеороликов на выбранную вами тему. Русский «Facebook», vkontakte.ru, также является отличным местом, чтобы улучшить свой русский, если вы присоединитесь к нескольким группам по интересам и попытаетесь участвовать в обсуждениях.
Как начать поиск в русскоязычном Интернете
По мере того, как напряженность в отношениях между Украиной и Россией продолжает накаляться, на первый план выходит необходимость для журналистов копаться в русскоязычном Интернете или Рунете и проверять сообщения. Но поиск источников, изображений и историй из России и Восточной Европы может оказаться сложной задачей, если вы не знаете языка.
Различия в проведении исследования русских источников заключаются не только в самом языке, но и в наборе инструментов, поскольку часто существуют более совершенные альтернативы таким сервисам, как Google Maps и Facebook для поиска в Рунете.
В дополнение к предоставлению ресурса для не говорящих по-русски по навигации в незнакомом разделе Интернета, это руководство показывает, что существуют особые проблемы при поиске и проверке материалов для историй на разных языках и в разных регионах. Большинство из этих рекомендаций в равной степени применимо, когда вы проводите исследования на турецком, арабском или любом другом языке с активной базой онлайн-пользователей.
Расширьте свой набор инструментовУ большинства журналистов есть несколько онлайн-инструментов, которые они используют для исследования и проверки, такие как Google Maps для проверки местоположения, а также Facebook и Twitter для поиска историй и людей.Эти инструменты по-прежнему достаточно хорошо работают для историй в большинстве стран из-за их почти повсеместного распространения, но часто есть лучшие альтернативы.
Российский аналог Google — Яндекс, который, помимо прочего, предоставляет поисковую систему, агрегатор новостей, поиск изображений и картографический сервис. Хотя о функции поиска нет ничего особенного, Яндекс Карты — отличный сервис, который часто превосходит Google Карты в России, Украине и Беларуси. Выбрав бинокль в нижнем левом углу экрана, вы можете включить режим «Панорама» — ответ Яндекса на Google Street View.
Синие области на карте показывают доступные снимки улиц для Яндекс Панорамы
Яндекс сделал множество снимков в сверхвысоком разрешении с воздушных шаров в некоторых крупных городах, что позволяет получить перспективу между видом улицы с земли и снимком со спутника.
Санкт-Петербург, вид с воздушного шара. Каждый синий значок воздушного шара указывает на дополнительные доступные изображения с этой точки зрения
Умный поискКак и при поиске материалов для рассказа на английском языке, наиболее распространенными поисковыми фразами, которые вы будете вводить в Twitter, Instagram и другие веб-сайты, являются названия мест.Если вы ищете информацию о пожаре или стрельбе в клубе, имеет смысл поискать в Twitter название клуба, его адрес и город, чтобы найти аккаунты свидетелей, фотографии, видео и т. Д. Эта практика, очевидно, будет работать на большинстве других языков, но некоторые службы могут обрабатывать этот поиск лучше, чем другие.
В русском языке, как и в других языках, прилагательные и существительные, составляющие географические названия, не остаются неизменными, как в английском языке. При описании того, что происходит в Большом театре, слово «Большой» никогда не меняется в английском языке, но так же, как «он» может измениться на «он», слово «Большой» изменит свое окончание на русском языке в зависимости от его роли в предложении. .
Если вы ищете учетные записи свидетелей в Твиттере, поиск по слову «Большой» на русском языке не покажет вам, что кто-то о чем-то говорит в Большом театре, рядом с Большим театром, за Большим театром, и скоро. В отличие от Twitter, эта проблема не возникает при использовании поиска Google, поскольку он распознает изменяющиеся формы слов на русском и других языках и будет включать их все в ваши поисковые запросы.
Если вам не удается найти материалы почти на любом языке в Твиттере, попробуйте добавить ключевое слово в Викисловарь.org, а затем скопируйте / вставьте варианты ключевого слова из раздела «Склонение» (для существительных и прилагательных) или «Спряжение» (для глаголов). Этот метод дает вам более десятка форм слова «Большой», чтобы расширить область поиска.
Таблица склонения всех возможных форм слова «большой» с ключевыми словами для использования в алгоритмах поиска
Искать в нужном местеДаже с идеальными ключевыми словами для поиска все будет напрасно, если вы будете искать не в нужных местах. Подавляющее большинство россиян не используют Twitter, и только около 10 миллионов имеют учетные записи в Facebook, но более 60 миллионов имеют учетные записи в российском клоне Facebook «Вконтакте» (ВКонтакте).
Услуга также чрезвычайно популярна в остальной части Восточной Европы, Центральной Азии и на Кавказе. Как подробно описано в руководстве по российским социальным сетям, довольно легко искать в ВКонтакте, не используя много русского языка, а его функции поиска при отслеживании определенных групп людей намного мощнее, чем у Facebook.
Домашняя страница Вконтакте, или ВК, самой популярной социальной сети в Восточной Европе и некоторых частях Центральной Азии и Кавказа
Феномен ВКонтакте, которого нет в большинстве стран Западной Европы и Америки, — это популярность местных групп для распространения и проверки информации. Часто лучший способ найти и проверить материалы в Восточной Европе — это отследить страницу группы в городе или районе, на которой могут присутствовать тысячи участников. В случае пожара в отдаленном районе Сибири или авиакатастрофы на Украине самый быстрый способ найти фотографии, видео и свидетельства очевидцев — это посетить страницы этих местных групп.
VK также отличается от Facebook и других западных сетей обилием информации о военной службе, часто в виде публичных групп для разных воинских частей. Поиск этих групп относительно прост, и вы можете искать пользователей с определенными видами военной службы, работы или образования, как в прошлом, так и в настоящем.
Как и во всех социальных исследованиях, будут полезные источники, у которых нет учетных записей в социальных сетях, и информация, предоставленная некоторыми источниками в социальных сетях, может быть неверной.Также стоит изучить другие сети, такие как «Одноклассники», у которого 40 миллионов российских пользователей, и «Мой Мир» (25 миллионов), чтобы расширить сеть.
Узнайте больше об этих и других сетях в полной версии этого руководства на Global Voices.
Хотя это резюме было специально для русскоязычных ресурсов, те же уроки можно применить почти к каждому региону для поиска новостей и проверки материалов. Например, с китайскими источниками вам нужно ориентироваться в Weibo, а общедоступные группы Telegram часто являются лучшим способом найти новые материалы, связанные с Сирией.Инструменты и методы, которые журналисты используют для публикаций, например, в США, Великобритании, Германии и Франции, будут достаточно хорошо работать и в других странах, но для поиска наиболее актуальных и заслуживающих внимания материалов необходимо применять подход «один размер для всех». заменить на регионально ориентированный.
Мои результаты поиска Google содержат много русского языка. Мой регион — Великобритания, и ни в Malwarebytes, ни в AVG нет вредоносных программ. | Форум поддержки Firefox
Спасибо за дальнейшие комментарии.
Fred McD, Я попробовал простой перезапуск в безопасном режиме — не помогло — потом заметил ваши дополнительные инструкции. Для справки в будущем, какие проблемы я буду искать? («Покопайтесь на безопасных сайтах. Есть ли проблемы?»)
Cor-el, я проверил ваши шрифты, сняв флажок, позволяющий страницам выбирать собственные шрифты. Без изменений. Все мои шрифты по умолчанию — хорошо известные латинские шрифты.
Zachary_, моя учетная запись Google определенно связана с моим компьютером; в основном я использую Google Диск и Google Документы (правда, только в Интернете, без приложения для синхронизации).Поскольку мой телефон от MS (Win 10 Mobile), на нем нет Google Диска, но, конечно, мой телефон подключен к моему компьютеру через обычные службы, такие как электронная почта. Я (все еще) в Великобритании и уже много лет не бывал в России. Ближе всего несколько недель назад была западная Польша … 🙂
Писец, нет, я не использую программу обеспечения конфиденциальности.
Я закончил просмотр своих файлов cookie. Я забыл, как быстро накапливается печенье.
Я удалил все, что не узнал, и некоторые из них.(В некоторых случаях мне, возможно, придется снова войти в систему — ничего страшного.)
NB: Среди удаленных файлов cookie было еще несколько с .ru, и вот, проблема исчезла! Один из них был от поисковой системы Яндекс.ру. Поскольку я не останавливался, чтобы следить за каждым удалением российских файлов cookie, я не могу сказать, какой из них был виновником, но это мой главный подозреваемый, хотя он заслуживает уважения …
Все комментарии полезны в будущем, поэтому спасибо всем, и особенно Fred McD, за предложение взглянуть на файлы cookie.
Спасибо за дальнейшие комментарии. Fred McD, я попробовал простой перезапуск в безопасном режиме — не помогло — потом заметил ваши дополнительные инструкции. Для справки в будущем, какие проблемы я буду искать? («Покопайтесь на безопасных сайтах. Есть ли проблемы?») Кор-эл, я проверил ваши шрифты, сняв флажок, позволяющий страницам выбирать собственные шрифты. Без изменений. Все мои шрифты по умолчанию — хорошо известные латинские шрифты. Zachary_, моя учетная запись Google определенно связана с моим компьютером; в основном я использую Google Диск и Google Документы (правда, только в Интернете, без приложения для синхронизации).Поскольку мой телефон от MS (Win 10 Mobile), на нем нет Google Диска, но, конечно, мой телефон подключен к моему компьютеру через обычные службы, такие как электронная почта. Я (все еще) в Великобритании и уже много лет не бывал в России. Ближайшим к нам несколько недель назад была западная Польша … 🙂 Писец, нет, я не использую программу обеспечения конфиденциальности. Я закончил просмотр своих файлов cookie. Я забыл, как быстро накапливается печенье. Я удалил все, что не узнал, и некоторые из них.(В некоторых случаях мне, возможно, придется снова войти в систему — ничего страшного.) NB: Среди удаленных файлов cookie было еще несколько с «.ru», и вот, проблема исчезла! Один из них был от поисковой системы Яндекс. ру. Поскольку я не останавливался, чтобы следить за каждым удалением российских файлов cookie, я не могу сказать, какой из них был виновником, но это мой главный подозреваемый, хотя он заслуживает уважения … Все комментарии полезны в будущем, поэтому спасибо всем, и особенно Fred McD, за предложение посмотреть файлы cookie.
Russian SEO — поисковая оптимизация в России
Чтобы привлечь клиентов из России, ваш веб-сайт должен быть указан в основных российских поисковых системах, таких как Яндекс. Позиционировать свой веб-сайт для России не так просто, как просто перевести его на русский язык. Русское SEO — это процесс улучшения видимости вашего сайта в результатах Google и Яндекс, чтобы ваши потенциальные клиенты из России нашли вас.
Россия — самый конкурентный онлайн-рынок в Европе
— Россия может похвастаться самым большим онлайн-населением среди всех европейских стран — 73.8 миллионов в 2013 году, по данным eMarketer.
— Самые популярные сайты в России, как правило, являются собственными: Яндекс контролирует самую большую долю рынка среди поисковых систем; Mail.ru остается ведущим поставщиком услуг электронной почты; VK, социальная сеть, похожая на Facebook, является ведущим социальным сайтом.
— По данным исследователей рынка comScore, российская поисковая система Яндекс в настоящее время занимает четвертое место по популярности в мире, опередив Microsoft Bing на пятое место.
— Россия, как огромная и многогранная страна, расположена на двух континентах.Это самая большая страна в мире с площадью более 16,9 млн км2, расположенная в 10 часовых поясах. Россия с населением 139 миллионов человек — это страна с экстремальными климатическими условиями и богатыми минеральными ресурсами, особенно нефтью, запасами угля и природного газа. Это крупнейший производитель нефти в мире и второй по величине экспортер. Москва — политический, экономический и финансовый центр России.
— После трудных лет перехода от коммунизма к капитализму в 1990-х годах российская экономика переживала сильный рост с начала 21 века до экономического кризиса 2008 года, который серьезно повлиял на страну.
— Россия вступила во Всемирную торговую организацию в 2012 году, что снизит торговые барьеры в России для иностранных товаров и услуг и поможет открыть зарубежные рынки для российских товаров и услуг. Россия столкнулась с трудностями в привлечении прямых иностранных инвестиций и в последние несколько лет испытала значительный отток капитала, что привело к официальным программам улучшения международных рейтингов России в отношении ее инвестиционного климата. Темпы роста экономики в 2012 году составили 3,4%.
— Большинство российских онлайн-пользователей выполняют поиск на русском языке, поэтому для того, чтобы быть найденными новыми клиентами на этом конкурентном рынке, веб-сайт вашей компании должен быть оптимизирован для российского рынка.
SEO в России: используйте свой сайт для привлечения потенциальных клиентов из России
Чем раньше (или занимал более высокий рейтинг на странице результатов поиска) и чаще сайт появляется в списке результатов поиска, тем больше посетителей он получит от пользователей поисковой системы.
Чтобы ваш веб-сайт чаще появлялся в результатах поисковых систем в России, нам необходимо принять во внимание вашу общую цифровую стратегию, оптимизировать ваше присутствие в социальных сетях, создать веб-сайт, оптимизированный для многоязычного поиска, создать отличный контент-маркетинг, посмотреть на коэффициенты конверсии, внедрение PR-подхода… Агентство Openvalley знает, как использовать социальные сети, как выполнять оптимизацию веб-сайтов и использовать контент-маркетинг для повышения вашего SEO-рейтинга в России.Мы заботимся о том, чтобы ваш веб-сайт привлекал больше посетителей, что ведет к увеличению бизнеса вашей компании.
Подход Openvalley к повышению рейтинга вашего сайта в России:
Что вы получите с нашими услугами по поисковой оптимизации в России?
— Отличная видимость: мы гарантируем, что ваш сайт достигнет высоких позиций в самых важных поисковых системах в России, таких как Яндекс или Google. ru
— носители русского языка, хорошо разбирающиеся в Интернете: мы заботимся о том, чтобы качество контента вашего сайта соответствовало ожиданиям вашей целевой аудитории.Мы работаем со специалистами-носителями русского языка.
— Централизованный мониторинг и управление сайтом: мы постоянно отслеживаем рейтинг вашего сайта и улучшаем результаты, адаптируя вашу стратегию SEO к вашим конкурентам в России и тенденциям на российском рынке. Вам будет легче контролировать интернационализацию своего веб-сайта, чем если бы вы имели дело с несколькими командами в разных странах.
— Экономичное решение: мы предлагаем индивидуальные решения, которые помогут вам добиться высокой видимости, и мы сосредоточены на получении лучших результатов обычного поиска для вашего русскоязычного веб-сайта по конкурентоспособной цене.
Какие цифровые сервисы выйти на российский рынок?
1 SEO для российского рынка
Повысьте свой рейтинг в обычном поиске и цифровое присутствие в России. Русское SEO — это сложная деятельность, которая включает в себя различные технические аспекты (структура сайта, геолокация и т. Д.), Многоязычный поиск ключевых слов, оптимизация контента веб-сайта, приманка для ссылок…
++ info
2 Социальные сети в России
Социальные сети следует использовать для связи с вашими потенциальными клиентами в России, что будет способствовать развитию бизнеса.Openvalley поможет вам определить правильную стратегию работы с социальными сетями для российского рынка, чтобы увеличить ваше присутствие в российских социальных сетях, таких как Вконтакте.
++ информация
3 Контент-маркетинг для российской аудитории
Как бы банально это ни звучало, контент — один из важнейших факторов любой стратегии поискового маркетинга. Очень важно убедиться, что у вас есть контент, который стоит смотреть на русском языке, чтобы общаться с русскоязычной аудиторией.
++ информация
4 Перевод веб-сайтов
Вопрос локализации и перевода контента на русский язык является ключевым для подключения ваших клиентов за рубежом.Openvalley работает с командой носителей языка, чтобы гарантировать, что веб-перевод и локализация оптимизированы для SEO, что положительно повлияет на рейтинг вашего сайта.
++ информация
5 Дизайн веб-сайтов на русском языке
Openvalley создает полнофункциональные веб-сайты для электронной коммерции или корпоративных сайтов. Вы можете добавлять неограниченное количество страниц, обновлять контент в любом месте и в любое время простым способом. Наши веб-сайты многоязычны, что означает, что вы можете добавить несколько дополнительных языков и оптимизировать для смартфонов.
++ информация
6 Платный поиск
Запуск кампании с оплатой за клик в России — хороший способ быстро привлечь новых клиентов. С оплатой за клик рекламодатели могут эффективно и эффективно ориентироваться на клиентов в зарубежной стране. Мы можем создавать платные поисковые кампании на русском языке в Google или Яндексе.
++ информация
10 шагов к поисковой оптимизации в России!
Одним из самых привлекательных рынков по своим размерам и экономической мощи, несомненно, является Российская Федерация. В России наиболее часто используемая поисковая система — это Яндекс, поэтому поисковая оптимизация должна основываться на ней. и так далее на русском языке и культуре. Здесь можно реализовать действия по поисковой оптимизации на русском языке, местном языке, который охватывает ряд других русскоязычных стран, в основном принадлежащих к бывшим странам СССР и различным русским общинам, расположенным по всему миру. Основной поисковой системой в России является Яндекс , и в настоящее время занимает более 56,8% доли рынка поисковых систем: 68% для десктопов, 51% для Android и 40% для iOS (источник Яндекс. Радар, январь 2019 г.). По данным Statcounter, в июле 2019 года Яндекс занимал 48,79% рынка в России, а Google — 47,88%. Российская Федерация — это огромные возможности для любого бизнеса: это самая большая страна в мире и крупнейший рынок электронной коммерции в Европе . Поисковая оптимизация в России — отличная возможность для многих видов бизнеса благодаря аудитории в 160 миллионов человек на местном уровне и 285 русскоязычных, проживающих по всему миру.
Яндекс — известная российская ИКТ-компания, основанная Аркадием Воложом, Аркадием Борковским Илья Валентиновичем Сегаловичем.Поисковая машина была запущена в 1997 году. Название компании означает «Еще один iNDEXer».
Google.ru завоевывает все большую долю рынка за последние несколько лет и скоро достигнет 50%. Несмотря на то, что Google добился большей доли, Яндекс остается основным входом на российский онлайн-рынок . Яндекс был построен в России русскими задолго до изобретения Google. Поисковая система Яндекс в основном работает на русском языке, который довольно сложно понять, учитывая, что он состоит из падежей слов, которые могут изменить значение каждого слова .Российский гигант «Яндекс» по-прежнему остается главной поисковой системой в России благодаря пониманию русского языка и предоставлению множества полезных сервисов, которыми россияне пользуются каждый день. Хотя Яндекс и Google.ru разделяют некоторые общие принципы поисковой оптимизации, требуется конкретных знаний алгоритмов и обновлений Яндекса, для оптимизации страниц для результатов поисковой системы Яндекса.
Яндекс также используется в других странах, кроме России: (48.79%), Беларусь 22,38%, Казахстан 21,88%, Таджикистан 15,12%, Узбекистан 11,87%, Турция 10,67%, Кыргызстан 9,61%, Туркменистан 6,73%, Украина 5,98%, Армения 4,20%, Молдова 3,40%, Грузия 2,85%, Азербайджан: 2,06%.
Российская поисковая система является не только лидером в поиске или рекламе с программой Яндекс Директ или с РСЯ яндекс рекламной сетью — собственной контекстной рекламной сетью, но и основным локальным игроком во многих областях, с несколькими приложениями и сервисами. Собственные: приложение Яндекс Такси, онлайн-переводчик и многоязычный, Яндекс Маркет, известная торговая площадка для электронной коммерции, Яндекс Деньги, который представляет собой сервис электронного кошелька и перевода денег онлайн, Яндекс Карты, почтовый сервис Яндекс.Почта, Яндекс Диск, агрегатор новостей Яндекса. Яндекс.Новисти и др. После того, как вы поняли, что Яндекс — это не просто поисковик , но и важная ИКТ-компания. Среди прочего, важно иметь в виду Сервисы, выпущенные одной и той же компанией в некоторых областях инноваций: Яндекс.Драйв каршеринг, Алиса (Алиса на русском), виртуальный голосовой помощник с Яндекс.Станцией, умная колонка, сам -вождение автомобилей или роботов для доставки еды на дом или для услуг электронной торговли.
У двух движков разные истории, SEO-деятельность Яндекса связана с языком и русской культурой . В настоящее время (2016-2017 гг.) Яндекс занимает около 60% поискового рынка по сравнению с менее чем 40% у Google. Вот почему SEO-деятельность в России или в русскоязычных странах должна начинаться с привилегированного взгляда на главную поисковую систему Russian to excellence, главные ворота в Российскую Федерацию. Кроме того, необходимо учитывать, что пользователей, которые используют Яндекс, не принадлежат к тому же типу, что и Google.ru .
Сегодня, а не как в прошлом, вы больше не можете игнорировать SEO на Google.ru, хотя к этому следует относиться по-другому из-за различных алгоритмов и фильтров, которые имеют разные механизмы, кроме того, которые используются двумя типами аудитория разная и с разными ожиданиями.
На русском языке не говорят только в России: Рунет во всем мире с его 285 миллионами пользователей
Рунет: Русский язык в России и во всем мире — Автор Maphobbyist — Собственная работа, CC BY-SA 3.0,
На русском языке в Российской Федерации говорят 160 миллионов человек, из них человек. В то время как в мире на русском языке говорят 285 миллионов человек . В России очень низкий уровень владения английским языком и в целом россиян предпочитают покупать, когда сайты на их родном языке . Это означает, что с интернет-сайтом, оптимизированным и локализованным для русскоязычных, сайт вашей компании может посещать гораздо более широкая аудитория, говорящая по-русски, со всего мира, и нет возможности продавать их на других языках, кроме русского .
Согласно отчету Hootsuite и We are Social, по состоянию на январь 2020 года количество пользователей сети в Российской Федерации составляет 118,0 млн. , а проникновение Интернета составляет 81% за тот же период времени.
Термин РУНЕТ — это сеть, в которой люди говорят на русском языке , внутри и за пределами Российской Федерации: так , включая всех русскоязычных, которых объединяет русская культура во всем мире . Миллионы пользователей, говорящих по-русски, живут во многих странах бывшего Советского Союза , Восточной Европе или в крупных населенных пунктах, расположенных в Израиле или США.Благодаря онлайн-маркетингу в любом случае мы теперь можем обращаться к пользователям, говорящим по-русски в любой части мира, благодаря большой мобильности для бизнеса или отдыха и широкому использованию мобильных устройств. Согласно отчету T-Index 2017 by Translated the Русский язык входит в число языков с лучшими онлайн-продажами на международном уровне .
Веб-сайт обязательно должен быть переведен (и локализован) на русский язык. , поскольку русские имеют низкий уровень знания английского языка, один из самых низких в Европе, согласно данным проекта SurveyLang Европейской комиссии за 2019 год.
Поисковые системы в России и их доля на рынке:
Основное различие между Яндексом и Google заключается в том, что основная поисковая система в России — это Яндекс с долей рынка 57,6% и Google с долей рынка 36%. Хотя годы назад можно было игнорировать Google, из-за большой рыночной доли основного игрока в России в последнее время это невозможно, потому что Google продолжает подгонять Яндекс, набирая все больший вес в поиске.
Google.ru завоевала значительную долю рынка, достигнув 50%. Несколько лет назад Google достиг 70% рынка пользователей Android. Российская антомонопольная служба заявила, что американский движок слишком ограничивает россиян, поэтому теперь Android должен позволить пользователям выбрать движок по умолчанию .
Основы для запуска SEO-проекта в Яндексе и для русского Интернета:
- Используйте домен .ru и, возможно, купите услуги хостинга непосредственно в Российской Федерации
- Создавайте локализованный контент, а не только перевод, создавайте контент для местной культуры и местного языка. Кроме того, изображения, значки, дизайн сайта должны быть выполнены местным дизайнером или кем-то, кто действительно знает культуру и язык ссылок.Картинки передают гораздо больше, чем слова
- Используйте кодировку utf-8 для правильного отображения текста в браузерах пользователей
- Структура сайта и каждая его часть должны быть построены так, чтобы пользователям было удобнее просматривать страницы или покупать русских или русских персонажей (рынок Российской Федерации состоит из множества регионов с разными культурами и традициями, учитывая бывшие советские страны. Русскоязычные или люди, говорящие на русском языке в мире)
- Создайте контактные формы и адреса, которые фактически могут быть использованы клиентом, чтобы легко связаться с компанией.Это включает в себя: номер телефона (разумный префикс и формат телефона), почтовый адрес и другие данные. коммерческих показателей фундаментальных, чтобы Яндекс понимал ваш тип бизнеса и ваше местонахождение. Эта информация особенно полезна для бизнеса с коммерческими намерениями.
Среди основных факторов ранжирования страниц в Яндексе можно выделить те, которые оказываются более актуальными в Яндексе, чем в Google:
- регионализация запроса сайта
- возраст домена
- пользовательский опыт на веб-страницах
- оптимизация на странице
Факторы ранжирования Яндекс:
Для того, чтобы ваш сайт занял первые места в результатах Яндекса, важно знать основные факторы ведущего российского движка и доминирующие по сравнению с таковыми у конкурента Google. Факторы ранжирования Яндекса больше, чем 800 , но по сути они сводятся к нескольким ключевым элементам : (Проценты, приведенные ниже на диаграмме, являются чисто ориентировочными)
- Пользовательский опыт и взаимодействие с пользователем
- Уникальный контент
- Геотаргетинг
- Коммерческие факторы
- Возраст домена
- Качественные обратные ссылки
- Мета-теги
- Мобильность
Яндекс уделяет гораздо больше внимания запросам пользователей по геолокации, чем Google. Яндекс запросы делятся на геонезависимые и геонезависимые . Например, для геозависимых поисковых запросов только веб-сайты, соответствующие этому критерию, будут отображаться в поисковой выдаче для локального поиска. Пользователи, выполняющие поиск на Яндексе с геозависимым поиском, будут видеть разные результаты выполнения. Вы можете указать Яндексу географическую зону принадлежности нашей онлайн-активности: , необходимо определить это в панели Яндекс Вебмастера . Кроме того, что касается местных действий, о них следует сообщать в соответствующем Каталоге, который очень похож на Google Мой бизнес.
Региональные факторы Яндекса для SEO
В этом процессе очень важно, чтобы отображал на сайте полный адрес вашей компании : название компании, улицу и номер дома, почтовый индекс, город, страну, номер телефона с национальным префиксом, номер плательщика НДС. Если у вашей компании несколько офисов, вы можете смело публиковать все полные реферальные адреса.
Поведение пользователя:
, в то время как поисковые системы по всему миру обсуждают более или менее определенную роль поведения пользователей как прямого или косвенного сигнала ранжирования в Google, что касается Яндекса, то определенные свидетельства манипуляций с поисковой выдачей выявили явную причинно-следственную связь между поведением пользователя и значительным рейтингом увеличивается в главном российском двигателе. Вовлеченность для Яндекса — гораздо более важный фактор, чем обратные ссылки на сайт . Сайт с высоким уровнем вовлеченности структурирован так, чтобы побудить пользователей оставаться на нем надолго.
В общем, всегда рекомендуется, чтобы создавал ценный контент для пользователя, который решает проблемы и информирует пользователя уникальным способом, чтобы предложить отличное взаимодействие с пользователем . Главная поисковая система России предлагает еще один бесплатный инструмент с большим потенциалом: Яндекс Метрика .Сервис, помимо предоставления отличной службы веб-аналитики, предлагает несколько полезных инструментов для анализа взаимодействия с пользователем, что позволяет отслеживать отдельные сеансы пользователя на отдельных страницах , анализируя их движения с помощью воспроизведения, тепловой карты, анализа форм и т. Д.
Яндекс строго наказывает все действия по подделке, которые пытаются имитировать поддельное взаимодействие на сайте с помощью программного обеспечения и плагинов, которые имитируют поведение пользователя на сайте, вредоносных программ или вирусов, которые угрожают посетителю, перенаправления на сторонние сайты, которые ведут пользователя скачивать что-то нежелательным образом. Яндекс активно борется с агрессивной рекламой или всплывающими окнами, используя специальный алгоритм 2012-2014 годов, который боролся с раздражающими окнами, которые мешают работе пользователя, доступности контента и удобству использования.
Помимо прочего, хорошо постоянно отслеживать: источники трафика, поисковые запросы, такие как стратегические страницы на сайте и действия, предпринимаемые пользователями.
Контент для Яндекса:Яндекс всегда вел большую борьбу со спамом, намного сильнее, чем Google.В частности, основные алгоритмы и фильтры противодействуют дублированию контента, чрезмерно оптимизированному контенту или спам-контенту . В поисковой оптимизации для Яндекса полезно знать, что есть несколько исторических алгоритмов против спама. Самый известный — фильтр AGs, который можно как-то сравнить с Google Panda . Был запущен алгоритм для противодействия некачественному контенту и дублированному контенту. В прошлом алгоритм наказывал сайты с плохим содержанием, исключая их из индекса поисковой системы.С 2014 года он начал обнулять TIC (тематический индекс цитирования (разновидность рейтинга страниц Google, который стал IKS). В целом, контент Яндекса, необходимый для каждой страницы, содержит меньшее количество слов, чем контент Google. Важно структурировать сайты с внутренние ссылки, которые ведут пользователя на полезный путь, информативный и с хорошим UX . Хорошей практикой является связывание авторитетных и полезных внешних сайтов с пользователем, например , что упрощает чтение (шрифт 12px или более считается для мобильных устройств) и включая визуальную информацию, такую как изображения, инфографику, видео и т. д.
Возраст домена:Среди наиболее важных аспектов ранжирования сайта на Яндексе — возраст сайта. Возраст и репутация сайта являются гарантией надежности сайта на протяжении многих лет. . В связи с этим новых сайтов обрабатываются своего рода песочницей , что ограничивает потенциал на ранней стадии домена. Использование сайта с хорошей репутацией и возрастом несколько лет может быть хорошим вариантом для размещения без начальных ограничений.
Коммерческие факторы:в российском SEO-ландшафте коммерческие факторы, влияющие на размещение сайта на Яндексе, учитывались на протяжении многих лет. Эти факторы, как гласит термин, связаны с предпринимательской деятельностью и известны с 2011 года. Сначала они использовались в Московской области, а затем распространились на всю территорию Российской Федерации. Первые 5 факторов, которые учитывает российский гигант:
- авторитет компании
- интерфейс
- наличие товара
- цена
- системы оплаты и доставки
Последовательно в 2013 году был опубликован документ под названием «Ранжирование запросов с коммерческой целью с учетом качества» , в котором инженеры Яндекса описали механизм коммерческих факторов при ранжировании сайтов .
На странице 4 показателя качества: (где надежность и качество обслуживания стоят вдвое дороже)
Надежность, удобство использования, качество дизайна и качество обслуживания
Ясно одно: работать на российском рынке с Яндексом означает предлагать бизнес с большим опытом. Для этого вам также необходимо обратить внимание на следующие элементы: подробная контактная информация, страницы компании в основных социальных сетях, подробная информация о продукте, служба доставки и доставки, четко видимая и эффективная поддержка клиентов, цены и четкая политика возврата. Товаров .
Мета-данные:очень важна еще и оптимизация мета-тегов для Яндекс. Известно, что они сильно влияют на поведение пользователей. Для этого важно оптимизировать теги title, description и keywords с содержанием , которое отражает содержимое страницы и побуждает пользователя щелкнуть результат в поисковой выдаче. Что касается длины тега заголовка для Яндекса, он, как правило, состоит из большего количества символов, чем у Google.Хорошей практикой является ограничение количеством символов до 60 таким образом, чтобы он подходил для обеих поисковых систем. Не менее важен тег «description», который в двух словах может помочь пользователю понять содержание страницы и подтолкнуть его к ее посещению. Этот тег должен быть составлен эффективно для вашей цели и не должен превышать 160 символов . Кроме того, российская поисковая система учитывает тег «ключевые слова», который должен состоять из нескольких ключевых фраз, соответствующих основной теме страницы.
Эффективность метаданных необходимо отслеживать с помощью показателя bouce rate , как и уровень вовлеченности на странице сайта и целевых страницах с соответствующими инструментами веб-анализа.
Как URL, написанные кириллицей, так и латинскими буквами, Яндекс прекрасно понимает. URL-адреса можно транслитерировать латинскими буквами. При наличии более похожего контента важно сообщить о главной веб-странице с помощью тега «rel = canonical» . Яндекс может проигнорировать эту команду, если веб-страница недоступна, если страница перенаправляется на другой домен или на каждой странице есть несколько тегов.
Обратные ссылкиВходящие ссылки Яндекс учитывает иначе, чем Google. Фактически российская поисковая система, благодаря специальным алгоритмам и анализу поведения пользователей, способна понять важность одиночных обратных ссылок по множеству сигналов. Даже при наличии входящей ссылки с очень авторитетного сайта ссылка будет иметь ценность только в том случае, если она приносит трафик и если она естественно заработана . Яндекс всегда боролся манипуляция SERPs, намного сложнее, чем американский конкурент.Сайт может быть оштрафован в рейтинге на один или несколько месяцев из-за алгоритма Минусинска.
Сайты, оптимизированные для мобильных устройствУже с 2015 года Яндекс отображал в результатах поиска сайты, подходящие для просмотра на мобильных устройствах. В тот год только 18% сайтов в поисковой выдаче были оптимизированы для мобильных устройств. С запуском Владивостокского алгоритма в 2016 году всем доменам, которые можно правильно просматривать со смартфонов и мобильных устройств, было присвоено . Совместимость страниц сайта с мобильными устройствами вы можете проверить через соответствующий тест в панели Яндекс.Вебмастера.
Также в 2016 году та же российская компания запускает Турбо-страниц , страницы с быстрой загрузкой, аналогичные страницам Google (AMP). Сайты, использующие эту новую технологию, отображаются в поисковой выдаче с символом ракеты. Турбо-страницы Яндекса позволяют сразу просматривать содержимое веб-страницы, не дожидаясь нескольких секунд. Эта новая система позволяет просматривать страницы со скоростью в 15 раз выше при подключении к сети 3G.К сильным сторонам этого типа страниц относится , снижение буфера на 30%. страницы расположены на серверах Яндекса, и если сайт находится в автономном режиме, страницы все равно будут доступны для поиска.
Основные возможности Яндекс:
- Основной алгоритм Яндекса называется MatrixNet , а TIC (Thematic Citation Index) оценивает авторитет и надежность домена в зависимости от количества и качества входящих ссылок. В августе 2018 года новый индикатор от TIC стал рейтингом SQI, который больше ориентирован на качество веб-сайта и его пользовательский опыт.
- Основное отличие Яндекса от Google заключается в локализации и регионализации запроса. В зависимости от местоположения запроса, локальных данных, связанных с организацией и веб-сайтом, они могут присутствовать, а в некоторых случаях — нет.
- Яндекс в большинстве случаев является лучшей машиной для понимания русского языка. Яндекс был в основном основан на русском языке, созданном разработчиками и инженерами-носителями языка.
- Яндексом пользуются в основном обычные люди, которые составляют большую часть аудитории русского движка.
- Яндекс очень ориентирован на местный аспект, поэтому большое внимание уделяется субъектам Российской Федерации. Вместо этого Google используется в основном молодой аудиторией и профессионалами, имеющими отношение к миру информатики. Многие из них утверждают, что Google.ru вернет наиболее релевантные результаты в области ИТ. Google в России больше ориентирован на большие города: Москву или Санкт-Петербург.
Яндекс глубоко привязан к русской онлайн-культуре и помимо того, что он является основным портом доступа к Рунету (российскому Интернету), имеет множество сервисов и приложений, которыми ежедневно пользуются миллионы россиян, например: Яндекс Такси, Яндекс Новости , Яндекс Деньги для перевода электронных денег и др.
Технические аспекты Яндекс:
Региональность: Яндекс уделяет гораздо больше внимания, чем Google, геолокации запроса и пользователя. Запросы в Яндексе делятся на геодипендентных и геоиндипендентных . Например, что касается поискового запроса по геодезии, только те интернет-сайты, которые соответствуют этому критерию, будут отображаться в поисковой выдаче с поиском локального символа.Пользователи, которые ищут на Яндексе с геодипендентным исследованием, увидят совершенно другие результаты.
Сканирование и индексирование: следует иметь в виду при оптимизации сайта для поисковых систем на русском языке, в то время как Google может занять несколько минут на этапе сканирования и индексации страниц сайта, , наоборот, Яндекс может занять несколько минут. дней или недель в тех же операциях . В целом, можно заметить, что обновление результатов поиска в Яндексе занимает намного больше времени по сравнению с Google.Незаменимым инструментом для проверки правильности индексации и различных технических аспектов является инструмент Яндекс для веб-мастеров.
Поведение пользователя: В то время как оптимизаторы поисковых систем во всем мире обсуждают роль поведения определенных пользователей как прямого или косвенного сигнала ранжирования в Google, поскольку данные Яндекса о манипуляциях с поисковой выдачей показали явную причину — и-эффект между поведением пользователей и значительным повышением рейтинга в основном движке — русский язык. В общем, всегда рекомендуется реализовывать контент , представляющий большую ценность для пользователя, который решает проблемы и информирует пользователя уникальным способом , чтобы предоставить пользователю отличный опыт.Российский гигант предлагает еще один бесплатный инструмент с большим потенциалом: Яндекс Метрика. Сервис, помимо предоставления отличного сервиса веб-аналитики, предлагает ряд полезных инструментов для анализа взаимодействия с пользователем, позволяя отслеживать отдельные сеансы пользователей на отдельных страницах, а затем анализировать движения при воспроизведении, тепловая карта, модули анализа и т. д.
Основной алгоритм Яндекса: MatrixNet
Первый и самый важный алгоритм поисковой системы Яндекс называется MatrixNet , он основан на машинном обучении и специально построен для того, чтобы избежать явления переобучения.Система машинного обучения может легко найти несуществующие корреляции между веб-страницами, факторами и поисковыми запросами. Матрица в этом смысле позволяет поисковой системе учитывать множество факторов для получения наиболее релевантных результатов. В то же время MatrixNet не позволяет системе находить зависимости между несуществующими результатами.
Основные алгоритмы, фильтры и штрафы Яндекса по типу
Система ранжирования Яндекса может быть вскоре разделена на 4 основные категории , включая алгоритмы искусственного интеллекта, построение ссылок, локальные алгоритмы и алгоритмы качества, фильтры и штрафы.
Яндекс.Алгоритмы AI:
первым и наиболее важным механизмом ранжирования была MatrixNet, которая до сих пор была центральным алгоритмом, основанным на тысячах переменных в секретной формуле, которая может понимать различных типов поисковых запросов в зависимости от их типа намерения, объема или отрасли. , чтобы пользователи могли получать наиболее релевантные результаты. В 2016 году был запущен Palekh , и он работал, благодаря функциям, подобным нейронным сетям, для того, чтобы возвращать лучшие результаты поиска , включая термины, которые не обязательно включены на страницы .Позже был запущен Королев , чтобы ускорить индексацию движка и понимание новых запросов. Королева можно как-то сравнить с Google RankBrain. Королев помогает Яндексу лучше понимать запросы пользователей, чтобы подбирать наиболее релевантную страницу под нужный запрос.
Алгоритмы на основе ссылок:
Борьба со спамом и манипуляциями с рейтингом поиска всегда была важна для Яндекс. Русский движок сначала запустил фильтр под названием Nepot (от кумовства) против обмена ссылками.Непот оштрафовал сайт, получив слишком много обратных ссылок за короткий период времени, что считалось естественным.
Алгоритмы AI | MatrixNet | Палех | Королев |
Ссылка здания | Непот | Рейтинг без обратных ссылок | |
Местные аспекты | Арзамас и Конаково | Обнинск | |
Содержание и качество | 8 SP1 | Магадан | Находка |
Фильтр AGS | Краснодар | Рейкьявик и Калининград | |
«Вы спам» | Поддельные и надоедливые всплывающие окна | Манипуляции с поисковой выдачей |
От популярности к показателю качества: TIC и SQI
Тематический индекс цитирования, также известный как TIC score — это основной алгоритм Яндекса, который в некотором смысле можно сравнить с Google Page Rank. Однако этот алгоритм также имеет много отличий от поисковой системы MountanView. ICT рассчитывает количество и качество входящих ссылок на данный документ. Качество обратной ссылки рассчитывается Яндексом параллельно с качеством ссылки. ICT можно измерить благодаря полосе Яндекс, в отличие от американского движка, у конкурента и значение балла TIC одинаковое значение для каждой страницы в домене , и оно все еще актуально. В борьбе с манипуляциями с поисковой выдачей Яндекс в последние годы выдвинул политику, предусматривающую наказание веб-сайтов, которые покупают ссылки, а не тех, которые их получают.ТИЦ Яндекс оценивает релевантность и сходство контента страницы, на которую идет ссылка, и связанного документа. Связь между входящими ссылками и исходящими из затронутых доменов определяется разными оценками, присвоенными каждому источнику, более или менее признанному авторитетным. В августе 2018 года оценка TIC была заменена на SQI — Оценка индекса качества сайта (Индекс качества сайта ИКС или SQI на английском языке), новый показатель, который составляет на основе общего качества сайта .Вместо того, чтобы указывать количество ссылок, указывающих на ресурс, оценка SQI показывает данные и бизнес, которые этот сайт обычно представляет в Интернете. Данные нового индикатора поступают из поиска и данных Яндекса, а также из его многочисленных приложений и онлайн-сервисов.
Намерение пользователя в центре: не только слова, тексты или технические детали
Без сомнения, чтобы начать деятельность по привлечению трафика и поиску новых клиентов в России, говорящих на русском языке, необходимо компании или агентству, которое вам нужно, эти услуги SEO поддерживаются консультантом с хорошим знанием русского языка, Русская культура.
Для правильного первоначального подхода к российскому рынку в Интернете необходимо провести предварительный аудит и изучить углубленный анализ рынка в Интернете, который состоит из двух основных поисковых систем и несовершеннолетних, таких как Mail. ru и густая сеть тематических сайтов и локальных социальных сетей. На начальном этапе важно определить, на какие вопросы пользователей и маркетологов отвечает наш сайт.
Дело в том, что дизайн локализации для российского рынка — это не только технический вопрос, связанный с поисковой оптимизацией для Яндекса, но и визуальная коммуникация с правильными изображениями, видео и мультимедиа, откалиброванными для общедоступных ссылок, текстов, составленных из рекламы. hoc, и с правильным тоном в зависимости от типа обстоятельств человека.Ваш поисковый запрос для российского рынка онлайн можно проанализировать с помощью основного инструмента по ключевым словам Яндекс Wordstat (для его использования необходимо зарегистрироваться), Google и других инструментов. Поисковые запросы и поисковые фразы на российском рынке требуют глубокого знания русского языка и культуры. Любые низкоуровневые услуги автоматического или письменного перевода приводят к недопониманию с конечным пользователем или не передают истинного значения вашего бизнеса. Отсюда следует, что для выхода на российский рынок должен быть персонал, способный говорить и отвечать на отзывы на русском языке.
Яндекс Линкбилдинг: что нужно знать
Чтобы начать правильное построение ссылок, полезно знать, что основные поисковые системы связаны с местным рынком. Что касается Яндекса, как и Google, российский движок ведет борьбу с развитием ссылочной деятельности неестественно, хотя есть различия по сравнению с его американским конкурентом. Яндекс имеет тенденцию наказывать сайт, который предоставляет купленную ссылку, а не того, кто ее получает.Однако такие алгоритмы, как Minusinsk и AGS, на протяжении многих лет боролись с продажей и покупкой ссылок, а затем с созданием обратных ссылок, которые не выглядят естественно. В конце 2013 года громким было сообщение , заявление руководителя поиска Яндекс Александра Садовского, который объявил, что обратная ссылка будет удалена из поиска Яндекса как сигнал о ранжировании . Только в марте 2014 года обновление вступило в силу для типов коммерческих поисковых запросов, которые включали следующие секторы: недвижимость, туризм, электроника и бытовая техника.
В феврале 2016 года Яндекс запускает фильтр Владивосток, который обращает внимание на сайты, подходящие даже для просмотра с мобильного устройства. В конце 2016 — начале 2017 года Яндекс запускает интеллектуальный алгоритм «Королев», который включает запросы на длинном хвосте и фразы, которые нечасты или трудны для понимания. Алгоритм Королёва питает систему MatrixNet, центральную часть функционирования российской поисковой системы. Королев завершает предыдущий Палех, основанный на машинном обучении и системах, подобных нейронным сетям.
Serp отличия в Яндексе
Яндекс SERP всегда был на шаг впереди американского гиганта и всегда демонстрировал новые функции, которые играют важную роль в пользовательском опыте, видимости сайта и CTR. Рядом с каждым URL-адресом Яндекс показывает свой Favicon , что является отличным способом отличить один сайт от другого. Этот фактор не следует недооценивать, так как он может стать большим фактором увеличения CTR. Также русскоязычная поисковая система показывает живые чаты для сайта, у которого есть эта услуга .Это может позволить пользователям общаться в чате с центром поддержки бизнеса, даже не посещая сайт.
Российский Яндекс запускает веб-браузер, чтобы конкурировать с Google
Корпорация Intel делает большие успехи в области производства полупроводников. Базирующаяся в Санта-Кларе, Калифорния, технологическая и электронная компания объявила, что потратит 20 миллиардов долларов на два новых завода по производству полупроводников в Чандлере, штат Аризона. Ожидается, что на заводах будет занято 3000 человек на высокотехнологичных производствах.
Кроме того, Intel сформирует отдельный бизнес по производству полупроводников, Intel Foundry Services, чтобы удовлетворить растущий мировой спрос на компьютерные микросхемы, с планами по открытию новых заводов по производству полупроводников в других странах США и Европы.
Новый отдельный бизнес поможет Intel бросить вызов конкурирующим производителям микросхем по всему миру, таким как Samsung Semiconductors из Южной Кореи и TSMC из Тайваня, которые в настоящее время производят многие компьютерные микросхемы, используемые в электронных продуктах, от сотовых телефонов и ноутбуков до электромобилей и холодильников.
Генеральный директор Intel Пэт Гелсинджер (Pat Gelsinger) сделал объявление во время веб-трансляции 23 марта, в которой он изложил то, что Гелсинджер назвал «IDM 2.0», — обширный план Intel по значительному увеличению объемов производства интегрированных устройств (IDM).
Новые фабрики в Аризоне, по словам Гелсингера, создадут около 3 000 постоянных рабочих мест «в сфере высоких технологий и высокой заработной платы», а также 15 000 новых местных долгосрочных рабочих мест в штате и 3 000 временных рабочих мест в строительстве. В своем заявлении губернатор Аризоны Дуг Дьюси сказал, что решение Intel построить там «еще раз доказывает, что Аризона находится на переднем крае передового производства и производства микросхем.
По словам Пэта Гелсингера, заводы стоимостью 20 миллиардов долларов будут производить «первое крупномасштабное литейное производство» Intel, и он планирует выбрать больше площадок для литейных производств в США и Европе.
Полупроводниковые заводы, такие как компании TSMC и Globalfoundries в США, обычно производят микросхемы, разработанные внешними заказчиками, такими как Qualcomm Inc. или Apple Inc., у которых нет собственных мощностей по производству микросхем. Intel уже разрабатывает и производит свои собственные микросхемы, но ее новое литейное производство позволит другим компаниям использовать производственные линии Intel и собственные методы создания микросхем.
Intel Foundry Services возглавит старший вице-президент Intel д-р Рандхир Такур, который будет подчиняться непосредственно Gelsinger.
Переход к производству полупроводников является удачным для Intel. General Motors Co., Ford Motor Co. и Honda North America, среди других автопроизводителей, столкнулись с узкими местами в производстве автомобилей, вызванными нехваткой полупроводников. Эта нехватка частично была вызвана повышенным спросом на компьютерную электронику во время той самой пандемии, которая сокрушила производство автомобилей весной 2020 года, от которой автопроизводители в настоящее время пытаются оправиться.
24 февраля, после встречи с двухпартийной группой сенаторов, президент Байден подписал распоряжение, предписывающее членам кабинета провести обзор цепочек поставок основных товаров, обычно производимых на международном уровне, включая полупроводники.
Yandex SEO Guide — Как эта маленькая поисковая система открывает новые возможности для бизнеса?
Последние новости! Помимо Google есть еще одна поисковая система! Многие из вас отреагируют странно, но да, это правда.Это «Яндекс»! Наверное, вы раньше не слышали о Яндексе. Но в этом посте вы получите четкое представление о Яндексе, что такое Яндекс на самом деле и как он может помочь вам расширить возможности для бизнеса. По сути, Яндекс — ведущая поисковая система в России, и в связи с недавними изменениями в законодательстве они также закрыли мост в мобильной сфере. Это больше, чем просто поисковая система, она также предоставляет вам совершенный браузер, электронную почту, услуги платного перевода рекламы, расположение карт на российском рынке, а также в Украине, Турции, Казахстане и Беларуси.
Русский язык в связи с SEO:
Если вы планируете перевести свою компанию на русский язык, то вы должны рассмотреть русскоязычную версию своего веб-сайта, чтобы привлечь больше посетителей и привлечь потенциальных клиентов. В прошлом у вас определенно была построена стратегия SEO с индивидуализированным веб-сайтом с англоязычной схемой контента. Но если вы планируете создавать веб-сайт и контент на русском языке, важно знать некоторые важные факты о русском языке, которые могут повлиять на вашу стратегию SEO.
- Один из важнейших сальванических языков и 5-й по распространенности язык в мире, русский язык используется почти 280 миллионами людей во всем мире.
- Русский язык довольно сложен с различными грамматическими явлениями, чтобы владеть им. Таким образом, наличие русского носителя или хорошего оратора или писателя может улучшить вашу стратегию SEO.
Яндекс Техническое SEO:
Что ж, между Google и Яндексом так много общего, у Google есть свой набор правил, а у Яндекса — свои, которые вы должны учитывать при планировании дизайна и разработки вашего веб-сайта в России.
1. Элемент — структура внутренних ссылок
Важность — в некоторой степени важна
2. Элемент — мета-тег Ключевые слова
Важность — Важность
3. Элемент — тег заголовка
Важность-очень важна
4. Элемент — тег заголовка
Важность — очень важный
5. Элемент — Ключевые слова в URL-адресах
Важность — Очень важно
Рейтинг Яндекса:
По сути, Яндекс предназначен для обработки и развития семантики языковой системы страны.У него есть свои правила, положения и рабочие алгоритмы, называемые Снежинском. Этот алгоритм Яндекса зависит от множества факторов ранжирования, включая уникальный контент и качественные обратные ссылки. Помимо этих двух, есть еще много факторов ранжирования, упомянутых ниже. Если вы реализуете их эффективно, они определенно увеличат охват вашего бизнеса.
- Геотаргетинг
- Мета-данные
- Вовлеченность пользователей
- Содержимое
- Возраст домена
- Коммерческие факторы
- Мобильность
- Время индексации
- Полномочия
Зачем оптимизировать под Яндекс?
Это вопрос, который приходит всем в голову: зачем оптимизировать Яндекс? Итак, ответ очень прост: если вы хотите нацелиться на российский рынок, чтобы привлечь больше потенциальных клиентов, полагаясь на тот факт, что ваш веб-сайт хорошо оптимизирован для Google, подумайте об этом хотя бы один раз. В 2018 году почти 65% интернет-пользователей в России выбрали Яндекс, а не Google для поиска в Интернете. Итак, это хорошая возможность привлечь российских клиентов в свой бизнес за счет оптимизации Яндекса и его стратегий. Несмотря на то, что алгоритмы Яндекса не так популярны, как Google, есть некоторые факторы, из-за которых посторонним сложно вписаться. Когда мы смотрим на светлую сторону Яндекса, у него мало плюсов:
Плюсы:- Его очень легко использовать, потому что он похож на Google
- Менее сложные алгоритмы, которые также легче оптимизировать
- Яндекс популярен даже на Android
- Из-за меньшего трафика конкуренция ниже как в обычном, так и в платном поиске.
- У него небольшая и отзывчивая команда по обслуживанию клиентов.
- Если вы подозреваете, что на ваш сайт был нанесен штраф и возникли некоторые проблемы, вы можете написать туда и, скорее всего, сделаете это раньше, и вы получите незамедлительную обратную связь.
- Его алгоритм может лучше учитывать спам
- Яндекс намного лучше Google в индексации сайтов на русском языке
Что ж, это основная вводная часть о Яндексе. Надеюсь, теперь у вас есть представление об этой поисковой системе, и вы тоже сможете ее использовать.Но основная часть, которую нам нужно обсудить здесь, — это то, как эта небольшая поисковая система открывает новые возможности для бизнеса. Итак, давайте обсудим некоторые важные моменты, касающиеся внутреннего SEO для Яндекса и того, как его алгоритмы могут способствовать развитию вашего бизнеса в России и во всем мире.
Внутреннее SEO для Яндекса:
Яндекс работает в соответствии с различными алгоритмами, которые гарантируют, что пользователи будут встречены с качественным и понятным контентом, полезной информацией, которую они искали, и соответствующей всем их поисковым намерениям.Этот процесс начался несколько лет назад с неизвестного обновления в SEO-оптимизации Яндекса, которое немного ввело новый рейтинг и переменные веса для поисковых запросов, включая одно- и многословные.
> 8-СП1
За этим неизвестным и безымянным обновлением в 2008 г. последовал броский «8-SP1» — алгоритм с первым именем. В истории Яндекса за это время большинство веб-сайтов со старыми версиями занимали более высокие позиции из-за своего возраста, и этот алгоритм в основном работал над изменением этого сценария, чтобы дать новым и более качественным доменам больше шансов занять лидирующие позиции.Помимо этого, этот алгоритм также изменил способ оценки обратных ссылок как фактора ранжирования в том смысле, что он снизил их мощность и эффективность. За 8-SP1 также последовали различные более мелкие изменения в алгоритмах качества, одним из самых популярных из которых является Магадан (2008 г.). Магадан в основном позволил поисковой системе понимать аббревиатуры, а также начать определять разницу между коммерческими и некоммерческими запросами и уникальность контента.
TIC (Тематический указатель цитирования)
Яндекс использует этот рейтинг тематического индекса цитирования, чтобы определить, получает ли веб-сайт целевую популярность, релевантность и авторитетность.Рейтинг тематического индекса цитирования колеблется от 0 до 150 000, и выше, чем этот конкретный диапазон, показатель означает, что качество веб-сайта выше. Подобно метрике авторитетности домена Moz, показатель цитирования в тематическом индексе не отражает, насколько хорошо ваш веб-сайт занимает первое место в поисковой системе, и никогда не учитывается как фактор ранжирования. Если у вас низкий показатель TIC прямо сейчас и вы хотите постоянно улучшать его для SEO-оптимизации Яндекса, вам необходимо убедиться, что у вас есть:
- Хорошо оптимизированный и высококачественный контент, который удовлетворяет потребности пользователей, как и Google.
- Убедитесь, что публикуемый вами контент соответствует тому, что вы предлагаете клиентам в качестве услуг, и тому, что они пытаются найти в вашем контенте.
- Внутренние ссылки, которые повышают ценность для пользователя и считают ее весьма полезной для этого поискового намерения.
Местное SEO
Если вы настроили таргетинг на Россию, локальная поисковая оптимизация Яндекса также может сработать. По размеру локальная SEO-оптимизация Яндекса может немного отличаться от Google. С помощью веб-мастера Яндекса вы можете легко указать регион и точное местоположение, на которое вы ориентируетесь, и с точки зрения пользователя поиск по геотаргетингу является полезной частью получения оптимальных результатов.
Оптимизация с геотаргетингом:
Яндекс уделяет наибольшее внимание географическому анализу, внедряя несколько месяцев назад новый алгоритм, названный «Арзамас в наши дни» или индикаторы. Он предоставляет разные результаты для разных пользователей в зависимости от их регионального географического положения. Эти индикаторы тщательно анализируют доменное имя вашего веб-сайта, точное местоположение по IP-данным, местоположения, назначенные при регистрации в каталоге Яндекса, и обогащают функции, связанные с контентом, написанные на веб-сайте, включая адрес, почтовые индексы, коды регионов и т. Д.
Итак, это алгоритмы SEO-оптимизации Яндекса, которые не только помогут вам оптимизировать стратегию SEO, но и помогут привлечь больше потенциальных клиентов, укрепить клиентскую базу и повысить узнаваемость бренда / бизнеса.
Заключение:
Если вы планируете начать бизнес или уже начали, планируя ориентироваться на Россию, то Яндекс — лучший способ начать. Как видите, есть некоторые важные соображения, о которых следует помнить, но общий принцип таков: результаты хороши для нацеливания на Россию.Компании, стремящиеся расширить свое присутствие на международном уровне, должны использовать правильные стратегии таргетинга и правильные инструменты. Внедряя Яндекс и следуя руководству по поисковой оптимизации Яндекса, вы можете добиться наилучших результатов и неожиданной рентабельности инвестиций. Так чего же ты ждешь? Начните работу с Яндексом прямо сейчас и побейте цель, которую вы планируете достичь в 2019 году.