Спецификация RSS 2.0 | RSS

RSS (Really Simple Syndication) — это формат обмена информацией для Web.

RSS — это диалект XML, поэтому любые RSS документы должны соответствовать стандарту XML 1.0, опубликованному на официальном сайте W3C.

На верхнем уровне RSS-документа находится элемент <rss>, который содержит обязательный атрибут version, который, в свою очередь, указывает на версию документа. Если документ соответствует данной спецификации, то атрибут version должен быть равен 2.0.

На уровень ниже от элемента <rss> находится единожды встречающийся элемент <channel>, который содержит информацию о канале (метаданные) и о его содержании.

Обязательные элементы <channel>

Элемент Описание Пример
title Название канала. Если у вас есть web-сайт, который содержит некоторую информации о канале, то имя канала, упомянутое на сайте, должно соответствовать имени, описанному в этом элементе. Новости bikman.ru
link URL web-сайта, соответствующего данному каналу. http://bikman.ru/
description Фраза или предложение, описывающее канал. Последние новости сайта bikman.ru.

Необязательные элементы <channel>

Элемент Описание Пример
language Язык канала. Список допустимых значений, которые приводит Netscape, находятся тут. Также можно пользоваться определенными W3C обозначениями. en-us
copyright Информация об авторских правах. Copyright 2004, Dmitry Bikman.
managingEditor E-mail адрес ответственного за содержание канала. [email protected] (Василий Пупкин)
webMaster
E-mail адрес ответственного за техническую составляющую работы канала.
[email protected] (Василий Пупкин)
pubDate Дата публикации контента канала, соответствующая RFC 822. Sat, 07 Sep 2002 00:00:01 GMT
lastBuildDate Дата и время последнего изменения контента канала, соответствующая RFC 822. Sat, 07 Sep 2002 00:00:01 GMT
category Одна или несколько категории, к которым принадлежит канал. <category>Newspapers</category>
generator Строка, описывающая программу, которая использовалась для создания канала. MightyInHouse Content System v2.3
docs URL спецификации RSS 2.0. http://blogs.law.harvard.edu/tech/rss
cloud Позволяет процессорам зарегистрироваться, используя cloud, и быть проинформированными об изменениях канала, используя легкий протокол публикации-подписки на RSS-фиды. <cloud domain=»rpc.sys.com» port=»80″ path=»/RPC2″ registerProcedure=»pingMe» protocol=»soap» />
ttl Устанавливает время жизни (time to live). Это число в минутах, которое показывает, насколько долго канал может быть кэширован без обновления из источника. <ttl>60</ttl>
image Определяет GIF, JPEG или PNG изображение, которое может быть ассоциировано с каналом.
rating PICS рейтинг канала.
textInput Определяет поле текстового ввода, которое может быть ассоциировано с каналом.
skipHours Подсказка процессорам, сообщающая, сколько часов они могут пропустить.
skipDays
Подсказка процессорам, сообщающая, сколько дней они могут пропустить.

<image>, вложенный элемент <channel>

<image> — это необязательный вложенный элемент <channel>, который содержит в себе три обязательных и три необязательных элемента.

<url> — это URL, указывающий на GIF, JPEG или PNG изображение, которое ассоциируется с каналом.

<title> описывает изображение. Используется в качестве атрибута alt тэга <img> при формировании HTML.

<link> — это URL, указывающий на web-сайт. При формировании HTML канала, изображение является ссылкой (необходимо принять во внимание, что <title> и <link> на практике должны быть равны элементам <title> и <link> в описании канала).

Опциональные элементы <width> и <height> определяют ширину и высоту изображения в пикселях. Необязательный элемент <description> содержит текст, который при формировании HTML должен содержаться в атрибуте title HTML тэга <a>, сформированного вокруг изображения.

Максимальное значение ширины изображения — 144. Значение по умолчанию — 88. Максимальное значение высоты изображения — 400. Значение по умолчанию — 31.

<cloud>, вложенный элемент <channel>

<cloud> — это необязательный вложенный элемент <channel>, который определяет web-службу, поддерживающую интерфейс rssCloud. Данный интерфейс может быть реализован с помощью протоколов HTTP-POST, XML-RPC или SOAP 1.1.

Его роль заключается в том, чтобы дать возможность процессорам RSS быть оповещенными об изменениях, произошедших с каналом, используя легкий протокол публикации-подписки на RSS-фиды.

<cloud domain="rpc.sys.com" port="80" path="/RPC2" registerProcedure="myCloud.rssPleaseNotify" protocol="xml-rpc" />

В этом примере для запроса информации об изменениях канала нужно отправить XML-RPC сообщение на rpc.sys.com (порт 80), указав путь равным «/RPC2». Процедура, которую необходимо вызвать, называется myCloud.rssPleaseNotify.

Полное описание интерфейса rssCloud находиться здесь.

<ttl>, вложенный элемент <channel>

<ttl> — это необязательный вложенный элемент <channel>, указывающий время жизни (time to live). Это число в минутах, которое указывает, как долго канал можно кэшировать без обновления из первоисточника.

<textInput>, вложенный элемент <channel>

<textInput> — это необязательный вложенный элемент <channel>, который должен содержать 4 обязательных вложенных элемента.

<title> — Надпись на кнопке Submit текстового поля ввода.

<description> — Описание поля ввода текста.

<name> — Имя текстового поля ввода.

<link> — URL на CGI скрипт, который должен обрабатывать текст, введенный в поле ввода.

Элементы <item>

<channel> может содержать любое количество элементов <item>. Эти элементы могут содержать в себе публикации целиком, или же анонсы со ссылками на полные варианты публикаций. Все вложенные элементы являются необязательными, однако хотя бы один элемент <title> или <description> должен присутствовать.

Элемент Описание Пример
title Заголовок. Рождение RSS — это чудо!
description Синопсис публикации (краткий обзор) или полный вариант публикации. Текст, который должен описывать краткое содержание публикации или же текст публикации целиком. Это личное дело авторов канала.
author E-mail адрес автора публикации. [email protected] (Василий Пупкин)
category Категория или категории публикации. Новости спорта
comments URL страницы отзывов и комментариев данной публикации. http://bikman.ru/comments/12345
enclosure Описание медиа объекта, который прикреплен к публикации.
guid Строка, однозначно определяющая публикацию. http://bikman.ru/2004/01/01/a.html
pubDate Дата и время публикации, соответствующие RFC 822. Sun, 19 May 2002 15:21:36 GMT
source RSS канал которому принадлежит публикация. Цитаты дня

<source>, вложенный элемент <item>

<source> — это необязательный вложенный элемент <item>.

Его значение — это имя RSS канала, которому принадлежит публикация. Он имеет один обязательный атрибут url, в котором указывается URL XML версии источника.

<source url=»http://bikman.ru/links2.xml»>Источник публикации</source>

Роль данного элемента заключена в распространении информации об источнике публикации.

<enclosure>, вложенный элемент <item>

<enclosure> — это необязательный вложенный элемент <item>.

Данный элемент имеет три обязательных атрибута. Url указывает URL вложения, length указывает длину в байтах, type указывает стандартный MIME тип вложения.

Атрибут url должен быть HTTP URL.

<enclosure url="http://bikman.ru/music.mp3" length="12216320" type="audio/mpeg" />

<category>, вложенный элемент <item>

<category> — это необязательный вложенный элемент <item>.

Этот элемент имеет единственный необязательный атрибут domain, который указывает на систематику классификации категории.

Значение элемента — это разделенная прямым слешем («/») строка, которая описывает иерархическое положение в данной таксономии. Процессоры могут использовать эту информацию для устанавливания связей при интерпретировании категорий.

<category>Почетная Смерть</category>

<category domain="http://bikman.ru/category">НЖМД</category>

В элемент &lt;item&gt; можно включать любое количество элементов &lt;category&gt;, в том числе для разных доменов, а так же иметь различные пересечения в пределах одного домена.

<b>&lt;pubDate&gt;, вложенный элемент &lt;item&gt;</b>

&lt;pubDate&gt; — это необязательный вложенный элемент &lt;item&gt;.

Значение этого элемента — это дата публикации, соответствующая стандарту RFC 822. Если дата указывает на будущее время, то процессоры могут не отображать элемент до тех пор, пока дата не станет текущей или прошедшей.

<pubDate>Sun, 19 May 2002 15:21:36 GMT</pubDate>

<guid> — это необязательный вложенный элемент <item>.

Значение элемента <guid> — это строка, однозначно определяющая публикацию. Например, данное значение может использоваться процессорами для определения новизны публикации.

<guid>http://bikman.ru/weblogItem3207</guid>

Не существует каких-либо определенных правил формирования значения <guid>. Обеспечение уникальности этой строки — задача канала.

Если элемент <guid> имеет атрибут isPermaLink, который равен true, процессор интерпретирует элемент <guid> как URL на публикацию, которая может быть открыта в web-браузере.

<guid isPermaLink="true">http://bikman.ru/2002/09/01.php#a2</guid>

<comments>, вложенный элемент <item>

<comments> — это необязательный вложенный элемент <item>.

Данный параметр указывает URL страницы комментариев, ассоциированной с данной публикацией.

<comments>http://bikman.ru/comments?blogId=705245&itemId=271</comments>

<author> — это необязательный вложенный элемент <item>.

Данный элемент указывает e-mail адрес автора публикации. Для газет и журналов, использующих RSS, автором является тот, кто написал публикацию, описанную в элементе . Для общих блогов, авторы могут быть различными. Для личных блогов, имеет смысл пропускать данный элемент.

<author>[email protected] (Вася Пупкин)</author>

RSS накладывает ограничение на использование первых непробельных символов в элементах <link> и <url>. Данные, содержащиеся в этих элементах, должны соответствовать стандарту URI IANA (http://, https://, news://, mailto: и ftp://). Предшествующие RSS 2.0 спецификации допускали использование только http:// и ftp:// схем, однако на практике другие URI схемы использовались авторами контента и каналов, а так же поддерживались процессорами. Стоит учитывать, что обработчики могут иметь ограничения на возможные URI схемы. Авторам не следует полагаться на полную поддержку URI схем со стороны процессоров RSS.

В спецификации RSS 0.91 длина данных элементов была ограниченна 500 или 100 символами. В элементе <channel> не могло содержаться более 15 элементов <item>. Начиная с версии 0.92, все ограничения на длину и вложенность XML элементов были сняты. Обработчики и генераторы RSS могут устанавливать собственные ограничения на количество элементов <item> и ограничения строк по длине.

В RSS 2.0 ставка сделана на связывание канала с его идентификатором в некотором катологе, широко используя систему категорий и иерархий. Например, для того, чтобы связать канал с идентификатором Syndic8, достаточно включить элемент <category> в качестве вложенного элемента <channel>, с атрибутом domain равным «Syndic8», и указать значение идентификатор/а для канала Syndic8 в базе данных.

<category domain="Syndic8">1765</category>

Часто задаваемый вопрос, как связаны значения элементов <guid> и <link>. Не одно и тоже ли это? Действительно, в некоторых системах управления контентом это так. В некоторых других системах <link> — это ссылка на первоисточник. Т.к. в некоторых системах несет в себе краткое описание больших публикаций, <link> указывает на саму публикацию, а <guid> — это ссылка на краткое описание в блоге. В любом случае, рекомендуется использовать <guid>, являющийся уникальной ссылкой на первоисточник, если это возможно. Это позволяет процессорам отслеживать уникальность новых публикаций и не повторяться.

Если у вас имеются вопросы по формату RSS 2.0, задавайте их в списке рассылки RSS2-Support.

RSS основан в 1999 году, и он должен был быть прозрачным для понимания форматом, со скоромными показаниями к применению. После того, как RSS превратился в популярный формат, разработчики стремятся расширить его, используя различные модули, определенные в различных пространствах имен (согласно спецификации W3C).

RSS позволяет расширять себя новыми возможностями. Для этого достаточно соблюдать простое правило. RSS канал может содержать элементы, отличные от описанных в данной спецификации, только в том случае, если эти элементы определены в пространстве имен.

Элементы, определенные в данной спецификации, сами не являются членами какого-либо пространства имен. Так что RSS 2.0 может оставаться совместимым с предыдущими версиями в таком смысле — версии 0.91 и 0.92 так же являются корректными с точки зрения RSS 2.0 спецификации. Если бы элементы RSS 2.0 были бы членами какого-либо пространства имен, то обратная совместимость была бы нарушена.

Несомненно, RSS — это отличный формат, он крайне популярен и широко распространен. Наличие устоявшейся концепции — это то, в чем RSS нуждался длительное время. Смысл данной работы — помочь формату стать неизменным, чтобы стимулировать рост среды, формирующейся вокруг RSS, а так же расчистить путь для появления инноваций в форматах обмена информацией. Поэтому спецификация заморожена на версии 2.0.1. Возможные версии 2.0.2, 2.0.3 и т.п. ожидаются только для пояснения, но никак не для добавления новых возможностей. Последующая работа должна происходить на уровне дополнительных модулей, которые используют пространства имен, и на уровне совершенно новых форматов обмена информации.

Спецификация RSS 2.0 предложена Berkman Center for Internet & Society at Harvard Law School под лицензией Attribution/Share Alike Creative Commons license. Автором данного документа является Dave Winer, основатель UserLand Software и просто парень из Berkman Center.

www.internet-technologies.ru

RSS — это должен знать каждый

Доброго времени суток, уважаемые читатели. Данная статья, может, и не является актуальной, но я посчитала, что для некоторых читателей это может быть полезно. Речь пойдет о том, что такое RSS и как им пользоваться.

Что такое RSS.

Мне не хотелось бы вдаваться в технические подробности, постараюсь быть краткой. RSS – это такой специальный формат из семейства XML-форматов, с помощью которого мы можем получать новости, практически, любого сайта, не заходя на сам сайт. Например, вам нравится какой-то сайт (блог), он достаточно часто обновляется, ежедневно на нем публикуются какие-то новости, которые вам интересны.
Чтобы узнать, появилось ли что-то новое на вашем любимом ресурсе, вам приходится переходить на него и смотреть обновления. Согласитесь, что это не совсем удобно.

Вот RSS и служит тому, чтобы извещать нас об этих новостях. Нет необходимости постоянно заходить на любимый сайт, обновлять страницы, когда можно просто получить оповещение о том, что содержимое этого сайта обновилось. Удобно, не правда ли.

В сети вы можете встретить разные термины, например, RSS-канал, RSS-лента, RSS-фид или просто фид, по сути, это все одно и тоже. Так называются сайты, у которых есть формат RSS.

Но в блогах Blogspot Blogger мы сталкиваемся с таким названием, как Atom. Он так же относится к семейству форматов XML, но также включает в себя протокол, основанный на HTTP. Как вы можете заметить, именно эта аббревиатура http всегда присутствует в адресах сайтов, т.к. все они передаются по этому протоколу. Формат Atom был придуман позже формата RSS, и служит тем же целям.

Формат RSS имеет свою иконку, уверена, вы часто встречаете ее, особенно в блогах. Эта иконка имеет яркий оранжевый цвет, скорее всего для того, чтобы бросаться в глаза, чтобы пользователи сразу видели, что у этого сайта есть RSS-канал на который можно подписаться. Конечно, в сети можно встретить различные интерпретации этой иконки, в разных цветах, и разной формой, но для всех иконок отличительной особенностью является именно этот знак.


Ленту новостей мы можем видеть в двух разных вариантах. Первый, обычный формат XML. Выглядит так.


Но чаще, вы можете видеть ленту в таком виде.


Это значит, что лента пропущена через сервис FeedBurner. О его преимуществах и использовании можно прочитать в серии статей Как настроить RSS в блоге. Лента, пропущенная через сервис FeedBurner имеет больший выбор различных ридеров и сервисов для чтения лент.

Так же, становится доступной подписка по электронной почте. Все эти настойки делаются хозяином сайта, для большей совместимости RSS-ленты с различными приложениями, для получения статистики по подписчикам и многого другого.

Как пользоваться RSS

Для нашего с вами удобства существует огромный выбор для получения новостей любимых сайтов. Всё, что помогает нам получать обновления, называется RSS-агрегатором. Практически все браузеры обладают встроенными RSS-агрегаторами. Так же, агрегатор называют ридером, RSS-ридером, онлайн клиентом. Рассмотрим некоторые из них.

Получать новости сайтов можно непосредственно в браузере. Все современные браузеры распознают сайты, у которых есть RSS канал. Как правило, когда вы заходите на любой сайт, если у этого сайта есть RSS-канал, то в адресной строке браузера или в меню отображается оранжевая иконка RSS. Если у сайта нет обновляемого канала новостей, то такая иконка либо вообще отсутствует, либо имеет серый цвет.

Посмотрите внимательно, возможно вы даже никогда не обращали на это внимание или просто не задумывались. Давайте посмотрим, как с помощью этой кнопки осуществляется подписка. Эксперименты я решила проводить с сайтом Хабрахабр, т.к. он очень часто обновляется и можно быстро увидеть результаты подписки. Итак, вы находитесь на своем любимом сайте.

В Internet Explorer иконка подписки расположена в меню


Попадаем на страницу канала, в верхнем левом углу будет ссылка подписки.


Просмотреть обновления можно, открыв Избранное в боковой панели браузера, вкладка Каналы. Сайты, на которых есть обновления будут отмечены как непрочитанные.

В Mozilla Firefox иконка появляется в адресной строке


На странице ленты из выпадающего списка выбираете Закладки на ленты новостей


Как приходят обновления, лично я не поняла. За несколько часов ничего не обновилось:). Кто знает, поделитесь в комментариях, пожалуйста. Может я что-то не так сделала.

В Opera подписка мне нравится больше всего, хотя я, практически, не пользуюсь ей. Иконка отображается в адресной строке, по нажатию на нее попадаешь на страницу, на которой все статьи уже удобно структурированы.


После подписки, при каждом открытии браузера, если есть обновления в лентах, на которые вы подписаны, в нижнем правом углу будет появляться сообщение об обновлениях


На мой взгляд, самая удобная подписка, возможность получать новости быстро, удобно, и не переходя постоянно на сам сайт.

Сейчас мы рассмотрели варианты, которые дают нам сами браузеры. Но при этом, ещё не обо всех браузерах сказано. В принципе, обо всех я и не собиралась рассказывать, а вот Chome от Google хотела уделить внимание. Дело в том, что я не совсем разобралась с ним. Пока выяснила, что для осуществления подписки необходимо установить специальное расширение.

Для этого кликаем по значку Ключ — Инструменты – Расширения, откроется страница с расширениями, выбрать RSS Subscription Extension (от Google). После установки этого расширения иконка RSS будет появляться справа от адресной строки. Но при самой подписке получается, что нельзя получать новости так, как, например, предложено в других браузерах. А необходимо выбрать определенный RSS агрегатор. К слову, все остальные браузеры (кроме Internet Explorer) так же дают право выбора той программы, через которую вы будете получать новости сайтов. И теперь мы рассмотрим самые распространенные из них.

Не ошибусь, если среди самых распространенных назову Google Reader и Яндекс Ленту. Если ваша основная почта находится на одном из этих ресурсов, то смело выбирайте их приложения для чтения новостных лент.

Google Reader имеет такую иконку
Яндекс лента такую
Смотреть обновления вы можете непосредственно в их интерфейсе. У Google ссылка на Reader всегда находится в верхнем левом углу на странице почты. У Яндекс обновления будут видны в почте в папке Подписки.

Хотелось бы ещё сказать, что Google предлагает размещать на главной странице iGoogle виджеты подписок. Я пробовала, мне не очень понравилось, т.к. новости приходят со значительным опозданием. Выглядит это так


Все онлайн клиенты для чтения фидов (RSS лент) перечислять не представляется возможным. Давайте лучше рассмотрим такой вариант. Например, вы пользуетесь каким-то ридером, и зайдя на страницу RSS-ленты, среди представленных возможностей, не находите свой сервис. Выход простой, в любой ридер можно самостоятельно добавить ленту, просто скопировав ее из адресной строки браузера. Примеры приводить не буду, но если вы внимательно посмотрите, всегда есть ссылка Добавить канал или что-то в этом роде. Проще даже представить невозможно.

Помимо онлайн клиентов для чтения RSS-лент, так же есть и декстопные программы. Одной из
наиболее интересных является программа FeedReader. Программа бесплатная, подробности можете узнать, перейдя по ссылке.

Теперь, обладая этими знаниями, вы сами решите, как удобней всего для вас получать новости своих любимых блогов и сайтов. Уверена, сможете разобраться и в других онлайн клиентах для чтения RSS-лент, а таковых очень много.

Участвуйте в акции Обмен постовыми.
Среди моих постоянных читателей появилась девушка Юлия, автор блога, тема которого вызывает много споров и эмоций (по крайней мере у меня точно), блог о вегетарианстве Вегетарианец на бобах. Я никогда не стану вегетарианцем, и считаю этот тип питания противоестественным для человека, и все же, прочитав несколько статей, поняла, что не обязательно быть вегетарианцем, чтобы читать этот блог. Живой язык, выбор тем для статей делает блог очень интересным для всех, даже для неисправимых любителей мяса. Хотела поставить ссылку на какую-то одну статью, но даже не смогла сделать выбор.

amateurblogger.ru

что это такое: RSS ленты, рассылки и потоки

RSS – технология передачи информации, оформленной в соответствии с указанными в коде параметрами. Источником предоставляемой информации является файл, созданный для автоматического формирования и предоставления публикаций по запросу. Для получения информации используют программы-агрегаторы, которые умеют работать с файлами, имеющими расширение rss или xml.

RSS

Технологию используют владельцы сетевых ресурсов с часто обновляемой информацией, например блогов, новостных порталов. Она позволяет пользователям сайтов при помощи RSS-агрегаторов получать новые публикации сразу с нескольких источников, не заходя на страницы сетевых ресурсов. Оформить подписку на интересный RSS-поток можно путем добавления ссылки на файл с соответствующим расширением в программу-агрегатор.

Для кого создали этот формат

Что такое RSS для владельца и пользователей сетевых ресурсов? Это возможность предоставления и получения информации в кратком, удобном для поверхностного ознакомления формате. С помощью RSS-ленты владелец сайта может сообщить аудитории о появлении нового контента, предоставив часть или полное содержание статьи со ссылкой на источник. Это самый простой и действенный способ поддержки посещаемости на стабильно высоком уровне. Для подписчика RSS лента – это возможность быстрого получения множества кратких описаний статей, новой информации с целью беглого ознакомления с контентом, отбора важного материала с последующим тщательным изучением данных.

RSS-рассылка – это то, что требуется при распространении информации с целью привлечения аудитории к материалу. Ее не используют для рассылки больших статей для получения отзывов или комментариев пользователей.

Содержание RSS-файла

  1. Метаданные для передачи краткого или полного содержания статьи, ссылки на страницу с контентом, аннотации, заголовка, изображения к материалу.
  2. Метаданные для группировки передаваемых пользователю заметок по пунктам.
  3. Метаданные о существующих разделах, например политические, спортивные новости.

Для создания списка каналов используют технологию OCS или OPML. Для формирования списков вручную проще в работе формат OPML.

Версии RSS

RDF. Подходит для работы с приложениями, поддерживающими этот формат.

RSS. Предназначен для рассылки простых публикаций.

RSS2. Популярен среди пользователей, рассылающих информацию общего назначения.

Atom. Является усовершенствованной версией RSS.

Преимущества технологии RSS

Для читающей аудитории:

  1. Быстрое и удобное получение нужной информации из Всемирной паутины.
  2. Источник информации доступен бесплатно.
  3. Возможность настройки периодичности обновления данных о появлении новой информации и получения краткого или полного содержания нужного контента.
  4. Экономия интернет-трафика. Актуально для пользователей, у которых доступ в интернет лимитирован. Получая заголовки статей, без загрузки полного содержимого страницы, пользователь сокращает количество скачанных мегабайт.

Для владельцев сетевых ресурсов:

  1. Быстрый рост ссылочный массы продвигаемого ресурса.
  2. Привлечение новых пользователей.
  3. Удержание постоянных посетителей.

Недостатки использования RSS для владельцев сетевых ресурсов

  • Доступность огромного количества каналов заставляет пользователей подписываться на источники, которые хоть немного их заинтересовали. Чем больше информации, тем сложнее своевременно ее обрабатывать.
  • Быстрая индексация содержимого RSS-лент с последующим понижением поискового рейтинга первоисточников. Поисковая система считает оригиналом тот контент, который находится в ленте, а не тот который расположен на странице сайта. Недостаток проявляется при публикации полных версий статей. Выкладывание краткого содержания со ссылкой на материал помогает решить проблему.
  • Незаконное копирование и распространение информации. RSS-ленты помогают владельцам трастовых сайтов использовать копии публикуемых статьей на своих сайтах. Поисковики отдают предпочтение известным и популярным ресурсам, поэтому могут посчитать первоисточник копией и понизить в поисковой выдаче.
  • Ссылка на страницу с полной версией статьи не дает гарантии перехода пользователя на продвигаемый ресурс. Если ссылки нет, то на увеличение трафика можно не рассчитывать.
  • XML-язык очень удобно использовать для автоматического парсинга контента по различным параметрам.

Подписка на RSS-ленту

Откройте в браузере страницу с контентом, на который хотите подписаться. Найдите ссылку на RSS-канал и нажмите на нее. Если ваш браузер поддерживает формат, то на новой странице вы увидите список публикуемых статей. Если для чтения содержимого лент вы предпочитаете использовать специальное программное обеспечение, то скопируйте найденную RSS-ссылку и добавьте ее в список. Новые материалы ленты можно получать по почте. Для этого нужно найти на сайте специальную форму, ввести в нее адрес электронной почты и подтвердить подписку.

Программы для чтения RSS-лент

Для удобного поиска и чтения информации разработано множество программ, дополнений, сервисов. Называют их ридерами или агрегаторами RSS-потоков. Преимуществом использования специальных программ является экономия времени на поиск и получение нужных данных. Они позволяют выставлять различные параметры поиска, сортировки ссылок, обновления контента, синхронизации списков. Программы разработаны под различные операционные системы, включая Windows и Android.

RSS-лента

Браузеры с поддержкой формата RSS

Практически все популярные браузеры могут обрабатывать RSS-потоки. Так как функция чтения лент является дополнением, то ее возможности сильно ограничены. Несмотря на это, браузерами удобно пользоваться для получения важных новостей из популярных источников информации.

Интернет-сервисы

Google Reader и аналогичный сервис «Яндекса» прекратили существование. Их место заняло множество платных и бесплатных онлайн-приложений, различающихся функциональностью и удобством использования.

Интернет-сервисы для чтения RSS

Сервисы для чтения RSS-лент

Palabre. Программа написана для мобильных устройств, работающих под управлением операционной системы Android. Обладает гибкими настройками. Пользователь может читать контент онлайн или офлайн после скачивания статей. Распространяется бесплатно со встроенной рекламой, которую можно отключить после покупки премиум-версии.

Newsflow. Разработана для пользователей Windows 10. Позволяет просматривать видео, читать статьи в приложении, составлять неограниченные списки лент.

Inoreader. Отличается возможностью кеширования получаемого контента для чтения без подключения к интернету. Можно скачать версию для настольных и мобильных устройств.

Как создать RSS-канал

Создать ленту можно несколькими способами:

  • вручную. Чтобы создать канал вручную, потребуется изучить код XML или другой популярный язык программирования, например C#;
  • при помощи специальных генераторов. Это самый простой способ получения ленты. Достаточно ввести в программу параметры формирования передаваемого контента, и генератор за считаные секунды создаст требуемый файл;
  • используя инструменты системы управления сайтом. Практически все движки имеют встроенный инструмент генерации RSS-потоков. Если система управления содержимым не предлагает такого инструмента, то пользователь обязательно найдет дополнение, которое решит задачу.

CMS WordPress

Технология RSS создана для пользователей интернета и владельцев сетевых ресурсов. Первые получают возможность быстро собирать, отфильтровывать, сортировать, обновлять данные, получаемые из множества источников, а вторые расширять аудиторию, увеличивать ссылочную массу, улучшать поведенческие факторы. Использовать технологию выгодно как читателям, так и тем, кто создает и публикует разнообразный контент.

wiki.rookee.ru

Что такое RSS и как им пользоваться

Не поленитесь прочесть эту небольшую статью, ибо в будущем она позволит сэкономить много времени.

RSS — один из форматов передачи данных в интернете. Предназначен для того, чтобы Вы могли в одном месте просматривать обновления всех интересующих Вас сайтов, на которые подписались. Этим местом является RSS Reader.

Наиболее популярные онлайн RSS ридеры:

  1. Google Reader;
  2. Яндекс Лента.

Если предпочитаете пользоваться Яндексом, заведите на нем почту, зайдите в нее и переключитесь на вкладку «Подписки», далее на карандаш «Добавить», вводите адрес сайта, на обновления которого хотите подписаться, или адрес его RSS канала и жмите добавить.

Замечание: чтобы узнать адрес новостного канала сайта, найдите на нем аббревиатуру RSS или оранжевый значок наподобие того, что расположен у меня в правой колонке. Такой значок есть на любом блоге, и Вы его быстро найдете. Кликните на него — URL адрес появившейся страницы и есть адрес RSS канала этого блога.

Если чаще используете Google, создайте почту на нем, после этого вы получаете доступ к Google Reader.

Зайдите в него, в появившемся окне нажмите на красную кнопку «подписаться» и введите адрес новсотного канала сайта:

Адрес feed канала моего блога: http://feeds.feedburner.com/Fairheartru

В начале главное понять не что такое RSS, а как этим пользоваться.

Подписаться на мой блог можно и со страницы feed канала. Пройдите по ссылке — RSS подписка, или нажмите на оранжевый значок в правой колонке.

Откроется страничка, на которой возможно выбрать используемый Вами RSS ридер (в народе просто «читалка»):

Как Вы заметили, читалок много, и здесь я описал только самые популярные. Выбрав нужный, Вас перебросит на его страничку, где необходимо подтвердить свою подписку. Вот и все! Теперь, когда я опубликую новую статью, Вы увидите ее анонс в своем RSS ридере, и если она Вам интересна, прочтете полную версию на моем блоге.

Замечание: нажав на кнопку +Google, Вы добавите модуль обновления моего блога на свою страничку iGoogle. Чтобы добавить именно в Google Reader, воспользуйтесь способом, что я описал выше.

Так же мой блог может отправлять анонсы новых статей на электронную почту, для этого достаточно ввести свой адрес электронной почты в форму «Обновления блога на Email» и нажать «ОК». Выбирайте наиболее удобный вариант подписки.

Спасибо, друзья, за внимание! До встречи на страницах моего блога!

Лучший способ выразить благодарность автору — поделиться с друзьями!

Узнавайте о появлении нового материала первым! Подпишитесь на обновления по email:

Следите за обновлениями в Twitter и RSS.

fairheart.ru

Как определить адрес RSS-ленты своего сайта » Техподдержка Prihod.ru

С помощью RSS-ленты записи с вашего сайта можно выводить на других сайтах. Записи в ленте будут обновляться автоматически.

Так же вы можете выводить в сайдбаре своего сайта отдельные рубрики или метки с помощью виджета RSS.

Как определить адрес RSS-ленты:

  1. Откройте на вашем сайте ту рубрику или метку, которую хотите выводить в сайдбаре. Если нужен адрес ленты всех записей сайта, то откройте главную страницу сайта.
  2. В адресной строке браузера припишите к тому, что там есть, слэш feed, вот так: /feed . Должно получиться что-то вроде http://prihod.ru/category/zametki-o-wordpress/feed/ , только, конечно, с адресом вашего сайта в начале. Должна открыться страничка с xml-содержимым. Мы получили RSS-ленту вашего сайта.

Страничка с xml-содержимым будет выглядеть примерно так:

или так (это зависит от браузера):

Если нужно разместить ленту на своем сайте, то заходим в раздел консоли «Внешний вид» — «Виджеты». Перетаскиваем в боковую колонку виджет RSS, вставляем в него нашу свежеполученную ссылку, устанавливаем название, настраиваем вывод ленты. Готово! Так в боковую колонку можно вытащить сколько угодно своих рубрик (по очереди, конечно).

Важно! Ни в коем случае не размещайте в виджете RSS прямую ссылку на рубрику, метку или весь сайт (т.е. без /feed). Это сильно повлияет на скорость работы вашего сайта.

Так же вы можете разместить на своем сайте виджет RSS Links (Extra), который автоматически выводит ссылку на RSS-ленту вашего сайта.

Просмотрено (11062) раз

support.prihod.ru

Часто встречающиеся ошибки RSS-канала — Технологии Яндекса

Cодержимое Турбо‑страницы не соответствует оригинальной версии (в элементе turbo:content текст не разбит на абзацы)

Текстовое содержимое страницы в элементе turbo:content не разделено на абзацы. Это ухудшает восприятие текста пользователями.

Используйте элемент p для разделения текста страницы на абзацы там, где это уместно.

Воспользуйтесь отладкой для проверки содержимого turbo:content.

HTML-элементы в тексте указаны некорректно

Отсутствуют обязательные элементы внутри элемента turbo:content.

Проверьте, что в элементе turbo:content присутствуют все необходимые для формирования Турбо-версии элементы, а внутри тега CDATA есть текстовое содержимое.

Воспользуйтесь отладкой для проверки содержимого turbo:content.

Не удалось скачать изображение

При формировании Турбо-версии робот не смог загрузить указанное изображение.

Проверьте, что изображение доступно и отвечает кодом 200 OK. Относительные ссылки на изображения необходимо изменить на абсолютные — с указанием адреса сайта и протокола. Например, img src=»http://example.com/img.jpg».

Cодержимое Турбо‑страницы не соответствует оригинальной версии (в содержимом тега [CDATA[]] найдены закодированные символы)

Внутри тега [CDATA[]] найдены закодированные символы.

Кодировать символы внутри [CDATA[]] не нужно. Замените закодированные символы на незакодированные в вашем RSS-канале.

Воспользуйтесь отладкой для проверки содержимого turbo:content.

URL, указанный в элементе link элемента item, встречается в другом RSS-канале

Данные об одной и той же странице передаются в нескольких RSS-каналах.

В интерфейсе Яндекс.Вебмастера в разделе отключите дублирующие RSS-каналы.

Заголовок некорректный

Элемент h2 не указан или указан некорректно.

Проверьте, что для данной страницы в RSS-канале передается корректный заголовок h2. Данный заголовок обязателен и не может быть пустым.

Воспользуйтесь отладкой для проверки содержимого turbo:content.

Не указан обязательный атрибут formaction

В RSS-канале используется элемент button, для которого не указан атрибут formaction.

Добавьте необходимый атрибут в соответствии с документацией.

Воспользуйтесь отладкой для проверки содержимого turbo:content.

yandex.ru

Читаем ВКонтакте через RSS / Habr

Возможно, я сильно отстал от жизни, но я практически не пользуюсь соцсетями, а собирать информацию об обновлениях интересующих меня сайтов предпочитаю через RSS. Но совсем от соцсетей не избавиться, некоторые полностью перешли туда, закинув сайты (ну или rss-каналы на этих сайтах).

Потому нужен какой-то парсер, который будет брать информацию со страницы в соцсети и представлять её в виде rss-канала, который я могу отдать своей RSS-читалке.


Какой-то время я пользовался feed.exileed.com, но это не слишком стабильная штука была, а последнее время вообще практически перестала работать. Потому задумался о замене.
Набрёл на сервис vkrss.com, но практически одновременно увидел и php-скрипт одноимённый: https://github.com/woxcab/vkrss, что сразу заставило прекратить поиски — я любитель self-hosted решений, на сторонние сервисы по возможности стараюсь полагаться только как на резерв, а не как на основу.

Умеет данный скрипт довольно много, для меня большая часть не нужна. Но может кому-то важно будет:

  • Получение RSS-ленты открытой стены: извлечение описания из разных частей (включая вложения) и построение заголовков на основе описания.
  • Также получение RSS-ленты закрытой стены при наличии токена с правами оффлайн-доступа, привязанного к профилю, которому открыт доступ к такой стене. Ниже описан один из способов получения токена.
  • Получение RSS-ленты, содержащей записи с различных открытых стен, которые соответствуют глобальному поисковому запросу.
  • Получение произвольного количества записей со стены.
  • Получение записей, опубликованных от кого угодно, от имени сообщества/владельца страницы или ото всех, кроме сообщества/владельца страницы.
  • Фильтрация записей по наличию или отсутствию подписи.
  • Фильтрация записей по соответствию и/или несоответствию регулярному выражению в стиле PCRE.
  • При желании исключение записей в сообществе, помеченных как реклама [по умолчанию отключено].
  • Извлечение хеш-тегов в качестве RSS-категорий.
  • При желании HTML-форматирование всех видов ссылок, изображений, переносов строк [по умолчанию включено].
  • Допустимо использование HTTPS, SOCKS4, SOCKS4A или SOCKS5 прокси-сервера для запросов.
  • У каждой записи в ленте указан автор (либо тот, кто подписан или опубликовал запись, либо тот, кто подписан или опубликовал исходную запись, если конечная запись является репостом исходной).
  • Возможность задать свой собственный разделитель с подстановками между родительским и дочерним записями (репосты).

RSS я после смерти гуглоридера читаю через Tiny Tiny RSS (не единственный вариант, но вполне достойный). Так что свой сервер у меня имеется и добавить там ещё и парсер для вконтакте проблемой не является.

В недостатках только то, что для работы данный скрипт требует регистрации на vk.com, без этого не получить токен доступа даже для чтения открытых страниц.

Исключительно для того, чтобы покормить паранойю, попробовал завести свежий аккаунт, но сломался на вводе номера телефона. Попробовал несколько различных сайтов для приёма sms, но ни один не подошел. На некоторые sms просто не приходила, на некоторые vk.com отказывался их посылать, «этот номер уже использовался» или «неправильный номер». Я не говорю, что это невозможно, просто далеко не так просто. Надёжней будет добыть физическую симкарту, не привязанную к вашей личности. Да и проще, наверное.

Но я всё равно уже зарегистрирован, так что всё вышеописанное было просто развлечением.

Вводные:

Имеется сервер на Ubuntu 16.04.6 LTS, где работает ttrss. Надо транслировать туда несколько страниц с сайта vk.com.

Страницы все открытые, без паролей, никаких закрытых страниц я не читаю.

Установка:

Тут всё элементарно — если не хочется ставить git, то скачиваем архив с гитхаба да распаковываем куда-нибудь в папку к вебсерверу, чтобы можно было браузером достучаться. Системные требования минимальные, достаточно практически одного только наличия php.

PHP>=5.2.2 (в т.ч. 5.3.X, 5.4.X, 5.5.X, 5.6.X, 7.X) с установленными по умолчанию поставляемыми расширениями mbstring, json, pcre, openssl.

Скрипт предпочитает использовать встроенные в PHP возможности по отправке запросов. Если у PHP отключена встроенная возможность загрузки файлов по URL (отключен параметр allow_url_fopen в конфигурации или параметрах интерпретатора), но при этом у PHP установлено расширение cURL, то именно оно будет использоваться для загрузки данных.

Настройка:

На странице программы достаточно понятная документация имеется по всем вопросам, потому я тут только кратко про свою задачу расскажу — читать публичные страницы.

Ссылка для получения rss-ленты базово должна выглядеть так: index.php?id=<страница>&access_token=XXXXXXXXX
Допустим, мы хотим читать Хабр. Тогда ссылка должна будет выглядеть как index.php?id=habr&access_token=XXXXXXXXX
Осталось только получить токен для доступа. Для чтения открытых страниц это элементарно.

Создаёте standalone-приложение:

И дальше в разделе «Настройки» вас интересует поле «Сервисный ключ доступа»:

Это будет ваш access_token. То есть в итоге наша ссылка должна будет выглядеть как index.php?id=habr&access_token=5eb381185eb381185eb38118f95ed8e59455eb35eb3811803a40fe7530c290f98df6d0a. Ну, не забыв, конечно, имя сервера в начале подставить. Открыв ссылку в браузере, видим пригодную для скармливания RSS-читалке страницу.

За более подробными инструкциями советую сходить на страницу программы: https://github.com/woxcab/vkrss#rus.

habr.com