Достаём потерянные статьи из сетевых хранилищ / Хабр

Решение рассматривается (пока) только для одного сайта — того, на котором мы находимся. Идея появилась в результате того, что один пользователь сделал юзерскрипт, который переадресует страницу на кеш Гугла, если вместо статьи видим «Доступ к публикации закрыт». Понятно, что это решение будет работать лишь частично, но полного решения пока не существует. Можно повысить вероятность нахождения копии выбором результата из нескольких сервисов. Этим стал заниматься скрипт HabrAjax (наряду с 3 десятками других функций). Теперь (с версии 0.859), если пользователь увидел полупустую страницу, с которой можно перейти лишь на главную, в личную страницу автора (если повезёт) и назад, юзерскрипт предоставляет несколько альтернативных ссылок, в которых можно попытаться найти потерю. И тут начинается самое интересное, потому что ни один сервис не заточен на качественное архивирование одного сайта.

Кстати, статья и исследования порождены интересным опросом А вас раздражает постоянное «Доступ к публикации закрыт»? и скриптом пользователя dotneter — комментарий habrahabr.

ru/post/146070/#comment_4914947.

Требуется, конечно, более качественный сервис, поэтому, кроме описания нынешней скромной функциональности (вероятность найти в Гугл-кеше и на нескольких сайтах-копировщиках), поднимем в статье краудсорсинговые вопросы — чтобы «всем миром» задачу порешать и прийти к качественному решению, тем более, что решение видится близким для тех, кто имеет сервис копирования контента. Но давайте обо всём по порядку, рассмотрим все предложенные на данный момент решения.

Кеш Гугла

В отличие от кеша Яндекса, к нему имеется прямой доступ по ссылке, не надо просить пользователя «затем нажать кнопку „копия“». Однако, все кеширователи, как и известный archive.org, имеют ряд ненужных особенностей.

1) они просто не успевают мгновенно и многократно копировать появившиеся ссылки. Хотя надо отдать должное, что к популярным сайтам обращение у них частое, и за 2 и более часов они кешируют новые страницы. Каждый в своё время.

2) далее, возникает такая смешная особенность, что они могут чуть позже закешировать пустую страницу, говорящую о том, что «доступ закрыт».

3) поэтому результат кеширования — как повезёт. Можно обойти все такие кеширующие ссылки, если очень надо, но и оттуда информацию стоит скопировать себе, потому что вскоре может пропасть или замениться «более актуальной» бессмысленной копией пустой страницы.

Кеш archive.org

Он работает на весь интернет с мощностями, меньшими, чем у поисковиков, поэтому обходит страницы какого-то далёкого русскоязычного сайта редко. Частоту можно увидеть здесь: wayback.archive.org/web/20120801000000*/http://habrahabr.ru
Да и цель сайта — запечатлеть фрагменты истории веба, а не все события на каждом сайте. Поэтому мы редко будем попадать на полезную информацию.

Кеш Яндекса

Нет прямой ссылки, поэтому нужно просить (самое простое) пользователя нажать на ссылку «копия» на странице поиска, на которой будет одна эта статья (если её Яндекс вообще успел увидеть).

Как показывает опыт, статья, повисевшая пару часов и закрытая автором, довольно успешно сохраняется в кешах поисковиков. Впоследствии, скорее всего, довольно быстро заменится на пустую. Всё это, конечно, не устроит пользователей веба, который по определению должен хранить попавшую в него информацию.

Yahoo Pipes

pipes.yahoo.com/pipes/search?q=habrahabr+full&x=0&y=0 и прочие.

Довольно интересное решение. Те, кто умеет их настраивать, возможно, полноценно решат задачу архивирования RSS. Из имеющегося, я не нашёл пайпов с поиском статьи по её номеру, поэтому пока нет прямой ссылки на такие сохранённые полные статьи. (Кто умеет с ним работать — прошу изготовить такую ссылку для скрипта.)

Многочисленные клонировщики

Все из них болеют тем, что не дают ссылки на статью по её номеру, не приводят полный текст статьи, а некоторые вообще ограничиваются «захабренным» или «настолько ленивы», что копируют редко (к примеру, раз в день), что актуально не всегда.

Однако, если хотя бы один автор копировщика подкрутит движок на сохранение полноценного и актуального контента, он окажет неоценимую услугу интернету, и его сервис займёт главное место в скрипте HabrAjax.

Из живых я нашёл пока что 4, некоторые давно существовавшие (itgator) на данный момент не работали. В общем, пока что они почти бесполезны, потому что заставляют искать статью по названию или ключевым словам, а не по адресу, по которому пользователь пришёл на закрытую страницу (а по словам отлично ищет Яндекс и не только по одному их сайту). Приведены в скрипте для какой-нибудь полезной информации.

Задача

Перед сообществом стоит задача, не утруждая организаторов сайта, довести продукт до качественного, не теряющего информацию ресурса. Для этого, как правильно заметили в комментариях к опросу, нужен

архиватор актуальных полноценных статей (и комментариев к ним заодно).

В настоящее время неполное решение её, как описано выше, выглядит так:

Если искать в Яндексе, то подобранный адрес выведет единственную ссылку (или ничего):

Нажав ссылку «копия», увидим (если повезёт) сохранённую копию (страница выбрана исключительно для актуального на данный момент примера):

В Гугле несколько проще — сразу попадаем на копию, если тоже повезёт, и Гугл успел сохранить именно то, что нам надо, а не дубль отсутствующей страницы.

Забавно, что скрипт теперь предлагает «выбор альтернативных сервисов» и в этом случае («профилактические работы»):

Жду предложений по добавлению сервисов и копировщиков (или хотя бы проектов) (для неавторизованных — на почту spmbt0 на известном гуглоресурсе, далее выберем удобный формат).

UPD 23:00: опытным путём для mail.ru было выяснено строение прямой ссылки на кеш:

'http://hl.mailru.su/gcached?q=cache:'+ window.location

Знатоки или инсайдеры, расскажите, что это за ссылка, насколько она стабильна (не изменится ли, например, домен 3-го уровня), что значит приставка «g»-cached? Значит ли это кеш Гугла или это кеш движка Gogo? Пример.

Добавил ссылки мейла и ВК в обновление скрипта (habrAjax) (0.861), теперь там — на 2 строчки больше.

Как очистить кэш браузера на телефоне

Читайте статью, если хотите разобраться, как очистить кэш браузера Яндекс на телефоне Android.

Что такое кэш

Кэш (cache) — это промежуточное хранилище, в которое попадают временные файлы сайта. Cache позволяет хранить файлы (html-код, скрипты, стили CSS, медиафайлы) интернет-ресурсов, на которые недавно заходил пользователь.

Поскольку файлы любого сайта расположены на одном из серверов в интернете, браузер сначала ищет нужный сервер, затем запрашивает у него данные и только после этого передает их пользователю. Только после этого пользователь может перейти перейти на нужный ресурс или страницу.

Кэширование упрощает этот процесс. Если пользователь уже посещал страницу некоторое время назад, поисковику не придется вновь тратить ресурсы и время на обращение к серверу. Всю информацию о сайте он сможет взять из кэша. Благодаря этому весомо сокращается время повторной загрузки страницы.

Как правило, cache хранится в отдельной папке на системном диске или операционной системе устройства. Он предназначен для хранения небольшого количества информации, поэтому нередко его сравнивают с кратковременной памятью устройства.

Зачем чистить кэш:

  • чтобы видеть актуальное состояние сайтов. Иногда поисковик кэширует сайт в момент, когда на нём возникла ошибка. Это значит, что при повторном обращении страница подтянется из cache также с ошибкой. Даже если работоспособность страницы могла быть уже восстановлена;

  • чтобы ускорить время загрузки сайтов. Чем меньше загружена кратковременная память устройства, тем эффективнее работа поисковой системы и выше скорость загрузки страниц сайта.

Нередко вместе с cache пользователи чистят и файлы cookie. Cookie — это данные об авторизации (пароли, email, телефон), статистике посещений и индивидуальных настройках пользователя. В целях безопасности эти файлы также необходимо регулярно удалять.

Как очистить кэш браузера на смартфоне

Рассмотрим на примерах популярных поисковиков, как очистить кэш браузера на андроиде вручную и с помощью специальных приложений.

Способ 1. Вручную

Рассмотрим вариант очистки вручную на примере Google Chrome.

  1. org/HowToStep»> 1.

    В браузере нажмите на кнопку с тремя точками (меню). Затем кликните История:

  2. 2.

    Нажмите Очистить историю…

  3. 3.

    Выберите временной период, за который хотите удалить кэш. Затем поставьте галочку напротив пункта «Изображения и другие файлы, сохраненные в кеше» и нажмите Удалить данные:

Готово, вы очистили cache на мобильном устройстве.

Способ 2. Через приложение

Рассмотрим вариант, как очистить кэш в Яндексе на телефоне через специальное приложение. Одно из самых популярных приложений — CCleaner. С его помощью можно проанализировать память телефона, узнать количество «мусорных» файлов и их вес.

Чтобы очистить кэш с помощью приложения:

  1. org/HowToStep»> 1.

    Установите программу CCleaner.

  2. 2.

    Чтобы открыть приложение, нажмите Начать использование.

  3. 3.

    После запуска кликните Быстрая очистка:

  4. 4.

    Поставьте галочки напротив тех файлов, которые вы хотите удалить, и нажмите Завершить чистку:

Готово.

Теперь вы знаете, какую функцию выполняет кэширование и как очистить кэш мобильного браузера на Android.

Помогла ли вам статья?

Да

раз уже
помогла

Определение кеша браузера | ПКМаг

Произносится как «наличные в браузере». Область временного хранения в памяти или на диске, в которой хранятся последние загруженные веб-страницы. Когда вы переходите с веб-страницы на веб-страницу, кэширование этих страниц в памяти позволяет быстро вернуться к странице без повторной загрузки ее из Интернета. Чтобы обеспечить отображение последней страницы, браузер сравнивает даты кэшированной страницы с текущей веб-страницей. Если веб-страница не изменилась, кэшированная страница отображается немедленно. Если веб-страница изменилась, она загружается, отображается и кэшируется.

При выходе из сеанса браузера кэшированные страницы сохраняются на диске. Настройки в вашем веб-браузере позволяют вам установить объем пространства, используемого для кэша, который по сути представляет собой папку на диске, и продолжительность времени хранения страниц. См. Веб-кеш.

Реклама

Истории PCMag, которые вам понравятся

{X-html заменен}

Выбор редакции

ЭТО ОПРЕДЕЛЕНИЕ ПРЕДНАЗНАЧЕНО ТОЛЬКО ДЛЯ ЛИЧНОГО ИСПОЛЬЗОВАНИЯ. Любое другое воспроизведение требует разрешения.
Авторские права © 1981-2023. Компьютерный язык (открывается в новом окне) Co Inc. Все права защищены.

Информационные бюллетени PCMag

Информационные бюллетени PCMag

Наши лучшие истории в папке «Входящие»

Следите за новостями PCMag

  • Фейсбук (Открывается в новом окне)
  • Твиттер (Откроется в новом окне)
  • Флипборд (Открывается в новом окне)
  • Гугл (откроется в новом окне)
  • Инстаграм (откроется в новом окне)
  • Pinterest (Открывается в новом окне)

PCMag.com является ведущим авторитетом в области технологий, предоставляющим независимые лабораторные обзоры новейших продуктов и услуг. Наш экспертный отраслевой анализ и практические решения помогут вам принимать более обоснованные решения о покупке и получать больше от технологий.

Как мы тестируем Редакционные принципы

  • (Открывается в новом окне) Логотип Зиффмедиа
  • (Открывается в новом окне) Логотип Аскмен
  • (Открывается в новом окне) Логотип Экстримтек
  • (Открывается в новом окне) Логотип ИНГ
  • (Открывается в новом окне) Логотип Mashable
  • (Открывается в новом окне) Предлагает логотип
  • (Открывается в новом окне) Логотип RetailMeNot
  • (Открывается в новом окне) Логотип Speedtest
  • (Открывается в новом окне) Логотип Спайсворкс

(Открывается в новом окне)

PCMag поддерживает Group Black и ее миссию по увеличению разнообразия голосов в СМИ и прав собственности на СМИ.

© 1996-2023 Ziff Davis, LLC., компания Ziff Davis. Все права защищены.

PCMag, PCMag.com и PC Magazine входят в число зарегистрированных на федеральном уровне товарных знаков Ziff Davis и не могут использоваться третьими лицами без явного разрешения. Отображение сторонних товарных знаков и торговых наименований на этом сайте не обязательно указывает на какую-либо принадлежность или поддержку PCMag. Если вы нажмете на партнерскую ссылку и купите продукт или услугу, этот продавец может заплатить нам комиссию.

  • О Ziff Davis(Открывается в новом окне)
  • Политика конфиденциальности(Открывается в новом окне)
  • Условия использования(Открывается в новом окне)
  • Реклама(Открывается в новом окне)
  • Специальные возможности(Открывается в новом окне)
  • Не продавать мою личную информацию (откроется в новом окне)
  • (Открывается в новом окне) доверительный логотип
  • (Открывается в новом окне)

Очистить кэш-память веб-браузера / историю браузера

Веб-кэш хранит различные части веб-страниц для ускорения загрузки и иногда может быть поврежден. Когда это происходит, это может привести к частично загруженным или плохо отформатированным веб-страницам с неполными изображениями. После очистки кеша браузер будет скачивать свежие копии всего, что вы видите на каждой странице.

Следуйте приведенным ниже пошаговым инструкциям для операционной системы вашего устройства:

 

Мобильный телефон/планшет

Устройства IOS

  1. На главном экране нажмите Настройки

    7

    7
  2. На экране настроек прокрутите вниз и нажмите кнопку Safari
  3. В разделе Конфиденциальность экрана Safari нажмите кнопку с надписью Очистить файлы cookie/история и данные
  4. На экране подтверждения нажмите Очистить файлы cookie/история и данные

 

Android

  1. Запустите браузер. (Примечание: в этом примере показан процесс в Chrome, но шаги аналогичны в других браузерах)
  2. Нажмите кнопку меню вверху справа (обычно 3 вертикальные точки)
  3. Нажмите Настройки , а затем Конфиденциальность
  4. Нажмите Очистить данные браузера и выберите элементы, которые вы хотите очистить, затем нажмите Прозрачный

 

Windows Phone

  1. Нажмите живую плитку Internet Explorer на главном экране
  2. Нажмите на многоточие «» в правом нижнем углу
  3. Прокрутите вниз и нажмите Настройки
  4. Прокрутите вниз и коснитесь Удалить историю
  5. Коснитесь Удалить для подтверждения и подождите несколько секунд, пока кэш и файлы cookie не очистятся

 

Ноутбук

Internet Explorer

  1. Нажмите клавишу Alt для отображения строки меню
  2. Перейдите к Инструменты и затем Свойства обозревателя
  3. На вкладке Общие есть раздел под названием История просмотров . Нажмите на кнопку Удалить
  4. Вы также можете нажать Ctrl+Shift+Delete , и вы сразу перейдете к окну Удалить историю просмотров

 

Safari

  1. Нажмите Safari в верхнем левом углу экрана
  2. В появившемся меню нажмите Настройки
  3. В появившемся окне перейдите на вкладку Конфиденциальность
  4. Нажмите кнопку Удалить все данные веб-сайта
  5. Нажмите Удалить сейчас во всплывающем окне

 

Google Chrome

  1. В правом верхнем углу Chrome откройте меню Chrome
  2. Выбрать Еще Инструменты затем Очистить данные просмотра
  3. В появившемся диалоговом окне установите флажки для типов информации, которые вы хотите удалить
  4. Используйте меню вверху, чтобы выбрать объем данных, которые вы хотите удалить.