MAC Affiliate Conference in Armenia 30-31 мая 2024 года Подробнее

История сайтов в вебархиве: как посмотреть старую версию страницы

Елена Кузнецова
Контент-менеджер

Книги, картины, газетные статьи и письма — все это, так или иначе, представляет собой контент, содержимое которого представляет интерес не только для современников его авторов, но и для следующих поколений. Чтобы получить доступ к оригиналам и копиям произведений прошлых лет, нужно посетить музей, картинную галерею или библиотеку. В наши дни большая часть информации и творчества публикуется в интернете на различных веб-сайтах. Однако и их цикл жизни не вечен: принимая решение о прекращении поддержки, владельцы вполне могут удалить ресурс за ненадобностью. Можно ли найти в онлайн-архивах старые версии сайта, посмотреть историю изменений в прошлом времени и узнать, как страницы выглядели раньше? Давайте разбираться.

продвижение

Общее представление

Для решения рассматриваемой задачи существуют специальные сервисы, главным среди которых по праву считается Wayback Machine. Разработанный Б. Кейлом в 1996 году, на сегодняшний день он насчитывает свыше 730 миллиардов записей. По сути, речь идет об огромной бесплатной цифровой библиотеке, периодически сохраняющей снимки веб-ресурсов, а также видео и аудиозаписи. Интервал зависит от востребованности конкретного портала — чем выше трафик, тем чаще система делает копии.

аналитика

Зачем нужен архиватор сайтов

Используя предлагаемые возможности, можно не только изучить историю развития интернета на примерах наиболее популярных страниц. Функционал архива позволяет:

  • Восстановить собственный ресурс в тех случаях, когда автоматическое резервное копирование не сработало должным образом.
  • Анализировать конкурентов, просматривая изменения пользовательского интерфейса, дизайна или предлагаемого контента.
  • Найти удаленную информацию, представляющую ценность в рамках решения определенной задачи.
  • Проверять домены, доступные для приобретения — вполне возможно, что предлагаемые веб-адреса ранее уже были скомпрометированы и внесены в черные списки.
  • Подобрать качественные статьи, подходящие для заимствования и повторной публикации — при условии соблюдения принципов авторского права.
администрирование

Как посмотреть архивные версии сайтов

Чтобы получить доступ к содержимому конкретного ресурса, достаточно выполнить простую последовательность действий:

  • Открыть Wayback Machine, расположенный по адресу archive.org.
  • Ввести в форму URL портала или отдельной страницы.
  • Нажать на кнопку «Browse».
Яндекс Метрика: что это, аналитика и сводка по просмотрам
Яндекс Метрика: что это, аналитика и сводка по просмотрам
Аналитические инструменты, предлагаемые ведущей отечественной поисковой системой, позволяют ознакомиться с информацией о посетителях сайтов. Система собирает и структурирует данные. Благодаря ей, можно понять, откуда приходит основной трафик, какие страницы просматривают дольше других, как распределяется аудитория по критериям пола, возраста и географической дислокации и т. д. В инструкции по настройке сервиса подробно раскрывается алгоритм установки веб счетчика, отвечающего за формирование обобщающей базы, которая в дальнейшем может быть представлена в виде различных отчетов, диаграмм и графиков. Что показывает аналитика Яндекс Метрики, как…

На экране появятся хронологическая шкала и календарь, даты в котором выделены разными цветами:

  • Голубой — означает успешную архивацию.
  • Зеленый — указывает на настройку редиректа.
  • Оранжевый — фиксирует наличие ошибки по вине клиента.
  • Красный — свидетельствует о проблемах со стороны сервера.

Остается только выбрать нужные периоды, относящиеся к первой или второй категории — и можно приступать к изучению. Важный момент: если точный адрес неизвестен, можно воспользоваться поиском с использованием ключевых слов и названий — в выдаче системы будут представлены все варианты, так или иначе, связанные с содержанием запроса.

копии страниц

Возможные проблемы

Стоит отметить, что зайти в вебархив, который показывает, как другие сайты выглядели раньше, и позволяет посмотреть, какими были старые версии страниц в прошлом времени, может любой желающий. Впрочем, открытый доступ не исключает возникновения других сложностей. Так, в отдельных записях не сохраняются иллюстрации или элементы дизайна, а некоторые ресурсы могут и вовсе отсутствовать. В первом случае можно попробовать проверить другие снимки, тогда как второй вариант обычно объясняется одной из следующих причин:

  • Запрос на удаление копий контента подан бывшим владельцем.
  • В процессе анализа выявлены нарушения закона, защищающего право владения продуктами интеллектуальной собственности.
  • Доступ архивных роботов изначально был ограничен по инициативе создателя веб-страницы.
SEO

Как самостоятельно добавить в архив собственный сайт

Если вы хотите сохранить свой ресурс для просмотра в будущем, а также удостовериться в достаточном количестве снимков — на Wayback Machine предусмотрен соответствующий функционал. В правой нижней части интерфейса расположено поле Save Page Now — просто введите нужный домен и нажмите на кнопку. Функция в первую очередь актуальна для владельцев порталов с небольшим трафиком, редко копируемых системой.

фриланс

Как удалить существующие копии и запретить роботизированный доступ

Оградить контент от архивирования в общедоступную библиотеку также несложно. Для этого нужно внести в файл robots.txt, сохраненный в корневой папке веб-сайта, следующий код:

User-agent: ia_archiverDisallow: /User-agent: ia_archiver-web.archive.orgDisallow: /

После смены настроек имеющиеся версии будут удалены, а формирование новых прекратится до момента окончания срока действия домена. При этом нужно учесть, что отказ от продления будет означать автоматический возврат в базу старых копий.

трафик

Как посмотреть архив сайта в интернете и восстановить данные

Нередко у пользователей возникает потребность не только в отслеживании изменений, но и в скачивании содержимого. Для этого есть несколько автоматических сервисов.

Индексация сайта в поисковых системах: как проиндексировать страницы в Яндекс и Google
Индексация сайта в поисковых системах: как проиндексировать страницы в Яндекс и Google
Индексация сайта – это значит, что произошел процесс получения информации поисковыми системами Яндекс и Гугл о страницах того или иного веб-ресурса. После того как данные были получены, они сохранились в базе, именуемой индексом. Таким образом поисковики фиксируют, что веб-сайт существует и содержит определенного рода контент, который и будет предложен пользователям при соответствующих запросах. Задача вебмастеров заключается в том, чтобы внести адрес продвигаемого ресурса в общий реестр, именуемый индексом. Миновать этот этап нельзя, от него зависит успешный запуск любого проекта, цель…

Архиварикс

Помогает восстановить данные как действующих, так и закрытых веб-порталов. Использует собственную систему CMS, отличающуюся совместимостью с другими аналогичными инструментами. Чтобы получить желаемый результат, достаточно заполнить форму на соответствующей вкладке, указав домен и временную отметку, а также выставив нужные параметры.

сервисы

Rush Analytics

Еще один полезный ресурс, где можно как открыть и посмотреть сайты в прошлом времени, так и выбрать конкретную дату для последующего скачивания страницы. На выходе формируется полноценный html-документ — с указанием стилей, иллюстрациями и прочим контентом.

R-tools.org

Платный сервис, стоимость услуг которого рассчитывается исходя из фактического объема загрузок. При необходимости можно выгрузить весь веб-ресурс целиком, либо отметить нужные разделы.

офис

Можно ли пользоваться старым контентом, если он уникален

Продвижение — сложный творческий процесс, требующий усилия многих людей. Специалисты создают качественные оптимизированные тексты, ведут блоги, делятся рекомендациями и советами. Если проект по каким-то причинам был завершен, а сайт оказался закрыт, через некоторое время он перестает индексироваться поисковыми системами, что фактически открывает возможность повторного использования его содержимого. Вопрос о том, насколько это этично, мы рассматривать не будем, однако уточним, что в работе с поисковиками никаких проблем не возникнет. Исключение составляют случаи, когда выбранная статья уже была скопирована и размещена кем-то еще. Уникальность рекомендуется проверять заранее, используя для этого соответствующие сервисы — text.ru, content-watch.ru и т. д.

позиции

Где еще можно посмотреть историю изменения страниц сайта в интернете

Отследить корректировки визуального оформления, интерфейса и структуры верстки, а также проанализировать положение в выдаче поисковых систем в разные периоды существования ресурса помогут следующие инструменты.

YML-файл: что это такое, как создать для Яндекс маркета
YML-файл: что это такое, как создать для Яндекс маркета
Отечественный маркетплейс разработал собственный стандарт для выгрузки данных по товарам в формате прайса. Требования, предъявляемые к пользователям, учитывают специфику информации, предоставление которой является обязательным условием торговой площадки. Формирование документов с помощью предлагаемого инструмента немного сложнее, чем работа с XLS или CSV, однако используемые шаблоны автоматизации помогают оптимизировать целый ряд рутинных процессов, в том числе — обновление по отдельным товарным позициям и их характеристикам. Как вручную создать и загрузить файл формата YML для Яндекс Маркета, что это такое, и какие примеры…

Копии, сохраняемые в Google и Яндекс

В данном случае речь идет о последних версиях, попавших в роботизированную индексацию. Для открытия кэша в Chrome используется соответствующий оператор, а вся запись условно будет выглядеть как cache:abc.ru. Можно представить полученный результат в текстовом виде, либо просмотреть исходный код. Во втором случае аналогичную функцию выполняют команды «site» и «url».

SERP

Keys.so

Сервис, демонстрирующий количество страниц в выдаче — с распределением по категориям, регулировкой параметров и опцией выгрузки подробной статистики в файлы для Excel.

Whois History

Справочных данных от регистраторов доменных имен, через который можно проверить возраст домена, уточнить сведения о владельцах и регистрационных процедурах и т. п.

SEO-услуги

Заключение

Современные веб-архивы — сайты для просмотра страниц в прошлом — позволяют не только отслеживать изменения, но и восстанавливать содержимое Интернет-ресурсов. Подобные инструменты одинаково полезны как тем, кто ищет новые идеи для контента, так и для людей, интересующихся историей популярных сетевых порталов.

Вопрос-ответ

Что делать, если нужная информация не находится ни в одном из архивов?

Теоретически может помочь кэш поисковых систем, роботы которых регулярно индексируют данные. Попробуйте воспользоваться стандартными операторами.

Почему в архивных сервисах нет информации о том или ином ресурсе?

Доступ к копированию мог быть ограничен по инициативе владельца, также потребовавшего удалить копии, сделанные ранее.

Какие есть расширения для браузеров?

Простой вариант для того, чтобы посмотреть историю версий сайта — установка в Chrome плагина Web Cache Viewer. Для просмотра достаточно кликнуть ПКМ на любой странице, открыв сохраненный вариант из кэша Google или Wayback Machine.

Продвигайтесь в Семантике

– Только качественный трафик
– Понятная отчетность о работе и о планах работ
– Полная прозрачность работ