Книги, картины, газетные статьи и письма — все это, так или иначе, представляет собой контент, содержимое которого представляет интерес не только для современников его авторов, но и для следующих поколений. Чтобы получить доступ к оригиналам и копиям произведений прошлых лет, нужно посетить музей, картинную галерею или библиотеку. В наши дни большая часть информации и творчества публикуется в интернете на различных веб-сайтах. Однако и их цикл жизни не вечен: принимая решение о прекращении поддержки, владельцы вполне могут удалить ресурс за ненадобностью. Можно ли найти в онлайн-архивах старые версии сайта, посмотреть историю изменений в прошлом времени и узнать, как страницы выглядели раньше? Давайте разбираться.
- Общее представление
- Зачем нужен архиватор сайтов
- Как посмотреть архивные версии сайтов
- Возможные проблемы
- Как самостоятельно добавить в архив собственный сайт
- Как удалить существующие копии и запретить роботизированный доступ
- Как посмотреть архив сайта в интернете и восстановить данные
- Можно ли пользоваться старым контентом, если он уникален
- Где еще можно посмотреть историю изменения страниц сайта в интернете
- Заключение
Общее представление
Для решения рассматриваемой задачи существуют специальные сервисы, главным среди которых по праву считается Wayback Machine. Разработанный Б. Кейлом в 1996 году, на сегодняшний день он насчитывает свыше 730 миллиардов записей. По сути, речь идет об огромной бесплатной цифровой библиотеке, периодически сохраняющей снимки веб-ресурсов, а также видео и аудиозаписи. Интервал зависит от востребованности конкретного портала — чем выше трафик, тем чаще система делает копии.
Зачем нужен архиватор сайтов
Используя предлагаемые возможности, можно не только изучить историю развития интернета на примерах наиболее популярных страниц. Функционал архива позволяет:
- Восстановить собственный ресурс в тех случаях, когда автоматическое резервное копирование не сработало должным образом.
- Анализировать конкурентов, просматривая изменения пользовательского интерфейса, дизайна или предлагаемого контента.
- Найти удаленную информацию, представляющую ценность в рамках решения определенной задачи.
- Проверять домены, доступные для приобретения — вполне возможно, что предлагаемые веб-адреса ранее уже были скомпрометированы и внесены в черные списки.
- Подобрать качественные статьи, подходящие для заимствования и повторной публикации — при условии соблюдения принципов авторского права.
Как посмотреть архивные версии сайтов
Чтобы получить доступ к содержимому конкретного ресурса, достаточно выполнить простую последовательность действий:
- Открыть Wayback Machine, расположенный по адресу archive.org.
- Ввести в форму URL портала или отдельной страницы.
- Нажать на кнопку «Browse».
На экране появятся хронологическая шкала и календарь, даты в котором выделены разными цветами:
- Голубой — означает успешную архивацию.
- Зеленый — указывает на настройку редиректа.
- Оранжевый — фиксирует наличие ошибки по вине клиента.
- Красный — свидетельствует о проблемах со стороны сервера.
Остается только выбрать нужные периоды, относящиеся к первой или второй категории — и можно приступать к изучению. Важный момент: если точный адрес неизвестен, можно воспользоваться поиском с использованием ключевых слов и названий — в выдаче системы будут представлены все варианты, так или иначе, связанные с содержанием запроса.
Возможные проблемы
Стоит отметить, что зайти в вебархив, который показывает, как другие сайты выглядели раньше, и позволяет посмотреть, какими были старые версии страниц в прошлом времени, может любой желающий. Впрочем, открытый доступ не исключает возникновения других сложностей. Так, в отдельных записях не сохраняются иллюстрации или элементы дизайна, а некоторые ресурсы могут и вовсе отсутствовать. В первом случае можно попробовать проверить другие снимки, тогда как второй вариант обычно объясняется одной из следующих причин:
- Запрос на удаление копий контента подан бывшим владельцем.
- В процессе анализа выявлены нарушения закона, защищающего право владения продуктами интеллектуальной собственности.
- Доступ архивных роботов изначально был ограничен по инициативе создателя веб-страницы.
Как самостоятельно добавить в архив собственный сайт
Если вы хотите сохранить свой ресурс для просмотра в будущем, а также удостовериться в достаточном количестве снимков — на Wayback Machine предусмотрен соответствующий функционал. В правой нижней части интерфейса расположено поле Save Page Now — просто введите нужный домен и нажмите на кнопку. Функция в первую очередь актуальна для владельцев порталов с небольшим трафиком, редко копируемых системой.
Как удалить существующие копии и запретить роботизированный доступ
Оградить контент от архивирования в общедоступную библиотеку также несложно. Для этого нужно внести в файл robots.txt, сохраненный в корневой папке веб-сайта, следующий код:
User-agent: ia_archiverDisallow: /User-agent: ia_archiver-web.archive.orgDisallow: /
После смены настроек имеющиеся версии будут удалены, а формирование новых прекратится до момента окончания срока действия домена. При этом нужно учесть, что отказ от продления будет означать автоматический возврат в базу старых копий.
Как посмотреть архив сайта в интернете и восстановить данные
Нередко у пользователей возникает потребность не только в отслеживании изменений, но и в скачивании содержимого. Для этого есть несколько автоматических сервисов.
Архиварикс
Помогает восстановить данные как действующих, так и закрытых веб-порталов. Использует собственную систему CMS, отличающуюся совместимостью с другими аналогичными инструментами. Чтобы получить желаемый результат, достаточно заполнить форму на соответствующей вкладке, указав домен и временную отметку, а также выставив нужные параметры.
Rush Analytics
Еще один полезный ресурс, где можно как открыть и посмотреть сайты в прошлом времени, так и выбрать конкретную дату для последующего скачивания страницы. На выходе формируется полноценный html-документ — с указанием стилей, иллюстрациями и прочим контентом.
R-tools.org
Платный сервис, стоимость услуг которого рассчитывается исходя из фактического объема загрузок. При необходимости можно выгрузить весь веб-ресурс целиком, либо отметить нужные разделы.
Можно ли пользоваться старым контентом, если он уникален
Продвижение — сложный творческий процесс, требующий усилия многих людей. Специалисты создают качественные оптимизированные тексты, ведут блоги, делятся рекомендациями и советами. Если проект по каким-то причинам был завершен, а сайт оказался закрыт, через некоторое время он перестает индексироваться поисковыми системами, что фактически открывает возможность повторного использования его содержимого. Вопрос о том, насколько это этично, мы рассматривать не будем, однако уточним, что в работе с поисковиками никаких проблем не возникнет. Исключение составляют случаи, когда выбранная статья уже была скопирована и размещена кем-то еще. Уникальность рекомендуется проверять заранее, используя для этого соответствующие сервисы — text.ru, content-watch.ru и т. д.
Где еще можно посмотреть историю изменения страниц сайта в интернете
Отследить корректировки визуального оформления, интерфейса и структуры верстки, а также проанализировать положение в выдаче поисковых систем в разные периоды существования ресурса помогут следующие инструменты.
Копии, сохраняемые в Google и Яндекс
В данном случае речь идет о последних версиях, попавших в роботизированную индексацию. Для открытия кэша в Chrome используется соответствующий оператор, а вся запись условно будет выглядеть как cache:abc.ru. Можно представить полученный результат в текстовом виде, либо просмотреть исходный код. Во втором случае аналогичную функцию выполняют команды «site» и «url».
Keys.so
Сервис, демонстрирующий количество страниц в выдаче — с распределением по категориям, регулировкой параметров и опцией выгрузки подробной статистики в файлы для Excel.
Whois History
Справочных данных от регистраторов доменных имен, через который можно проверить возраст домена, уточнить сведения о владельцах и регистрационных процедурах и т. п.
Заключение
Современные веб-архивы — сайты для просмотра страниц в прошлом — позволяют не только отслеживать изменения, но и восстанавливать содержимое Интернет-ресурсов. Подобные инструменты одинаково полезны как тем, кто ищет новые идеи для контента, так и для людей, интересующихся историей популярных сетевых порталов.
Вопрос-ответ
Что делать, если нужная информация не находится ни в одном из архивов?
Теоретически может помочь кэш поисковых систем, роботы которых регулярно индексируют данные. Попробуйте воспользоваться стандартными операторами.
Почему в архивных сервисах нет информации о том или ином ресурсе?
Доступ к копированию мог быть ограничен по инициативе владельца, также потребовавшего удалить копии, сделанные ранее.
Какие есть расширения для браузеров?
Простой вариант для того, чтобы посмотреть историю версий сайта — установка в Chrome плагина Web Cache Viewer. Для просмотра достаточно кликнуть ПКМ на любой странице, открыв сохраненный вариант из кэша Google или Wayback Machine.