Также стоит отметить сильную привязку различных полезных канувших в лету (порой, насовсем, веб-архив не всемогущ) сайтов к надежности хостинга. Многие годные сайты погибли из-за того, что автор просто не проплатил доменное имя, или хостинг-платформа перестала сущестововать.
https://rense.com/general38/escap.htm , перевод by Яндекс (Гугл-транслейт хорошо перевел заголовок "Побег из цифровой темной эпохи")
В эту тему буду добавлять разное старперское с Хабра наподобие "Вымирание компьютерных файлов" https://habr.com/ru/companies/ua-hostin ... les/473928Выход из цифрового мракобесия
Стюарт Брэнд
Опубликовано в журнале Library Journal, том 124. Выпуск 2, стр. 46–49
6-20-3
Из-за стремительного устаревания цифровых форматов и платформ, а также из-за того, что срок службы цифровых носителей, таких как магнитная лента и компакт-диски, составляет десять лет, мы сейчас переживаем период самых значительных и невосполнимых потерь информации. Если это утверждение кажется вам чрезмерным, подумайте о количестве грамотных людей в мире и о том, сколько работы связано со «знаниями», то есть с компьютерами. Сама мировая экономика стала цифровой. Это проблема цивилизации.
Информация существует в двух основных измерениях — пространстве и времени. Благодаря цифровизации и интернету вся информация стала потенциально глобальной. Пространство для данных продолжает расширяться, но время, в течение которого они хранятся, сокращается. Период полураспада данных в настоящее время составляет около пяти лет. Улучшений не предвидится, потому что внимание высокотехнологичной отрасли сосредоточено только на обновлении в следующем году, и это отражается на продуктах. Но цивилизационное время измеряется веками. Происходит серьёзное разъединение. Утрата культурной памяти стала платой за стремление быть в тренде.
Ничто не сравнится с бескислотной бумагой
Ущерб уже значителен. Возможно, вы заметили, что файлы, которые вы бережно записывали на дискеты 5l/4 дюйма несколько лет назад, теперь не читаются. Исчезли не только эти дисководы, но и программы, операционные системы и компьютеры, на которых были записаны файлы (WordStar в CP/M на Kaypro?). Ваши файлы могут быть в целости и сохранности, но восстановить их невозможно, как будто их никогда и не было. То же самое можно сказать о спутниковых данных Landsat, полученных в 1960-х и начале 1970-х годов, которые хранятся на бесчисленных катушках магнитной ленты, уже не поддающейся считыванию. Все ранние наработки в области компьютерных технологий в таких лабораториях, как MIT Artificial Intelligence, также утрачены, несмотря на то, насколько тщательно они были записаны в то время. Современные наработки также обречены, поскольку темпы устаревания цифровых технологий продолжают расти, а серьёзный поиск долгосрочной стратегии хранения данных ещё не начался.
В цифровом мире до сих пор нет ничего лучше бескислотной бумаги. Бывший библиотекарь Калифорнийского университета в Беркли Питер Лэйман отмечает: «Когда мы понимаем, что книга важна, мы...сообщаем издателю: напечатайте её на бескислотной бумаге. При наличии хорошего библиотечного кондиционера она прослужит 500. лет. Если вы хотите сохранить что-то ещё, например газету, сделайте её микрофильм. Мы знаем, что при правильном уходе микрофильм может прослужить 500 лет». Но что нам делать с цифровыми документами? Сегодня мы обновляем их каждый раз, когда меняются технологии, или каждые 18 месяцев, в зависимости от того, что наступит раньше. Это дорогостоящий подход! Нам нужен цифровой эквивалент микрофильмов, решение, которое прослужит 500 лет.
Теряем Нашу Коллективную Память
Разработчик суперкомпьютеров Дэнни Хиллис также рассмотрел эту проблему на конференции «Цифровая преемственность», которая проходила в Центре Гетти в Лос-Анджелесе в феврале 1998 года. «Раньше, когда информацию было трудно копировать, — сказал Хиллис, — люди ценили копии и бережно к ним относились». Сейчас копии настолько распространены, что считаются бесполезными, и им уделяется очень мало внимания с точки зрения долгосрочного хранения. Он отметил, что тысячи лет назад мы записывали важные сведения на глине и камне, которые сохранялись тысячи лет. Сотни лет назад мы использовали пергамент, который хранился сотни лет.
В результате, по мнению Хиллиса, мы сейчас переживаем период, который может стать для будущих историков настоящим безумием — тёмные века, — потому что почти все наши произведения искусства, научные открытия, новости и другие записи создаются и хранятся на носителях, которые, как мы знаем, не переживут даже нас самих. Мы оказались в такой ситуации отчасти потому, что цифровизация даёт множество преимуществ. Теперь мы можем хранить, искать и сопоставлять буквально всё. На самом деле, по оценкам Майкла Леска из Bellcore, который подсчитал общий объём данных во всём мире, объём хранилищ уже превысил объём данных, и, вероятно, это надолго. Места для хранения больше, чем самих вещей для хранения. Нам больше не нужно ничего выбрасывать. Эта конкретная роль архивариусов и кураторов устарела.
Новая история
Если необработанные данные будут не только храниться, но и оставаться доступными, история станет другой дисциплиной, более близкой к науке, поскольку она сможет использовать методы интеллектуального анализа данных, применяемые маркетологами, для выявления закономерностей, скрытых в данных. Вы сможете быстро просматривать историю, выявлять взаимосвязанные тенденции, приближать отдельные моменты. Ключевые события можно изучать в оригинале — в реальном эксперименте с виртуальной реальностью и силовой обратной связью, который продемонстрировал новый способ сворачивания белка, изменивший медицину, а также в записях с камер наблюдения в лаборатории, телефонных звонках, электронных письмах и поисковых запросах, связанных с этим открытием. Обратите внимание, что в этом примере есть как пассивные, так и активные цифровые записи.
Электронная почта, телефонные звонки и фотографии — это пассивные данные; всё, что вам нужно делать, — это поддерживать их в читабельном состоянии. Но эксперимент с виртуальной реальностью — это активный процесс: вероятно, он проводился на каком-то экспериментальном, собранном на скорую руку лабораторном оборудовании. Без этого сложного оборудования, существовавшего в то время, вы не сможете воспроизвести эксперимент. Сохранение таких цифровых данных, зависящих от оборудования, практически невозможно. Например, тщательно проработанная модель Берлина в виртуальной реальности, которая годами использовалась для планирования развития города, почти наверняка будет утрачена, как и знаменитая компьютерная модель решающего танкового сражения в войне в Персидском заливе, созданная армией США.
Хранение в сравнении с консервацией
Хранить данные в цифровом формате легко, а вот сохранять их — нет. Сохранение подразумевает каталогизацию, доступность и возможность использования сохраненной информации на современных носителях, что требует постоянных усилий и затрат. Кроме того, в то время как современная информация имеет экономическую ценность и окупается, архивы не приносят прибыли, поэтому у создателей или первых сборщиков цифровой информации редко есть стимул — или навыки, или преемственность — сохранять свои материалы. Это задача для долгосрочных некоммерческих организаций, таких как библиотеки, университеты и государственные учреждения, у которых может быть или не быть полномочий и финансирования для выполнения этой работы. Архивариус Калифорнийского университета в Беркли Говард Бессер отмечает, что цифровые артефакты становится всё сложнее восстанавливать. Во-первых, возникает проблема с просмотром: книга сама себя демонстрирует, а содержимое компакт-диска невидимо, пока его не откроют на чём-то. Кроме того, существует проблема сжатия — бесчисленное множество способов сжатия файлов и всё более распространённое шифрование. Есть проблемы с взаимосвязями — гипертекстовые ссылки или ссылки на веб-сайты, которые были активны в оригинале, но теперь ведут в никуда. Проблемы с переводом возникают из-за различий в поведении разных медиа. Точно так же, как фотография картины — это не то же самое, что сама картина, просмотр через экран — это не то же самое, что погружение в среду, а просмотр игры — это не то же самое, что играть в неё. По всем этим причинам архивисты теперь рекомендуют снабжать все цифровые артефакты большим количеством «метаданных» — цифровой информацией об артефакте, которая рассказывает, что это такое и как оно работает. Ряд профессиональных организаций работает над созданием согласованных (и расширяемых) стандартов для метаданных. Постепенно формируется набор «лучших практик» для обеспечения цифровой преемственности: используйте наиболее распространенные форматы файлов, по возможности избегайте сжатия, ведите журнал изменений файла, используйте стандартные метаданные, делайте несколько копий и так далее.
И не забывайте об атомарном резервном копировании: хотя долговечность битов всё ещё под вопросом, атомы в составе чернил на бумаге обладают высокой стабильностью.
Сеть: убежище или ужас?
А что насчёт интернета? Туда можно сбросить всё, что угодно, оттуда можно получить всё, что угодно, и там появляются довольно универсальные стандарты, такие как TCP/IP. Там же появляются новые таланты. Интернет ответственен за легионы «эмуляторов», которые продолжают находить новые способы оживить старые игры, такие как Pac-Man и Frogger, для запуска на новых компьютерах. Народные архивисты, такие как эмуляторы, — это одна из обнадеживающих волн будущего. Массовое распространение подобных исследований может дать огромную силу. Другой пример: благодаря нынешнему интересу к семейной генеалогии тысячи пользователей программы под названием «Создание генеалогического древа» объединяют свои исследования в «Мировое генеалогическое древо» в интернете. На данный момент оно объединяет 75 000 генеалогических древ, в общей сложности 50 миллионов имен. Цель, которая когда-то казалась недостижимой, — в конечном счёте задокументировать и связать воедино всех людей, когда-либо живших на Земле. Благодаря сети сохранение данных становится фрактальным — бесконечно разветвлённым, а не централизованным. Но возникает вопрос: является ли сама сеть невероятно надёжной и бессмертной или же это самый эфемерный цифровой артефакт из всех? По словам веб-архивиста Брюстера Кейла, в настоящее время «память» интернета составляет около двух месяцев.
В чём же решение? Мы не можем отменить цифровизацию всего и вся. Что нам нужно сделать, так это изменить подход к разработке программного обеспечения: от хрупкого к отказоустойчивому, от безрассудного к ответственному, от ориентированного на прошлое к ориентированному на будущее. Это неразрешимые проблемы. Конечно, ни одну из них нельзя решить за год, но все они могут стать результатом десятилетий целенаправленной работы, если мы поймём, что на кону стоит здоровье цивилизации.
Мышление В Долгосрочной перспективе
«Настоящая проблема, — говорит разработчик компьютеров Хиллис, — не технологическая. У нас есть технические знания, чтобы решить такие проблемы, как цифровая деградация. Чего нам пока не хватает в нашей цифровой культуре, так это привычки к долгосрочному планированию, которая способствует сохранению... В начале 2000-х люди поймут, что мы находимся не в конце пути, а в его начале». На самом деле будут и 3000-й, и 4000-й, и так далее. Как только эта идея получит более широкое распространение, инженеры, которые думают о следующем цифровом носителе, естественно, задумаются о том, как долго он будет существовать....
Хиллис настроен более оптимистично, чем я. Я думаю, что для того, чтобы инженеры начали серьёзно относиться к проблеме долговечности цифровых носителей, библиотекам и архивам нужно будет настойчиво и аргументированно требовать этого. Если это произойдёт, то надежда библиотекаря Лаймана может оправдаться: «Я бы сказал, что нас мотивирует не только страх потерять то, что у нас есть, но и возможность построить что-то новое из этого цифрового мусора, который мы создали, — построить что-то действительно удивительное, что может стать такой же достопримечательностью нашей цивилизации, какой была Александрийская библиотека в древнем мире».
Комментарий
От Ника Рида
6-23-3
В статье Стюарта Брэнда подчеркивается важный, но часто упускаемый из виду аспект устаревания систем, которое в значительной степени обусловлено маркетингом поставщиков и делает большую часть текущей официальной истории практически невосстановимой в долгосрочной перспективе.
О чём говорят гораздо реже, хотя кто-то (не я) должен упоминать об этом на таких форумах, как ваш, так это о массовой краже личных данных, которая происходит в результате того же коррупционного процесса.
Хотя записи, которые наши бабушки и дедушки вели о своих мыслях и важных событиях в жизни, были немногочисленными и гораздо более ограниченными в плане восприятия, чем современные — рукописные дневники, чёрно-белые фотографии и т. д., — то, что они записывали во время ухаживаний, было легкодоступно, когда их внуки вступали во взрослую жизнь. Чем старше становятся люди, тем важнее для их удовлетворённости оказываются такие личные воспоминания. Но нынешнее цифровое поколение может рассчитывать на гораздо более скудный экскурс в прошлое, чем у их предков.