LINUX.ORG.RU
ФорумTalks

Постепенное пропадание информации в интернете на примере Ha

 ,


1

1

Есть мнение, что все что в интернет попало, то навсегда. Но на практике это далеко не так, даже не считая случаев когда инфа выпиливается по суду, кучи сайтов закрываются и накрывается все что там было.

Конкретный пример. Понадобилось мне прочитать пару архивов в формате Ha. Если кто не в курсе - это такой ныне призабытый, но в 90-е годы довольно популярный архиватор, написанный Harry Hirvola, использующий довольно продвинутый алгоритм сжатия. Особенно популярен был среди разных bbs-ок для текстовых коллекций. По степени сжатия текстовых файлов был тогда лидером и даже сейчас мало кто лучше сожмет.

Ну и вот, столкнулся с тем, что в текущем debian пакета нет. Был на alioth.debian.org но alioth недавно дебиановцы прикрыли. Поиски исходников привели на закрытые проекты на гитхабе, на то ли закрытый, то ли ушедший в даун сервер ftp://sunsite.unc.edu/pub/Linux/utils/compress где вроде и была изначальная страница порта Ha на unix-системы.

В итоге я все-таки нашел на левом сайте среди залежей разного старого софта в том числе и ha и даже с исходниками 1995-го года. После исправления там одной ошибки, из-за которой они не компилировались, даже нормально заработало и архив был успешно открыт.

Информация не пропала? С одной стороны да. С другой она уже потребовала заметных усилий по поиску и это для штуки, которая когда-то валялась чуть ли не везде.

Такая вот история.

★★★★★
Ответ на: комментарий от nerfur

Он больше внешний вид сайтов сохраняет, скачать оттуда архивы с исходниками чего-то уже обычно не удается.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от BMX

для софта нет такого

Поэтому надо выкладывать сорцы, а потом проходиться по ним ботом архива. Простой текст он все же самый живучий и удобоваримый.

entefeed ☆☆☆
()
Ответ на: комментарий от sergej

post-factum в 2015 тоже пилил, правда пакет тоже протух и исходники недоступны.

Ну вот и по твоей ссылке как раз пост-фактумовский пакет с Upstream URL: https://github.com/pfactum/ha протух. В смысле исходников через git clone https://aur-dev.archlinux.org/ha-archiver.git не получишь.

Такой вот прикол, что исходники Ha уже надо суметь нарыть, я сумел, но без помощи гугла, просто вспомнил сайт с залежами старого софта и поискал там наудачу. А вот через гугл как-то сходу даже и не вышло.

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: Минута гуглинга и... от Deleted

Даже собирается и работает:

$ ./ha --help
HA 0.999� Copyright (c) 1995 Harri Hirvola

 usage : HA <cmd> archive [files]
 examples : ha a21r foo /bar/* , ha l foo , ha xy foo

 commands :
   a[sdqemr012] - Add files      d[q]         - Delete files
   e[aqty]      - Extract files  f[sdqemr012] - Freshen files
   l[f]         - List files     t[q]         - Test files
   u[sdqemr012] - Update files   x[aqty]      - eXtract files with pathnames

 switches :
   0,1,2  - try method (0-CPY,1-ASC,2-HSC)
   t      - Touch files          r      - Recurse subdirs
   f      - Full listing         y      - assume Yes on all questions
   m      - Move files           a      - set system specific file Attributes
   e      - Exclude pathnames    s      - find Special files
   q      - Quiet operation      d      - make Directory entries

Type "ha h | more" to get more information about HA.

Deleted
()
Ответ на: Минута гуглинга и... от Deleted

Интересно, а это что такое? Это не stable - в stable у меня ha не находится.

Но смысл именно в постепенном пропадании, пока что найти пакеты все же можно.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от Deleted

Даже собирается и работает:

Ну вот кстати твой вариант так просто не собирается.

 /bin/sh: 1: cd: can't cd to c
Makefile:37: recipe for target 'subdirs' failed

А все потому что в оригинальных исходниках был каталог С, а в этом пакете из него все файлы вывалили в общий, но makefile не поправили.

В моем была ошибка из-за

#ifdef OS2
/* MODIFICATION: strcmp replaced by stricmp for OS/2 */
	    if (!stricmp(md_strcase(hd->path),newhdr.path) && 
		!stricmp(md_strcase(hd->name),newhdr.name)) {
#else
            if (!strcmp(md_strcase(hd->path), newhdr.path) &&
                !stricmp(md_strcase(hd->name),newhdr.name)) {

Пришлось заменить в #else на strcmp, по смыслу комментария она только для os/2, без этого линковщик не мог найти stricmp и валился. Интересно, как ему удавалось тогда собирать под linux, если верить readme? Или в архив пошло с ошибкой. Или тогда в glibc имелся stricmp...

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 2)
Ответ на: комментарий от Deleted

Меня прикалывает, что этого нельзя понять из текста ссылки.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от BMX

для софта нет такого

Software Heritage archive. Там бета, поиск слабый (только по URL) да и индексирует он пока только git репозитории. Но вот люди пытаются.

xaizek ★★★★★
()

Есть мнение, что все что в интернет попало, то навсегда

это было ещё до того, как человечество прожило с интернетом более четверти века.

system-root ★★★★★
()

Пойти что-ли limit поискать? ;-)

atrus ★★★★★
()

А UHA не его продолжение часом? А то я тоталкоммандером понажимал когда-то, а теперь думаю, не ССЗБ ли. Тем более, жмёт он немногим сильнее других, но раз в 10 медленнее.

bodqhrohro_promo
()

а ещё у нас недостаточно египтологов, чтобы прочитать все глиняные таблички. но в целом мир особо от этого не страдает :)

Iron_Bug ★★★★★
()

Постепенное пропадание информации в интернете

Есть такая проблема.

на примере Ha

Но не в этом случае. Если в Debian был пакет, значит, он есть в сборнике всех версий всех пакетов https://snapshot.debian.org/package/${SOURCE_PACKAGE_NAME}/ (не забыть последний слеш). Т.е.: https://snapshot.debian.org/package/ha/. Дальше - выбрать версию по усмотрению.

gag ★★★★★
()
Ответ на: комментарий от praseodim

Пришлось заменить в #else на strcmp, по смыслу комментария она только для os/2, без этого линковщик не мог найти stricmp и валился.

А лучше на strcasecmp (compare two strings ignoring case).

gag ★★★★★
()

alioth.debian.org

Кстати, а никто не в курсе, все-ли проекты оттуда переехали на новые хостинги ? А то тот-же fakeroot переезжал на сальсу почти неделю вроде (если не путаю).

А так да, в интернетах время от времени данные пропадают, увы.

DawnCaster ★★
()

Есть мнение, что все что в интернет попало, то навсегда

ИМХО, это мнение тех, кто про Интернет только из книжек и ТВ знает :) Любой, кто искал хоть раз информацию старше, ну, где-то, 5 лет, знает, как велика доля безвозвратной пропажи.

Информация не пропала? С одной стороны да.

Это не пропажа. С любой стороны. А вот сколько всего безвозвратно именно пропало за те же 5, а особенно за 10 лет…

KRoN73 ★★★★★
()
Ответ на: комментарий от bodqhrohro_promo

А UHA не его продолжение часом? А то я тоталкоммандером понажимал когда-то, а теперь думаю, не ССЗБ ли. Тем более, жмёт он немногим сильнее других, но раз в 10 медленнее.

Верно. Не стоит пользоваться всякой экзотикой. Есть распространённые алгоритмы deflate, lzma ну может zstd, он довольно крут и везде проникает, есть распространённые форматы типа tar.gz, zip, tar.xz, tar.lz (экзотика немного но специально для длительного хранения и тот же lz умеет это распаковывать при желании), 7z

Xenius ★★★★★
()
Ответ на: комментарий от Deleted

Нет, это вашем линуксе всё пропадает каждую пятилетку.
Шо макинтош, шо винда - на каждом углу старье раздаётся.

Deleted
()

Это мнение надо ппривязывать к контексту. Оно не о том что информация не пропадет а о том, что вы не можете объективно контроллировать её дальнейшее распространение.

Nastishka ★★★★★
()
Ответ на: комментарий от dikiy

В Ubuntu 16.04 это есть. А с 18.04 уже выкинули.

ЗЫ: Хотя это опять же к отсылке к неадекватности автора об трудности поиска исходников. Найти проще простого.

fornlr ★★★★★
()
Последнее исправление: fornlr (всего исправлений: 1)

даже не считая случаев когда инфа выпиливается по суду

Вот «выпилить по суду» - лучший способ сохранить информацию в интернете надолго

TheAnonymous ★★★★★
()

В конце 1990-х Максим Мошков уже вывел «время полураспада веб-ресурса». Вот точную величину не помню, по-моему он писал про 5 лет.

question4 ★★★★★
()
Ответ на: комментарий от Iron_Bug

а ещё у нас недостаточно египтологов, чтобы прочитать все глиняные таблички.

А все тебе прочитать и не дадут, сначала местные специалисты просмотрят находки, а потом решат, следует ли их кому показывать или может лучше на переработку пустить.

Napilnik ★★★★★
()

Обычное расширение пространства. Как лежал этот ha на паре говносайтов со старыми программами раньше, так и лежит, просто информационное пространство между вами расширилось и теперь не так-то просто туда попасть.
Причем скорость расширения пространства растет и со временем эти части пространства будут отдалятся все-быстрее и быстрее, следовательно достичь их будет сложнее.

Tark ★★
()
Ответ на: комментарий от Napilnik

Если у местных специалистов хватает мозгов отличить табличку с древними секретами не подлежащими огласке от рецепта древнего супа из брюквы, то получается древние египтяне никуда не девались, раз эти специалисты владеют всей полнотой информации.

Tark ★★
()
Ответ на: комментарий от Tark

Обычное расширение пространства. Как лежал этот ha на паре говносайтов со старыми программами раньше, так и лежит, просто информационное пространство между вами расширилось и теперь не так-то просто туда попасть.

Вот как раз с этой пары сайтов он и исчез, вернее сами сайты исчезли.

Еще недавно была тема про исчезновение изначального источника исходников для bzip2

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от fornlr

ЗЫ: Хотя это опять же к отсылке к неадекватности автора об трудности поиска исходников. Найти проще простого.

Я нашел исходники, и даже не сильно упарился при этом. Логично, что в теме подсказали кучку вариантов. Все так, но найти стало определенно сложнее и я это почувствовал, вот в чем суть.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от post-factum

Действительно логично, но не пришло в голову. С Ha еще такой момент, что это название хорошо перекрывается другими терминами. Поэтому искать лучше по имени автора.

Между прочим, просто интересно, а зачем ты перевел сборку на cmake, просто захотелось или какой-то есть программистский смысл? Там вроде уже был готовы обычный makefile даже без особых зависимостей.

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 1)

Можно было бы ещё на крайний случай поспрашивать на форумах, вдруг у кого из старых пердуновветеранов завалялось на дискетах в шкафу, и они бы повторно выложили

Harald ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.