Чем разводить срач о том, кто и кому продался, когда по дефолту речь идет о новых книгах и даже анонимно можно качать чуть менее, чем все, не говоря уже о торрентах, лучше чуток помогли бы техническим советом главному:
В Talks, потому что тут не только технический вопрос и вообще обсуждение либрусека носит не технический характер.
Вопрос к линуксоидам
Как определить, берётся ли файл из кэша или с диска?
Точнее, нужен список файлов, за, скажем, час, которые читались с диска. Те, которые брались из кэша - не интересуют. (Да, я понимаю, что все файлы проходят через буфера. Нужны те, кто нагружают диск, как это не назови.) Из них буду выбирать, кого проще утащить на другой сервер. А то опять упёрлись в диск, прошлый раз помогло добавление нового, а третий в сервер уже не лезет. Значит файло уёдет на другую машину. Не знаю только, какое именно. В идеале - которое меняется редко, а читается часто, для упрощения синхронизации. Список открытых/прочитанных файлов я получил с помощью perl-Linux-Inotify2, но не могу понять, кто из них взят из кэша, а ради кого пришлось диск мучать. Можно, конечно, прикинуть из общих соображений, но что-то меня потянуло на системный подход.
И на закуску «За что я ненавижу XML» http://lib.rus.ec/node/157529 Это уже не о помощи речь идет, а видно что задолбался человек.
Наконец-то я смог сформулировать, за что я ненавижу XML. В применении к книгам, очевидно - прочие использования этого незаконнорождённого отпрыска пьяной макаки и запаршивевшего верблюда меня волнуют мало, хотя встречаться с конфигами, где ради одного значения надо написать четыре вложенных тега по полсотни символов тоже удовольствия мало. Да и типичный вебсайт по сути своей от книги мало отличается, а чисто флэшевые поделки лично мне не интересны. Так вот. Книга - это текст. Текст в книге главное. Есть ещё всякие рющечки, шрифты и прочие выделения, ссылки, сноски, заголовки и прочее. Я прекрасно это всё знаю, ценю и использую. Но всё-таки текст важнее разметки. Если испортится разметка - книга остаётся всё той же книгой, её можно будет читать, пусть чуть менее удобнее. Мысль автора не исказится. Если же испорчен текст ценой сохранения правильности разметки - книга испорчена. Ещё раз. Книга это текст c разметкой, причём текст первичен. Кажется, простая и очевидная мысль. Но не для всех. Во всяком случае не для придумщиков XML, чтоб им побыстрее переродиться престарелыми червями. В XML считается, что главное - разметка. Если среди мегабайта текста попадётся отдельно стоящий &, или там <, любой парсер сочтёт это куском тэга. Хотя на тэг это ни разу не похоже. И текст будет испорчен. Это абсолютно бредовый подход. За разметку можно принимать только то, что точно разметка. Встретили <p> - ну ладно, сочтём за тэг. Хотя сама по себе идея метить метаинформацию распространённым символами, да ещё и несколькими, запрещая их использовать Тексту, достойна пожизненной кастрации.