[либрусек]Помогите ему немножко

0

0

Чем разводить срач о том, кто и кому продался, когда по дефолту речь идет о новых книгах и даже анонимно можно качать чуть менее, чем все, не говоря уже о торрентах, лучше чуток помогли бы техническим советом главному:

В Talks, потому что тут не только технический вопрос и вообще обсуждение либрусека носит не технический характер.

Вопрос к линуксоидам
Как определить, берётся ли файл из кэша или с диска?
Точнее, нужен список файлов, за, скажем, час, которые читались с диска. Те, которые брались из кэша - не интересуют. (Да, я понимаю, что все файлы проходят через буфера. Нужны те, кто нагружают диск, как это не назови.) Из них буду выбирать, кого проще утащить на другой сервер. А то опять упёрлись в диск, прошлый раз помогло добавление нового, а третий в сервер уже не лезет. Значит файло уёдет на другую машину. Не знаю только, какое именно. В идеале - которое меняется редко, а читается часто, для упрощения синхронизации. Список открытых/прочитанных файлов я получил с помощью perl-Linux-Inotify2, но не могу понять, кто из них взят из кэша, а ради кого пришлось диск мучать. Можно, конечно, прикинуть из общих соображений, но что-то меня потянуло на системный подход.

http://lib.rus.ec/node/157533

И на закуску «За что я ненавижу XML» http://lib.rus.ec/node/157529 Это уже не о помощи речь идет, а видно что задолбался человек.

Наконец-то я смог сформулировать, за что я ненавижу XML. В применении к книгам, очевидно - прочие использования этого незаконнорождённого отпрыска пьяной макаки и запаршивевшего верблюда меня волнуют мало, хотя встречаться с конфигами, где ради одного значения надо написать четыре вложенных тега по полсотни символов тоже удовольствия мало. Да и типичный вебсайт по сути своей от книги мало отличается, а чисто флэшевые поделки лично мне не интересны. Так вот. Книга - это текст. Текст в книге главное. Есть ещё всякие рющечки, шрифты и прочие выделения, ссылки, сноски, заголовки и прочее. Я прекрасно это всё знаю, ценю и использую. Но всё-таки текст важнее разметки. Если испортится разметка - книга остаётся всё той же книгой, её можно будет читать, пусть чуть менее удобнее. Мысль автора не исказится. Если же испорчен текст ценой сохранения правильности разметки - книга испорчена. Ещё раз. Книга это текст c разметкой, причём текст первичен. Кажется, простая и очевидная мысль. Но не для всех. Во всяком случае не для придумщиков XML, чтоб им побыстрее переродиться престарелыми червями. В XML считается, что главное - разметка. Если среди мегабайта текста попадётся отдельно стоящий &, или там <, любой парсер сочтёт это куском тэга. Хотя на тэг это ни разу не похоже. И текст будет испорчен. Это абсолютно бредовый подход. За разметку можно принимать только то, что точно разметка. Встретили <p> - ну ладно, сочтём за тэг. Хотя сама по себе идея метить метаинформацию распространённым символами, да ещё и несколькими, запрещая их использовать Тексту, достойна пожизненной кастрации.

Ссылка

←	Пиратская партия получила второе место в европарламенте

[Ubuntu] Cчастье недолго длилось...

→

← 1 2 →

Ответ на: комментарий от LamerOk 09.11.09 22:06:43 MSK

Увы, мир не идеален.

stave ★★★★★
(10.11.09 00:35:46 MSK)

Ссылка

Ответ на: комментарий от anonymfus 09.11.09 21:47:01 MSK

>Ну есть же, в CSS для print и projection типов медиа.

может оно и есть, но я его не видел.

>Опера вроде на том же месте открывает, специально проверил. Впрочем, она и не падает сама обычно.

а хром не открывает :/

stave ★★★★★
(10.11.09 00:36:39 MSK)

Ссылка

Ответ на: комментарий от Rastafarra 09.11.09 14:55:00 MSK

> ух ё... дай пару линков, где принимают статью в дежавю для журналов, а?

Причем тут статьи для журналов, если мы говорим об электронных библиотеках? А там, почему-то сплошь djvu для нехудожественной литературы, и чего это они, по твоему дурью маются?

praseodim ★★★★★
(10.11.09 10:34:18 MSK) автор топика

Ссылка

Меня там нет, т.ч. пусть кто-нибудь передаст, что есть другой способ. Из лога сервера взять время обслуживания запроса (и, вероятно, разделить на размер файла, если очень разные). Если проигнорировать возможные тонкие оптимизации, оно состоит из времени обработки «кешированных» файлов и работы дисков. Первое более-менее предсказуемо по экспериментальным данным (±занятость процессоров, своп, и пр. тоже учитываемые вещи), т.ч. всё, что больше «второе». Если диски переружены, разница будет очень заметна, т.ч. гадать не придётся.

Итого, можно просто суммировать время/размер, кто больше — тот и плохой.

DonkeyHot ★★★★★
(10.11.09 11:22:39 MSK)

Ссылка

Ответ на: комментарий от stave 09.11.09 21:33:36 MSK

В хтмл точно нет страниц. И каждый раз, когда браузер упал, иди ищи где остановился в прошлый раз.

современные браузеры запоминают где ты остановился, не?

drull ★☆☆☆
(10.11.09 15:22:19 MSK)

Господи! Куда же катится мир, а? Мы на всех парах летим в digital dark age. И чем дальше, тем больше мне кажется, что спасет нас только оголтелый технофашизм...

Полное непонимание принципов... Полное незнание истории... Причем как категорично, прям как Шариков.

Для дебилов: юзайте православный ASN.1. "А когда надоест" - юзайте XML.

Macil ★★★★★
(10.11.09 15:35:48 MSK)