[либрусек]Помогите ему немножко

0

0

Чем разводить срач о том, кто и кому продался, когда по дефолту речь идет о новых книгах и даже анонимно можно качать чуть менее, чем все, не говоря уже о торрентах, лучше чуток помогли бы техническим советом главному:

В Talks, потому что тут не только технический вопрос и вообще обсуждение либрусека носит не технический характер.

Вопрос к линуксоидам
Как определить, берётся ли файл из кэша или с диска?
Точнее, нужен список файлов, за, скажем, час, которые читались с диска. Те, которые брались из кэша - не интересуют. (Да, я понимаю, что все файлы проходят через буфера. Нужны те, кто нагружают диск, как это не назови.) Из них буду выбирать, кого проще утащить на другой сервер. А то опять упёрлись в диск, прошлый раз помогло добавление нового, а третий в сервер уже не лезет. Значит файло уёдет на другую машину. Не знаю только, какое именно. В идеале - которое меняется редко, а читается часто, для упрощения синхронизации. Список открытых/прочитанных файлов я получил с помощью perl-Linux-Inotify2, но не могу понять, кто из них взят из кэша, а ради кого пришлось диск мучать. Можно, конечно, прикинуть из общих соображений, но что-то меня потянуло на системный подход.

http://lib.rus.ec/node/157533

И на закуску «За что я ненавижу XML» http://lib.rus.ec/node/157529 Это уже не о помощи речь идет, а видно что задолбался человек.

Наконец-то я смог сформулировать, за что я ненавижу XML. В применении к книгам, очевидно - прочие использования этого незаконнорождённого отпрыска пьяной макаки и запаршивевшего верблюда меня волнуют мало, хотя встречаться с конфигами, где ради одного значения надо написать четыре вложенных тега по полсотни символов тоже удовольствия мало. Да и типичный вебсайт по сути своей от книги мало отличается, а чисто флэшевые поделки лично мне не интересны. Так вот. Книга - это текст. Текст в книге главное. Есть ещё всякие рющечки, шрифты и прочие выделения, ссылки, сноски, заголовки и прочее. Я прекрасно это всё знаю, ценю и использую. Но всё-таки текст важнее разметки. Если испортится разметка - книга остаётся всё той же книгой, её можно будет читать, пусть чуть менее удобнее. Мысль автора не исказится. Если же испорчен текст ценой сохранения правильности разметки - книга испорчена. Ещё раз. Книга это текст c разметкой, причём текст первичен. Кажется, простая и очевидная мысль. Но не для всех. Во всяком случае не для придумщиков XML, чтоб им побыстрее переродиться престарелыми червями. В XML считается, что главное - разметка. Если среди мегабайта текста попадётся отдельно стоящий &, или там <, любой парсер сочтёт это куском тэга. Хотя на тэг это ни разу не похоже. И текст будет испорчен. Это абсолютно бредовый подход. За разметку можно принимать только то, что точно разметка. Встретили <p> - ну ладно, сочтём за тэг. Хотя сама по себе идея метить метаинформацию распространённым символами, да ещё и несколькими, запрещая их использовать Тексту, достойна пожизненной кастрации.

Ссылка

←	Пиратская партия получила второе место в европарламенте

[Ubuntu] Cчастье недолго длилось...

→

← 1 2 →

Про XML красиво и верно написал, правда, там ещё много чего помимо этого вспомнить можно.

P.S. Ждём адептов XML-я и срача в треде.

Ramen ★★★★
(09.11.09 11:29:31 MSK)

Ссылка

Понравилось про пожизненную кастрацию. Типа, кастрировать можно на пару лет, если заслужил :)

ЗЫ. По теме. Бред и высер.

vada ★★★★★
(09.11.09 11:41:25 MSK)

Бг - только давеча вот читал статью на межделмаше про будущее XML - говорилось, что оно как раз для публикаций и работе с текстом :)

h8 ★★★
(09.11.09 11:47:50 MSK)

Ссылка

Вторая цитата доставила своей фимозностью. Пожалуй, надо ее сохранить как копипасту для целей грязного троллинга.

Deleted
(09.11.09 11:53:20 MSK)

Ответ на: комментарий от Deleted 09.11.09 11:53:20 MSK

Фимозность фимозностью, но сказал ее практик, которому реально приходится разбираться с тысячами xml-файлов (fb2).

praseodim ★★★★★
(09.11.09 12:03:12 MSK) автор топика

Ответ на: комментарий от vada 09.11.09 11:41:25 MSK

> Понравилось про пожизненную кастрацию. Типа, кастрировать можно на пару лет, если заслужил :)

В ЕС есть такое для сексуальных преступников. Пока принимает таблетки — кастрирован, прекратил принимать — вернулся в норму.

question4 ★★★★★
(09.11.09 12:41:48 MSK)

Неосилятор XML'а детектед.

Deleted
(09.11.09 13:00:14 MSK)

Ссылка

Ответ на: комментарий от praseodim 09.11.09 12:03:12 MSK

У нас и в вебе то полно этих практиков. Что б им пусто было. HTML то не могут осилить, а уже на XML замахиваются.

Deleted
(09.11.09 13:01:01 MSK)

Ссылка

> отдельно стоящий &

> или там <

INFOMAN ★★★★★
(09.11.09 13:21:30 MSK)

Ссылка

> Книга это текст c разметкой, причём текст первичен

А разметка при этом должна быть однозначной, понятной и легко парситься. XML это обеспечивает. Больше от него ничего не требуется.

INFOMAN ★★★★★
(09.11.09 13:24:55 MSK)

Ответ на: комментарий от question4 09.11.09 12:41:48 MSK

>В ЕС есть такое для сексуальных преступников. Пока принимает таблетки — кастрирован, прекратил принимать — вернулся в норму.

Пруф?

Sectoid ★★★★★
(09.11.09 13:37:18 MSK)

Ответ на: комментарий от Sectoid 09.11.09 13:37:18 MSK

в чехии такая хрень, погугли

~~z0D5e8n7x_2~~ ★
(09.11.09 14:12:20 MSK)

Ссылка

Ответ на: комментарий от praseodim 09.11.09 12:03:12 MSK

> Фимозность фимозностью, но сказал ее практик, которому реально приходится разбираться с тысячами xml-файлов (fb2).

А зачем использовать fb2 для хранения книг?

sin_a ★★★★★
(09.11.09 14:15:01 MSK)

Ответ на: комментарий от Sectoid 09.11.09 13:37:18 MSK

> Пруф?

погугли химическую кастрацию.

Rastafarra ★★★★
(09.11.09 14:22:41 MSK)

Ссылка

Ответ на: комментарий от sin_a 09.11.09 14:15:01 MSK

А что вместо fb2 использовать? Просто интересно.

h8 ★★★
(09.11.09 14:24:31 MSK)

Ответ на: комментарий от INFOMAN 09.11.09 13:24:55 MSK

> XML это обеспечивает.

для верстки книг это обеспечивает латех, не?

Rastafarra ★★★★
(09.11.09 14:24:53 MSK)

Ответ на: комментарий от h8 09.11.09 14:24:31 MSK

> А что вместо fb2 использовать?

пдф?

Rastafarra ★★★★
(09.11.09 14:25:26 MSK)

Ответ на: комментарий от Rastafarra 09.11.09 14:24:53 MSK

>книг
>латех

Т.е. что бы читать книжку надо латех поставить? Суров.

Deleted
(09.11.09 14:32:48 MSK)

Ответ на: комментарий от Rastafarra 09.11.09 14:25:26 MSK

За пдф расстреливать — читать неудобно, фиксированная ширина и шрефты.

Deleted
(09.11.09 14:33:19 MSK)

Ответ на: комментарий от Deleted 09.11.09 14:33:19 MSK

И да, копипаста с пдфа тоже Г.

Deleted
(09.11.09 14:33:40 MSK)

Ссылка

Ответ на: комментарий от h8 09.11.09 14:24:31 MSK

> А что вместо fb2 использовать? Просто интересно.

epub же!

isden ★★★★★
(09.11.09 14:33:53 MSK)

Ответ на: комментарий от isden 09.11.09 14:33:53 MSK

Он тоже несколько монструозненький, да и XHTML там, вроде :)

Deleted
(09.11.09 14:40:08 MSK)

Ссылка

Ответ на: комментарий от Deleted 09.11.09 14:32:48 MSK

> Т.е. что бы читать книжку надо латех поставить?

мисье читает xml в текстовом редакторе? мисье знает толк в извращениях.

Rastafarra ★★★★
(09.11.09 14:43:48 MSK)

Ответ на: комментарий от Deleted 09.11.09 14:33:19 MSK

> фиксированная ширина и шрефты.

одни это называют «дизайн», другие «правила оформления»... кстати даже госты кто-то придумывает. думаешь как обычно бабло пилят?

Rastafarra ★★★★
(09.11.09 14:45:38 MSK)

Ответ на: комментарий от Deleted 09.11.09 14:33:19 MSK

Бгг, pdf - это стандарт технической документации.
OMG, и чего тока на лоре не узнаешь ...

~~elipse~~ ★★★
(09.11.09 14:49:54 MSK)

Ответ на: комментарий от h8 09.11.09 14:24:31 MSK

> А что вместо fb2 использовать? Просто интересно.

Мне очень нравится plain text, как у Мошкова.

Однако я понимаю, что не все могут разделять мой вкус.

sin_a ★★★★★
(09.11.09 14:50:03 MSK)

Ответ на: комментарий от Rastafarra 09.11.09 14:45:38 MSK

Скажем так, для целей хранения и чтения книг в электронной библиотеке, pdf - сильно НЕУДОБЕН. Пилят, не пилят деньги, но когда у тебя десятки тысяч книг, многое начинает по другому видеться.

Отчего-то же пришли к стандарту де-факто: научная литература в djvu, художественная в fb2. И чем им хороший pdf не угодил, что его оставляют только если книга была изначально в этом формате?

praseodim ★★★★★
(09.11.09 14:51:14 MSK) автор топика

Ответ на: комментарий от sin_a 09.11.09 14:50:03 MSK

> Мне очень нравится plain text, как у Мошкова.

Хорош только для хужожественных книг и то не всяких, иногда и рисунки встречаются или выделение текста, которых в plain text, естественно нет. А Мошков - молодец и герой за все что сделал, но вот, увы, даже utf-8 не осилил.

praseodim ★★★★★
(09.11.09 14:54:50 MSK) автор топика

Ссылка

Ответ на: комментарий от praseodim 09.11.09 14:51:14 MSK

> научная литература в djvu

ух ё... дай пару линков, где принимают статью в дежавю для журналов, а?

Rastafarra ★★★★
(09.11.09 14:55:00 MSK)

Ответ на: комментарий от Rastafarra 09.11.09 14:55:00 MSK

статьи, конечно.

Rastafarra ★★★★
(09.11.09 14:56:57 MSK)

Ссылка

Ответ на: комментарий от Rastafarra 09.11.09 14:43:48 MSK

Распарсить xml очень просто и многие проги это умеют. Расскажи мне, как ты представляешь «парсинг» латеха без самого (огромного) латеха?

Deleted
(09.11.09 15:08:45 MSK)

Ссылка

Ответ на: комментарий от Rastafarra 09.11.09 14:45:38 MSK

Да пусть пилят, а у меня, понимаете ли, шрифт больше нужен на экране — зрение не позволяет читать мелкий и горизонтальный скролл мне там не нужен. ГОСТы пусть в живых книгах делают. Впрочем, и в них то в размере шрифта разброд.

Deleted
(09.11.09 15:09:49 MSK)

Ответ на: комментарий от elipse 09.11.09 14:49:54 MSK

???

>стандарт технической документации
>книги

WTF?

Deleted
(09.11.09 15:10:20 MSK)

Ответ на: комментарий от Deleted 09.11.09 15:10:20 MSK

В смысле, я говорю о художественной литературе. Впрочем, PDF читать с экрана для любого содержимого очень неудобно.

Deleted
(09.11.09 15:13:44 MSK)

Ответ на: комментарий от Deleted 09.11.09 15:09:49 MSK

> у меня, понимаете ли, шрифт больше нужен на экране — зрение не позволяет читать мелкий и горизонтальный скролл мне там не нужен.

Блджад, да поставь ты себе нормальный полноэкранный просмотрощик с зумом и не плачь. Даже простейший фоксит ридер всё это может.

LamerOk ★★★★★
(09.11.09 15:42:10 MSK)

Ответ на: комментарий от Deleted 09.11.09 15:09:49 MSK

> зрение не позволяет читать мелкий и горизонтальный скролл мне там не нужен.

жаль тебя расстраивать, но каждый вьювер умеет шкалить фонты. сюрприз?

Rastafarra ★★★★
(09.11.09 16:24:03 MSK)

Ответ на: комментарий от Deleted 09.11.09 15:13:44 MSK

> PDF читать с экрана для любого содержимого очень неудобно.

прелесть какая. покажешь что-то лучше? понятно, что в книге может быть пачка картинок, формул, сложное форматирование, сноски и приличное оглавление. или ты хочешь читать <xml>plain text</xml>?

Rastafarra ★★★★
(09.11.09 16:28:31 MSK)

Ответ на: комментарий от Rastafarra 09.11.09 16:28:31 MSK

Даже в HTML читать проще, чем в PDF.

Deleted
(09.11.09 17:43:09 MSK)

Ответ на: комментарий от LamerOk 09.11.09 15:42:10 MSK

>Блджад

НДБ.

Deleted
(09.11.09 17:43:23 MSK)

Ответ на: комментарий от Rastafarra 09.11.09 16:24:03 MSK

Reflow текста при этом происходит?

Deleted
(09.11.09 17:44:21 MSK)

Ссылка

Ответ на: комментарий от Deleted 09.11.09 17:43:09 MSK

>Даже в HTML читать проще, чем в PDF.

Толсто :)

stave ★★★★★
(09.11.09 18:25:48 MSK)

Ответ на: комментарий от stave 09.11.09 18:25:48 MSK

Да нет, это по собственному опыту :) По крайней мере если он не фиксированной ширины.

Deleted
(09.11.09 18:38:17 MSK)

Расскажите идиоту про lesser парсеры.

loveless
(09.11.09 19:27:11 MSK)

Ссылка

зачем книгам какие-то форматы, окромя plaintext?

художественное - plaintext, техническое - pdf и всем счастье, нет?

t184256 ★★★★★
(09.11.09 20:40:08 MSK)

Ссылка

Ответ на: комментарий от Deleted 09.11.09 18:38:17 MSK

В хтмл точно нет страниц. И каждый раз, когда браузер упал, иди ищи где остановился в прошлый раз.

У меня по собственному опыту, все книжки в пдф, сам перегонял :)

stave ★★★★★
(09.11.09 21:33:36 MSK)

Ответ на: комментарий от stave 09.11.09 21:33:36 MSK

>В хтмл точно нет страниц.

Ну есть же, в CSS для print и projection типов медиа.

http://www.w3.org/TR/CSS2/page.html

http://www.w3.org/TR/CSS2/media.html

http://www.opera.com/browser/tutorials/operashow/

> И каждый раз, когда браузер упал, иди ищи где остановился в прошлый раз.

Опера вроде на том же месте открывает, специально проверил. Впрочем, она и не падает сама обычно.