LINUX.ORG.RU
ФорумTalks

[либрусек]Помогите ему немножко


0

0

Чем разводить срач о том, кто и кому продался, когда по дефолту речь идет о новых книгах и даже анонимно можно качать чуть менее, чем все, не говоря уже о торрентах, лучше чуток помогли бы техническим советом главному:

В Talks, потому что тут не только технический вопрос и вообще обсуждение либрусека носит не технический характер.

Вопрос к линуксоидам

Как определить, берётся ли файл из кэша или с диска?

Точнее, нужен список файлов, за, скажем, час, которые читались с диска. Те, которые брались из кэша - не интересуют. (Да, я понимаю, что все файлы проходят через буфера. Нужны те, кто нагружают диск, как это не назови.) Из них буду выбирать, кого проще утащить на другой сервер. А то опять упёрлись в диск, прошлый раз помогло добавление нового, а третий в сервер уже не лезет. Значит файло уёдет на другую машину. Не знаю только, какое именно. В идеале - которое меняется редко, а читается часто, для упрощения синхронизации. Список открытых/прочитанных файлов я получил с помощью perl-Linux-Inotify2, но не могу понять, кто из них взят из кэша, а ради кого пришлось диск мучать. Можно, конечно, прикинуть из общих соображений, но что-то меня потянуло на системный подход.

http://lib.rus.ec/node/157533

И на закуску «За что я ненавижу XML» http://lib.rus.ec/node/157529 Это уже не о помощи речь идет, а видно что задолбался человек.

Наконец-то я смог сформулировать, за что я ненавижу XML. В применении к книгам, очевидно - прочие использования этого незаконнорождённого отпрыска пьяной макаки и запаршивевшего верблюда меня волнуют мало, хотя встречаться с конфигами, где ради одного значения надо написать четыре вложенных тега по полсотни символов тоже удовольствия мало. Да и типичный вебсайт по сути своей от книги мало отличается, а чисто флэшевые поделки лично мне не интересны. Так вот. Книга - это текст. Текст в книге главное. Есть ещё всякие рющечки, шрифты и прочие выделения, ссылки, сноски, заголовки и прочее. Я прекрасно это всё знаю, ценю и использую. Но всё-таки текст важнее разметки. Если испортится разметка - книга остаётся всё той же книгой, её можно будет читать, пусть чуть менее удобнее. Мысль автора не исказится. Если же испорчен текст ценой сохранения правильности разметки - книга испорчена. Ещё раз. Книга это текст c разметкой, причём текст первичен. Кажется, простая и очевидная мысль. Но не для всех. Во всяком случае не для придумщиков XML, чтоб им побыстрее переродиться престарелыми червями. В XML считается, что главное - разметка. Если среди мегабайта текста попадётся отдельно стоящий &, или там <, любой парсер сочтёт это куском тэга. Хотя на тэг это ни разу не похоже. И текст будет испорчен. Это абсолютно бредовый подход. За разметку можно принимать только то, что точно разметка. Встретили <p> - ну ладно, сочтём за тэг. Хотя сама по себе идея метить метаинформацию распространённым символами, да ещё и несколькими, запрещая их использовать Тексту, достойна пожизненной кастрации.

★★★★★

Про XML красиво и верно написал, правда, там ещё много чего помимо этого вспомнить можно.

P.S. Ждём адептов XML-я и срача в треде.

Ramen ★★★★
()

Понравилось про пожизненную кастрацию. Типа, кастрировать можно на пару лет, если заслужил :)

ЗЫ. По теме. Бред и высер.

vada ★★★★★
()

Бг - только давеча вот читал статью на межделмаше про будущее XML - говорилось, что оно как раз для публикаций и работе с текстом :)

h8 ★★★
()

Вторая цитата доставила своей фимозностью. Пожалуй, надо ее сохранить как копипасту для целей грязного троллинга.

Deleted
()
Ответ на: комментарий от Deleted

Фимозность фимозностью, но сказал ее практик, которому реально приходится разбираться с тысячами xml-файлов (fb2).

praseodim ★★★★★
() автор топика
Ответ на: комментарий от vada

> Понравилось про пожизненную кастрацию. Типа, кастрировать можно на пару лет, если заслужил :)

В ЕС есть такое для сексуальных преступников. Пока принимает таблетки — кастрирован, прекратил принимать — вернулся в норму.

question4 ★★★★★
()

Неосилятор XML'а детектед.

Deleted
()
Ответ на: комментарий от praseodim

У нас и в вебе то полно этих практиков. Что б им пусто было. HTML то не могут осилить, а уже на XML замахиваются.

Deleted
()

> отдельно стоящий &

&amp;

> или там <

&lt;

INFOMAN ★★★★★
()

> Книга это текст c разметкой, причём текст первичен

А разметка при этом должна быть однозначной, понятной и легко парситься. XML это обеспечивает. Больше от него ничего не требуется.

INFOMAN ★★★★★
()
Ответ на: комментарий от question4

>В ЕС есть такое для сексуальных преступников. Пока принимает таблетки — кастрирован, прекратил принимать — вернулся в норму.

Пруф?

Sectoid ★★★★★
()
Ответ на: комментарий от praseodim

> Фимозность фимозностью, но сказал ее практик, которому реально приходится разбираться с тысячами xml-файлов (fb2).

А зачем использовать fb2 для хранения книг?

sin_a ★★★★★
()
Ответ на: комментарий от isden

Он тоже несколько монструозненький, да и XHTML там, вроде :)

Deleted
()
Ответ на: комментарий от Deleted

> Т.е. что бы читать книжку надо латех поставить?

мисье читает xml в текстовом редакторе? мисье знает толк в извращениях.

Rastafarra ★★★★
()
Ответ на: комментарий от Deleted

> фиксированная ширина и шрефты.

одни это называют «дизайн», другие «правила оформления»... кстати даже госты кто-то придумывает. думаешь как обычно бабло пилят?

Rastafarra ★★★★
()
Ответ на: комментарий от h8

> А что вместо fb2 использовать? Просто интересно.

Мне очень нравится plain text, как у Мошкова.

Однако я понимаю, что не все могут разделять мой вкус.

sin_a ★★★★★
()
Ответ на: комментарий от Rastafarra

Скажем так, для целей хранения и чтения книг в электронной библиотеке, pdf - сильно НЕУДОБЕН. Пилят, не пилят деньги, но когда у тебя десятки тысяч книг, многое начинает по другому видеться.

Отчего-то же пришли к стандарту де-факто: научная литература в djvu, художественная в fb2. И чем им хороший pdf не угодил, что его оставляют только если книга была изначально в этом формате?

praseodim ★★★★★
() автор топика
Ответ на: комментарий от sin_a

> Мне очень нравится plain text, как у Мошкова.

Хорош только для хужожественных книг и то не всяких, иногда и рисунки встречаются или выделение текста, которых в plain text, естественно нет. А Мошков - молодец и герой за все что сделал, но вот, увы, даже utf-8 не осилил.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от Rastafarra

Распарсить xml очень просто и многие проги это умеют. Расскажи мне, как ты представляешь «парсинг» латеха без самого (огромного) латеха?

Deleted
()
Ответ на: комментарий от Rastafarra

Да пусть пилят, а у меня, понимаете ли, шрифт больше нужен на экране — зрение не позволяет читать мелкий и горизонтальный скролл мне там не нужен. ГОСТы пусть в живых книгах делают. Впрочем, и в них то в размере шрифта разброд.

Deleted
()
Ответ на: комментарий от Deleted

В смысле, я говорю о художественной литературе. Впрочем, PDF читать с экрана для любого содержимого очень неудобно.

Deleted
()
Ответ на: комментарий от Deleted

> у меня, понимаете ли, шрифт больше нужен на экране — зрение не позволяет читать мелкий и горизонтальный скролл мне там не нужен.

Блджад, да поставь ты себе нормальный полноэкранный просмотрощик с зумом и не плачь. Даже простейший фоксит ридер всё это может.

LamerOk ★★★★★
()
Ответ на: комментарий от Deleted

> зрение не позволяет читать мелкий и горизонтальный скролл мне там не нужен.

жаль тебя расстраивать, но каждый вьювер умеет шкалить фонты. сюрприз?

Rastafarra ★★★★
()
Ответ на: комментарий от Deleted

> PDF читать с экрана для любого содержимого очень неудобно.

прелесть какая. покажешь что-то лучше? понятно, что в книге может быть пачка картинок, формул, сложное форматирование, сноски и приличное оглавление. или ты хочешь читать <xml>plain text</xml>?

Rastafarra ★★★★
()
Ответ на: комментарий от Rastafarra

Reflow текста при этом происходит?

Deleted
()

Расскажите идиоту про lesser парсеры.

loveless
()

зачем книгам какие-то форматы, окромя plaintext?

художественное - plaintext, техническое - pdf и всем счастье, нет?

t184256 ★★★★★
()
Ответ на: комментарий от Deleted

В хтмл точно нет страниц. И каждый раз, когда браузер упал, иди ищи где остановился в прошлый раз.

У меня по собственному опыту, все книжки в пдф, сам перегонял :)

stave ★★★★★
()
Ответ на: комментарий от stave

>В хтмл точно нет страниц.

Ну есть же, в CSS для print и projection типов медиа.

http://www.w3.org/TR/CSS2/page.html

http://www.w3.org/TR/CSS2/media.html

http://www.opera.com/browser/tutorials/operashow/

> И каждый раз, когда браузер упал, иди ищи где остановился в прошлый раз.


Опера вроде на том же месте открывает, специально проверил. Впрочем, она и не падает сама обычно.

anonymfus ★★★★
()
Ответ на: комментарий от stave

В EPUB тот же HTML, правда XHTML. Есть закладки или нет, это уже от того, чем смотришь зависит :)

Deleted
()

Прально! хренить книги в JSON формате!

wfrr ★★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.