LINUX.ORG.RU

конвертилка нада..


0

0

короче есть почти простой текст в анси-формате, полученный из хтмл (c lib.ru) путем SaveAs в Мозилле.. Как выяснилось, в нем куча вских невидимых символов, переносов и прочей гадости.. Чем быстро/удобно его сконвертить в такой текст, чтоб азацы были одной строкой...??

thnx

anonymous

А надо было его сохранить как html и не трахаться. А вообще все, что с lib.ru качается прекрасно любым даунлоадером и тоже без символов.

jackill ★★★★★
()

дык говорю ж - текст надо, простой текст.. _Не хтмл_

anonymous
()

Дык потом бы скопировал нужный тебе текст из хтмлника и вставил в любой редактор текстовый - мало их что ли...

YagMort ★★
()

lynx --dump aaa.html > aaa.txt

kraw ★★★★
()

А ты внутрь бы зашел - там у каждой книги от html шапка и концовка, а все остальное в pre забито. Это обычный текст.

jackill ★★★★★
()

> А ты внутрь бы зашел - там у каждой книги от html шапка и концовка,
а все остальное в pre забито. Это обычный текст.

да текст, но! нужен реально playn text, т.е. _без переносов_ - переносы (разбивка) строки допускается только между абзацами. Каждый абзац - это неразрывная строка.

А вот теперь, если глянуть в то, что получается в результате SaveAs всяких мозил, опер и "links -dump", то можно увидеть, что там текст выровнен, что есть крутой гимор при преобразовании текста во всякие lyx, latex и прочие Weasel (для Пальм) форматы..

Неужели непонятно о чем я?!

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.