LINUX.ORG.RU

html2text, cp1251 и буква Я


0

0

Имеется тцать (около сотни) htm'ников в нехорошей кодировке cp1251. Хотелось бы их всем скопом переконвертировать в простой отформатированный текст, с целью чтения на наладоннике. Но, из за нехорошей кодировки сабж режет букву я, т.к. какой-то му..дрый индус повесил ей на код FF. Предварительное переконвертирование в другую кодировку делает только хуже - весь текст куда-то пропадает. Переконвертировать в транслит тоже не удастся, т.к. там есть примеры кода, естественно на латинице.

Что могут предложить уважаемые специалисты по всему?

Ответ на: комментарий от gaa

У мну LBook v3, там хоть и Lnux, но "искаробки" только cp1251

marsijanin ★★
() автор топика
Ответ на: комментарий от marsijanin

> Fnx. А как его заставить не печатать ссылки?

Там вроде был ключик типа --не-печатать-ссылки :) Ну или sed в руки и вперёд.

gaa ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.