пересохраняем odt в rtf с помощью либреофиса. файл без изображения - 80кб, со вставленным jpg изображением в 100кб - 5,28Мб. Это из-за того, что в rtf изображения не сжатые вставляются, что-то типа bmp.
В файле видим изображение в виде большого текстового блока, в котором много раз повторяется буква f, в основном от 80 до 120 раз подряд. По поводу замены повторяющегося символа нашел только совет http://stackoverflow.com/a/4532759 однако замена 20 f подряд на f[20] не помогла - файл стал меньше размером, но побился - изображение пропало.
Спецификация есть вот тут http://www.boumphrey.com/rtf/rtfspec.pdf но она мне не помогла, не нашел, куда смотреть.
Вопрос - как правильно заменить повторяющиеся символы, чтобы файл нормально открывался?
Перемещено post-factum из talks