ну чтоб на яве.
Apache ODFDOM не нравится тем, что он не все разбирает. например если есть нумерованный список, то апачий getTextContent берет и склеивает элементы списка без разделителей. при этом тот же libreoffice все открывает корректно.
и вообще она с 11-го года вроде как не обновляется..?
бороться с либой --- это конечно да, но я бы предпочел подоткнуть другую. хочу просто получить текст из документа.