LINUX.ORG.RU

По каким критериям резать? Надо ли на выходе получать well-formed/valid XML?

Скорее всего, кури XPath и XSLT.

anonymous
()

есть многое на свете, друг горацио, что и не снилось нашим мудрецам

chg ★★★★★
()
Ответ на: комментарий от anonymous

Надо ли на выходе получать well-formed/valid XML?

Да. Допустим порезать между тегами 2 уровня вложенности.

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от Suntechnic

Подозреваю тебе прийдется сделать это «аналитически». Используя любую библиотеку считывать, зная формат определять в место разрыва (зная формат его можно определить), например если дерево двухуровневое, можно складывать ~50% тегов в один файл и 50% в другой, дублируя корень. Не думаю что есть универсальный инструмент для такого. Это же как резать без рентгена.

trashymichael ★★★
()

Резать можно так. Инструментарий - любой редактор.

<?xml version="1.0" encoding="ISO-8859-1"?>

<!DOCTYPE project [
  <!ENTITY misc SYSTEM "file:./build/misc.xml">
  <!ENTITY design SYSTEM "file:./build/design.xml">
  <!ENTITY design-client SYSTEM "file:./build/design-client.xml">
  <!ENTITY design-netclient SYSTEM "file:./build/design-netclient.xml">
  <!ENTITY design-zclient SYSTEM "file:./build/design-zclient.xml">
]>

<project>
    <name>design-custom</name>

&misc;
&design;
&design-client;
&design-netclient;
&design-zclient;

</project>

vtVitus ★★★★★
()
Ответ на: комментарий от Suntechnic

Чего именно не понял?
В моём примере, xml файл собирается из 5 частей, которые я вынес в отдельные файлы в папку build. Использован был чудо редактор руки + notepad++, на разделку ушло 5 минут, на 20 частей уйдет 20 минут.
Если вам чего-то другого надо, то вопроса я тогда не понял.

vtVitus ★★★★★
()
Ответ на: комментарий от vtVitus

Ну сам-то синтаксис понятен. Ну это мне. А кто его еще понимает?

Я вообще порезал сплитом, а потом просто добавил недостающие части в начало и в конец в каждом файле. Так что-то же минут 20 ушло. Правда не notepad++ а geany

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от trashymichael

Ну почему же... Можно же легко найти токен по которому резать. Это первый который встречается более одного раза.

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от Suntechnic

А кто его еще понимает?

Должны все парсеры xml, апачевские точно понимают.

vtVitus ★★★★★
()
Ответ на: комментарий от trashymichael

это бред,

Нет.

а если структура не двухуровневая?

Ну и что? Приведи как пример как это может помешать?

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от Suntechnic

если это должно быть 2 половины без намека на валидность, че б не разбить их по-байтово? структуру ты и сам можешь придумать, вот тебе намек:

<foo>
    <bar>
        <foo> 
            <bar>
            </bar>
        </foo>
    </bar>
</foo>

trashymichael ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.