Разрабатываю свой формат (на основе XML) для хранения аннотации к данным, которые получены с экспериментальной установки. Возникла проблема: файлы получаются слишком большими, в них 98% составляют однотипные строчки вида: <block time=«1000» size=«1000» offset=«0» marks=«» comment=«»/>, которых может быть тысячи. В год будут записываться несколько тысяч новых файлов.
Сейчас я думаю сделать хранение таких участков в виде «delimiter-separated values» для разделения значений использовать специально предназначенные для этого символы (U+001F, U+001E).
Хотелось бы узнать мнение знающих людей по поводу такого компромиссного полу-XML-полу-не-XML формата. Или если все совсем плохо, то какие есть альтернативы?