Какие существуют открытые форматы баз звуков? База звуков должна уметь хранить тыщи мелких звуковых файлов с UTF-8 именем для каждого.
Юзер отмечает звуки в разных звуковых треках на текстовых треках ( http://audigger.sourceforge.net/img/screenshot-ru-1-jpg.jpg ). Затем он запускает «экспорт» и получает набор звуков с сопоставлением им UTF-8 имён.
Как хранить такой набор звуков?
Это необязательно семплы: под семплом обычно понимается привязка звука к ноте или какой-нибудь кнопке электробаяна. Хотя, семплеры (матрица кнопок) считают любой звук семплом :)
Так вот, как лучше хранить и распространять такой набор звуков?
Ну, типа: json-файл со списком из 100K объектов, где каждая запись имеет id - целое число и в том же каталоге валяется 100K файлов для каждого ID: 1.wav, 2.wav и т.п. Это удар по ФС: сто тыщ мелких объектов. Их тогда надо будет по каталогам разбивать.
Ещё я видел каталог с wav-файлами, где для каждого файла хранится одноимённый TXT-файл, в котором что-то про этот wav-файл сказано. Но тут получается 200K файлов, а не 100K+1. Ваще смерть винта.
Я бы вообще слил мелкие кусочки в жирный wav-файл (с ограничением на 4GB, например), а рядом положил json-файл с описанием кусочков внутри этого wav-файла. Такое очень быстро и просто читать и удобно хранить. Получилось бы несколько wav-файлов и один index.json
Ещё существуют .CUE - файлы, но я не понял как там насчёт UTF-8 в именах кусков и как насчёт миллиона записей в нём.
Чем там DJ пользуются на своих pioneer cdj 2000 для отметки кусков треков? Или им там не надо 100К кусков хранить?