Звуковая база - это, грубо говоря, звуковые файлы и поставленные им в соответствие всякие метки. Как это хранится физически - дело десятое, много форматов.
Звуковые базы применяются например в речевых технологиях - когда нужно обучить статистические акустические модели для звука «а», нужно где-то взять звуковые файлы, где эта «а» отмечена в куче разных мест. Всяких технологий обучения и распознавания много, не будем вдаваться. Или в изучении иностранных языков - ты отмечаешь кусок, посылаешь иностранцу, спрашиваешь «что это было», он слушает, подписывает. Или ты подписываешь перевод всех фраз в длинном файле, а потом запускаешь его и читаешь синхронный перевод, если мозгов на синхронный перевод вживую не хватает, как у большинства людей. Или в электронной музыке - базы семплов.
Я в свободное время делаю вот такой звуковой редактор: http://audigger.sourceforge.net/ и мне не хватает обратной связи от возможных заинтересованных лиц и не хватает обсуждения идей разных проектов, которые могут быть построены с участием таких технологий.
Ну например, можно создать сайт, где желающие регистрируются и учавствуют в наполнении коллективных звуковых баз. Все эти дела можно снабжать игровыми элементами, чтобы ездить на человеческой гордыне и чувствах кармодрочерства. Итоговые звуковые базы делаются доступными для скачивания всеми желающими, объявляются достоянием общественности. Кроме этого, никто не мешает использовать предлагаемое открытое ПО для создания закрытых баз и барыжить эти базы как плод своего труда.
Если кто-то хочет потрепаться на эту тему, пишите в ужасный проприетарный скайп: volfgangmone. Нахожусь в СПб, поэтому если кто-то может меня познакомить с каким-нибудь профессором ИТМО, которому это интересно, то я с ним с радостью пообщаюсь в реале.