Преобразование звука в MIDI в реальном времени

audio, jack, midi, synth, музыка в linux

6

4

Спустя 2,5 месяца работы я готов вам представить свою программу wave2midi. Она анализирует спектр нот в звуковом сигнале в реальном времени и выдает на выход MIDI события, которые можно записывать в таких программах, как MuseScore, или проигрывать в синтезаторе Yoshimi. Моя программа может воспринимать даже аккорды!

Программа работает в среде UNIX подобных систем с звуковой системой JACK Audio Connection Kit.

К ней можно подключать любые программы, поддерживающие JACK.

Я использую w2midi для того, чтобы получать звук синтезатора, играя на электрогитаре и для того, чтобы получать звук синтезатора своим голосом в микрофон! Вы можете придумать свой способ её использовать. Можно, например, для более точного распознавания пропускать входящий сигнал через компрессор, а выходящие ноты транспонировать (я думаю есть такие утилиты, если нет, то напишу).

>>> Видео демонстрация

Программа состоит из интерфейса командной строки (w2midi) и графического интерфейса (w2midi_qt). CLI часть написана на C99, а графическая - на C++ с использованием фреймворка Qt5.

w2midi распространяется под лицензией Apache 2.0, w2midi_qt под GPL-3.0-only.

Хочу обратить внимание на настройку:

Чем выше буфер, тем выше задержка и точность
Если программа улавливает лишние звуки, измените порог срабатывания в Дб

Программа распознает частоты с помощью преобразования Фурье, а конкретно, с помощью библиотеки FFTW3. Частоты преобразуются в ноты по простой формуле: 12 * \log_2 \frac{f}{d}, где f - полученная частота, d - опорная. Гармонический ряд - относителен, я считаю его относительно частоты 440 герц (нота ля первой октавы).

Отдельно хочу обратить внимание на обертоны. Если просто анализировать ноты по такому алгоритму, то получается настоящая какафония… Это из за того, что музыкальные инструменты издают не чистую синусоиду, а еще и дополнительные гармоники, называемые обертонами, придающие тембр. Но они нам не нужны во время записи нот. Чтобы их побороть я придумал очень простой алгоритм: из полутонов, стоящий в интервале (расстояние между нотами) секунда (1-2 полутона) выбирается самый громкий. Да, все так просто… В музыке НИКОГДА не используются секунды. Самое интересное, что об этом нигде не написано, просто заметил эмпирическим путём такое интересное свойство.

Вот такая история. Инструкции по сборке из исходных кодов находятся в README.

>>> Видео демонстрация

>>> Репозиторий w2midi

>>> Репозиторий w2midi_qt

Ссылка

←	Решил поменять картинку загрузки FreeBSD

Planet Cosmo Communicator

→

← 1 2 →

Круто! Очень здорово. Побольше бы таких людей у нас было.

James_Holden ★★★★
(14.05.22 19:11:24 MSK)

В музыке НИКОГДА не используются секунды.

В определенной серьезной классической музыке 20 века и позднее вполне используются. Но вряд ли кто-то будет твоей программой такое распознавать.

Поэтому идея с секундами отличная, просто и эффективно.

James_Holden ★★★★
(14.05.22 19:20:25 MSK)

Ссылка

Ответ на: комментарий от James_Holden 14.05.22 19:11:24 MSK

hobbit, обрати внимание. Имхо, стоит подтверждения в выходные, пока народ заходит.

ist76, а ты что думаешь?

~~crypt~~ ★★★★★
(15.05.22 10:52:29 MSK)
Последнее исправление: crypt 15.05.22 10:55:50 MSK (всего исправлений: 1)

Хоть музыкой не увлекаюсь, но респект за такой труд! Уверен многим пригодится

Sunderland93 ★★★★★
(15.05.22 14:00:16 MSK)

Ссылка

А задержка не слишком большая?

Clockwork ★★★★★
(15.05.22 18:52:06 MSK)

Ссылка

Ответ на: комментарий от crypt 15.05.22 10:52:29 MSK

Я думаю, что автор очень большой молодец и что написал программу и что сделал видеопрезентацию, а не просто три строчки текстового описания. Кому-то такая вещь, очень возможно, даже пригодится. Мне нет, просто потому, что у меня есть миди-клавиатура и я на ней что-то несложное вполне способен наиграть руками, а тут, как я понял, всё-таки лаг. Но я вполне могу себе придумать применение этой программы в реальном живом выступлении (когда звук бедный, а на основе того что играет гитарист можно генерировать всякие «пады»)

Ещё я кое-что думаю про форму головы грифа, но это оффтоп.

ist76 ★★★★★
(15.05.22 18:56:21 MSK)

Ссылка

Сделано круто, настоящий любительский проект.

Интересно, а что за usb карта используется в демонстрации?

~~AVL2~~ ★★★★★
(15.05.22 19:50:53 MSK)

Ответ на: комментарий от AVL2 15.05.22 19:50:53 MSK

На скриншоте вижу Скарлетт

ist76 ★★★★★
(15.05.22 20:11:35 MSK)

Ответ на: комментарий от ist76 15.05.22 20:11:35 MSK

Ага

realbarmaley ★★
(15.05.22 20:29:07 MSK) автор топика

Ссылка

Ответ на: комментарий от AVL2 15.05.22 19:50:53 MSK

scarlett solo focusrite

realbarmaley ★★
(15.05.22 20:29:38 MSK) автор топика

Ссылка

Ответ на: комментарий от AVL2 15.05.22 19:50:53 MSK

focusrite scarlett 2i2 или 2i4

pkurg ★★★★
(15.05.22 20:32:06 MSK)

Ответ на: комментарий от pkurg 15.05.22 20:32:06 MSK

Без понятия

realbarmaley ★★
(15.05.22 20:33:13 MSK) автор топика

Ссылка

За peervideo зачёт. Да и за всё остальное тоже. Молодец.

Erepb ★★★
(15.05.22 21:23:23 MSK)

Ссылка

Ответ на: комментарий от pkurg 15.05.22 20:32:06 MSK

Я слышал, что к ним драйвера есть, но блин цена, но все равно интересно, они реально без проблем работают в линуксе?

Вот прям как обычные аудиокарточки usb, воткнул и готово? Или там миллиард тонкостей с дистрибутивом, ядром и т.д.?

~~AVL2~~ ★★★★★
(15.05.22 21:35:58 MSK)

Ответ на: комментарий от AVL2 15.05.22 21:35:58 MSK

Тупо подрубаещь и работает. Даже firmware не нужен. Работает на любых дистрах, даже на одобренных ФСПО

realbarmaley ★★
(15.05.22 21:39:55 MSK) автор топика

Ссылка

Ответ на: комментарий от AVL2 15.05.22 21:35:58 MSK

Цена у них (для аудиоинтерфейсов) - считай, что даром. Не RME, чай.
Имей ввиду, у Скарлетов уже три ревизии вышло. С третьей были небольшие сложности, тут на форуме один из участников допиливал и, кажется, допилил.

ist76 ★★★★★
(15.05.22 21:43:55 MSK)

Ответ на: комментарий от ist76 15.05.22 21:43:55 MSK

Я в 2015 покупал

realbarmaley ★★
(15.05.22 21:51:55 MSK) автор топика

Ссылка

Ответ на: комментарий от ist76 15.05.22 21:43:55 MSK

Ясно, спасибо за предупреждение, на авито как раз много 2гн, а новые все 3 поколения.

~~AVL2~~ ★★★★★
(15.05.22 22:08:23 MSK)

Ссылка

и на выдает на выходе

Кто новость проверял на?

ashot ★★★★
(15.05.22 22:25:06 MSK)

Ответ на: комментарий от ashot 15.05.22 22:25:06 MSK

А изменить я уже не могу :)

realbarmaley ★★
(15.05.22 22:33:19 MSK) автор топика
Последнее исправление: realbarmaley 15.05.22 22:33:28 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от ashot 15.05.22 22:25:06 MSK

Я, на. :) Первый абзац как-то проглядел. Спасибо, поправил.

hobbit ★★★★★
(15.05.22 22:53:58 MSK)

Ссылка

В музыке НИКОГДА не используются секунды

Имеется в виду малая секунда? Редко, но используется, у Sepultura, помнится :)

ЗЫ. какОфония

kott ★★★★★
(16.05.22 01:25:26 MSK)

Ответ на: комментарий от kott 16.05.22 01:25:26 MSK

Брр, что за ерунда, как это не используется? А Em9 например 024000 ?

kott ★★★★★
(16.05.22 01:31:00 MSK)

весьма интересно, буду пробовать.

piyavking ★★★★★
(16.05.22 01:35:35 MSK)

Ссылка

или я не понял твою мысль

kott ★★★★★
(16.05.22 01:49:43 MSK)

Ссылка

Ответ на: комментарий от kott 16.05.22 01:31:00 MSK

сори, затупил немношк

kott ★★★★★
(16.05.22 05:30:09 MSK)

Ссылка

В музыке ничего не понимаю, но простые и эффективные алгоритмы это круто.

kirill_rrr ★★★★★
(16.05.22 06:29:00 MSK)

Ссылка

Ответ на: комментарий от kott 16.05.22 01:31:00 MSK

Редко используются

realbarmaley ★★
(16.05.22 08:58:22 MSK) автор топика

Ссылка

Ответ на: комментарий от kott 16.05.22 01:31:00 MSK

Если em9 заменить на em7 никто не заметит подвоха

realbarmaley ★★
(16.05.22 09:00:21 MSK) автор топика

Молодец. Я хотел такую программу писать для ZX-Spectrum в 1991 году. Но учитель в музыкалке сказал, что ему такую программу не надо.

Mirage1_ ★
(16.05.22 09:09:43 MSK)

Ответ на: комментарий от Mirage1_ 16.05.22 09:09:43 MSK

А на каком языке?

realbarmaley ★★
(16.05.22 09:10:30 MSK) автор топика

Ответ на: комментарий от realbarmaley 16.05.22 09:10:30 MSK

А на каком языке?

Обычно писал в машинных кодах. Но сейчас понимаю, что вряд ли смог написать такое школьником, не зная разложения в ряды. Просто на уровне идеи было. Учитель по баяну подбирал музыку на слух, а я - нет, не слышал.

Mirage1_ ★
(16.05.22 09:12:28 MSK)

Ответ на: комментарий от Mirage1_ 16.05.22 09:12:28 MSK

А я сейчас тоже школьник, 8 класс. Только я не осилил быстрое преобразование Фурье, только дискретное, поэтому взял готовое - FFTW3

realbarmaley ★★
(16.05.22 09:17:42 MSK) автор топика

Ответ на: комментарий от realbarmaley 16.05.22 09:17:42 MSK

для 8-классника впечатляет, но всё равно ознакомься с aubio, его недавно в MOD Devices вкрутили: https://github.com/DISTRHO/PitchTrackingSeries https://moddevices.com/guitar-synth/

kott ★★★★★
(16.05.22 09:39:41 MSK)

Ответ на: комментарий от realbarmaley 16.05.22 09:00:21 MSK

как это не заменит? я втупил, когда подумал, что интервал в малую секунду вообще не используется

kott ★★★★★
(16.05.22 09:41:20 MSK)

Ссылка

Ответ на: комментарий от kott 16.05.22 09:39:41 MSK

aubio крутая прога, но у меня в принципах разработки была простота и понятность.

realbarmaley ★★
(16.05.22 09:44:57 MSK) автор топика

Ссылка

Попробовал с гитарой.

Сразу напоролся на «какофонию», причина которой оказалась проста - была выставлена маленькая задержка у pipewire и мощности компа не хватало. Решилось увеличением задержки.

При работе программы, конечно, не получается магически превратить обычную гитару в гитарный синтезатор, не зря же у него с каждой струны отдельный канал сделан )))

Диссонансы твой алгоритм фильтрации секунд устраняет хорошо. Остается проблема - обертоны все равно цепляются, образующие интервалы октава и, вроде даже квинта. Чистая нота у меня получается только на первой струне. Возможно ты подскажешь какие-то настройки, как можно с этим бороться?

Как это воспринимается на слух - зависит от MIDI инструмента. Когда я выбрал фортепиано, у меня извлечение одной ноты на гитаре приводит к исполнению целого пассажа ))) Вот дергаю ноту, и обертоны то цепляются то нет по мере изменения их громкости.

Если выбрать какой-то плавный PAD, то как раз получается неплохо, все ноты плавно накладываются и создается фон из взятого на гитаре аккорда.

Более неприятное явление - из-за особенностей гитары, взятая нота плавает, высота сразу четко не устанавливается. И звучит гамма из двух-трех нот подряд первую секунду. Серьезным образом эту проблему можно было бы решить, если использовать событие Pitch Bend.

James_Holden ★★★★
(16.05.22 12:49:05 MSK)

Ссылка

В музыке НИКОГДА не используются секунды.

Сомнительное утверждение

https://youtu.be/uYuKyueSb7k

https://youtu.be/gkBet-VRNQc

Aeon ★
(16.05.22 13:08:11 MSK)

Ответ на: комментарий от Aeon 16.05.22 13:08:11 MSK

Это гармонической музыкой сложно назвать :)

realbarmaley ★★
(16.05.22 13:19:25 MSK) автор топика

Ответ на: комментарий от realbarmaley 16.05.22 13:19:25 MSK

Тем не менее, это - музыка.

Есть и более простые для восприятия примеры.

https://youtu.be/239vHrwt8Rs

Aeon ★
(16.05.22 13:46:09 MSK)

Ответ на: комментарий от Aeon 16.05.22 13:46:09 MSK

Понял, я просто взял компромисс простота-качество

realbarmaley ★★
(16.05.22 14:27:49 MSK) автор топика

Ссылка

Ответ на: комментарий от Aeon 16.05.22 13:46:09 MSK

Вы же имеете ввиду одновременное воспроизведение полутонов в интервале секунда?

realbarmaley ★★
(16.05.22 14:29:22 MSK) автор топика

Ответ на: комментарий от realbarmaley 16.05.22 14:29:22 MSK

Да, одновременное, в последнем примере гитарный рифф прям начинается с малой секунды.

Aeon ★
(16.05.22 14:59:37 MSK)

Ответ на: комментарий от Aeon 16.05.22 14:59:37 MSK

Интересно :) но мой алгоритм работает более менее

realbarmaley ★★
(16.05.22 15:08:45 MSK) автор топика

Ссылка

В музыке НИКОГДА не используются секунды.

Чтоа? Куча джазовых аккордов имеют секунду. Причем не на нотах разных октав, а на ближних нотах.

И прикинь, в гамме ДО-мажор есть аж две секунды. Вот это ничеси!

Но за программу однозначно зачет.

Xintrea ★★★★★
(16.05.22 15:14:48 MSK)
Последнее исправление: Xintrea 16.05.22 15:16:14 MSK (всего исправлений: 1)

Ответ на: комментарий от Xintrea 16.05.22 15:14:48 MSK

Речь об аккордах же, не о гамме. А так то в диатонической гамме 7 секунд, если от тоники до тоники считать. Секунда бывает большая и малая, если что.

James_Holden ★★★★
(16.05.22 15:16:59 MSK)

Ответ на: комментарий от Xintrea 16.05.22 15:14:48 MSK

в гамме ДО-мажор есть аж две секунды

Редко ми и фа, си и до играю вместе, но исключения, как вы сказали, джазовые аккорды

realbarmaley ★★
(16.05.22 15:17:00 MSK) автор топика

Ссылка

Ответ на: комментарий от James_Holden 16.05.22 15:16:59 MSK

Речь об аккордах же, не о гамме. А так то в диатонической гамме 7 секунд, если от тоники до тоники считать. Секунда бывает большая и малая, если что.

Правильно, я про малую и написал.

Наложение последовательных нот друг на друга - это обычное дело, то есть даже аккорды не нужны чтобы алгоритм попал в такую ситуацию.

Xintrea ★★★★★
(16.05.22 15:23:20 MSK)

Ссылка

Ответ на: комментарий от James_Holden 16.05.22 15:16:59 MSK

Секунда бывает большая и малая, если что

Это я знаю. Малая один полутон, большая два полутона

realbarmaley ★★
(16.05.22 15:31:10 MSK) автор топика

Ответ на: комментарий от Xintrea 16.05.22 15:14:48 MSK

я думаю, имелось в виду малая секунда от тоники в аккордах

kott ★★★★★
(16.05.22 15:56:20 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

←	Решил поменять картинку загрузки FreeBSD

Скриншоты

Planet Cosmo Communicator

→

Похожие темы