Берем любую аудиозапись. Там между голосом есть фон. Как определить временный отрезок фона в аудиозаписи (там где нет голоса) в автоматическом режиме? Без программ audacity и подобных.
Скриншот из audacity для понимания темы. http://i5.imageban.ru/out/2016/01/17/daec09bbe194ff73d0539565c3765325.png
Например, фон можно определить как отрезок, где есть монотонный звук. Как определить временный отрезок фона в аудиозаписи где монотонный звук?