LINUX.ORG.RU
Ответ на: комментарий от linuxmachtfrei

а что с тобой случилось 20.02.2017?

Да ничего. Проснулся другим человеком. А в августе перешел на линукс (Xubuntu).

anonymous
()
Ответ на: комментарий от anonymous

Если к fdkaac добавить опцию -w 20000, то картина получится такая.

В lame и oggenc, кстати, тоже можно задать частоту среза для любого битрейта. MP3 в таком случае чем-то смахивает на Vorbis.

То есть, получается, для этих трёх кодеков можно произвольно выбирать частоту среза на любых битрейтах.

anonymous
()
Ответ на: комментарий от anonymous

может у mp3 будут артефакты и на 320k

Я лично не слышу с настройками --cbr -b 320 -q 0 -m j (на довольно сложном материале), это не значит впрочем, что у него большой запас по качеству. Но, то что Lame 3.100 320k хороший кодек (не говно) это однозначно. ВЧ, однако подрезает, но главное слух. На спектре можно увидеть, что даже на 320k частоты выше 16000 несколько ослабляются. Но можно сказать, что Lame выжимает из древнего формата максимум. А частоты выше 16000 особо на восприятие не влияют.

anonymous
()
Ответ на: комментарий от anonymous

у меня во всех вариантах установлен жёсткий CBR

А зачем? У QAAC, кстати, спектр лучше, чем у FDK.

Про Vorbis я и сам не думал, что так всё печально у него получится

На 128k я его уже не различаю, поэтому я бы не сказал, что это плохой кодек. Плохо себя ведет на низких битрейтах, там у него тенденция к жесткости.

MP3 в таком случае чем-то смахивает на Vorbis

На слух по разному.

слушаешь и пытаешься сличить на что эта дельта похожа

Звучит страшно. Но это вроде то, что маскируется и не должно быть слышно. Кодер выкидывает неслышие (на фоне других) звуки.

они довольно-таки у всех разные

Это да. Уже даже примерно представляю у кого какие.

anonymous
()
Ответ на: комментарий от anonymous

CBR для того, чтобы посмотреть как будет себя вести кодек именно на указанном битрейте. Я, конечно, с VBR не сравнивал, но, мне кажется, что так нагляднее. Повторять эксперимент второй раз, если что, мне уже не так интересно. На слух ещё песенки послушаю, да и хватит :)

anonymous
()
Ответ на: комментарий от anonymous

Звучит страшно

Эти искажения ведь не слышны при прослушивании, иначе мы бы их услышали в слепом тесте. Они побочный продукт DCT фильтра (который экономит нам битрейт). Во время прослушивания музыки ты можешь, например, не услышать мяуканье котенка. В этом и заключается эффект маскировки. Можно неслышно подмешивать что-то, а можно наоборот выкидывать неслышимое, экономя битрейт. В данном случае имеет место и то и другое.

anonymous
()
Ответ на: комментарий от anonymous

Сравни еще какие-нибудь кодеки. WMA, например. Рекомендую EZ CD Audio Converter. Если поставишь на Win7 будет использоваться 10 версия WMA, а если на XP, то 9. Между ними различия в спектре есть. И я не знаю насчет обратной совместимости. Ну или хотя бы из состава ffmpeg (говорят, у него плохой wma кодер, но иногда им кодят, определить это легко, к счастью). Еще можно проверить musepack (который расхваливали раньше), LossyWAV, MP2, AC3, DTS.

AC3 рекомендую на битрейте 160k на моно, 192k на стерео. DTS я даже не знаю, он гораздо менее эффективный (особенно opensource), битрейта нужно больше.

Я хочу сравнить какой кодер на низких битрейтах лучше для автомагнитолы, которая поддерживает только MP3 и WMA. Уже выяснил, что от mp3 128k (особенно CBR) надо уходить на битрейты повыше. 140k хотя бы и там сравнивать. До 160k max, иначе это уже будет не экономия. Еще интересно, действительно ли официальный AC3 лучше ffmpeg AC3, о чем постоянно говорят на трекерах и «бьют по рукам» за ffmpeg.

anonymous
()
Ответ на: комментарий от anonymous

В этом и заключается эффект маскировки

Зачем гадать, если можно послушать то, что «маскируется/режется»? Речь идёт о кодеках, а не об «искуственном интелекте», «думать» они не умеют.

anonymous
()
Ответ на: комментарий от anonymous

Musepack хотел посмотреть и AC3 может гляну, с ffmpeg который идёт. WMA, в который может кодировать ffmpeg, только восьмой версии. Если хочешь, то сделаю такую же картинку для него.

Для тех же четырёх кодеков: MP3, AAC, Vorbis и Opus, можешь пока посмотреть как они соотносятся на 128 килобитах с полосой 20-20k и переменным битрейтом. Из-за того, что исходник короткий, то средний битрейт иногда получается прилично больше целевого. Как, например, у Vorbis. Но если кодировать длинный файл, то битрейт нормализуется.

И вот в таком варианте, действительно, Vorbis выглядит совершенно иначе.

anonymous
()
Ответ на: комментарий от anonymous

Я лично видел, как фубаровский дизеринг раскрасил шумом весь свободный спектр, где до этого была пустота

Это нойзшейпинг. По уровню он на 7 дБ громче дизеринга Audacity (у которого пик -70 дБ). У фубара на ВЧ больше шума, но меньше на СЧ. Судя по всему, нойзшейпинг отдельно от дизеринга у фубара не отключается. Потому я бы не стал пользоваться фубаровским дизерингом. Может, на слух он и хорош, но очень уж на графиках страшен. На лету при прослушивании другое дело.

anonymous
()
Ответ на: комментарий от anonymous

Просто некоторые кодеки едят только 16 или 24 бит и я думаю в каком виде им их подсовывать из 32 бит, после дизеринга или нет. Решил подсовывать 16 бит с дизерингом Audacity, а 24 бит с дизерингом Foobar (на 24 бит он малозаметен, но тоже больше на ВЧ). Боюсь, что без дизеринга звук будет скрипучим, а я буду валить это на кодек (как в случае wma), но это вряд ли, конечно.

Audacity при преобразовании 32>24 бит не выполняет дизеринг, даже если он включен. Foobar выполняет (если включен) и при 24 битах, на графиках почти незаметен (на уровне -110 дБ). 32>16 без дизеринга у Audacity и Foobar побитово совпадают. А вот 32>24 без дизеринга немного отличаются: у фубар пик дельты -144 дБ (граничное для 24 бит), у Audacity -138 дБ. Но это такие мелочи, что их никто никогда не отличит. Просто немного другой алгоритм обрезки 32>24 бит.

У Audacity побитово не совпадает 32>16 с дизерингом в зависимости от формата вывода «WAV (Microsoft) signed 16-bit PCM» и «Прочие несжатые файлы-WAV (Microsoft)-Signed 16-bit PCM». Но там отличия дельты в мелочах. В принципе, почти одинаково. Видимо шум чуть по разному компонуется. Я выбрал первый вариант, как более дефолтный. О параметрах 32>16 дизеринга см. коммент выше.

Даже в lossless бывают модификации, шумы всякие, которые могут мешать, а могут помогать.

anonymous
()
Ответ на: комментарий от anonymous

в зависимости от формата вывода

От формата вывода это не зависит. Просто шум рандомный. Даже в пределах одного формата есть различия на следующем экспорте.

Блин, до чего же наглая винда (7). Стоит оставить ее в покое, как она начинает заниматься своими делами. Хотя, я везде, где только можно поотключал все лишнее, даже в планировщике (а там много всего). Снести что-ли все эти виндоподелия, включая фубар и не будет больше тестов. А может это boot defrag или prefetch?

anonymous
()
Ответ на: комментарий от anonymous

Получается aac cbr хуже, чем aac vbr, несмотря на больший битрейт. В cbr больше горизонтальных полос и прореживаний. mp3 плох как всегда. Почему-то opus оказался хуже, чем fdk aac - над правой рукой (не с нашей стороны) у волос есть прореживания. Vorbis хорош, но битрейт у него все-таки большой на этом участке.

AC3 и WMA из ffmpeg проверь. А я закодирую официальными кодеками чуть позже.

anonymous
()
Ответ на: комментарий от anonymous

Закодировал в WMA и AC3 официальными кодеками. WMA standard CBR 44100 16 bit из Win7 (EZ CD Audio Converter 7.1.8.1). К сожалению, на битрейтах 64k и выше работает только в стерео, не знаю помешает ли это тесту. У WMA битрейт получился больше заявленного, видимо из-за сложного исходника. AC3 из Sonic Scenarist SD 3.3.2, версия кодировщика 3.31.11C, 2011 год. AC3 сделал с lowpass фильтром и без. Картинку еще не создавал. Не знаю какие битрейты выбрать.
http://s000.tinyupload.com/index.php?file_id=00448096986315578831

anonymous
()
Ответ на: комментарий от anonymous

WMA standard 160k CBR (official Win7) распознал со второго захода по шершавым ВЧ и более грубому звуку. Первый был 5/7 (33%).

foo_abx 2.0.6c report
foobar2000 v1.5.1
2020-04-29 01:21:27

File A: original32.wav
SHA1: 7b1a6090328e64b8a70ca523ce4370ebc5f2820e
Gain adjustment: -6.64 dB
File B: 160k-cbr.wav
SHA1: cf85ee5479a303d86365646d6a5a1795c9cd1569
Gain adjustment: -6.68 dB

Output:
DS : Primary Sound Driver, 32-bit
Crossfading: NO

01:21:27 : Test started.
01:22:24 : 01/01
01:22:40 : 02/02
01:22:51 : 03/03
01:23:22 : 04/04
01:23:42 : 05/05
01:24:31 : 06/06
01:25:07 : 07/07
01:25:23 : 08/08
01:25:23 : Test finished.

 ---------- 
Total: 8/8
p-value: 0.0039 (0.39%)

 -- signature -- 
c4c866e4778009a018bbeffd8f442464c12aa132
Так то явных искажений нет, но грубовато. Боюсь, и на более высоких битрейтах он не избавится от этой своей особенности и для автомагнитолы придется выбирать мягкий mp3 на тех битрейтах, где не будут явно слышны его артефакты. Хотя, наверняка, есть жанры, где ценится жесть.

anonymous
()
Ответ на: комментарий от anonymous

Отличие то чёткое (8/8)

Отличия четкие в цифрах, а чтобы их реально услышать и зафиксировать, порой приходится помучиться.

А за-diff-ить не пробовал?

Разница -13 дБ (у fdk 128k -11 дБ). Дельта менее высокочастотная на слух, чем у fdk. Ни о чем это не говорит.

Дело еще в том, что каждый кодер вносит задержку (сдвиг) при кодировании и часто указывает ее значение в метаданных. Декодер читает эти данные и компенсирует задержку при декодировании. В результате получается полная синхронность и отсутствие пауз. Называется gapless lossy playback. Но это в идеале. А в реальности, декодеры не всегда такие умные (и кодеры). В случае wma standard ffmpeg не компенсирует задержку и микширование в противофазе дает неправильный результат. Чтобы микширование в противофазе (то что делает sox и то, что можно сделать в Audacity - одну дорожку инвертировать, потом их свести) работало правильно, должна быть идеальная синхронность, до сэмпла. Тут без Audacity не обойтись. Пришлось wma синхронить в ней, прежде чем считать разницу.

anonymous
()
Ответ на: комментарий от anonymous

Dolby Digital (AC3) звучит неплохо на 160-192k. Официальный Sonic получше. ffmpeg распознал 7/8, Sonic 6/8. Звук уходит в мягкоту. Отчеты. Срезы примерно одинаковы (20000 на 192k, 16000 на 160k, у ffmpeg чуть выше). У Sonic чуть больше сверх ВЧ (18-20), у ffmpeg средне ВЧ (12-16).

anonymous
()
Ответ на: комментарий от anonymous

TinyUpload чё-то забрыкался, хотя у них там значится, что они принимают файлы до 50 МБ, а этот — не более 35. Закинул в другой сервис. И ещё один, на всякий случай.

Посмотрел на твои AC3 и WMA и даже не стал заморачиваться с ffmpeg’овскими :)

🦕

anonymous
()
Ответ на: комментарий от anonymous

не компенсирует задержку и микширование

А нет таких тулз, которые по фазе первой волны Фурье (T=length) могут это самое выравнивание сделать?

anonymous
()
Ответ на: комментарий от anonymous

Для синхронизации, наверное, лучше корреляцию использовать. Можно из неё же сразу и минимум взять в качестве разницы исходника и зажатого файла.

Musepack, кстати, почти 11 миллисекунд добавляет к началу и там не 100% тишина, а какой-то однобитный шум.

anonymous
()
Ответ на: комментарий от anonymous

PluralEyes plugin for Sony Vegas автоматически синхронизирует аудио и видеоматериалы без необходимости временного кода, хлопушки или специальной подготовки. И аналогичные решения для мультикамерного монтажа видимо то, что ты просишь. В нашем случае видео нет (или его можно заменить на черный фон), но плагин ориентируется и по пикам звуковой волны. Инвертирование и микширование придется делать после него. Правда, я не уверен, что там достаточная точность синхронизации (до сэмпла).

anonymous
()
Ответ на: комментарий от anonymous

Посмотрел на твои AC3 и WMA и даже не стал заморачиваться с ffmpeg’овскими

У ffmpeg wma спектр гораздо лучше, кстати. Даже на более низком битрейте.

anonymous
()
Ответ на: комментарий от anonymous

Самый большой delay у aac и mp3 около 43 мс. У ac3 5 мс, у opus 7 мс, dts 11 мс. У vorbis вроде 0. Opus, vorbis и wma pro ffmpeg компенсирует. В случае с opus только относительно новые версии ffmpeg. Можно попробовать добавить опцию -async 1 при декодировании.

Тулзы то есть?

Foobar в большинстве случаев timing accuracy при декодировании. Есть у него баг с aac, закодированным ffmpeg.

anonymous
()
Ответ на: комментарий от anonymous

Или корректные (родные) декодеры.

мультикамерного монтажа

Любительского, потому что на проф оборудовании используют временные коды.

anonymous
()
Ответ на: комментарий от anonymous

plugin for

Плагины говоришь. Не хоч смущать, но по-моему это явный перебор. Зачем «привязываться» к чему то, если тулза нужна «везде»?

anonymous
()
Ответ на: комментарий от anonymous

По таким картинкам можно наблюдать на каком битрейте у кодеков начинается деградация. mpc хорош только на q10? o_O Можно создать иллюстрирующее видео, показывающее дегенерацию, снабдить все более страшными звуками вплоть до скрипа и крика. Я займусь этим пожалуй в ближайшее время. Потестю заодно какую-нибудь видеомонтажку.

А пока краткая сводка по скринам. Последний нормальный битрейт:
aac 128
ac3 320 (если плевать на верхние ВЧ, которые можно и обрезать перед кодированием, то 192-224)
mp3 256
mpc q10
opus 64
vorbis 128
wma 256

anonymous
()
Ответ на: комментарий от anonymous

иллюстрирующее видео

Отличная идея! Порекомендую тебе взять Enscribe с моим патчем, либо сам просто закоментируй там виндовинг. Enscribe и Baudline с опцией -monet могут делать трёхцветные спектры: по одному каналу звука на два цветных канала + ещё один цветовой канал из разницы фаз каналов. Скорее всего таких же чётких картинок не получится из-за смещения фазы, но кто его знает. Я сам не пробовал этот режим.

А потом, можно взять ещё не статичную картинку, а кадры из видео и поочерёдно их кодировать с постепенно меняющимся битрейтом. Например взять чей-то танец. А в качестве звукового сопровождения наложить музыку, точно так же закодированную с постепенно меняющимся битрейтом :)

У Baudline исходник, к сожалению, закрытый и что-то поменять там не получится. И я им тыщу лет не пользовался, поэтому даже не подскажу, что и как там лучше сделать. Я, если что, своим велосипедом пользуюсь, который с одним колесом, то есть понимает только моно, и без педалей, то есть надо «толкать» каждый раз, чтобы оно поехало xD. Не рекомендую.

На Ютуб, если что, можно заливать FLAC, в самом лучшем варианте он закодируется в Opus 160k с полным спектром 20-20k. Vimeo кодирует в AAC 255k.

anonymous
()
Ответ на: комментарий от anonymous

Ну да, кстати, он ещё и каналы по цветам разделяет.

А цветную картинку ещё можно сделать предварительно разделив кадр на три цветных канала и закодировать и нарисовать спектр каждого в отдельности, а потом склеить каналы обратно в одну картинку.

anonymous
()
Ответ на: комментарий от anonymous

Vimeo кодирует в AAC 255k

Vimeo меня не пустит из-за VPN. Постоянно банит, уроды такие. Все мои видео грохнули, правда их было всего 2 :)

Порекомендую тебе взять Enscribe

Я вообще-то человек не творческий, поэтому скорее всего у меня ничего не получится :( А то бы я столько всего понаделал. Или вот рассказы писать, еще может и получится, потому что в детстве сочинял. Можно по мотивам снов.

anonymous
()
Ответ на: комментарий от ZenitharChampion

Винил же трещит

Это не самое страшное. И в этом есть свой шарм.

anonymous
()
Ответ на: комментарий от anonymous

по мотивам снов

Сегодня приснилось, что Петров и Васечкин решили жить вместе. К сожалению, больше ничего не помню. И это то запомнилось благодаря регенерации. Еще часто снится, что хожу с кем-то по городу, заблудившись. Ищу в карте на смартфоне остановку на которой можно уехать домой. Смарт должен определить местоположение по GPS или сотовым сетям, но боюсь, что кончится батарея. Или вот прогуливаю колледж, езжу на автобусах и боюсь, что меня кто-нибудь увидит.

anonymous
()
Ответ на: комментарий от anonymous

По характеру искажений можно попробовать выяснить какие AAC кодеки используют видеохостинги.

anonymous
()
Ответ на: комментарий от anonymous

В частности интересуют vk.com, facebook (там he профиль), dailymotion.

anonymous
()

Попробуй и узнаешь.

Лично для меня винил даже на виниле не подходит.

kirill_rrr ★★★★★
()
Ответ на: комментарий от anonymous

RMAA сигналом

Чёй-т за сигнал такой?

Кстати, а что это за оконная функция на скрине? По форме похожа на Наталла, но по децибелам уж как-то очень нереалистично. Нас, часом, не обманывают? Исходники есть? А если найду?

anonymous
()
Ответ на: комментарий от anonymous

уехать домой

А я однажды в полудрёме понял, что домой не получается уехать не из-за каких-то там мешающих внешних обстоятельств, а потому, что домой-то не очень и хочется на самом деле. Но пока, видимо, тебе надо домой, такие сны будут сниться.

anonymous
()
Ответ на: комментарий от anonymous

RMAA (RightMark Audio Analyzer) это программа, которая генерирует тестовые сигналы для проверки тракта записи-воспроизведения. Обычно соединяют линейный выход звуковой карты со входом и пишут loopback. С помощью нее тестируют качество звуковых карт. Также можно сгенерировать WAV, воспроизвести его на каком-нибудь устройстве (или прогнать через lossy кодер), записать (или декодировать lossy) и проанализировать. В тестовом сигнале различные вариации тональных частот 20-20000. Анализируется частотная характеристка, уровень искажений в различных условиях, взаимопроникновение каналов, фазовая характеристика, уровень шума и динамический диапазон.

RMAA собственническая программа под Windows. Написана русскими программистами. В интернете есть упоминания, что она работает под Wine, но у меня не запустилась на 5.3. Хотя, ничего особенно в ней нет, файлов минимум. Совсем Wine плохой стал, это уже не первый случай деградации. Точнее, она запускается только один раз, если в инсталлере поставить галочку «запустить после установки». Но стоит закрыть и открыть самому уже не запускается. В виртуальной машине WinXP работает.

Конечно, lossy кодеры ей тестировать неправильно. Lossy кодеры используют психоакустику для учета особенностей слуха человека и могут порождать искажения, которые будут зафиксированы технически, но при этом далеко не факт, что слушатель их заметит. Надо полагать, чем продвинутей кодер, чем он более хитрый, тем больше будет искажений. Однако, по их характеру можно определить тип кодера (если он неизвестен, но подсунуть свой файл для кодирования можно, например, в видеохостингах). Но, несмотря на это, я думаю, некоторые параметры все-таки будут актуальны и для lossy, например, частотный диапазон.

Управление простое. Нажать кнопку «сгенерировать WAV». Закодировать его в lossy, раскодировать обратно в WAV (в той же разрядности). Нажать кнопку «проанализировать WAV». Так можно сделать несколько анализов за раз. Над каждым тестом справа есть кнопочка «график», где можно посмотреть либо один график (если выбран только один файл), либо сравнительный, если несколько.

Я проанализировал Opus, FDK AAC, Vorbis и MP3 на 192k. Отчет здесь https://my-files.su/001dbu Там же тестовый WAV файл. Чем ниже кривые на графике, тем меньше искажений. Кстати, синхронность не требуется. Прога сама выполняет синхронизацию (актуально, если писать с внешних устройств, типа DVD плееров). В редких случаях, если файл записи слишком уж искажен, прога его не признает.

anonymous
()
Ответ на: комментарий от anonymous

lossy кодеры ей тестировать неправильно. Lossy кодеры используют психоакустику

По этой же причине разглядывание спектра хитрого технического сигнала не имеет особого смысла. Я про ту девочку.

anonymous
()
Ответ на: комментарий от anonymous

На скринах видно, что Vorbis очень «нервный» и отличается от остальных. Opus «хуже всех». У MP3 есть небольшие искажения на ВЧ, но в целом он самый линейный, так как самый простой. Vorbis имеет нелинейную частотную характеристику (+1.5…-2 дБ) на частотах 19500-24000 (из-за lowpass фильтра? как, впрочем, и ниже 20 Гц), у mp3 это проявляется в меньшей мере (0…-1 дБ). Только MP3 имеет линейную фазовую характеристику.

anonymous
()
Ответ на: комментарий от anonymous

Я жил на Чемском до 19 лет. Было много плохого, но и много хорошего. Потом пришлось переехать в квартал, который я не особо люблю, хотя здесь живет моя родня. Школу я не вспоминаю, но бывает, что снятся люди из колледжа в стенах школы.

anonymous
()
Ответ на: комментарий от anonymous

А мне вот очень часто деревня бабушкина снится. Хотя я там был-то совсем маленький ещё и всего три раза. Ездили на поезде — красотища от самого начала путешествия и пока домой не вернёшься.

anonymous
()
Ответ на: комментарий от anonymous

Анализируется частотная характеристка, уровень искажений в различных условиях, взаимопроникновение каналов, фазовая характеристика, уровень шума и динамический диапазон.

Ясно. Как-то это слишком заумно и скучно. Я лучше девочек поразглядываю :)

anonymous
()
Ответ на: комментарий от anonymous

Кстати, у железной дороги раньше часто тусовались. Теперь эти поезда сцуки иногда меня кошмарят. Самый прикол, когда переходишь несколько линий (хотя откуда их столько возьмется, максимум две) и слева поезд, справа поезд... Вот жалко с кораблями дел почти не имел, было бы занятно.

anonymous
()
Ответ на: комментарий от anonymous

Не хочешь АЧХ своего смарта проверить? Можно выявить на какой частоте лучше работает (где нет кривого ресемплинга). Но параметры оцифровывающей звуковой карты должны быть хорошими.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.