LINUX.ORG.RU

Audacity: размер файла после редактирования

 , ,


1

1

Как так получается, что допустим я с помощью youtube-dl скачиваю аудио с YouTube’a в формате M4A - (140 m4a audio only tiny 133k, m4a_dash container, mp4a.40.2@128k (44100Hz), 3.39MiB), обрезаю небольшой кусочек, а на выходе получаю 5 мегабайт? Это виноват FFmpeg? Или Google сжимающие всё подряд?



Последнее исправление: mc_hlebushek (всего исправлений: 2)
Ответ на: комментарий от mc_hlebushek

Поставь mediainfo (sudo apt install mediainfo) и покажи выхлоп mediainfo /path/to/file.m4a где /path/to/file.m4a это то что ты получил из audacity

MrClon ★★★★★
()
Ответ на: комментарий от mc_hlebushek

Эксопртируешь, т.е. перекодируешь. Виноват не ffmpeg, а тот кто им неумело пользуется.

А при чем тут гугел, который кодирует все подряд?

anonymous
()
Ответ на: комментарий от mc_hlebushek

По какому стандарту? Звук на ютубе может быть пожат как минимум тремя кодеками: opus, aac и mp3. Наверняка ещё какое-нибудь леками есть

MrClon ★★★★★
()
Ответ на: комментарий от MrClon

youtube-dl -f bestaudio+bestvideo выдаёт WebM почему-то…

Оригинальный файл:

General
Complete name                            : MØ - Kamikaze (Official Video).m4a
Format                                   : dash
Codec ID                                 : dash (iso6/mp41)
File size                                : 3.39 MiB
Duration                                 : 3 min 39 s
Overall bit rate                         : 130 kb/s
Encoded date                             : UTC 2019-05-05 03:19:02
Tagged date                              : UTC 2019-05-05 03:19:02

Audio
ID                                       : 1
Format                                   : AAC LC
Format/Info                              : Advanced Audio Codec Low Complexity
Codec ID                                 : mp4a-40-2
Duration                                 : 3 min 39 s
Bit rate                                 : 128 kb/s
Channel(s)                               : 2 channels
Channel layout                           : L R
Sampling rate                            : 44.1 kHz
Frame rate                               : 43.066 FPS (1024 SPF)
Compression mode                         : Lossy
Stream size                              : 3.36 MiB (99%)
Title                                    : ISO Media file produced by Google Inc. Created on: 05/04/2019.
Language                                 : English
Encoded date                             : UTC 2019-05-05 03:19:02
Tagged date                              : UTC 2019-05-05 03:19:02

Отредактированный файл:

General
Complete name                            : Desktop/MØ - Kamikaze (Official Video).m4a
Format                                   : MPEG-4
Format profile                           : Apple audio with iTunes info
Codec ID                                 : M4A  (isom/iso2)
File size                                : 11.5 MiB
Duration                                 : 3 min 30 s
Overall bit rate mode                    : Constant
Overall bit rate                         : 460 kb/s
Writing application                      : Lavf58.29.100

Audio
ID                                       : 1
Format                                   : AAC LC
Format/Info                              : Advanced Audio Codec Low Complexity
Codec ID                                 : mp4a-40-2
Duration                                 : 3 min 30 s
Duration_LastFrame                       : -16 ms
Bit rate mode                            : Constant
Bit rate                                 : 458 kb/s
Channel(s)                               : 2 channels
Channel layout                           : L R
Sampling rate                            : 44.1 kHz
Frame rate                               : 43.066 FPS (1024 SPF)
Compression mode                         : Lossy
Stream size                              : 11.5 MiB (100%)
Default                                  : Yes
Alternate group                          : 1
mc_hlebushek
() автор топика
Ответ на: комментарий от mc_hlebushek

youtube-dl -f bestaudio+bestvideo выдаёт WebM почему-то…

Наверное потому-что он считает что vp9 и opus это лучшие кодеки доступные для этого видео. Что, в общем-то, не удивительно.

Отредактированный файл

Его продолжительность всего на 9 секунд меньше исходника, при этом он сохранён с втрое большим битрейтом (458 kb/s против 128 kb/s у исходника). Разбирайся с настройками экспорта той программы которая выдала тебе этот файл

MrClon ★★★★★
()
Ответ на: комментарий от MrClon

Это я редактировал сейчас в VirtualBox в Manjaro, вот результат из под Windows 7:

Общее
Полное имя                               : D:\MØ - Kamikaze.m4a
Формат                                   : MPEG-4
Профиль формата                          : Apple audio with iTunes info
Идентификатор кодека                     : M4A  (isom/iso2)
Размер файла                             : 4,95 Мбайт
Продолжительность                        : 3 м. 30 с.
Режим общего битрейта                    : Постоянный
Общий поток                              : 197 Кбит/сек
Программа кодирования                    : Lavf55.33.100

Аудио
Идентификатор                            : 1
Формат                                   : AAC LC
Формат/Информация                        : Advanced Audio Codec Low Complexity
Идентификатор кодека                     : mp4a-40-2
Продолжительность                        : 3 м. 30 с.
Duration_LastFrame                       : -1 мс.
Вид битрейта                             : Постоянный
Битрейт                                  : 192 Кбит/сек
Каналы                                   : 2 канала
ChannelLayout                            : L R
Частота                                  : 44,1 КГц
Частота кадров                           : 43,066 кадра/сек (1024 SPF)
Метод сжатия                             : С потерями
Размер потока                            : 4,92 Мбайт (99%)
Default                                  : Да
AlternateGroup/String                    : 1

mc_hlebushek
() автор топика
Ответ на: комментарий от mc_hlebushek

Теперь битрейт 192 Кбит/сек. Вместо того чтобы перебирать ОС в поисках той в которой Audacity по умолчанию использует нужный тебе битрейт, лучше разберись как задать его вручную

MrClon ★★★★★
()
Ответ на: комментарий от MrClon

Не знаю насколько это точно, но по размеру подходит:

Общее
Уникальный идентификатор                 : 95076110354999261066618376970916529202 (0x4786FE27AC2F8BD89E2A7FB8E0AB0432)
Полное имя                               : D:\MØ - Kamikaze - 1.m4a
Формат                                   : Matroska
Версия формата                           : Version 4
Размер файла                             : 3,28 Мбайт
Продолжительность                        : 3 м. 31 с.
Общий поток                              : 130 Кбит/сек
Программа кодирования                    : Lavf55.33.100
Библиотека кодирования                   : Lavf55.33.100
FileExtension_Invalid                    : mkv mk3d mka mks

Аудио
Идентификатор                            : 1
Формат                                   : AAC LC
Формат/Информация                        : Advanced Audio Codec Low Complexity
Идентификатор кодека                     : A_AAC-2
Продолжительность                        : 3 м. 31 с.
Каналы                                   : 2 канала
ChannelLayout                            : L R
Частота                                  : 44,1 КГц
Частота кадров                           : 43,066 кадра/сек (1024 SPF)
Метод сжатия                             : С потерями
Default                                  : Да
Forced                                   : Нет

mc_hlebushek
() автор топика
Ответ на: комментарий от AKonia

Есть ли смысл перевести свою аудио-библиотеку с MP4/M4A на WebM? Много чего про него читал, и используется он для браузеров

mc_hlebushek
() автор топика
Ответ на: комментарий от mc_hlebushek

Смотря где пользовать, на линуксе с mpv/audacious - пустая трата времени, для какого-нибудь дешманского плеера умеющего в 1-2 формата стоит, но я бы не занимался пока не столкнулся с этим в лоб, я сам вообще предпочитаю lossless и не вижу существенной разницы между сжатыми форматами(не тягаться им с flac/wav), но по качеству звучания лучше и размеру opus меньше. Я сам звуковые дорожки качаю с флажком -f251, т.е. как раз opus.

AKonia ★★★
()
Ответ на: комментарий от AKonia

Я понял, поищу ещё какую-нибудь информацию про Opus и там уже решу окончательно, какой формат использовать лучше

mc_hlebushek
() автор топика
Ответ на: комментарий от mc_hlebushek

Существенно - без разницы, но для музыки opus лучше из-за битрейта 192 против 128 у m4a, для речи вообще пофиг.

AKonia ★★★
()
Ответ на: комментарий от mc_hlebushek

Есть ли смысл перевести свою аудио-библиотеку с MP4/M4A на WebM?

Во-первых webm это контейнер mkv в который положили видео пожатое vp8/vp9/av1 и аудио пожатое vorbis или opus. Это формат видео. Во-вторых пережимать аудио пожатое lossy кодеком другим lossy кодеком (или ещё раз тем же самым кодеком) стоит только если ты хорошо представляешь зачем тебе это нужно. Например нужно уменьшить вес, или если твой плеер не поддерживает исходный формат. От повторного сжатия качество либо не изменится, либо ухудшится. Так нафига?

MrClon ★★★★★
()
Ответ на: комментарий от MrClon

Как минимум избавиться от несвободного ACC, тем более я только обрезаю аудио-файлы, а так-то YouTube сам предлагает Opus/WebM файл, просто перезакачать

mc_hlebushek
() автор топика
Ответ на: комментарий от mc_hlebushek

Если не лень по новой качать всю аудиотеку…

MrClon ★★★★★
()

Opus имеет самое высокое качество. На битрейте 200 kbps и выше еще никто не отличил от оригинала. Конвертировать лучше им. Если в Audacity он недоступен, можно воспользоваться Vorbis. Битрейт >= 192 kbps. Не пользуйся AAC энкодером от ffmpeg (тот, что в Audacity), он имеет плохое качество.

С ютуба лучше качать Opus (160k код 251). Он обычно имеет больше битрейт, чем AAC и сохраняет частоты до 20k (AAC до 16k). На ютубе используется довольно качественный AAC encoder (FHG или FDK), но Opus все равно лучше. К тому же еще неизвестно, что подавали на ютуб, может mp3 128k какой-нибудь.

anonymous
()
Ответ на: комментарий от anonymous

Opus имеет самое высокое качество.

Нет. Opus имеет наименьшее значение «битрейт/качество». А самое высокое качество у DSD.

anonymous
()
Ответ на: комментарий от anonymous

На ютубе используется довольно качественный AAC encoder (FHG или FDK)

Откуда инфа? ffprobe говорит что там AAC-LC.

anonymous
()
Ответ на: комментарий от anonymous

там AAC-LC.

И что бы эт значило? Хмм, давайте подумаем…

anonymous
()
Ответ на: комментарий от anonymous

Откуда инфа?

Отсюда поиск на странице по fhg.
И предположение, что FDK разрабатывался для гугловского андроида, а ютуб принадлежит гуглу. Кстати, битрейт там не строго CBR в классическом понимании, но размах довольно небольшой. Статья немного устарела, высокобитрейтных звуковых файлов на ютубе уже почти нет.

anonymous
()
Ответ на: комментарий от mc_hlebushek

Оригинальный файл
Format : dash

Поставь ffmpeg. Без него youtube-dl не сможет перепаковать dash в нормальный mp4. dash далеко не все железные плееры поймут.

anonymous
()
Ответ на: комментарий от anonymous

Я уже решил, что перехожу на WebM, а FFmpeg у меня и так есть...

Общее
Полное имя                               : D:\MØ - Kamikaze (Official Video).webm
Формат                                   : WebM
Версия формата                           : Version 4
Размер файла                             : 3,49 Мбайт
Продолжительность                        : 3 м. 39 с.
Общий поток                              : 133 Кбит/сек
Программа кодирования                    : google/video-file
Библиотека кодирования                   : google/video-file

Аудио
Идентификатор                            : 1
Формат                                   : Opus
Идентификатор кодека                     : A_OPUS
Продолжительность                        : 3 м. 39 с.
Каналы                                   : 2 канала
ChannelLayout                            : L R
Частота                                  : 48,0 КГц
Битовая глубина                          : 16 бит
Метод сжатия                             : С потерями
Язык                                     : English
Default                                  : Да
Forced                                   : Нет

mc_hlebushek
() автор топика
Ответ на: комментарий от mc_hlebushek
ffmpeg version git-2019-10-31-b414cff Copyright (c) 2000-2019 the FFmpeg developers
  built with gcc 9.2.1 (GCC) 20191010
  configuration: --enable-gpl --enable-version3 --enable-sdl2 --enable-fontconfig --enable-gnutls --enable-iconv --enable-libass --enable-libdav1d --e
nable-libbluray --enable-libfreetype --enable-libmp3lame --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable-libopus -
-enable-libshine --enable-libsnappy --enable-libsoxr --enable-libtheora --enable-libtwolame --enable-libvpx --enable-libwavpack --enable-libwebp --ena
ble-libx264 --enable-libx265 --enable-libxml2 --enable-libzimg --enable-lzma --enable-zlib --enable-gmp --enable-libvidstab --enable-libvorbis --enabl
e-libvo-amrwbenc --enable-libmysofa --enable-libspeex --enable-libxvid --enable-libaom --enable-libmfx --enable-ffnvcodec --enable-cuvid --enable-d3d1
1va --enable-nvenc --enable-nvdec --enable-dxva2 --enable-avisynth --enable-libopenmpt --enable-amf
  libavutil      56. 35.101 / 56. 35.101
  libavcodec     58. 60.100 / 58. 60.100
  libavformat    58. 33.100 / 58. 33.100
  libavdevice    58.  9.100 / 58.  9.100
  libavfilter     7. 66.100 /  7. 66.100
  libswscale      5.  6.100 /  5.  6.100
  libswresample   3.  6.100 /  3.  6.100
  libpostproc    55.  6.100 / 55.  6.100
Hyper fast Audio and Video encoder
mc_hlebushek
() автор топика
Ответ на: комментарий от mc_hlebushek

ffmpeg version git-2019-10-31-b414cff

Чо то я в твоём ffmpeg--enable-libfdk-aac не увидел. Не самая «перцовая» версия у тебя.

anonymous
()
Ответ на: комментарий от mc_hlebushek

FFmpeg у меня и так есть
Полное имя : D:\

Есть то он есть. Но лежит ли он в PATH на твоей винде и видит ли его youtube-dl? Перемести ffmpeg.exe в C:\Windows. Потом и в консоли можешь просто писать ffmpeg, а звуковые файлы перетаскивать в терминал.

Чо то я в твоём ffmpeg-е --enable-libfdk-aac не увидел. Не самая «перцовая» версия у тебя

Перцовую версию можно скачать отсюда https://oss.netfarm.it/mplayer/
libfdk-aac...7z нужно тоже скачать, распаковать и dll поместить рядом с ffmpeg.exe. То есть всё скинуть в C:\Windows
Но я бы не рекомендовал пользоваться fdk. Он поддерживает только 16 бит, а значит fixed point. Может быть клиппинг. Если ты будешь 5.1 дорожку конвертить им в стерео (-ac 2), для предотвращения клиппинга ffmpeg сильно занизит громкость.

Отсюда: https://ffmpeg.org/download.html

Там собирают без FDK из-за лицензионных ограничений.
Если уж кодировать в AAC, то с помощью QAAC.

anonymous
()
Ответ на: комментарий от MrClon

Ты наверное путаешь с расширениями, которые предлагали такой формат, потому что он очень востребован у народа. Но реализовывалось это так: сервер разработчика расширения скачивал aac, конвертил на своей стороне в mp3 и предлагал его для скачки. Нативные виндовые качалки те уже могли конвертировать на стороне клиента. И при этом все совершенно прозрачно. Как будто пользователь скачал mp3 с ютуба.

anonymous
()
Ответ на: комментарий от anonymous

Не, я его в выхлопе youtube-dl -F видел. Похоже это было легаси времён флешатины.

MrClon ★★★★★
()
Ответ на: комментарий от anonymous

Отсюда поиск на странице по fhg.
И предположение, что FDK разрабатывался для гугловского андроида, а ютуб принадлежит гуглу. Кстати, битрейт там не строго CBR в классическом понимании, но размах довольно небольшой. Статья немного устарела, высокобитрейтных звуковых файлов на ютубе уже почти нет.

Это всё не важно, можно просто взять их aac и проверить хотя бы ffprome'м. AAC есть трёх основных видов: aac-lc самый убогий, чуть лучше mp3, he-aac v1, he-aac v2. Последний по соотношению качество/битрейт лучший (где-то чуть-чуть уступая opus), первый худший и самый старый, им и закодировано аудио на Ютубе.

А разница там очень большая: he-aac v2 на битрейте 64kbps звучит лучше чем aac-lc на битрейте 128kbps.

anonymous
()
Ответ на: комментарий от anonymous

К сожалению, это не так. AAC-LC самая популярная разновидность формата AAC. Кодировать в AAC-LC могут разные кодировщики (QAAC, FHG, FDK, Nero, ffmpeg, FAAC, Mainconcept, Dolby и многие другие). Узнать какой применялся кодировщик обычно невозможно (ffprobe эту информацию не показывает), если только кодировщик не записал ее в метаданные.

aac-lc самый убогий, чуть лучше mp3

AAC-LC (особенно от QAAC, FHG и FDK) намного лучше mp3

he-aac v1, he-aac v2 лучшие

В профиле HE v1 все высокие частоты вырезаются и потом синтезируются декодером «по мотивам». В HE v2 для экономии еще и стереопанорама удаляется и тоже «восстанавливается» как придется. Эти профили никак не могут быть лучше AAC-LC на нормальных битрейтах.

На сверхнизких битрейтах, они действительно способны выдать более лучшее качество, чем LC (точнее, менее мерзское) за счет вышеописанных трюков, но это все сорта г. На средне-высоких битрейтах (96k и выше) использовать HE не имеет смысла и даже вредно. Тот, кто хорошо работал на низких битрейтах, не обязательно будет хорошо работать на высоких. Более того кодеры обычно сами переключаются на LC с определенных битрейтов и заставить их использовать HE нельзя. Низкие битрейты обычно используются для речи. Для них и используются ухищрения, а не для качественной музыки.

he-aac v2 на битрейте 64kbps звучит лучше чем aac-lc на битрейте 128kbps

Спорное утверждение. Тем более v2. В AAC-LC 128k срез обычно на 16k, но все частоты настоящие. Срез это не всегда плохо, кстати, он позволяет кодеру тратить битрейт на более полезные слышимые частоты, хоть это и не нравится любителям разглядывать спектры.

чуть-чуть уступая opus

Довольно сильно HE уступает опусу. Начнем с того, что даже на 64k Opus сохраняет все частоты до 20k (непонятно, правда, зачем) без синтезирования.

Боже мой, но откуда такие ламеры беруться? Школьники что-ли? Лучше бы уроки учили или ин. языки.

anonymous
()
Ответ на: комментарий от anonymous

беруться
берутся

fixed. Заговорился я тут.
Уйду я от вас, надоело.

anonymous
()
Ответ на: комментарий от anonymous

А ты, наверное, из тех, кто и mp3pro считал лучше обычного mp3? Маркетинг в действии. Каюсь, сам попался на эту удачку.

mp3pro - был такой формат по типу AAC-HE. Тоже ВЧ синтезировался. Обратно совместим с mp3. Обычные декодеры играли только частоты до 11кГц. Чтобы играть до 20кГц требовался специальный декодер, win only, конечно. Данные восстановления высоких частот хранились в тегах и малейшее их редактирование неспециализированным софтом приводило к удалению этой информации. mp3 превращался в убогую 11 кГц жатку. В Nero Wave Editor был доступен этот формат.

Теперь AAC. High-Efficiency это же так круто звучит. Не то что LC - Low Complexity. Маркетологи не зря свой хлеб едят.

anonymous
()
Ответ на: комментарий от anonymous

Если кто любит экзотику, вот кодер, обсуждение здесь.
Не надейтесь завести это на Linux.

Сравнение кодеров на 96 kbps
MP3 оказался лучше Vorbis'а из-за большего битрейта. QAAC разрабатывает Apple для iTunes Store, FHG институтом Fraunhofer (который изначально придумал MP3, кодер был доступен в Winamp), FDK - Google для Android.

Кстати, Winamp ожил. Рекомендую. Но теперь из него удалили все несвободные компоненты (включая FHG кодер). Скин Modern не переплюнул еще ни один плеер.

anonymous
()
Ответ на: комментарий от anonymous

Сначала про себя расскажи, тролль. Ну, ладно. Так и быть. Смотри, у Vorbis 5 проблемных треков (с оценкой 3), а у QAAC и MP3 всего 2. Хотя, это ерунда. Главное все сошлись на том, что FAAC намного хуже. Непонятно, правда, зачем было его тестировать, а не FHG, FDK, Nero и ffmpeg. Странные тесты.

У Vorbis'а какая-то лажа со стереопанорамой была, как они сказали. Может, глючный билд попался. От билда очень зависит выбор битрейта. Иными словами, на разных билдах при задании, например, -b 320k битрейт, который выберет кодер будет очень отличаться (и соотвественно качество). А Vorbis в принципе всегда занижает заданный битрейт. Я проводил тесты. Наибольший битрейт выбирает собственная сборка aoTuV. ffmpeg на среднем месте. Хуже всего какие-то оптимизированные билды.

алгоритм выбора битрейта OGG Vorbis несовершенен - присутствуют треки с низким битрейтом и относительно низким качеством

Еще заметил, в режиме битрейта Vorbis кодирует медленнее, чем в режиме целевого качества.

anonymous
()
Ответ на: комментарий от anonymous

в режиме битрейта …, чем в режиме целевого качества

Так тебе битрейт или качество? Определись уже.

anonymous
()
Ответ на: комментарий от anonymous

Говорят, Fraunhofer MP3 лучше, чем LAME MP3 на 128 kbps CBR.
Я сделал мини слепой тест (мне лень делать полноценный) на песне Smash!! - Belle. Мне сразу бросились в глаза (вернее в уши) склизливые тарелки, оказалось у LAME. Сам голос (ВЧ) норм.

Не надейтесь завести это на Linux

Закодить через Wine, конечно, можно.

Vorbis всегда занижает заданный битрейт

Но в заголовке остается заданное стандартное значение. Реальное значение битрейта можно увидеть в данных контейнера и оно будет меньше (на сложных файлах больше). Например:

General
Complete name                            : vorbis.ogg
Format                                   : Ogg
File size                                : 3.66 MiB
Duration                                 : 4 min 47 s
Overall bit rate mode                    : Variable
Overall bit rate                         : 107 kb/s

Audio
Format                                   : Vorbis
Format settings, Floor                   : 1
Duration                                 : 4 min 47 s
Bit rate mode                            : Variable
Bit rate                                 : 128 kb/s
Channel(s)                               : 2 channels
Sampling rate                            : 44.1 kHz
Compression mode                         : Lossy
Stream size                              : 3.51 MiB (96%)

anonymous
()
Ответ на: комментарий от anonymous

Smash!! - Belle

Кстати, французы не признали в них русских, скорее из Ближнего Востока. Но акцент небольшой есть, у Влада меньше (однако R больше выделяет). Хотя еще год назад в групее «Непоседы» они исполняли Belle намного хуже, когда Сергею было 18, а Владу 16.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.