Я разрабатываю систему, которая обращается к веб-камере пользователя и хочет проверить, хороший ли уровень звука (не очень громкий или очень низкий). Я думал протестировать его на нескольких видео и на себе, чтобы найти приемлемый диапазон дБ и использовать его в качестве пороговых значений для системы. Имеет ли смысл попробовать это, используя дБ в качестве измерения, особенно если я не знаю, какое оборудование пользователь использует для записи звука? Я не планирую делать это в режиме реального времени, а вместо этого запишу короткий клип, в котором пользователь говорит и анализирует это.
Существует множество способов измерения «громкости».
Значения выборки PCM, которые вы собираетесь получить в своем программном обеспечении, фактически являются мгновенными измерениями сигнала с плавающей запятой. Они будут иметь диапазон от -1.0
до +1.0
. (Невозможно определить фактическое звуковое давление в децибелах в комнате без какой-либо калибровки.)
Тот факт, что значение семпла достигает 1.0
или -1.0
, не обязательно означает, что у вас «громкий» звук! Если он мелькает там на один-два семпла и тут же останавливается, у вас довольно тихий щелчок. Измерение максимального абсолютного значения дает вам пиковое значение, которое часто коррелирует с громкостью, но это не совсем то же самое.
Существует несколько стандартов определения громкости. Похоже, вы хотите реализовать свой собственный, но вы можете использовать существующий стандарт, чтобы начать свое исследование. См. также: https://www.tcelectronic.com/brand/tcelectronic/loudness-explained
@jaket Как это? Не могли бы вы сказать, что либо -1.0
, либо +1.0
равны 0 dBFS? С удовольствием поправлю и/или уточню. Спасибо.
20*log10(-1) равно -бесконечности. dBFS специально определяется таким образом, что среднеквадратическая амплитуда синуса полной шкалы (от -1 до 1) равна 0 dBFS. Среднеквадратическая амплитуда полномасштабного прямоугольного сигнала составляет +3 дБ полной шкалы. Полагаю, я пытаюсь сказать, что любые измерения громкости, о которых я знаю, включая среднеквадратичное значение, включают некоторую интеграцию во времени, и это делает последнее предложение первого полного абзаца немного запутанным. Ваше здоровье
@jaket Да, полностью согласен с громкостью, я имел в виду пиковый уровень сигнала. Я уберу этот ответ, чтобы уточнить. Спасибо за ваши Коментарии.
Я не думаю, что совершенно правильно приравнивать мгновенные значения выборки от -1,0 до 1,0 к дБ.