Разница между выводом python librosa.core.stft() и спектрограммой Matlab (x)

Я конвертирую код Python в MATLAB. В коде Python используется следующая команда:

stft_ch = librosa.core.stft(audio_input[:, ch_cnt], n_fft=self._nfft, 
                            hop_length=self._hop_len, win_length=self._win_len, 
                            window='hann')

Где audio_input.shape=(2880000, 4), self._nfft=2048, self._hop_len=960 и self._win_len=1920.

При конвертации в MATLAB я использовал:

stft_ch = spectrogram(audio_input(:, ch_cnt), hann(win_len), win_len-hop_len, nfft);

где я проверил size(audio_input)=2880000, 4, win_len=1920, win_len-hop_len=960 и nfft=2048.

Я получаю вывод из MATLAB с size(stft_ch)=1025, 2999, где Python показывает stft_ch.shape=(1025, 3001). Размер 2999 в выводе MATLAB ясен и соответствует документация, где k = ⌊(Nx – noverlap)/(length(window) – noverlap)⌋, если окно является вектором.

Однако я не смог найти в Документация по Python, как задается длина t.

Почему существует разница в размерах? Моя конверсия хороша?

Есть ли функция Python, которая производит вывод, более похожий на MATLAB spectrogram(), чтобы я мог получить сложный вывод того же размера?

python matlab

02.04.2019 14:16

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

1 044

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

После долгого времени и неудовлетворенной щедрости я сам нашел ответ.

Функция MATLAB spectrogram() выводит вектор времени, который соответствует середине каждого окна, опуская последнее окно. Например, сигнал длиной 10 отсчетов с окном из 3 отсчетов и перекрытием 1 отсчета приведет к следующим 4 окнам:

1:3, 3:5, 5:7, 7:9, где m:n представляет собой окно, включающее образцы от m до n, включая n-й образец.

Таким образом, центрами окон будут: 2,4,6,8. Обратите внимание, что 10-й образец не включен.

Кажется, что MATLAB требует, чтобы максимальное number_of_windows было подчинено (number_of_windows-1)*hop_length+window_size<=number_of_samples.

В версии Python liberosa.core.stft() наоборот, t — это время первой выборки для каждого кадра, и кадры охватывают больше, чем входной сигнал. например, сигнал длиной 10 сэмплов с окном из 3 сэмплов и 2 скачками сэмпла (скачки, а не перекрытия) приведет к следующим 4 окнам:

1:3,3:5,5:7,7:9,9:11, где m:n представляет собой окно, включающее образцы от m до n, включая n-й образец.

Таким образом, началами для окон будут: 1,3,5,7,9. Обратите внимание, что включен 11-й несуществующий образец.

Кажется, что либероза требует минимального number_of_windows, подчиненного number_of_windows*hop_length>number_of_samples.

В моем случае:

(2999-1)*960+1920=2880000<=2880000 для MATLAB. 3001*960=2880960>2880000, а 30000*960=2880000!> 2880000 в питоне.

Обратите внимание, что время можно центрировать в Python, установив флаг center=True.

Это лучшее объяснение, которое я смог найти. Любое другое объяснение будет приветствоваться в качестве ответа.

18.06.2019 13:12

Другие вопросы по теме

Повторная выборка векторного массива 2 в Matlab и вывод в том же измерении

MATLAB ухудшает качество изображения

Преобразование имен переменных массива в строку

Как извлечь метаданные изображения с помощью MATLAB?

Как я могу импортировать данные с неравной длиной строки

Построить трехмерную траекторию / путь моего БПЛА без GPS

Как настроить контурные линии в Matlab?

Изображение в градациях серого занимает больше места на диске, чем RGB, при экспорте с помощью команды MATLAB imwrite

Как найти полный путь к приложению или файлу в Linux?

Как написать код для запуска функции и извлечения из нее значений

Разница между выводом python librosa.core.stft() и спектрограммой Matlab (x)

Ответы 1

Другие вопросы по теме

Похожие вопросы