Группировка данных с помощью циклов (обработка сигналов в MATLAB)

Я работаю в MATLAB с данными сигнала, которые состоят из последовательных провалов, как показано ниже. Я пытаюсь написать код, который сортирует содержимое каждого провала в отдельную группу. Как должна выглядеть общая структура такого кода?

Далее мои данные. Меня интересует только часть сигнала, которая находится ниже определенного порога d (красная линия):

И вот желаемая группировка:

Группировка данных с помощью циклов (обработка сигналов в MATLAB)

Вот неудачная попытка:

k=0; % Group number

for i = 1 : length(signal)
    if signal(i) < d
        k=k+1;
        while signal(i) < d
            NewSignal(i, k) = signal(i);
            i = i + 1; 
        end
    end
end

Приведенный выше код сгенерировал 310 групп вместо желаемых 12 групп.

Любое объяснение будет принята с благодарностью.

Не могли бы вы уточнить, что вы имеете в виду под «группами»? Очевидно, у вас есть непрерывные данные. Итак, вам нужен, например, массив ячеек или структура (с 12 элементами), хранящая все (t, y) данные для каждой «группы»? Массив ячеек или структура, поскольку я предполагаю, что количество точек данных на «группу» может варьироваться.

— 26.04.2019 15:08

Почему бы вам не создать логический массив путем сравнения с вашим порогом. Найдите все подпоследовательности в этом массиве (последовательные индексы), и у вас есть свои группы.

— 26.04.2019 15:15

Этот отвечать ищет самый длинный продолжающийся массив выше порогового значения. Чтобы настроить этот код для поиска всех массивов (в вашем случае ниже порога), должно быть очень просто

— 26.04.2019 15:20

@CrisLuengo Нет. Я внимательно изучил свои данные. Точки данных в провалах не колеблются выше порога. Проблема должна быть связана с тем, как написаны мои циклы.

— 27.04.2019 06:37

@Irreducible Большое спасибо за ссылку. Пример с использованием регулярного выражения работает для моих данных. Но проблема в том, что при каждом запуске код находит провал с наибольшим количеством элементов в нем. Знаете ли вы, как изменить код, чтобы он последовательно группировал провалы? Например, я хочу назначить элементы dip 1 в группу 1, элементы dip 2 в группу 2 и т. д.

— 27.04.2019 08:26

Да, вместо того, чтобы брать индексы с наибольшим количеством элементов, просто возьмите все начало и конец из регулярного выражения, каждая пара представляет собой группу

— 27.04.2019 08:31

algorithm matlab for-loop while-loop signal-processing

26.04.2019 14:59

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

107

Перейти к ответу Данный вопрос помечен как решенный

Ответы 3

Легко, функция, которую вы ищете, это bwlabel, которая в сочетании с логической индексацией делает это простым.

Для начала я сделал несколько поддельных данных, которые напоминали ваши данные.

x=1:1000;
y=sin(x/20);
for ii=1:9
    y=y+-10*exp(-(x-ii*100).^2./10);
end
y=awgn(y,4);
plot(x,y)

Затем установите порог и используйте «bwlabel».

d=-4;% set the threshold

groupid=bwlabel(y<d);

bwlabel помечает соединенные группы в черно-белом изображении, здесь мы эффективно сделали черно-белое (логические 0 и 1) одномерное изображение в логическом векторе y<d. bwlabel возвращает номер региона по индексу региона. Нас не интересует область 0, поэтому, чтобы получить значения x или значения y области n, просто используйте x(groupid==n), например, с моими тестовыми данными.

x_4=x(groupid==4)
y_4=y(groupid==4)

x_4 = 398   399   400   401   402
y_4 = -5.5601   -7.8280   -9.1965   -7.9083   -5.8751

Привет, это очень интересный подход. Но когда я применяю его к своим данным, в некоторых случаях элементы одного провала сохраняются более чем в одной группе. У меня получилось 20 групп вместо необходимых 12.

— 27.04.2019 08:28

26.04.2019 17:45

В MATLAB вы не можете изменить индекс цикла for цикла. Цикл for:

for i = array

петли над каждым столбиком array по очереди. В вашем коде 1 : length(signal) — это массив, каждый из его элементов посещается по очереди. Внутри этого цикла есть цикл while, который увеличивает i. Однако, когда этот цикл while завершается и выполняется следующая итерация цикла for, i сбрасывается на следующий элемент в массиве.

Таким образом, этому коду нужно два цикла while:

i = 1; % Index
k = 0; % Group number
while i <= numel(signal)
    if signal(i) < d
        k = k + 1;
        while signal(i) < d
            NewSignal(i,k) = signal(i);
            i = i + 1; 
        end
    end
    i = i + 1;
end

27.04.2019 07:09

Ответ принят как подходящий

Используя сгенерированные Benl данные, вы можете сделать следующее:

%generate data
x=1:1000;
y=sin(x/20);
for ii=1:9
    y=y+-10*exp(-(x-ii*100).^2./10);
end
y=awgn(y,4);


%set threshold
t=-4;
%threshold data
Y = char(double(y<t) + '0'); %// convert to string of zeros and ones
%search for start and ends

Идея принята отсюда

[s, e] = regexp(Y, '1+', 'start', 'end');

%and now plot and see that each pair of starts and end
% represents a group
plot(x,y)
hold on
for k=1:numel(s)
line(s(k)*ones(2,1),ylim,'Color','k','LineStyle','--')
line(e(k)*ones(2,1),ylim,'Color','k','LineStyle','-')
end
hold off
legend('Data','Starts','Ends')

Processed Data

Комментарии: Прежде всего, я выбираю произвольное пороговое значение, а вы должны найти «лучшее» в своих данных. Кроме того, я не группировал данные явно, а скорее этот подход дает вам начало и конец каждой эпохи с провалом (вы можете назвать это группой). Таким образом, вы могли бы сказать, что каждый индекс является индексом группировки. Наконец, я не стал отлаживать этот подход для крайних случаев, когда провалы приходятся на начало и конец...

Мне удалось использовать этот подход, но пришлось немного сгладить данные. В общем, проблема в том, что в исходных данных он часто находит более одной подпоследовательности на провал. Я имею в виду, что как только код идентифицирует самые большие строки из всех провалов, он продолжает находить меньшие строки из ранее определенных провалов. Есть ли способ настроить код так, чтобы мы по-прежнему получали один набор данных для каждого провала (без сглаживания)? Что было бы хорошим способом сказать программе игнорировать строки, расположенные рядом с ранее зарегистрированными регионами?

— 29.04.2019 13:36

Моей первой мыслью было бы, что это связано с порогом, однако, не зная ваших данных и того, как именно вы реализовали код в своем случае, трудно предложить что-либо значимое. Я бы посоветовал вам открыть новый вопрос с вашим кодом, в лучшем случае с набором данных для примера, и показать нам желаемый и полученный результат.

— 29.04.2019 14:00

27.04.2019 08:38