Я работаю в MATLAB с данными сигнала, которые состоят из последовательных провалов, как показано ниже. Я пытаюсь написать код, который сортирует содержимое каждого провала в отдельную группу. Как должна выглядеть общая структура такого кода?
Далее мои данные. Меня интересует только часть сигнала, которая находится ниже определенного порога d (красная линия):

И вот желаемая группировка:

Вот неудачная попытка:
k=0; % Group number
for i = 1 : length(signal)
if signal(i) < d
k=k+1;
while signal(i) < d
NewSignal(i, k) = signal(i);
i = i + 1;
end
end
end
Приведенный выше код сгенерировал 310 групп вместо желаемых 12 групп.
Любое объяснение будет принята с благодарностью.
Почему бы вам не создать логический массив путем сравнения с вашим порогом. Найдите все подпоследовательности в этом массиве (последовательные индексы), и у вас есть свои группы.
Этот отвечать ищет самый длинный продолжающийся массив выше порогового значения. Чтобы настроить этот код для поиска всех массивов (в вашем случае ниже порога), должно быть очень просто
@CrisLuengo Нет. Я внимательно изучил свои данные. Точки данных в провалах не колеблются выше порога. Проблема должна быть связана с тем, как написаны мои циклы.
@Irreducible Большое спасибо за ссылку. Пример с использованием регулярного выражения работает для моих данных. Но проблема в том, что при каждом запуске код находит провал с наибольшим количеством элементов в нем. Знаете ли вы, как изменить код, чтобы он последовательно группировал провалы? Например, я хочу назначить элементы dip 1 в группу 1, элементы dip 2 в группу 2 и т. д.
Да, вместо того, чтобы брать индексы с наибольшим количеством элементов, просто возьмите все начало и конец из регулярного выражения, каждая пара представляет собой группу





Легко, функция, которую вы ищете, это bwlabel, которая в сочетании с логической индексацией делает это простым.
Для начала я сделал несколько поддельных данных, которые напоминали ваши данные.
x=1:1000;
y=sin(x/20);
for ii=1:9
y=y+-10*exp(-(x-ii*100).^2./10);
end
y=awgn(y,4);
plot(x,y)
Затем установите порог и используйте «bwlabel».
d=-4;% set the threshold
groupid=bwlabel(y<d);
bwlabel помечает соединенные группы в черно-белом изображении, здесь мы эффективно сделали черно-белое (логические 0 и 1) одномерное изображение в логическом векторе y<d. bwlabel возвращает номер региона по индексу региона. Нас не интересует область 0, поэтому, чтобы получить значения x или значения y области n, просто используйте x(groupid==n), например, с моими тестовыми данными.
x_4=x(groupid==4)
y_4=y(groupid==4)
x_4 = 398 399 400 401 402
y_4 = -5.5601 -7.8280 -9.1965 -7.9083 -5.8751
Привет, это очень интересный подход. Но когда я применяю его к своим данным, в некоторых случаях элементы одного провала сохраняются более чем в одной группе. У меня получилось 20 групп вместо необходимых 12.
В MATLAB вы не можете изменить индекс цикла for цикла. Цикл for:
for i = array
петли над каждым столбиком array по очереди. В вашем коде 1 : length(signal) — это массив, каждый из его элементов посещается по очереди. Внутри этого цикла есть цикл while, который увеличивает i. Однако, когда этот цикл while завершается и выполняется следующая итерация цикла for, i сбрасывается на следующий элемент в массиве.
Таким образом, этому коду нужно два цикла while:
i = 1; % Index
k = 0; % Group number
while i <= numel(signal)
if signal(i) < d
k = k + 1;
while signal(i) < d
NewSignal(i,k) = signal(i);
i = i + 1;
end
end
i = i + 1;
end
Используя сгенерированные Benl данные, вы можете сделать следующее:
%generate data
x=1:1000;
y=sin(x/20);
for ii=1:9
y=y+-10*exp(-(x-ii*100).^2./10);
end
y=awgn(y,4);
%set threshold
t=-4;
%threshold data
Y = char(double(y<t) + '0'); %// convert to string of zeros and ones
%search for start and ends
Идея принята отсюда
[s, e] = regexp(Y, '1+', 'start', 'end');
%and now plot and see that each pair of starts and end
% represents a group
plot(x,y)
hold on
for k=1:numel(s)
line(s(k)*ones(2,1),ylim,'Color','k','LineStyle','--')
line(e(k)*ones(2,1),ylim,'Color','k','LineStyle','-')
end
hold off
legend('Data','Starts','Ends')
Комментарии: Прежде всего, я выбираю произвольное пороговое значение, а вы должны найти «лучшее» в своих данных. Кроме того, я не группировал данные явно, а скорее этот подход дает вам начало и конец каждой эпохи с провалом (вы можете назвать это группой). Таким образом, вы могли бы сказать, что каждый индекс является индексом группировки. Наконец, я не стал отлаживать этот подход для крайних случаев, когда провалы приходятся на начало и конец...
Мне удалось использовать этот подход, но пришлось немного сгладить данные. В общем, проблема в том, что в исходных данных он часто находит более одной подпоследовательности на провал. Я имею в виду, что как только код идентифицирует самые большие строки из всех провалов, он продолжает находить меньшие строки из ранее определенных провалов. Есть ли способ настроить код так, чтобы мы по-прежнему получали один набор данных для каждого провала (без сглаживания)? Что было бы хорошим способом сказать программе игнорировать строки, расположенные рядом с ранее зарегистрированными регионами?
Моей первой мыслью было бы, что это связано с порогом, однако, не зная ваших данных и того, как именно вы реализовали код в своем случае, трудно предложить что-либо значимое. Я бы посоветовал вам открыть новый вопрос с вашим кодом, в лучшем случае с набором данных для примера, и показать нам желаемый и полученный результат.
Не могли бы вы уточнить, что вы имеете в виду под «группами»? Очевидно, у вас есть непрерывные данные. Итак, вам нужен, например, массив ячеек или структура (с 12 элементами), хранящая все
(t, y)данные для каждой «группы»? Массив ячеек или структура, поскольку я предполагаю, что количество точек данных на «группу» может варьироваться.