Примеры данных, которые я получаю от регистратора работы устройства
df1 <- read.table(text = "temp.1
heating
heating
heating
heating
heating
heating
heating
heating
cooling
heating
heating
heating
heating
heating
heating
cooling
cooling
cooling
cooling
cooling
cooling
cooling
heating
heating
heating
cooling
cooling
heating
heating
heating
cooling
heating
heating
heating
heating
cooling
cooling
cooling
cooling
heating
heating
heating
cooling
heating
cooling
heating
cooling
heating
heating
heating
heating", header = TRUE)
Иногда во время «нагревания» будет наблюдаться однократное (до двухкратного) «охлаждение». Это ошибка, и я бы хотел, чтобы эти значения игнорировались. Хотелось бы отметить скважность после такой коррекции. Маркировка также должна содержать порядковый номер – необходима информация о том, сколько циклов нагрева и охлаждения произошло в данный день. Ожидаемый результат:
> df1
temp.1 level
1 heating H.1
2 heating H.1
3 heating H.1
4 heating H.1
5 heating H.1
6 heating H.1
7 heating H.1
8 heating H.1
9 cooling H.1
10 heating H.1
11 heating H.1
12 heating H.1
13 heating H.1
14 heating H.1
15 heating H.1
16 cooling C.1
17 cooling C.1
18 cooling C.1
19 cooling C.1
20 cooling C.1
21 cooling C.1
22 cooling C.1
23 heating H.2
24 heating H.2
25 heating H.2
26 cooling H.2
27 cooling H.2
28 heating H.2
29 heating H.2
30 heating H.2
31 cooling H.2
32 heating H.2
33 heating H.2
34 heating H.2
35 heating H.2
36 cooling C.2
37 cooling C.2
38 cooling C.2
39 cooling C.2
40 heating H.3
41 heating H.3
42 heating H.3
43 cooling H.3
44 heating H.3
45 cooling H.3
46 heating H.3
47 cooling H.3
48 heating H.3
49 heating H.3
50 heating H.3
51 heating H.3
РЕДАКТИРОВАТЬ2: Был еще один случай, которого я не ожидал, и мой вопрос был неточным. Пожалуйста, посмотрите стихи 51-53. Когда серия «охлаждения» прерывается однократным «нагревом», это также следует игнорировать. Я пытался изменить ваше решение, но безуспешно
df1
temp.1 level
1: heating H.1
2: heating H.1
3: heating H.1
4: heating H.1
5: heating H.1
6: heating H.1
7: heating H.1
8: heating H.1
9: cooling H.1
10: heating H.1
11: heating H.1
12: heating H.1
13: heating H.1
14: heating H.1
15: heating H.1
16: cooling C.1
17: cooling C.1
18: cooling C.1
19: cooling C.1
20: cooling C.1
21: cooling C.1
22: cooling C.1
23: heating H.2
24: heating H.2
25: heating H.2
26: cooling H.2
27: cooling H.2
28: heating H.2
29: heating H.2
30: heating H.2
31: cooling H.2
32: heating H.2
33: heating H.2
34: heating H.2
35: heating H.2
36: cooling C.2
37: cooling C.2
38: cooling C.2
39: cooling C.2
40: heating H.3
41: heating H.3
42: heating H.3
43: cooling H.3
44: heating H.3
45: cooling H.3
46: heating H.3
47: cooling C.3
48: cooling C.3
49: cooling C.3
50: cooling C.3
51: cooling C.3
52: heating C.3
53: cooling C.3
54: cooling C.3
55: cooling C.3
56: heating H.4
57: heating H.4
58: heating H.4
Появление «охлаждения» после «нагрева» 3 раза или «нагрева» после «охлаждения» 3 раза меняет категорию на «уровень». Поэтому строки 26-27 считаются ошибками, а строки 23-25 предназначены для изменения "уровня".





data.table подход
library(data.table)
# set to data.table format
setDT(df1)
# initialise heating or cooling level
df1[, level := toupper(substr(temp.1,1,1))]
# override level of groupsizes size 2 or less with "H"
df1[, level := if (.N <= 2) "H", by = .(rleid(temp.1))]
# tamporary value for indexing, can be dropped at the end
df1[, temp := rleid(level)]
# create the correct level id, and afterwards drop the temp column
df1[, level := paste(level, as.integer(factor(temp)), sep = "."), by = .(level)][, temp := NULL][]
обновление для обновленных данных образца/желаемого результата
library(data.table)
setDT(df1)
# determine groups of 3 (or more) consecutive temp.1
df1[, group := if (.N >= 3) .GRP, by = .(rleid(temp.1))]
# fill down missing groupnumbers
setnafill(df1, type = "locf", cols = "group")
# set level letter (from initial answer)
df1[, level := toupper(substr(temp.1[1],1,1)), by = .(group)]
df1[, temp := rleid(level)]
df1[, level := paste(level, as.integer(factor(temp)), sep = "."), by = .(level)][, temp := NULL][]
для редактирования: как бы вы могли определить, является ли строка 52 или строка 53 ошибкой?
Я отредактировал его еще раз, чтобы выделить случай, с которым у меня возникла проблема.
См. обновленный ответ выше. Кажется, работает немного другой подход.
Дамы и господа, вот гений (имеется в виду слова Роберта Шумана о Фридерике Шопене). Прекрасно работает. Благодаря вам
Ваше решение великолепно. Однако мой вопрос не был точным. Можете ли вы посмотреть мой пост после редактирования?