У меня есть фрейм данных, например df:
df = pd.DataFrame({'Months': [4, 3], 'Type': ['A', 'B'], 1: [0, 1], 2: [0, 1], 3: [2, 1], 4: [2, 0], 5: [0, 0], 6: [0, 0], 7: [0, 0], 8: [0, 0], 9: [0, 0]})
Months Type 1 2 3 4 5 6 7 8 9
0 4 A 0 0 2 2 0 0 0 0 0
1 3 B 1 1 1 0 0 0 0 0 0
Для каждой строки я хотел бы посмотреть на значение df["Months"]
(это будет количество столбцов, которые мы должны «перепрыгнуть»). Если в df[1]
или за его пределами есть значение выше 0
, я бы хотел перепрыгнуть столбцы n
на основе числа в df["Months"]
, а затем добавить это же число, но умноженное на -1
.
Итак, результат должен быть таким:
df = pd.DataFrame({'Months': [4, 3], 'Type': ['A', 'B'], 1: [0, 1], 2: [0, 1], 3: [2, 1], 4: [2, 0], 5: [0, -1], 6: [0, -1], 7: [0, -1], 8: [-2, 0], 9: [-2, 0]})
Months Type 1 2 3 4 5 6 7 8 9
0 4 A 0 0 2 2 0 0 0 -2 -2
1 3 B 1 1 1 0 -1 -1 -1 0 0
Кто-нибудь может мне помочь?
Например, в первой строке df["Months"] равен 4. Впервые значение, отличное от 0, должно быть найдено в df[3]. Затем мы должны перейти к следующим 4 столбцам и снова добавить это значение, но теперь умноженное на -1... это должно быть -2. После этого он должен сделать то же самое для следующего столбца или там, где он находит значение, отличное от 0.
Не могли бы вы уточнить add the value again
? Вы выбираете значение из df[3], умножаете его на -1 и помещаете в df[8]? Что, если df[8] имеет ненулевое число? Под переходом вы подразумеваете добавление значения перехода + 1 к индексу (переход на 4 из df[3] означает переход к df[3+4+1])? After this, it should do the same thing
вы имеете в виду, что мы идем к df[4] и повторяем операцию? Когда же тогда мы остановим алгоритм?
В чем именно вам нужна помощь? Мол, что вы пробовали и где застряли? Эта задача состоит из нескольких частей, поэтому неясно, с какой из них у вас возникли трудности. Например, умеете ли вы использовать df.apply()
и Series.shift()
? Возможно, вы захотите прочитать Почему вопрос «Может ли кто-нибудь мне помочь?» не полезный вопрос?
«сложить… но умножить на -1» — разве это не длинный способ сказать «вычесть»?
Эта часть описания может сбить с толку: «... число в df["Months"]
, а затем добавить это же число...», поскольку «то самое число» звучит так, как будто оно относится к «числу в df["Months"]
».
Начиная с:
Months Type 1 2 3 4 5 6 7 8 9
0 4 A 0 0 2 2 0 0 0 0 0
1 3 B 1 1 1 0 0 0 0 0 0
Делает:
# Move these columns to the index.
df = df.set_index(["Months", "Type"])
# Apply a per-row function that shifts all values by Months + 1
# and then multiplies by -1.
# Add the original and modified dfs together.
out = df + df.apply(
lambda x: x.shift(x.name[0] + 1, fill_value=0).mul(-1),
axis=1,
)
# Reset the index.
out = out.reset_index()
Выход:
Months Type 1 2 3 4 5 6 7 8 9
0 4 A 0 0 2 2 0 0 0 -2 -2
1 3 B 1 1 1 0 -1 -1 -1 0 0
Не могли бы вы пояснить правило на примере первой строки? (1) Вы берете 4 из «Месяцев». (2) К какому столбцу вы перепрыгиваете — 4 (
4:[2, 0]
)? (3) Что вы делаете дальше — берете значение из 4-го столбца, равное 2? (4) Что дальше — вы снова прыгаете на 4 столбца, чтобы добраться до столбца8:[-2, 0]
? (5) Что дальше — вы умножаете все следующие столбцы после 8-го на отрицательное значение, полученное на шаге (3)?