У меня есть набор данных, который выглядит примерно так:
| col_1 | col_2 | col_3 |
|---|---|---|
| 0 | нан | нан |
| нан | 1 | нан |
| нан | нан | нан |
| нан | нан | 1 |
И мне нужно свернуть эти столбцы во что-то вроде этого:
| фу |
|---|
| 0 |
| 1 |
| нан |
| 1 |
Моя первая попытка заключалась в следующем:
df[columns].values[~df[columns].isna()]
Но так как есть строки, где все значения равны nan, я пропускаю эти строки.
Моя вторая попытка заключалась в следующем:
def get_cols_or_nan(row):
mask = ~row.isna()
if np.any(mask):
return row[mask][0]
return float('nan')
df[columns].apply(get_cols_or_nan, axis=1)
Но, я не знаю почему, это значительно медленнее до такой степени, что для меня это невыполнимо.
Есть ли более эффективный способ свернуть эти столбцы? Мне гарантируется, что в каждой строке есть только одно значение, отличное от nan.
Я не видел последний комментарий, значит, он закрыт в здесь






Если у вас есть не более одного значения, отличного от NA, в строке, вы можете использовать:
df.stack().droplevel(1).reindex_like(df)
выход:
0 0.0
1 1.0
2 NaN
3 1.0
dtype: float64
Вы можете найти максимальное число в строках с помощью df.max(axis=1)
out = df.max(axis=1).to_frame('foo')
print(out)
foo
0 0.0
1 1.0
2 NaN
3 1.0
что должно произойти, если у вас также есть число в первой строке для col2?