В приведенном ниже коде я заменяю все значения NaN
из столбца b
пустой строкой, если соответствующее значение в столбце a
равно 1.
Код работает, но мне приходится дважды набирать df.loc[df.a == 1, 'b']
.
Есть ли более короткий/лучший способ сделать это?
import pandas as pd
df = pd.DataFrame({
'a': [1, None, 3],
'b': [None, 5, 6],
})
filtered = df.loc[df.a == 1, 'b']
filtered.fillna('', inplace=True)
df.loc[df.a == 1, 'b'] = filtered
print(df)
Используйте Series.fillna
только для совпадающих значений по условию:
df.loc[df.a == 1, 'b'] = df['b'].fillna('')
@jezrael: Спасибо, это работает. Не могли бы вы объяснить, как это возможно, ведь df.loc[df.a == 1, 'b']
и df['b']
имеют разную длину: 1 и 3?
@barciewicz - я думаю, что это работает так же, как присваивание всех значений из df['b'].fillna('')
, но только для отфильтрованных значений столбца df['b']
как насчет использования предложения numpy where
для проверки значений в a и b и замены? см. макет ниже. Я использовал столбец «c
», чтобы проиллюстрировать
import pandas as pd
import numpy as np
df = pd.DataFrame({
'a': [1, None, 3],
'b': [None, 5, 6],
})
#replace b value if the corresponding value in column a is 1 and column b is NaN
df['c'] = np.where(((df['a'] == 1) & (df['b'].isna())), df['a'], df['b'])
df
исходный фрейм данных
a b
0 1.0 1.0
1 NaN 5.0
2 3.0 6.0
результат:
a b c
0 1.0 NaN 1.0
1 NaN 5.0 5.0
2 3.0 6.0 6.0
Use where() to do it in one line
import numpy as np
df['b'] = np.where((df['b'].isnull()) & (df['a']==1),'',df['a'])
Привет от Очередь сообщений низкого качества :)