Я заметил, что df.rename(columns=str.lower) можно использовать, а df.rename(columns=str.replace(" ", "_")) — нет.
Это потому, что разрешено использовать переменную, в которой хранится метод (str.lower), но нельзя вызывать метод (str.lower())?
Есть аналогичный вопрос, почему сообщение об ошибке df.rename(columns=str.replace(" ", "_")) довольно запутанное – без ответа на этот вопрос.
Можно ли использовать методы аксессора .str (из pd.DataFrame().columns) внутри df.rename(columns=...)?
Единственное решение, которое я придумал до сих пор, это
df = df.rename(columns=dict(zip(df.columns, df.columns.str.replace(" ", "_"))))
но, может быть, есть что-то более последовательное и похожее на стиль df.rename(columns=str.lower)? Я знаю, что df.rename(columns=lambda x: x.replace(" ", "_") работает, но он не использует метод доступа .str столбцов pandas, он использует str.replace() стандартной библиотеки.
Цель вопроса - изучить возможности использования методов pandas str при переименовании столбцов в цепочке методов, поэтому df.columns = df.columns.str.replace(' ', '_') мне не подходит.
В качестве примера df предположим:
df = pd.DataFrame([[0,1,2]], columns=["a pie", "an egg", "a nut"])






df.rename принимает объект функции (или другой вызываемый объект).
В первом случае str.lower — функция. Однако str.replace(" ", "_") вызывает функцию и оценивает результат, хотя в этом случае вызов неверен и вызывает ошибку. Но вы не хотите передавать результат вызова функции, вы хотите передать функцию.
Итак, что-то вроде
def space_to_dash(col):
return col.replace(" ", "_")
df.rename(columns=space_to_dash)
Или используйте лямбда-выражение:
df.rename(columns=lambda col: col.replace(" ", "_"))
Обратите внимание: df.rename(columns=str.lower) также не использует метод доступа .str, он использует встроенный метод str. Поэтому я думаю, что вы запутались.
Теперь вы можете использовать аксессор .str для объекта индекса столбца, поэтому:
df.columns.str.replace(" ", "_")
Но тогда вам нужно будет сделать то, что, как вы уже сказали, вы не хотите делать:
df.columns = df.columns.str.replace(" ", "_")
Важно отметить, что это изменяет исходный объект фрейма данных на месте, а не df.rename, который возвращает новый объект фрейма данных. Непонятно, почему вы хотите использовать аксессор .str, в этом ли причина?
Спасибо. Я думаю, невозможно использовать аксессор pandas
.strвdf.rename(columns=...), кроме как я написал? Я подумал, что было бы лучше, если бы цепочка методов оставалась внутри методов pandas с аксессором.strдля переименования столбцов, но, похоже, аксессоры.strздесь бесполезны.