У меня есть фрейм данных df следующим образом:
A B
21k2 b 1
2412 9 p
И A, и B являются строками.
Я хотел бы, чтобы элементы столбца A были обрезаны следующим образом:
A B
21k2 1
2412 p
Дополнительные благодарственные баллы, если вы также можете показать, как удалить что-либо перед пробелом.
Вы можете использовать функцию split
и метод getItem
.
df = df.select(F.split('A', ' ').getItem(0).alias('A'), 'B')
Было бы лучше создать переменную split_col с F.split раньше и использовать withColumnRenamed, если у вас много столбцов.
это панды