У меня есть фрейм данных pandas, экспортированный в CSV, в котором хранятся индекс, имя пользователя и строка, специфичная для пользователя. Я хочу, чтобы функция редактировала строку пользователя, если он уже существует в базе данных, и создавала пользователя, если его нет. Например:
,User,String
0,Bob,Bob Is Cool
1,Joe,Joe Is Great
Добавление Joe
и Joe is Smart
сделает это:
,User,String
0,Bob,Bob Is Cool
1,Joe,Joe Is Smart
Добавление Jeff
и Jeff is Good
сделает это:
,User,String
0,Bob,Bob Is Cool
1,Joe,Joe Is Smart
2,Jeff,Jeff is Good
Я пытался использовать in
. Например:
if user in df.User:
if user in df.values:
И так далее, но я не могу заставить его работать. Он всегда добавляет новую запись, несмотря ни на что.
Любая помощь приветствуется. Заранее спасибо!
Измените свое состояние на
df.User.eq(user).any()
Когда я использую уже существующего пользователя и когда я использую это условие, он все равно создает новую строку в фрейме данных. Я использую if df.User.eq(user).any():
в качестве оператора if. Любая помощь?
in
в пандах проверяйте индекс значения вместо самого значения:
>>> import pandas as pd
>>> data = pd.read_csv('data.csv', index_col=0)
>>> 'Bob' in data['User']
False
>>> 1 in data['User']
True
если вы хотите проверить, существует ли Bob
в фрейме данных, вы должны сделать это:
>>> 'Bob' in data['User'].values
True
Вы можете установить «Пользователь» в индекс фрейма данных с помощью
df = df.set_index('User')
, а затем просто использоватьdf.loc[user, 'String'] = 'updated or new string'
.