У меня есть столбец в фрейме данных pandas, например:
C
0 1100
1 1011
2 2013
3 3210
Я хочу иметь четыре разных столбца из этого столбца следующим образом:
E F G H
0 1 1 0 0
1 1 0 1 1
2 2 0 1 3
3 3 2 1 0
Я использовал пользовательскую функцию split_string, чтобы получить то же самое, применив ее к фрейму данных.
def split_string(s):
return list(map(lambda i:i,s))
Применяя эту функцию к столбцу фрейма данных, я могу получить его для одного столбца следующим образом:
new
0 [1 ,1 ,0 ,0]
1 [1 ,0 ,1 ,1]
2 [2 ,0 ,1 ,3]
3 [3 ,2 ,1 ,0]
Но для нескольких столбцов это не работает. Если есть какое-либо обходное решение, пожалуйста, предложите.
Pd.DataFrame([[i for i in str(num)] for num in df.C]) это может работать, но мне нужно сделать это в том же фрейме данных, потому что, если я буду создавать новый фрейм данных, как я могу объединить его в исходный фрейм данных без какого-либо столбца, служащего основой для присоединения?
@nikhil_ghanghor - Также не нужно добавлять к исходному DataFrame? Потому что не принимает ответ.
@jezrael они оба помогли мне разобраться в проблеме, поэтому я так или иначе принял их обоих. И тебе спасибо .
@nikhil_ghanghor - Так что не нужно добавлять к оригиналу? И номера не нужны? Нужны струны?
@nikhil_ghanghor - Если да, хорошо, примите решение, сделайте это. Мой отличается, преобразуйте значения в числа и добавьте столбцы к оригиналу.
@jezrael Мне нужны были строки, но ваш ответ помог мне, как мы можем добавить фрейм данных в другой, не имея общих столбцов, так что в этом смысле оба ответа сработали в мою пользу.
@nikhil_ghanghor - Значит, выходные столбцы должны быть строками? Я думаю 1 не число 1 а строка '1'
Так:
In [1794]: res = pd.DataFrame(df.C.apply(lambda x: list(str(x))).tolist(), columns=['E', 'F', 'G', 'H'])
In [1795]: res
Out[1795]:
E F G H
0 1 1 0 0
1 1 0 1 1
2 2 0 1 3
3 3 2 1 0
Используйте понимание списка с преобразованием значений в числа для DataFrame, а затем добавьте в исходные столбцы с помощью DataFrame.join:
L = [list(map(int, str(x))) for x in df['C']]
df1 = pd.DataFrame(L, index=df.index, columns=['E', 'F', 'G', 'H'])
df = df.join(df1)
Или concat:
df = pd.concat([df, df1], axis=1)
print (df)
C E F G H
0 1100 1 1 0 0
1 1011 1 0 1 1
2 2013 2 0 1 3
3 3210 3 2 1 0
Это лучше и быстрее, чем применение?
pd.DataFrame([[int(i) for i in str(num)] for num in df.C])
?