Панды добавляют строковые токены в список с соответствующим столбцом, где эти столбцы в этих строковых строках имеют одинаковое значение

Я работаю над этим набором данных.

Панды добавляют строковые токены в список с соответствующим столбцом, где эти столбцы в этих строковых строках имеют одинаковое значение

Мой вопрос заключается в том, как сгруппировать этот набор данных на основе одной и той же метки времени и объединить эти строки в одну с уникальными токенами, поэтому, например, я мог бы:

дата нить 2011-02-01 15:00:00 Richmond Service Index S&P/CS HPI Composite — 20 ед. n.s.a Texas Services Sector Outlook TIC Чистые долгосрочные операции, включая свопы

Я понятия не имею, какой метод я должен использовать для решения этой проблемы. Кто-нибудь знает, как это решить?

0
0
70
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Может ли это помочь вам?

import pandas as pd
from collections import OrderedDict

df['event'] = df['event'].str.replace('amp;', '')
df = df.groupby('date')['event'].apply(lambda x: ' '.join(x)).reset_index()
df['event'] = df['event'].str.split().apply(lambda x: OrderedDict.fromkeys(x).keys()).str.join(' ')

Другие вопросы по теме