У меня есть фрейм данных, как указано ниже (df), с ежедневной частотой, и я хотел бы преобразовать его в минутную частоту, начиная с 8:30 и заканчивая 16:00.
import pandas as pd
dict = [
{'ticker':'jpm','date': '2016-11-28','returns': '0.2'},
{ 'ticker':'ge','date': '2016-11-28','returns': '0.2'},
{'ticker':'fb', 'date': '2016-11-28','returns': '0.2'},
{'ticker':'aapl', 'date': '2016-11-28','returns': '0.2'},
{'ticker':'msft','date': '2016-11-28','returns': '0.2'},
{'ticker':'amzn','date': '2016-11-28','returns': '0.2'},
{'ticker':'jpm','date': '2016-11-29','returns': '0.2'},
{'ticker':'ge', 'date': '2016-11-29','returns': '0.2'},
{'ticker':'fb','date': '2016-11-29','returns': '0.2'},
{'ticker':'aapl','date': '2016-11-29','returns': '0.2'},
{'ticker':'msft','date': '2016-11-29','returns': '0.2'},
{'ticker':'amzn','date': '2016-11-29','returns': '0.2'}
]
df = pd.DataFrame(dict)
df['date'] = pd.to_datetime(df['date'])
df=df.set_index(['date','ticker'], drop=True)
Кто-нибудь может подсказать, как это сделать?
Как вы думаете 4:00
или 16:00
?
извините, я исправил вещь df1. Да, я имел в виду 16:00, извините.
Я считаю, что вам нужно изменить форму на DataFrame.unstack
для DatetimeIndex
, затем установить минутную частоту на DataFrame.asfreq
, время фильтрации на DataFrame.between_time
и в последний раз использовать DataFrame.stack
для MultiIndex
:
df1 = df.unstack().asfreq('Min', method='ffill').between_time('8:30','16:00').stack()
print (df1.head(10))
returns
date ticker
2016-11-28 08:30:00 aapl 0.2
amzn 0.2
fb 0.2
ge 0.2
jpm 0.2
msft 0.2
2016-11-28 08:31:00 aapl 0.2
amzn 0.2
fb 0.2
ge 0.2
не забудьте поставить зеленую галочку @Tartaglia :) хороший ответ Джезараэль!
@Datanovice - Спасибо :)
Джезраэль, описанный выше подход не работает для двухстрочных кадров данных по какой-то странной причине, я разместил это в новой теме: stackoverflow.com/questions/56895049/…
Израэль, описанный выше подход вызывает еще одну проблему неправильного заполнения отсутствующих строк, я также опубликовал это в новой теме: stackoverflow.com/questions/56926406/…
Для
df1
нет переменной, это опечатка?