{origin:
2018-06-01T09:30:00.000+00:00 BID 30415.000 4
2018-06-01T09:30:00.000+00:00 BID 30415.000 3
2018-06-01T09:30:01.000+00:00 BID 30415.000 2
2018-06-01T09:30:01.000+00:00 BID 30414.000 4
2018-06-01T09:30:01.000+00:00 ASK 30416.000 1
2018-06-01T09:30:01.000+00:00 ASK 30416.000 2
2018-06-01T09:30:01.000+00:00 TRADE 30415.000 1
}
Я хотел бы переформатировать данные так:
timestamp bid bid_size ask ask_size trade trade_size
{2018-06-01T09:30:00.000+00:00 30415 4 nan nan nan nan
2018-06-01T09:30:00.000+00:00 30415 3 nan nan nan nan
2018-06-01T09:30:01.000+00:00 30415 2 30416 1 nan nan
2018-06-01T09:30:01.000+00:00 30415 4 30416 2 30415 1
}
Не могли бы вы помочь с использованием Python? Также я сталкиваюсь с проблемой дублированной временной метки, я думаю, это потому, что ее тиковые данные вызывают одну и ту же временную метку по сравнению с разным размером ставки / запроса, и я также не знаю, как правильно сделать их в одной строке.






Это не совсем ясно из вашего примера, но первое, что нужно сделать, - это загрузить данные в pandas DataFrame, называемый, например, df, вместо словаря, который есть сейчас. Убедитесь, что этот DataFrame имеет четкие имена заголовков.
Если у вас есть данные в фрейме данных panda, вы можете использовать DataFrame.pivot(), см. Дополнительные объяснения эта ссылка.
В вашем случае вы получите что-то вроде:
df.pivot(index=<Column1>, columns=<Column2>, values=<Column3>)
где вам нужно заменить <ColumnX> соответствующими заголовками, которые вы предоставили.
Надеюсь это поможет!
@ Чан Кеннет: Не могли бы вы сообщить нам, помогло это или нет?
Почему размер ставки увеличивается до 4 на 4-й строке?