У меня есть df со столбцами Timestamp и Value. Оба имеют тип объекта «объект».
| Timestamp | Value |
--------------------------------------
| 8/21/2023 12:00:00 AM | a |
| 11/22/2023 12:00:00 AM | b |
| 3/7/2022 12:00:00 AM | c |
Я хотел бы отфильтровать df по столбцам меток времени. Например, получите результаты до 01.06.2022, что должно дать мне следующее:
| Timestamp | Value |
--------------------------------------
| 3/7/2022 12:00:00 AM | c |
Время в колонке мне тоже не нужно. Просто даты должно быть достаточно.
Нужна помощь в преобразовании типа dtype из объекта в datetime, если это первый шаг. После этого фильтровать?
Заранее спасибо!
Конвертируйте to_datetime
, а затем отфильтруйте его, используя формат YYYY-MM-DD
df["Timestamp"] = pd.to_datetime(df["Timestamp"])
df = df[df["Timestamp"] < "2022-06-01"]
Timestamp Value
2 2022-03-07 c
@adityatandel, вам нужно использовать формат YYYY-MM-DD
: '2023-11-22'
, '2023-11-21'
.
мои извинения. я использовал формат «ГГГГ-ММ-ДД». Я получил ошибку, когда запустил df["Timestamp"] = pd.to_datetime(df["Timestamp"]). /var/folders/lp/4fmp6zz13gj6rbtx1k3wbqp00000gp/T/ipykernel_46030/4274785559.py:1: Предупреждение пользователя: не удалось определить формат, поэтому каждый элемент будет анализироваться индивидуально, возвращаясь к dateutil
. Чтобы синтаксический анализ был последовательным и ожидаемым, укажите формат. Может ли быть поэтому фильтрация не работает?
Он работает без предупреждений для данных в вопросе, поэтому проблема может быть связана с остальными вашими данными. Попробуйте преобразовать в дату и время, указав формат: pd.to_datetime(df["Timestamp"], format='%m/%d/%Y %I:%M:%S %p')
. Если это не помогло, возможно, в вашем наборе данных есть разные форматы.
Спасибо @e-motta! Продолжение. Если я хочу отфильтровать все записи до 22.11.2023, как мне это сделать? df = df[df["Timestamp"] < "22.11.2023"] или df = df[df["Timestamp"] <= "21.11.2023"] не отфильтровывает запись с 22.11.2023 /2023 временная метка.