Я загрузил набор данных с данными времени в формате datetime64. Он мне нужен в формате, в котором каждое значение даты разделено на год, месяц и день как разные элементы. Как мне это сделать?
Для справки: это один элемент, мне нужно что-то вроде (2010, 1, 1), час, минуты и т. д. не имеют значения:
tiempo[0]
Out[207]: numpy.datetime64('2010-01-01T12:00:00.000000000')
Я попытался преобразовать его в метку времени, а затем в дату и время, но у меня не получилось.
ts = (tiempo - np.datetime64('1970-01-01T00:00:00Z'))// np.timedelta64(1, 's')
Как насчет чего-то вроде этого:
import numpy as np
tiempo = np.datetime64('2010-01-01T12:00:00.000000000')
year = tiempo.astype('datetime64[Y]').astype(int) + 1970
month = tiempo.astype('datetime64[M]').astype(int) % 12 + 1
day = tiempo.astype('datetime64[D]').astype(int) % (365 // 12) + 1
print(year, month, day)
Один из способов сделать это:
from dateutil.parser import parse
def to_date(dt):
return parse(str(dt)).date()
А затем примените эту функцию ко всем элементам вашего набора данных. Предполагая, чтоtiempo — это серия pandas, вы можете получить такие даты:
dates = tiempo.apply(to_date)
Если вы ожидаете, что на входе будет None (т.е. в базе данных было NULL), лучше сделайте следующее:
dates = tiempo.apply(lambda x: pd.NaT if x is None else to_date(x))
Встроенный datetime
можно использовать для анализа строки даты. Это избавляет от необходимости возиться с преобразованиями .astype
и соответствующей математикой эпох.
Предостережение: метод strptime
может анализировать только доли секунды до шести знаков после запятой. Следовательно, в строке из девяти десятичных знаков необходимо обрезать конечные три нуля.
Чисто и просто:
import numpy as np
from datetime import datetime as dt
# Original numpy datetime object.
npdt = np.datetime64('2010-12-01T12:00:00.000000000')
# Parsed datetime object.
dto = dt.strptime(npdt.astype(str)[:-3], '%Y-%m-%dT%H:%M:%S.%f')
# Tuple containing (year, month, day)
date = dto.year, dto.month, dto.day
Выход:
(2010, 12, 1)
вы можете использовать панд to_datetime
import numpy as np
import pandas as pd
tiempo = np.datetime64('2010-01-01T12:00:00.000000000')
date_time = pd.to_datetime(tiempo)
print(date_time.year, date_time.month, date_time.day)
Функция to_date будет корректно работать не только с np.datetime64, но и с любым типом, подобным дате. Временная метка, дата-время, дата и т. д., даже строковое представление дат в различных форматах.