Я использую метод Pandas Series.dt.tz_convert() для преобразования часового пояса в серии DataFrame:
STANDARD_DATETIME_FORMAT = '%Y-%m-%d %H:%M:%S'
df['timestamp'] = pd.to_datetime(df['timestamp'], format=STANDARD_DATETIME_FORMAT).dt.tz_convert(timezone)
Отлично работает для большинства часовых поясов, но не для некоторых, например «Америка/Мехико_Сити» (UTC-6). Например, дата:
"2024-04-24 10:00:00.000000+0000"
с timezone = "America/Mexico_City" выходами:
"2024-04-24 05:00:00"
вместо
"2024-04-24 04:00:00"
В Мехико на данную дату не действует летнее время, так что проблема не в этом.
Версия Панды — 1.2.0.






Вы используете довольно старую версию Pandas. Он был выпущен 26 декабря 2020 года
Ваша ссылка предполагает, что Мехико изменил использование летнего времени в 2023 году. Вполне возможно, что в то время разработчики Pandas не знали о планах изменить его.
Обновлено: он работает правильно в текущей версии Pandas (2.2.2).
Спасибо! Я думал об этой возможности в отношении версии Pandas, но с вашего подтверждения я обязательно обновлю слой Lambda. Я принесу обновления.
согласился с @MGP, что это проблема версии. Правила часового пояса время от времени обновляются. Однако на самом деле не pandas предоставляет здесь данные tz; вам необходимо убедиться, что пакеты
pytz(более старые версии pandas) иtzdata(в Windows) обновлены.