Сдвиг даты на один день в Sparklyr?

Я работаю над проектом прогнозирования временных рядов на R. Однако мне нужно получить данные из таблиц, расположенных в среде Hadoop. Я использую Sparklyr для доступа к этим таблицам. Но я понял странную проблему после завершения передачи данных.

Мой столбец даты смещается на один день, и я вижу данные 27.03.2017 в строке, представляющей 26.03.2017.

sc <- spark_connect(master = "yarn-client", 
                    spark_home = "/usr/hdp/current/spark2-client/",
                    config = conf)

invoke(hive_context(sc), "sql", "USE mydb")

data <- tbl(sc, 'mydata_raw')
data.df <- data.frame(data)
filter(data.df, date == "2018-05-05")


          date        unit 
         <date>       <int>                 
1        2018-05-04   1111 

В моих кустовых таблицах такой проблемы нет.

Я не знаю Sparklyr но первым делом я бы проверил, отличаются ли часовые пояса.

JBGruber 18.03.2019 14:13

Я проверил это. Мой сеанс R и узлы Hive находятся в одном часовом поясе. Я не уверен, есть ли проблема, связанная с часовым поясом.

omzeybek 18.03.2019 14:36

Сталкиваетесь ли вы с той же проблемой, когда используете Apache Spark напрямую (скажем, с API Scala или Python), или это происходит только в sparklyr? Кроме того, как вы создали таблицу в Hive? Не могли бы вы предоставить соответствующий оператор DDL и схему на стороне Spark?

user10938362 18.03.2019 20:44

У меня не было такой проблемы, когда я использовал pyspark. Это происходит только в sparklyr. Я передаю данные в HDFS с помощью Kylo, ​​затем создаю таблицу в Hive. Вы имеете в виду утверждение, которое я использовал для создания таблицы в Hive. Если да, то это код CREATE TABLE mydb.mydata_raw ( date DATE, unit INT ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\u003B' STORED AS TEXTFILE location '/mypath/myfolder' TBLPROPERTIES("orc.compress" = "snappy");

omzeybek 19.03.2019 07:51

Я не могу воспроизвести это, но это определенно не ожидаемое поведение, поэтому я рекомендую посещение системы отслеживания ошибок sparklyr и создать проблему. Этот вопрос поднимался на SO раньше, но никогда (насколько мне известно) не видел за пределами sparklyr. Чтобы дополнительно определить вину, вы можете проверить filter(data.df, date == "2018-05-05") %>% spark_dataframe() %>% invoke("show"), а затем spark_log(sc), чтобы убедиться, что собственный вывод Spark выглядит нормально. Если вы решите открыть вопрос, пожалуйста, зайдите и оставьте редактирование/комментарий со ссылкой.

user10938362 19.03.2019 11:56

Привет, я создал проблему в системе отслеживания ошибок Sparklyr, вот ссылка; github.com/rstudio/sparklyr/issues/1954

omzeybek 25.03.2019 06:48
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
6
172
0

Другие вопросы по теме