Как отформатировать строку даты для связного сканера/фрейма данных AWS, чтобы правильно идентифицировать ее как поле даты?

У меня есть некоторые данные в формате JSON (пример ниже). Сканер aws клея считывает эти данные и создает базу данных клеевого каталога с таблицей, а также устанавливает поле даты как строковое поле. Есть ли способ отформатировать дату в моем файле JSON так, чтобы сканер мог идентифицировать ее как поле даты? Я планирую считать эти данные в динамический фрейм с помощью aws Glue etl и отправить их в базу данных sql, где я хочу сохранить их как поле даты, чтобы можно было легко запрашивать и сравнивать поле даты. пример скрипта ниже.

Могу ли я преобразовать поле даты строки в поле даты rds в фрейме данных Spark?

myscript.py

data=gluecontext.create_dynamic_frame.from_catalog(database = "sample", table_name = "table" ...

data_frame=data.toDF()

//convert the string field to date field in the spark data frame
{"id": "abc", .... date = "2024-07-09"}
...
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
3
0
52
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете использовать to_date для преобразования строкового поля в поле даты в фрейме данных Spark следующим образом:

from pyspark.sql.functions import to_date

data=gluecontext.create_dynamic_frame.from_catalog(database = "sample", table_name = "table")
data_frame = data.toDF()

# convert the string field to the date field in the spark data frame
data_frame = data_frame.withColumn("date", to_date("date", "yyyy-MM-dd"))

Спасибо. если можно, один вопрос в том же духе: есть ли способ сгенерировать уникальный ключ в искровом кадре данных, который можно использовать для генерации уникальных идентификаторов или какого-то идентификатора, который можно использовать в качестве первичного ключа, когда это будет написано к столу rds?

kishi 12.07.2024 03:42

Другие вопросы по теме