У меня есть файл Customer_Profile.csv
, содержащий столбец Birthday
, а значения похожи на формат 19460620
(YearMonthDay).
Я хочу рассчитать только год возраста от настоящего / настоящего дня. Кроме того, после расчета возраста я также хочу категоризировать / сгруппировать возраст в новом столбце с именем Age_Group
.
Например, возрастная группа должна быть следующей:
Возраст от 10 до 20 лет - группа 1
.
Возраст от 21 до 30 лет - группа 2
.
Возраст от 31 до 40 лет - группа 3.
и так далее. Любая идея написать скрипт Python для вышеуказанных задач.
Да я начал на это отвечать, я знаю как. Я просто не собираюсь даже пытаться расшифровать это слово салат
вы можете легко проанализировать дату рождения с помощью datetime.datetime.strptime
следующим образом:
birth_date = datetime.datetime.strptime("19460620", "%Y,%m%d")
и текущее время:
now = datetime.datetime.now()
тогда вы можете получить возраст, используя следующее:
birthday_passed = (now.month > birth_date.month) or
(now.month == birth_date.month and now.day == birth_date.day)
age = now.year - birth_date.year
if birthday_passed:
age -= 1
чтобы сгруппировать свой возраст, вы можете использовать целочисленное деление:
group = (age - 1) // 10
Чтение и запись csv достаточно легко сделать с помощью pandas. просто посмотрите pandas.read_csv
и pandas.to_csv
Посмотрите на свой вопрос, формат и содержание и спросите себя, зачем кому-то тратить на это время ... Как спросить