У меня есть excelfile, который я читаю в Dataframe.
using DataFrames, XLSX
df = DataFrame(XLSX.readtable("Stocks/WIHL-Wihlborgs.xlsx", "PriceMonth")...)
│ Row │ Date │ Openprice │ Highprice │ Lowprice │ Closeprice │ Volume │
│ │ Any │ Any │ Any │ Any │ Any │ Any │
├─────┼────────────┼───────────┼───────────┼──────────┼────────────┼──────────┤
│ 1 │ 2020-12-23 │ 189.1 │ 189.7 │ 170.3 │ 181.5 │ 4170122 │
│ 2 │ 2020-11-30 │ 160.0 │ 191.6 │ 158.0 │ 189.1 │ 8006506 │
│ 3 │ 2020-10-30 │ 178.4 │ 184.3 │ 151.2 │ 160.6 │ 6760931 │
│ 4 │ 2020-09-30 │ 138.5 │ 178.8 │ 137.9 │ 177.5 │ 9005351 │
│ 5 │ 2020-08-31 │ 147.2 │ 152.1 │ 137.2 │ 138.3 │ 4865386 │
sort(df)
Но когда я пытаюсь использовать функцию sort()
на этом DateFrame, я получаю LoadError: MethodError: no method matching isless(::String, ::Dates.Date)
Я думаю, что это странно, так как у меня есть еще одна вкладка в том же файле Excel, где у меня есть цены за день, и это нормально для сортировки. И единственная разница, которую я вижу, заключается в том, что в файле Excel на вкладке «Цены/месяц» поле «Дата» указано как «Дата», а на вкладке «Цены/день» поле «Дата» указано как «Любой». Но в DataFrame обе вкладки в поле «Дата» указаны как «Любой».
Мне трудно понять, почему вкладка «Цены/день» работает с sort()
, а вкладка «Цены/месяц» — нет, вместо этого она дает мне LoadError
.
Изменение столбцов на соответствующий тип данных должно исправить это (infer_eltypes):
using DataFrames, XLSX
df = DataFrame(XLSX.readtable("./dat.xlsx", "Sheet1", infer_eltypes=true)..., )
#5×6 DataFrame
# Row │ Date Openprice Highprice Lowprice Closeprice Volume
# │ Date Any Float64 Any Float64 Int64
#─────┼─────────────────────────────────────────────────────────────────
# 1 │ 2020-12-23 189.1 189.7 170.3 181.5 4170122
# 2 │ 2020-11-30 160 191.6 158 189.1 8006506
# 3 │ 2020-10-30 178.4 184.3 151.2 160.6 6760931
# 4 │ 2020-09-30 138.5 178.8 137.9 177.5 9005351
# 5 │ 2020-08-31 147.2 152.1 137.2 138.3 4865386
Теперь сортировка дат работает нормально:
df[sortperm(df.Date),1:2]
#5×2 DataFrame
# Row │ Date Openprice
# │ Date Any
#─────┼───────────────────────
# 1 │ 2020-08-31 147.2
# 2 │ 2020-09-30 138.5
# 3 │ 2020-10-30 178.4
# 4 │ 2020-11-30 160
# 5 │ 2020-12-23 189.1
Также возможна установка типа Даты вручную:
using Dates
df.Date = Dates.Date.(string.(df.Date), "yyyy-mm-dd")
#5-element Array{Date,1}:
# 2020-12-23
# 2020-11-30
# 2020-10-30
# 2020-09-30
# 2020-08-31
infer_eltypes=true
не изменил мой столбец Date на тип данных Date. Поэтому мне нужно было изменить тип вручную, как вы показали во втором примере, который отлично работал.