я сделал эту программу для школьного проекта, она отлично работает, но мои данные должны быть в виде дат но каждый раз, когда я вставляю даты как переменные, он просто выдает мне сообщение об ошибке (не может плавать строка "2022-05-16")
заранее спасибо
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import datetime
dataset = pd.read_csv('/content/Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
y = dataset.iloc[:, 2].values
dataset
"""from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)"""
"""from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)"""
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X, y)
Чтобы получить столбец datetime как datetime-dtype, а не как строку, вы можете использовать аргумент parse_dates
в панды.read_csv:
dataset = pd.read_csv('/content/Position_Salaries.csv', parse_dates=...)
Или вы можете преобразовать столбец datetime в тип данных datetime позже, используя pandas.to_datetime:
dataset[date_col] = pd.to_datetime(dataset[date_col])
Впоследствии вы можете захотеть извлечь компоненты даты, используя файл методы доступа .dt.