Как передать другой набор данных для обучения и тестирования без разделения фрейма данных. (питон)?

Я рассмотрел несколько вопросов, которые помогают разделить ваш фрейм данных на обучение и тестирование, с помощью scikit, без и т. д.

Но мой вопрос в том, что у меня есть 2 разных CSV (2 разных кадра данных разных лет). Я хочу использовать один как поезд, а другой как тест?

Как это сделать для линейной регрессии/любой модели?

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
4
0
1 105
3
Перейти к ответу Данный вопрос помечен как решенный

Ответы 3

Ответ принят как подходящий
  • Загрузите наборы данных по отдельности.
  • Убедитесь, что они имеют одинаковый формат строк и столбцов (функций).
  • Используйте набор train для fit модели.
  • Используйте набор test для predict результата после тренировки.
# Load the data
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

# Split features and value
# when trying to predict column "target" 
X_train, y_train = train.drop("target"), train["target"]
X_test, y_test = test.drop("target"), test["target"]

# Fit (train) model
reg = LinearRegression()
reg.fit(X_train, y_train)

# Predict
pred = reg.predict(X_test)

# Score
accuracy = reg.socre(X_test, y_test)

Да, X_train и X_test должны иметь одинаковую последовательность столбцов (признаков).

skillsmuggler 28.05.2019 18:22

Привет, я думаю, вы забыли добавить префиксы X_ и y_ для «загрузки данных»? :)

MattiH 17.01.2022 12:51

пожалуйста,killsmuggler, что насчет X_train и X_Test, как я могу это определить, потому что, когда я пытаюсь это сделать, он говорит NameError: имя «X_train» не определено

Как сейчас написано, ваш ответ неясен. Пожалуйста, редактировать, чтобы добавить дополнительную информацию, которая поможет другим понять, как это относится к заданному вопросу. Дополнительную информацию о том, как писать хорошие ответы, можно найти в справочном центре.

Community 17.01.2022 10:27

Да, это немного неправильно. Пожалуйста, добавьте это после первых трех строк y_train = train[:, :1] #если y — это только один столбец X_train = train[:, 1:]

MattiH 17.01.2022 12:52

Я не мог отредактировать первый ответ, который почти готов. Хотя кода не хватает...

# Load the data
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

y_train = train[:, :1]  #if y is only one column
X_train = train[:, 1:]

# Fit (train) model
reg = LinearRegression()
reg.fit(X_train, y_train)

# Predict
pred = reg.predict(X_test)

# Score
accuracy = reg.socre(X_test, y_test)

Другие вопросы по теме