Зачем нужно «пространство предсказаний»?

Это старая проблема прогнозирования с использованием регрессии, исследующей данные Gapminder. Они использовали «пространство предсказания» для вычисления предсказания.

Q1. Зачем мне создавать «пространство предсказаний»? Какая от этого польза?

Q2. Отношение вычислений предсказаний к «пространству предсказаний»?

import numpy as np
import pandas as pd

# Read the CSV file into a DataFrame: df
df = pd.read_csv('gapminder.csv')

The data seems like this;

Country,Year,life,population,income,region

Afghanistan,1800,28.211,3280000,603.0,South Asia

Slovak Republic,1960,70.47800000000001,4137224,8693.0,Europe & Central Asia

# Create arrays for features and target variable
y = df.life.values
X = df.fertility.values

# Reshape X and y
y = y.reshape(-1,1)
X = X.reshape(-1,1)

# Create the regressor: reg
reg = LinearRegression()

# Create the prediction space
prediction_space = np.linspace(min(X_fertility), max(X_fertility)).reshape(-1,1)

# Fit the model to the data
reg.fit(X_fertility, y)

# Compute predictions over the prediction space: y_pred
y_pred = reg.predict(prediction_space)

Как можно объяснить это, не глядя на данные? В своем вопросе вы должны предоставить некоторые образцы данных.

Sociopath 10.09.2018 11:26

Ты прав. Я предоставил образец по запросу.

Rakibul Hassan 10.09.2018 12:29

Я думаю, вы немного перепутали код, вы присвоили значение X, а затем использовали X_fertility для соответствия.

Ameer Ul Islam 12.05.2020 17:06
3
3
888
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Я считаю, что вы проходите курс от DataCamp

Я тоже наткнулся на это, и ответ - prediction_space и y_pred используются для построения прямой линии на графике.

ПРИМЕЧАНИЕ: для тех, кто читает это и не понимает, о чем я говорю, во фрагменте кода фактически отсутствует код построения графика.

# Plot regression line
plt.plot(prediction_space, y_pred, color='black', linewidth=3)
plt.show()

Другие вопросы по теме