Петля линейной регрессии для диаграммы рассеяния остатков

Я запускаю симуляцию линейной регрессии, каждая модель соответствует разным значениям переменной «метка». Я могу распечатать метрики для каждой модели, но я не могу запустить разные диаграммы рассеяния для каждой модели. Все графики воспроизведены на одной диаграмме рассеяния. Я хотел бы запустить метрику и другую диаграмму рассеяния для каждой модели.

import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from scipy.stats import binom
from scipy.stats import norm
import numpy as np

from scipy.stats import norm
# generate random numbers from N(0,1)
x = norm.rvs(size=10000,loc=0,scale=1)
y = norm.rvs(size=10000,loc=0,scale=1)
z = binom.rvs(n=10,p=0.8,size=10000)
df = pd.DataFrame(data = {'v1':x.flatten(),'target':y.flatten(),'label':z.flatten()})

classes=df.label.unique().tolist()
results = []


for name in classes:
    df_subset=df.loc[df['label']==name]
    
    reg = LinearRegression()
    reg.fit(df_subset['v1'].values.reshape(-1, 1), df_subset["target"].values.reshape(-1, 1))
    predictions = reg.predict(df_subset['v1'].values.reshape(-1, 1))
    
    res=np.mean((predictions - df_subset["target"].values.reshape(-1, 1)) ** 2)
    results.append(res)
    
    msg = "Metric model %s: %f " % (name, res)
    print(msg)
    
    df_subset['pred']=predictions
    sns.scatterplot(data=df_subset, x='pred', y = "target")

Если какой-либо ответ помогает, закройте вопрос, приняв его.

Pygirl 22.12.2020 21:42
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
1
280
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Просто создайте новую фигуру перед сюжетом sns. plt.figure() <--- после графика sns сделайте plt.show(), чтобы вы могли показывать оператор печати (метрику модели) перед каждым графиком.

import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from scipy.stats import binom
from scipy.stats import norm
import numpy as np
import seaborn as sns

from scipy.stats import norm
# generate random numbers from N(0,1)
x = norm.rvs(size=10000,loc=0,scale=1)
y = norm.rvs(size=10000,loc=0,scale=1)
z = binom.rvs(n=10,p=0.8,size=10000)
df = pd.DataFrame(data = {'v1':x.flatten(),'target':y.flatten(),'label':z.flatten()})

classes=df.label.unique().tolist()
results = []


for name in classes:
    df_subset=df.loc[df['label']==name]
    
    reg = LinearRegression()
    reg.fit(df_subset['v1'].values.reshape(-1, 1), df_subset["target"].values.reshape(-1, 1))
    predictions = reg.predict(df_subset['v1'].values.reshape(-1, 1))
    
    res=np.mean((predictions - df_subset["target"].values.reshape(-1, 1)) ** 2)
    results.append(res)
    
    msg = "Metric model %s: %f " % (name, res)
    print(msg)
    plt.figure() #<-----------here
    df_subset['pred']=predictions
    sns.scatterplot(data=df_subset, x='pred', y = "target")
    plt.show() #<------------ here

Я бы рекомендовал установить библиотеку matplotlib, а затем

import matplotlib.pyplot as plt
y = 0
.
.
.
#inside your for loop
plot = sns.scatterplot(data=df_subset, x='pred', y = "target")
plt.savefig('plot_' + str(y))
plt.clf()

Другие вопросы по теме