Я рассчитываю коэффициенты инфляции дисперсии
from patsy import dmatrices
from statsmodels.stats.outliers_influence import variance_inflation_factor
y, X = dmatrices('A ~ B + C + D + E + F + G, data=df, return_type='dataframe')
vif = pd.DataFrame()
vif['VIF'] = [variance_inflation_factor(X.values, i) for i in range(X.shape[1])]
vif['variable'] = X.columns
vif
Как теперь я могу стандартизировать функции с помощью StandardScaler(), а затем пересчитать коэффициенты инфляции дисперсии стандартизированных функций?
Использование «patsy import dmatrices» уже масштабирует и стандартизирует функции. Поэтому нет необходимости делать второй шаг с StandardScaler().
Ознакомьтесь с преобразованиями состояния и стандартизацией от Пэтси.