Мне нужно провести факторный анализ. Мои данные представляют собой анкету с одинаковыми ответами на каждый вопрос, поэтому проблем с масштабом нет.
Я пробовал использовать factanal() из базы R и fa() из пакета psych.
Даже если для обоих методов установлено максимальное правдоподобие, использование ротации «промакс» дает разные факторные нагрузки.
Вопрос там уже задавался: https://stackoverflow.com/questions/50573764/differences-between-fa-and-factanal-functions-in-r#:~:text=factanal%20performs%20a%20maximum %2Dправдоподобие, наименьшая%20квадрат%20регрессия%20(OLR).
но ответ не совсем верен, в статье, на которую они ссылаются, говорится «те же результаты», но те же результаты получаются только тогда, когда мы используем вращение «варимакс».
Поэтому мне интересно, почему существует разница в факторных нагрузках (пакет psych предлагает больше вещей, но почему он другой, хотя он должен быть одинаковым?)
Это воспроизводимый пример:
# Load the psych package for
# data analysis and visualization
library(psych)
library(GPArotation)
# Load the mtcars dataset
data(mtcars)
# Perform factor analysis on the mtcars dataset
factanal <- factanal(mtcars, factors=3, rotation = "promax")
fa <- fa(mtcars, nfactors = 3, fm = "ml", rotate = "promax")
# Print the results
head(round(factanal$loadings, 2))
Factor1 Factor2 Factor3
mpg 0.54 0.16 -0.43
cyl -0.53 -0.58 0.08
disp -0.65 -0.32 0.19
hp -0.11 -0.48 0.47
drat 0.83 0.12 0.10
wt -0.71 0.18 0.54
head(round(fa$loadings, 2))
ML2 ML1 ML3
mpg 0.52 0.17 -0.43
cyl -0.51 -0.59 0.08
disp -0.63 -0.33 0.19
hp -0.09 -0.49 0.48
drat 0.83 0.13 0.10
wt -0.70 0.16 0.54
В документации R рекомендуется использовать «oblique.Scores=TRUE», но это не меняет факторные нагрузки:
fa2 <- fa(mtcars, nfactors = 3, fm = "ml", rotate = "promax", oblique.scores=T, scores = "tenBerge")
head(round(fa2$loadings, 2))
ML2 ML1 ML3
mpg 0.52 0.17 -0.43
cyl -0.51 -0.59 0.08
disp -0.63 -0.33 0.19
hp -0.09 -0.49 0.48
drat 0.83 0.13 0.10
wt -0.70 0.16 0.54
@Фриде, зная, почему существует разница, может привести к пониманию того, какой из них лучший, это лишь вторично. И я не знаю, не упускаю ли я какие-то варианты, которые могли бы объяснить эти различия, это программирование.
fa <- fa(mtcars, nfactors = 3, fm = "ml", rotate = "Promax")Этот вопрос не заключался в том, чтобы «… искать рекомендации по библиотекам программного обеспечения, учебным пособиям, инструментам, книгам или другим внешним ресурсам». , он спрашивал, почему существуют различия между результатами двух функций... промаксных вращений.
@Фриде; Я думаю, вы слишком сосредоточились на одном (не по теме) предложении, а не на общем тоне вопроса или просьбе о помощи по поводу разных результатов. Тем не менее я удалил оскорбительное предложение из вопроса. Также был предоставлен воспроизводимый пример.





Вы можете получить тот же поворот, что и stats::promax, используемый factanal, используя Promax (обратите внимание на заглавную букву P). На странице помощи ?Promax объясняется:
Promax — это прямая адаптация функции stats::promax. Кроме того, он вернет межфакторные корреляции, а также матрицу нагрузок и вращения.
Я не заглядывал в документацию, чтобы увидеть, что делает promax из пакета psych (я уверен, что это будет там, поскольку они очень хороши), но беглый взгляд на исходный код fa показывает, что он возвращает вращение нормализованных нагрузок:
Promax = {pro <- Promax(loadings,...) #Promax without Kaiser normalization
loadings <- pro$loadings
Phi <- pro$Phi
rot.mat <- pro$rotmat},
promax = {#pro <- stats::promax(loadings,...) #from stats
pro <- kaiser(loadings,rotate = "Promax",...) #calling promax will now do the Kaiser normalization before doing Promax rotation
Код, показывающий эквивалентность:
library(psych)
data(mtcars)
m1 <- factanal(mtcars, factors=3, rotation = "promax")
m2 <- fa(mtcars, nfactors = 3, fm = "ml", rotate = "Promax")
loadings(m2)[] - loadings(m1)[]
# ML2 ML1 ML3
# mpg -1.705875e-06 1.473799e-06 -3.059439e-07
# cyl 1.594591e-07 -8.884557e-07 -1.818443e-07
# disp 8.168498e-07 4.712348e-07 2.310251e-06
# hp 6.522325e-07 -1.931424e-06 -1.722668e-06
# drat 8.599102e-07 1.509280e-06 8.609054e-07
# wt 2.121750e-06 8.515195e-07 3.925057e-06
# qsec 1.092731e-06 1.119313e-06 2.633606e-06
# vs 4.688156e-07 -8.692953e-07 -6.737374e-07
# am -1.884347e-06 1.230842e-06 -1.514240e-06
# gear -1.691097e-06 -2.111156e-06 -5.330317e-06
# carb 1.288899e-06 -2.468629e-06 -2.641025e-06
Спасибо за ответ! Я не заметил, что было 2 разных промакса с маленькой и прописной первой буквой. В следующий раз я постараюсь не «спрашивать», лучше ли один, еще раз спасибо за ваше время.
«[...] и как узнать, какой из обоих методов может быть лучшим [...]» — проголосовали за закрытие. Этот вопрос больше о других вещах, чем о программировании.