В SPSS: Порядок выполнения факторного анализа

На первом шаге процедуры факторного анализа происходит стандартизация заданных значений переменных (z-преобразование); затем при помощи стандартизированных значений рассчитывают корреляционные коэффициенты Пирсона между рассматриваемыми переменными.

Исходным элементом для дальнейших расчётов является корреляционная матрица. Для понимания отдельных шагов этих расчётов потребуются хорошие знания, прежде всего, в области операций над матрицами; интересующимся подробностями советуем обратиться к специальной литературе. Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения диагональных элементов матрицы (так называемые относительные дисперсии простых факторов).

Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу. Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки. Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы, наиболее часто употребляемым из которых является метод определения главных факторов (компонентов).

Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является ортогональное вращение по так называемому методу варимакса. Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа. Кроме того на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам.

Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения. Таким образом для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

36.

Иногда один объект может хар-ся множеством признаков (многомерные объекты), тогда возникает необходимость сокращения числа наблюдений, но при условии, что новые переменные так же хорошо характеризуют явления.

Причины снижения числа наблюдений:

4. Необходимость наглядного представления исходных данных;

5. Стремление к локанизму исследуемых моделей.

6. Необходимость существенного сжатия объемов хранимой информации.

Предпосылки перехода от бОльшего числа признаков р к меньшему р’:

1. Дублирование информаии, описываемой сильно взаимодействующими признаками,

2. Не информативность признаков, маломеняющихся при переходе от 1го объекта к др.

3. Возможность агрегирования (простого суммирования по некоторым признакам).

Для этой цели используется анализ методом главных компонентов – статистический метод сокращения числа наблюдений, необходимый для описания того или иного явления. Суть метода — сократить число объясняющих пе­ременных до наиболее существенно влияющих факторов. Метод главных компонент применяется для исключе­ния или уменьшения мультиколлинеарности объясняющих пере­менных регрессии. Основная идея заключается в сокращении числа объясняющих переменных до наиболее существенно влия­ющих факторов. Это достигается путем линейного преобразова­ния всех объясняющих переменных xi (i=0,..,n) в новые пере­менные, так называемые главные компоненты. При этом требу­ется, чтобы выделению первой главной компоненты соответство­вал максимум общей дисперсии всех объясняющих переменных xi (i=0,..,n). Второй компоненте — максимум оставшейся дис­персии, после того как влияние первой главной компоненты ис­ключается и т. д. (гл компонента представляет собой линейную комбинацию р-переменных).

*Коэффициенты гл компонент оцениваются таким образом, чтобы дисперсия гл компоненты была максимальной.

*Если переменые Х представлены в одних и тех же единицах измерения, то необходимо использовать ковариационную матрицу, если нет –то корр.

*сумма квадратов всех компонент д.б.=1

*первая гл компонента характеризуется максимальной дисперсией, чем больше значение дисперсии, тем важнее компонента.

37. Интерпритация факторов:На данном этапе исследователь должен превратиться из статистика, заботящегося в первую очередь о правильности и точности вычислений, в эксперта по проблеме, закономерности которой исследовались с помощью факторного анализа. Теперь необходимо взять на вооружение все наши знания о переменных, подвергшихся фа, и начать с тщательного анализа последней факторной матрицы для определения того, какие переменные существенно нагружены данным фактором, а какие вообще с ними не связаны. Первые гипотезы о природе выявленных факторов могут основываться на наблюдениях и наших знаниях о самих переменных.

Пр.: от Кеттела: выобрака из 2х пьяных и 2х трезвых людей. 1 пил виски с содовой, 2- вино с содовой, трезвые – ничего не пили. То получим корреляции, которые укажут на какой-то общий фактор. Этим фактором больше всех будут загружены переменные «состояние опьянения» и «содовая вода». В этом случае только тот, кто знает, что переменные «виски « и «вино» включает общий фактор – алкоголь, распознает его роль при переменной «состояние опьянения». Только использование достаточно обширной выборки, включающей также людей, которые пили только содовую веду без алкоголя, уменьшит у переменной «содовая вода» нагрузку факторов «опьянения» и особенно «алкоголь» до минимальных размеров.

Сущностью факторного анализа является процедура вращения факторов, то есть перераспределения дисперсии по определённому методу. Цель ортогональных вращений — определение простой структуры факторных нагрузок, целью большинства косоугольных вращений является определение простой структуры вторичных факторов, то есть косоугольное вращение следует использовать в частных случаях.

Необходимость вращения факторов возникает чаще всего, когда выявленным факторам не удается дать достаточно четкую содержательную интерпретацию. Например, факторные нагрузки для рассматриваемого фактора могут быть близкими по величине и одинаковыми по знаку у многих признаков, так что трудно однозначно определить, какой фактор 'стоит' за выделенной комбинацией признаков. Вращение позволяет сделать матрицу факторных нагрузок более 'контрастной' за счет увеличения нагрузок по одним признакам и уменьшения по другим, что способствует более отчетливому выявлению групп признаков, определяющих тот или иной фактор.

Вращение бывает:

· ортогональным

· косоугольным.

При первом виде вращения каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, поэтому факторы оказываются независимыми, некоррелированными друг от друга (к этому типу относится МГК). Второй вид — это преобразование, при котором факторы коррелируют друг с другом. Преимущество косоугольного вращения состоит в следующем: когда в результате его выполнения получаются ортогональные факторы, можно быть уверенным, что эта ортогональность действительно им свойственна, а не привнесена искусственно.

return false">ссылка скрыта

Аналитические и геометрические методы – может быть это расчитанные вручную и нарисованные (графическое изображение)-не уверена!!!

Решение задач можно осуществлять 2 методами:

1. используя геометрическую интерпретацию проблемы (рисунки, графики, модели);

2. выполняя соответствующие вычисления, приводящие к определению нового положения системы новых проекций.

Используя лишь графики, нельзя достич высокой точности результатов, не говоря уже о том, что в многмерных случаях их применение требует кропотливой работы. Однако, применительно к задаче определения наилучшего положения осей графическая интерпритация играет главную роль. Только с ее помощью можно представить наглядно, как перемещаются отдельные группы точек относительно вращаемых осей, что облегчает поиск простой структуры.

Точное определение можно получить с помощью алгебраических и тригоноометрических вычислений, которое осуществляется в факторном анализе посредством вычисления формул.