Факторный анализ

Описание

Обработчик применяется с целью понижения размерности пространства факторов. Это необходимо в случаях, когда входные факторы коррелированы друг с другом, т. е. взаимозависимы. В факторном анализе речь идет о выделении из множества измеряемых характеристик объекта факторов, более емко отражающих свойства объекта.

Первым этапом факторного анализа является выбор новых признаков, которые являются линейными комбинациями прежних и "вбирают" в себя большую часть общей изменчивости входных факторов. Поэтому они содержат большую часть информации, заключенной в первоначальных данных.

В обработчике "Факторный анализ" это осуществляется с помощью метода главных компонент. Он сводится к выбору новой ортогональной системы координат в пространстве наблюдений. В качестве первой главной компоненты избирают направление, вдоль которого массив данных имеет наибольший разброс, а выбор каждой последующей происходит так, чтобы разброс данных вдоль нее был максимальным, и, чтобы она была ортогональна другим главным компонентам, выбранным прежде.

Пример:

Проведем факторный анализ небольшой таблицы, содержащей некоторые статистические данные по регионам:

Исходная таблица:

Регион Население (тыс. чел.) Доля городского населения, % Занятых в экономике (тыс. чел.) Доходы на человека (руб./мес.)
Тамбовская обл. 1269 58,4 532,4 1187,1
Пензенская обл. 1531 64,6 674,5 936,8
Ростовская обл. 4358 67,6 1811,8 1033,6
Читинская обл. 1259 62,4 439,5 472,9
Чукотский а. о. 72 67,9 33,8 963,7

Таблица факторов:

Фактор1 Фактор2 Регион Население (тыс. чел.) Доля городского населения, % Занятых в экономике (тыс. чел.) Доходы на человека (руб./мес.)
0,13 -0,47 Тамбовская обл. 1269 58,4 532,4 1187,1
0,51 -0,49 Пензенская обл. 1531 64,6 674,5 936,8
3,11 -0,42 Ростовская обл. 4358 67,6 1811,8 1033,6
0,18 -0,88 Читинская обл. 1259 62,4 439,5 472,9
-0,87 -0,34 Чукотский а. о. 72 67,9 33,8 963,7

Таблица факторных нагрузок:

Метка Фактор1 Фактор2
Население (тыс. чел.) 0,98 -0,05
Доля городского населения, % 0,40 0,77
Занятых в экономике (тыс. чел.) 0,98 0,04
Доходы на человека (руб./мес.) -0,33 0,82

Порты

Вход

  • Входной источник данных (таблица данных). В настройках этого порта следует выставить назначение "Используемое" для полей, данные которых следует подвергнуть факторному анализу.

Выход

  • Выходной набор данных (таблица данных). Содержит исходную таблицу, к которой добавлены поля факторов.
  • Выходной набор данных (таблица данных). Содержит таблицу факторных нагрузок.

Мастер настройки

  • Критерий значимости факторов:
    • По собственному значению;
    • По дисперсии;
    • Задать число факторов.

Значение каждого критерия можно задать в специальном поле справа от соответствующей ему радиокнопки.

  • Метод получения окончательного решения
    • Без вращения — исходные факторы, полученные методом главных компонент, остаются без изменений.
    • Варимакс — критерием является упрощение описания каждого фактора. В результате максимизируется нагрузка на каждый фактор относительно небольшого числа переменных, а факторные нагрузки остальных переменных минимизируются. Рекомендуется выбирать, когда требуется обеспечить высокую интерпретируемость результатов факторного анализа.
    • Квартимакс — данный критерий упрощает описание каждой переменной, то есть уменьшает число факторов, связанных с этой переменной.
  • Ограничить число выходных факторов — необязательный флаг, при активации которого можно задать ограничивающее число выходных факторов в соответствующем поле области.

results matching ""

    No results matching ""