Настройка конечных классов
Для начала оценки и корректировки результатов формирования начальных и конечных классов необходимо нажать на кнопку Активировать, расположенную справа от поля Состояние входа. Для включения режима редактирования используется кнопка Редактировать разбиение. Чтобы сохранить внесенные изменения необходимо нажать кнопку Применить, если изменения настроек сохранять не требуется, то — Отменить.
На панели инструментов доступны следующие команды:
- Скрыть боковую панель — нажатие на кнопку скрывает панель со списком входных столбцов, повторное нажатие возвращает панель;
- Редактировать разбиение — при нажатии на кнопку становятся доступны поля для редактирования параметров конечных классов;
- Объединить с предыдущим — объединяет конечный класс, выделенный на диаграмме или в таблице детализации, с предыдущим (расположенным левее) классом (кнопка доступна в режиме редактирования разбиения, т.е. когда нажата кнопка );
- Объединить со следующим — объединяет конечный класс, выделенный на диаграмме или в таблице детализации, с последующим (расположенным правее) классом (кнопка доступна в режиме редактирования разбиения);
- Показать таблицу конечных классов — область конечных классов будет представлена в виде таблицы (можно также вызвать начатием клавиш Alt+One);
- Показать диаграммы конечных классов — область конечных классов будет представлена в виде диаграмм (Alt+Two);
- Доли событий / Количество событий — переключение для отображения абсолютных и относительных значений.
Все перечисленные команды доступны и в контекстном меню (правая кнопка мыши). Кроме них в контекстном меню доступны команды:
- Разбить по границе — установка новой дополнительной границы, а значит увеличение числа конечных классов на 1 (операция обратная командам Объединить со следующим/Объединить с предыдущим);
- Заморозить выбранные — изменить статус поля на Заморожено (т.е. поле не будет использоваться при переобучении), команда также доступна при нажатии на кнопку слева от каждого входного столбца;
- Разморозить выбранные — изменить статус поля на Разморожено (т.е. поле может быть использовано в процессе формирования конечных классов при переобучении), команда также доступна при нажатии на кнопку слева от каждого входного столбца.
Для редактирования доступны следующие параметры:
Конечные классы:
- Минимальная доля, % — это отношение числа наблюдений, для которых значение входного признака попадает в данный класс, к общему числу наблюдений исходного набора данных (вес класса). По умолчанию устанавливается 5%. Формирование классов с весом меньше заданного не допускается. Малый вес класса указывает на его низкую значимость и целесообразность объединения с некоторым другим классом.
- Максимальное количество — наибольшее допустимое количество классов, создаваемое узлом для столбца. По умолчанию устанавливается значение 5. Это значение можно изменить: большое число классов приводит к уменьшению их веса, а малое — к уменьшению информационного индекса.
- Установить... — показывает зависимость IV от количества классов и позволяет выбрать их число для настройки максимального количества. После нажатия на кнопку Рассчитать пересчитываются показатели в соответствии с выбранным количеством классов.
Оптимизация:
- Равномерность, % — определяет способ разбиения диапазона изменения входного признака на классы (интервалы). По умолчанию параметр равен 0, и может изменяться от 0 до 1. Значение, равное 0, обеспечивает такое разбиение на классы, которое максимизирует информационный индекс. При значении параметра, равном 1, алгоритм формирует классы таким образом, чтобы в каждый из них попало примерно одинаковое число наблюдений. Таким образом, в первом случае повышается значимость признака, а во втором — интерпретируемость конечных классов.
Любые внесенные изменения немедленно отражаются на диаграмме и в таблице детализации.
В Списке входных столбцов можно сортировать и фильтровать записи. Для этого нужно открыть выпадающее меню, нажав кнопку , которая появляется при наведении курсора на заголовок Столбец или IV.