Отчет по регрессии Отчет по регрессии

Визуализатор Отчет по регрессии для компонента Логистическая регрессия отображает статистические параметры и результаты статистических тестов для анализа регрессионных моделей.

Данный визуализатор состоит из трех областей:

Подробно о том, как включить данный визуализатор, можно прочитать в статье.

Интерфейс

Операции

Область Информация о модели

  • Информация о модели — отображение/скрытие информации о модели.

Область Коэффициенты регрессии

  • Таблица — переключение отображения коэффициентов регрессии в вид Таблица.
  • Дерево — переключение отображения коэффициентов регрессии в вид Дерево.
  • Нулевые значения — отображение/скрытие нулевых значений.

Область Шаги построения

Области визуализатора

Информация о модели

Описание показателей модели представлено в таблице:

Показатель Описание
Логический Константа Информация о том содержит модель константу или нет
Вещественный Deviance нулевой модели Показывает степень соответствия нулевой модели набору данных, на котором она обучается
Вещественный Deviance Показывает степень соответствия модели набору данных, на котором она обучается
Вещественный Псевдо R^2 МакФаддена Коэффициент детерминации МакФаддена определяется на основе логарифма функции правдоподобия и применяется для оценки степени соответствия модели регрессии реальным данным (изменяется от 0 до 1)
Вещественный Псевдо R^2 МакФаддена (скорр.) Используется для сравнения моделей с различным числом факторов (изменяется от 0 до 1)
Целый Число степеней свободы ошибки Разность между размером выборки и числом оцениваемых параметров модели
Целый Число степеней свободы модели Число независимо варьируемых переменных модели
Вещественный Хи-квадрат Статистика отношения правдоподобия
Вещественный Р-значение Оценка значимости модели. Чем меньше P-значение, тем меньше вероятность нулевой гипотезы о том, что нет статистически значимой связи между зависимой и независимыми переменными. Вычисляется по статистике отношения правдоподобия.
Вещественный Критерий Акаике Критерий используется для сравнения моделей с разным числом параметров, когда требуется выбрать наилучший набор объясняющих переменных
Вещественный Критерий Акаике (скорр.) Модифицированный критерий Акаике, применяемый для выборок малого размера, когда отношение числа содержащихся в ней примеров к числу параметров модели меньше 40
Вещественный Критерий Байеса Критерий основан на использовании функции правдоподобия и тесно связан с информационным критерием Акаике
Вещественный Критерий Ханнана-Куинна Критерий основан на использовании функции правдоподобия и является альтернативой критериям Акаике и Байеса

Коэффициенты регрессии

Описание коэффициентов представлено в таблице:

Коэффициент Описание
Коэффициент Оценки значений коэффициентов при независимых переменных
Стандартная ошибка Стандартная ошибка оценки коэффициента
Статистика Вальда Статистика Вальда для оценки значимости переменной
Р-значение Оценка значимости переменной. Чем меньше Значимость (Р-значение), тем меньше вероятность нулевой гипотезы о том, что коэффициент при независимой переменной равен 0. Вычисляется по z-статистике.
Отношение шансов Отношение шансов наступления события к его не-наступлению для каждого увеличения переменной на одну единицу, при условии, что все другие переменные остаются постоянными
Нижняя граница ДИ Нижняя граница доверительного интервала отношения шансов
Верхняя граница ДИ Верхняя граница доверительного интервала отношения шансов

Коэффициенты регрессии могут быть представлены в виде Таблицы (см. рисунок 1) или Дерева (см. рисунок 2).

Режим отображения Таблица
Рисунок 1. Режим отображения Таблица
Режим отображения Дерево
Рисунок 2. Режим отображения Дерево

Шаги построения

Область Шаги построения имеет смысл включать только в том случае, если при настройке узла Логистическая регрессия в параметре Отбор факторов и защита от переобучения был выбран алгоритм, который подразумевает режим обработки фактов.

Область Шаги построения состоит из следующих полей:

Поле Описание
Модель Дерево, в котором отображается пошаговый процесс отбора факторов для построения финальной модели
Показатель Значение выбранного показателя для текущей модели
Изменение поля Отображает добавлен или удален был факт ("+" показывает, что факт был добавлен в модель, а "-" означает, что факт удален из модели)
Поля Текущие поля модели

Существует три вида моделей:

  • Нулевая модель — начальная модель работы алгоритма.
  • Промежуточная модель — модель, которую создал алгоритм в процессе обучения.
  • Финальная модель — модель, которую алгоритм посчитал наилучшей, и дальнейшие действия не приведут к улучшению модели.

Доступные для выбора показатели:

  • Deviance.
  • Критерий Акаике.
  • Критерий Акаике (скорр.).
  • Критерий Байеса.
  • Критерий Ханнана-Куинна.