Отчет по регрессии

Визуализатор Отчет по регрессии компонента Линейная регрессия отображает параметры и результаты статистических тестов для анализа регрессионных моделей.

Данный визуализатор состоит из трех областей:

Интерфейс

Операции

Область Информация о модели

Область Коэффициенты регрессии

  • Таблица — переключение отображения коэффициентов регрессии в вид Таблица.
  • Дерево — переключение отображения коэффициентов регрессии в вид Дерево.
  • Нулевые значения — отображение/скрытие нулевых значений.

Область Шаги построения

Области визуализатора

Информация о модели

  • Модель (выпадающий список) - позволяет выбрать одну из моделей, созданных пошаговым алгоритмом в процессе отбора факторов.

Описание показателей модели представлено в таблице:

Показатель Описание
Логический Константа Информация о том содержит модель константу или нет
ВещественныйЛогарифм функции правдоподобия Показывает степень соответствия модели набору данных, на котором она обучается
Вещественный Коэффициент детерминации Доля дисперсии зависимой переменной, объяснённая регрессионной моделью (изменяется от 0 до 1)
Вещественный Коэффициент детерминации (скорр.) Отличается от нескорректированного коэффициента детерминации тем, что накладывает штраф за дополнительно вводимые в модель переменные (изменяется от 0 до 1)
Вещественный Стандартное отклонение Мера отклонения примеров от предсказанных моделью значений
Целый Число степеней свободы ошибки Разность между размером выборки и числом оцениваемых параметров модели
Целый Число степеней свободы модели Число независимо варьируемых переменных модели
Вещественный F-статистика Статистика F-теста для оценки значимости модели
Вещественный Р-значение модели Оценка значимости модели. Чем меньше P-значение, тем меньше вероятность нулевой гипотезы о том, что нет статистически значимой связи между зависимой и независимыми переменными. Вычисляется по F-статистике.
Вещественный Критерий Акаике Критерий используется для сравнения моделей с разным числом параметров, когда требуется выбрать наилучший набор объясняющих переменных
Вещественный Критерий Акаике (скорр.) Модифицированный критерий Акаике, применяемый для выборок малого размера, когда отношение числа содержащихся в ней примеров к числу параметров модели меньше 40
Вещественный Критерий Байеса Критерий основан на использовании функции правдоподобия и тесно связан с информационным критерием Акаике
Вещественный Критерий Ханнана-Квина Критерий основан на использовании функции правдоподобия и является альтернативой критериям Акаике и Байеса

Коэффициенты регрессии

Описание коэффициентов представлено в таблице:

Коэффициент Описание
Коэффициент Оценка значений коэффициентов при независимых переменных
Стандартная ошибка Стандартная ошибка оценки коэффициента
Т-статистика Статистика Т-критерия Стьюдента для оценки значимости переменной
Р-значение Оценка значимости переменной. Чем меньше Р-значение, тем меньше вероятность нулевой гипотезы о том, что коэффициент при независимой переменной равен 0. Вычисляется по Т-статистике.
Нижняя граница ДИ Нижняя граница доверительного интервала
Верхняя граница ДИ Верхняя граница доверительного интервала

Коэффициенты регрессии могут быть представлены в виде Таблицы (см. рисунок 1) или Дерева (см. рисунок 2).

Режим отображения Таблица
Рисунок 1. Режим отображения Таблица
Режим отображения Дерево
Рисунок 2. Режим отображения Дерево

Шаги построения

Область Шаги построения состоит из следующих полей:

Поле Описание
Модель Дерево, в котором отображается пошаговый процесс отбора факторов для построения финальной модели
Показатель Значение выбранного показателя для текущей модели
Изменение поля Отображает добавлен или удален фактор ("+" означает, что фактор добавлен в модель, а "-" показывает, что фактор удален из модели)
Поля Текущие поля модели

Существует три вида моделей:

  • Нулевая модель — начальная модель работы алгоритма.
  • Промежуточная модель — модель, которую создал алгоритм в процессе обучения.
  • Финальная модель — модель, которую алгоритм посчитал наилучшей.

Доступные для выбора показатели:

  • F-тест (Р-значение)
  • Коэф-т детерминации
  • Коэф-т детерминации (скорр.)
  • Критерий Акаике
  • Критерий Акаике (скорр.)
  • Критерий Байеса
  • Критерий Ханнана-Куинна