Нормализация непрерывных данных

Варианты нормализации данных в Loginom:

  • Нет — отсутствие нормализации. В таком случае данные поступают в основной алгоритм без предварительной обработки.
  • Масштабирование [min; max] — приведение данных линейным преобразованием к заданному пользователем диапазону [min; max]:
    • Минимум — минимальное значение.
    • Максимум — максимальное значение.
  • Масштабирование [-1;1] — приведение данных линейным преобразованием к диапазону [-1;1].
  • Масштабирование [0;1] — приведение данных линейным преобразованием к диапазону [0;1].
  • Абсолютное масштабирование — каждое значение делится на максимальное абсолютное значение.
  • Стандартизация — из каждого значение вычитается среднее значение и делится на стандартное отклонение.
  • Отношение — каждое значение делится на статистический показатель, либо на заданное пользователем значение.
    • Делитель:
      • Статистический показатель (Минимум, Максимум, Среднее, Сумма, Стандартное отклонение на основе несмещенной дисперсии).
      • Заданное значение.

Контроль диапазона значений

Контроль диапазона значений отвечает за то, чтобы при выполнении узла значение не вышло за указанный диапазон, сохраненный при обучении.

  • Метод контроля:
    • Нет — метод контроля отсутствует.
    • Ошибка — если встречается значение вне заданного диапазона, то при запуске узла выдается ошибка Нормализующее значение больше максимума диапазона значений.
    • Винсоризация — если встречается значение вне заданного диапазона, то оно приводится к максимальному/минимальному значению.
  • Ручная настройка — при установке данного флага становится доступным выбор диапазона значений.
  • Исходный диапазон — значения минимума и максимума входного поля. Устанавливается при переобучении узла.
    • Минимальное.
    • Максимальное.
  • Контролируемый диапазон — ручная настройка диапазона значений.
    • Минимальное.
    • Максимальное.