Нормализация

Нормализация значений полей — это преобразование данных к виду, наиболее подходящему для обработки алгоритмом.

Настройка нормализации доступна как отдельная страница в мастерах:

Настройки нормализации

  • Поле — поле набора данных.
  • Нормализатор — выбранный нормализатор поля.
  • Множитель — параметр, определяющий значимость столбца при построении модели. Нулевое значение эквивалентно тому, что столбец не участвует при построении модели. Более высокое значение по сравнению с другими полями увеличивает шансы, что столбец будет присутствовать в финальной модели.
  • Неудаляемое — признак неудаляемости поля. Не может быть удалено в процессе отбора факторов. Данный фактор всегда будет присутствовать в модели.

Перечисленные алгоритмы используют различные параметры настроек нормализации:

Компонент Поле Нормализатор Множитель Неудаляемое
Линейная регрессия
Логистическая регрессия
Нейросеть (классификация)
Нейросеть (регрессия)
Кластеризация
EM Кластеризация
ARIMAX
Самоорганизующиеся сети  


Статьи в разделе: