Нормализация
Нормализация значений полей — это преобразование данных к виду, наиболее подходящему для обработки алгоритмом.
Настройка нормализации доступна как отдельная страница в мастерах:
- Линейная регрессия;
- Логистическая регрессия;
- Нейросеть (классификация);
- Нейросеть (регрессия);
- Кластеризация;
- EM Кластеризация;
- ARIMAX;
- Самоорганизующиеся сети.
Настройки нормализации
- Поле — поле набора данных.
- Нормализатор — выбранный нормализатор поля.
- Множитель — параметр, определяющий значимость столбца при построении модели. Нулевое значение эквивалентно тому, что столбец не участвует при построении модели. Более высокое значение по сравнению с другими полями увеличивает шансы, что столбец будет присутствовать в финальной модели.
- Неудаляемое — признак неудаляемости поля. Не может быть удалено в процессе отбора факторов. Данный фактор всегда будет присутствовать в модели.
Перечисленные алгоритмы используют различные параметры настроек нормализации:
Компонент | Поле | Нормализатор | Множитель | Неудаляемое |
---|---|---|---|---|
Линейная регрессия | ● | ● | ● | ● |
Логистическая регрессия | ● | ● | ● | ● |
Нейросеть (классификация) | ● | ● | ||
Нейросеть (регрессия) | ● | ● | ||
Кластеризация | ● | ● | ||
EM Кластеризация | ● | ● | ||
ARIMAX | ● | ● | ||
Самоорганизующиеся сети | ● | ● |
Статьи в разделе: