Самоорганизующиеся сети
Описание
Самоорганизующиеся сети позволяют выявлять кластеры (группы) входных векторов, обладающих некоторыми общими свойствами. Таким образом, они хорошо подходят для кластерного анализа.
К самоорганизующимся сетям относятся, в частности, сети Кохонена. Сети Кохонена представляют собой разновидность самоорганизующихся карт признаков, которые, в свою очередь, являются специальным типом нейронных сетей. Сеть Кохонена состоит из узлов, которые объединяются в кластеры. Наиболее близкие узлы соответствуют похожим объектам, а удаленные друг от друга — непохожим.
Также одним из типов самоорганизующихся сетей является нейронный газ. Нейронный газ — это алгоритм, позволяющий осуществлять адаптивную кластеризацию входных данных, то есть не только разделить пространство на кластеры, но и определить необходимое их количество, исходя из особенностей самих данных.
Для получения результирующих наборов требуется предварительное обучение узла.
Порты
Вход
- Входной источник данных (таблица данных) — обязательный порт.
Требования к принимаемым данным
Поле будет запрещено к использованию, если:
- оно является дискретным и содержит всего одно уникальное значение;
- оно непрерывное и с нулевой дисперсией;
- оно содержит пропущенные значения.
Выход
Разбиение на кластеры. Таблица, состоящая из полей:
- Номер кластера — каждому объекту присвоен номер того кластера, в который он входит. Кластер состоит из узлов сети.
- Номер узла — каждому объекту присвоен номер узла сети, к которому он относится. Узлы в свою очередь объединяются в кластеры (поле Номер кластера).
- Расстояние до узла — евклидово расстояние до ближайшего узла, т.е. того, которому принадлежит объект.
- Все поля исходного набора данных, независимо от назначения поля.
Координаты узлов. Таблица, состоящая из полей:
- Номер узла — перечислены номера сформированных узлов.
- Номер кластера — перечислены номера сформированных кластеров.
- Поля исходного набора данных, для которых значение параметра Назначение выбрано Используемое. В ячейках полей указаны веса узлов сети.
Мастер настройки
Мастер настройки включает в себя следующие группы параметров:
- Настройка входных столбцов. На данном этапе производится выбор полей для кластеризации:
- Для полей, участвующих в кластеризации, выставить назначение Используемое.
- Для прочих полей оставить Не задано.
- Настройки нормализации.
Самоорганизующаяся нейронная сеть.
- Тип самоорганизующейся сети:
- Сеть Кохонена.
- Нейронный газ. При выборе данной опции блок Параметры сети становится неактивным.
- Параметры сети:
- Топология сети: 1D, 2D прямоугольная, 2D гексагональная, 3D.
- Размер сети по X. Параметр доступен для редактирования при любой топологии сети. Устанавливается значение целого типа в интервале от 2 до 100. По умолчанию — 3.
- Размер сети по Y. Параметр доступен для редактирования при следующих топологиях сети: 2D прямоугольная, 2D гексагональная, 3D. Устанавливается значение целого типа в интервале от 2 до 100. По умолчанию — 3.
- Размер сети по Z. Параметр доступен для редактирования при топологии сети 3D. Устанавливается значение целого типа в интервале от 2 до 100. По умолчанию — 3.
- Тип самоорганизующейся сети:
Random seed — начальное число (целое, положительное), которое используется для инициализации генератора псевдослучайных чисел. Последовательность чисел генератора полностью определяется начальным числом. Если генератор повторно инициализируется с тем же начальным числом, он выдаст ту же последовательность чисел.
Параметр влияет на воспроизводимость результата обучения. Можно повторить результат обучения узла, если подать те же данные и выставить тот же random seed.
Для параметра доступны следующие команды:
- Всегда случайно — начальное число всегда будет случайным.
- Генерировать — сгенерируется новое начальное число.
- Копировать — в буфер обмена будет скопировано указанное значение.