Группировка Группировка

Группировка выполняет действия над набором данных аналогичные действиям SQL-запроса с применением предложения GROUP BY. Компонент позволяет объединять записи избранных полей в группы, а для оставшихся полей вычислять статистические показатели (сумму, среднее, минимум и т.д.). Для каждой группы возвращается одна строка. Статистические показатели (или функции агрегации) при этом вычисляются для каждой группы, а не для всего набора в целом.

Пример:

Исходная таблица:

Дата Товар Вес, кг
12.07.2015 Яблоки 20
12.07.2015 Яблоки 18
12.07.2015 Помидоры 24
13.07.2015 Помидоры 22
13.07.2015 Груши 12
13.07.2015 Груши 16

В качестве полей-групп выберем поля Дата и Товар, а поле-параметр (по которому будет проводиться агрегация) — Вес, кг. Для примера применим три функции агрегации: сумма, количество записей и среднее.

Результирующая таблица:

Дата Товар Вес, кг (Сумма) Вес, кг (Количество) Вес, кг (Среднее)
12.07.2015 Помидоры 24 1 24
12.07.2015 Яблоки 38 2 19
13.07.2015 Груши 28 2 14
13.07.2015 Помидоры 22 1 22

Как видно из примера, группа образуется уникальным сочетанием значений полей, выбранных в качестве группировочных.

Вход

  • Входной источник данных Входной источник данных — порт для подключения входного набора данных.

Выход

  • Выходной источник данных Выходной набор данных — порт отдающий сгруппированную таблицу.

Мастер настройки

Окно мастера поделено на две области.

  • Доступные поля — содержит список полей входного набора данных.
  • Выбранные поля — делится на списки Группа и Показатели.
    • Группа Группа — поля группировки.
    • Показатели Показатели — поля, по которым рассчитываются функции агрегации.
Агрегация показателей и возможные типы данных
Вид агрегации
Сумма
Количество
Минимум
Максимум
Среднее
Медиана
Мода
Стандартное отклонение
Количество уникальных
Количество пропусков
Первый
Последний
Единственный

Для настройки требуется переместить поля входного набора в списки Группа или Показатели, перетаскивая их мышью. Так же это можно сделать с помощью кнопок : Переместить в Группу Переместить в Группу (комбинация горячих клавиш Alt+G) и Переместить в Показатель Переместить в Показатели (комбинация горячих клавиш Alt+S). Над списком доступных полей расположено поле Фильтрация, оно позволяет найти поле по имени или его части.

Настройка метода агрегации для каждого показателя производится в отдельном окне. Чтобы его открыть, нужно дважды кликнуть по полю в списке Показатели или вызвать это окно из контекстного меню. Далее отметить галочками нужные методы агрегации. Результат для каждого метода будет записан в отдельный столбец.

В нижней части мастера расположены два параметра отмечаемые чекбоксами:

  • Кэшировать значения групп — результирующие данные будет закэшированы для использования последующими узлами;
  • Сортировать результирующие данные — данные в результирующей таблице будут отсортированы по полям группировки в зависимости от их последовательности расположения в списке Группы.