Импорт из текстового файла
Используется для импорта данных из текстовых файлов c разделителями. Текстовый файл с разделителями представляет собой обычный текстовый файл, столбцы данных в котором разделены однотипными символами-разделителями, например, символами табуляции, запятыми, точками с запятой и т. д.
Вход
- Управляющие переменные (необязательный порт) — переменными можно задать значения параметров мастера настройки.
Выход
- Набор данных (таблица данных).
Мастер настройки
Мастер содержит несколько этапов настройки.
Шаг 1. Импорт из текстового файла
На первом этапе настройки указываются следующие параметры:
Имя файла/URL — путь к файлу, содержащему необходимые данные, или URL-ссылка для получения файла (поддерживаются протоколы http/https, а также HTTP Basic Authentication
https://login:password@hostname.com/path/file.csv
,http://hostname.com/path/file.csv
).Кнопка вызывает диалог выбора файла.
Кнопка позволяет добавить несколько файлов для импорта. Данные из всех файлов будут импортированы в одну итоговую таблицу. Файлы должны быть одинаковой структуры.
Для разделения файлов в строке используется специальный символ разделитель
|
, например:Имя Файла 1.txt|Имя Файла 2.txt
Имя файла может содержать маску, которая позволяет системе выполнять поиск файлов, соответствующих ей. Для маски применяется специальный символ
*
. Например,Путь до файла/М*ска.txt
илиПуть до файла/*.txt
. При задании маски нельзя использовать символ?
, т.к. он может являться частью URL-ссылки. Чтобы сохранить возможность множественного импорта с использованием URL-ссылок, данный символ не воспринимается как маска.- Информация о файле — выпадающий список, добавляет дополнительные поля, содержащие информацию о файле:
- Нет — без дополнительных полей.
- Имя файла — дополнительное поле с именем файла:
Товары.txt
. - Относительный путь — дополнительное поле содержит относительный путь до файла:
Пользователь/Downloads/Товары.txt
. - Абсолютный путь — дополнительное поле содержит абсолютный путь до файла:
C:Users/Пользователь/Downloads/Товары.txt
. - Имя файла, время модификации — дополнительные поля, содержащие имя файла (поле Строкового типа) и время модификации файла (поле типа Дата/Время).
- Относительный путь, время модификации — дополнительные поля, содержащие относительный путь (поле Строкового типа) и время модификации файла (поле типа Дата/время).
- Абсолютный путь, время модификации — дополнительные поля, содержащие абсолютный путь (поле Строкового типа) и время модификации файла (поле типа Дата/время).
- Кодовая страница — кодировка, в которой хранится текст в файле.
- Заголовок в первой строке — флаг, определяющий, что метки полей создаваемого набора данных содержатся в первой строке импортируемого текста.
- Пропустить строк — количество строк с начала текста, не подлежащее импорту.
Шаг 2. Настройки форматов импорта
Определить автоматически — автоматически определяются все разделители и рассчитывается структура полей.
На этапе настройки указываются следующие параметры:
- Разделитель столбцов — символ, разделяющий данные соседних столбцов.
Примечание: Есть несколько стандартных разделителей:
tab
,,
,;
. Если естьtab
или;
, используется тот, который чаще встречается, иначе приоритет отдаётся,
. Также присутствует возможность задать разделитель вручную, для этого необходимо в строке заменить предложенный в форме ввода текст на нужный разделитель. Если названных разделителей нет, то делается попытка разделить по пробелам.
- Считать последовательные разделители одним — установка флага позволит принимать несколько подряд идущих разделителей столбцов за один.
- Ограничитель строк – символ, обрамляющий значения ячейки загружаемого набора данных. Текст, следующий за этим символом и предшествующий следующему его вхождению, импортируется как одно значение, даже если текст содержит символ-разделитель.
- Пусто – текст, представляющий значение Null.
- Переменный тип — установка флага определяет поля, содержащие в себе записи с различными типами данных, как Переменный тип. При неактивном флаге таким полям присваивается Строковый тип.
- Десятичный разделитель – символ, разделяющий дробную и целую части числовых значений.
- Формат даты – параметром задается формат даты, используемый в импортируемом тексте.
- Разделитель даты – символ, разделяющий компоненты даты.
- Разделитель времени – символ, разделяющий компоненты времени.
Примечание: Распознавание чисел и даты происходит так: выбирается первый строковый столбец, который преобразуется в нужный тип (целый, вещественный, дата/время). Разделитель, распознанный в этом столбце, будет применяться в остальной таблице.
- Истина – текст, представляющий логическое значение Истина.
- Ложь – текст, представляющий логическое значение Ложь.
Табличная часть окна мастера предназначена для настройки параметров импорта для каждого поля набора данных.
- Обновить все — рассчитывает все имена, метки, типы и виды данных полей.
- Определить типы данных — рассчитывает заново только типы и виды данных.
- Кол-во строк для анализа — задает количество строк набора, по которым будет проводиться анализ типа данных. При этом максимальное число строк для отображения 200.
- Исходные данные — в табличной части окна мастера будет показан исходный (текстовый) вариант загружаемых данных.
- Результат — в табличной части окна мастера будет показан результат преобразования данных с учетом установленных параметров полей.
- Развернуть — разворачивает табличную часть мастера настроек.
- Свернуть — сворачивает табличную часть мастера настроек.
Следующие настройки применяются для формирования результирующего набора данных вручную:
- Имя — задается уникальное имя поля.
- Метка — задает пользовательское описание поля.
- Тип данных — тип данных , в который будет преобразовано текстовое значение поля.
- Вид данных — вид данных, задается списком значений:
- Непрерывный.
- Дискретный.
- Неопределенный.
- Использовать — флаг включения поля в результирующий набор данных.
Автоматическое определение структуры таблицы
Свойства таблицы, которые могут быть определены автоматически:
- Заголовок в первой строке
- Ограничитель строк
- Десятичный разделитель
- Разделитель даты
- Разделитель времени
- Формат даты
Особенности множественного импорта файлов
При множественном импорте настройки мастера являются общими для всех файлов, которые будут импортироваться. Активация узла будет читать строки из всего диапазона файлов, пока не будет прочитан последний.
Чтение имени файла выполняется либо до разделителя, либо до конца строки. Из этого следует, что если в конце строки Имя файла/URL оставить разделитель, то программа выполнит пустое чтение в конце обработки строки. В связи с этим пустое чтение не воспринимается как ошибка. Таким образом, ситуация имя1||имя2
и имя3|
не считается ошибочной.
При множественном импорте на второй странице мастера настройки отображаются строки из нескольких файлов пока их общий диапазон строк не превысит указанный лимит (по умолчанию для импорта из текстового файла это 25 строк).
При определении типов колонок в учёт берутся строки из нескольких файлов.
Статьи в разделе: