Сегодня приведу микро пример, как вычленить строку из текстового файла по заданному шаблону. Например, у нас есть файл, в котором перемешаны время, даты, данные. Нам нужно вычленить время в формате ‘??:??’ и оставить только даты и данные (для дальнейшего парсинга).
Итак, код для Qlik Sense Script:
LOAD
text([@1:n]) as строка,
rowno() as rownum,
if(text([@1:n]) like '??:??',1,0) as [время флаг]
FROM [lib://source/расходы.txt]
(fix, utf8, no labels)
where text([@1:n])<>''
;
А вот и результат парсинга:

Т.е. теперь с помощью знака вопроса ‘?’ Вы можете задавать шаблон строки, размещая нужные знаки в порядке, который Вам нужен. Например, Вы знаете, что номера заказов заданы в формате ‘???-???-?????’, вбиваете этот шаблон в скрипт и начинаете парсить. Опять же, этот подход нужен для парсинга тестовых файлов, отрытых источников данных, где нет структуры данных.
И немного про парсинг:
Парсинг – это вычленение данных из неструктурированных источников данных (txt, комментарии документов, Html, информация из социальных сетей, api) и запись данных в структурированном и форматированном виде (текст, дата, число, деньги и т.п.)