Сегодня приведу микро пример, как вычленить строку из текстового файла по заданному шаблону. Например, у нас есть файл, в котором перемешаны время, даты, данные. Нам нужно вычленить время в формате ‘??:??’ и оставить только даты и данные (для дальнейшего парсинга).

Итак, код для Qlik Sense Script:

LOAD
    text([@1:n]) as строка,
    rowno() as rownum,
    if(text([@1:n]) like '??:??',1,0) as [время флаг]
FROM [lib://source/расходы.txt]
(fix, utf8, no labels)
where text([@1:n])<>''
;

А вот и результат парсинга:

Красным цветом помечены флаги, которые можно фильтровать на уровне скрипта

Т.е. теперь с помощью знака вопроса ‘?’ Вы можете задавать шаблон строки, размещая нужные знаки в порядке, который Вам нужен. Например, Вы знаете, что номера заказов заданы в формате ‘???-???-?????’, вбиваете этот шаблон в скрипт и начинаете парсить. Опять же, этот подход нужен для парсинга тестовых файлов, отрытых источников данных, где нет структуры данных.

И немного про парсинг:

Парсинг – это вычленение данных из неструктурированных источников данных (txt, комментарии документов, Html, информация из социальных сетей, api) и запись данных в структурированном и форматированном виде (текст, дата, число, деньги и т.п.)

0 0 голос
Рейтинг статьи

Подписаться
Уведомление о
guest
0 комментариев
Встроенная Обратная Связь
Просмотр всех комментариев
0
Оставьте, пожалуйста, комментарий!x
()
x