Показываем время
08
/21
О чем мы поговорим сегодня
Посмотрим на выступление Analytics Group, чтобы узнать больше про аналитику блокчейн и настоящее расследование криптопреступлений! Во второй части дня изучим линейные графики для показа данных во времени и попробуем их построить в Qlik Sense.
ИСТОРИЯ УСПЕХА
Как расследовать кражи криптоактивов с помощью Qlik Sense: аналитика блокчейна в Analytics Group
Сегодня на марафоне будет еще один видео кейс: о том, как Qlik Sense помогает видеть аномалии в закономерностях данных и расследовать воровство криптоактивов. Этим кейсом на конференции Qlik Data Transformation Day 2022 поделился Владимир Лазарев, CEO, Analytics Group (~14 минут, не считая ответов на вопросы).

Но сначала загадка: посмотрите на верхнеуровневую аналитику блокчейн проекта и подумайте, какие закономерности/аномалии здесь видны, и что вам хочется исследовать подробнее?
А теперь посмотрите видео, где разбирается именно этот кейс и «проваливаются» в аналитику Qlik Sense, чтобы найти 30 000 долларов сворованных криптоактивов (и это один из небольших кейсов Analytics Group).
Выступление на Qlik Data Transformation Day 2022 в Astana Hub
Владимир Лазарев, CEO, Analytics Group, рассказал, как аналитика блокчейна на основе Qlik позволяет видеть аномалии в закономерностях данных и расследовать воровство криптоактивов
>106 000 000
Сейчас рынок крипты — это более 106 млн. пользователей с объемом транзакций в 1,9 трлн. долларов США
113 000
криптокошельков проанализировано в Analytics Group, чтобы выявить злоумышленника (только по одному из кейсов)
ТЕОРИЯ
Визуализация данных во времени
Денис Катюшин
генеральный директор, QUBData
Как правило, визуализация данных во времени позволяет оценить динамику показателя на протяжении нескольких недель/месяцев/лет. Чаще всего при построении аналитической отчетности используется ретроспектива 3 года (реже 5−7 лет).

При этом важно, чтобы было обеспечено «скольжение» — при закрытии очередного отчетного периода справа, отсекается хвост в размере такого же периода слева. Например, закрыли июнь 2022 года, добавили его во временной ряд, а июль 2020 года удалили. На какие вопросы можно получить ответы с использованием такой визуализации:
как изменялось значение выручки на протяжении 3 лет? растем/падаем?
как изменялась структура выручки по группам продукции на протяжении 3 лет? какие группы продуктов занимают лидирующие позиции в формировании выручки?
как выполнялся план на протяжении отчетного года помесячно? были ли провальные месяцы? были ли месяцы с серьезным перевыполнением плана?
как выполнялся план на протяжении отчетного года нарастающим итогом? например, выполнен ли план уже в октябре? или сколько осталось еще для выполнения плана за 2 месяца до окончания года?
какой прирост/падение к прошлому году присутствует по выручке помесячно?
присутствует ли сезонность в продажах? есть ли ярко выраженные просадки/всплески по выручке в конкретные месяцы года?
>> Кейс из практики
В компании, которая производит картонажную продукцию (упаковка — различные формы, различные коллекции и т. д.), ежедневно происходит списание различных компонентов в производство, в том числе химических реагентов. В дашборде руководителя по производству отражается посменный и почасовой (посредством drill down) график расхода компонентов на различные производственные линии.

Визуализация расхода компонентов в динамке позволили руководителю обнаружить выбросы по расходу хим. реагентов (превышал среднее значение в 3,5 раза), которые фиксировались при работе одной конкретной бригады (в определенные смены). В связи с этим было инициировано разбирательство — с чем связаны такие выбросы: с некорректной настройкой оборудования или человеческим фактором.
Линейный график
Линейный график — самый базовый способ для демонстрации изменения величины во времени: трендов, прогнозов и динамики. На линейных графиках может быть как одна, так и несколько линий, отображающих разные показатели.

Линейные графики чаще всего используют именно для показа данных во времени. Линия соединяет отдельные значения данных и усиливает акцент на видимых изменениях, отклонениях, трендах (в отличии от столбцов, которые акцентируют внимание на отдельных значениях, не связывая их между собой).

Для создания линейного графика в Qlik Sense, вам достаточно одного измерения и одной меры. При этом, измерение всегда располагается по оси X, а меры — по оси Y. Вы можете добавить дополнительные измерения, чтобы построить линейный график по нескольким наборам данных и получить несколько линий.
В свойствах линейного графика, вы также можете
  • показать точки на линии, чтобы выделить величины из источника данных
  • определить как показывать null-значения (пробелы, соединения точек, нули)
  • выбрать тип линейного графика: с линией или областью
Вариации линейного графика
Простой линейный график может быть переведен в другое представление, с заливкой области. Показывать в виде области изменение всего лишь одного показателя бессмысленно. Но при добавлении на график нескольких измерений, график с областью приобретает новый смысл. Обычно, такой график называют графиком с накоплением.

График с накоплением работает также как и обычный график за исключением того, что несколько категорий данных могут накладываться непосредственно друг на друга. То есть, каждое значение нового набора данных прибавляется к уже существующим значениям, образуя «новый слой».

В Qlik Sense, при выборе графика с областью, у вас есть возможность указать, как именно следует показывает несколько наборов данных: друг над другом или от общей оси.

Сравните расположение сегментов и размерность шкалы на двух примерах ниже. Мы используем левый вариант, когда нам важно показать накопленный итог и всю сумму по всем сегментам внутри визуализации. Правый вариант по смыслу аналогичен простому линейному графику.
Когда вам нужно показать несколько мер на визуализации, можно использовать комбинированные диаграммы с двумя осями.
Комбинированные диаграммы подходят:
при наличии линейного графика и столбиковой диаграммы с одной и той же осью X
для сравнения нескольких показателей с другими диапазонами значений
для демонстрации корреляции между двумя показателями в одной визуализации
для проверки соответствия одного показателя целевому, который определяется другим показателем
Наиболее распространенный пример: сравнение плана и факта или отображение процентной доли рядом с абсолютными значениями. При этом, на комбинированном графике, меры могут иметь разную размерность (абсолютные числа и %, показатель со шкалой от 10 до 100 и в миллиардах), или одинаковую (доходы и расходы в одной размерности).
Доступ к выбору второй оси — через кнопку «Другие свойства» и выбор «Вторичной оси».

Вы также можете выбрать каким способом показывать оба показателя: такими же барами, линией или маркерами. Маркерами выступают простые геометрические фигуры, которые откладывают значение точки в виде одного символа. Обычно маркерами показывается дополнительный, не приоритетный показатель, поскольку маркер менее заметен на фоне столбцов.

Комбинированная диаграмма поддерживает только одно измерение, и поэтому ее нельзя использовать, когда нужно включить в визуализацию два и больше измерений.

Можно указать только одно измерение и до 15 мер. Каждую из мер можно, как обычно, разбивать на дополнительные, задавать настройки цвета и применять все стандартные свойства.
ПРАКТИКА
Создаем визуализации
Игорь Буробин
эксперт по Qlik Sense, «Про BI»
Практическое задание
Мы продолжаем работать на основе уже загруженных данных (из практики дня 05).

Постройте линейный график, отображающий количество фильмов по году производства. На графике будет отображена одна линия, но добавив второе измерение мы можем отразить столько линий, сколько значений во втором измерении.

Добавьте измерение «Жанр» и на графике каждая линия будет отображать динамику отдельного жанра. Если у вас не установлены отборы, то на графике будет отображено множество линий. Это типичный пример плохой визуализации, спагетти-чарт. Обычно я не рекомендую выводить на линейчатый график более 5 линий.
Подсказки
Для того, чтобы уменьшить количество значений измерений мы можем использовать Ограничения (как в предыдущем дне марафона в задании, где требовалось выводить рейтинг стран по наибольшему количеству фильмов).

Сегодня мы используем другой способ — мы добавим в график условие вычисления. В условии вычисления указывают выражение: если выражение истинно, то визуализация будет отображаться, иначе будет выведено сообщение, текст которого указывается вторым параметром.

Добавьте в условие вычисления выражение count(distinct [Жанр]) <= 5, а в отображаемое сообщение текст, который будет выводится если выражение ложно.
Разместите рядом с графиком фильтр по измерению Жанр.

Убедитесь в том, что при выборе в фильтре пяти и менее жанров визуализация будет отображаться.
Полезные ссылки
Если вам интересно узнать больше, переходите по ссылкам для дальнейшего изучения тем и расширения кругозора
Александр Полоротов
со-основатель, Datanomix.pro

Нарисованная Флоренс

В Европе историю ухода за больными в госпиталях делят на две эпохи: до Флоренс Найтингейл и после.

Викторианская аристократка известна не только как образцовая сестра милосердия, но и как видный общественный деятель и пионер визуализации данных. В 1859 году она стала первой женщиной, принятой в Королевское статистическое общество.

Подробнее про историю Флоренс Найтингейл и о ее вкладе в визуализацию данных — читайте в статье от Александра!
Телеграм-сообщество Qlik
Приглашаем вас присоединиться к телеграм-чату Qlik, чтобы общаться с коллегами, задавать вопросы экспертам и оставаться в курсе новостей Марафона.
@qlikbi_chat
Обзор дня и встреча с экспертом: День 08
Павел Краснопольский, ведущий разработчик, Qlik

2022