Науковці в сфері медицини встановили, що якщо в інструкції до ліків знаходиться тільки текст, людина засвоює з неї лише 70% інформації. Якщо ж в інструкцію додати малюнки, людина засвоїть вже 95%.

d3bf07c63f8341ef99df2c94169a83e4

Що таке візуалізація даних?
Перш за все, потрібно знати, що ж таке візуалізація даних і які її методи використовуються, в тому числі і в повсякденному житті. Найпростіші, а тому й найпоширеніші методи візуалізації – це графіки
Візуалізація даних – це наочне представлення масивів різної інформації. Існує кілька типів візуалізації:

b7def1d560ec48978f5ae39133c0b816

• Звичайне візуальне представлення кількісної інформації в схематичній формі. До цієї групи можна віднести всім відомі кругові та лінійні діаграми, гістограми і спектрограми, таблиці і різні точкові графіки.
• Дані при візуалізації можуть бути перетворені у форму, що посилює сприйняття і аналіз цієї інформації. Наприклад, карта і полярний графік, тимчасова лінія і графік з паралельними осями, діаграма Ейлера.
• Концептуальна візуалізація дозволяє розробляти складні концепції, ідеї і плани за допомогою концептуальних карт, діаграм Ганта, графів з мінімальним шляхом та інших подібних видів діаграм.
• Стратегічна візуалізація переводить у візуальну форму різні дані про аспекти роботи організацій. Це всілякі діаграми продуктивності, життєвого циклу і графіки структур організацій.
• Графічно організувати структурну інформацію за допомогою пірамід, дерев і мап даних допоможе метафорична візуалізація, яскравим прикладом якої є мапа метро.
• Комбінована візуалізація дозволяє об’єднати кілька складних графіків в одну схему, як в мапі з прогнозом погоди.

Навіщо використовувати візуалізацію даних?

Візуальна інформація краще сприймається і дозволяє швидко і ефективно донести до глядача власні думки та ідеї. Фізіологічно, сприйняття візуальної інформації є основною для людини. Є численні дослідження, які підтверджують, що:

• 90% інформації людина сприймає через зір
• 70% сенсорних рецепторів знаходяться в очах
• близько половини нейронів головного мозку людини задіяні в обробці візуальної інформації
• на 19% менше при роботі з візуальними даними використовується когнітивна функція мозку, що відповідає за обробку та аналіз інформації
• на 17% вище продуктивність людини, що працює з візуальною інформацією
• на 4,5% краще згадуються докладні деталі візуальної інформації

• в 60 000 разів швидше сприймається візуальна інформація в порівнянні з текстовою

5c7b951c3de74c0d98dad75c22fdde24
На графіку читач швидше знайде мінімальне і максимальне значення
• 10% людина запам’ятовує з почутого, 20% – з прочитаного, і 80% – з побаченого і зробленого
• на 323% краще людина виконує інструкцію, якщо вона містить ілюстрації

b6abee98df114929a33d6d835782af81
Інструкцію знизу набагато легше і швидше зрозуміти і виконати

Детальніше про факти та дослідженнях можна подивитися у цікавій інфографіці тут.

Очевидно, що людина схильна обробляти саме візуальну інформацію. Крім прекрасної обробки нашим мозком, візуалізація даних має кілька переваг:

• Акцентування уваги на різних аспектах даних

• Аналіз великого набору даних зі складною структурою
• Зменшення інформаційного перевантаження людини і утримування його уваги
• Однозначність і ясність виведених даних
• Виділення взаємозв’язків і відносин, що містяться в інформації

d53b9208af8243b7b98596348efc612e
На графіку легко можна помітити важливі дані
• Естетична привабливість

7184546d1d05479ab3a8099b8e8ca323
Естетично привабливі графіки роблять подачу даних ефектною і такою, що запам’ятовується

Едвард Тафті, автор одних з найкращих книг по візуалізації, описує її як інструмент для показу даних; спонукання глядача замислитися про суть, а не методології; уникнення спотворення того, що повинні сказати дані; відображення багатьох чисел на невеликому просторі; показу великого набору даних зв’язковим і єдиним цілим; спонукання глядача порівнювати фрагменти даних; служіння досить чітким цілям: опису, дослідженню, упорядкуванню або прикрашанню (“The Visual Display of Quantitative Information”, Edward Tufte).

Як правильно використовувати візуалізацію даних?

Успіх візуалізації безпосередньо залежить від правильності її застосування, а саме від вибору типу графіка, його вірного використання та оформлення.

8b593906401e4c6daab6fec0d684fd4b

60% успіху візуалізації залежить від вибору типу графіка, 30% – від його правильного використання та 10% – від його вірного оформлення.

Правильний тип графіка

Графік дозволяє висловити ідею, яку несуть дані, найбільш повно і точно, тому дуже важливо вибрати відповідний тип діаграми. Вибір можна здійснити за алгоритмом:

4f5e7ebbc22d4ee88d9c82e7028ad26c
Цілі візуалізації – це реалізація основної ідеї інформації, це те, заради чого потрібно показати вибрані дані, якого ефекту потрібно досягнути – виявлення взаємозв’язків в інформації, відображення розподілу даних, композиції або порівняння даних.

40d0fc4491c04504abf02d287b919423

У першому ряду показані графіки з цілями відображені співвідношення даних і їх розподіл, а в другому рядку цілями є відображення композиції і порівняння даних

Співвідношення в даних – це те, як вони залежать один від одного, зв’язок між ними. За допомогою співвідношень можна виявити наявність або відсутність залежностей між змінними. Якщо основна ідея інформації містить фрази “відноситься до”, “знижується / підвищується при”, то потрібно прагнути показати саме співвідношення в даних.
Розподіл даних – це те, як вони розташовуються відносно чого-небудь, скільки об’єктів потрапляє в певні послідовні області числових значень. Основна ідея при цьому буде містити фрази “в діапазоні від x до y”, “концентрація”, “частотність”, “розподіл”.
Композиція даних – об’єднання даних з метою аналізу загальної картини в цілому, порівняння компонентів, що складають відсоток від якогось цілого. Ключовими фразами для композиції є “склало x%”, “частка”, “відсоток від цілого”.
Порівняння даних – об’єднання даних, з метою порівняння деяких показників, виявлення того, як об’єкти співвідносяться один з одним. Також це порівняння компонентів, що змінюються з часом. Ключові фрази для ідеї при порівнянні – “більше / менше ніж”, “дорівнює”, “змінюється”, “підвищується / знижується”.

Після визначення мети візуалізації потрібно визначити тип даних. Вони можуть за своїм типом і структурою бути дуже різнорідними, але в самому простому випадку виділяють безперервні числові і тимчасові дані, дискретні дані, географічні та логічні дані. Безперервні числові дані містять в собі інформацію залежності однієї числової величини від іншої, наприклад графіки функцій, такий як y = 2x. Безперервні тимчасові містять в собі дані про події, що відбуваються на якомусь проміжку часу, як графік температури, вимірюваної кожен день. Дискретні дані можуть містити в собі залежності категорійних величин, наприклад графік кількості продажів товарів у різних магазинах. Географічні дані містять в собі різну інформацію, пов’язану з місцем розташування, геологією та іншими географічними показниками, яскравий приклад – це звичайна географічна карта. Логічні дані показують логічне розташування компонентів відносно один одного, наприклад генеалогічне древо сім’ї.

0c570fe9422d40b0b916b4303b088786

Графіки неперервних числових і часових даних, дискретних даних, географічних і логічних даних

Залежно від мети і даних можна вибрати найбільш підходящий їм графік. Найкраще уникати різноманітності заради різноманітності і вибирати за принципом “чим простіше, тим краще”. Тільки для специфічних даних використовувати специфічні типи діаграм, в інших же випадках добре підійдуть найпоширеніші графіки:

• лінійний (line)
• з областями (area)
• колонки і гістограми (bar)
• кругова діаграма (pie, doughnut)
• полярний графік (radar)
• точковий графік (scatter, bubble)
• карти (map)
• дерева (tree, mental map, tree map)
• тимчасові діаграми (time line, gantt, waterfall).

Лінійні діаграми, графіки з областями і гістограми можуть містити в одному аргументі для однієї категорії кілька значень, які можуть бути як абсолютними (тоді до таких видів графіками додається приставка stacked), так і відносними (full stacked).

4b2e8b285f74473a9e3916112f37d8cb

Графік зі stacked значеннями і з full stacked

При виборі відповідного графіка можна керуватися наступною таблицею, складеної на основі цієї діаграми і книги “Говори мовою діаграм” Джина Желязни:

4c01a2ef33ea443d9db66131c51703dd

Діаграма Желязни виглядає наступним чином:

data-chart-type (1)

Правильне використання графіка

Важливо не тільки вірно вибрати тип графіка, але і правильно його використовувати:

• Не потрібно навантажувати графік великою кількістю інформації. Оптимальна кількість різних типів даних, категорій – це не більше 4-5, інакше ж доцільніше розділити таку діаграму на кілька штук.

294036f07c9141889f825eb03f808413
Такий графік можна порівняти зі спагеті і краще розділити на кілька діаграм
• Вірно вибрати шкалу і її масштаб для графіка. Для гістограм і графіків з областями потрібно починати шкалу значень з нуля. Постаратися не використовувати інвертовані шкали – це дуже часто вводить глядача в оману щодо даних.

e2688cad00de455ca321ec1c6e503251
Невірна шкала негативно впливає на сприйняття даних. У першому випадку некоректно обраний масштаб, у другому шкала інвертована
• Для кругових діаграм і графіків, де показаний відсоток від загальної частки, сума значень завжди повинна становити 100%.
• Для кращого сприйняття даних інформацію на осі краще впорядкувати – або за значеннями, або за алфавітом, або по логічному змістом.

Правильне оформлення графіка

Ніщо так не радує око, як правильно оформлені графіки, і ніщо так не псує діаграми, як наявність графічного “сміття”. Основні принципи оформлення:

• використовувати палітри схоже, не яскравих кольорів, і постаратися обмежитися набором із шести штук
• допоміжні та другорядні лінії повинні бути простими і не кидаються в очі

394b7161491c4f7db2cc99c31e77cee9
Допоміжні лінії на графіку не повинні відволікати увагу від основної ідеї даних
• там, де можливо, використовувати тільки горизонтальні написи на осях
• для графіків з областями варто використовувати колір з прозорістю
• для кожної категорії на графіку використовувати свій колір

Висновки

Візуалізація – потужний інструмент донесення думок та ідей до кінцевого споживача, помічник для сприйняття та аналізу даних. Але як і всі інструменти, її потрібно застосовувати в свій час і в своєму місці. В іншому випадку інформація може сприйматися повільно, а то і некоректно.

521a4ac60f004bbdbd1152a7f6aaf5ed

На графіках зображені одні й ті ж дані, зліва показано основні помилки візуалізації, а праворуч вони виправлені

При вмілому застосуванні візуалізація даних дозволяє зробити матеріал вражаючим, ненудним і незабутнім.

P.S. Дана стаття є передруком статті з порталу habrahabr.ru (DevExpress). Графіки для статті були зроблені за допомогою DevExtreme.

Переклад Тарнай Володимир

Share On Facebook
Share On Twitter
Показати кнопки
Сховати кнопки