Очень большие наборы данных, включающие в себя объемные символы – создают проблемы для аналитиков, и не последняя из этих проблем – это сложность визуализации связей между отдельными компонентами. В условиях отсутствия визуальных подсказок, которые часто привлекают внимание на графических изображениях, аналитикам легко упустить из виду важные изменения в данных. Одним из способов решения проблемы является использование графов.
В этом примере я выбрал 30 акций индекса Dow, вместе с образцом сырьевых товаров и облигаций и сформировал базу данных ежедневных доходностей за период с января 2012 по декабря 2013 года. Если мы хотим посмотреть на то, как коррелируют активы, то один из способов — это создание графа смежности, который отображает взаимосвязи между активами, которые связаны между собой на определенном уровне (0.5 от высшего, в данном примере).Очевидно, что выбор порогового значения корреляции носит несколько условный характер, и несложно динамически оценить результаты по целому ряду различных параметров порога, например в диапазоне от 0,3 до 0,75: