Вы находитесь на странице: 1из 3

Заметки по информатике и математике Выпуск 11

УДК 311.2:004.021

Кластеризация как элемент предобработки данных при


оптимизации портфеля по модели Марковица
А. Ю. Полетаев, Е. В. Старчиков
Ярославский государственный университет им. П. Г. Демидова
E-mail: anatoliy-poletaev@mail.ru, author@nowhere.org

Аннотация
Вопрос составления оптимального портфеля относится к
наиболее важным проблемам, имеющим огромное практиче-
ское значение. Однако, из-за того, что объём исходных дан-
ных обычно достаточно велик, необходимо искать способы
упрощения расчётов. В данной статье исследуется вопрос
влияния предварительной кластеризации данных, позволяю-
щей понизить их размерность, на выбор оптимального порт-
феля по модели Г. Марковица.
Ключевые слова: кластеризация, портфельные инвести-
ци, портфель Марковица, финансы.

Постановка задачи Согласно портфельной теории, впервые сфор-


мулированной Г. Марковицем в 1952 г., для составления оптималь-
ного портфеля из n ценных бумаг необходимо оценить лишь два
показателя [1]. Pn
1. Ожидаемую доходность R = i=1 PRni XPi
n
2. Меру риска (изменчивости) V = i=1 j=1 σi,j Xi Xj
Где Ri - ожидаемая доходность
Pn i-ой ценной бумаги; Xi - доля средств,
инвестированных в неё ( i=1 Xi ) = 1; σi,j - ковариация доходно-
стей ценных бумаг i и j.
Портфель может быть оптимизирован по заданной ожидаемой
доходности (для минимизации риска), по заданному риску (для
максимизации доходности) и по RAPOC (risk-adjusted return) - то-
гда максимизируется функция R − γV , где γ - некоторый коэф-
фициент. Результатом оптимизации является вектор долей X =
[X1 , . . . , Xn ]
В настоящее время разработано достаточно много математиче-
ских методов оптимизации портфеля по Марковицу [2; 3], однако,

c Полетаев А. Ю., Старчиков Е. В., 2019

1
Заметки по информатике и математике Выпуск 11

их общим недостатком является достаточно высокая вычислитель-


ную сложность. Учитывая, что объём биржевых данных достаточ-
но велик (например, только на американской бирже NASDAQ тор-
гуются акции более 3000 компаний [4]), а оптимизация портфеля
на динамичном рынке может требоваться достаточно часто, необ-
ходимо искать пути упрощения выбора оптимального портфеля.

Предлагаемое решение Предлагаемый подход заключается в


предварительной кластеризации - разделении n доступных ценных
бумаг на k групп (кластеров) (k < n). Затем для каждого кластера
рассчитываются доходность как средняя доходностей входящих в
него ценных бумаг и строится ковариационная матрица доходно-
стей кластеров. После этого можно будет решать задачу оптими-
зации портфеля для меньшего числа параметров, получив вектор
долей для кластеров W = [W1 , . . . , Wk ]. Рассчитать долю каждой
ценной бумаги можно будет по формуле:
Wj
Xi =
Sj
где

j - кластер, в который входит ценная бумага i


Sj - число ценных бумаг в кластере j
Критерием разделения (матрицей расстояний для метода иерар-
хической кластеризации) может служить, например, корреляция
доходностей ценных бумаг.
Таким образом, предлагаемый способ позволяет, если кластеры
выделяются достаточно хорошо, и k значительно меньше (как ми-
нимум на порядок) n, достаточно сильно снизить вычислительную
сложность оптимизации портфеля по модели Марковица. Кроме
того, несмотря на то, что алгоритмы кластеризации также облада-
ют достаточно высокой вычислительной сложностью, кластеры на
рынке ценных бумаг являются достаточно устойчивыми (эта тема
для применения к расчёту оптимального портфеля требует допол-
нительного изучения). Поэтому можно не проводить кластериза-
цию перед каждым расчётом оптимального портфеля, а провести
её один раз и пользоваться разбиением ценных бумаг на кластеры
в течение некоторого времени.

2
Заметки по информатике и математике Выпуск 11

Из-за того, что кластеры представляют собой объединения цен-


ных бумаг, оптимальный портфель, рассчитанный для кластеров,
конечно, будет по своим характеристикам хуже, чем оптимальный
портфель, рассчитанный для отдельных ценных бумаг. Для выяс-
нения целесообразности применения предложенного решения необ-
ходимо определить, насколько сильным будет снижение характери-
стик оптимального портфеля, рассчитанного для кластеров ценных
бумаг, по сравнению с оптимальным портфелем, рассчитанным для
отдельных ценных бумаг.

Пример проверки предлагаемого решения Для проверки ка-


чества предложенного решения сравним показатели качества опти-
мальных портфелей, рассчитанных на *данные* за *время* для
кластеризованных и некластеризованных данных. Кластеризация
проводилась по методу... Для оптимизации использовалась модель
Марковица и библиотека CVXPY, оптимизация производилась по
заданной ожидаемой доходности (т.к. матрицы ковариаций для кла-
стеризованных и некластеризованных данных различаются). Ре-
зультаты проверки приведены в таблице *таблица*
Таким образом, можно сделать вывод о том, что...

Список литературы
1. Markowitz H. Portfolio Selection // The Journal of Finance. 1952.
Vol. 7, no. 1. P. 77–91.
2. Дубровин В. И., Оськив О. Модели и методы оптимизации вы-
бора инвестиционного портфеля // Радиоэлектроника, инфор-
матика, управление. 2008. № 1. С. 49—60.
3. Joshi C. Markowitz Portfolio Optimization. 2017. URL: https:
//chaitjo.github.io/markowitz/.
4. NASDAQ corporate overview. 2015. URL: https://business.
nasdaq.com/media/Nasdaq%20Corporate%20Factsheet%202015_
tcm5044-11606.pdf.