Вы находитесь на странице: 1из 14

ПЕРМСКИЙ ФИЛИАЛ ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО

АВТОНОМНОГО ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ


ВЫСШЕГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Факультет экономики, менеджмента и бизнес-информатики

Аверенс Августа Артёмовна


ДЕТЕРМИНАНТЫ СПРОСА НА ТЕАТРАЛЬНЫЕ ПОСТАНОВКИ
КУРСОВАЯ РАБОТА
студента образовательной программы бакалавриата «Экономика»
по направлению подготовки 38.03.01 Экономика

Руководитель
кандидат эк. наук
Е.В. Роженцова

Пермь, 2020 год


Литературный обзор и методология

Экономика культуры имеет дело с искусством в широком смысле. Что касается


сферы музыкального театра, опера играет решающую роль в построении лучшего
общества, поскольку она вносит более широкий вклад в улучшение культуры и искусства.
Роль грантов от учреждений и спонсорства от компаний в умножении выгод для всего
общества весьма существенна. Ресурсы театра весьма ограничены, а потому правильное
их распределение – это крайне важная задача любого государственного учреждения
культурной индустрии. Понимание внутренних процессов, осознание экономических
выгод и ограничений всегда актуальны для любой рассматриваемой индустрии: как
коммерческой, так и некоммерческой. Именно поэтому было решено рассмотреть в
рамках микроэкономического исследования деятельность одного из музыкальных театров
г. Перми, чтобы повысить осведомленность театрального менеджмента о законах спроса
на музыкальные постановки для жителей данного города и региона.

Цель данной работы - выяснить, можно ли сделать статистический прогноз


кассового успеха спектакля, используя запросы поисковой системы наряду с другой
информацией, такой как например сезон, национальность композитора и др. В разделе
«Методология» будет описаны источники данных, используемых при прогнозировании,
характеристики данных запроса, метод прогнозирования и экспериментальные
результаты. В «Заключении» будут подведены результаты исследования и предложены
дальнейшие направления работы.

Мы понимаем, что театр должен, по крайней мере частично, окупить расходы за


счет доходов от производства, чтобы производить новые постановки и делать вклад в
репутацию региона. Следовательно, театр постоянно пытается балансировать между тем,
чтобы быть доступным и покрывать расходы, используя механизм ценообразования и
взимая различные цены за различные спектакли и места (ценовую диверсификацию).

Исследование посещаемости может помочь обеспечить соответствующее


обслуживание аудитории. Поскольку высокие показатели посещаемости означают
большое количество зрителей, театрам необходимо поддерживать соответствующий
уровень собственных услуг, количество персонала, чтобы верно ориентироваться на свою
аудиторию. В настоящее время посещаемость обычно оценивается театральными
менеджерами на основе их собственного опыта, что требует глубокого понимания и
богатого опыта.
Деятельность театрального менеджмента предполагает систематическое изучение
потребностей и желаний клиентов, их восприятие и отношение, предпочтения и степень
удовлетворенности. Рентшлер и др. (2002) утверждал: "чем больше организация узнает о
потребностях, предпочтениях и заботах своих клиентов, тем быстрее растет уровень их
удовлетворенности и лояльности". Именно так современные исследователи в области
маркетинга подразумевают, что художественные организации не могут по-настоящему
понять свой продукт, пока не поймут, как его воспринимает потребитель или их
аудитория (March & Thompson, 1996).

Обратимся к уже существующим работам в вопросах исследования экономики


театра и спроса на театральные представления.

В статье «A microeconomic study of theatre demand» (Lévy-Garboua and


Montmarquette, 1996) приводится модель спроса на театральные постановки, которую
называют “learning by consuming”, которая заключается в том, что количество каждого
товара взвешивается по его качеству и потребление увеличивается со временем. Модель
тестируется на выборке данных, собранных в 1987 году Министерством культуры
Франции из опроса 8000 человек в возрасте от 15 лет и старше, включая 1000 человек,
регулярно посещающих театр («театралов»). Исследование было направлено на
выявление детерминант похода в театр с использованием моделей потребительского
выбора (условного и безусловного). Переменные разделены по категориям: социально-
экономические и демографические, ценовые и качественные, переменные знаний и
предпочтений и др. Так среди переменных были следующие: цена представления и цена
субститутов, оценка качества (репутация театра, репутация режиссера, качества дизайна и
костюмов, рецензии, репутация актера, спектакля, продюсера и трупы, внутренняя
постановка или нет, размер постановки, тип постановки (классификация репертуара:
классическая постановка (до 1900 г.) или нет), контекст постановки, время постановки
(вечер/день, премьера/нет, открытая репетиция/нет и т.д.). Данная модель позволила
выявить, что спрос на театр эластичен по цене и что эффекты замещения телевизионных
театральных передач, кино и чтения являются значимыми. На субъективную оценку
качества представления влияют в большей степени: вкус индивида на театральные
постановки и степень осведомленности о самом театре. Также размер города является
важным фактором, влияющим на желание посещать городской театр.

Что касается выбора регрессоров, например, (Werck and Heyndels, 2007)


используют в качестве независимых переменных следующие факторы: оригинальный
язык пьесы, возраст драматурга, является ли пьеса адаптацией или нет, количество
задействованных актеров (персонажей), а также является ли пьеса ремейком или новой
постановкой.

Рисунок 1. Выбор независимых переменных (Werck and Heyndels, 2007)

Статья «A latent class model of theatre demand» (Grisolía and Willis, 2012) была
направлена на исследование WTP и сегментов рынка театрального спроса с
использованием модели латентного класса. В статистике модель латентного класса (LCM)
связывает набор наблюдаемых (обычно дискретных) многомерных переменных с набором
латентных переменных. Это тип латентной переменной модели. Она называется моделью
скрытого класса, поскольку скрытая переменная дискретна. Латентные классовые модели
обычно используются, когда исследователь подозревает, что в популяции существуют
различные подгруппы или категории индивидов. Модель применяется с использованием
данных опроса заявленных предпочтений, проведенного в региональном театре в Англии.
Результаты позволяют определить три класса театралов: основной (обеспеченные люди,
которые любят все виды спектаклей), популярный (с самым низким WTP, предпочитают
комедии и легкие шоу) и интеллектуальный (максимальный WTP, сильный интерес к
драматургии).

Если во многих работах тип представления как переменную включали в категорию


«качество», в исследовании «A latent class model of theatre demand» (Grisolía and Willis,
2012) данную переменную брали как отдельный фактор, так как разные типы спектаклей
показывают разные предпочтения, вне зависимости от качества спектакля. Однако в саму
модель включаются оба фактора: жанр и качество. Авторы делают акцент на социо-
демографических факторах, так как методология основывается в большей степени на
опросе людей. Помимо латентной модели спроса строится также и логит-модель спроса. В
статистике логистическая модель (или логит-модель) используется для моделирования
вероятности существования определенного класса или события, такого как сдал/не сдал,
победил/проиграл, жив/мертв или здоров/болен. Все это может быть применено также для
моделирования нескольких классов событий, таких как определение того, содержит ли
изображение кошку, собаку и т. д. Каждому объекту, обнаруженному на изображении,
будет присвоена вероятность от 0 до 1 и сумма, добавленная к единице. Модели probit и
logit являются одними из самых популярных моделей. В них зависимая переменная – это
двоичный ответ, обычно кодируемый как переменная 0 или 1. Например, совершает ли
потребитель покупку или нет, участвует ли человек на рынке труда или нет.

Интересным результатом можно выделить, что для английской аудитории драма


являлась самым популярным жанром (кроме того класса, который редко посещает театр:
для них это была комедия). Очевидно была выявлена высокая статистическая значимость
отрицательной цены: чем выше цена, тем неохотнее люди покупают билеты
(отрицательная полезность). Само здание и репутация театра очень важны для многих
зрителей: его популярность, статус, местоположение.

В работе (Ozhegov and Ozhegova, 2018) предлагается оценка для прогнозирования


спроса, которая учитывает неоднородность предпочтений. В качестве регрессоров были
выбраны следующие переменные: представление (вид, композитор, дирижер и т.д.),
постановка (месяц, день недели, время дня, премьера/не премьера) и выбранное место в
зале. Наиболее частыми переменными для разбиения выборки на подвыборки являются
тип постановки (балет или опера), место в зале, национальность композитора (русский
или иностранный), мировая известность постановщика и дирижера. Было выявлено, что
спрос менее эластичен по цене на балет (российские балеты среди всех остальных) и
иностранные оперы, а также места в центре партера.

Сегментация театрального спроса была проанализирована с точки зрения


количества проданных билетов на различные спектакли в зависимости от цены билетов,
жанра, рецензий, свободного времени и сезона года с использованием линейной обычной
регрессионной модели наименьших квадратов (см. Corning and Levy 2002).

Другой подход к оценке спроса, согласующийся с экономической теорией и


максимизацией полезности, заключается в использовании заявленных методов
предпочтения, таких как дискретный выбор (DC) (см. Train 2003). В экономике
дискретные модели выбора, или качественные модели выбора, описывают, объясняют и
предсказывают выбор между двумя или более дискретными альтернативами, такими как
выход или не выход на рынок труда или выбор между видами транспорта. Таким образом,
результатом такого типа исследования было пойдет ли человек на спектакль или нет.

Ранние исследования спроса на исполнительское искусство рассматривали спрос


главным образом как функцию с зависимой переменной ценой (Moore 1968; Withers 1980;
Throsby and Withers 1979).

Однако мы видим, что со временем появляются новые эмпирические методы и


более сложные модели, использующие большее число переменных (см. Throsby 1994;
Akdede and King 2006 и др.). Эти переменные можно сгруппировать в четыре категории:
цена, качество, тип представления и социально-экономические переменные, влияющие на
посещаемость театра.

В работе (Boerner et al., 2011) рассматривалась удовлетворенность посетителей


своим субъективным опытом в театрах. В результате сопоставления исследований
театрального маркетинга и театральных исследований была предложена модель
удовлетворенности посетителей театром. Результаты полевого исследования с 158
наблюдениями по трем спектаклям "Двенадцатая ночь" Уильяма Шекспира в немецком
театре определили восприятие зрителями режиссуры и их эмоциональную реакцию как
значимые детерминанты. Напротив, сравнение суждений опытных и неопытных
посетителей не выявило никаких значимых различий. При исследовании
удовлетворенности посетителей театральными постановками были взяты такие факторы
как тематика спектакля, режиссура, актерский состав, главный исполнитель, оформление
сцены, музыка, качество обслуживания (т.е. дополнительные услуги театра,
инфраструктура и сервис), эмоциональная реакция зрителей и их эмоциональная связь с
главным исполнителем будут определяющими факторами.

При оценке качества спектакля, в работе Throsby (1983) качество измерялось


посредством нескольких переменных: классификация репертуара (классическое
произведение, современное произведение); автор (известный, неизвестный); вид
исполнения (актерское мастерство, танцы, пение, игра на инструментах); и стандарт
производства и сценографии.

Люди часто ищут информацию о постановках, прежде чем решить, стоит ли


посещать представление. Эта оценка качества основана на наборе характеристик, таких
как тип постановки, автор, актерский состав, режиссер и оценка экспертов (а именно
"критиков") через обзоры. (Abbé-Decarroux 2002, Urrutiaguer (2002), Colbert et al. 1998).
Обзоры критиков теперь можно найти на многих веб-сайтах в открытом доступе в
Интернете.

Результаты исследования (Corning and Levy, 2002) выявили, что оперы в их


премьерном сезоне более популярны, чем репризы. Спрос на классические оперы ниже и
выше на отечественные и на спектакли с участием известного оперного солиста. Отзывы
прессы и общая популярность оперного произведения имеют весьма ожидаемый эффект.
Имеют места и сезонные эффекты. Общая эластичность спроса по цене оказалась близка к
единице: в среднем рост цен на 1% приводил к снижению спроса на 1,16 % в исследуемом
театре.

В основном работы по прогнозированию кассовых сборов были посвящены


исследованию индустрии кинематографии, а не театру. Предполагается, что две
вышеупомянутые сферы во многом похожи и методы могут быть применимы к обеим, с
некоторыми дополнительными допущениями. Как, например, цена. Одно из главных
отличий между изучением спроса на театральные представления и кинофильмы – это
гетерогенность цен на билеты: в театре принято устанавливать разные цены на билеты,
тогда как в кинозалах мы часто обнаруживаем, что цены равны для любого ряда и места.

Массивные источники данных, полученные в результате взаимодействия нас с


Интернетом, могут предложить новый взгляд на поведение рынка. Анализируя базу
данных запросов Google для поиска терминов, связанных с фильмами, в статье (Chanseung
and Jung, 2014) приводится метод анализа большого количества поисковых запросов
Google для прогнозирования доходов от фильмов.

(Mestyan et al.) показывают, что популярность фильма можно предсказать еще до


его выхода, измерив и проанализировав уровень активности редакторов и зрителей
соответствующей веб-страницы фильма в Википедии.

Для прогнозирования кассовых сборов в индустрии кинематографии исследователи


в основном используют два вида данных: традиционные метаданные фильмов и веб-
данные. В первых исследованиях по данной тематике используются только традиционные
метаданные фильмов, которые включают информацию о режиссере, актерах,
продолжительности сеанса, жанре и т. д. Однако в дальнейшем в работах все чаще
обращаются к данным, которые проходят через parsing-процедуру с веб-страниц,
например «Кинопоиска», «IMD» и др. Это позволяет расширить границы исследования и
углубиться в материал по данной теме.
Изучение базовых знаний на основе этих данных ценно для киноиндустрии и
индустрии театра, поскольку они позволят оптимизировать процессы, минимизировать с
ними связанные издержки и максимизировать прибыль. Однако исследовательские работы
по посещаемости театральных постановок немногочисленны и требуют дальнейшего
изучения в целях получения новых, более современных результатов.

Как правило, посещаемость демонстрирует циклическую картину с очевидными


пиками, что похоже на данные временных рядов. Эти пики происходят обычно в
выходные дни, во время праздничных дней и других значимых событий.

В статье (Walanaraya et al., 2018) изучается взаимосвязь между определенными


параметрами фильмов и доходами от их показа, и затем строятся модели
прогнозирования. Данные делятся на группы с применением различных методов, которые
впоследствии сравниваются между собой по точности распределения. Авторы исследуют,
могут ли методы кластеризации повысить точность. Первоначально линейная регрессия,
полиномиальная регрессия и регрессия опорных векторов (SVR) применялись ко всем
данным для прогнозирования кассовых сборов от фильма. Затем для разделения данных
на группы перед выполнением регрессионного анализа были применены методы
кластеризации, например по жанрам, с использованием максимизации ожиданий (EM) и
K-средних. Для сравнения точности различных методов в качестве показателей
эффективности использовались коэффициент детерминации R-квадрат и
среднеквадратичная ошибка модели (RMSE). Данное исследование показало, что обычно
линейная регрессия без кластеризации дает модель с наибольшим R-квадратом, в то время
как линейная регрессия с EM-кластеризацией дает наименьшую RMSE.

Многие не так давно выпущенные статьи уже используют при прогнозировании


продаж методы машинного обучения, как например в статье (Yue et al., 2017), где был
предложен подход к прогнозированию кассовых сборов для недавно выпущенных
фильмов с помощью метаданных о кинофильмах, данных о потребностях аудитории и
модели посещаемости (attendance model) при использовании итеративной модели
посещаемости (AIM). Она строится путем итеративного объединения базовой модели на
основе алгоритма случайного леса (Random Forest Algorithm) и вспомогательной модели
на основе SVM (метода опорных векторов). Случайный лес - это ансамблевый алгоритм,
который может повысить производительность дерева решений. Кроме того, он может
исправить чрезмерную подгонку и добиться высокого обобщения модели.
В данном исследовании мы не будем применять усложненные методы машинного
обучения, ограничившись лишь стандартными методами линейной регрессии.

Аналогично исследованию (Chanseung and Jung, 2014), мы выбираем данные


запроса названия спектакля, но берем их из Yandex Wordstat, а не Google Trends.
Существуют также дополнительные переменные, которые, возможно, могут улучшить
качество системы прогнозирования. В данной работе были использовали переменные о
сезоне, стране происхождения спектакля, национальности композитора
(отечественный/зарубежный), является ли спектакль первым в этом сезоне, месяц и день
недели постановки, является ли произведение классическим (написанным до 1900 г.) или
современным, аналитика из соц. сетей (количество постов, посвященных событию,
количество кликов, лайков, репостов, подписчиков), особенность события (является ли
репризой, бенефисом и др.), а также сами поисковые запросы за 5 недель до спектакля с
шагом в неделю и ограничением на Пермский край как регион, жители которого,
вероятно, приезжают в г. Пермь, чтобы посетить театральное представление.

Основное и необходимое допущение использования данных поискового запроса


для прогнозирования состоит в том, что люди, которые вводят запросы названия
спектакля, заинтересованы в нем и, следовательно, вероятно, пойдут на него.

Иногда слова в названиях фильмов или спектаклях сильно распространены


(например, «Онегин» может подразумевать как спектакль, так и само литературное
произведение), что запросы о названии фильма часто перекрываются с несвязанными
запросами. В этих случаях некоторые авторы используют другие связанные запросы,
включая актеров и режиссеров.

Названия спектаклей вводились вручную в Yandex Wordstat и помещались в


таблицу формата Excel наряду с другими переменными. Так как было важно, чтобы цена
не влияла на показатели спроса, были выбраны спектакли (оперы и балеты) с
одинаковыми ценами по поясам (800 рублей – для опер, 1200 рублей – на балет). Данные
по выручке и количеству проданных билетов были взяты с сайта radario.ru (электронная
система продажи билетов, с разрешения менеджмента театра), данные по социальным
сетям – amplifr.com (кумулятивный доступ к социальным сетям (Инстаграмм, Фейсбук,
Вконтакте)), информация по спектаклям – с официального сайта Пермского Театра Оперы
и Балета (permopera.ru). Так как в этом сезоне у театра сменился оператор электронной
системы билетов, данные имелись только за настоящий сезон 2019/2020 г. Под
вышеупомянутые параметры подошли 32 постановки семи опер («Евгений Онегин»,
«Мадам Баттерфляй», «Синдерелла», «Царская невеста», «Севильский цирюльник»,
«Князь Игорь» и «Лючия ди Ламмермур») и шести балетов («Шехерезада», «Лебединое
озеро», «Зимние грёзы», «Балеты Баланчина», «Баядерка» и «Бахчисарайский фонтан»).

Для большинства спектаклей, как и ожидалось, частота запросов резко возрастает


ближе к дате постановки, особенно если он ставится впервые за сезон или открывает его
(«Лебединое озеро» в августе и начале сентября).

Простая множественная линейная регрессия - это метод, который будет


использоваться в данной работе. Он подразумевает создание прямой линии среди
диаграммы рассеяния, которая минимизирует остатки (сумму квадратов ошибок),
заданную следующим образом:

E=min ∑ ( I t−I pr ) ,

Где I t – реальная выручка от представления, I pr – прогнозируемая выручка.

Наша предполагаемая модель выглядит следующим образом:

TR=β0 + β 1∗autumn+ β 2∗winter + β 3∗opera + β 4∗o r rus + β5∗o r french + β6∗o r italian + β7∗first + β 8∗day+

где: TR – это выручка с проданных билетов; autumn – дамми-переменная,


отвечающая за сезон-осень; winter – дамми-переменная, отвечающая за сезон-зиму;opera –
дамми-переменная, отвечающая за жанр; ori – дамми-переменная, отвечающая за страну
происхождения, отличающуюся от уже приведенных в формуле (Россия, Франция,
Италия); first – дамми-переменная, отвечающая за первый показ постановки в данном
сезоне; classical – дамми-переменная, отвечающая за постановки (написанные до 1900 г.);
special – дамми-переменная, отвечающая за «особенность» выбранной постановки
(бенефис, реприза, премьера); β i – параметр, показывающий силу зависимости от
выбранного фактора: β 2 – параметр, показывающий силу зависимости выручки от
количества поисковых запросов на неделе показа; β 3 – параметр, показывающий силу
зависимости выручки от количества поисковых запросов за неделю до показа; β 4 –
параметр, показывающий силу зависимости выручки от количества поисковых запросов за
2 недели до показа; β 5 – параметр, показывающий силу зависимости выручки от
количества поисковых запросов за 3 недели до показа; β 6 – параметр, показывающий силу
зависимости выручки от количества поисковых запросов за 4 недели до показа.

Аналогичная модель для количества проданных билетов:

TICKETS=β 0 + β 1∗autumn+ β 2∗winter+ β 3∗opera+ β 4∗o r rus + β 5∗o r french + β 6∗o r italian + β 7∗first+ β
Необходимые расчеты и вычисления проводились в программе RStudio, которая является
удобным интерфейсом для языка программирования R. На рис. показана зависимость
между истинным доходом и прогнозируемым доходом спектаклей, которая была оценена
по входным переменным.

Call:
lm(formula = data2$tickets ~ data2$queries0 + data2$opera + data2$autumn +
data2$russian + data2$first + data2$classical + data2$queries1 +
data2$queries2 + data2$queries3 + data2$queries4)

Residuals:
Min 1Q Median 3Q Max
-126.061 -31.441 4.814 25.937 118.722

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 787.12993 32.84937 23.962 < 2e-16 ***
data2$queries0 0.03901 0.06606 0.591 0.5611
data2$opera -230.72380 28.80645 -8.009 8.08e-08 ***
data2$autumn -32.76809 34.71664 -0.944 0.3560
data2$russian -45.23324 33.15202 -1.364 0.1869
data2$first -3.07984 28.65241 -0.107 0.9154
data2$classical 101.21456 32.45902 3.118 0.0052 **
data2$queries1 -0.02495 0.13207 -0.189 0.8520
data2$queries2 -0.19384 0.19085 -1.016 0.3214
data2$queries3 0.02854 0.08529 0.335 0.7412
data2$queries4 0.23554 0.09600 2.453 0.0230 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 68.35 on 21 degrees of freedom


Multiple R-squared: 0.7982, Adjusted R-squared: 0.7021
F-statistic: 8.307 on 10 and 21 DF, p-value: 2.617e-05

Call:
lm(formula = data2$tickets ~ data2$queries0 + data2$queries1 +
data2$queries2 + data2$queries3 + data2$queries4)

Residuals:
Min 1Q Median 3Q Max
-272.124 -60.689 7.925 85.012 163.899

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 663.26992 35.35906 18.758 <2e-16 ***
data2$queries0 0.08297 0.10385 0.799 0.432
data2$queries1 -0.13796 0.22818 -0.605 0.551
data2$queries2 -0.04047 0.32726 -0.124 0.903
data2$queries3 -0.03764 0.14411 -0.261 0.796
data2$queries4 0.21727 0.14989 1.450 0.159
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 124.5 on 26 degrees of freedom


Multiple R-squared: 0.1715, Adjusted R-squared: 0.01214
F-statistic: 1.076 on 5 and 26 DF, p-value: 0.3964

Call:
lm(formula = data2$tickets ~ data2$queries0 + data2$opera + data2$autumn +
data2$russian + data2$first + data2$classical + data2$queries1 +
data2$queries2 + data2$queries3 + data2$queries4)

Residuals:
Min 1Q Median 3Q Max
-126.061 -31.441 4.814 25.937 118.722
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 787.12993 32.84937 23.962 < 2e-16 ***
data2$queries0 0.03901 0.06606 0.591 0.5611
data2$opera -230.72380 28.80645 -8.009 8.08e-08 ***
data2$autumn -32.76809 34.71664 -0.944 0.3560
data2$russian -45.23324 33.15202 -1.364 0.1869
data2$first -3.07984 28.65241 -0.107 0.9154
data2$classical 101.21456 32.45902 3.118 0.0052 **
data2$queries1 -0.02495 0.13207 -0.189 0.8520
data2$queries2 -0.19384 0.19085 -1.016 0.3214
data2$queries3 0.02854 0.08529 0.335 0.7412
data2$queries4 0.23554 0.09600 2.453 0.0230 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 68.35 on 21 degrees of freedom


Multiple R-squared: 0.7982, Adjusted R-squared: 0.7021
F-statistic: 8.307 on 10 and 21 DF, p-value: 2.617e-05

(Руи и др.) использовали данные о продажах фильмов и информацию о твитах,


собранную из интернета, чтобы проанализировать, как Twitter влияет на продажи билетов
на фильмы. Затем они классифицировали сообщения в твитах на три вида: позитивная
информация, негативная и нейтральная, и использовали эти данные, а также данные о
продаже билетов для прогнозирования кассовых сборов. В работе Ким и др. были собраны
данные социальных сетей за три недели до и после выхода фильма. Была представлена
модель организации кинотеатров и обнаружили, что организация кинотеатров также
играет решающую роль в кассовых сборах, а данные социальных сетей играют важную
роль в прогнозировании кассовых тенденций.

В качестве конкретного случая исследование (Shim and Pourhomayoun, 2017)


фокусируется на использовании данных Twitter, собранных до премьерного показа
фильма в выходные дни, чтобы предсказать его кассовые сборы в течение каждого из
выходных дней премьеры.

В качестве театрального учреждения для анализа был выбран Пермский театр


оперы и балета. В 2017 году в рамках Свободного проекта было выявлено, что Пермский
театр оперы и балета упоминается в СМИ значительно чаще аналогичных театров России,
при этом около 40% упоминаний осуществляются в федеральных источниках, 7% в
зарубежных (на русском языке).

Так как выборка крайне мала, будет целесообразным не исключать ни одного


наблюдения. Большую долю выборки занимают осенние представления
(преимущественно оперы ~0,59), на которые было продано в среднем 706 билетов, и чья
средняя выручка составила 381028,5 руб. Представления как отечественного (0,56), так и
зарубежного происхождения, написанные преимущественно до 1900 г.

В модели есть цель отразить зависимость выручки/проданных билетов от


различных факторов (национальности композитора, типа представления, количества
запросов в интернете накануне спектакля и т.д.). Предполагается, что наши зависимые
переменные (выручка/количество проданных билетов) растут с увеличением количества
Чем больше отношение суммы займа к годовому доходу, тем выше процентная ставка, так
как вероятность дефолтности данного займа велика. Процентная ставка находится в
обратной зависимости с кредитным рейтингом: чем выше кредитный рейтинг, тем выше
(самый большой кредитный рейтинг А) способность клиента вернуть долг, тем под
меньшую процентную ставку можно выдать займ. Тип владения жилья по нашим
предположениям тоже по-разному влияет на процентную ставку: жильё в собственности
должно повышать кредитоспособность и уменьшать процентную ставку, а арендуемое
жильё – увеличивать. Стоит провести дополнительное исследование по поводу ипотечных
объектов и некоторых других переменных. 
Список литературы

1. Boerner, S., Moser, V., Jobst, J., 2011. Evaluating cultural industries: Investigating
visitors’ satisfaction in theatres. Serv. Ind. J. 31, 877–895.
https://doi.org/10.1080/02642060902960792
2. Chanseung, L., Jung, M., 2014. Predicting Movie Incomes Using Search Engine Query
Data.
3. Corning, J., Levy, A., 2002. Demand for live theater with market segmentation and
seasonality. J. Cult. Econ. 26, 217–235. https://doi.org/10.1023/A:1015673802364
4. Grisolía, J.M., Willis, K.G., 2012. A latent class model of theatre demand. J. Cult. Econ.
36, 113–139. https://doi.org/10.1007/s10824-012-9158-6
5. Lévy-Garboua, L., Montmarquette, C., 1996. A microeconometric study of theatre
demand. J. Cult. Econ. 20, 25–50.
6. Ozhegov, E.M., Ozhegova, A., 2018. Bagging prediction for censored data: Application
for theatre demand, Lecture Notes in Computer Science (including subseries Lecture
Notes in Artificial Intelligence and Lecture Notes in Bioinformatics).
https://doi.org/10.1007/978-3-319-73013-4_18
7. Shim, S., Pourhomayoun, M., 2017. Predicting movie market revenue using social media
data, in: Proceedings - 2017 IEEE International Conference on Information Reuse and
Integration, IRI 2017. pp. 478–484. https://doi.org/10.1109/IRI.2017.68
8. Walanaraya, P., Puengpipattrakul, W., Sutivong, D., 2018. Movie Revenue Prediction
Using Regression and Clustering, in: 2018 2nd International Conference on Engineering
Innovation, ICEI 2018. pp. 63–68. https://doi.org/10.1109/ICEI18.2018.8448610
9. Werck, K., Heyndels, B., 2007. Programmatic choices and the demand for theatre: The
case of Flemish theatres. J. Cult. Econ. 31, 25–41. https://doi.org/10.1007/s10824-006-
9026-3
10. Yue, Y., Li, Y., Jia, T., Wu, Z., 2017. An iterative model for predicting film attendance.
https://doi.org/10.1007/978-3-319-70087-8_89