Вы находитесь на странице: 1из 1

Семинар.

Логит регрессия и анализ маркетинговых компаний в банке

Собрана база прямой работы с клиентами (direct marketing) португальским банком, ее


описание по ссылке:

 https://www.kaggle.com/c/marketing-data/data

В рамках семинара строим разные модели, каждая из которых объясняет переменную


«открыл клиент вклад или нет»

Задание:

1. Содержательно выбрать переменные, которые должны влиять на объясняемую.


Пояснить.
2. Построить линейную модель, проинтерпретировать коэффициенты и значимость,
проинтерпретировать качество модели
o А также изобразите на графике исходные данные и спрогнозированные по
модели
plot(X,Y)
points(modek$fitted.values, col="red")
3. Постройте логит модель:
a. Постройте модель, проинтерпретируйте значимость и коэффициенты
logit<- glm(y ~ x1 + x2, family = binomial, data=dataframe)
summary(logit)
b. Рассчитайте предельные эффекты и проинтерпретируйте
library("margins")
margins(logit, type = "response")
c. Рассчитайте метрики качества модели и проинтерпретируйте
library(descr)
LogRegR2(logit)
d. Рассчитайте точность и сконструируйте confusion matrix,
проинтерпретируйте
confMatrixNew <- confusion.matrix(Y, logit$ fitted.values, threshold = 0.3)
confMatrixNew

4. Сравните коэффициенты линейной модели и логита


library(stargazer)
stargazer(model1, logit1, type="text", out="models.txt")

По итогам семинара должен быть оформлен отчет в формате Word или RmD (1 от 2-х
студентов). В отчете должно быть отражено с пункта 3: какие шаги предприняты и
какие выводы можно сделать. Отчет должен быть загружен в LMS до 16 мая
включительно (сб).

Копирование текстов коллег и плагиат являются не приемлемыми!