Академический Документы
Профессиональный Документы
Культура Документы
Дискриминантный анализ
Дискриминантный анализ
Выполнено:
Петровой Марией Владиславовной
Был проведен дискриминантный анализ в IBM SPSS Statistics на основе данных, взятых из
файла «Банковский кредит.sav».
Этот анализ чаще всего проводят для того, чтобы определить какие из признаков лучше
всего отличают объекты друг от друга.
Статистика группы
Станд. N валидных (по списку)
Наличие долга по ранее взятому кредиту Среднее отклонения Невзвешенные Взвешенные
Нет Стаж на последнем месте 10.1843 6.77679 293 293.000
работы
Долг клиента по кредитной 1.1765 1.33726 293 293.000
карте банка в тысячах
Время проживания по 8.4505 6.58520 293 293.000
последнему адресу
Да Стаж на последнем месте 6.0253 6.47673 79 79.000
работы
Долг клиента по кредитной 2.4260 3.63501 79 79.000
карте банка в тысячах
Время проживания по 6.2025 6.42986 79 79.000
последнему адресу
Всего Стаж на последнем месте 9.3011 6.91852 372 372.000
работы
Долг клиента по кредитной 1.4418 2.10886 372 372.000
карте банка в тысячах
Время проживания по 7.9731 6.60836 372 372.000
последнему адресу
Данная таблица содержит данные о средних значения дискриминационных переменных в
каждой из исследуемых групп. Эти показатели дают общее представление о том,
являются ли дискриминационные переменные отличительными признаками этих групп.
Из таблицы, например видно, что хотя среднее значение стажа на последнем месте
работы 9,3 у всех, но этот показатель значительно различается у людей у которых есть
долг по прошлому кредиту и у которых нет.
Но это ещё не может служить 100% доказательством того, что это ключевой
различающийся признак. Для подтверждения нужно проверить значимость того или
иного коэффициента.
Критерии равенства групповых средних
Лямбда Уилкса F ст.св.1 ст.св.2 знач.
Стаж на последнем месте .939 23.872 1 370 .000
работы
Долг клиента по кредитной .941 23.147 1 370 .000
карте банка в тысячах
Время проживания по .981 7.323 1 370 .007
последнему адресу
По данной таблице смотрим значимость показателя и те, что больше 0,05, убираем из
модели.
В нашем случае из модели вылетает только время проживания по последнему адресу, т.к.
его значимость незначительно превышает 0,05 (0,07).
Функции в центроидах групп Чем больше значение в этой таблице, тем лучше т.к.
Наличие долга по ранее Функция это значит, что различие групп существеннее.
взятому кредиту 1
По данным результатам делаем почти 100% вывод о
Нет .284 том, что наличие долга по взятому кредиту имеет чуть
Да -1.052 ли не ключевое значение в принятии решения давать
Нестандартизованные канонические кредит человеку или не давать.
дискриминантные функции,
вычисленные в групповых средних
Так же в SPSS есть функция пошагового
дискриминантного анализа. Его отличие в том, что там
SPSS автоматически подбирает лучшую модель и дает
пользователю выбор из нескольких вариантов, если
таковые имеются.
Все первые таблицы остались без изменения, и это логично, потому что мы проводили
этот анализ на тех же самых данных.
Введенные/удаленные переменныеa,b,c,d
Лямбда Уилкса
Точное F
Шаг Введено Статистика ст.св.1 ст.св.2 ст.св.3 Статистика ст.св.1 ст.св.2 знач.
1 Стаж на .939 1 1 370.000 23.872 1 370.000 .000
последнем
месте
работы
2 Долг клиента .777 2 1 370.000 53.043 2 369.000 .000
по кредитной
карте банка в
тысячах
На каждом шаге вводится переменная, минимизирующая общую лямбду Уилкса.
a. Максимальное число шагов равно 6.
b. Минимальное частное F для ввода - это 3.84.
c. Максимальное частное F для удаления - это 2.71.
d. Уровень F, допуск или VIN недостаточны для дальнейших вычислений.
Данная таблица показывает пошаговое составление дискриминантного уравнения.