Иркутск, 2013 г.
1. Основные понятия
В линейный регрессионный анализ входит широкий круг задач, связанных с
построением (восстановлением) зависимостей между группами числовых
переменных
X (x1 , ..., xp) и Y = (y1 ,..., ym).
Предполагается, что Х - независимые переменные (факторы, объясняющие
переменные) влияют на значения Y - зависимых переменных (откликов,
объясняемых переменных). По имеющимся эмпирическим данным (Xi , Yi), i
= 1, ..., n требуется построить функцию f (X), которая приближенно
описывала бы изменение Y при изменении X:
Y f (X).
Предполагается, что множество допустимых функций, из которого
подбирается f (X), является параметрическим:
f (X) = f (X, ),
где - неизвестный параметр (вообще говоря, многомерный). При
построении f (X) будем считать, что
Y = f (X, ) + , (1)
где первое слагаемое - закономерное изменение Y от X, а второе - -
случайная составляющая с нулевым средним; f (X, ) является условным
математическим ожиданием Y при условии известного X и называется
регрессией Y по X.
1.1. Простая линейная регрессия
Задание: В табл. 1 приведены данные по 45 предприятиям легкой
промышленности по статистической связи между стоимостью основных
фондов (fonds, млн руб.) и средней выработкой на 1 работника (product, тыс.
руб.); z - вспомогательный признак: z = 1 - федеральное подчинение, z = 2 -
муниципальное (файл Product. Sta.).
Таблица 1
fonds product z fonds product z fonds product z
6,5 18,3 1 9,3 17,2 2 10,4 21,4 2
10,3 31,1 1 5,7 19,0 2 10,2 23,5 2
7,7 27,0 1 12,9 24,8 2 18,0 31,1 2
15,8 37,9 1 5,1 21,5 2 13,8 43,2 2
7,4 20,3 1 3,8 14,5 2 6,0 19,5 2
14,3 32,4 1 17,1 33,7 2 11,9 42,1 2
15,4 31,2 1 8,2 19,3 2 9,4 18,1 2
21,1 39,7 1 8,1 23,9 2 13,7 31,6 2
22,1 46,6 1 11,7 28,0 2 12,0 21,3 2
12,0 33,1 1 13,0 30,9 2 11,6 26,5 2
9,5 26,9 1 15,3 27,2 2 9,1 31,6 2
8,1 24,0 1 13,5 29,9 2 6,6 12,6 2
8,4 24,2 1 10,5 34,9 2 7,6 28,4 2
15,3 33,7 1 7,3 24,4 2 9,9 22,4 2
4,3 18,5 1 13,8 37,4 2 14,7 27,7 2
Выполнение:
Выполнение:
Рис22. Диаграмма рассеяния