Вы находитесь на странице: 1из 4

В табл. 1 приведено 40 значений параметров социологического опроса x и y.

Параметр опроса y является зависимым от параметра x (например, y – заработная плата, x


– возраст опрашиваемого). Т.о. дано 40 точек на плоскости XY.

x -0,168 0,481 -0,130 -1,925 1,096 -0,207 1,551 1,915 -1,949 0,446
y 0,47 0,34 0,37 22,64 0,23 0,45 0,28 0,98 30,12 0,29
x -1,325 1,991 -0,144 -1,582 -1,736 -0,625 0,122 0,744 1,861 -1,272
y 1,22 1,59 0,41 2,31 7,07 0,52 0,32 0,26 0,69 0,92
x 0,194 0,128 0,594 1,230 0,633 -1,698 -0,663 -0,494 0,576 0,304
y 0,36 0,43 0,32 0,22 0,26 5,78 0,42 0,44 0,22 0,29
x 0,874 0,883 0,051 -1,658 0,495 -0,443 1,202 -1,925 1,933 -0,581
y 0,30 0,22 0,35 5,26 0,30 0,40 0,25 17,65 1,32 0,51
Таблица 1

ВЫПОЛНЕНИЕ:
1) Перенесем данные табл. 1. в MS Excel.
2) Произведем сортировку исходных данных. Для этого в MS Excel запишем их в виде
двух строк. Отсортированные данные представим в виде табл. 1.1.
Таблица 1.1
X -1,949 -1,925 -1,925 -1,736 -1,698 -1,658 -1,582 -1,325 -1,272 -0,663
Y 30,12 17,65 22,64 7,07 5,78 5,26 2,31 1,22 0,92 0,42
X -0,625 -0,581 -0,494 -0,443 -0,207 -0,168 -0,144 -0,13 0,051 0,122
Y 0,52 0,51 0,44 0,4 0,45 0,47 0,41 0,37 0,35 0,32
X 0,128 0,194 0,304 0,446 0,481 0,495 0,576 0,594 0,633 0,744
Y 0,43 0,36 0,29 0,29 0,34 0,3 0,22 0,32 0,26 0,26
X 0,874 0,883 1,096 1,202 1,23 1,551 1,861 1,915 1,933 1,991
Y 0,3 0,22 0,23 0,25 0,22 0,28 0,69 0,98 1,32 1,59

3) Изобразим заданные точки на рис. 1. График строим по сортированным данным.


Диаграмма 1

35
Рисунок 1
30

25

20
4)
Найдем
15

10

0
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5

наибольшее и наименьшее значения аргумента x и функции y.


X наименьшее = -1,949
Y наименьшее=0,22
Х наибольшее=1,9991
Y наибольшее=30,12
5) Определим средние арифметические аргумента и функции
Хсреднее= 0,019475
Yсреднее=2,6695
6) Найдем сумму всех значений аргумента всех значений функции:
40

∑ xi=0.779
i=1
40

∑ yi= 106.78
i=1
7)Произведем разбивку исходных данных на интервалы по значениям функции y. Шаг
Ymax −Ymin 30.12−0.22
интервала определим по формуле:h= = =4.271≈4
7 7
Для удобства в качестве шага возьмем значение h=4. Нижнюю границу первого интервала
примем равной y 1=0.22. Получаем следующие интервалы по y:
интервал 1: 0.22 ≤ y ≤ 4.22;
интервал 2: 4.22 ≤ y ≤ 8.22;
интервал 3: 8.22 ≤ y ≤ 12.22;
интервал 4: 12.22 ≤ y ≤ 16.22;
интервал 5: 16.22 ≤ y ≤ 20.22;
интервал 6: 20.22 ≤ y ≤ 24.22;
интервал 7: 24.22 ≤ y ≤ 28.22;
интервал 8: 28.22 ≤ y ≤ 30.22.
Верхняя граница последнего интервала превышаем максимальное значение функции y max ,
следовательно, разбивку на интервалы прекращаем.
8) Определим количество пар чисел x и y (точек), попадающее в каждый из
рассмотренных интервалов. Для этого используем в MS Excel функцию ЧАСТОТА.
9) Найдем суммарное значение функции y для каждого интервала, а также среднее
арифметическое значение параметра y для каждого интервала (используя функцию
СУММЕСЛИ или отдельно СУММ от ЕСЛИ).
10) Сведем все полученные для интервалов данные в табл. 2.

Таблица 2
№ Интервала Интервал по y Число точек, ni Сумма Среднее
значений y на значение y на
интервале интервале
1 от 0.22 до 4.22 34 18.26 0.537059
2 от 4.22 до 8.22 3 18.11 6.036667
3 от 8.22 до 12.22 0 0 0
4 от 12.22 до 16.22 0 0 0
5 от 16.22 до 20.22 1 17.65 17.65
6 от 20.22 до 24.22 1 22.64 22.64
7 от 24.22 до 28.22 0 0 0
8 от 28.22 до 32.22 1 30.12 30.12
Сумма 40 106.78

11) Построим гистограмму и график по интервалам и количеству точек, заданным в табл.


2. Представим их на рис. 2.
40

35

30

25

20

15

10

0
от 0,22 до от 4,22 до от 8,22 до от 12,22 до от 16,22 до от 20,22 до от 24,22 до от 28,22 до
4,22 8,22 12,22 16,22 20,22 24,22 28,22 32,22

Рисунок 2
12) Произведем сглаживание данных табл. 1 методом наименьших квадратов по
2 3 4

уравнению:ỹ=e a + a x+a x a x a x
0 1 2 3 4

По данным табл. 1. в виде двух строк вычисляем:


N=40;
n

∑ x i=0.779;
i=1
n

∑ x 2i =52.86606
i=1
n

∑ x 3i =-5.64572736
i=1
n

∑ x 4i =148.1507166
i=1
n

∑ x 5i =-17.24005868
i=1
n

∑ x 6i =482.9416137
i=1
n

∑ x 7i =-33.84426941
i=1
n

∑ x 8i =1662.299653
i=1
n

∑ yi=-13.8249
i=1
n

∑ yi x i=-40.7591
i=1
n

∑ yi x 2i =38.75212
i=1
n

∑ yi x 3i =-109.668
i=1
n

∑ yi x 4i =169.3367
i=1
В итоге система имеет вид:
40a+0.779b+52.866606c-5.64572736d+148.1507166e=-13.8249
0.779a+52.866606b-5.64572736c+148.1507166d-17.24005868e=-40.7591
52.866606a-5.64572736b+148.1507166c-17.24005868d+482.9416137e=38.75212
-5.64572736a+148.1507166b-17.24005868c+482.9416137d-33.84426941e=-109.668
148.1507166a-17.24005868b+482.9416137c-33.84426941d+1662.299653=169.3367

Решаем данную систему методом обратной матрицы:


Откуда a=-0.95697,b=0.41,с=-0,26437,d=-0.10388,e=0.257598.
Сглаживающая функция имеет вид:
ỹ=-0.95697+0.41*x-0.26437* x 2-0.10388* x 3+0.257598* x 4
40
13) Подсчитаем значения ỹ для каждой точки x табл. 1. и найдем сумму всех ỹ –.∑ ỹ i
i=1
14) Определим квадрат разницы значений y табл.1. и сглаженных ỹ для каждой точки x.
40
2
15) Найдем сумму всех квадратов разницы –.∑ ( y i− ỹ i)
i=1
16) На Диаграмме 1 изобразим график сглаженной кривой ỹ и нанесем линию тренда в
виде полиномиальной функции 6-й степени с указанием ее уравнения на Диаграмме. Все
это представим на рис. 3
4

0
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5

-1

-2

исходные данные Polynomial (исходные данные)


Сглаженная кривая

Рисунок 3

Оценить