Вы находитесь на странице: 1из 17

Размещено на http://www.allbest.

ru/
Оглавление

Введение
Теоретические сведения
Ход выполнения работы
Заключение
Список литературы
Размещено на http://www.allbest.ru/
Введение

Курс математических методов обработки данных необходим для


приобретения знаний и навыков в обработки экспериментальных данных,
проведению эксперимента.
Исследовательская работа построена на проведение различных
экспериментов и очень важно владеть методами обработки результатов и
правильно их оценивать.
Целью курсовой работы является закрепление знаний, полученных на II
курсе при решении задач, связанных с будущей профессиональной
деятельностью студентов в области автоматизации. Курсовая работа
предполагает решение студентом задачи по полученным результатам в
лаборатории установить зависимость этих данных и оценить ее.
При проведении опыта целью которого, является определение
зависимости одной физической величины от другой неизбежно возникают
ошибки измерения, поэтому возникает задача по имеющимся
экспериментальным точкам наилучшим способом воспроизвести искомую
зависимость. Для решения подобных задач часто применяют метод
наименьших квадратов, именно с помощью этого метода я буду решать свою
задачу.
Курсовую работу по обработке данных буду проводить с помощью
программного обеспечения Mathcad.
Размещено на http://www.allbest.ru/
Теоретические сведения

Метод наименьших квадратов.


До начала XIX века учёные не имели определённых правил для
решения системы уравнений, в которой число неизвестных меньше, чем
число уравнений; до этого времени употреблялись частные приёмы,
зависевшие от вида уравнений и от остроумия вычислителей, и потому
разные вычислители, исходя из тех же данных наблюдений, приходили к
различным выводам. Гауссу от 1795 принадлежит первое применение метода,
а Лежандр в 1805 году независимо открыл и опубликовал его под
современным названием (Méthode des moindres quarrés).
Лаплас связал метод с теорией вероятностей, а американский
математик Эдрейн в 1808 году рассмотрел его теоретико-вероятностные
приложения. Метод распространён и усовершенствован дальнейшими
изысканиями Энке, Бесселя, Ганзена и других.
Метод наименьших квадратов — один из базовых методов
регрессионного анализа для оценки неизвестных параметров регрессионных
моделей по выборочным данным. Метод основан на минимизации суммы
квадратов остатков регрессии.
Необходимо отметить, что собственно методом наименьших квадратов
можно назвать метод решения задачи в любой области, если решение
заключается или удовлетворяет некоторому критерию минимизации суммы
квадратов некоторых функций от искомых переменных. Поэтому метод
наименьших квадратов может применяться также для приближённого
представления (аппроксимации) заданной функции другими (более
простыми) функциями, при нахождении совокупности величин,
удовлетворяющих уравнениям или ограничениям, количество которых
превышает количество этих величин и т. д.
Итак, суть метода наименьших квадратов сводится к тому, что сумма
квадратов отклонений экспериментальных данных от сглаживающей кривой
Размещено на http://www.allbest.ru/
сводится к минимуму

N
∑ ( y i−ϕ (x i ))2=min,
i=0

где yi и xi экспериментальных значений в i-опыте


N – число экспериментов,
φ(xi)- искомая зависимость y от x.
При выборе вида зависимости y=f(x) возможны следующие случаи:
1. Общий вид зависимости y от f(x) известен заранее на основании
теоретических предпосылок. Задача состоит в нахождении численных
значений параметров этой зависимости.
2. Зависимость y=f(x) априори не известна и нет никаких
предпосылок о ее математической форме. В этом случае для
экспериментального описания исследуемой закономерности в области ее
существования ограниченными пределами изменения аргумента необходимо
применить алгебраический полином определенной степени (ряд Тейлора).
Для определения параметров зависимости y=f(x) запишем ее зависимость не
только от аргумента х, но и от параметров аj где j от нуля до s
Тогда условие примет вид:

N
∑ [ y i −ϕ( x i ; a1 ; a 2 ;.. . as )]=min
i=0 (1)

Ряд Тейлора:

y=a0x0+a1x1+a2x2+…+asxs

Нахождение значений параметров, удовлетворяющих этому условию


сводится к нахождению экстремума функции aj. Для этого необходимо взять
Размещено на http://www.allbest.ru/
производные по параметрам от выражения (1) и приравнять к нулю. Таким
образом мы получим систему s + 1 уравнений, решение которой дает
возможность найти параметры аj, то есть при аппроксимации искомой
зависимости полинома s-того порядка система уравнений даст решение
численному значению параметра aj
Пусть изученная зависимость y от x, в результате опытов получено N
пар чисел с координатами xi и yi, при этом зависимость y от х представлена в
виде y=a0 + a1x в соответствии с методом наименьших квадратов, параметры
этой зависимости должны удовлетворять условию:

N
∑ ( y i−( a0+ a1 x ))2=min
i =0

(2)

Взяв частные производные от выражения (2) по параметрам а0 и а1 и


приняв их за ноль, получим систему нормальных уравнений

a0 x0+a1 x1= x0y


a0 x1+a1 x2= x1y

решая полученную систему уравнений находим а0 и а1, тем самым


полностью определяем функцию, которая наилучшим образом
аппроксимирует искомую функцию y(x).
Аппроксимация — научный метод, состоящий в замене одних объектов
другими, в том или ином смысле близкими к исходным, но более простыми.
Аппроксимация
Аппроксимация – это описание экспериментальных точек какой либо
функцией.
Аппроксимация позволяет исследовать числовые характеристики и
качественные свойства объекта, сводя задачу к изучению более простых или
Размещено на http://www.allbest.ru/
более удобных объектов (например, таких, характеристики которых легко
вычисляются или свойства которых уже известны).
В теории чисел изучаются диофантовы приближения, в частности,
приближения иррациональных чисел рациональными.
В геометрии рассматриваются аппроксимации кривых ломаными.
Некоторые разделы математики в сущности целиком посвящены
аппроксимации, например, теория приближения функций, численные методы
анализа.
Корреляция. Корреляционный анализ.
Любые две случайные величины, входящие в систему, являются
независимыми или зависимыми. Поскольку степень взаимной зависимости
может быть различной, целесообразно вести количественную меру взаимной
зависимости. В качестве такой меры могут служить корреляционный момент
и коэффициент корреляции, к определению которых мы перейдем.
Корреляционный анализ позволяет оценить тесноту связи одной
физической величины от другой. Описывается это как

σy
y=m y +r yx ( x−m x )=a 0 +a1 x
σx

где mx, my – математическое ожидание x и y соответственно.


Корреляция от латинского это соотношение, взаимосвязь
В свою очередь корреляционная зависимость это статистическая
взаимосвязь двух или нескольких случайных величин (либо величин, которые
можно с некоторой допустимой степенью точности считать таковыми). При
этом изменения значений одной или нескольких из этих величин сопутствуют
систематическому изменению значений другой или других величин.
Математической мерой корреляции двух случайных величин служит
корреляционное отношение, либо коэффициент корреляции. В случае, если
изменение одной случайной величины не ведёт к закономерному изменению
Размещено на http://www.allbest.ru/
другой случайной величины, но приводит к изменению другой
статистической характеристики данной случайной величины, то подобная
связь не считается корреляционной, хотя и является статистической.
Впервые в научный оборот термин «корреляция» ввёл французский
палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции»
частей и органов живых существ, с помощью которого можно восстановить
облик ископаемого животного, имея в распоряжении лишь часть его
останков. В статистике слово «корреляция» первым стал использовать
английский биолог и статистик Фрэнсис Гальтон в конце XIX века.
Корреляционные моменты, коэффициент корреляции - это числовые
характеристики, тесно связанные во введенным выше понятием случайной
величины, а точнее с системой случайных величин. Поэтому для введения и
определения их значения и роли необходимо пояснить понятие системы
случайных величин и некоторые свойства присущие им.
И так, коэффициент корреляции это

k yx
r yx =
σx σ y

Корреляционный момент это

N
1
k xy = ∑ ( y −m y )( xi −mx )
N−1 i=0 i

Корреляционный момент так же принимает значения от -1 до 1,


значения ±1 свидетельствует о наличии линейной зависимости между
величинами x и y при коэффициенте корреляции равном нулю.
Таким образом корреляционный момент может служить
характеристикой тесноты линейной связи между величинами x и y. Чем
ближе коэффициент корреляции по абсолютному значению к единице, тем
Размещено на http://www.allbest.ru/
эта связь сильнее. Абсолютное значение этой величины это модуль получено
значения.
Интерпретация величины корреляционного момента осуществляется в
соответствии с таблицей

значение интерпретаци
я
0-0.2 очень слабая
0.2-0.5 слабая
0.5-0.7 средняя
0.7-0.9 высокая
0.9-1 очень высокая

В следствии необходимости не линейной связи между случайными


величинами x и y вводится новая характеристика: отношение корреляции.
Формула корреляционного отношения

σ yi
ηxy= σ y

в которой σ yi это межгрупповое среднее квадратичное отклонение


случайной величины y. Если корреляционное отношение равно нулю, то x и y
зависимостью не связаны, в том случае, когда корреляционное отношение
равно 1 величины x и y связаны функциональной зависимостью.
Коэффициент детерминации.
Коэффициент детерминации это доля дисперсии зависимой
переменной, объясняемая рассматриваемой моделью зависимости, то есть
объясняющими переменными. Более точно — это единица минус доля
необъяснённой дисперсии (дисперсии случайной ошибки модели, или
условной по факторам дисперсии зависимой переменной) в дисперсии
зависимой переменной. Его рассматривают как универсальную меру связи
одной случайной величины от множества других. В частном случае линейной
Размещено на http://www.allbest.ru/
зависимости является квадратом так называемого множественного
коэффициента корреляции между зависимой переменной и объясняющими
переменными. В частности, для модели парной линейной регрессии
коэффициент детерминации равен квадрату обычного коэффициента
корреляции между y и x.
Коэффициент детерминации, как и коэффициент корреляции,
принимает значения от -1 до +1. Чем ближе его значение коэффициента по
модулю к 1, тем теснее связь результативного признака Y с исследуемыми
факторами X.

SSf
R2= SS
метод наименьший квадрат mathcad
Ход выполнения работы

Решая, какую выбрать зависимость, что бы она как можно точно


описала мою функцию я взяла полином второй степени
Свои исходные данные я задаю в виде матрицы x и y:

 200  0.1139
   
 185  0.1139
 185  0 
 175  0.3010
   
 175  0.3010
x  y 
 160  0.2553
 150  0.2788
   
 135  0.3010
 135  0.4150
   
 125  0.3979
b  2

a  1

c  3

Далее с помощью функции минимайз рассчитываю значения


Размещено на http://www.allbest.ru/
аппроксимирующей функции, в моем случае у7(х).

9 2
f ( a b c)   i  i  i 
y  a  b  x  c x 2
i 0

Given

 a  
0.249 
 b    4.436 10 3 
 
 c   2.677 10 5 
 
2
y7( x)  a  b  x  c x
0
0 0.066
1 0.154
2 0.154
3 0.206
y7( x)  4 0.206
5 0.274
6 0.312
7 0.36
8 0.36
9 0.386

a
 b   Minimizef
( a b c)
 
c
1000  c  1000

1000  b  1000
1000  a  1000

Вставляем график, на котором наглядно видно как найденная мною


зависимость описывает исходную.

0.8
y 0.6
y7 ( x)0.4

0.2
0
120 140 160 180 200
x
Размещено на http://www.allbest.ru/
Далее рассчитываю
1. факторную сумму квадратов отклонений средних значений у в
каждом опыте от общего среднего значения у. Эта сумма характеризует
рассеяние групповых средних значений во всех опытах;

  y7(x)i  0.24778
2
SSf 
i0

SSf  0.103

2. общую сумму квадратов отклонений у от общего среднего


значения, которая характеризует рассеяние всех опытных значений величины
у вокруг общего среднего значения;

  yi  0.24778
2
SS 
i0

SS  0.157

3. остаточную сумму квадратов отклонений величины у от ее


значения в каждом опыте, которая характеризует рассеяние величины у от ее
среднего значения внутри опыта.

  yi  y7(x)i
2
SSr 
i 0

SSr  0.054

Суммы я рассчитывала для того чтобы далее рассчитать численное


значение коэффициента детерминации

SSf
R2 
R2  0.658 SS

Коэффициент детерминации получила равный 0.658 что


Размещено на http://www.allbest.ru/
свидетельствует о слабой связи.
Далее я проделываю программу по той же схеме.
Так как при нескольких одинаковых значения X у меня разные значения
Y, я решила взять для X среднее между ними значение и повторила свой
эксперимент.

 0.1139  200
   
 0.0569  185
 0.3010  175
y  0.2553 x   160
 
   
 0.2788  150
 0.358   135
 0.3979  125
   

 a  
0.987 
 b    5.073 10 
 3
 
 c   3.123 10 6 
 
a  1

c  3

b  1

6 2
f ( a b c)   i  i  i 
y  a  b  x  c x 2
i 0

Given

1000000 a  1000000

1000000 b  1000000

1000000 c  1000000

a
 b   Minimizef
( a b c)
 
c
Размещено на http://www.allbest.ru/

0.8
y 0.6
y5 ( x)0.4

0.2

0
120 140 160 180 200
x

 0.098
 
 0.156
 0.195
y5( x)   0.256
 
 0.297
 0.359
 0.402
 
2
y5( x)  a  b  x  c x

0.8
y 0.6
y5 ( x)0.4

0.2

0
120 140 160 180 200
x

 0.098
 
 0.156
 0.195
y5( x)   0.256
 
 0.297
 0.359
 0.402
 
SSf  0.072

SSr  0.022

SS  0.093
Размещено на http://www.allbest.ru/
6

  y5(x)i  0.2517
2
SSf 
i0

  yi  y5(x)i
2
SSr 
i 0

  yi  0.2517
2
SS 
i0

SSf
R2 
SS

R2  0.78

Получила коэффициент детерминации равный 0.78, это выше чем в


первом опыте, следовательно связь сильнее, чем в первом опыте.
Чтобы еще увеличить коэффициент детерминации для первого опыта, я
решила взять тригонометрическую функцию

 200
   0.1139
 185  
 185  0.1139
 175  0 
   0.3010
175  
x    0.3010
 160 y   0.2553
 150  0.2788
   
 135  0.3010
 135  0.4150
   
 125  0.3979
b  2

c  1

a  1
9

 yi   2.4a cos  b  xi 


2
f ( a b ) 
i 0

Given

1000  a  1000

1000000 b  1000000

 a   Minimizef
  ( a b )
b 
Размещено на http://www.allbest.ru/
 a     0.151 
   
 b   2.029 
y7(x)  2.4a cos ( b  x)

0
0 0.312
1 0.019
2 0.019
3 0.362
y7 ( x)  4 0.362
5 0.178
6 0.337
7 0.3
8 0.3
9 0.241

0.8
y 0.6
y7 ( x)0.4

0.2

0
120 140 160 180 200
x

  yi  0.24778
2
SS 
i0

SS  0.157

  yi  y7(x)i
2
SSr 
i 0

SSr  0.103

  y7(x)i  0.24778
2
SSf 
i0

SSf  0.153

SSf
R2 
SS

R2  0.97
Размещено на http://www.allbest.ru/
Величина коэффициента детерминации служит важным критерием
оценки качества линейных и нелинейных моделей. В моей работе
коэффициент детерминации равен 0.97, это значит что модель регрессии
хорошо аппроксимирует исходные данные и такой регрессионной моделью
можно воспользоваться для прогноза значений результативного показателя.
Размещено на http://www.allbest.ru/
Заключение

В курсовой работе мне была поставлена задача по данным


эксперимента проведенным в лаборатории установить зависимость и оценить
ее адекватность.
Эту задачу я решала с помощью программного обеспечения Mathcad.
Мною был построен график по полученным значениям на котором
наглядно видно, что коэффициент детерминации получился близким к
единице, при дальнейших расчетах я установила, что он равен 0.97, это
свидетельствует о том, что модель адекватна, следовательно, установленная
мною зависимость верна.
Размещено на Allbest.ru