Вы находитесь на странице: 1из 22

1

Отчет по дисциплину Б1.В.ДВ.3.2.


(Дисциплины по выбору)

«Методы планирования, проведения и обработка


результатов экспериментального исследования
энергоустановок с фотоэлектрическим преобразованием»

Кафедра: ГВИЭ

Выполнил : Аунг Ко
Руководитель: Васьков А.Г.

Москва 2017г.
2

Содержание
Отбор и оценки информации ............................................................................. 3

1. Проблемы сбора и отработки информации .............................................. 3

2. Зависимость результата от способа отбора .............................................. 4

3. Виды отбора информации .......................................................................... 6

4. Расслоенный отбор ..................................................................................... 8

5 .Обобщенное понятие и свойства точечных оценок ................................ 9

6. Метод моментов ........................................................................................ 12

7. Метод наибольшего правдоподобия ....................................................... 13

8. Метод наименьших квадратов ................................................................. 17

9. Робастные оценки ..................................................................................... 20

10. Число степеней свободы. ....................................................................... 21

Список литературы ........................................................................................... 22


3

Отбор и оценки информации

1. Проблемы сбора и отработки информации


Информация не является ни материей, ни энергией. В отличие от
них, она может возникать и исчезать.

Особенность информации заключается в том, что проявляется она


только при взаимодействии объектов, причем обмен информацией может
совершаться не вообще между любыми объектами, а только между теми
из них, которые представляют собой организованную структуру (систему).
Элементами этой системы могут быть не только люди: обмен
информацией может происходить в животном и растительном мире,
между живой и неживой природой, людьми и устройствами[1].

Информация – наиболее важный ресурс современного производства:


он снижает потребность в земле, труде, капитале, уменьшает расход сырья
и энергии, вызывает к жизни новые производства, является товаром,
причем продавец информации не теряет ее после продажи, может
накапливаться. Понятие «информация» обычно предполагает наличие
двух объектов – «источника» информации и «приемника» (потребителя,
адресата) информации.

Информация передается от источника к приемнику в материально-


энергетической форме в виде сигналов (например, электрических,
световых, звуковых и т. д.), распространяющихся в определенной среде.

Понятие информации можно рассматривать с двух позиций: в


широком смысле слова – это окружающий нас мир, обмен сведениями
между людьми, обмен сигналами между живой и неживой природой,
людьми и устройствами; в узком смысле слова информация – это любые
сведения, которые можно сохранить, преобразовать и передать[1].
4

Информация – специфический атрибут реального мира,


представляющий собой его объективное отражение в виде совокупности
сигналов и проявляющийся при взаимодействии с «приемником»
информации, позволяющим выделять, регистрировать эти сигналы из
окружающего мира и по тому или иному критерию их идентифицировать.

Из этого определения следует, что

1. информация объективна, так как это свойство материи – отражение;


2. информация проявляется в виде сигналов и лишь при
взаимодействии объектов;
3. одна и та же информация различными получателями может быть
интерпретирована по-разному в зависимости от «настройки»
«приемника».

2. Зависимость результата от способа отбора


Основными информационными процессами являются:

 сбор (восприятие) информации;


 подготовка (преобразование) информации;
 передача информации;
 обработка (преобразование) информации;
 хранение информации;
 отображение (воспроизведение) информации.
Так как материальным носителем информации является сигнал, то
реально это будут этапы обращения и преобразования сигналов (см. на
рисунок 1) [1].
5

Рис. 1. Основные информационные процессы.

С точки зрения информатики наиболее важными представляются


следующие:

Актуальность информации – свойство информации сохранять


ценность для потребителя в течение времени, т. е. не подвергаться
«моральному» старению.

Полнота информации – свойство информации, характеризуемое


мерой достаточности для решения определенных задач. Полнота
информации означает, что она обеспечивает принятие правильного
(оптимального) решения. Оценивается относительно вполне определенной
задачи или группы задач.

Адекватность информации – свойство, заключающееся в


соответствии содержательной информации состоянию объекта.
Нарушение идентичности связано с техническим старением информации,
при котором происходит расхождение реальных признаков объектов и тех
же признаков, отображенных в информации.

Сохранность информации – свойство информации, характеризуемое


степенью готовности определенных информационных массивов к
целевому применению и определяемое способностью контроля и защиты
6

информации обеспечить постоянное наличие и своевременное


предоставление информационного массива, необходимых для
автоматизированного решения целевых и функциональных задач системы.

Достоверность информации – свойство информации,


характеризуемое степенью соответствия реальных информационных
единиц их истинному значению. Требуемый уровень достоверности
информации достигается путем внедрения методов контроля и защиты
информации на всех стадиях ее переработки, повышения надежности
комплекса технических и программных средств информационной
системы, а также административно-организационными мерами.

3. Виды отбора информации


По виду отбор бывает: индивидуальный, групповой и комбинированный
[2].
Индивидуальный отбор – выборочная совокупность образуется при
последовательном отборе отдельных единиц.

Групповой (серийный) – качественно однородные группы или серии


изучаемых единиц.

Отбору подлежат целые группы (серии, гнезда), отобранные


случайным или механическим способом. В каждой такой группе
проводится сплошное наблюдение, а результаты переносятся на всю
совокупность.

Комбинированный отбор – предполагает сочетание первого и


второго видов, может проходит в одну или несколько ступеней. При
многоступенчатой выборке типический отбор сочетают с несколькими
стадиями (ступенями) отбора. При этом каждая стадия имеет свою
единицу отбора. Например, при обследовании бюджетов семей рабочих:

1. стадия – распределение по отраслям;


7

2. стадия – распределение по предприятиям;


3. стадия – отбор рабочих групп внутри предприятия;
4. стадия– разбивка рабочих на квалифицированных и
неквалифицированных.
Многофакторная выборка отличается от многоступенчатой тем, что
на всех ступенях выборки сохраняется одна и та же единица отбора.
Примером комбинированной выборки может служить отбор серий
из нескольких типичных групп.
По степени охвата единиц совокупности различают большие и
малые: малая выборка (численность единиц в ней меньше 20).
По способу формирования выборки:
Собственно-случайный отбор; осуществляется с помощью
жеребьевки или по таблице случайных чисел. Пример, тиражи
выигрышей: из общего количества выпущенных билетов наугад
отбирается определенная часть номеров, на которые приходятся
выигрыши. Причем всем номерам обеспечивается равная возможность
попадания в выборку. Используется на практике редко.
Механический отбор. Вся совокупность подразделяется на типы
(районы) и проводится случайный или механический отбор из каждого
типа (района). Так, если надо провести 10% механическую выборку
студентов, то составляется список их фамилий по алфавиту и механически
отбирается каждый десятый студент, например, 1-й, 11-й, 21-й, 31-й и т.д.
Типический отбор. Изучаемая неоднородная совокупность
разбивается по существенному, типическому признаку на качественно
однородные, однотипные группы. Затем из каждой группы случайным
способом отбирается количество единиц, пропорциональное удельному
весу группы во всей совокупности. Например, отрасль и подотрасль,
формы собственности. Этот обор дает более точные результаты, чем
случайный и механический.
8

По методу отбора различают повторный и бесповторный


Повторный отбор – это схема возвращенного шара. Общая
численность единиц генеральной совокупности в процессе выборки
остается неизменной. В социально-экономических исследованиях
встречается редко.
Бесповторный отбор – это схема невозвращенного шара. Дает
более точные результаты по сравнению с повторным. Единица
совокупности, попавшая в выборку, в генеральную совокупность не
возвращается и в дальнейшем в выборке не участвует, численность
генеральной совокупности сокращается в процессе исследования.
Случайный бесповторный отбор чаще всего имеет место в
социально-экономических исследованиях.
Виды выборок представлены схематично на рис.2.

Рис. 2. Виды отбора единиц из генеральной совокупности.

4. Расслоенный отбор
При описании способа отбора, при котором n единиц выборки
отбирались из совокупности объема Nс соблюдением принципа
случайности по схеме возвращенного или невозвращенного шара [3]:
9

Цель выборки заключалась в том, чтобы сделать наиболее


достоверные выводы о всей совокупности. Единственный способ влиять
на точность выборочных оценок состоял при этом в увеличении или
уменьшении объема выборки.

Пусть совокупность из N единиц состоит из L подмножеств


объема Nh , h - 1,2,................,L, таких, что

или ее можно разделить на такие подмножества, и отбор единиц выборки


производится раздельно, т. е. из Nh единиц h-го подмножества по
правилам простого случайного отбора извлекается nh единиц выборки:

причем

Такой способ отбора называется расслоенным отбором, a L подмножеств


совокупности называются слоями.

5 .Обобщенное понятие и свойства точечных оценок


Важнейшей задачей выборочного метода является оценка
параметров (характеристик) генеральной совокупности по данным
выборки, которую можно сформулировать следующим образом [4].

Пусть распределение признака Х – генеральной совокпности –

задается функцией вероятностей (для дискретной


случайной величины Х) или плотностью вероятности (для
10

непрерывной случайной величины Х), которая содержит неизвестный


параметр . Для вычисления данного параметра исследовать все
элементы генеральной совокупности не представляется возможным. В
связи с этим о параметре пытаются судить по выборке (x1, x2, …, xn).
Данные значения можно рассматривать как частные значения
(реализации) nнезависимых случайных величин Х1, Х2, …, Хn, каждая из
которых имеет тот же закон распределения, что и сама случайная
величина Х.

Точечной оценкой параметра называют функцию результатов


наблюдений над случайной величиной Х, подсчитанное значение которой
принимается за , т.е.

Основными методами нахождения оценок являются метод


моментов, метод максимального правдоподобия, метод наименьших
квадратов. Точечные оценки могут обладать свойствами
несмещенности, состоятельности и эффективности.

Несмещенной называют статистическую оценку , математическое


ожидание которой равно оцениваемому параметру при любом объеме
выборки, т.е.

Смещенной называют статистическую оценку, математическое


ожидание которой не равно оцениваемому параметру.В теории

математической статистики доказано, что - является несмещенной

оценкой, а - смещенной, т.е.


11

В связи с тем, что практический смысл имеют несмещенные оценки,


поэтому в расчетах используют исправленную выборочную дисперсию,
являющуюся несмещенной оценкой, т.е.

Несмещенную оценку параметра называют эффективной, если


она имеет наименьшую дисперсию среди всех возможных несмещенных
оценок параметра , вычисленных по выборкам одного и того же
объема n. К примеру, на практике в целях упрощения расчетов
генеральную среднюю часто оценивают медианой выборки, в то время

как эффективной оценкой является выборочная средняя . Оценку


параметра называют состоятельной, если она сходится по вероятности
к оцениваемому параметру, т.е.

К примеру, в теории математической статистики доказано, что


выборочная дисперсия является состоятельной оценкой, т.е.

В качестве статистических оценок параметров генеральной


совокупности желательно использовать оценки, удовлетворяющие
12

одновременно требованиям несмещенности, состоятельности и


эффективности.

6. Метод моментов
Пусть x ,x … xn – независимая выборка из распределения с
плотностью p(x; θ1 ,…, θr ), зависящей от параметров θ1 ,…, θr [5].

Определение: Интеграл вида



mk (θ1 ,…, θr ) = ∫−∞ 𝑥 𝑟 𝑝(𝑥, 𝜃1 , … . , 𝜃𝑟 )𝑑𝑥 называется теоретическим
1
моментом порядка k, а статистика 𝑏𝑘 = ∑𝑛𝑗=1 𝑥𝑗𝑘 называется выборочным
𝑛

моментом порядка k.

Предположим, что при k=1,2….r, все теоретические моменты mk (θ1 ,…,


θr ) конечны и что система уравнений 𝑏𝑘 = 𝑚 𝑘 (θ1 , … , θr ), k=1,2,…,r
−1
однозначна разрешима, причем решение 𝜃𝑘 = 𝑚𝑘 (b1 ,…, br ), k=1,2,…r
−1
дается непрерывными обратными функциями 𝑚𝑘 . При этих условиях
имеет место.

Теорема о методе моментов. Оценки 𝜃̂𝑘 , получаемые как решения системы


−1
уравнений 𝜃𝑘 = 𝑚𝑘 (b1 ,…, br ), k=1,2,…r состоятельны.

Пример 1. Найти методом моментов по выборке x ,x …x точечную


оценку неизвестного параметра λ показательного распределения с
плотностью p(x)= λe-x (x >0).

Решение. Здесь неизвестный параметр один, поэтому вычисляем


∞ 1
теоретический и выборочный моменты: m1() = ∫−∞ λe−x 𝑑𝑥 = ,

𝑛
1
𝑏1 = 𝑥̅ = ∑ 𝑥𝑗
𝑛
𝑗=1
13

1
Искомая оценка имеет вид ̂ = 𝑥 .

7. Метод наибольшего правдоподобия


Это универсальный метод оптимального оценивания неизвестных
параметров, если известен вид функции распределения. Рассмотрим
особенности его применения для дискретных и непрерывных
распределений [6].

1) Дискретные СВ

Пусть X - дискретная СВ, которая в результате n испытаний приняла


значения x1 , x2 ,...,xn. Допустим, что вид закона распределения СВ X
задан, но не известен параметр , которым определяется этот закон.
Требуется найти точечную оценку этого параметра. Обозначим
вероятность того, что СВ X приняла значение xi , 𝑖 = ̅̅̅̅̅
1, 𝑛 через p(xi ,).
Функцией правдоподобия дискретной СВ X называют функцию
аргумента :

L( x1, x2,...,xn , ) = p(x1,) p(x2,) .... p(xn,) ,

где x1 , x2 ,...,xn - фиксированные числа.

В качестве точечной оценки параметра принимают такое его

значение

∗  ∗ x1, x2,...,xn)

при котором функция правдоподобия достигает максимума.


Оценку ∗ называют оценкой максимального правдоподобия (ММП-
оценкой).

В силу монотонности логарифма функции L и ln L достигают


максимума при одном и том же значении  , поэтому вместо max L ищут
14

max(ln L), что удобнее. Функцию ln(L) называют логарифмической


функцией правдоподобия.

Максимум ищем по обычной схеме:

1) Находим производную ,

2) Приравниваем ее к нулю: Это уравнение правдоподобия.

Отсюда находим критическую точку ∗ .

3) Найдем

Если вторая производная при ∗ отрицательна, то ∗ - точка максимума.

Найденную величину ∗ принимают в качестве ММП-оценки


неизвестного параметра  .

Оценки наибольшего правдоподобия, вообще говоря, состоятельны


(но могут быть смещенными), распределены асимптотически нормально
(при больших n приближенно нормально) и имею наименьшую дисперсию
по сравнению с другими асимптотически нормальными оценками.

Если для оцениваемого параметра  существует эффективная оценка


∗ , то уравнение правдоподобия имеет единственное решение ∗ .

Этот метод наиболее полно использует данные выборки, поэтому


полезен и в случае малых выборок. Недостаток метода в том, что он
иногда требует сложных вычислений.

Замечание. ММП-оценка не всегда совпадает с оценкой, найденной

методом моментов.

2) Непрерывные СВ
15

Пусть для непрерывной СВ X , которая в n испытаний приняла значения


x1, x2, ....,xn , известен вид плотности распределения f (x) , но неизвестен
параметр  , которым определяется эта функция.

Функцией правдоподобия непрерывной СВ X называют функцию


аргумента :

где x1, x2, ....,xn - фиксированные числа.

Оценку наибольшего правдоподобия (ММП-оценку) находят так же,

как и в случае дискретной СВ.

Замечание. Если плотность СВ X зависит от двух параметров 1, 2, то


функция правдоподобия зависит от двух переменных 1, 2 :

Так же, как и в дискретном случае находят логарифмическую функцию и


для отыскания максимума решают систему:

Пример. Методом максимального правдоподобия найти точечную оценку


неизвестного параметра показательного распределения

Решение. Построим функцию правдоподобия


16

а
также логарифмическую функцию правдоподобия

вычислим ее производную

Из уравнения правдоподобия найдем критическую


точку

Вычислим Подставляя во вторую

производную, убеждаемся, что Следовательно, при


𝑛
 ∑𝑛 функция ln L(x1, x1, ....,xn, ), а значит, и функция ln L(x1, x1,
𝑖=1 𝑥𝑖

....,xn, ) достигает локального максимума. Таким образом, -


ММП-оценка параметра  показательного распределения.
17

Замечание. Использование частного случая метода максимального


правдоподобия - метода наименьших квадратов - будет подробно
рассмотрено ниже на примере задач регрессионного анализа.

8. Метод наименьших квадратов


Пример.

Экспериментальные данные о значениях переменных х и у приведены в


таблице [7].

В результате их выравнивания получена функция

Используя метод наименьших квадратов , аппроксимировать эти


данные линейной зависимостью y=ax+b (найти параметры а и b).
Выяснить, какая из двух линий лучше (в смысле метода наименьших
квадратов) выравнивает экспериментальные данные. Сделать чертеж.

Задача заключается в нахождении коэффициентов линейной


зависимости, при которых функция двух

переменных а и b принимает наименьшее


значение. То есть, при данных а и b сумма квадратов отклонений
экспериментальных данных от найденной прямой будет наименьшей. В
этом вся суть метода наименьших квадратов.

Таким образом, решение примера сводится к нахождению


экстремума функции двух переменных.

Составляется и решается система из двух уравнений с двумя


неизвестными. Находим частные производные
18

функции по переменным а и b, приравниваем эти


производные к нулю.

Решаем полученную систему уравнений любым методом


(например методом подстановки или методом Крамера) и получаем
формулы для нахождения коэффициентов по методу наименьших
квадратов(МНК).

При данных а и b функция принимает


наименьшее значение. Доказательство этого факта приведено ниже по
тексту в конце страницы . Вот и весь метод наименьших квадратов.

Формула для нахождения параметра a содержит суммы , ,

, и параметр n - количество экспериментальных данных. Значения


19

этих сумм рекомендуем вычислять отдельно. Коэффициент b находится


после вычисления a.

Пришло время вспомнить про исходый пример.

Решение.

В нашем примере n=5 . Заполняем таблицу для удобства вычисления


сумм, которые входят в формулы искомых коэффициентов.

Значения в четвертой строке таблицы получены умножением


значений 2-ой строки на значения 3-ей строки для каждого номера i .

Значения в пятой строке таблицы получены возведением в квадрат


значений 2-ой строки для каждого номера i . Значения последнего столбца
таблицы – это суммы значений по строкам. Используем формулы метода
наименьших квадратов для нахождения коэффициентов а и b.
Подставляем в них соответствующие значения из последнего
столбцатаблицы:
20

Следовательно, y = 0.165x+2.184 - искомая аппроксимирующая прямая.

Осталось выяснить какая из линий y = 0.165x+2.184 или


лучше аппроксимирует исходные данные, то есть произвести оценку
методом наименьших квадратов.

Оценка погрешности метода наименьших квадратов

Для этого требуется вычислить суммы квадратов отклонений исходных

данных от этих линий и , меньшее


значение соответствует линии, которая лучше в смысле метода
наименьших квадратов аппроксимирует исходные данные.

Так как , то прямая y = 0.165x+2.184 лучше приближает исходные


данные.

9. Робастные оценки
Робастность – нечувствительность оценки к “плохим измерениям”
(выбросам и другим отклонениям от используемой модели). Способы
увеличения робастности оценки [8]:

1. Оценка более устойчивых параметров распределения.

Например, медиана распределения более устойчива, чем среднее

2. Усечение крайних значений


21

Например, отбрасывание K крайних измерений, или замена


значений К крайних измерений максимальным значением из оставшихся
измерений (винзорирование)

3. Группировка данных

4. Использование модифицированной функции правдоподобия

10. Число степеней свободы.


Количество степеней свободы — это количество значений в
итоговом вычислении статистики, способных варьироваться. Иными
словами, количество степеней свободы показывает размерность вектора из
случайных величин, количество «свободных» величин, необходимых для
того, чтобы полностью определить вектор [9].

Количество степеней свободы может быть не только натуральным,


но и любым действительным числом, хотя стандартные таблицы
рассчитывают p-value наиболее распространённых распределений только
для натурального числа степеней свободы.
22

Список литературы
1. http://wm-help.net/lib/b/book/120467185/4
2. http://lib.exdat.com/docs/1611/index-502-2.html?page=7
3. http://stu.alnam.ru/book_vbm-38
4. http://studopedia.ru/3_116842_ponyatie-i-svoystva-tochechnih-
otsenok.html
5. http://lektsii.org/6-80827.html
6. http://economy.bsu.by/wp-content/uploads/2016/03/Lecture-17.pdf
7. http://www.cleverstudents.ru/articles/mnk.html
8. Логашенко И.Б. //Современные методы обработки
экспериментальных данных
9. http://ru.rfwiki.org/wiki/Степени_свободы_(теория_вероятностей)