Академический Документы
Профессиональный Документы
Культура Документы
Если d — оценка параметра , то разность (-d) есть ошибка оценивания. Так как для
любой оценки
^ 2
d ,
2 (1.5)
то можно говорить, что байесовская оценка при квадратичной функции потерь
оптимальна по критерию минимума среднего квадрата ошибки. Оценку (4)
называют байесовской среднеквадратической. Отметим также, что в соответствии
с (2.4)
^
y . (1.6)
Рассмотрим еще одну функцию потерь вида
c , d c1 d , (1.7)
где константа с1>0, а — дельта-функция. В этом случае апостериорный риск
c1 d y c1 d y d c1 d y . .
^
L M max L . (1.9)
Если максимум достигается во внутренней точке множества и функция
правдоподобия дифференцируема по , то оценка м является корнем уравнения
L()/=0 или
d ln L / d 0, (1.10)
называемого уравнением максимального правдоподобия.
Отметим, что рассматриваемая оценка
м введена эвристически и о ее
качестве ничего определенного пока что сказать нельзя (в отличие от байесовской
оценки (4), которая по сути дела получена минимизацией среднего квадрата
ошибки). Чтобы внести в этот вопрос некоторую ясность, рассмотрим одно важное
свойство точечных оценок.
Пусть d=(y) — оценка неслучайного параметра , математическое ожидание
которой может быть смещено относительно :
M ( y ) ( y ) ( y ) dy ( ) , (1.11)
Y
Дифференцируя по , получаем *
y
y
dy 1 ' y dy 1 ' , (1.12)
Y Y
y y dy y dy 1 ' .
2 2
Y Y
Первый интеграл в этом выражении равен дисперсии оценки (y):
y 2 y y 2 D y .
Таким образом, получаем неравенство
D y
1 ' 2 , (1.14)
ln y /
2
1
D y . (1.15)
ln y /
2
^
eff y D нэ / D y 1/ ln y / D y ,
2 (1.16)
(1.17)
Функция (-) не зависит от y. Поэтому если существует оценка (y) при
которой (15) становится равенством, т. е. если существует (y)= нэ , то, как следует
из (17), (y)= нэ = , где — решение уравнения максимального
правдоподобия, т. е.
= . м
( у 1 )
Схема i
( у 2 ) Выбора
максимума
( у m )
1
ОП 2 2 ln y ОП
2
Подставив это выражение в (25), получим уравнение максимального правдоподобия
ln y ln y ОП ОП 2 ln y ОП 0,
2
из которого находим оценку
1
2
M ОП ln y ОП 2 ln y ОП
. (1.26)
Согласно (26) синтезированный измеритель представляет собой по существу
оптимальный дискриминатор (рис. 1.3,а), формирующий ошибку рассогласования
р=оп- м , называемую также сигналом ошибки. Для его работы необходимо иметь
опорное значение параметра оп, близкое к истинному значению параметра . Это
опорное значение можно найти в результате параллельного поиска, который
реализуется многоканальной схемой, либо последовательным во времени поиском
по всей области возможных значений параметра . В последнем случае должна
быть предусмотрена перестраиваемая в области в схема поиска, включающая в себя
обнаружитель сигнала. На выходе этого устройства формируется опорное значение
оп, лежащее в окрестности истинного значения параметра . Последовательный
поиск проигрывает во времени параллельному, однако проще в технической
реализации, так как не требует многоканальных устройств.
Когда флуктуации 2 (рис. 1.3,а) не слишком велики, схему оптимального
дискриминатора можно упростить, заменив случайную величину ее математическим
ожиданием:
2 2
2 ln y ОП ln y ОП . (1.27)
2 2
При этом значение 2 вычисляется заранее и вводится в схему дискриминатора
(рис. 1.3,б) в виде постоянного весового коэффициента*.
11
Если сигнал ошибки р=оп— м подать на цепи сглаживания и управления и
замкнуть обратную связь, подав управляющее воздействие в виде опорного значения
параметра оп на дискриминатор, то получим следящий измеритель (рис. 1.4).
Напомним, что при отыскании оценки максимального правдоподобия
м
д
ln ( y ) оп
д
д
оп
ln ( y ) оп
д
1
у оп 2 оп ˆм у 1 д оп ˆм
ln ( y ) оп
2 д
д2
ln ( y ) оп
д 2
а) б)
Рисунок 1.3. Структурные схемы дискриминаторов
вектора
=( i ,...,
l) является оптимальной оценкой соответствующего
скалярного параметра i. Эти компоненты вычисляются по формуле (28), которую
после интегрирования по всем параметрам, кроме i, можно записать в виде
i i i y d i ,
i
Качество векторной оценки
характеризуется минимальным средним риском
2
l
r 0 , *
i i ,
i 1
который, как видим, равен сумме средних квадратов ошибок оценивания
компонент i(i=1,...,l).
Рассмотрим теперь оценку максимального правдоподобия
м
=( 1м ,...,
lм )
секторного неслучайного параметра =(1,..., l). Эта оценка находится из
условия максимума функции правдоподобия L()=(y), т. е.
L M max L .
Как и при скалярном параметре, для отыскания оценки максимального
правдоподобия можно максимизировать логарифм функции правдоподобия. Если
максимум достигается внутри множества и функция правдоподобия
дифференцируема по всем параметрам 1, .... l, то векторная оценка ( , ...,
1м
lm )
находится путем решения системы уравнений максимального правдоподобия:
ln L / i 0, i 1, , l. (1.29)
Потенциальные точности измерения можно определить с помощью системы
неравенств, дающих нижние границы для дисперсий любых несмещенных оценок
di=i(y) неслучайных параметров i:
i y i 2 D i y ii2 , i 1, , l. (1.30)
Здесь ii2(i=l,...,L) — диагональные элементы матрицы I-1, обратной информационной
матрице Фишера I, элементы которой
2
I ij ln y ln y ln y . (1.31)
i j i j
Система неравенств (30) обобщает неравенство Крамера—Рао (15) на
векторный параметр. Для наиболее эффективных оценок неравенства (30)
переходят в равенства. При этом если существуют такие оценки, то они являются
оценками максимального правдоподобия
=(
м
,...,
1м
lм). Кроме того, при
довольно общих условиях оценки (
1м,…,
lм ) асимптотически (при увеличении
объема n выборки у=у1, ..., yn) наиболее эффективны. Это позволяет определить
потенциальные точности измерения i . компонент векторного параметра
формулой
i ii2 , (1.32)
дающей наименьшие значения среднеквадратических ошибок.
y t s1 t dt s1 t dt .
2
aM (1.37)
0 0
Отсюда видно, что оптимальный измеритель амплитуды сигнала (35) может быть
реализован с помощью коррелятора или же линейного фильтра.
Вычислив математическое ожидание оценки с учетом (2.34)
T T
a M as1 t t s1 t dt s1 t dt a,
2
0 0
видим, что оценка амплитуды является несмещенной. Дисперсия оценки
2 2 2
D a M a M a M a M a a M a 2
2
T TT
s12 t dt y t ' y t ' ' s1 t ' s1 t ' ' dt ' dt ' ' a 2 .
0 00
15
наиболее эффективной.
Потенциальная точность измерения амплитуды
T
a N 0 2 s12 t dt ,
0
T
при этом a a 1 2E N 0 , где E a 2 s12 t dt - энергия сигнала.Таким образом,
0
относительная погрешность измерения амплитуды сигнала обратно
пропорциональна отношению сигнал-шум по напряжению.
Оценка неэнергетического параметра. Условное отношение правдоподобия
(34) при неэнергетическом параметре
E 2 T
y exp 0 exp y t s , t dt , (1.38)
N0 N 0 0
T
где E s 2 ( , t )dt - энергия сигнала. Первый блок оптимального измерителя (см.
0
рис.1.1,6) формирует корреляционный интеграл
T
z y t s , t dt , (1.39)
0
а второй блок отыскивает в области его максимальное значение z( м ), тем самым
определяя оценку максимального правдоподобия м. Уравнение (25) в
рассматриваемом случае имеет вид z()/=0.
На вход измерителя поступает процесс
y t s 0 , t t , (1.40)
где о—истинное значение оцениваемого параметра. На выходе коррелятора
согласно (39) и (40) имеем
T T
z s 0 , t s , t dt t s , t dt.
0 0
Первое слагаемое зависит от рассогласования по измеряемому параметру
опорного сигнала S(,t) коррелятора и принимаемого сигнала S(о, t). Поэтому
интеграл
T
0 , s 0 , t s , t dt (1.41)
0
Т
СФ1
z(1) z(1)
0
i
y(t) S(1,t) i y(t) СВМ
CВМ
Т
z(m) z(m)
СФm
0
S(m,t)
а) б)
конечной разностью
2
T T
y t s ОП , t dt y t s ОП , t dt
N 0 0 2 0 2
и опустив весовой коэффициент, представим дискриминатор в виде двухканального
коррелятора с расстроенными на каналами, выходы которых присоединены к
схеме вычитания (рис. 1.6). Подав выходной сигнал дискриминатора на цепи
сглаживания и управления и замкнув обратную связь, получим следящий
измеритель.
0
y(t) s( оп , t)
2
s ( оп , t)
2
0
Оценка
0 Цепь
s(t 0 ) t задержки
сглаживания
Т
0
Генератор Схема
селекторного регулируемой Опорный
импульса задержки
s (t оп ) импульс
2
s (t оп )
2
A(t ) cos 0 t (t ) 1
A(t ) cos 0 t (t ) m
Т
0
Т i
y(t) СВМ
0
0
T
1
0 , A t cos 0 t t 0 cos 0 t t 0 dt
2
E 0
A t
T 2
1
cos cos 2 0 t 2 t 0 dt
E 0
2
A2 t
T
1
cos dt cos 0 .
E 0
2
Так как 2cos(o—)/2=-1, то согласно (44)
1 2E N 0 . (1.45)
Таким образом, среднеквадратическая ошибка , характеризующая потенциальную
точность измерения фазы частотного заполнения радиоимпульса, обратно
пропорциональна отношению сигнал-шум по напряжению и не зависит от вида
амплитудной и фазовой модуляции.
Оценка времени запаздывания сигнала со случайными начальной фазой и
амплитудой. Радиолокационные и радионавигационные сигналы кроме
информативных параметров содержат и неинформативные. К последним обычно
относятся начальная фаза высокочастотного заполнения радиосигнала и его
амплитуда. Поэтому практически важную задачу оценивания времени запаздывания
радиосигнала рассмотрим, использовав модель сигнала со случайными начальной
фазой и «амплитудой» а:
s , a, , t 2aA t cos 0 t t ,
(1.46)
0 t T
(нормировочный коэффициент 2 введен для удобства записи дальнейших
соотношений).
Законы амплитудной A(t—) и фазовой (t—) модуляции зависят от
информативного параметра —времени запаздывания сигнала, по которому
определяется дальность R (см. (3.1), (3.2)). Обратим внимание на то, что в
20
A t 1 cos 0 t 1 t 1
Χ
Т
z1 ( 1 )
0
/2 z12 ( 1 ) z 22 ( 1 )
z12 ( 1 ) z 22 ( 1 )
z 2 ( 1 )
Χ
Т
z1 ( 1 )
0
i
СВМ
A t m cos 0 t m t m
Х
0
z1 ( m )
/2 z12 ( 1 ) z 22 ( 1 )
Х
Т
z 2 ( m )
0
21
a)
у(t) ˆ м
CФ АД СВМ
б)
Рисунок 1.9. Структурные схемы корреляционного (а) и фильтрового (б)
измерителей времени запаздывания сигнала со случайными начальной фазой и
амплитудой
N0 2 a2 z 02
y exp , (1.47)
N0 E N 0 N 0 E
где
z 0 z12 z 22 (1.48)
— огибающая корреляционного интеграла, квадратурные составляющие
которого
T
z1 2 y t A t cos 0 t t dt ,
0
T
(1.48а)
z 2 2 y t A t sin 0 t t dt ;
0
E —усредненная энергия сигнала (см. (2.76)). Максимально правдоподобная оценка
и учтем, что
~ 1 ~
A t
2 F j exp j t d . (1.59)
получаем
~
A t ~ *
j ~ ~
A t dt ' F j ' F * j ' ' ' ' '
2 2
j ~
exp j ' ' ' d ' d ' '
2
2 F j d .
Поэтому
~ 2 2
A t ~ *
1 ~ 2
A t dt F j d .
4 2
Определим среднее значение частоты:
~ 2 ~ 2
F j d F j d . (1.62)
A t dt E2 2. (1.64)
2 A t dt E . (1.66)
2
Итак, подставляя выражения (64), (66) в формулу (56) и учитывая (57), (63),
получаем
I 4k 2 E 2 [ 2 2 ].
И наконец, выразив константу к согласно (55) и перейдя к усредненной энергии
E 2 2 E , найдем
I [ 2 E 2
N 0 N 0 E ] [ 2 ]. 2
Таким образом, согласно (23), (54) потенциальная точность измерения времени
запаздывания сигнала
26
1
1
2E
2
2
2
. (1.67)
1 N0 N0 E
Величина [ 2 ( ) 2 ], описываемая формулами (62) и (65), есть средний квадрат
ширины спектра огибающей сигнала, а
э 2 (1.68)
2
СФ1 АД
у(t) СВМ fi
СФm АД
a)
f0+f-fг
СФ1 АД
f0+f Оценка
См ЦС
частоты
fг СФ2 АД
ПГ РЭ
б)
28
z 02 , f1
z 02 ˆ1, f1
СФ1 АД СВМ
y(t) z 02 , f 2
z 02 ˆ2 , f 2 ОСВМ
ˆi , f i
СФ2 АД СВМ
z 02 , f m
z 02 ˆm , f m
СФm АД СВМ
где
k1 2 q 2 1 q , (1.83)
величины , 2 , t , t 2 определяются прежними формулами (71) и (78), а
~
dA * t ~
~
t 2 Im t A t dt A t dt . (1.84)
dt
Выбрав начало отсчета времени и частоты так, чтобы =0, t =0, имеем
2
t
I k1 ,
t t2
при этом обратная матрица
1 t2 t
I 1 .
2
k1[ 2 t 2 t ] t 2
Отсюда и из (32) следует, что потенциальные точности совместного измерения
31
1 q 1 1 q 1
, .
q ' ' 0,0 q ff ' ' 0,0
2 f 2
Обратим внимание на то, что оценка di зависит от двух моментов времени: от
момента окончания наблюдения t и от момента , для которого отыскивается оценка
параметра . Если эти моменты времени совпадают: =t, то оценивание называется
фильтрацией. При >t оценивание называется экстраполяцией или предсказанием, а
при <t—интерполяцией или сглаживанием.
Задав функцию потерь с(,d), можно определить байесовское решение
di*=*(yt0) путем минимизации среднего риска или же апостериорного риска:
min c , t y 0t y 0t c , * y 0t y 0t .
Это решение и будет оптимальной в байесовском смысле оценкой параметра .
Причем при =t имеем оптимальную фильтрационную оценку d*tt, а при >t. и <t—
оптимальные экстраполяционную и интерполяционную оценки соответственно.
При квадратичной функции потерь (3) оптимальные оценки параметра сигнала
определяются выражением
d t* y 0t , t (1.93)
(в этом нетрудно убедиться, поступая так же, как и при выводе оценки (4)). Если
функция потерь квадратична относительно сигнала s(t,t), т.е. с(,d)=[S(,t)—d]2, t0,
то оптимальные оценки сигнала
d t* s , y 0t , t (1.94)
Качество оптимального оценивания определяется значением байесовского риска
r * Mc[ , * , ( y t )] , который при квадратичной функции потерь (3)
t 0
*
r t
y 0t , (1.95)
т. е. совпадает со средним значением квадрата ошибки оценивания. Квадратный
корень этой величины есть среднеквадратическая* ошибка оптимального
оценивания: t r *t .
Отметим, что среднеквадратические ошибки оптимальной интерполяции и
оптимальной фильтрации удовлетворяют неравенству t, <t. Это объясняется
тем, что дополнительное наблюдение реализации y t={yu, <ut} не может ухудшить
качества оптимального оценивания. Оно может быть либо улучшено, либо, по
крайней мере, остаться прежним. Последнее, как следует .из (95), будет в том случае,
если M(yt0)=M(y0), т.е. когда параметр статистически не зависит от
дополнительного наблюдения реализации yt0.
Таким образом, интерполяция позволяет повысить качество оценивания по
сравнению с фильтрацией. Покупается это ценой увеличения времени наблюдения и
усложнения алгоритма обработки наблюдаемого процесса [53]. Что касается
экстраполяции, то она применяется тогда, когда наблюдение окончено, однако
необходимо продолжать оценивание параметра . Такая задача возникает, например,
во вторичной обработке радиолокационной информации при определении
траектории движущегося объекта (гл. 7). Центральное место в теории оценивания
случайных процессов занимает задача фильтрации; на ее основе решаются также
задачи интерполяции и экстраполяции. В дальнейшем рассматривается только задача
фильтрации.
Для получения конкретных результатов необходимо задать вид случайного
процесса t, который может служить математической моделью изменяющегося
35
где 1i 1 1 , , i 1 ; y1i 1 y1 , , y i 1 .
36
i
0 1i 1 k 1 k 1 .
k 1
Поэтому совместная плотность вероятностей
i 1 i
1i 1 , y1i 1 y1i 1 1i 1 0 1i 1 y k s k , t k k 1 k 1 .
k 1 k 1
Перепишем эту формулу в виде
1i 1 , y1i 1 y i 1 s i 1 , t i 1 i 1 i
i i 1 (1.102)
y k s k , t k k 1 k 1 .
k 1 k 1
Выражение, стоящее в фигурных скобках, есть совместная плотность вероятностей
i(1i, y1i) Подставляя с учетом этого формулу (102) в (101), получаем
1i 1 , y1i 1
y i 1 s i 1 , t i 1 i 1 i y1i , 1i ,
(1.103)
y i 1 s i 1 , t i 1 i 1 i y1i , 1i d 1 d i 1
y i 1 s i 1 , t i 1 i 1 i p i d i
p i 1 i 1
. (1.104)
y i 1 s i 1 , t i 1 i 1 i p i d i d i 1
1 i2
i exp 2 , i 1,2, . (1.115)
0 2 2 0
Так как сигнал и шум гауссовские и аддитивные, то наблюдаемый процесс (112)
тоже гауссовский. Кроме того, с помощью формулы Байеса можно убедиться, что
апостериорная плотность вероятностей pi(i) также является гауссовской. Поэтому ее
можно записать в виде
hi h
p i i exp i i mi 2 . (1.116)
2 2
Апостериорное среднее mi и апостериорная дисперсия 1/hi полностью определяют
апостериорную плотность вероятностей pi(i). Параметры mi и hi, определим исходя
из рекуррентного соотношения оптимальной фильтрации (104). Для этого согласно
(96) и (112) нужно в нем положить S(i, ti)= i и затем подставить (113), (115), а также
pi+1(i+1) и рi(i) в форме (116). Конкретизировав таким образом рекуррентное
соотношение (104), проинтегрируем по i, используя для этого интеграл
exp ax b2
2
bx dx exp
a 4a
Затем, приравняв соответствующие члены, стоящие в разных частях полученного
равенства, найдем рекуррентные алгоритмы для параметров апостериорной
плотности вероятностей:
mi 1 c1i y1i c 2i mi (1.117)
hi 1
hi 1 , i 1,2,
hi 12 1 2 2 02 (1.118)
где
c1i
hi 12 1 2 2 , c 2i
hi 02
(1.119)
hi 12 1 2 2 hi 02
hi 12 1 2 2 hi 02
.
c1i c1t
ˆi 1 ̂ ˆt
yi yt t
+ +
ˆi c2t
t
c2i
a) б)
Формирующий фильтр
c1t m
t K
yt mt yt RC ˆt
+
- г)
в)
2 2 1
L yt . (1.125)
4 2 N0 2
Апостериорная плотность вероятностей pt() по тем же причинам, что и в случае
дискретного времени, является гауссовской:
ht h
p t exp t mt 2 . (1.126)
2 2
Подставив (125) и (126) в уравнение оптимальной фильтрации (109), выполним в
нем операции дифференцирования. Приравнивая затем члены при одинаковых
степенях и 2, получаем дифференциальные уравнения для параметров
апостериорной плотности вероятностей:
2 2 yt
m t mt , (1.127)
N 0 ht N 0 ht
2
h t 2 12 ht2 2ht , (1.128)
N0
где 21=/4—дисперсия сигнала t. Апостериорное среднее mt совпадает с
оптимальной оценкой
t (как и при дискретном времени). При этом линейное
дифференциальное уравнение (127) вместе с уравнением (128) определяет
структурную схему (рис. 1.14,б) оптимального линейного фильтра, являющегося
одномерным вариантом непрерывного фильтра Калмана. В полученной схеме
имеются усилители с переменными коэффициентами усиления
2 2
с1t , c 2t , (1.129)
N 0 ht N 0 ht
причем функция ht является решением обыкновенного дифференциального
уравнения (128):
r 1 r0 exp 2r1t 1
ht 1 2 2,
2 1 1 r0 exp 2r1t 2 1
где
2 4 12 r1 2 12 h0
r1 ; r0 ,
N0 r1 2 12 h0
a h0—начальное условие для уравнения (128). В стационарном режиме, когда ht=0,
функция ht обращается в постоянную:
1 4 12
h 1 1 . (1.130)
2 12 N 0
где
43
s , t 2 s , t a , t
s' mt , t mt , s' ' mt , t mt , a' mt , t mt .
2
y
2
2K t
K t b mt , t 2 K t a ' mt , t t s mt , t s' ' mt , t s' mt , t 2 . (1.136)
N0
При выполнении условия большой апостериорной точности апостериорное среднее
приближенно равняется оптимальной оценке параметра: mt
t
Таким образом, уравнения (133), (134) .или эквивалентные им (135), (136)
определяют квазиоптимальные алгоритмы нелинейной фильтрации параметра t
сигнала S(t,t), наблюдаемого на фоне белого шума. Отметим, что при увеличении
отношения сигнал-шум (q) эти алгоритмы являются асимптотически
оптимальными [53]. Конкретизируя форму сигнала S и вид параметра t, можно с
помощью уравнений (133) — (136) синтезировать устройства квазиоптимальной
фильтрации стохастических сигналов и их параметров.
Уравнение (136), необходимое для синтеза алгоритмов фильтрации, определяет
также и их анализ. Действительно, качество фильтрации, как уже отмечалось,
характеризуется апостериорной дисперсией Kt; последняя же в гауссовском
приближении определяется уравнением (136). При этом среднеквадратическая
ошибка фильтрации
t K t (1.137)
В отличие от подобной формулы (100), равенство в (137) приближенное вследствие
того, что рассматриваемая задача фильтрации решалась в гауссовском приближении.
В качестве примера рассмотрим случай, когда стохастический радиосигнал
является фазомодулированным:
s t , t A0 sin 0 t t , (1.138)
где A0 и 0 — известные константы, а флуктуации фазы t определяются уравнением
(122) при =0, т.е. t=t. Это означает, что фаза t является гауссовским процессом с
независимыми приращениями, т.е. испытывает нестационарные блуждания.
Коэффициенты переноса и диффузии рассматриваемого процесса:
a , t 0, b , t 2 . (1.139)
Используя (138), (139), конкретизируем уравнения (135), (136). При этом
пренебрежем колебательными членами с удвоенной частотой 2о, дающими малый
вклад. В результате получим
m t yt 2 K t N 0 A0 cos 0 t mt , (1.140)
K t yt 2 K t2 N 0 A0 sin 0 t mt 2 . (1.141)
Уравнение (140) описывает следящий измеритель типа фазовой автоподстройки
частоты (ФАПЧ) с переменным коэффициентом усиления Kt в цепи обратной связи.
Этот коэффициент усиления, определяемый уравнением (141), зависит от
наблюдаемого процесса и, следовательно, является случайным.
Для упрощения технической реализации измерителя в стационарном режиме
44
2К N 0
yt m
t mt ˆt
A0 cos( 0 t mt )
ПГ РЭ
сt
yt mt
s ' (t m t )
Наблюдаемый процесс в данном случае имеет вид (106), где нужно положить
S(t, t)(t—). При такой постановке задачи задержка со временем не меняется и,
45