Вы находитесь на странице: 1из 45

1

1. ОЦЕНИВАНИЕ ПАРАМЕТРОВ СИГНАЛОВ

1.1. ОБЩИЕ ВОПРОСЫ ОЦЕНИВАНИЯ ПАРАМЕТРОВ

Измерение координат и параметров движения объектов в радиолокации и


радионавигации, как ясно из гл. 3, сводится к измерению параметров принимаемых
сигналов, отраженных или излученных объектом. Метод измерения координат
определяет, какой параметр подлежит измерению: время запаздывания, амплитуда,
частота, фаза. Оценив параметры сигнала, можно найти дальность, разность
дальностей, угловые координаты, радиальную и угловую скорости объектов.
Для обеспечения наивысшей точности измерения координат необходимо
оценивать параметры принимаемых радиосигналов оптимальным образом. Как и
задача обнаружения сигналов, задача измерения их параметров является
статистической, и ее оптимальное решение можно получить, использовав раздел
теории статистических решений — теорию оценивания * параметров.
Статистическая задача оценивания параметров сигнала ставится следующим
образом. Пусть в течение некоторого времени наблюдается случайный процесс y(t) -
смесь полезного сигнала и шума. Полезный сигнал зависит от неизвестных
параметров, значения которых не изменяются * на интервале наблюдения.
Параметры сигнала можно разделить на информативные и неинформативные.
Информативные параметры =(1, 2, ..., l) несут полезную информацию о
координатах и параметрах движения объекта и подлежат оцениванию. Примером
информативного параметра является время запаздывания отраженного от объекта
радиосигнала, по которому в активной радиолокации определяют наклонную
дальность. Неинформативные параметры =(1, 2,... ..., r) — мешающие и
оцениванию обычно не подлежат. Примером неинформативного параметра может
служить начальная фаза высокочастотного заполнения радиоимпульсов.
Оптимальное правило оценивания, как и оптимальное правило обнаружения,
определяется наилучшей в том или ином смысле решающей функцией , которая
отыскивается методами теории статистических решений. Оцениваемый параметр 
может принимать непрерывное или же дискретное множество значений . В
результате наблюдения на отрезке времени [0, Т] реализации y={y(t), 0  t T}
случайного процесса y(t) выносится решение d=(y), которое и используется в
качестве неизвестного значения параметра . При этом решение d называется
точечной оценкой или просто оценкой параметра .
Наблюдение протекает в непрерывном либо в дискретном времени.
Непрерывные случайные величины {y(ti)yi, i=1,..., n} описываются n-мерной
плотностью распределения вероятностей (y, ) (здесь и далее у=у1,..., yn)-
зависящей от информативных и неинформативных параметров сигнала. Так как
последние являются мешающими, то их влияние целесообразно исключить. Проще
всего это реализовать при байесовской постановке задачи, когда М - вектор
случайных величин, плотность распределения вероятностей которых (априорная
плотность) 0() известна. Тогда в соответствии с правилами теории вероятностей
можно вычислить
     у  ,   0    d1  d r       y,    d1  d    y  . (1.1)
М М
2

В результате плотность вероятностей (y) обусловлена только


информативными параметрами; зависимость от неинформативных параметров
исключается. Итак, в общей постановке статистическая задача оценивания
параметров сигнала сводится к оцениванию параметров распределения вероятностей
наблюдаемого процесса. Далее рассмотрим основные методы оценивания
скалярного параметра, затем обобщим их на векторный.
Байесовские оценки. Введем функцию потерь с(, d), характеризующую плату
за вынесение оценки d при условии, что истинное значение параметра равно . В
байесовской постановке задачи оценивания параметр  интерпретируется как
случайная величина, распределение вероятностей которой известно наблюдателю
(см. § 2.2). Минимизируя средний риск r (0, ) (см. (2.6)), или же апостериорный
риск ra(у, ) (см. (2.10)), можно найти байесовское решение а*=*(у) относительно
априорной плотности вероятностей 0():
r  0 ,  *   min r   0 ,  . (1.2)

Решение d* и будет оптимальной оценкой по байесовскому критерию, иначе -
байесовской оценкой параметра . Качество оптимальной оценки определяется
минимальным значением среднего риска, т. е. байесовским риском (2).
Чтобы приступить к отысканию байесовской оценки, необходимо
конкретизировать функцию потерь. Одной из наиболее употребительных функций
потерь является квадратичная:
c   , d     d  2 . (1.3)
В этом случае апостериорный риск (2.10)

ra  y,         y   2 y . 
Так как условное математическое ожидание суммы равно сумме условных
математических ожиданий и в силу свойств
 f  y  y   f  y    y  ,  f  y  y   f  y  , где f(-) – любая функция, имеем
ra  y ,      y   2  y    y    2  y .
2

Выделив в правой части этого равенства полный квадрат


  
ra  y,      y     y      2 y     y   ,
2 2

видим, что выражение, стоящее в фигурных скобках, не зависит от оценки. Поэтому
минимизировать по  нужно первый член. Этот член неотрицателен, причем
минимальное значение достигается, если он равен нулю. Следовательно
d *   *  y     y . .
Таким образом, байесовская оценка при квадратичной функции потерь представляет
собой апостериорное математическое ожидание оцениваемого параметра . В

дальнейшем эту оценку будем обозначать также.

Выразив апостериорное математическое ожидание через апостериорную
плотность вероятностей, имеем
^
   y     y d . (1.4)

При квадратичной функции потерь байесовский риск (2)



r ( 0, * )  M   ˆ 2 ,
3

Если d — оценка параметра , то разность (-d) есть ошибка оценивания. Так как для
любой оценки

 ^ 2
  d      ,
2 (1.5)

 
то можно говорить, что байесовская оценка при квадратичной функции потерь
оптимальна по критерию минимума среднего квадрата ошибки. Оценку (4)
называют байесовской среднеквадратической. Отметим также, что в соответствии
с (2.4)
^
     y    . (1.6)
Рассмотрим еще одну функцию потерь вида
c , d   c1     d  , (1.7)
где константа с1>0, а  — дельта-функция. В этом случае апостериорный риск
 c1     d   y    c1     d    y  d  c1    d y . .

Отсюда видно, что оценка d*, минимизирующая апостериорный риск, должна


максимизировать апостериорную плотность вероятностей (y) оцениваемого
параметра .
Таким образом, байесовская оценка при функции потерь вида (7) —
оптимальная по критерию максимума апостериорной плотности вероятностей или
максимальная апостериорная. Если максимум достигается во внутренней точке
области изменения параметра  и апостериорная плотность (y)
дифференцируема по , то максимальную апостериорную оценку можно найти,
решив уравнение (y)/ y=0. Обычно удобнее решать уравнение
 ln   y  /   0 (1.8)
(ln(y) достигает максимума при том же значении , что и (y)).
Оценка максимального правдоподобия. Неравенство Крамера — Рао. Если
оцениваемый параметр  является неслучайной величиной, то для отыскания оценки
используют небайесовские методы оценивания. Наибольшее распространение из
них получил метод максимального правдоподобия.
Плотность распределения вероятностей (y) наблюдений уY,
рассматриваемая как функция неслучайного параметра 
L     y   ,
называется функцией правдоподобия. Обратим внимание на то, что эта функция
зависит как от параметра , так и от реализации y=y1,..., уn наблюдаемого
случайного процесса. Оценкой максимального правдоподобия называется такая

точечная оценка d*=*(y) 
 м , для которой
4

^ 
L M   max L . (1.9)

  
Если максимум достигается во внутренней точке множества  и функция

правдоподобия дифференцируема по , то оценка  м является корнем уравнения
L()/=0 или
d ln L  / d  0, (1.10)
называемого уравнением максимального правдоподобия.

Отметим, что рассматриваемая оценка
 м введена эвристически и о ее
качестве ничего определенного пока что сказать нельзя (в отличие от байесовской
оценки (4), которая по сути дела получена минимизацией среднего квадрата
ошибки). Чтобы внести в этот вопрос некоторую ясность, рассмотрим одно важное
свойство точечных оценок.
Пусть d=(y) — оценка неслучайного параметра , математическое ожидание
которой может быть смещено относительно :
M ( y )    ( y ) ( y  ) dy    ( ) , (1.11)
Y

где () — смещение оценки. Если ()=0, т. е. если


  y    , (1.11а)
оценка (y) называется несмещенной. Из (11) следует, что
   y         y   dy  0.
Y

Дифференцируя по , получаем *
  y  
    y         
dy   1  '     y   dy  1  '   , (1.12)
Y Y

где '() =d()/d. Перепишем равенство (12) с учетом формулы


  y   /     y    ln   /  (4.13)
следующим образом:
 ln   y  
    y          y    y   dy  1  '  .
Y

Применим к этому соотношению неравенство Коши—Буняковского (см. (2.106)):
  ln   y   
2

   y          y   dy      y   dy  1   '    .
2 2

Y Y
 
Первый интеграл в этом выражении равен дисперсии оценки  (y):
  y        2    y    y   2  D y .
Таким образом, получаем неравенство
D  y  
1  '    2 , (1.14)
  ln   y   /  
2

которое называется неравенством Крамера—Рао. Если оценка является


несмещенной, неравенство Крамера—Рао принимает вид
5

1
D  y   . (1.15)
   ln   y   /  
2

Как видим, неравенства (14) и (15) определяют минимально возможные или


нижние границы дисперсий любых смещенных и несмещенных оценок
соответственно. Эти границы, т. е. правые части указанных неравенств, называют
границами Крамера— Рао. Их значения зависят от объема выборки у=у1,..., Уn и
плотности вероятностей (y).
Дисперсия оценки есть мера ее рассеяния относительно среднего значения
оценки, и при измерениях желательно использовать оценки с минимальными
дисперсией и смещением. Наилучшей, очевидно, будет несмещенная оценка,
дисперсия которой равна границе Крамера—Рао (т. е. правой части в (15)); такую

оценку назовем наиболее эффективной* и обозначим
 нэ .
Для сравнения различных оценок  (y) .(в том числе и оценок максимального

правдоподобия) с наиболее эффективной
 нэ вводят отношение их дисперсий

^
eff   y   D нэ / D  y   1/ ln  y   /   D  y ,
2 (1.16)

называемое эффективностью оценки (y). Чем больше это отношение, тем


предпочтительнее оценка. Очевидно, что для любых оценок (y) неслучайного
параметра  0eff((y)]l, причем eff(нэ)==l.
Обратимся к соотношению (15). Равенство в нем достигается, если неравенства
Коши - Буняковского для рассматриваемого случая переходят в равенство.
Последнее имеет место тогда, когда для всех yY и  
ln  y   /     y      .
где (-) — функция, не зависящая от y. Это равенство должно выполняться для

всех значений   , в том числе и для некоторой оценки  параметра , при
которой
ln  y   /     y        0.
 


      (1.17)
Функция (-) не зависит от y. Поэтому если существует оценка (y) при

которой (15) становится равенством, т. е. если существует (y)=  нэ , то, как следует
  
из (17), (y)=   нэ = , где  — решение уравнения максимального
 
правдоподобия, т. е.
 = . м

Таким образом, если существует наиболее эффективная оценка, то она


 
совпадает с оценкой максимального правдоподобия
 м.. В данном случае
 м .
оптимальна в том смысле, что она не смещена и ее дисперсия имеет наименьшее
возможное значение среди дисперсий любых оценок неслучайного параметра .
Однако если наиболее эффективной оценки не существует, то, вообще говоря,
нельзя утверждать, что оценка максимального правдоподобия оптимальна. В то же
6

время при выполнении не слишком ограничительных условий, накладываемых на


плотность (y) (см., например, [63, с. 361]), оценка максимального правдоподобия

* (y1, ..., yn) =  мn . асимптотически оптимальна, поскольку она состоятельна, т. е.
сходится по вероятности к истинному значению параметра
lim P  Mn       0
n 
для любого 0, и асимптотически наиболее эффективна:
lim eff  Mn   1
n 
Потенциальная точность измерения параметра. Приняв решение d=(y) за
оценку параметра , мы совершаем ошибку =(y)- . Достаточно общей и в то же
время удобной мерой качества оценивания является среднее значение квадрата
ошибки:
    2    y     2 . (1.18)
Эта мера используется как при байесовских, так .и при небайесовских оценках.
Следует только иметь в виду, что математическое ожидание в (18) для указанных
оценок вычисляется по-разному.
При байесовском подходе -случайная величина. Поэтому усреднение
осуществляется по y и :
   y     2      y     2   y   0   dyd ,
Y

где 0(y)—априорная плотность вероятностей параметра . При небайесовской


оценке параметр  неслучайный и поэтому усреднение осуществляется только по y:
  y     2      y     2   y   dy.
Y
От меры (18) всегда можно перейти к величине
    2     y     2 , (1.19)
имеющей ту же размерность, что и оцениваемый параметр. Если —неслучайный
параметр, а (y)—его несмещенная оценка ()=0, то мера (19)-
среднеквадратическая ошибка оценивания. При ()0 мера точности оценивания
(19) представляет собой полную ошибку, учитывающую смещение оценки (см.(1.8)).
Заметим, что если смещение оценки (y) известно наблюдателю, а это может быть
только тогда, когда смещение не зависит от неизвестного параметра , т. е. (), то
путем вычитания  всегда можно перейти к несмещенной оценке (y) — .
Отметим также, что для байесовских оценок понятие несмещенности,
определенное формулой (11 а), смысла не имеет, так как  - случайная величина;
можно говорить лишь о несмещенности в среднем, т. е. в смысле равенства (6). Тем
не менее термин «среднеквадратическая ошибка» сохраняют за мерой (19) и для
байесовских среднеквадратических оценок.
Если оценка (y) оптимальна, т. е. (y) = *(y) ,то величина (19) определяет
потенциальную точность измерения параметра, т. е. точность измерения, которая
может быть достигнута только при оптимальном построении измерителя. Так как
оценка может быть оптимальной по различным критериям, то и потенциальная
точность, определяемая в среднеквадратическом смысле (19), будет, вообще говоря,
разной.
В классе байесовских оценок наивысшей потенциальной точностью, как
7

следует из соотношения (5), обладает байесовская среднеквадратическая оценка (4).


В классе небайесовских оценок наивысшей точностью, как ясно из предыдущего,
будет обладать оценка максимального правдоподобия, если существует наиболее
эффективная оценка. Кроме того, как следует из асимптотических свойств оценки
максимального правдоподобия, эта оценка почти всегда асимптотически имеет
наивысшую потенциальную точность.
Возникает естественный вопрос, какую из возможных оценок нужно
использовать при решении практических задач измерения параметров
радиосигналов. Если неизвестный параметр сигнала можно представить в виде
случайной величины с известным распределением вероятностей, то целесообразно
использовать байесовские оценки, и в частности байесовскую
среднеквадратическую оценку, заведомо обладающую наивысшей потенциальной
точностью.
Однако неизвестный параметр не всегда можно рассматривать как случайную
величину с известным распределением вероятностей. В ряде задач, особенно при
отсутствии необходимой априорной информации, более адекватным является
представление неизвестного параметра сигнала в виде действительной неслучайной
величины. При этом целесообразно использовать небайесовские оценки, и в
частности оценку максимального правдоподобия. Отметим, что в асимптотике, т. е.
при увеличении объема выборки (n), безразлично, какую из рассмотренных
оценок применять, поскольку, как доказывается в математической статистике,
байесовские оценки и оценка максимального Правдоподобия асимптотически
эквивалентны.
Для выявления взаимосвязи байесовской оценки и оценки максимального
правдоподобия при любом конечном объеме выборки воспользуемся формулой
Байеса (2.8). Подставив (2.8) в уравнение (8), получим
ln  y   /   ln  y   /   ln 0   /   0.
Отсюда видно, что если ()/=0, то байесовская оценка по критерию
максимума апостериорной плотности вероятностей и оценка максимального
правдоподобия совпадают. Последнее равенство иногда интерпретируют как
условие, при котором количество априорной информации об оцениваемом параметре
равно нулю.
В дальнейшем при решении задач оценивания параметров радиосигнала,
постоянных на интервале наблюдения, будем применять метод максимального
правдоподобия. При оценивании меняющихся со временем параметров будем
использовать байесовский подход (§ 4.3).
Под потенциальной точностью измерения неслучайного параметра 
радиосигнала в дальнейшем будем понимать наименьшее значение
среднеквадратической ошибки  которое определяется границей Крамера—Рао (см.
15)):
2 2
     
 2  1 /   ln  y    ,    1 /   ln  y    . (1.20)
     
Расчет потенциальной точности по этим формулам обычно упрощается, если
воспользоваться соотношением
2
   2
 ln  y      ln   y  . (1.21)
    2
8

Для доказательства его продифференцируем обе части равенства Y  ( y  )dy  1


по  и учтем формулу (13). В результате
  y   
 dy     y   ln   y   dy  0.
Y
 Y

Снова дифференцируя по :
  y    2
 ln   y   dy     y   ln   y   dy  0
Y
  Y  2
и, используя (13), получаем
2
    2 
   ln   y      y   dy    2
ln   y     y   dy  0,
Y Y   
что и доказывает соотношение (21).
При расчете потенциальной точности измерения необходимо знать плотность
вероятностей смеси сигнала и шума (y)(y,  =1). Если теперь (y  =1) —
плотность вероятностей одного шума, то статистика
 y      y  ,  1 /   y   0     y   /   y   0  (1.22)
есть условное отношение правдоподобия. Так как плотность вероятностей шума
(y  =1) не зависит от параметра , то
 
ln   y    ln   y   ,
 
при этом соотношения (20) (с учетом (21)) эквивалентны формулам
2 2
 2  1 /  ln  y   ,    1/   ln  y   . (1.23)
 2  2
В результате при расчете потенциальной точности измерения для конкретных
моделей сигнала и шума можно воспользоваться соответствующими выражениями
для условных отношений правдоподобия, полученными в гл. 2.
Итак, рассматриваемая среднеквадратическая ошибка ста зависит от объема
(длительности) наблюдений у=у1,..., yn и от их плотности вероятностей (y). Она,
вообще говоря, может зависеть и от значения оцениваемого параметра. Поэтому в
общем случае при расчете потенциальной точности измерения входящие в формулы
(20) .и (23) производные должны вычисляться в точке =0, где 0—истинное
значение оцениваемого параметра:
2 2
 2  1 /  ln  y     0 ,   1/   ln  y     0 . (1.24)
 2  2

у Формирова- L() Схема ˆМ y ˆМ


тель ф-ции выбора ln  ( y  ) max ln  ( y  )
правдопо- максимума  
добия
а) б)
Рисунок 1.1. Структурные схемы оптимальных измерителей
9

Структурные схемы измерителей. Схема оптимального измерителя параметра



, реализующего оценку максимального правдоподобия  м , может быть
представлена согласно (9) в виде схемы на рис. 1.1,а. Первый блок, на вход которого
поступает реализация смеси сигнала .и шума, формирует функцию правдоподобия
L(), второй блок отыскивает максимум этой функции по всей области изменения
параметра . На выходе измерителя имеем значение параметра, при котором
функция правдоподобия максимальна.
Максимизация функции правдоподобия для отыскания оценки эквивалентна
максимизации условного отношения правдоподобия (22) (или его логарифма). При
этом уравнение
 ln   y   /   0 (1.25)
эквивалентно уравнению максимального правдоподобия (10). В результате
оптимальный измеритель можно представить также в виде схемы на рис. 1.1,б. Это
позволяет при синтезе оптимальных измерителей параметра сигнала опираться на
результаты синтеза оптимальных обнаружителей сигналов.
Пути технической реализации оптимального измерителя, показанного на рис.
4.1, могут .быть различными. Наиболее общий путь сводится к следующему. Пусть 
(область значений параметра ) представляет собой отрезок прямой с граничными
точками max и min. Разобьем этот отрезок на несколько отрезков точками i, i=1, 2,...,
m, положив min=l<2<…<i< ... <m=max.

( у 1 )

Схема i
( у  2 ) Выбора
максимума

( у  m )

Рисунок 1.2. Структурная схема многоканального измерителя

Условное отношение правдоподобия (y), являющееся функцией


непрерывного параметра , аппроксимируется в этом случае совокупностью
условных отношений правдоподобия {(yi), i=l,...,m}. В результате приходим к
многоканальному измерителю (рис. 1.2). Каждый из каналов формирует условное
отношение правдоподобия для фиксированного значения параметра , т. е. для
значений i(i=l, ... , m). Схема выбора максимума определяет номер канала с
максимальным выходным эффектом.
Если окажется, что (yi)> (yj) для всех j=1, ..., m, ji, то за оценку
параметра  принимается значение i.
Заметим, что в каждом из каналов вместо условного отношения правдоподобия
можно формировать логарифм условного отношения правдоподобия. Отметим
10

также, что если бы параметр  был дискретным, принимающим m возможных


значений, схема на рис. 1.2 была бы оптимальной в смысле максимума функции
правдоподобия. При непрерывном параметре эта схема является квазиоптимальной.
Однако при увеличении числа каналов она неограниченно приближается к
оптимальной, поскольку точность аппроксимаций условного отношения
правдоподобия (y) совокупностью {(yi), i=1,...,m} при увеличении m растет
и в пределе при m получаем функцию непрерывного параметра.
Число каналов m многоканального измерителя можно определить, задавшись
допустимым снижением точности измерения но сравнению с потенциальной
точностью. В радиолокационных измерителях число каналов обычно выбирают с
учетом .разрешающей способности РЛС  по измеряемому параметру : m= =(max
—min)/ . Это число каналов является, вообще говоря, минимальным; на практике
его обычно увеличивают, чтобы обеспечить необходимое перекрытие каналов.
Рассмотрим другой путь реализации измерителя (см. рис. 1.1). Для этого
разложим ln (y) в ряд Тейлора в окрестности некоторой опорной точки оп,
лежащей вблизи истинного значения параметра . Если разность оп— достаточно
мала, то можно ограничиться первыми тремя членами ряда:
 
ln   y    ln  y  ОП     ОП 


ln   y     ОП 


1
   ОП  2  2 ln  y     ОП
2 
Подставив это выражение в (25), получим уравнение максимального правдоподобия
  
ln   y    ln   y     ОП     ОП  2 ln   y     ОП  0,
   2
из которого находим оценку
1
  
 2
 
 M   ОП  ln   y     ОП   2 ln  y     ОП 
 . (1.26)
   
Согласно (26) синтезированный измеритель представляет собой по существу
оптимальный дискриминатор (рис. 1.3,а), формирующий ошибку рассогласования

р=оп-  м , называемую также сигналом ошибки. Для его работы необходимо иметь
опорное значение параметра оп, близкое к истинному значению параметра . Это
опорное значение можно найти в результате параллельного поиска, который
реализуется многоканальной схемой, либо последовательным во времени поиском
по всей области возможных значений параметра . В последнем случае должна
быть предусмотрена перестраиваемая в области в схема поиска, включающая в себя
обнаружитель сигнала. На выходе этого устройства формируется опорное значение
оп, лежащее в окрестности истинного значения параметра . Последовательный
поиск проигрывает во времени параллельному, однако проще в технической
реализации, так как не требует многоканальных устройств.
Когда флуктуации 2 (рис. 1.3,а) не слишком велики, схему оптимального
дискриминатора можно упростить, заменив случайную величину ее математическим
ожиданием:
2 2
2  ln  y     ОП   ln y     ОП . (1.27)
 2  2
При этом значение 2 вычисляется заранее и вводится в схему дискриминатора
(рис. 1.3,б) в виде постоянного весового коэффициента*.
11


Если сигнал ошибки р=оп—  м подать на цепи сглаживания и управления и
замкнуть обратную связь, подав управляющее воздействие в виде опорного значения
параметра оп на дискриминатор, то получим следящий измеритель (рис. 1.4).

Напомним, что при отыскании оценки максимального правдоподобия
 м

предполагалось, что параметр  не меняется на интервале наблюдения [0, Т]. Однако


если это не так и оцениваемый параметр изменяется во времени, то измеритель,
представленный на рис. 1.4, будет следить за изменением параметра, уменьшая
ошибку рассогласования р. При этом соответственно изменяется опорное значение
оп(t), которое и может .служить оценкой величины (t).

д
ln  ( y  ) оп
д
д
оп
ln  ( y  ) оп
д
1
у оп 2  оп  ˆм у 1 д  оп  ˆм
ln  ( y  ) оп
 2 д
д2
ln  ( y  ) оп
д 2

а) б)
Рисунок 1.3. Структурные схемы дискриминаторов

у Дискрими- р Цепи оп


натор сглаживания
и управления

Рисунок 1.4. Структурная схема следящего измерителя

В рассматриваемом следящем измерителе синтезирован пока что


дискриминатор (см. рис. 1.3). Что же касается синтеза цепей сглаживания
(фильтрации), то он может быть проведен отдельно от синтеза дискриминатора
путем минимизации среднего квадрата ошибки М[(t)-оп(t)]2. Следящую систему
измерения можно синтезировать и более строгим методом, не привлекая
эвристически введенную процедуру раздельной оптимизации операций
дискриминирования (выделения сигнала ошибки) и сглаживания, а оптимизируя всю
систему в целом. Для этого уже на начальном этапе синтеза необходимо задать
математическую модель переменного параметра (в виде некоторого случайного
процесса (t)) и затем воспользоваться теорией оценивания случайных процессов
(см.§4.3).
Оценивание векторного параметра. На практике нередко возникает
необходимость оценивать несколько параметров радиосигнала. Так, в радиолокации
часто требуется измерять дальность до объекта и одновременно скорость его
движения. В связи с этим рассмотрим кратко статистическую задачу оценивания
12

векторного параметра и приведем результаты, непосредственно обобщающие


изложенную теорию оценивания.
Пусть плотность распределения вероятностей (y) наблюдений y (смесь
сигнала и шума) зависит от векторного параметра =(1, 2, ..., l;). Необходимо
по результатам наблюдения y оценить каждую компоненту вектора . На языке
теории статистических решении это означает, что нужно с использованием
векторной решающей функции = (1,..., l) вынести векторное решение d=(d1, ...,
dl) :d= (y), т.е. d1=1(y), ..., dl=l(y), которое и будет оценкой вектора .
В байесовской постановке задачи оценивания вектор  является случайным,
априорная плотность вероятностей которого0() известна наблюдателю. Введем
скалярную функцию потерь с(, d), характеризующую плату за вынесение оценки d
векторного параметра . Аналогично (2.6) запишем средний риск
r   0 ,    c ,   y      c ,   y    y   0   dyd .
Y

Путем минимизации среднего риска или же апостериорного риска


ra  y ,     c ,   y   y   c ,   y    y   d ,

где (y) — апостериорная плотность вероятностей параметра , найдем


байесовское решение d*=*(y):
 
r  0 ,  *  min r   0 ,  .

Вектор d*=(d*1, ..., d*l)— оптимальная оценка параметра .
Рассмотрим квадратичную функцию потерь
l
c  , d     i  d i  2 ,
i 1
являющуюся сумой квадратов ошибок оценивания. Апостериорный риск
l
ra  y,       i   i  y   2
 l
 
y      i   i  y   2 y .
 i 1  i 1
Минимизация этого выражения осуществляется аналогично предыдущему. В
результате получаем

d i*   i*  y    i    i y     i  y  d , i  1,  , l. (1.28)


Таким образом, оптимальная векторная оценка
 параметра  есть
 
апостериорное математическое ожидание:
 =М(y). Каждая из компонент
 i

  
вектора
  =( i ,...,
 l) является оптимальной оценкой соответствующего
скалярного параметра i. Эти компоненты вычисляются по формуле (28), которую
после интегрирования по всем параметрам, кроме i, можно записать в виде
 i    i   i y  d i ,
i

где i — область определения i, a (iy) – апостериорная плотность вероятностей


скалярного параметра i.
13


Качество векторной оценки
 характеризуется минимальным средним риском
2
 
l
  
r 0 , *
   i   i  ,
i 1  
который, как видим, равен сумме средних квадратов ошибок оценивания
компонент i(i=1,...,l).
  
Рассмотрим теперь оценку максимального правдоподобия
 м

=( 1м ,...,
 lм )
секторного неслучайного параметра =(1,..., l). Эта оценка находится из
условия максимума функции правдоподобия L()=(y), т. е.
 
L M   max L  .
   
Как и при скалярном параметре, для отыскания оценки максимального
правдоподобия можно максимизировать логарифм функции правдоподобия. Если
максимум достигается внутри множества  и функция правдоподобия
 
дифференцируема по всем параметрам 1, .... l, то векторная оценка (  , ...,

 lm )
находится путем решения системы уравнений максимального правдоподобия:
 ln L  /  i  0, i  1, , l. (1.29)
Потенциальные точности измерения можно определить с помощью системы
неравенств, дающих нижние границы для дисперсий любых несмещенных оценок
di=i(y) неслучайных параметров i:
 i  y    i  2  D i  y    ii2 , i  1,  , l. (1.30)
Здесь ii2(i=l,...,L) — диагональные элементы матрицы I-1, обратной информационной
матрице Фишера I, элементы которой
     2 
I ij    ln   y   ln   y       ln   y   . (1.31)
  i  j    i  j 
Система неравенств (30) обобщает неравенство Крамера—Рао (15) на
векторный параметр. Для наиболее эффективных оценок неравенства (30)
переходят в равенства. При этом если существуют такие оценки, то они являются
  
оценками максимального правдоподобия
 =(
м
 ,...,

 lм). Кроме того, при
 
довольно общих условиях оценки (
 1м,…,
 lм ) асимптотически (при увеличении
объема n выборки у=у1, ..., yn) наиболее эффективны. Это позволяет определить
потенциальные точности измерения   i . компонент векторного параметра 
формулой
  i   ii2 , (1.32)
дающей наименьшие значения среднеквадратических ошибок.

1.2. ОЦЕНИВАНИЕ ПАРАМЕТРОВ СИГНАЛА НА ФОНЕ БЕЛОГО


ШУМА
Применим изложенные методы к задаче оценивания неслучайного параметра
14

 сигнала s(, t) (s—детерминированная функция), наблюдаемого в течение


времени Т на фоне белого гауоссовского шума (t) со спектральной плотностью
No/2. Наблюдаемый процесс
y  t   s  , t     t  , 0  t  T . (1.33)
В дальнейшем будут рассмотрены также задачи, когда сигнал зависит от случайных
неинформативных параметров.
Оценки параметров сигнала будем искать методом максимального
правдоподобия. Для этого нам потребуется условное отношение правдоподобия (y|
). Как следует из гл. 2, применительно к рассматриваемой задаче условное
отношение правдоподобия

 2
T
1
T 

  y    exp  y t  s , t  dt  N 0  s 2
  , t  dt . (1.34)

 N0 0 0 

Параметры сигнала можно разделить на энергетические, для которых равенства
s(, t)=0 следует =0 и наоборот, и неэнергетические, для которых указанное условие
не выполняется. Энергетический параметр определяет энергию радиосигнала
T
E     S 2 ( , t ) dt . От неэнергетического параметра энергия сигнала, как правило, не
0
зависит, и поэтому в формуле (34) второе слагаемое под знаком экспоненты при
фиксированном Т является константой. Амплитуда и длительность радиосигнала
являются энергетическими параметрами, а фаза, частота и время запаздывания—
неэнергетическими.
Оценка амплитуды. Рассмотрим сигнал
s a, t   as1  t  , 0  t  T , (1.35)
где s1(t) - детерминированная функция времени, а неизвестным параметром является
амплитуда: =а. Условное отношение правдоподобия (34) в этом случае

 2a
T
a2
T

  y a   exp  y t  s1  t  dt   s1  t  dt .
2
(1.36)

 N0 0
N0 0 

а уравнение максимального правдоподобия (25)


T T
 2 2a
ln   y a    y t  s1  t  dt   s1  t  dt  0.
2
a N0 0
N0 0
Решением этого уравнения является оценка максимального правдоподобия
 T T

 y t  s1  t  dt  s1  t  dt .
2
aM  (1.37)
0 0
Отсюда видно, что оптимальный измеритель амплитуды сигнала (35) может быть
реализован с помощью коррелятора или же линейного фильтра.
Вычислив математическое ожидание оценки с учетом (2.34)
 T T
 a M     as1  t     t   s1  t  dt  s1  t  dt  a,
2

0 0
видим, что оценка амплитуды является несмещенной. Дисперсия оценки
 2 2 2
      
D a M    a M   a M    a M  a     a M   a 2 
     
2
T  TT
   s12  t  dt     y  t ' y  t ' ' s1  t ' s1  t ' ' dt ' dt ' '  a 2 .
 0  00
15

Подставляя сюда выражение (33) с учетом (35), используя соотношение (2.34) и


фильтрующее свойство дельта-функции, находим
 T
D a M  N 0 2  s12  t  dt .
0
Вычислим теперь границу Крамера—Рао. Подставляя (36) в (23), получаем
1

 
2  2a T
a2
T  
T
 a2   2   1
y  t  s  t  dt   s1
2
 t  dt   N 0 2  s12  t  dt .
 a
  N 0 0
N0 0  
 0

В результате оказалось, что D =2a, т. е. оценка амплитуды (37) является
a м

наиболее эффективной.
Потенциальная точность измерения амплитуды
T
a  N 0 2  s12  t  dt ,
0

T
при этом a a 1 2E N 0 , где E  a 2  s12  t  dt - энергия сигнала.Таким образом,
0
относительная погрешность измерения амплитуды сигнала обратно
пропорциональна отношению сигнал-шум по напряжению.
Оценка неэнергетического параметра. Условное отношение правдоподобия
(34) при неэнергетическом параметре
 E   2 T 
  y    exp  0  exp   y  t  s   , t  dt , (1.38)
 N0   N 0 0 
T
где E   s 2 ( , t )dt - энергия сигнала. Первый блок оптимального измерителя (см.
0
рис.1.1,6) формирует корреляционный интеграл
T
z     y t  s , t  dt , (1.39)
0

а второй блок отыскивает в области  его максимальное значение z(  м ), тем самым
определяя оценку максимального правдоподобия м. Уравнение (25) в
рассматриваемом случае имеет вид z()/=0.
На вход измерителя поступает процесс
y  t   s  0 , t     t  , (1.40)
где о—истинное значение оцениваемого параметра. На выходе коррелятора
согласно (39) и (40) имеем
T T
z     s  0 , t  s  , t  dt     t  s  , t  dt.
0 0
Первое слагаемое зависит от рассогласования по измеряемому параметру
опорного сигнала S(,t) коррелятора и принимаемого сигнала S(о, t). Поэтому
интеграл
T
  0 ,    s  0 , t  s  , t  dt (1.41)
0

называют функцией рассогласования сигнала по параметру . Если оценивается


16

время запаздывания сигнала  (т. е. =), то (41) переходит в автокорреляционную


функцию сигнала. Введем также нормированную функцию рассогласования:
T
  0 ,    s  0 , t  s  , t  dt E . (1.42)
0
Сигнал на выходе коррелятора и функция (42) будут максимальными при
отсутствии рассогласования, т. е. при =о, при этом (о, о)=l.
Построить одноканальный корреляционный измеритель в принципе возможно,
но практически неудобно, так как требуются запоминание (запись) принимаемой
реализации {y(t), 0tT} и ее перемножение на опорное колебание S(,t)
последовательно для разных значений , перекрывающих область ; результаты
перемножении интегрируются в течение времени Т, и затем отыскивается

максимальное значение z(
 м ). Такая процедура требует больших затрат времени.
От этого недостатка свободен многоканальный измеритель (см. рис. 1.2), схема
которого для рассматриваемого случая показана на рис. 1.5,а.
Каждый канал формирует соответствующее значение корреляционного
интеграла
T
z  i    y t  s i , t  dt , i  1,  , m. (1.43)
0

Опорные сигналы S(i,t) (t=1,..., m), подаваемые на умножители, должны


перекрывать весь диапазон возможных значений параметра . Число каналов m
выбирают из тех же соображений, что и в общей схеме на рис. 1.2.
Многоканальный измеритель можно реализовать и в фильтровом варианте (рис.
1.5,б). В этом случае корреляторы заменяются согласованными фильтрами.

Т
СФ1
 z(1) z(1)
0
i
y(t) S(1,t) i y(t) СВМ
CВМ

Т
z(m) z(m)
 СФm
0

S(m,t)
а) б)

Рисунок 1.5. Структурные схемы корреляционного (а) и фильтрового (б)


многоканальных измерителей

Импульсная характеристика согласованного фильтра в i-м канале, как следует из


(43), согласована с формой сигнала, являясь ее зеркальным отображением
hi(t)=S(i, T — t).
Конкретизируем теперь общую схему дискриминатора (рис. 1.3,6) для
рассматриваемой задачи. Заменив производную
17
T
 2 
ln   y     ОП   y t  s , t  dt  
 N 0  0
ОП

конечной разностью
2    
T T
   
  y  t  s ОП  , t dt   y  t  s ОП  , t dt  
N 0  0  2  0  2  
и опустив весовой коэффициент, представим дискриминатор в виде двухканального
коррелятора с расстроенными на  каналами, выходы которых присоединены к
схеме вычитания (рис. 1.6). Подав выходной сигнал дискриминатора на цепи
сглаживания и управления и замкнув обратную связь, получим следящий
измеритель.


0

y(t) s( оп  , t)
2

s ( оп  , t)
2


0

Рисунок 1.6. Структурная схема дискриминатора

 Оценка
0 Цепь
s(t   0 )   t задержки
сглаживания
Т


0

Генератор Схема
селекторного регулируемой Опорный
 импульса задержки

s (t   оп  ) импульс
2

s (t   оп  )
2

Рисунок 1.7. Структурная схема следящего измерителя времени запаздывания


сигнала

Например, следящий измеритель времени запаздывания сигнала (=) можно


представить в виде схемы на рис. 1.7. Оценка времени задержки снимается в виде
напряжения с выхода цепи сглаживания, в качестве которой может быть
использована, например, интегрирующая цепь. На схему регулируемой задержки
поступает опорный импульс, который запускает генератор селекторного (следящего)
18

импульса. На умножители подаются два селекторных импульса, задержанных


относительно друг друга на . Напряжение на выходе схемы вычитания
пропорционально временному рассогласованию (о—on) принимаемого сигнала S(t
—о) и селекторных импульсов. Управляющее напряжение, снимаемое с цепи
сглаживания, изменяет положение селекторных импульсов так, что временное
рассогласование уменьшается. При изменении задержки сигнала о, т. е. при
изменении дальности до цели, временное положение селекторных импульсов
соответственно меняется, в результате происходит автоматическое сопровождение
цели по дальности.
Определим теперь потенциальную точность измерения параметра. Согласно
(24), (38) имеем
T
2 2
 2   1
N0

 2
 y t  s , t  dt   0
.
0
Подставляя в это соотношение наблюдаемую величину (40), учитывая
2 2
равенство M(t)=0 и (41), получаем  2
e=-1/
N 0  2
 ( 0 ) =0. Заменив (0, )
нормированной функцией рассогласования (42), имеем
2E  2
 2   1   0 ,     0 .
N 0  2
Таким образом, потенциальная точность измерения параметра
2E  2
   1    0 ,      0 . (1.44)
N 0  2

A(t ) cos 0 t   (t )  1 

  

A(t ) cos 0 t   (t )   m 
Т


0

Т i
y(t)  СВМ
0


0

Рисунок 1.8. Структурная схема многоканального корреляционного измерителя


фазы радиосигнала
19

Как видим, среднеквадратическая ошибка обратно пропорциональна


отношению сигнал-шум и зависит от кривизны нормированной функции
рассогласования в ее максимуме.
В качестве примера рассмотрим радиоимпульс S(, t)=А(t)cos[ot+(t)- ], с
неизвестной начальной фазой , где A(t), (t) —законы амплитудной и фазовой
модуляции соответственно, являющиеся детерминированными функциями; o —
известная частота.
Конкретизация общей схемы многоканального корреляционного измерителя
(см. рис. 1.5,а) приводит к схеме на рис. 1.8. Штриховой линией обведена
фазосдвитающая цепочка, каждое звено которой осуществляет сдвиг фазы на .
Если фаза измеряется в диапазоне 0 ... 2, то число каналов m=2/. Величина 
и, следовательно, число каналов могут определяться допустимой потерей точности
измерения по сравнению с потенциальной точностью или допустимой потерей в
отношении сигнал-шум. Если, например, использовать всего шесть каналов, то, как
показывает расчет, потери в отношении сигнал-шум составят 8 %.
Вычислим потенциальную точность измерения фазы. В этом случае
нормированная функция рассогласования (42)

T
1
  0 ,    A  t  cos 0 t    t    0  cos 0 t    t    0  dt 
2
E 0

A t
T 2
1
  cos      cos 2 0 t  2  t    0    dt 
E 0
2
A2  t 
T
1
  cos     dt  cos  0   .
E 0
2
Так как 2cos(o—)/2=-1, то согласно (44)
  1 2E N 0 . (1.45)
Таким образом, среднеквадратическая ошибка , характеризующая потенциальную
точность измерения фазы частотного заполнения радиоимпульса, обратно
пропорциональна отношению сигнал-шум по напряжению и не зависит от вида
амплитудной и фазовой модуляции.
Оценка времени запаздывания сигнала со случайными начальной фазой и
амплитудой. Радиолокационные и радионавигационные сигналы кроме
информативных параметров содержат и неинформативные. К последним обычно
относятся начальная фаза высокочастотного заполнения радиосигнала и его
амплитуда. Поэтому практически важную задачу оценивания времени запаздывания
радиосигнала рассмотрим, использовав модель сигнала со случайными начальной
фазой  и «амплитудой» а:
s , a,  , t   2aA t    cos 0  t       t      ,
(1.46)
0  t   T
(нормировочный коэффициент 2 введен для удобства записи дальнейших
соотношений).
Законы амплитудной A(t—) и фазовой (t—) модуляции зависят от
информативного параметра —времени запаздывания сигнала, по которому
определяется дальность R (см. (3.1), (3.2)). Обратим внимание на то, что в
20

рассматриваемой постановке задачи информативный параметр  является


неизвестной неслучайной величиной (в отличие от модели (2.79)), а
неинформативные параметры а и  — случайными величинами. При этом, как и в
задаче обнаружения, считаем, что амплитуда сигнала распределена по закону Рэлея
(2.72), а начальная фаза—по равномерному закону (2.61). При такой постановке
задачи для отыскания функции правдоподобия (у|) нужно воспользоваться
соотношением типа (1), что эквивалентно отысканию условного отношения
правдоподобия (у|) путем усреднения условного отношения правдоподобия (у|,
а, ) при фиксированных значениях а и  по формуле
 2
 y       y  , a,   0  a  0    dda
0 0
(ср. с (2.73)). Воспользовавшись выражением для отношения правдоподобия (2.75),
получим

A t   1  cos 0  t   1     t   1  

  

Χ
Т

 z1 ( 1 )
0

/2 z12 ( 1 )  z 22 ( 1 )
z12 ( 1 )  z 22 ( 1 )

z 2 ( 1 )
Χ
Т
z1 ( 1 ) 
0
i
СВМ

A t   m  cos 0  t   m     t   m  

Х 
0
z1 ( m )

/2 z12 ( 1 )  z 22 ( 1 )

Х
Т

 z 2 ( m )
0
21

a)

у(t) ˆ м
CФ АД СВМ

б)
Рисунок 1.9. Структурные схемы корреляционного (а) и фильтрового (б)
измерителей времени запаздывания сигнала со случайными начальной фазой и
амплитудой

N0  2 a2 z 02    
 y    exp , (1.47)
N0  E  N 0 N 0  E   
где
z 0    z12     z 22    (1.48)
— огибающая корреляционного интеграла, квадратурные составляющие
которого
T
z1     2  y  t  A t    cos 0  t       t     dt ,
0
T
(1.48а)
z 2    2  y  t  A t    sin  0  t       t     dt ;
0
E —усредненная энергия сигнала (см. (2.76)). Максимально правдоподобная оценка

 м времени запаздывания , как следует из (25) и (47), является решением


уравнения z2o()/=0.
Схема многоканального измерителя применительно к рассматриваемой задаче
показана в корреляционном варианте на рис. 1.9,а. Каждый .из m каналов этого
измерителя в свою очередь, состоит из двух квадратурных каналов, на которые
подаются опорные колебания, сдвинутые по фазе на /2. Запаздывание  между
отводами линии задержки выбирается в соответствии с разрешающей способностью
РЛС по времени запаздывания , которая, в свою очередь, определяет
разрешающую способность по дальности R (см. 6.3). При этом минимальное число
каналов m определяется заданным диапазоном изменения дальности
22

Rmax  Rmin : m   Rmax  Rmin   R .

Рисунок 1.10. Диаграмма выбора максимума видеосигнала в фильтровом


измерителе

Отметим, что каждую пару квадратурных каналов можно заменить


согласованным фильтром с последующим амплитудным детектором. В результате
такой замены придем к многоканальному фильтровому измерителю. Однако
специфика оцениваемой величины , являющейся временным параметром,
позволяет в фильтровом варианте схемы ограничиться лишь одним каналом (рис.
1.9,б) (как и в задаче обнаружения, см. § 2.5), на выходе которого с течением
времени последовательно формируется z0() для всех возможных значений задержки
сигнала . Необходимость амплитудного детектора, выделяющего огибающую
корреляционного интеграла z0(), обусловлена незнанием начальной фазы сигнала.

Так как величина z0() максимальна при том же значении  , что и монотонная
м

'функция f(z0()), то детектор может иметь любую монотонную на интервале z0>0


амплитудную характеристику, т. е. быть линейным, квадратичным,
логарифмическим и т. д. Максимум отыскивается например, следующим образом.
Сигнал с выхода детектора ограничивается снизу на уровне ho, чтобы отсечь
шумовые выбросы (рис. 1.10,а). Затем он дифференцируется (рис. 1:10,б),
усиливается и ограничивается (рис. 1.10,е) и запускает генератор, формирующий
импульс, фронт которого совпадает с положением максимума сигнала о (рис.
1.10,г).
Момент, при котором огибающая корреляционного интеграла максимальна,
можно определять также путем фиксации моментов пересечения сигналом
порогового уровня (рис. 1.10,а). При симметричном сигнале о=(1+2)/2. Более
простой способ связан с фиксацией только момента 1. Получаемую при этом
систематическую ошибку (о—1) можно исключить, если поддерживать амплитуду
сигнала постоянной (с помощью АРУ).
Для обеспечения автоматического слежения за положением максимума сигнала
23

необходимо выход детектора в схеме на рис. 1.9,б подсоединить ко входу схемы на


рис. 1.7, иначе говоря, заменить схему выбора максимума следящим измерителем
времени запаздывания видеосигнала.
Вычислим теперь потенциальную точность измерения времени запаздывания
сигнала. Для дальнейших расчетов удобно перейти к комплексному представлению
рассматриваемых процессов и величин. Прежде всего запишем сигнал (46) в виде
действительной части комплексного сигнала:
~
s   , a,  , t   2 Re a ~A  t    exp j 0 t  ,
a  a exp  j ( 0   ) - комплексная случайная величина (о и —неслучайные
~
величины), для которой
a ~  0,  a ~a
~*   a ~ 2   a 2  2 2 , (1.49)
~
а A t     A t    exp j  t    . - комплексная огибающая сигнала.
Рассмотрим комплексную огибающую наблюдаемого процесса
yt  a
~ ~A ~
 t     ~  t  , где ~ (t ) комплексный белый шум [51]:
~ ~ ~
   t   0,    t ' *  t ' '  N 0  t 't ' '. (1.50)
Далее введем комплексный корреляционный интеграл*

~
z t 
~ y  t  A *  t    dt.
~ (1.51)


Тогда огибающую корреляционную интеграла (48) можно представить в виде модуля


комплексного корреляционного интеграла

~
z 0    ~
z    y  t  A *  t    dt .
~ (4.52)


При этом условное отношение правдоподобия (47) приобретает вид


N0  2 2 z   2 
 y    exp . (1.53)
N0  E  N 0 N 0  E   
Для расчета потенциальной точности измерения в соответствии с (23)
необходимо вычислить величину
I    2 ln   y    2 . (1.54)
Дифференцируя ln(y), имеем
z   ~ * z *   


ln   y    k
 ~

z  
2
k


 ~ ~*  ~
z   z    k   z    ~
z  
~

   
 z *   
~
z  
 2k Re  ~ ,
  
где константа

k  2 2 N 0 N 0  E ,  (1.55)
Повторное дифференцирование дает
2 z    ~
 ~ z *   ~  2 ~ z *   
ln   y    2k Re   z   . 
 2     2 
Подставив в эту формулу выражение (51) и взяв математическое ожидание,
получим
24
~ ~
A *  t '  A t ' ' 
 
  

I  2k Re     ~ y  t ' ~
y *  t ' ' dt ' dt ' ' 

       
~
 2 A t ' ' 
 
  
~ 
   A *  t '  2
 ~y  t ' ~
y *  t ' ' dt ' dt ' '.
   

Корреляционная функция процесса y (t) согласно (49), (50)
 ~ y *  t ' '   2 2 A t ' '  A *  t ' '   N 0  t 't ' '.
~ ~
y  t ' ~
Подставляя это соотношение в предыдущую формулу, находим
~ 2 ~ 2
 A t    ~ * A t   
 

I  2k 2 2

  A  t    dt  N0  
dt 
  
~
 2 A t    ~ *
   
~ 2
 Re 2 2  A t    dt  A  t    dt  (1.56)
    2 
~
 2 A t     
 
~ 
 Re  N 0  A *  t    2
dt  .
    


~ ~
Упростим полученное выражение. Прежде всего учтем, что A(t   ) A * (t   )dt  E
при любых , т.е. энергия сигнала от времени запаздывания не зависит.
Дифференцируя обе части этого равенства по , получаем
~
A t    ~ *

Re  A  t    dt  0.


В результате повторного дифференцирования имеем
~ ~ ~

 2 A  t    ~*
A t   
A t    A *  t    
Re  
 2 
dt  0.


  
Следовательно,
~ ~ 2
 2 A t    ~ * A t   
 
Re   2 A  t    dt   dt  0 (1.57)
 

и поэтому сумма второго и четвертого слагаемых в формуле (56) равна нулю.
Для дальнейшего упрощения выражения (56) введем спектральную плотность
комплексной огибающей сигнала

~ ~
F  j    A t  exp  jt  dt (1.58)


и учтем, что

~ 1 ~
A t    
2  F  j  exp j  t     d . (1.59)


Дифференцирование обеих частей этого равенства дает


~
A t   

j ~


2  F  j  exp j  t     d . (1.60)


Используя выражения (59), (60), представим интеграл в первом слагаемом


формулы (56) в виде
~
A t    ~ *
   
j ~ ~
 A  t    dt    ' F  j ' F *  j ' ' 
  
  2 4 2   
 exp j   ' ' ' t     dtd ' d ' '.
Далее, используя интегральное представление дельта-функции

1
     exp  jt  dt , (1.61)
2 
25

получаем
~
A t    ~ *
  
j ~ ~
 A  t    dt    ' F j ' F *  j ' '    ' ' ' 
  2 2  

j ~
 exp  j   ' ' '  d ' d ' '  
2

2  F j  d .


Поэтому
~ 2 2
A t    ~ *
  
1 ~ 2
 A  t    dt     F  j  d  .

 4 2  
 

Определим среднее значение частоты:
 
~ 2 ~ 2
   F j  d  F  j  d . (1.62)
 

Учитывая равенство Парсеваля


 
1 ~ 2 ~ 2
 F  j  d   A t  dt  E (1.63)
2  

(оно вытекает из (58) и интегрального представления дельта-функции), имеем


~ 2
A t    ~ *

 
A  t    dt  E2   2. (1.64)


Аналогичным образом представим интеграл в третьем слагаемом формулы (56).


Для этого продифференцируем обе части равенства (60) по .
~
 2 A t   

1 ~
 
2
F  j  exp j  t     d .
 2 2 

Используя это выражение и формулу (59), получаем


~
 2 A t    ~ *
  
1
 A  t    dt     ' 2 F~ j ' F~ *  j '  
  2 4 2  
 exp j '  t     exp  j ' '  t     dtd ' d ' '.
Воспользовавшись представлением дельта-функции (61), найдем
~
 2 A t    ~ *
 
1 ~ 2
  2 A  t    dt   2  F  j  d .
2

 

Определив средний квадрат частоты


 
~ 2 ~ 2
2  
2
F  j  d  F  j  d . (1.65)
 

учтя (63), будем иметь


~
 2 A t    ~ *

  2 A  t    dt   E . (1.66)
2



Итак, подставляя выражения (64), (66) в формулу (56) и учитывая (57), (63),
получаем
I  4k 2 E 2 [ 2     2 ].
И наконец, выразив константу к согласно (55) и перейдя к усредненной энергии
E  2 2 E , найдем

I  [ 2 E 2  
N 0 N 0  E ]  [ 2   ].  2
Таким образом, согласно (23), (54) потенциальная точность измерения времени
запаздывания сигнала
26
1

 
1


 2E
2
2  
    2

 . (1.67)
1  N0 N0  E

  

Величина [  2  ( ) 2 ], описываемая формулами (62) и (65), есть средний квадрат
ширины спектра огибающей сигнала, а
 э   2    (1.68)
2

— эффективная ширина спектра огибающей сигнала. Определив усредненное


отношение сигнал-шум* q  E / N 0 , формулу (67) перепишем в виде
  1 q 2 q  э . (1.69)
При q >>1 имеем
  1 2q  э . (1.70)
Таким образом, среднеквадратическая ошибка , характеризующая
потенциальную точность измерения времени запаздывания радиосигнала, обратно
пропорциональна эффективной ширине спектра огибающей радиосигнала э и
усредненному отношению сигнал-шум по напряжению q . Эффективная ширина
спектра (68) рассчитывается по формулам (62), (65), которые, как нетрудно
убедиться с помощью (59) и (61), эквивалентны соотношениям
~ ~ 2
dA t  ~ * dA t 
 
 j  A  t  dt  j  dt
dt dt
  

, 
2
 

(1.71)
~ 2 ~ 2
 A t  dt  A t  dt
 

Выбрав начало отсчета частоты так, чтобы  =0. имеем


 э   . 2
(1.72)
Потенциальная точность измерения дальности R связана с потенциальной
точностью измерения времени запаздывания радиосигнала  , как .следует из (3.2),
соотношением
 R  c  2 . (1.73)
В качестве примера рассмотрим колоколообразный радиоимпульс, огибающая
которого имеет вид

A t   exp   t 2  и2 ,  (4.74)
где и — длительность импульса, отсчитываемая на уровне ехр(-/4)0,46 от
максимума. Эффективная ширина спектра огибающей такого сигнала,
рассчитываемая по формулам (72), (71), (74), э=  /  и . Следовательно, согласно
(69), (70) потенциальная точность измерения времени запаздывания сигнала
   1  q и 2 q ;     и 2 q , q  1. (1.75)
Как видим, для повышения потенциальной точности измерения времени
запаздывания импульс надо укорачивать, а отношение сигнал-шум — повышать.
Отметим, что при заданной длительности импульса и увеличение э и,
следовательно, повышение потенциальной точности измерения времени
запаздывания сигнала и соответственно потенциальной точности дальнометрии
достигается путем применения широкополосных (сложных) сигналов *.
Оценка смещения частоты сигнала со случайными начальной фазой и
амплитудой. Рассмотрим модель принимаемого радиосигнала
s  , a,  , t   2aA t  cos   0    t    t    , 0  t  T , (1.76)
27

где информативный неслучайный параметр  представляет собой смещение


несущей частоты из-за эффекта Доплера, а неинформативные случайные параметры
а и  распределены так же, как и в предыдущем случае. Условное отношение
правдоподобия записывается аналогично (53):
N0  2 2 z 02    
 y    exp  , (1.76а)
N0  E 
 N 0 N 0  E  
где

~
z0    y  t  A *  t  exp 
~ jt  dt


- модуль комплексного корреляционного интеграла; A(t )  A(t ) exp[ j (t )] —


комплексная огибающая радиосигнала; y (t ) — комплексная огибающая
наблюдаемого процесса.
Уравнение максимального правдоподобия z20()/=0.
Конкретизируя общую схему многоканального измерителя (,см. рис. 1.2),
приходим либо к фильтровому, либо к корреляционному многоканальному
устройству. В фильтровом варианте (рис. 1.11,а) каждый из каналов измерителя
состоит из согласованного фильтра, настроенного на фиксированную частоту fi, и
амплитудного детектора. Число каналов определяется полосой пропускания фильтра
и диапазоном возможных доплеровских частот, который, в свою очередь обусловлен
диапазоном изменения скорости объекта. Амплитудно-частотная характеристика
согласованного фильтра повторяет амплитудно-частотный спектр сигнала. При этом
полоса пропускания фильтра должна быть согласована с шириной спектра
доплеровского сигнала.

СФ1 АД

у(t) СВМ fi

СФm АД

a)

f0+f-fг
СФ1 АД

f0+f Оценка
См ЦС
частоты

fг СФ2 АД

ПГ РЭ

б)
28

Рисунок 1.11. Структурные схемы многоканального (а) и следящего (б)


измерителей частоты со случайными начальной фазой и амплитудой

Конкретизируем теперь следящий измеритель (см. рис. 1.4) с дискриминатором


по схеме на рис. 1.3,б применительно к рассматриваемой задаче. Заменив
производную z0()/ конечной разностью, получим дискриминатор, который в
фильтровом варианте состоит из согласованных фильтров СФ 1 и СФ2, расстроенных
по частоте на f амплитудных детекторов АД и схемы вычитания. В следящем
измерителе (рис. 1.11,б) напряжение с выхода цепи сглаживания ЦС воздействует на
реактивный элемент РЭ, управляющей частотой fг перестраиваемого генератора ПГ,
для уменьшения рассогласования между fг и частотой f0+f сигнала, поступающего на
смеситель См.
В режиме поиска сигнала по частоте необходимо плавно менять частоту
перестраиваемого генератора fг до тех пор, пока частота f0+f-fг не попадет в полосы
фильтров СФ1 и СФ2 и не произойдет захват (обнаружение) сигнала. После этого
измеритель переходит в режим слежения.
Поступая аналогично тому, как это делалось при выводе формулы (69),
находим, что потенциальная точность измерения смещения частоты f=/2
сигнала со случайными начальной фазой и амплитудой
 f  1 q 2q t э , (1.77)
а при q ,>>1  f  qt э где t э  t 2  (t ) 2 - эффективная длительность сигнала,
рассчитываемая по формулам
 
~ 2 ~ 2
2  t A t  dt  2  2  t 2 A t  dt
t  

, t2  

, (1.78)
~ 2 ~ 2
 A t  dt  A t  dt
 

Выбрав начало отсчета времени так, чтобы t =0, имеем


t э  2
t . (1.79)
Учитывая взаимосвязь частоты Доплера и радиальной составляющей
скорости движения объекта (3.22), находим потенциальную точность измерения
радиальной скорости: VR=f/2.
Если, например, радиоимпульс имеет колоколообразную форму (74), то
эффективная длительность сигнала (79) t э   и , где и — длительность
импульса, отсчитываемая на уровне 0,46. Поэтому
  1  q 2 qt и ,
f
(1.80)
а при q >>1 имеем  f  2q и
Таким образом, для повышения потенциальной точности измерения частоты и
соответственно радиальной скорости объекта длительность импульса нужно
увеличивать. Однако при этом, как следует из (75) и (73), будет уменьшаться
потенциальная точность измерения дальности.
Совместные оценки времени запаздывания и смещения частоты сигнала
со случайными начальной фазой и амплитудой. В связи с необходимостью в
радиолокации измерять дальность и одновременно скорость движения объекта
возникает задача совместного оценивания времени запаздывания  и
доплеровского смещения частоты  принимаемого радиосигнала. Рассмотрим эту
29

задачу на примере сигнала со случайными начальной фазой  и амплитудой а:


s  ,  , a,  , t   2aA t    cos   0    t       t       ,
(1.81)
0  t   T
Данный сигнал при =0 переходит в (46), а при =0 - в (76). Условное отношение
правдоподобия имеет вид
N0  2 2 z 2   ,   
 y  ,   exp ,
N0  E  N0 N0  E   
где

~
z 0  ,    y  t  A *  t    exp 
~ jt  dt (1.82)


- модуль комплексного корреляционного интеграла. Система уравнений


максимального правдоподобия (29) в рассматриваемом случае состоит из двух
уравнений:
z 02  ,   z 02  ,  
 0,  0.
 
Решениями этой системы являются совместные оценки времени запаздывания

 м и доплеровского смещения частоты y(t ) .


м

z 02  , f1  
z 02 ˆ1, f1 
СФ1 АД СВМ

y(t) z 02  , f 2  
z 02 ˆ2 , f 2  ОСВМ
ˆi , f i
СФ2 АД СВМ

z 02  , f m  
z 02 ˆm , f m 
СФm АД СВМ

Рисунок 1.12. Структурная схема многоканального фильтрового измерителя


времени запаздывания и смещения частоты сигнала со случайными начальной фазой
и амплитудой

Схема устройства совместного измерения времени запаздывания  и


доплеровского смещения частоты f=/2, формирующая оценки максимального
 
правдоподобия
 м и f м , является многоканальной. При этом в корреляционном
варианте измеритель должен быть многоканальным как по частоте, так и по времени
запаздывания. Если число каналов, необходимое для перекрытия заданного
диапазона изменения скорости объекта, равно m, а число каналов по дальности n, то
общее число каналов рассматриваемого измерителя mn.
При фильтровом построении измерителя число каналов можно сократить в n
30

раз, ограничившись многоканальным построением схемы только по частоте (рис.


1.12). Согласованные фильтры СФi (i=1,..., m) перекрывают весь диапазон
доплеровских частот. В каждом из каналов после АД имеется схема выбора
максимума СВМ, в которой на заданном отрезке времени [0, T], определяемом
диапазоном просматриваемой дальности, отыскивается максимальное значение
сигнала
z 02 ˆ j f j   max z 02  , f j , j  1,..., m.
  0,T 

При этом фиксируются значения времени запаздывания  j , j=1,..., m, при которых
выходные сигналы детекторов максимальны. Из совокупности получаемых сигналов

 j, f j ) ,
z 02 ( j=1,…,m в оконечной схеме выбора максимума ОСВМ выбирается
наибольший, пусть это будет, например, сигнал на выходе i-го канала:
z 02 ˆi f i   max z 02 ˆ j f j .
j1,..., m 
 
С выхода измерителя поступают значения
 i, и f i , приближенно равные
совместным оценкам максимального правдоподобия времени запаздывания и
 
доплеровского смещения частоты:
 i
  м , fifм Степень приближения зависит от
выбранного числа каналов m.
Найдем теперь потенциальные точности совместного измерения параметров  и
f. Для этого потребуется информационная матрица I = Iij, являющаяся в
рассматриваемом случае двумерной, i, j=1,2. Ее элементы, как следует из (31), имеют
вид
 2   2 
I11    2 ln   y  , f  , I 22    2 ln  y  , f  ,
    f 
  2 
I12  I 21    ln   y  , f  ,
 f 
где условное отношение правдоподобия (y|, f) определяется прежней формулой с
учетом замены в (82) параметра  на 2f.
Раскрывая эти выражения аналогично предыдущему, получаем
I11  k1[ 2     2 ], I12  k1[t   t ],
I 22  k1[t 2   t  ],
2

где
k1  2 q   2 1  q  , (1.83)
величины  ,  2 , t , t 2 определяются прежними формулами (71) и (78), а
~
dA *  t  ~
 
~
t  2 Im  t A t  dt  A t  dt . (1.84)

dt 

Выбрав начало отсчета времени и частоты так, чтобы  =0, t =0, имеем
2
 t
I  k1 ,
t t2
при этом обратная матрица
1 t2  t
I 1  .
2
k1[ 2 t 2  t ]  t   2
Отсюда и из (32) следует, что потенциальные точности совместного измерения
31

времени запаздывания ст., и доплеровского смещения частоты f


t2 2
  ,   .
 2  2
f
k1[ 2 t 2  t ] k1 [ 2 t 2  t ]
После конкретизации значения к1 (83) и простого преобразования эти формулы
можно записать в виде
1 q 1 1 q 1
  ,   , (1.85)
       
2 f 2
2q 2 I  r2 2q t2 I  r2
где
r  t 2t2 (1.86)
-коэффициент корреляции, характеризующий взаимосвязь погрешностей измерения.
Если комплексная огибающая A (t) является действительной величиной A
(t)=A(t), т. е. в сигнале отсутствует фазовая модуляция, то, как следует из (84), имеем
t =0 и, следовательно, коэффициент корреляции r=0. В данном случае
среднеквадратические ошибки  и f не связаны между собой, при этом выражения
(85) при r=0 совпадают с формулами (69) и (77) (с учетом (72), (79)), полученными
при условии, что оценивается лишь один параметр (время запаздывания или
частота).
Выявим теперь зависимость потенциальных точностей совместного измерения
времени запаздывания и частоты сигнала со случайными начальной фазой и
амплитудой от соответствующей функции рассогласования и связанной с ней
функции неопределенности *. Для этого введем нормированную функцию
рассогласования комплексной огибающей сигнала:
 
~ ~* ~ 2
  , f    A t  A  t    exp j 2ft  dt  A t  dt . (1.87)
 

Ее называют также времячастотной функцией рассогласования, а квадрат модуля


этой функции (,t)=(,f)2—функцией неопределенности.
Дважды дифференцируя функцию неопределенности по , полагая затем =0,
f=0 и используя формулы (71), получаем
 2   , f 
2  , f 0    ' '  0,0   2[ 2   ].  2

Аналогичным образом, с учетом (71), (78) и (84), находим
 f ' '  0,0  2t   t ,  ff ' '  0,0   2[t 2   t  ].
2

Как видим, вторые производные функции неопределенности в начале координат


(в точке максимума) позволяют определить элементы информационной матрицы I и,
следовательно, потенциальные точности совместного измерения времени
запаздывания и доплеровского смещения частоты. При этом среднеквадратические
ошибки (85) выражаются через указанные производные (с учетом (   t =0)
следующим образом:
1 q 1
  ,
q 2

   ' '  0,0  I  r 2 
(1.88)
1 q 1
  ,
f
q 2 
  ff ' '  0,0  I  r 2 
где r   f ' '  0,0   ' '  0,0  ff ' '  0,0  . . При отсутствии корреляции между ошибками (r=0)
имеем
32

1 q 1 1 q 1
  ,   .
q    ' '  0,0  q   ff ' '  0,0 
2 f 2

Таким образом, потенциальные точности измерения времени запаздывания и


доплеровского смещения частоты радиосигнала определяются отношением сигнал-
шум q , а также остротой функции неопределенности, характеризуемой вторыми
производными функции неопределенности в точке максимума.
Оценка угловой координаты. Измерение угловых координат объектов в
зависимости от используемого метода пеленгации сводится к оцениванию тех или
иных параметров принимаемых радиосигналов (см. § 3.2). Поэтому при
оптимизации измерения угловых координат и расчете потенциальных точностей
измерения можно применить предыдущие результаты оценивания параметров
сигналов.
Рассмотрим задачу оценивания угловой координаты на примере амплитудного
метода пеленгации, использующего зависимость амплитуды принятого сигнала от
разности углов max— между направлением максимума результирующей ДН
антенной системы и направлением прихода радиоволн, отраженных или излученных
пеленгуемым объектом. Результирующая ДН fp() определяется произведением
диаграмм направленности передающей и приемной антенн.
Если обзор по угловой координате  осуществляется с угловой скоростью , то
положение максимума ДН будет меняться со временем согласно mах=t, а
амплитуда принимаемого сигнала
A  , t   A0 f p   t    , (1.89)

Рисунок 1.13. Диаграмма, поясняющая оценивание угловой координаты

где =/—момент совпадения направления максимума диаграммы направленности


с направлением на пеленгуемый объект (рис. 4.13). Измерив время , можно при
известной угловой скорости вращения антенны  определить угловую координату
объекта .
Таким образом, в данной постановке задачи углометрии оценка максимального

правдоподобия
 м угловой координаты объекта  определяется через оценку
  
м= 
максимального правдоподобия
 м момента времени :
 м
. При этом
можно воспользоваться предыдущим результатом анализа оценивания времени
33

запаздывания радиосигнала. Так, потенциальная точность измерения угловой


координаты.
     , (1.90)
где  — потенциальная точность измерения временя запаздывания радиосигнала.
Пусть, например, главный лепесток результирующей ДН имеет
колоколообразную форму
f p    exp[    a  2 ],
где a—ширина ДН антенны на уровне 0,46.
Тогда при равномерном обзоре огибающая принимаемого сигнала согласно (89)
имеет вид
A , t   A0 exp[   t    2  ОГ
2
], (1.91)
где ог=а/—длительность огибающей сигнала на уровне 0,46. Потенциальная
точность измерения времени запаздывания сигнала со случайными амплитудой и
начальной фазой, огибающая которого имеет вид (91), определяется аналогично (75):
   (1  q) / 2 ( q) 2  ог . Следовательно, потенциальная точность измерения угловой
координаты согласно (90)
  1  q  2  q   . (1.92)
2
 a

Таким образом, среднеквадратическая ошибка а, характеризующая


потенциальную точность углометрии, прямо пропорциональна ширине ДН антенны
a. Подставив соотношение (1.2) в (92), видим, что погрешность измерения
1 q k
 
 
2 q
2 da 

уменьшается с увеличением относительного размера апертуры антенны dа/.

4.3. ОЦЕНИВАНИЕ ПАРАМЕТРОВ СТОХАСТИЧЕСКИХ


СИГНАЛОВ
В § 1.1, 1.2, как правило, предполагалось, что параметры принимаемых
сигналов не изменяются в течение времени наблюдения. Однако в радиолокации и
радионавигации это предположение не всегда выполняется. В общем случае
параметры принимаемых сигналов меняются во времени, причем нередко
случайным образом. При этом наиболее общей и в то же время удобной
математической моделью изменяющегося параметра сигнала является случайный
процесс (t)= t.
Сигналы, для которых моделями параметров служат те .или иные случайные
процессы, называются стохастическими. При этом задача оценивания
стохастического сигнала и его параметров сводится к задаче оценивания некоторых
случайных процессов. Отметим,. что детерминированный сигнал S(t) и
квазидетерминированный сигнал S(,t), где —случайная величина,—предельные
частные случаи стохастического сигнала S(t, t) [53].
Итак, пусть оцениваемый параметр t — случайный процесс, вид которого пока
не конкретизируем. В течение времени [0, t] наблюдается реализация yt0={y, 0t}
случайного процесса yt, являющегося смесью шума и стохастического сигнала,
зависящего от параметра t. В результате наблюдения этой реализации и применения
решающей функции  выносится решение di=(yt0), которое представляет собой
оценку параметра  в момент времени .
34

Обратим внимание на то, что оценка di зависит от двух моментов времени: от
момента окончания наблюдения t и от момента , для которого отыскивается оценка
параметра . Если эти моменты времени совпадают: =t, то оценивание называется
фильтрацией. При >t оценивание называется экстраполяцией или предсказанием, а
при <t—интерполяцией или сглаживанием.
Задав функцию потерь с(,d), можно определить байесовское решение
di*=*(yt0) путем минимизации среднего риска или же апостериорного риска:
       
min  c   ,  t y 0t y 0t   c   ,  * y 0t y 0t .

Это решение и будет оптимальной в байесовском смысле оценкой параметра .
Причем при =t имеем оптимальную фильтрационную оценку d*tt, а при >t. и <t—
оптимальные экстраполяционную и интерполяционную оценки соответственно.
При квадратичной функции потерь (3) оптимальные оценки параметра сигнала
определяются выражением
d t*     y 0t ,   t (1.93)
(в этом нетрудно убедиться, поступая так же, как и при выводе оценки (4)). Если
функция потерь квадратична относительно сигнала s(t,t), т.е. с(,d)=[S(,t)—d]2, t0,
то оптимальные оценки сигнала
d t*    s   ,   y 0t ,   t (1.94)
Качество оптимального оценивания определяется значением байесовского риска
r *  Mc[ ,  * , ( y t )] , который при квадратичной функции потерь (3)
t   0
*
r t  
        y 0t , (1.95)
т. е. совпадает со средним значением квадрата ошибки оценивания. Квадратный
корень этой величины есть среднеквадратическая* ошибка оптимального
оценивания:  t  r *t .
Отметим, что среднеквадратические ошибки оптимальной интерполяции и
оптимальной фильтрации удовлетворяют неравенству t, <t. Это объясняется
тем, что дополнительное наблюдение реализации y t={yu, <ut} не может ухудшить
качества оптимального оценивания. Оно может быть либо улучшено, либо, по
крайней мере, остаться прежним. Последнее, как следует .из (95), будет в том случае,
если M(yt0)=M(y0), т.е. когда параметр  статистически не зависит от
дополнительного наблюдения реализации yt0.
Таким образом, интерполяция позволяет повысить качество оценивания по
сравнению с фильтрацией. Покупается это ценой увеличения времени наблюдения и
усложнения алгоритма обработки наблюдаемого процесса [53]. Что касается
экстраполяции, то она применяется тогда, когда наблюдение окончено, однако
необходимо продолжать оценивание параметра . Такая задача возникает, например,
во вторичной обработке радиолокационной информации при определении
траектории движущегося объекта (гл. 7). Центральное место в теории оценивания
случайных процессов занимает задача фильтрации; на ее основе решаются также
задачи интерполяции и экстраполяции. В дальнейшем рассматривается только задача
фильтрации.
Для получения конкретных результатов необходимо задать вид случайного
процесса t, который может служить математической моделью изменяющегося
35

параметра радиосигнала. Наиболее широкий и в то же время гибкий (в смысле


возможности математического исследования) класс случайных процессов
составляют марковские случайные процессы [22, 50, 53]. Этими процессами можно
с необходимой степенью точности аппроксимировать параметры реальных сигналов,
используемых в радиолокации и радионавигации. Поэтому в дальнейшем
предполагается, что оцениваемый параметр t является марковским случайным
процессом.
Общие уравнения оптимальной фильтрации. Вначале рассмотрим случай,
когда в дискретные моменты времени ti наблюдается аддитивная смесь
yi  s i , t i    i , i  1,2, , (1.96)
сигнала S(i,ti) и шума i. Параметр i(ti) представляет собой марковский процесс с
дискретным временем и непрерывным фазовым пространством. Такой процесс
описывается переходной (условной) плотностью вероятностей 0(i+1|i) и начальной
плотностью вероятностей (i). Считаем, что шум i является случайным процессом
с независимыми значениями, описываемыми плотностью вероятностей (i).
Так как оптимальная оценка сигнала и его параметра находится путем
минимизации апостериорного риска, то для отыскания таких оценок необходимо
определить прежде всего апостериорную плотность вероятностей параметра,
которую обозначим
  i y1 , , yi   pi  i  , i  1,2, . (1.97)
При квадратичной функции потерь оптимальные оценки параметра и сигнала,
как следует из (93) и (94), соответственно будут
 

d ii*    i y1i    i pi  i  d i  ˆi ,

(1.98)
 

d ii*   s  i , t i  y1i   s  i , t i  pi  i  d i  sˆi ,


где yi1(y1,…, yi).


Зная апостериорную плотность pi(i), можно определять также качество
получаемых оценок, в частности среднеквадратическую ошибку фильтрации.
Действительно, качество оптимальной фильтрации можно характеризовать
«шириной» апостериорной плотности вероятностей, мерой которой служит
апостериорная дисперсия
   

K i   [ i    i y1i ]   i  ˆi  2 pi  i  d i . (1.99)
2
y1i 


Усредняя апостериорную дисперсию, получаем (с учетом (2.4)) среднее


значение квадрата ошибки оптимальной фильтрации:

 K i  {[  i  ˆi  2 y1i ]}    i  ˆi  2 .
Следовательно, среднеквадратическая ошибка оптимальной фильтрации
 ii   i   K i . (1.100)
Таким образом, апостериорная плотность вероятностей параметра играет
важную роль в теории оптимальной фильтрации. К ее отысканию мы и перейдем.
Для этого воспользуемся формулой Байеса (см. (2.8)):

  1i 1 y1i 1   
  1i 1 , y1i 1  ,
 
(1.101)
    1i 1 , y1i 1 d 1  d i 1
 

где  1i 1   1 ,  , i 1  ; y1i 1   y1 ,  , y i 1 .
36

Выразим совместную плотность вероятностей (1i+1, y1i+1) случайного вектора


(1i+1, y1i+1) через заданные распределения вероятностей параметра сигнала и шума.
Учитывая (96) и то, что значения шума статистически независимы, имеем
 
i 1
 y1i 1  1i 1      y k  s  k , t k  .
k 1

Так как случайный процесс i(i=l, 2, ...) марковский, то априорная плотность


вероятностей вектора 1i+1

 
i
 0  1i 1     k 1  k   1 .
k 1
Поэтому совместная плотность вероятностей
     
i 1 i
 1i 1 , y1i 1   y1i 1 1i 1  0 1i 1      y k  s k , t k     k 1  k   1 .
k 1 k 1
Перепишем эту формулу в виде
 
  1i 1 , y1i 1     y i 1  s  i 1 , t i 1    i 1  i  
 i i 1  (1.102)
     y k  s  k , t k     k 1  k   1  .
 k 1 k 1 
Выражение, стоящее в фигурных скобках, есть совместная плотность вероятностей
i(1i, y1i) Подставляя с учетом этого формулу (102) в (101), получаем


  1i 1 , y1i 1   
   y i 1  s  i 1 , t i 1     i 1  i  y1i ,  1i  ,
 
(1.103)
      y i 1  s i 1 , t i 1    i 1  i   y1i ,  1i d 1  d i 1
 

 

Учитывая, что    1i , y1i d1  d i 1 


   i , y1i ,  интегрируя обе части равенства
(103) по 1, ..., i-1, находим

  1 ,  1i 1 , y1i 1   
   y i 1  s i 1 , t i 1    i 1  i   i , y1i  .
 

      y i 1  s i 1 , t i 1    i 1  i   i , y1i d d


i i 1
 

Интегрируя теперь обе части равенства по i, учитывая соотношение (i,


y1 )=(iy1i)(yi) и используя обозначение (97), получаем
i


   y i 1  s  i 1 , t i 1      i 1  i  p  i  d i
p i 1  i 1    

. (1.104)
      y i 1  s i 1 , t i 1     i 1  i  p i  d i d i 1
 

Найденное соотношение является рекуррентным, определяющим апостериорную


плотность pi+1(i+1) через апостериорную плотность pi(i) для i=l,2,.... При этом
начальное условие имеет вид
   y1  s 1 , t1    1 
p1  1    .
(1.105)
    y1  s1 , t1    1  d 1


Рекуррентное соотношение (104) позволяет последовательно находить


апостериорную плотность вероятностей pi(i) оцениваемого параметра i для
любых моментов времени. Оно служит основой для синтеза и анализа устройств
оптимальной фильтрации стохастических сигналов и их параметров и называется
рекуррентным соотношением оптимальной фильтрации.
37

Перейдем к случаю непрерывного времени. Наблюдаемый процесс


yt  s t , t    t , t  0, (1.106)
где параметр t сигнала S(t,t) —непрерывный марковский процесс, имеющий
непрерывные с вероятностью 1 траектории.
Такой случайный процесс называется диффузионным марковским. Его
статистические свойства определяются коэффициентом переноса a(x,t) и
коэффициентом диффузии b(х, t):
 t 
a x, t   lim   t  t  t  x ,
t  0  t 
 
(1.107)
t  2 
b x, t   lim   t  t  t  x .
t 0
 t 
Шум t—белый гауссовский со спектральной плотностью No/2. Уравнение для
апостериорной плотности вероятностей (ty0t)pt() параметра t получим путем
предельного перехода к непрерывному времени в рекуррентном соотношении (104).
Для этого учтем, что белому гаусоовскому шуму t в дискретном времени
соответствует гауссовский процесс с независимыми значениями (ti)=i i=l,2,..., с
нулевым средним и дисперсией (2.42), т. е.
1   t  2 
   i   exp   i , t  t i  t i 1. (1.108)
N 0 t   N0  
Подставим (118) в (104) и разложим экспоненту в ряд по степеням t. Переходя
затем к пределу при t0, получаем стохастическое дифференциальное уравнение
для апостериорной плотности вероятностей:
pt    L  L pt    pt   , (1.109)
где оператор L имеет вид
 1 2 2  1 
L a  , t   b  , t   s , t   yt  s , t  . (1.110)
 2  2 N0  2 
а
 
2  1 
L pt      Lpt   d   s , t   yt  2 s , t   pt   d . (1.111)

N0 

Стохастическое уравнение (109) нелинейное интегро-дифференциальное с


частными производными. Определяя апостериорную плотность вероятностей pt(),
оно тем самым позволяет находить оптимальные (линейные и нелинейные) оценки
сигнала S(t, t) и его параметра и называется уравнением оптимальной фильтрации*.
Линейная фильтрация. Рекуррентное соотношение (104) и интегро-
дифференциальное уравнение (109) определяют оптимальную, в общем случае
нелинейную фильтрацию. Рассмотрим важный частный случай, когда оптимальная
фильтрация является линейной. Пусть протекающий в дискретном времени
наблюдаемый процесс имеет вид
yi   i   i . (1.112)
При этом полезный сигнал i является марковским гауссовским процессом, для
которого переходная плотность вероятностей
1       2 
  i 1  i   exp i 12 i 2 ,

 1 2 1   2  
 2 1 1     (1.113)
38

где =ехр(-|t|); t=ti+1—ti i=l,2,.... Здесь —коэффициент корреляции; 1/ —


интервал корреляции сигнала i, Начальная плотность вероятностей
1   2 
   1   exp 1 2 . (1.114)
1 2  2 1 
Предполагается также, что шум i гауссовский:
39

1   i2 
   i   exp 2 , i  1,2, . (1.115)
0 2  2 0 
Так как сигнал и шум гауссовские и аддитивные, то наблюдаемый процесс (112)
тоже гауссовский. Кроме того, с помощью формулы Байеса можно убедиться, что
апостериорная плотность вероятностей pi(i) также является гауссовской. Поэтому ее
можно записать в виде
hi  h 
p i  i   exp  i  i  mi  2 . (1.116)
2  2 
Апостериорное среднее mi и апостериорная дисперсия 1/hi полностью определяют
апостериорную плотность вероятностей pi(i). Параметры mi и hi, определим исходя
из рекуррентного соотношения оптимальной фильтрации (104). Для этого согласно
(96) и (112) нужно в нем положить S(i, ti)= i и затем подставить (113), (115), а также
pi+1(i+1) и рi(i) в форме (116). Конкретизировав таким образом рекуррентное
соотношение (104), проинтегрируем по i, используя для этого интеграл

 exp  ax    b2 
2
 bx dx  exp 


a  4a 
Затем, приравняв соответствующие члены, стоящие в разных частях полученного
равенства, найдем рекуррентные алгоритмы для параметров апостериорной
плотности вероятностей:
mi 1  c1i y1i  c 2i mi (1.117)
hi 1
hi 1   , i  1,2,

hi 12 1   2   2  02  (1.118)

где

c1i 

hi 12 1   2   2  , c 2i 
hi 02 
(1.119)

hi 12 1   2   2  hi 02   
hi 12 1   2   2  hi 02
.

Начальное условие получаем из (105) и (114)


 12 y1 1 1
m1  , h1   . (1.120)
 02   12  12  02
Апостериорное среднее mi, как следует из (116) и (98), совпадает с оптимальной

оценкой сигнала:mi=
 i . Таким образом, рекуррентные соотношения (117), (118)
вместе с формулами (119), (120) позволяют последовательно находить оптимальную
оценку сигнала. Весовые коэффициенты c1i и c2i, вычисляемые по формулам (119) и
(118), от наблюдаемого процесса yi не зависят. Рекуррентные соотношения (117) и
(118) определяют оптимальный линейный фильтр с переменными параметрами
(рис. 1.14,а), который является одномерным вариантом дискретного фильтра
Калмана.
Рекуррентное соотношение (118), определяющее весовые коэффициенты
фильтра Калмана, позволяет также рассчитать
40

c1i c1t
ˆi 1 ̂ ˆt
yi yt t

 + + 

ˆi c2t

 t
c2i
a) б)

Формирующий фильтр
c1t m
t K
yt  mt yt RC ˆt
+
- г)

в)

Рисунок 1.14. Структурная схемы дискретного (а) и непрерывного (б – г)


фильтров Калмана

качество его работы. Действительно, так как апостериорная дисперсия Ki=1/hi от


наблюдаемого процесса yi, не зависит (см. (118)), то MKi=Ki=1/hi и в силу
соотношения (100) среднеквадратическая ошибка оптимальной фильтрации
 i  1 hi . (1.121)
Рассмотрим теперь случай, когда наблюдаемый процесс протекает в
непрерывном времени: yt=t+t, где t—белый гауссовский шум со спектральной
плотностью No/2, а сигнал tвг является непрерывным марковским гауссовским
процессом, определяемым стохастическим дифференциальным уравнением
t   t   t , (1.122)
где t — дельта-коррелированный гауссовский процесс:
 t  0,  t  t    2  . (1.123)
Процесс t принадлежат к классу диффузионных марковских процессов. При этом,
как следует из (107) и (122), (123), его коэффициенты переноса и диффузии
a , t    , b , t    2 . (1.124)
Используя эти коэффициенты и учитывая, что S(t,t), конкретизируем оператор
(110):
41

  2 2  1 
L      yt   . (1.125)
 4  2 N0  2 
Апостериорная плотность вероятностей pt() по тем же причинам, что и в случае
дискретного времени, является гауссовской:
ht  h 
p t    exp  t   mt  2 . (1.126)
2  2 
Подставив (125) и (126) в уравнение оптимальной фильтрации (109), выполним в
нем операции дифференцирования. Приравнивая затем члены при одинаковых
степенях  и 2, получаем дифференциальные уравнения для параметров
апостериорной плотности вероятностей:
 2  2 yt
m t     mt  , (1.127)
 N 0 ht  N 0 ht
2
h t  2 12 ht2  2ht  , (1.128)
N0
где 21=/4—дисперсия сигнала t. Апостериорное среднее mt совпадает с

оптимальной оценкой
 t (как и при дискретном времени). При этом линейное
дифференциальное уравнение (127) вместе с уравнением (128) определяет
структурную схему (рис. 1.14,б) оптимального линейного фильтра, являющегося
одномерным вариантом непрерывного фильтра Калмана. В полученной схеме
имеются усилители с переменными коэффициентами усиления
2  2 
с1t  , c 2t     , (1.129)
N 0 ht  N 0 ht 
причем функция ht является решением обыкновенного дифференциального
уравнения (128):
r 1  r0 exp  2r1t   1
ht  1 2  2,
2 1 1  r0 exp  2r1t   2 1
где
2 4 12 r1    2 12 h0
r1    ; r0  ,
N0 r1    2 12 h0
a h0—начальное условие для уравнения (128). В стационарном режиме, когда ht=0,
функция ht обращается в постоянную:
1  4 12 
h 1  1  . (1.130)
2 12  N 0 

При этом коэффициенты усиления (129) также становятся постоянными.


Техническая реализация фильтра Калмана в этом случае существенно упрощается.
Структурную схему фильтра Калмана можно представить и по-иному (рис.
1.14,в). Чтобы убедиться в этом, достаточно переписать уравнение (127) в виде
2
m t  mt   y t  mt  .
N 0 ht
При таком представлении непосредственно видно, что фильтр Калмана включает в
себя формирующий фильтр (на рис. 1.14,а обведен штриховой линией), структурная
схема которого описывается уравнением (122), т. е. определяется априорными
сведениями о фильтруемом процессе t.
42

Отметим, что фильтр Калмана можно также представить в виде схемы


разомкнутого типа, использовав RС-цепь. Действительно, напряжение mt, снимаемое
с емкости при подаче на RC-цепь напряжения yt, определяется уравнением
m t  mt  y t ,   1 RC .
Сравнивая это уравнение с уравнением фильтра Калмана (127), видим, что его
структурную схему можно представить в виде рис. 1.14,г. В стационарном режиме
коэффициент усиления K=2/(2+Noh) и параметр RС-цепи =+(2/N0h) являются
постоянными величинами.
Среднеквадратическая ошибка оптимальной фильтрации определяется
аналогично (121): t=1/ ht . В стационарном режиме эта ошибка равна постоянной
величине
  1 h  2 1 1  1  4q , (1.131)
где параметр q=2l/N0 имеет смысл отношения сигнал-шум по мощности. Как
видим, среднеквадратическая ошибка оптимальной фильтрации стохастического
сигнала t растет с увеличением его дисперсии 12 и уменьшается с ростом
отношения сигнал-шум q.
Нелинейная фильтрация. Как уже отмечалось, в общем случае оптимальная
фильтрация является нелинейной. При этом для получения технически реализуемых
алгоритмов приходится прибегать к приближенным методам конкретизации общих
уравнений оптимальной фильтрации. Рассмотрим один из них — метод га-
уссовского приближения.
Пусть наблюдаемый процесс имеет вид (106), где диффузионный марковский
параметр t сигнала S(t,t) может иметь как гауссовское, так и негауссовское
распределение вероятностей. Показано, что при условии большой апостериорной
точности [48, 53], которое выполняется, в частности, при достаточно большом
отношении сигнал-шум, апостериорная плотность вероятностей pt() не сильно
отличается от гауссовской. Поэтому при выполнении условия большой
апостериорной точности согласно методу гауссовского приближения используют
гауссовскую аппроксимацию
ht  h 
p t    exp  t   mt  2 . (1.132)
2  2 
Уравнения для параметров mt и ht получим с помощью уравнения оптимальной
фильтрации (109). Для этого подставим (132) в (109), причем функции S(,t), a(,t),
b(,t) разложим в ряды Тейлора в окрестности от mt. В соответствии с гауссовским
приближением в разложении функции S(,t) ограничимся членами, степень которых
не выше (-mt)2, в разложении а(,t) - не выше (9-mt), а в разложении b(,t) - первым
членом, не содержащим . Приравнивая затем члены при одинаковых степенях (-
mt), получаем
2
 t  a  mt , t  
m  yt  s mt , t   s'  mt , t  , (1.133)
N 0 ht
2
h t  b mt , t  ht2  2ht a '  mt , t    yt  s mt , t   s' '  mt , t   2  s'  mt , t   2 . (1.134)
N0 N0

где
43

s , t   2 s  , t  a , t 
s'  mt , t     mt , s' '  mt , t     mt , a'  mt , t     mt .
  2 

Если сделать замену переменных, перейдя к апостериорной дисперсии Kt=1/ht то


вместо (133) и (134) будем иметь
2K t
m t  a mt , t    yt  s mt , t   s'  mt , t  , (1.135)
N0

 y 
2
2K t
K t  b mt , t   2 K t a '  mt , t   t  s mt , t   s' '  mt , t    s'  mt , t   2 . (1.136)
N0
При выполнении условия большой апостериорной точности апостериорное среднее

приближенно равняется оптимальной оценке параметра: mt
t
Таким образом, уравнения (133), (134) .или эквивалентные им (135), (136)
определяют квазиоптимальные алгоритмы нелинейной фильтрации параметра t
сигнала S(t,t), наблюдаемого на фоне белого шума. Отметим, что при увеличении
отношения сигнал-шум (q) эти алгоритмы являются асимптотически
оптимальными [53]. Конкретизируя форму сигнала S и вид параметра t, можно с
помощью уравнений (133) — (136) синтезировать устройства квазиоптимальной
фильтрации стохастических сигналов и их параметров.
Уравнение (136), необходимое для синтеза алгоритмов фильтрации, определяет
также и их анализ. Действительно, качество фильтрации, как уже отмечалось,
характеризуется апостериорной дисперсией Kt; последняя же в гауссовском
приближении определяется уравнением (136). При этом среднеквадратическая
ошибка фильтрации
 t  K t (1.137)
В отличие от подобной формулы (100), равенство в (137) приближенное вследствие
того, что рассматриваемая задача фильтрации решалась в гауссовском приближении.
В качестве примера рассмотрим случай, когда стохастический радиосигнал
является фазомодулированным:
s t , t   A0 sin   0 t   t  , (1.138)
где A0 и 0 — известные константы, а флуктуации фазы t определяются уравнением
(122) при =0, т.е. t=t. Это означает, что фаза t является гауссовским процессом с
независимыми приращениями, т.е. испытывает нестационарные блуждания.
Коэффициенты переноса и диффузии рассматриваемого процесса:
a  , t   0, b , t    2 . (1.139)
Используя (138), (139), конкретизируем уравнения (135), (136). При этом
пренебрежем колебательными членами с удвоенной частотой 2о, дающими малый
вклад. В результате получим
m t  yt  2 K t N 0  A0 cos  0 t  mt  , (1.140)
 
K t   yt 2 K t2 N 0 A0 sin   0 t  mt    2 . (1.141)
Уравнение (140) описывает следящий измеритель типа фазовой автоподстройки
частоты (ФАПЧ) с переменным коэффициентом усиления Kt в цепи обратной связи.
Этот коэффициент усиления, определяемый уравнением (141), зависит от
наблюдаемого процесса и, следовательно, является случайным.
Для упрощения технической реализации измерителя в стационарном режиме
44

(при Kt=0) можно пренебречь флуктуациями коэффициента Kt и взять в качестве его


константу K =МKt, которая, как следует из (141), имеет вид
 K t  N 0 2 A02 . (1.142)
В результате приходим к типовой схеме ФАПЧ (рис. 1.15).
Таким образом, ФАПЧ является квазиоптимальным измерителем фазы
рассмотренного стохастического сигнала, наблюдаемого на фоне белого шума.
Среднеквадратическая ошибка фильтрации фазы, как следует из (137) и (142),
 t  4 N 0 / 2 A02 . Используя уравнения (133)—(136), можно аналогичным образом
синтезировать и анализировать квазиоптимальные следящие измерители для других
моделей сигнала и его параметра.
С методической точки зрения полезно рассмотреть пример оценивания
параметра квазидетерминированного сигнала. Как уже отмечалось, последний есть
частный случай стохастического сигнала. Поэтому при синтезе и анализе
измерителей параметров квазидетерминированного сигнала можно воспользоваться
полученными уравнениями нелинейной фильтрации. Проиллюстрируем это на
примере оценивания времени запаздывания t сигнала S(t—), где —случайная
величина.

2К N 0

yt m
t mt  ˆt

A0 cos( 0 t  mt )
ПГ РЭ

Рисунок 1.15. Структурная схема ФАПЧ

сt
yt mt


s ' (t  m t )

Рисунок 1.16. Структурная схема следящего измерителя времени запаздывания


сигнала

Наблюдаемый процесс в данном случае имеет вид (106), где нужно положить
S(t, t)(t—). При такой постановке задачи задержка  со временем не меняется и,
45

следовательно, описывается уравнением =0. Поэтому коэффициенты (107) равны


нулю. В результате уравнение для оценки mt задержка  согласно (133) имеет вид
2
t 
m y t s '  t  mt  , (1.143)
N 0 ht
При записи этого уравнения опущен член вида S(t—mt)S'(t—mt)=-[S2(t-mt)]'/2,
определяющий энергию сигнала (этот член неинформативен, так как оцениваемый
параметр неэнергетический). Поступая аналогично при конкретизации уравнения
(134), получаем
2
h t   y t s ' '  t  mt  . (1.144)
N0
Следящий измеритель (рис. 1.16), построенный в соответствии с уравнением
(143), строго говоря, должен быть дополнен устройством, определяющим в
соответствии с (144) переменный коэффициент усиления ct=2/Noht. Решение
уравнения (144)
2 T
hT  h0   yt s' '  t  mt  dt ,
N0 0
где h1=1/2 — начальное условие (2 — априорная дисперсия случайной величины
). Конкретизируя в этом решении наблюдаемый процесс yt, можно убедиться, что
функция ht с ростом времени t неограниченно возрастает. Поэтому коэффициент
усиления ct0 и, следовательно, в пределе (при t) обратная связь в следящем
измерителе разрывается. Это будет соответствовать точному измерению параметра,
когда апостериорная дисперсия K=1/h=0. Отметим, что при более сложной
постановке задачи, когда задержка меняется со временем, являясь некоторым
случайным процессом t, определяемым, например, уравнением типа (122),
коэффициент сt не стремится к 0 при t, при этом рассматриваемый измеритель
(рис. 1.16) следит за изменением задержки сигнала.
Обработку сигнала, связанную с вычислением производной S'(t—mt) в схеме на
рис. 1.16, можно упростить, если эту производную заменить конечной разностью
s'  t  mt    s t  mt   2   s t  mt   2   .
Если, кроме того, переменный случайный коэффициент усиления c t заменить
постоянным (подобно предыдущему примеру), то рассматриваемый измеритель
(рис. 1.16) будет по существу аналогичен следящему измерителю на рис. 1.7,
полученному методом разделения обработки на операции дискриминирования и
сглаживания.
В заключение отметим, что рассмотренные уравнения оптимальной фильтрации
допускают непосредственное обобщение на задачи, когда полезный сигнал зависит
от многих параметров [14, 36, 48, 53].

Оценить