SlideShare una empresa de Scribd logo
1 de 22
ИЗВЕСТИЯ АКАДЕМИИ НАУК СССР
                       Серия математическая:
                               25 (1961), 477—498




                   Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН

   ОБ ОДНОЙ СТАТИСТИЧЕСКОЙ ЗАДАЧЕ ОПТИМАЛЬНОГО
                    УПРАВЛЕНИЯ

        В работе рассматривается вопрос об оптимальном достижении
    управляемой точкой малой окрестности другой, стохастически движу­
    щейся точки. В связи с этим решается задача с малым параметром для
    параболического дифференциального уравнения с частными производ­
    ными.

                        § 1. Постановка задачи

   Точку z фазового пространства R переменных z1, . . ., zn назовем
управляемой, если ее движение в пространстве R описывается системой
обыкновенных дифференциальных уравнений
           Z* = f (Z . . . , Zn, U . . ., О ,        I = 1, . . . , Щ   (1)

где и = (и1, . . .,'и г ) — управляющий параметр.
   Точку Q фазового пространства R назовем случайной, если процесс
ее движения есть марковский процесс. Как известно [см. (*)], вероят­
ностную характеристику этого процесса дает функция р (о, х, %, у),
равная плотности вероятности того, что случайная точка Q, находящаяся
в момент а в положении х, в момент т будет находиться в положении у.
Функция р (сг, х, т, ?/), как функция первой пары переменных а и х,
удовлетворяет параболическому дифференциальному уравнению второго
порядка — первому дифференциальному уравнению А. Н. Колмогорова

                  | £ + av (в, х) -р^      + Ь1(б,х)^-        = 0         (2)

и является фундаментальным решением этого уравнения. Таким обра­
зом, решение уравнения (2) F (а, х), имеющее наперед заданное началь­
ное значение Fx (x):
                         F (о, х) - Fx (х),         а -+ т,               (3)
дается формулой
                     F(o,x)=^p(o,x,x,y)F1t!/)dy.                          (4)

(В этой формуле, как и всюду в дальнейшем, если специально не ука­
зана область интегрирования, интегрирование ведется по всему про­
странству R.)
   Отметим еще одно важное свойство функции р (о, х, т, у). Пусть тре­
буется решить неоднородное параболическое уравнение, соответствующее
478                 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


уравнению (2):

                   + а (0 Х)
               Ъ         ' Ш? + Ь (<Т' х) ^       = Р (
                                                          °' х)     (5)

при нулевом начальном условии. Тогда искомое решение дается формулой


              и{о, х, т) = —^ds^p     (о, х, s, у) Р (s, у) dy.         (6)
                               а


    В настоящей работе мы будем предполагать, что правые части системы
 уравнений (1), описывающей движение управляемой точки z, непрерывно
 зависят от всех переменных и непрерывно дифференцируемы по z1, . . ., zn
    Относительно же коэффициентов уравнения (2), описывающего движе­
 ние случайной точки Q, мы сделаем следующие предположения:
    а) коэффициенты а^ (сг, х), Ь1 (а, х), г, / = 1, . . . п, определены и
 непрерывны при а > О и при любых          x^R;
    б) все собственные значения матрицы || а^ (а, х)  при этих значениях
 аргументов ограничены сверху и снизу положительными константами;
    в) коэффициенты Ьг (а, х) при возрастании J x  возрастают не бы­
 стрее, чем е|х1.
    Итак, пусть в пространстве R движутся управляемая точка z и слу­
 чайная точка Q. Пусть вместе с управляемой точкой z движется некоторая
ее окрестность 2 2 , например шар или, вообще, область, ограниченная
произвольной кусочно гладкой поверхностью, кусочно гладко меняющей­
ся вместе с z.
    Если задан закон управления точкой z, т. е. если параметр и задан
как кусочно непрерывная функция времени и — и (/), то система диф­
ференциальных уравнений (1) однозначно определяет непрерывное дви­
жение точки z в пространстве R. Следовательно, если заданы начальные
положения управляемой точки z и случайной точки (?, то однозначно
определяется вероятность встречи точки Q с окрестностью 2 Z на отрезке
времени < <^ t < ; т или на бесконечном отрезке времени 0 < ; t <C ос, или
          т
вероятность встречи с тем или иным весом. Эти вероятности являются,
таким образом, функционалами управления и (t), и естественно возни­
кает задача о таком выборе управлений и (t) точкой z, при которых эти
функционалы достигают экстремальных значений.
    Чтобы точно формулировать задачу, введем в рассмотрение неотри­
цательную и не превосходящую единицы функцию h (t), определенную
на всей оси t. Обозначим через tyu (а, х, т) вероятность того, что случай­
ная точка Q, находящаяся в момент времени а в положении х, на отрезке
времени а <^ t <^ x встретится с окрестностью 2 2 управляемой точки z
(при этом предполагается, что начальное положение точки z, равное
z (а), задано). Ставится следующая задача: выбрать управление и (t),
точкой z таким образом, чтобы функционал
                          со

                      / =h(s)~[qu(o,       х, s)]ds                  (7)
                          О

достигал максимума.
СТАТИСТИЧЕСКАЯ       ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ            479


     Управление и (t) и соответствующую ему траекторию z (t) системы (1),
 обеспечивающие максимум функционала (7), будем называть оптималь­
ными. Таким образом, решение задачи сводится к принципу максиму­
ма [см. ( 2 )], если только функционал (7) известен как функционал от
и (0, z (t).
     Само собой разумеется, что функционал (7) зависит также от размеров
и формы окрестности 2 2 управляемой точки 2. Как мы увидим
ниже, для его вычисления нам потребуется решать граничную задачу
для уравнения (2). При этом нас будет интересовать эффективная, хотя
бы и приближенная, формула для этого решения. Оказывается, что такую
формулу можно получить, если размер окрестности 2 2 считать малым*
Но задача «накрыть» малой управляемой окрестностью случайную точку
 Q как раз и является естественной.
     Итак, в настоящей работе окрестность 2 2 мы будем считать малой.
Д л я простоты мы будем предполагать, что 2 2 есть ^-мерный шар радиуса
8 с центром в точке z. Однако внимательный читатель сможет увидеть,
что все наши рассуждения и сам результат почти не изменятся, если под
2 Z понимать произвольную область малого «радиуса», ограниченную
произвольной кусочно гладкой поверхностью, кусочно гладко меняющей­
ся вместе с z.

    § 2. Сведение вычисления функционала I к решению граничной
                   задачи для уравнения Колмогорова
    Прежде чем указать подход к вычислению функционала (7), сделаем
несколько замечаний, относящихся к произвольному марковскому про­
цессу.
    Выделим в пространстве R фиксированную область Г, ограниченную
(п — 1)-мерной кусочно гладкой поверхностью S. Обозначим через
q (о, х, т, у) плотность вероятности точки Q, находящейся в момент а
в положении х, быть в момент х в положении ?/, не заходя при этом на
протяжении времени о <J t <^ т в область Г. Очевидно, что

                       q (о, х, т, у) < р (а, х, т, у),
                                                                      (8)
            l i m  q (а, х, т, у) dy = lim р (а, х, т, у) dy = 1.

   Далее, известно, что функция q (а, х, т, у) вне области Г является
фундаментальным решением уравнения (2), а при приближении точки
х к границе области Г справедливо соотношение

                  q (а, х, т, у) dy -> 0    при х -> х0£ S.          (9)
                д—г

    Пусть теперь область Г не фиксирована, а движется вместе с t, т. е.
имеется однопараметрическое семейство областей Г*. Обозначим через
q (о, х, т, у) плотность вероятности случайной точки Q, находящейся
в момент времени а в положении х, быть в момент т в положении г/, не
480                  Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


встречаясь на протяжении времени а <^ t <^ x с движущейся областью
Г*. Тогда, очевидно, функция

                                 ?(<т, х, т, y)dy                     (10)

является решением уравнения (2) и удовлетворяет следующему гранич­
ному значению:
                      q (а, #, т, у) dy -»0      при ж -» Sa.         (11)

   Теперь мы можем указать подход к вычислению функционала (7).
Пусть движущаяся область Г* есть шар радиуса е с центром в управляе­
мой точке z (t). В соответствии с § 1 будем обозначать его через S z щ.
Положим
                    У(о,<х, 1) = i — q(o, х, r,y)dy.               (12)

 •" Непосредственно из определения следует, что функция г|) (а, х, т)
есть вероятность того, что случайная точка Q, находящаяся в момент
0 в положении х, на отрезке времени о <^ t ^ т будет «накрыта» окре­
стностью 2 2 (о управляемой точки z. Следовательно, функция я|) (а, ж, т),
определенная формулой (12), есть та же самая функция, которая фигу­
рирует в функционале (7).
    Таким образом, для вычисления функционала (7) мы должны решить
уравнение
                    дв
           '                         дх%дх3        У
                                                        ' дх1          Х
                                                                            '
при условиях:
                                  ф (а, х, т) - 0,                     (14)
                         |) (а, х, т) — 1 при ж -» £ а .
                                        »                                  (15)
      Мы покажем, что решение задачи (13), (14), (15) представляется в виде
                   ф (а, х, т) - е п - 2 ¥ (а, х, т) + о (е п - 2 ),       (16)
и получим эффективную формулу для W (а, х, т), представляющую глав­
ную часть вероятности я|) (о, #, т).

                  § 3. Некоторые предварительные оценки
   В настоящем параграфе мы докажем ряд вспомогательных неравенств,
связанных с фундаментальным решением уравнения (2). Кроме того,
мы решим внешнюю задачу Дирихле для многомерного уравнения Лап­
ласа вне эллипсоида Se

                           a i 2 + . . • + Kln2 - е2                   (17)
с единичным граничным значением. Результаты этого параграфа элемен­
тарны, однако мы выделяем их в специальный параграф, чтобы в после­
дующем можно было на них ссылаться не прерывая основных доказа­
тельств.
СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ                                         481


   Обозначим через g (о, £, т, ц) фундаментальное решение уравнения
теплопроводности



Как известно, оно имеет вид:

                  g (в, Е, ?, Т]) =                    п.е    4(т-а)
                                                          Т
                                       [2л; (t с- а ) ]
Положим, далее,

                          /•(6)= К £ 1 2 + . . . + Г          2
                                                                       •'''*       (20)
и введем следующие обозначения:

                  ©А. (о, Е, т) - ^g (or, lf т], t)—L-.rfr,,                            (21)


                Q, (a, E, t) = U * U (*. E, *, Л) -rr7d4.                               (22)

Чтобы интегралы, стоящие в правых частях формул (21) и (22), имели
смысл, мы, конечно, должны считать, что к < п.              -; ; ^
   Нам понадобятся следующие три неравенства, оценивающие фулШщи
©л (а, |, т) и Й* (а, |, т) при г (|) = е:

               °>л (а> Е, t) |г (5)==Е < - ^ -        при т — о > 8,                    (23)

                ©л (сг, Е, т) |г {1)==е < —           при т — а < 8,                    (24)

               Q*K6,t)|rR)=.<-^r.                                                   (25)

Здесь С — константа, не зависящая от е, а б (е) -» 0 при е -» 0.
   В ы в о д н е р а в е н с т в (23), (24). Легко видеть, что •
          со* (о, Е • • • , Еп, т) = ©л (сг, г (Е), 0, . . . , 0, т) =
                                                                                    (2Ь)
            =— — К          2
                                             '<~>                 - ^ ч -          ;1
               [2я(т —о)]                                                      '        '
Положим
                      т)* = г (Е) ж*,       т — а = / 2 (Е) .Л
Тогда из (26) получим:
                                                 _1
                          со* (a, g, т) = - J — F (0,                                   (27)
где
                                        (.х*-1)Ч--.-+*п3          ,

                                 2
                         (2яг)
482                     Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


Очевидно, что
                      V (0 -> 1 при t -> 0.                       (29)
Для дальнейшего отметим, что V (t) при больших значениях t имеет сле­
дующую асимптотику:
                                  rv>                                             (30)
                                      '°{J)
Действительно, положив в формуле (28)
                                 2 J/Iyi =      х                                (31)
получим:
                                                        ..+1/ n 2 J
               V(t) = -^e
                         t *
                                 U      ^/
                                                                       А)"*       (32)

(К — константа), откуда и следует (29). Итак, имеем:
                          щ
                               1°> *>х) <i*®v           {*т) •                    (33)

Но легко видеть, что
                 V(1^)           < Me)         при т - о > г,                     (34)

                    ^ ( т ) < С        при T f f
                                                - <6>                             ( 35 )
откуда и вытекают неравенства (23), (24).
   В ы в о д н е р а в е н с т в а (25). Мы имеем:
            Q* (а, 1 . . ., Г , т) - О* (а, г (*), 0, . . ., 0, т) =


               J    I      JL                       г*(т|)                    '
                  [2я(*-<з)]2
Отсюда, полагая rf = г (£) # s — о = г2 (£) г, получим:
                                                     т—о


                         Qft (a, gf т) = _ <          ? F       W Л|              (36)
                                        г (I)    - <}
где V (t) — функция, определенная формулой (28). В частности,
                                                       т—о
                                                           £2

                     «* (а, £, т) | r №)=t = - ^        jj 7 ( 0 Л.               (37)
                                                           О

Если теперь учесть асимптотику функции V (t) при больших значениях
t (см. формулу (30)), то сразу найдем:
                        т—о
                         £2

                         ^ F (t) dt < С In в при ft = 2,
                         о

                         ^ К (0 Л < С                 при /с > 2,

откуда и следует неравенство (25). Одновременно мы установили, что
                               Q»(a, £, т ) < - £ - .                             (38)
                                               г (S)
СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО                           УПРАВЛЕНИЯ    483


    Замечание          к неравенствам            (23), (24), (25). Пусть
р (б, | , т, ц) — фундаментальное решение общего уравнения Колмогорова

                 ~ + а** (а, 1)-^~ + Ъ1 (а, I) ~ = О.                              (39)
                                                     v
                  да        v » *>/ Q^IQ^O                   д1г

Исходя из этого фундаментального решения, определим функции
<ол (а, £, т) и йл- (сг, £, т) соответственно по формулам (21), (22), подста­
вив в них вместо q (а, £, т, и) функцию /? (а, £, т, т]). Оказывается, что
для так определенных функций о^ (а, £, т) и й* (о, £, т) справедливы те
же неравенства (23), (24), (25). Действительно, в теории параболических
уравнений доказывается, что при тех ограничениях на коэффициенты
уравнения (39), которые мы предположили выполненными в § 1, фунда­
ментальное решение уравнения (39) мажорируется фундаментальным
решением некоторого уравнения теплопроводности, т. е. для него имеет
место неравенство:
                                            с -т^-1
                       р (а, £, т, г)) < —j-             e   -*-* ,
                                                     2
                                             (?-с)

где у — константа. Эта оценка обеспечивает возможность буквального
повторения вычислений, проведенных при выводе неравенств (23), (24),
(25).
   Для дальнейшего нам потребуется также решить внешнюю задачу
Дирихле для уравнения Лапласа

                            U + ...+ 4 = °                                  (40)
оря единичном граничном значении на эллипсоиде Sz (17).
   Мы докажем следующее предложение:
   ЛЕММА. Исчезающее в бесконечности решение внешней задачи Дирихле
для уравнения (40) с граничным условием

                                  ^(IJIfes^1.                                   (41)
где Sz — эллипсоид (17), имеет вид
                                         2
                        ^(I) = e " -         - ^ + S(!;e),                      (42)

еде а — положительная константа, однозначно определяемая размерами
эллипсоида (42), а г (|) = Vx2 + . . . + f™2. При этом функция л (£, е)
л/ж г (£) < 1 удовлетворяет следующим неравенствам:

                           я(1г)<М-^^,                                        (43)

                            — я(£, е) < ^ ^ г - = -                             (44)

{М — константа).
484                   Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


   Доказательство.                   Будем искать решение задачи (40)* (41)
в виде
                         v() = ^~2~1^Ж     + S (¥, в),                (45)
                                     г "(g)
где а — пока не определенная константа, а л (£, е) — потенциал двой­
ного слоя, создаваемый эллипсоидом S£ в точке £, с не известной пока
плотностью (х (ц) (через ц мы обозначаем координаты точек, лежащих
на эллипсоиде Зг). Так как л (|, е) — решение уравнения (40), то оба
слагаемых в правой части формулы (45) при любом значении константы
а являются решениями уравнения (40). Таким образом, функция v (£),
представляемая формулой (45), является решением уравнения (40).
В силу хорошо известного свойства потенциала двойного слоя, граничное*
условие (41) дает:
                           ле(ц,    в) = 1 - a - g ^ -                 (46>
                                                  Г       (Г))



для любого т]б^£» где через ле (г), е) обозначен предел функции л (£, е)
при стремлении точки £ к точке г поверхности Sz извне. Но так как

                        лГе(т), е) = — 2ni (г|) + л0 (т), 8),          (47)

где % (т], е) — значение л (£, е) в точке ц поверхности SZ1 то из (46) полу­
чаем:
                      -2л|х й ) + я 0 (ч) = 1 - « Ч & •                 (48)
      Известно, что

                       M v )       = U(ii)   п-^- Ф          , ^ ,     (49)
                                     J       Р        (м> 4i)


где ф — угол, составленный направлением нормали в точке гц с радиу­
сом-вектором р (т), T]i), проведенным из точки гц в точку т].
   Введем обозначения:
                                         Z
                                         t
                                         j            1
                            2^ /"" ~ 
                                    ~   !
                           ^ ft' Л1) = 9 F
                                                 Р (TJ» MI)
                                               C0S
                                                   Ф
                                             n-i ,- - , >
                                                                        (50)



Тогда из условия (48) мы получаем неоднородное интегральное уравнение
для неизвестной плотности i (ц):

                      р(ц)=к        (ц^цг) |i Ы dSz + ф (л).           (51)


Уравнение (51) есть уравнение Фредгольма второго рода. Согласно изве­
стной теореме Фредгольма, для его разрешимости необходимо и дост'а-
СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ                                                 485


точно, чтобы свободный член был ортогонален ко всем собственным функ-
циям сопряженного однородного интегрального уравнения
                                             (*        —
                             V(T,)=          )K(41,4)ii(41)dSt.                                       (52)
                                          iE
Известно также [см. ( 3 )], что если ядро К (п, %) дается формулой (50),
то уравнение (52) имеет только одну собственную функцию. Обозначим
эту функцию через v 0 (r) и будем считать ее известной.
   Условие ортогональности дает возможность определить константу а.
Запишем его:
                 :
        •••'•'       -   1
                                                                v0(n)d££-0.                           (53)
                             ) [       r n - 2 (t])

Отсюда следует:
                                                I Vo(t|) dSt

                               a = —
                                         ."i-JStfi.                                          ,..
В полученной формуле константа а зависит от е, но зависимости эта лишь
кажущаяся. В самом деле, обозначим через S эллипсоид
                                   2
                               W        +      . . . +КЦП2             = 1,   — . - iiv • - : - . ,   (54)
                                        ~ч                                         1
получающийся из эллипсоида 6е увеличением всех осей в — раз. Без труда
обнаружим, что
                                                       Vo(n)dS

                                                                                                      (55)
                                               С       Vo (Л)
                                                       Уо(Л)       r
                                                                  jT
                                                                 dS
                                                       г^(п)
                                               S

Таким образом, а не зависит от е и полностью определяется размерами
эллипсоида (54).
   Итак, функция v (g), даваемая формулой (45), при а, определяемой
по формуле (55), является решением задачи (40), (41). Остается лишь
проверить выполнение неравенств (43), (44). Но они непосредственно сле­
дуют из определения потенциала двойного слоя я (£, е):

                                                         1
                                               J р        {1, л)

        § 4. Вычисление функционала I в случае, когда уравнение
    .         Колмогорова имеет^постоянные коэффициенты
   В этом параграфе вероятность р (о, х, т), а следовательно, функцио­
нал (7) будут вычисленыГдля одного важного частного случая, когда ч урав­
нение (2) имеет постоянные коэффициенты. Мы б^дем предполагать, что
размерность фазового пространства R больше двух: я > 2.
486                Е. Ф. МИЩЕНКО,            Л. С. ПОНТРЯГИН


      Итак, мы будем решать уравнение



где ai;>, Ъ{ — постоянные коэффициенты, при начальных и граничных
условиях (14), (15), которые в дальнейшем будем записывать в виде:
                                  г|) (т, х, х) = О,                      (57)
                                ф(а, ж, т)|„         = 1,                 (58)
                                            ^z (а)
где %Z(<J) —сфера радиуса 8 с центром в точке z (a).
   Прежде всего перейдем от этой задачи к задаче с граничным условием
на сфере радиуса Б С центром в начале координат. Для этой цели в про­
странстве (z, t) введем новые координаты по формулам
                       z = £ + z (t),            о < * < s,               (59)
так, что
                   х = I + z (а),           у - 1 + z (s).
                                                 1                         (60)
При таком преобразовании координат сфера 22(о) перейдет в сферу Sz;

                            ll2 + . . . + Ъп* = в2.                        (61)
      Положим
                                                       z
                       Ф(а,     £, т) = я|) (а, £ +        И> т )-        (62)
Тогда для функции ф (а, £, т) мы получаем дифференциальное уравнение

                   ^    +   а   ^_4Х+(6{-/(а))-^=0                        (63)
ш условия:
                                  Ф (т, 6, т) - 0,                         (64)
                                 Ф(а,   I, т)| 5 е = 1.                   (65)
   Чтобы решить уравнение (63) при условиях (64), (65), нам потребу­
ются вспомогательные построения.
   Нашим первым шагом будет конструкция некоторого специального
решения уравнения



   Для того чтобы получить это специальное решение, перейдем с помощью
линейного преобразования от координат J-1, . . ., £п к координатам
£ . . ., £п, в которых уравнение (66) приведется к виду

                                   §+Дф      0    = 0,                    (67)

где А — оператор Лапласа. При такому преобразовании координат сфера
Sz перейдет, очевидно, в эллипсоид Sz
                        ххГ + . . . + к¥* = е2,                           (68)
                                                                     ij
где Хъ . . ., Кп суть собственные значения матрицы || a |.
СТАТИСТИЧЕСКАЯ           ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ                           487


      Обозначим через g (а, £, т, rj) фундаментальное решение уравнения (67):

                  g (о, I т, ч) = -      !    z exp { - ^ J l j                 .         (69)
                                  [2я (т - а)] 2
Положим

                       ф0 (о, f, т) = е"-* _ _ ^ _         +   я (f,   е)   _

                  -  g (а, I , т, л) Г е"-* ^ г - + л (л, в) 1 £/ч,                        (70)
где а — константа, определенная формулой (55), а я (1, е) — потенциал
двойного слоя, создаваемый эллипсоидом Sz в точке £. Перепишем фор­
мулу (70) в несколько ином виде:

                      ф0 (а, I, т) = ф0 (а, I , т) + бф0 (а, £ т),                        (71)
где
            Ф (а, £: т) = е - 2 _ ^
             о                                   _^   g (а> Б> Tj ц)   _Л_^          d    (72)
                                    Г      (g)                          Г   " (Т|)


   Очевидно, функция ф0 (а, £, т) является решением уравнения (67)
м удовлетворяет начальному условию

                                        Фо(т, I, т) = 0.                                  (73)

   Перейдем теперь от координат £', . . . ,"|п вновь к координатам I1, . . . , £п,
и пусть при этом функции

             •ф0(а, | , т),    ф0(а, |, т),       бф 0 (а, |", т),     g(o, f, t, TJ)
перейдут соответственно в функции

             qT0(cr, | , т),   ф0(сг, £, т), бф 0 (а, £, т),           g(<x, £, т, TJ).
    Нам впоследствии понадобится явное выражение для функции
<р0(а, £, т). Чтобы выписать его, надо знать, как запишутся в координа­
тах £ . . . , 1п функции г(1) и g(a, £, т, т]). Это легко выяснить. В са­
мом деле, обозначим через (щ элементы матрицы, обратной матрице ||ai;"||,
так что
                                          aV* = д£.                                       (74)
Тогда легко можно убедиться, что



                           (-п — g | = [ay (-п- — Г) (rj^ — i J )l 2 •
      Учитывая еще, что

                                  dt = VK • • • К dr],                                     (76)
488                       Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


мы получим для функции ф0 (а, £, т) следующее явное выражение:

                                       а
      Фо   (о, £, т) = *™                  ^ -     J g(а, £, т, т,) 8 " ' : ' ' К * * - * * ^   (77)
                                           2                                        2
                               [*#']                                     K^W]
где

            g(а, g, т, I]) =             ^ ехр                   1   4(т   _б)           | .   (78)
                                [2я(т-с)]2
      Итак, доказана следующая
      ЛЕММА 1. Функция

                        Фо(<*> £, t) = ф0(а, £, т)+бф 0 (а, £, т),
гЗе ф0 (сг, £, т) определена формулой (77), является решением^ уравнения*
(66) а удовлетворяет нулевому начальному условию

                                               Ф0(т, £, т) = 0.                                 (79).

    Следует отметить, что функция ф0 (а, £, т) не равна единице на сфере
Sz. Однако, как будет выяснено дальше, ее граничное значение в некото­
ром смысле лишь несущественно отличается от единицы.
    Теперь уже все подготовлено, чтобы решать уравнение (63) при усло­
виях (64), (65). Сначала мы найдем некоторое специальное решение урав­
нения (63), удовлетворяющее лишь нулевому начальному условию (64).
Оценив затем граничное значение этого специального решения, мы уви­
дим, что оно лишь несущественно отличается от единицы. Отсюда мы
выведем, что и само это специальное решение лишь несущественно,
с точностью до величин более высокого порядка малости по е, отличается
от точного решения задачи (63), (64), (65). После этого полученное спе­
циальное решение будет упрощено путем отбрасывания некоторых чле­
нов и, таким образом, мы получим приближенное решение задачи (63),
(64), (65). Перейдем к осуществлению этой программы.
    Будем искать специальное решение уравнения (63), удовлетворяющее
 условию (64), в виде
                          Ф (<т, g, т) - фо (а, 6, т) + ф! (а, £, т),                             (80)

где фо (сг, £, т) — только что построенное специальное решение уравне­
ния (63), удовлетворяющее условию (64), а фх (а, £, т) — пока не извест­
ная функция. Непосредственно проверяется, что фх (сг, £, т) должна
удовлетворять неоднородному параболическому уравнению

            &. + а н - i , + [bl - 7}' (о)] - % = _ [ & * _ z* (о)] а Ф«( д '£' т >              (81)


 и начальному условию
                                            Ф1 (т, £,. т) = 0.                                    (82)
СТАТИСТИЧЕСКАЯ         ЗАДАЧА     ОПТИМАЛЬНОГО          УПРАВЛЕНИЯ       489


1Решение задачи (81), (82) во всем пространстве В с помощью формулы,
 аналогичной формуле (6) § 1, очевидно, невозможно, так как правая часть
 уравнения (81) при £ = О имеет полюс порядка п, получающийся при
 дифференцировании функции я (£, г). Однако эту трудность можно обой­
 ти, так как нас интересует решение ф1 (а, £, т) лишь вне шара, ограни­
 ченного сферой Se. Для этого рассмотрим функцию q (a, х, s, у), введен­
 ную в начале § 2 и равную плотности вероятности того, что случайная
 точка Q, находящаяся в момент времени а в положении х, в момент т
 находится в положениии у, не встречаясь при этом на протяжении вре­
 мени а <; t ^ s с шаром, ограниченным сферой 2 Z (o радиуса г с центром
 в управляемой точке z (t). Очевидно, функция

          q (or, Б, s, ц) = q (a, I + z (а), s, т) + z (s)) = q (а, х, s, у)   (83)

 см. формулы (59), (60)) является вне сферы Se фундаментальным реше­
нием уравнения (63), удовлетворяет граничному условию

                           Jg(cr, g, s, r)dv) ^     -0,                       (84)

ж решением задачи (81), (82) будет функция

        ф2 (о, g, т) Л tf Л ? (<r, I, s, т|) [6* - **' (5)] ^ о ^ ^ т ) dt),   (85)
                       'а 4                                    *»

где i?£ обозначает дополнение в й к шару, ограниченному сферой Sz.
Очевидно, что
                               ф! К S *) |^6S£ - 0.
                                     »

    Таким образом, нами получена следующая
    ЛЕММА 2. Функция

                     Ф(о, £, т) =ф 0 (а, £, T)+(^(cr, £, т),                   (86)

где ф0 (о, £, т) определена формулой (70), а фа (а, £, т) — формулой (85),
является решением уравнения (63), удовлетворяет нулевому начальному
условию Ф (т, £, т) = 0 и имеет те же граничные значения на сфере Ss,
что и функция ф0 (<т, £, т).
     Теперь мы докажем, что функция Ф (о, £, т) вне сферы радиуса г0
(т*0 — любое конечное, не зависящее от 8 число) аппроксимирует решение
задачи (63), (64), (65).
     Доказательство этого факта базируется на одной лемме об оценке
решений параболического уравнения. Сформулируем эту лемму.
     ЛЕММА 3 (об оценке решений параболического уравнения). Пусть
>и (а, g, т) — решение параболического уравнения

                 *L = _ а и ( 0 , 1)-^U-bl(о,        l)^^L(и),                 (87)
490                Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


удовлетворяют^ условиям:
                                  и(т, £, т) = 0,                     (88>
                         и (в, £, т) | адве = W(a, т),                 (89)
где
                               fС    при х — а < е,
                   VF(6, т ) < х / .           ^                (90>
                     v    у                                      v
                            ^ 16(e) л/? и х — 0 > е                 '
(С — константа, 6 (е) -* 0 л/ж 8 -» 0). Тогда для решения и (а, £, т)
справедлива следующая оценка:
                 | и (а, £, т) | < A (£, е) + 6 (8) х (а, £, т),       (91).
где А (£, е) — положительная функция, имеющая при | £ j > г0 порядок
о (8П~2), а л/(сг, |, т) — решение уравнения (87), имеющее при а = т нуле­
вые начальные значения и принимающее на сфере $г единичное значение.
    Д о к а з а т е л ь с т в о . Положим
                       г/; (а, т) = г^ (а, т) + га2 (а, т),            (92),

где функции WX (а, т), w2(a, х) определены следующим образом:
             7
                    _            (С         при х —а < е,
                    ^1 (<*, t) = п                   .                (93>
                      14     ;                                        v
                                 (0         при х — ог> 8,               '
                     _            f0         при х — а<Г 8,
                    ^>(а, т) = L /      4             ^               (94>
                      "V '    '    16(8)    ПРИ Т — 0 > 8.
Решения уравнения (87), имеющие нулевые начальные значения и крае­
вые значения, равные w(a, t), w1(a, т), w2 (0, т), обозначим соответствен­
но через и (а, | , т), ui (а, £, т), и"2 (о, £, т). Очевидно,
                   и (а, £, т) = щ (а, |, т) + и, (а, £, т).           (95>
   На основании теоремы о максимальном значении для решений пара­
болических уравнений, решение и (а, £, х) задачи (87), (88), (89) оцени­
вается следующим образом:
                             и (а, £, т ) < й ( а , £, т).             (96>

Оценим отдельно функции их (а, £, т) и м2 (о, £, т). Для т (а, | , т) оцен­
ка получается из той же теоремы о максимальном значении решения пара­
болического уравнения:
                        Мог, Б, т ) < 6 ( е ) х ( а , ё, т).           (97)
   Для получения оценки функции Mj_(a, £, т) потребуются более тонкие
рассуждения. Прежде всего оценим ги (о, £, т) при т — a < s.
   Положим

                                  Т О - * ^                            (98).
СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ                                          491


где К — константа, К ^> С. Будем теперь искать решение уравнения
(87) с начальным значением, равным у (£), и с граничным значением на
сфере SE1 равным К, в виде
                         v(o, £,,т) = Y(g)-i- v0(o, I, r).                                    (99).
Тогда для функции v0 (a, £, т) получается неоднородное уравнение

                %-+а^(р,         g ) ^         + & > , E)-§-=L[T(g)b                         (ЮО)

которое мы должны решить при нулевых начальных и нулевых гранич­
ных условиях. Такое решение, как мы знаем, вне сферы S£ дается форму­
лой:

                 v0(a, £, т ) = — ds          q(e,     £, s, ц)Ь [т(г))Ыт].                (101)

Итак,

              v(o, £, т) = г (|) — ^ с?5 [ q(e, I               5,   Tj)L[Y(Ti)]rfT|.        (102)

Очевидно,
                                й 2 (а, £, т ) < г ? ( а , £, т).                            (103)
Нам остается, таким образом, оценить лишь функцию v (с>, £, т) при,
| g j >• г0 и т — а <^ е. Заметив, что

                      ^[тШО* 1 - 1                rn+i(E)            r   n(g)j
                                                                                             (104V»

где У11? /I2 — достаточно большие константы, и принимая во внимание
неравенство
                            q(o, | , т, т ] ) < / ? ( а , | , т, г)),                        (105)'
из формулы (102) получаем:

            I v (a, g, т) ; < у (£) + ^ dv  р (a, g, 5, rj) - ^ Т Г у ^                 +


                        + ds      U ( a , g, * , T , ) - ^ l ? - r f T | .                  (106).


Интегралы, стоящие в правой части неравенства (106), обозначим соот­
ветственно через 1г, 1.2 и оценим отдельно их величины. Мы имеем:

                Л < Л х е " - 2 - ' ^ as f ^ (a, £, <- !]) — i
                                                     ,,                          dr =
                                                           r
                                   i      «i                         '~ w
                   = Л! • e"-2-^ Jrf*.(B„_V (a, ^ , s ) т о ( e " ' 2 ) ,                    (107),

где 0 <^ v <^ 1. Отсюда, принимая во внимание неравенство

                             co,j_v(a, £, s)<"               •— г
492                    Б. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН

находим:
                                                   т

                       1г < А1 ~^~~        8-2-     [ds+O (8-2).                     (108)
                         г (Е)          J
Следовательно, при т — о <; 8 и | £ | > г0
                                     Л « о (е^-а).                                  (109)

      Аналогично получим, что при т — о <^ 8 и | £ | У> г0
                                    12^0       (8^2).                               (НО)

Таким образом, функция v (a, £, т), мажорирующая на границе сферы
£ £ решение 1гх (а, £, т), при | £ | > г0 и т — а ^ 8 имеет порядок о (еп~2).
Отсюда следует, что и само решение их (а, £, т) при | £ | > г0 и т — cr ^ e
имеет порядок о (&п~2). Несколько изменяя предыдущее построение,
можно убедиться, что такая же оценка для щ (о, £, т) имеет место и при
т — а ^> е. Лемма доказана.
    Теперь мы можем доказать, что функция Ф (а, £, т), фигурирующая
в формулировке леммы 2, вне сферы любого конечного радиуса с точно­
стью до величин порядка о (8П~2) аппроксимирует решение задачи (63),
(64), (65). Иными словами, справедлива следующая
    ЛЕММА 4. Пусть ф (а, £, т) — решение уравнения (63), удовлетворяю­
щее начальным и^граничным условиям (64), (65), а Ф (а, £, т) — решение
уравнения (63), определенное в лемме 2. Тогда для , юбого г0, не зависящего
от 8 п/ж | £ | > г0, решение Ф (а, £, т) с точностью [до величин порядка
о (еп~2) аппроксимирует решение ф (о, £, т):

                       Ф (а,   £, т) - Ф (а, £, т) ^ о (8—2).                       (111)

   Доказательство.                  Обозначим через и (а, £, т) разность функ­
ций ф и Ф:
                    и (а, £, т) = < (а, £, т) — Ф (а, | , т).
                                   р                                                 (112)

Функция и (а, £, т) является решением уравнения (63) и удовлетворяет
нулевым начальным условиям. Далее, из формулы (85) видно, что гра­
ничные значения функции и (а, £, т) на сфере Se совпадают с граничны­
ми значениями функции ф0 (о, £, т) -—jp0 (б, £, т). Оценим эти послед­
ние. Для этого запишем разность ф — ф0 в следующем виде:

       ? (о, 6, т) - фо (а, 6, т)    =   {Ф   (а, Б, т) - ^ 8 - 2 _ | " - + я (I, 8) j j -

                 - ^ g ( a , | , т, ^ ) ^ п - 2 7 _ ^ _ + я(л ? e)]efrj.            (ИЗ)

Граничные значения слагаемого, заклю еиного в фигурную скобку в
правой части формулы (ИЗ), равны нулю (см. § 3). Остается, таким обра­
зом, оценить лишь граничные значения второго слагаемого на сфере Sz
(в координатах £ . . . , £п — на эллипсоиде Se).
СТАТИСТИЧЕСКАЯ            ЗАДАЧА         ОПТИМАЛЬНОГО УПРАВЛЕНИЯ                                       493


   Так как для потенциала двойного слоя я (3-, е) справедлива                                               оценка
(43), то, очевидно, имеем:

                      g(<x, £, т, т])                            + я(т), е) rfrj
                                                      !
                                                          (Т])                            ^
                          ?г 2                                       1
                   Л! • е ~ • (оп__2 (а, | , т) -|- Л 2 • е"- . соп_! (а, g, т),                             (114)

где А1 и Л2 — константы, а соп„2 (о, g, т) и co n _ 1 (a, £, т) — функции,
определенные формулой (21) соответственно при к = п — 2, А = п — 1.
Используя теперь неравенства (23), (24), получаем., что граничные зна­
чения второго слагаемого в формуле (113), а следовательно, и граничные
значения w (а, т) функции и (а, £, т) удовлетворяют условиям леммы 3.
Следовательно, на основании леммы 3, мы можем заключить, что соотно­
шение (111) справедливо. Лемма 4, таким образом, доказана.
    Упростим полученное приближенное решение Ф (а, £, т), отбросив
в нем величины, имеющие при | £ | > г0 порядок о (е п ~ 2 ). Чтобы сделать
это, выпишем решение Ф (о, g, т) в явном виде. Вспоминая формулы
(70), (71). (80), (85), мы можем написать:

                    Ф (о, I, т) = ф0 (a, g, т) 4- бф 0 (а, £, т) +

    + ^ds ^ q (а, т ; s, л) fft''— z1' (5)] - Д - [ср0 (о, g, т) + б ф0 (а, £, т)Ыи. (115)


Прежде всего ясно, что при 111 > /•„
                                        бф 0 яго(е"-2).                                                      (116)
Поэтому второе слагаемое в правой части формулы (115) можно отбро­
сить. Несколько сложнее упрощается интеграл, стоящий в правой части
формулы (115). Во-первых, можно отбросить член

            h = ds      g(a, £, s, ц) [Ьг — z1'(s)]-?-r                  [6<p0(s, r,x)dr.               (117)

В самом деле,

          |/,K^ds                       ^{a,l,s,v[)bi-zi'{s)             • б ф 0 ( 5 , 1], t )   fi?T|,
                                                                    dr:


Но так как [см. формулы (70), (71), (43), (44)]
                            I д
                                г б ф 0 ( 5 , ц, т) < e " - i i ? ( r ] ) ,
                             дг
где R (т)) в нуле имеет полюс порядка не выше п, то

             h<    8 " - 1 ~ v  d s  p (a, I, s, ii) | V — zv (s) I ! B 1 ft) j rfti,                      (119)


где 7/j (т)) имеет теперь в нуле уже полюс порядка не выше п — v
(0 <J v <C 1). Таким образом,
                                         1Х « О (8™-2).                                                       (120)
2   Известия АН СССР, серия математическая, № 4
494                       Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


      Нам остается упростить член
                     т

               J, = ^ds^q(o,          I, s, r) [Ъ1 - zi (в)] - Л [Фо (б-, л , x)]di.   (121)

      Покажем, что при j £ j > г0
           т

      / 2 = ds р (о, g, s, Ti) [6* - г*' (s)] Л - [ф0 (s, л, t)]dri + о(в'-*). (122)

Мы имеем:
               I2 = [jdsip(a,       I, s, т)) [ й * _ г * » ] - Л - [ф0 (s, т), т)] +
                     а


  + ^ s ^ (р (а, £, 5, т]) — g (а, £, 5, т|)] [6* — z1' (s)] JJ [<р0(s, rj, t)] drj +
       о
                 т

               + ds        p(a, I, s, т]) [6* - zi'(s)} Л - [Фо(*, т|, x)]di.         (123)


Последнее слагаемое в правой части формулы (123) имеет, очевидно,
порядок о (еп—2). Обозначим через и (а, £, т) второе слагаемое. Функция
и (а, £, т) при а = т имеет нулевое начальное значение и является в
области /? е решением уравнения (63). Так как

                                | - ^ [ ф о ( * , Т1, т ) ] | < е ™ - 2 Д ( т 1 ) ,      (124)

где R(r) имеет полюс порядка не выше п — 1, то граничные значения
функции и (о, £, т) оцениваются следующим образом:
                         | и (a, g, т) |E6S£ < М- 8—^ Qn_T (а, g, т) ^т                 (125)
Отсюда, на основании неравенства (25), заключаем, что
                                      и(о, 1,т)^<Ь(г),                                 (126) •
где б (е) — 0 при г — 0. Следовательно, всюду в области Л£
           >         >
                                |и(а, £, т) | < б (е) а (а, £, т).                       (127)
   Лемма 4 и неравенства (120), (127), а также формула (123) доказывают
следующее предложение.
   ЛЕММА 5. Функция
                                      т

Ф (а, | , т) = ф0 (<т, I, х) +  ds [p(a, I, s, л ) [Ь{ - z*' («)] ^ О ^ т , ,             (128)

где ф0 (a, £, т) определена формулой (77) тг/ж j g | > г0 (г0 — произвольное,
не зависящее от е положительное число), с точностью до величин порядка
о(еп—2) аппроксимирует решение ф (а, £, т) уравнения (63), удовлетво­
ряющее условиям, (64), (65).
СТАТИСТИЧЕСКАЯ                ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ                       495


   Чтобы подвести итог всем рассмотрениям настоящего параграфа,
нам остается вновь возвратиться к старым координатам х и у согласно
формулам (59), (60). Проведя соответствующие замены, на основании
леммы 5 мы можем сформулировать следующее предложение.
   ТЕОРЕМА 1. Пусть движение управляемой точки z, имеющей в на­
чальный момент времени G положение z (о), описывается системой диф­
ференциальных уравнений
                z1 = f (z1, . . . , zn, и1, . . . , ur),       i = 1, . . . , п,
где (и1, . . . , иг) — управляющие параметры. Пусть в пространстве В
переменных z1, . . . , zn движется еще случайная точка Q, плотность пере­
хода которой р (о, х, х, у) удовлетворяет уравнению Колмогорова с по­
стоянными коэффициентами
                               dp   i   а   д2р       у i dp      A
                               -т£- - - № —г*—.. ч- о —ч- = 0.
                                д
                                  3      дхгдх1       дхг
 Обозначим через 2 Z шар радиуса е с центром в управляемой точке z, дви­
жущейся вместе с z. Обозначим, далее, через я|) (а, х, т) вероятность того,
 что случайная точка Qt находящаяся в момент о в положении х, на отрезке
времени о <J t <J х будет «накрыта» шаром 2 Z . Тогда вероятность
if (а, х, х), являющаяся функционалом управления и (t), представляется
 при х — z (а) | ^> г0, где г0 — произвольное -положительное, не зависящее
 от е число, в следуюгцем виде:
            Ц (сг, х, х) - 8П~2 [ij?0 (о, х, х) +Цг (а, х, х)]+ о (г71-*).
     Чтобы выписать явные выражения для функций aj)0 (а, х, х) и
рг (а, х, т), введем следующие обозначения:
     а) Хь . . . , Хп — собственные значения матрицы а1Ц
     б) || dij -~ матрица, обратная матрице || aij ||;
     в)                  G (а, х, х, г) = g (G, x — z (G), X, TJ) = . .

        =                  Kexpl—:
                           2
                                                           4тг^)                —};
             [2я(т — с)]
   г) а — константа, не зависящая от уравнений, описывающих движе­
ние точек z и Q, и определяемая формулой (55) § 3.
   Тогда
                                                                         П—2
                                        [а. • (я* - zl (в)) (xj — ^ (а))] Т "


                               •S G{G   X, х, т|)              ^=2"-*%



        *i (а, *, т) = J efe J p (а, я;, в, у) [Ь1 - **' (s)) ^ W )                dy.


   Таким образом, теорема 1 дает явное выражение для главного члена
вероятности tj) (а, х, х) и, следовательно, для главного члена функцио­
нала (7).
496                       Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН

                 § 5. Вычисление функционала (7) в общем случае
   В настоящем параграфе вероятность г|э (а, х, т), а следовательно, и
функционал (7) будут вычислены для случая, когда коэффициенты урав­
нения Колмогорова зависят от а и х. Мы предполагаем, что эти коэффи­
циенты удовлетворяют условиям а), б), в), сформулированным в § 2. Схема
вычисления в значительной степени воспроизводит схему, которой мы
следовали в предыдущем параграфе, поэтому подробно мы будем про­
водить лишь существенно новые построения.
   Итак, вам нужно решить уравнение
                                  + al5
                             ^           ^^-£ij+bi^x^°                                        (129>
при условиях
                                             -ф (т, х, т) = 0,                                       (130)
                                          я|)(а, Х) t) S o = l.                                     (131)
   Как и в § 4, с помощью формул (51), (60) приведем эту задачу к за­
даче решения уравнения
       :
           § + « i i ( £ + 2 ( a ) , a ) - i ^ r + L64S + 3 ( o r ) , a ) - z ' - ' ( a ) ] J | - = 0 (132)
при условиях
                                            <р(тЛ, т) = 0,                                          (133)
                                          Ф(а, 6, T)| S E = 1.                                      (134)

      Перепишем уравнение (132) в несколько иной форме:
  :
      I J + « у ( * ( " > . ° ) - ^ Г + 1^(6 + z(а), о)-аН*(«),                    а)1-^Х           +
                             + [6*(5 +      2   (а),а)-^(а)]^-=0.                                   (135)

Нашим первым шагом будет конструкция некоторого специального реше­
ния q>J (a, £,' т) уравнения
                                 • ^ + а « (2 (0), О) - ^ ^ = 0.                                    (136)

     Для того чтобы получить это специальное решение, перейдем с по­
мощью линейного преобразования от координат I 1 , . . ., | , г к координатам
I"1» . • . , Т  в которых уравнение (136) запишется в виде

                                            §-+Аф„=0.                                               (137)
Такое преобразование координат теперь уже зависит от параметра 9.
Сфера Sz перейдет, очевидно, в эллипсоид
                         ^(9)1" 1 2 + . • . + М В ) | п , = е2,       ( 138 )
где Ях (0), . . ., >„п(0) суть собственные значения матрицы a^(z (0), 0||.
   Так же как и в предыдущем параграфе, мы можем сконструировать
функцию
                                  Ф90 = Ф° (*, 1*) + бфо №               *)>                            ( 139 )
СТАТИСТИЧЕСКАЯ          ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ                               497


где
             Ф0 «г, I т) = г - -Щ-                 - J j(o, I х, л) ^Щ^1^                   <**>)

которая является решением уравнения (137) и удовлетворяет нулевому
начальному условию.
   Перейдем теперь от [координат £ . . ., gn вновь к координатам
£ . . ., |п> и пусть при этом функции

                                                     5
                                   Фо'        Ф~о'       Фо>    #9
перейдут соответственно в функции
                                 ~е           о      с ~о       е
                                 Фо.         фо,     О фо,     g .

Мы можем выписать функцию ф0 (a, g, т) в явном виде. Для этого, как
и раньше, обозначим через а) (z (8), 8) элементы матрицы, обратной
матрице || al'J (z (в), 8) ||, так что

                              а « И в ) , 9)ад.( 2 (в), в) =                                 (141)
Тогда
                          ф > , | , Т) = в»"*                  ^(6)
                                                                         п—2
                                                                          2
                                                         «{,•(«(6), 0]

                    - J «• (а, £, т, Л) ^ • а ( 0 ) - П 1 ( 9 ) . . . М 9 )            f     (142)

                                                                                 2
                                                     К,-(М9), 0)rf-V]
 где
      £ (а, g, т, т)) =                j - exp ^               '—             4(T_g)       J -(143)
                                                                                           -
                                         2
                           [2я(т-в)]

    Рассмотрим теперь функцию фо (a, g, т), т. е. построенную нами функ­
 цию при значении параметра в. равном о. Функция фо (а, g, т) уже не
 удовлетворяет уравнению (136), в коэффициентах которого вместо 8
 подставлено о Однако очевидна следующая
    ЛЕММА 1'. Функция

                            Ф (а, g, х) = фо (а, | , т) + бфо,
                             о

 где фо определена формулой (142), является решением дифференциального
 уравнения

                     ^ . + ^(,(а),а)^-^.[ф»1^=0                                               (144)

 и имеет нулевые начальные значения при а = т.
    Теперь, как и в предыдущем параграфе, мы можем искать специаль­
 ное решение уравнения (132), имеющее нулевые начальные значения, в
 следующем виде:

                          Ф (а, Е, т) - фо7 (а, g, т) + фх (а, g, т),                         (145)
498                      Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН


где фо (сх, £, т) — только что построенное решение уравнения (144), а
ф1 (<?, £ f) — пока не известная функция. Подставляя Ф (о, £, т) в урав­
         >
нение (132) и учитывая лемму 1' дляф х (о, £, т), мы получим неоднородное
параболическое уравнение

       %• + & (I + ж {а), о)^-+                  [Ь> (Б + г (а), о) - * • » ] | f                 =

                 = - ( № ( £ > z (а), а) - a» (z (а), о)}8^'1'                 %)
                                                                                    +

        + lb' (£ + z (a), a) - z»' (a)] a < ( ° ' * ' T >   +   A. ft»   (a,   g,   T)]e==( j   {i46)


и начальное условие
                                    Ф (т, ё, т) = 0.
                                     Х                                                           (147)
Так как правая часть уравнения (146) имеет при £ = 0 полюс порядка
п (а не (д + 1)!), то мы можем почти буквально повторить все рассужде­
ния предыдущего параграфа и доказать лемму, аналогичную лемме 5.
    ЛЕММА 5'. Функция

                                Ф (а, £, т) -    Ф°   (о, £, т) +

+  cfe  р (а, 1 + z (а), 5, т) + ^(5)).          [а1* (т) + z (s), 5) — а4* (2 (s), 5)] х

             х               + [b {ri + z
                 т                             ^s) -zi (s)] -^H+
                                + -^Гф?(*.Л.т)]в=,}^.                                            (148)

где фо (сг, 5» т ) определена формулой (142), при | £ j > г0 (г0 — произ­
вольное положительное число, не зависящее от г) с точностью до величин
порядка о (вп~2) аппроксимирует решение ф (о, £, т) уравнения (132),
удовлетворяющее начальным и граничным условиям (165)—(169).
   Чтобы формулировать теперь окончательный результат, мы вновь
должны перейти к координатам х и у по формулам (51), (60). Тогда из
леммы 5 последует теорема, аналогичная теореме 1 предыдущего пара­
графа. Мы не будем здесь выписывать окончательных формул, так как
при желании читатель легко это сделает сам.
                                                                                     Поступило
                                                                                      29.Х.1960

                                      ЛИТЕРАТУРА
1
    К о l m o g o r o f f A.- N-, Uber die analytischcn Methoden in der Wahrscheinlich-
       keitsrechnung, Math. Ann., 104 (1931), 415—458.
2
    С о б о л е в С. Л., Уравнения математической физики, Физматгиз, М-, 1954.
3
    Б о л т я н с к и й В. Г., Г а м к р е л и д з е Р. В., П о н т р я г и н Л. С , Тео­
       рия оптимальных процессов. I, Известия Ак. наук СССР, серия матем., 24 (1960),
       3-42.
4
    М и щ е н к о Е . Ф . , П о и т р я г и н Л . С , Одна статистическая задача оптималь­
       ного управления, Доклады Ак. наук СССР, 128, № 5 (1959), 390—392.

Más contenido relacionado

La actualidad más candente

Тригонометрические функции числового аргумента
Тригонометрические функции числового аргументаТригонометрические функции числового аргумента
Тригонометрические функции числового аргументаFormula.co.ua
 
Основы комбинаторики - II
Основы комбинаторики - IIОсновы комбинаторики - II
Основы комбинаторики - IIDEVTYPE
 
Use of eliptic curves for generating digital signature
Use of eliptic curves for generating digital signatureUse of eliptic curves for generating digital signature
Use of eliptic curves for generating digital signatureAndrei Poliakov
 
УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...
УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...
УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...ITMO University
 
Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)
Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)
Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)Alexey Paznikov
 
Лекция №1. Введение. Предмет "Теория вычислительных процессов"
Лекция №1. Введение. Предмет "Теория вычислительных процессов"Лекция №1. Введение. Предмет "Теория вычислительных процессов"
Лекция №1. Введение. Предмет "Теория вычислительных процессов"Nikolay Grebenshikov
 
20110409 quantum algorithms_vyali_lecture10
20110409 quantum algorithms_vyali_lecture1020110409 quantum algorithms_vyali_lecture10
20110409 quantum algorithms_vyali_lecture10Computer Science Club
 
Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...
Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...
Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...Nikolay Grebenshikov
 
5.2. курс лекций афу
5.2. курс лекций афу5.2. курс лекций афу
5.2. курс лекций афуGKarina707
 
20110224 systems of_typed_lambda_calculi_moskvin_lecture02
20110224 systems of_typed_lambda_calculi_moskvin_lecture0220110224 systems of_typed_lambda_calculi_moskvin_lecture02
20110224 systems of_typed_lambda_calculi_moskvin_lecture02Computer Science Club
 
1.4 Точечные оценки и их свойства
1.4 Точечные оценки и их свойства1.4 Точечные оценки и их свойства
1.4 Точечные оценки и их свойстваDEVTYPE
 
10 a n_r
10 a n_r10 a n_r
10 a n_r4book
 
Линейная алгебра - I
Линейная алгебра - IЛинейная алгебра - I
Линейная алгебра - IDEVTYPE
 
Квадратичная математика
Квадратичная математикаКвадратичная математика
Квадратичная математикаDEVTYPE
 

La actualidad más candente (20)

Тригонометрические функции числового аргумента
Тригонометрические функции числового аргументаТригонометрические функции числового аргумента
Тригонометрические функции числового аргумента
 
Pr i-7
Pr i-7Pr i-7
Pr i-7
 
10474
1047410474
10474
 
Основы комбинаторики - II
Основы комбинаторики - IIОсновы комбинаторики - II
Основы комбинаторики - II
 
Use of eliptic curves for generating digital signature
Use of eliptic curves for generating digital signatureUse of eliptic curves for generating digital signature
Use of eliptic curves for generating digital signature
 
УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...
УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...
УПРАВЛЕНИЕ ПО ВЫХОДУ ЛИНЕЙНЫМ ПАРАМЕТРИЧЕСКИ НЕОПРЕДЕЛЕННЫМ ОБЪЕКТОМ В УСЛОВИ...
 
Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)
Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)
Лекция 5. Метод конечных разностей (параллельные алгоритмы в стандарте MPI)
 
Лекция №1. Введение. Предмет "Теория вычислительных процессов"
Лекция №1. Введение. Предмет "Теория вычислительных процессов"Лекция №1. Введение. Предмет "Теория вычислительных процессов"
Лекция №1. Введение. Предмет "Теория вычислительных процессов"
 
Pr i-7
Pr i-7Pr i-7
Pr i-7
 
20110409 quantum algorithms_vyali_lecture10
20110409 quantum algorithms_vyali_lecture1020110409 quantum algorithms_vyali_lecture10
20110409 quantum algorithms_vyali_lecture10
 
Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...
Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...
Лекция №3. Свойства и моделирование стандартных схем программ. Предмет "Теори...
 
Funkciya y cos_ee_svojstva_i_grafik
Funkciya y cos_ee_svojstva_i_grafikFunkciya y cos_ee_svojstva_i_grafik
Funkciya y cos_ee_svojstva_i_grafik
 
Integral1
Integral1Integral1
Integral1
 
23
2323
23
 
5.2. курс лекций афу
5.2. курс лекций афу5.2. курс лекций афу
5.2. курс лекций афу
 
20110224 systems of_typed_lambda_calculi_moskvin_lecture02
20110224 systems of_typed_lambda_calculi_moskvin_lecture0220110224 systems of_typed_lambda_calculi_moskvin_lecture02
20110224 systems of_typed_lambda_calculi_moskvin_lecture02
 
1.4 Точечные оценки и их свойства
1.4 Точечные оценки и их свойства1.4 Точечные оценки и их свойства
1.4 Точечные оценки и их свойства
 
10 a n_r
10 a n_r10 a n_r
10 a n_r
 
Линейная алгебра - I
Линейная алгебра - IЛинейная алгебра - I
Линейная алгебра - I
 
Квадратичная математика
Квадратичная математикаКвадратичная математика
Квадратичная математика
 

Destacado (6)

IT Innovation
IT InnovationIT Innovation
IT Innovation
 
IT Outsourcing
IT OutsourcingIT Outsourcing
IT Outsourcing
 
E business
E businessE business
E business
 
SQL Portfolio
SQL PortfolioSQL Portfolio
SQL Portfolio
 
eEducation
eEducationeEducation
eEducation
 
Hype vs. Reality: The AI Explainer
Hype vs. Reality: The AI ExplainerHype vs. Reality: The AI Explainer
Hype vs. Reality: The AI Explainer
 

Similar a Get Ft

Kasatelnaya k grafiku_funkcii
Kasatelnaya k grafiku_funkciiKasatelnaya k grafiku_funkcii
Kasatelnaya k grafiku_funkciiIvanchik5
 
kasatel-nayakgrafikufunkcii.ppt
kasatel-nayakgrafikufunkcii.pptkasatel-nayakgrafikufunkcii.ppt
kasatel-nayakgrafikufunkcii.pptssuser12dca4
 
математик анализ лекц№10
математик анализ лекц№10математик анализ лекц№10
математик анализ лекц№10narangerelodon
 
20080928 structuralcomplexitytheory lecture01-02
20080928 structuralcomplexitytheory lecture01-0220080928 structuralcomplexitytheory lecture01-02
20080928 structuralcomplexitytheory lecture01-02Computer Science Club
 
10.2.1. курс лекций афу
10.2.1. курс лекций афу10.2.1. курс лекций афу
10.2.1. курс лекций афуGKarina707
 
12.4. курс лекций афу
12.4. курс лекций афу12.4. курс лекций афу
12.4. курс лекций афуGKarina707
 
20081116 structuralcomplexitytheory lecture09-10
20081116 structuralcomplexitytheory lecture09-1020081116 structuralcomplexitytheory lecture09-10
20081116 structuralcomplexitytheory lecture09-10Computer Science Club
 
Григорий Анатольевич Кабатянский - Конечные алгебры, геометрии и коды
Григорий Анатольевич Кабатянский - Конечные алгебры, геометрии и кодыГригорий Анатольевич Кабатянский - Конечные алгебры, геометрии и коды
Григорий Анатольевич Кабатянский - Конечные алгебры, геометрии и кодыYandex
 
Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...
Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...
Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...Ильдус Ситдиков
 
Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...
Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...
Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...aleksashka3
 
Предикаты. Основные понятия, связанные с предикатами
Предикаты. Основные понятия, связанные с предикатамиПредикаты. Основные понятия, связанные с предикатами
Предикаты. Основные понятия, связанные с предикатамиИльдус Ситдиков
 
20081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-1220081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-12Computer Science Club
 

Similar a Get Ft (20)

2 prohds
2 prohds2 prohds
2 prohds
 
Kasatelnaya k grafiku_funkcii
Kasatelnaya k grafiku_funkciiKasatelnaya k grafiku_funkcii
Kasatelnaya k grafiku_funkcii
 
kasatel-nayakgrafikufunkcii.ppt
kasatel-nayakgrafikufunkcii.pptkasatel-nayakgrafikufunkcii.ppt
kasatel-nayakgrafikufunkcii.ppt
 
математик анализ лекц№10
математик анализ лекц№10математик анализ лекц№10
математик анализ лекц№10
 
20080928 structuralcomplexitytheory lecture01-02
20080928 structuralcomplexitytheory lecture01-0220080928 structuralcomplexitytheory lecture01-02
20080928 structuralcomplexitytheory lecture01-02
 
10.2.1. курс лекций афу
10.2.1. курс лекций афу10.2.1. курс лекций афу
10.2.1. курс лекций афу
 
Unit3
Unit3Unit3
Unit3
 
Unit3
Unit3Unit3
Unit3
 
12.4. курс лекций афу
12.4. курс лекций афу12.4. курс лекций афу
12.4. курс лекций афу
 
20081116 structuralcomplexitytheory lecture09-10
20081116 structuralcomplexitytheory lecture09-1020081116 structuralcomplexitytheory lecture09-10
20081116 structuralcomplexitytheory lecture09-10
 
Григорий Анатольевич Кабатянский - Конечные алгебры, геометрии и коды
Григорий Анатольевич Кабатянский - Конечные алгебры, геометрии и кодыГригорий Анатольевич Кабатянский - Конечные алгебры, геометрии и коды
Григорий Анатольевич Кабатянский - Конечные алгебры, геометрии и коды
 
Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...
Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...
Кванторные операции над предикатами. Формула логики предикатов. Тавтологии ло...
 
6 pr sl sign
6 pr sl sign6 pr sl sign
6 pr sl sign
 
Tvp2438
Tvp2438Tvp2438
Tvp2438
 
Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...
Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...
Кванторы. Квантор всеобщности. Квантор существования.Равносильные формулы лог...
 
Основы MATLAB. Численные методы
Основы MATLAB. Численные методыОсновы MATLAB. Численные методы
Основы MATLAB. Численные методы
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
Предикаты. Основные понятия, связанные с предикатами
Предикаты. Основные понятия, связанные с предикатамиПредикаты. Основные понятия, связанные с предикатами
Предикаты. Основные понятия, связанные с предикатами
 
Lecture 10 cont_joint_distr
Lecture 10 cont_joint_distrLecture 10 cont_joint_distr
Lecture 10 cont_joint_distr
 
20081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-1220081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-12
 

Get Ft

  • 1. ИЗВЕСТИЯ АКАДЕМИИ НАУК СССР Серия математическая: 25 (1961), 477—498 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН ОБ ОДНОЙ СТАТИСТИЧЕСКОЙ ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В работе рассматривается вопрос об оптимальном достижении управляемой точкой малой окрестности другой, стохастически движу­ щейся точки. В связи с этим решается задача с малым параметром для параболического дифференциального уравнения с частными производ­ ными. § 1. Постановка задачи Точку z фазового пространства R переменных z1, . . ., zn назовем управляемой, если ее движение в пространстве R описывается системой обыкновенных дифференциальных уравнений Z* = f (Z . . . , Zn, U . . ., О , I = 1, . . . , Щ (1) где и = (и1, . . .,'и г ) — управляющий параметр. Точку Q фазового пространства R назовем случайной, если процесс ее движения есть марковский процесс. Как известно [см. (*)], вероят­ ностную характеристику этого процесса дает функция р (о, х, %, у), равная плотности вероятности того, что случайная точка Q, находящаяся в момент а в положении х, в момент т будет находиться в положении у. Функция р (сг, х, т, ?/), как функция первой пары переменных а и х, удовлетворяет параболическому дифференциальному уравнению второго порядка — первому дифференциальному уравнению А. Н. Колмогорова | £ + av (в, х) -р^ + Ь1(б,х)^- = 0 (2) и является фундаментальным решением этого уравнения. Таким обра­ зом, решение уравнения (2) F (а, х), имеющее наперед заданное началь­ ное значение Fx (x): F (о, х) - Fx (х), а -+ т, (3) дается формулой F(o,x)=^p(o,x,x,y)F1t!/)dy. (4) (В этой формуле, как и всюду в дальнейшем, если специально не ука­ зана область интегрирования, интегрирование ведется по всему про­ странству R.) Отметим еще одно важное свойство функции р (о, х, т, у). Пусть тре­ буется решить неоднородное параболическое уравнение, соответствующее
  • 2. 478 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН уравнению (2): + а (0 Х) Ъ ' Ш? + Ь (<Т' х) ^ = Р ( °' х) (5) при нулевом начальном условии. Тогда искомое решение дается формулой и{о, х, т) = —^ds^p (о, х, s, у) Р (s, у) dy. (6) а В настоящей работе мы будем предполагать, что правые части системы уравнений (1), описывающей движение управляемой точки z, непрерывно зависят от всех переменных и непрерывно дифференцируемы по z1, . . ., zn Относительно же коэффициентов уравнения (2), описывающего движе­ ние случайной точки Q, мы сделаем следующие предположения: а) коэффициенты а^ (сг, х), Ь1 (а, х), г, / = 1, . . . п, определены и непрерывны при а > О и при любых x^R; б) все собственные значения матрицы || а^ (а, х) при этих значениях аргументов ограничены сверху и снизу положительными константами; в) коэффициенты Ьг (а, х) при возрастании J x возрастают не бы­ стрее, чем е|х1. Итак, пусть в пространстве R движутся управляемая точка z и слу­ чайная точка Q. Пусть вместе с управляемой точкой z движется некоторая ее окрестность 2 2 , например шар или, вообще, область, ограниченная произвольной кусочно гладкой поверхностью, кусочно гладко меняющей­ ся вместе с z. Если задан закон управления точкой z, т. е. если параметр и задан как кусочно непрерывная функция времени и — и (/), то система диф­ ференциальных уравнений (1) однозначно определяет непрерывное дви­ жение точки z в пространстве R. Следовательно, если заданы начальные положения управляемой точки z и случайной точки (?, то однозначно определяется вероятность встречи точки Q с окрестностью 2 Z на отрезке времени < <^ t < ; т или на бесконечном отрезке времени 0 < ; t <C ос, или т вероятность встречи с тем или иным весом. Эти вероятности являются, таким образом, функционалами управления и (t), и естественно возни­ кает задача о таком выборе управлений и (t) точкой z, при которых эти функционалы достигают экстремальных значений. Чтобы точно формулировать задачу, введем в рассмотрение неотри­ цательную и не превосходящую единицы функцию h (t), определенную на всей оси t. Обозначим через tyu (а, х, т) вероятность того, что случай­ ная точка Q, находящаяся в момент времени а в положении х, на отрезке времени а <^ t <^ x встретится с окрестностью 2 2 управляемой точки z (при этом предполагается, что начальное положение точки z, равное z (а), задано). Ставится следующая задача: выбрать управление и (t), точкой z таким образом, чтобы функционал со / =h(s)~[qu(o, х, s)]ds (7) О достигал максимума.
  • 3. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 479 Управление и (t) и соответствующую ему траекторию z (t) системы (1), обеспечивающие максимум функционала (7), будем называть оптималь­ ными. Таким образом, решение задачи сводится к принципу максиму­ ма [см. ( 2 )], если только функционал (7) известен как функционал от и (0, z (t). Само собой разумеется, что функционал (7) зависит также от размеров и формы окрестности 2 2 управляемой точки 2. Как мы увидим ниже, для его вычисления нам потребуется решать граничную задачу для уравнения (2). При этом нас будет интересовать эффективная, хотя бы и приближенная, формула для этого решения. Оказывается, что такую формулу можно получить, если размер окрестности 2 2 считать малым* Но задача «накрыть» малой управляемой окрестностью случайную точку Q как раз и является естественной. Итак, в настоящей работе окрестность 2 2 мы будем считать малой. Д л я простоты мы будем предполагать, что 2 2 есть ^-мерный шар радиуса 8 с центром в точке z. Однако внимательный читатель сможет увидеть, что все наши рассуждения и сам результат почти не изменятся, если под 2 Z понимать произвольную область малого «радиуса», ограниченную произвольной кусочно гладкой поверхностью, кусочно гладко меняющей­ ся вместе с z. § 2. Сведение вычисления функционала I к решению граничной задачи для уравнения Колмогорова Прежде чем указать подход к вычислению функционала (7), сделаем несколько замечаний, относящихся к произвольному марковскому про­ цессу. Выделим в пространстве R фиксированную область Г, ограниченную (п — 1)-мерной кусочно гладкой поверхностью S. Обозначим через q (о, х, т, у) плотность вероятности точки Q, находящейся в момент а в положении х, быть в момент х в положении ?/, не заходя при этом на протяжении времени о <J t <^ т в область Г. Очевидно, что q (о, х, т, у) < р (а, х, т, у), (8) l i m q (а, х, т, у) dy = lim р (а, х, т, у) dy = 1. Далее, известно, что функция q (а, х, т, у) вне области Г является фундаментальным решением уравнения (2), а при приближении точки х к границе области Г справедливо соотношение q (а, х, т, у) dy -> 0 при х -> х0£ S. (9) д—г Пусть теперь область Г не фиксирована, а движется вместе с t, т. е. имеется однопараметрическое семейство областей Г*. Обозначим через q (о, х, т, у) плотность вероятности случайной точки Q, находящейся в момент времени а в положении х, быть в момент т в положении г/, не
  • 4. 480 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН встречаясь на протяжении времени а <^ t <^ x с движущейся областью Г*. Тогда, очевидно, функция ?(<т, х, т, y)dy (10) является решением уравнения (2) и удовлетворяет следующему гранич­ ному значению: q (а, #, т, у) dy -»0 при ж -» Sa. (11) Теперь мы можем указать подход к вычислению функционала (7). Пусть движущаяся область Г* есть шар радиуса е с центром в управляе­ мой точке z (t). В соответствии с § 1 будем обозначать его через S z щ. Положим У(о,<х, 1) = i — q(o, х, r,y)dy. (12) •" Непосредственно из определения следует, что функция г|) (а, х, т) есть вероятность того, что случайная точка Q, находящаяся в момент 0 в положении х, на отрезке времени о <^ t ^ т будет «накрыта» окре­ стностью 2 2 (о управляемой точки z. Следовательно, функция я|) (а, ж, т), определенная формулой (12), есть та же самая функция, которая фигу­ рирует в функционале (7). Таким образом, для вычисления функционала (7) мы должны решить уравнение дв ' дх%дх3 У ' дх1 Х ' при условиях: ф (а, х, т) - 0, (14) |) (а, х, т) — 1 при ж -» £ а . » (15) Мы покажем, что решение задачи (13), (14), (15) представляется в виде ф (а, х, т) - е п - 2 ¥ (а, х, т) + о (е п - 2 ), (16) и получим эффективную формулу для W (а, х, т), представляющую глав­ ную часть вероятности я|) (о, #, т). § 3. Некоторые предварительные оценки В настоящем параграфе мы докажем ряд вспомогательных неравенств, связанных с фундаментальным решением уравнения (2). Кроме того, мы решим внешнюю задачу Дирихле для многомерного уравнения Лап­ ласа вне эллипсоида Se a i 2 + . . • + Kln2 - е2 (17) с единичным граничным значением. Результаты этого параграфа элемен­ тарны, однако мы выделяем их в специальный параграф, чтобы в после­ дующем можно было на них ссылаться не прерывая основных доказа­ тельств.
  • 5. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 481 Обозначим через g (о, £, т, ц) фундаментальное решение уравнения теплопроводности Как известно, оно имеет вид: g (в, Е, ?, Т]) = п.е 4(т-а) Т [2л; (t с- а ) ] Положим, далее, /•(6)= К £ 1 2 + . . . + Г 2 •'''* (20) и введем следующие обозначения: ©А. (о, Е, т) - ^g (or, lf т], t)—L-.rfr,, (21) Q, (a, E, t) = U * U (*. E, *, Л) -rr7d4. (22) Чтобы интегралы, стоящие в правых частях формул (21) и (22), имели смысл, мы, конечно, должны считать, что к < п. -; ; ^ Нам понадобятся следующие три неравенства, оценивающие фулШщи ©л (а, |, т) и Й* (а, |, т) при г (|) = е: °>л (а> Е, t) |г (5)==Е < - ^ - при т — о > 8, (23) ©л (сг, Е, т) |г {1)==е < — при т — а < 8, (24) Q*K6,t)|rR)=.<-^r. (25) Здесь С — константа, не зависящая от е, а б (е) -» 0 при е -» 0. В ы в о д н е р а в е н с т в (23), (24). Легко видеть, что • со* (о, Е • • • , Еп, т) = ©л (сг, г (Е), 0, . . . , 0, т) = (2Ь) =— — К 2 '<~> - ^ ч - ;1 [2я(т —о)] ' ' Положим т)* = г (Е) ж*, т — а = / 2 (Е) .Л Тогда из (26) получим: _1 со* (a, g, т) = - J — F (0, (27) где (.х*-1)Ч--.-+*п3 , 2 (2яг)
  • 6. 482 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Очевидно, что V (0 -> 1 при t -> 0. (29) Для дальнейшего отметим, что V (t) при больших значениях t имеет сле­ дующую асимптотику: rv> (30) '°{J) Действительно, положив в формуле (28) 2 J/Iyi = х (31) получим: ..+1/ n 2 J V(t) = -^e t * U ^/ А)"* (32) (К — константа), откуда и следует (29). Итак, имеем: щ 1°> *>х) <i*®v {*т) • (33) Но легко видеть, что V(1^) < Me) при т - о > г, (34) ^ ( т ) < С при T f f - <6> ( 35 ) откуда и вытекают неравенства (23), (24). В ы в о д н е р а в е н с т в а (25). Мы имеем: Q* (а, 1 . . ., Г , т) - О* (а, г (*), 0, . . ., 0, т) = J I JL г*(т|) ' [2я(*-<з)]2 Отсюда, полагая rf = г (£) # s — о = г2 (£) г, получим: т—о Qft (a, gf т) = _ < ? F W Л| (36) г (I) - <} где V (t) — функция, определенная формулой (28). В частности, т—о £2 «* (а, £, т) | r №)=t = - ^ jj 7 ( 0 Л. (37) О Если теперь учесть асимптотику функции V (t) при больших значениях t (см. формулу (30)), то сразу найдем: т—о £2 ^ F (t) dt < С In в при ft = 2, о ^ К (0 Л < С при /с > 2, откуда и следует неравенство (25). Одновременно мы установили, что Q»(a, £, т ) < - £ - . (38) г (S)
  • 7. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 483 Замечание к неравенствам (23), (24), (25). Пусть р (б, | , т, ц) — фундаментальное решение общего уравнения Колмогорова ~ + а** (а, 1)-^~ + Ъ1 (а, I) ~ = О. (39) v да v » *>/ Q^IQ^O д1г Исходя из этого фундаментального решения, определим функции <ол (а, £, т) и йл- (сг, £, т) соответственно по формулам (21), (22), подста­ вив в них вместо q (а, £, т, и) функцию /? (а, £, т, т]). Оказывается, что для так определенных функций о^ (а, £, т) и й* (о, £, т) справедливы те же неравенства (23), (24), (25). Действительно, в теории параболических уравнений доказывается, что при тех ограничениях на коэффициенты уравнения (39), которые мы предположили выполненными в § 1, фунда­ ментальное решение уравнения (39) мажорируется фундаментальным решением некоторого уравнения теплопроводности, т. е. для него имеет место неравенство: с -т^-1 р (а, £, т, г)) < —j- e -*-* , 2 (?-с) где у — константа. Эта оценка обеспечивает возможность буквального повторения вычислений, проведенных при выводе неравенств (23), (24), (25). Для дальнейшего нам потребуется также решить внешнюю задачу Дирихле для уравнения Лапласа U + ...+ 4 = ° (40) оря единичном граничном значении на эллипсоиде Sz (17). Мы докажем следующее предложение: ЛЕММА. Исчезающее в бесконечности решение внешней задачи Дирихле для уравнения (40) с граничным условием ^(IJIfes^1. (41) где Sz — эллипсоид (17), имеет вид 2 ^(I) = e " - - ^ + S(!;e), (42) еде а — положительная константа, однозначно определяемая размерами эллипсоида (42), а г (|) = Vx2 + . . . + f™2. При этом функция л (£, е) л/ж г (£) < 1 удовлетворяет следующим неравенствам: я(1г)<М-^^, (43) — я(£, е) < ^ ^ г - = - (44) {М — константа).
  • 8. 484 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Доказательство. Будем искать решение задачи (40)* (41) в виде v() = ^~2~1^Ж + S (¥, в), (45) г "(g) где а — пока не определенная константа, а л (£, е) — потенциал двой­ ного слоя, создаваемый эллипсоидом S£ в точке £, с не известной пока плотностью (х (ц) (через ц мы обозначаем координаты точек, лежащих на эллипсоиде Зг). Так как л (|, е) — решение уравнения (40), то оба слагаемых в правой части формулы (45) при любом значении константы а являются решениями уравнения (40). Таким образом, функция v (£), представляемая формулой (45), является решением уравнения (40). В силу хорошо известного свойства потенциала двойного слоя, граничное* условие (41) дает: ле(ц, в) = 1 - a - g ^ - (46> Г (Г)) для любого т]б^£» где через ле (г), е) обозначен предел функции л (£, е) при стремлении точки £ к точке г поверхности Sz извне. Но так как лГе(т), е) = — 2ni (г|) + л0 (т), 8), (47) где % (т], е) — значение л (£, е) в точке ц поверхности SZ1 то из (46) полу­ чаем: -2л|х й ) + я 0 (ч) = 1 - « Ч & • (48) Известно, что M v ) = U(ii) п-^- Ф , ^ , (49) J Р (м> 4i) где ф — угол, составленный направлением нормали в точке гц с радиу­ сом-вектором р (т), T]i), проведенным из точки гц в точку т]. Введем обозначения: Z t j 1 2^ /"" ~ ~ ! ^ ft' Л1) = 9 F Р (TJ» MI) C0S Ф n-i ,- - , > (50) Тогда из условия (48) мы получаем неоднородное интегральное уравнение для неизвестной плотности i (ц): р(ц)=к (ц^цг) |i Ы dSz + ф (л). (51) Уравнение (51) есть уравнение Фредгольма второго рода. Согласно изве­ стной теореме Фредгольма, для его разрешимости необходимо и дост'а-
  • 9. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 485 точно, чтобы свободный член был ортогонален ко всем собственным функ- циям сопряженного однородного интегрального уравнения (* — V(T,)= )K(41,4)ii(41)dSt. (52) iE Известно также [см. ( 3 )], что если ядро К (п, %) дается формулой (50), то уравнение (52) имеет только одну собственную функцию. Обозначим эту функцию через v 0 (r) и будем считать ее известной. Условие ортогональности дает возможность определить константу а. Запишем его: : •••'•' - 1 v0(n)d££-0. (53) ) [ r n - 2 (t]) Отсюда следует: I Vo(t|) dSt a = — ."i-JStfi. ,.. В полученной формуле константа а зависит от е, но зависимости эта лишь кажущаяся. В самом деле, обозначим через S эллипсоид 2 W + . . . +КЦП2 = 1, — . - iiv • - : - . , (54) ~ч 1 получающийся из эллипсоида 6е увеличением всех осей в — раз. Без труда обнаружим, что Vo(n)dS (55) С Vo (Л) Уо(Л) r jT dS г^(п) S Таким образом, а не зависит от е и полностью определяется размерами эллипсоида (54). Итак, функция v (g), даваемая формулой (45), при а, определяемой по формуле (55), является решением задачи (40), (41). Остается лишь проверить выполнение неравенств (43), (44). Но они непосредственно сле­ дуют из определения потенциала двойного слоя я (£, е): 1 J р {1, л) § 4. Вычисление функционала I в случае, когда уравнение . Колмогорова имеет^постоянные коэффициенты В этом параграфе вероятность р (о, х, т), а следовательно, функцио­ нал (7) будут вычисленыГдля одного важного частного случая, когда ч урав­ нение (2) имеет постоянные коэффициенты. Мы б^дем предполагать, что размерность фазового пространства R больше двух: я > 2.
  • 10. 486 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Итак, мы будем решать уравнение где ai;>, Ъ{ — постоянные коэффициенты, при начальных и граничных условиях (14), (15), которые в дальнейшем будем записывать в виде: г|) (т, х, х) = О, (57) ф(а, ж, т)|„ = 1, (58) ^z (а) где %Z(<J) —сфера радиуса 8 с центром в точке z (a). Прежде всего перейдем от этой задачи к задаче с граничным условием на сфере радиуса Б С центром в начале координат. Для этой цели в про­ странстве (z, t) введем новые координаты по формулам z = £ + z (t), о < * < s, (59) так, что х = I + z (а), у - 1 + z (s). 1 (60) При таком преобразовании координат сфера 22(о) перейдет в сферу Sz; ll2 + . . . + Ъп* = в2. (61) Положим z Ф(а, £, т) = я|) (а, £ + И> т )- (62) Тогда для функции ф (а, £, т) мы получаем дифференциальное уравнение ^ + а ^_4Х+(6{-/(а))-^=0 (63) ш условия: Ф (т, 6, т) - 0, (64) Ф(а, I, т)| 5 е = 1. (65) Чтобы решить уравнение (63) при условиях (64), (65), нам потребу­ ются вспомогательные построения. Нашим первым шагом будет конструкция некоторого специального решения уравнения Для того чтобы получить это специальное решение, перейдем с помощью линейного преобразования от координат J-1, . . ., £п к координатам £ . . ., £п, в которых уравнение (66) приведется к виду §+Дф 0 = 0, (67) где А — оператор Лапласа. При такому преобразовании координат сфера Sz перейдет, очевидно, в эллипсоид Sz ххГ + . . . + к¥* = е2, (68) ij где Хъ . . ., Кп суть собственные значения матрицы || a |.
  • 11. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 487 Обозначим через g (а, £, т, rj) фундаментальное решение уравнения (67): g (о, I т, ч) = - ! z exp { - ^ J l j . (69) [2я (т - а)] 2 Положим ф0 (о, f, т) = е"-* _ _ ^ _ + я (f, е) _ - g (а, I , т, л) Г е"-* ^ г - + л (л, в) 1 £/ч, (70) где а — константа, определенная формулой (55), а я (1, е) — потенциал двойного слоя, создаваемый эллипсоидом Sz в точке £. Перепишем фор­ мулу (70) в несколько ином виде: ф0 (а, I, т) = ф0 (а, I , т) + бф0 (а, £ т), (71) где Ф (а, £: т) = е - 2 _ ^ о _^ g (а> Б> Tj ц) _Л_^ d (72) Г (g) Г " (Т|) Очевидно, функция ф0 (а, £, т) является решением уравнения (67) м удовлетворяет начальному условию Фо(т, I, т) = 0. (73) Перейдем теперь от координат £', . . . ,"|п вновь к координатам I1, . . . , £п, и пусть при этом функции •ф0(а, | , т), ф0(а, |, т), бф 0 (а, |", т), g(o, f, t, TJ) перейдут соответственно в функции qT0(cr, | , т), ф0(сг, £, т), бф 0 (а, £, т), g(<x, £, т, TJ). Нам впоследствии понадобится явное выражение для функции <р0(а, £, т). Чтобы выписать его, надо знать, как запишутся в координа­ тах £ . . . , 1п функции г(1) и g(a, £, т, т]). Это легко выяснить. В са­ мом деле, обозначим через (щ элементы матрицы, обратной матрице ||ai;"||, так что aV* = д£. (74) Тогда легко можно убедиться, что (-п — g | = [ay (-п- — Г) (rj^ — i J )l 2 • Учитывая еще, что dt = VK • • • К dr], (76)
  • 12. 488 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН мы получим для функции ф0 (а, £, т) следующее явное выражение: а Фо (о, £, т) = *™ ^ - J g(а, £, т, т,) 8 " ' : ' ' К * * - * * ^ (77) 2 2 [*#'] K^W] где g(а, g, т, I]) = ^ ехр 1 4(т _б) | . (78) [2я(т-с)]2 Итак, доказана следующая ЛЕММА 1. Функция Фо(<*> £, t) = ф0(а, £, т)+бф 0 (а, £, т), гЗе ф0 (сг, £, т) определена формулой (77), является решением^ уравнения* (66) а удовлетворяет нулевому начальному условию Ф0(т, £, т) = 0. (79). Следует отметить, что функция ф0 (а, £, т) не равна единице на сфере Sz. Однако, как будет выяснено дальше, ее граничное значение в некото­ ром смысле лишь несущественно отличается от единицы. Теперь уже все подготовлено, чтобы решать уравнение (63) при усло­ виях (64), (65). Сначала мы найдем некоторое специальное решение урав­ нения (63), удовлетворяющее лишь нулевому начальному условию (64). Оценив затем граничное значение этого специального решения, мы уви­ дим, что оно лишь несущественно отличается от единицы. Отсюда мы выведем, что и само это специальное решение лишь несущественно, с точностью до величин более высокого порядка малости по е, отличается от точного решения задачи (63), (64), (65). После этого полученное спе­ циальное решение будет упрощено путем отбрасывания некоторых чле­ нов и, таким образом, мы получим приближенное решение задачи (63), (64), (65). Перейдем к осуществлению этой программы. Будем искать специальное решение уравнения (63), удовлетворяющее условию (64), в виде Ф (<т, g, т) - фо (а, 6, т) + ф! (а, £, т), (80) где фо (сг, £, т) — только что построенное специальное решение уравне­ ния (63), удовлетворяющее условию (64), а фх (а, £, т) — пока не извест­ ная функция. Непосредственно проверяется, что фх (сг, £, т) должна удовлетворять неоднородному параболическому уравнению &. + а н - i , + [bl - 7}' (о)] - % = _ [ & * _ z* (о)] а Ф«( д '£' т > (81) и начальному условию Ф1 (т, £,. т) = 0. (82)
  • 13. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 489 1Решение задачи (81), (82) во всем пространстве В с помощью формулы, аналогичной формуле (6) § 1, очевидно, невозможно, так как правая часть уравнения (81) при £ = О имеет полюс порядка п, получающийся при дифференцировании функции я (£, г). Однако эту трудность можно обой­ ти, так как нас интересует решение ф1 (а, £, т) лишь вне шара, ограни­ ченного сферой Se. Для этого рассмотрим функцию q (a, х, s, у), введен­ ную в начале § 2 и равную плотности вероятности того, что случайная точка Q, находящаяся в момент времени а в положении х, в момент т находится в положениии у, не встречаясь при этом на протяжении вре­ мени а <; t ^ s с шаром, ограниченным сферой 2 Z (o радиуса г с центром в управляемой точке z (t). Очевидно, функция q (or, Б, s, ц) = q (a, I + z (а), s, т) + z (s)) = q (а, х, s, у) (83) см. формулы (59), (60)) является вне сферы Se фундаментальным реше­ нием уравнения (63), удовлетворяет граничному условию Jg(cr, g, s, r)dv) ^ -0, (84) ж решением задачи (81), (82) будет функция ф2 (о, g, т) Л tf Л ? (<r, I, s, т|) [6* - **' (5)] ^ о ^ ^ т ) dt), (85) 'а 4 *» где i?£ обозначает дополнение в й к шару, ограниченному сферой Sz. Очевидно, что ф! К S *) |^6S£ - 0. » Таким образом, нами получена следующая ЛЕММА 2. Функция Ф(о, £, т) =ф 0 (а, £, T)+(^(cr, £, т), (86) где ф0 (о, £, т) определена формулой (70), а фа (а, £, т) — формулой (85), является решением уравнения (63), удовлетворяет нулевому начальному условию Ф (т, £, т) = 0 и имеет те же граничные значения на сфере Ss, что и функция ф0 (<т, £, т). Теперь мы докажем, что функция Ф (о, £, т) вне сферы радиуса г0 (т*0 — любое конечное, не зависящее от 8 число) аппроксимирует решение задачи (63), (64), (65). Доказательство этого факта базируется на одной лемме об оценке решений параболического уравнения. Сформулируем эту лемму. ЛЕММА 3 (об оценке решений параболического уравнения). Пусть >и (а, g, т) — решение параболического уравнения *L = _ а и ( 0 , 1)-^U-bl(о, l)^^L(и), (87)
  • 14. 490 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН удовлетворяют^ условиям: и(т, £, т) = 0, (88> и (в, £, т) | адве = W(a, т), (89) где fС при х — а < е, VF(6, т ) < х / . ^ (90> v у v ^ 16(e) л/? и х — 0 > е ' (С — константа, 6 (е) -* 0 л/ж 8 -» 0). Тогда для решения и (а, £, т) справедлива следующая оценка: | и (а, £, т) | < A (£, е) + 6 (8) х (а, £, т), (91). где А (£, е) — положительная функция, имеющая при | £ j > г0 порядок о (8П~2), а л/(сг, |, т) — решение уравнения (87), имеющее при а = т нуле­ вые начальные значения и принимающее на сфере $г единичное значение. Д о к а з а т е л ь с т в о . Положим г/; (а, т) = г^ (а, т) + га2 (а, т), (92), где функции WX (а, т), w2(a, х) определены следующим образом: 7 _ (С при х —а < е, ^1 (<*, t) = п . (93> 14 ; v (0 при х — ог> 8, ' _ f0 при х — а<Г 8, ^>(а, т) = L / 4 ^ (94> "V ' ' 16(8) ПРИ Т — 0 > 8. Решения уравнения (87), имеющие нулевые начальные значения и крае­ вые значения, равные w(a, t), w1(a, т), w2 (0, т), обозначим соответствен­ но через и (а, | , т), ui (а, £, т), и"2 (о, £, т). Очевидно, и (а, £, т) = щ (а, |, т) + и, (а, £, т). (95> На основании теоремы о максимальном значении для решений пара­ болических уравнений, решение и (а, £, х) задачи (87), (88), (89) оцени­ вается следующим образом: и (а, £, т ) < й ( а , £, т). (96> Оценим отдельно функции их (а, £, т) и м2 (о, £, т). Для т (а, | , т) оцен­ ка получается из той же теоремы о максимальном значении решения пара­ болического уравнения: Мог, Б, т ) < 6 ( е ) х ( а , ё, т). (97) Для получения оценки функции Mj_(a, £, т) потребуются более тонкие рассуждения. Прежде всего оценим ги (о, £, т) при т — a < s. Положим Т О - * ^ (98).
  • 15. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 491 где К — константа, К ^> С. Будем теперь искать решение уравнения (87) с начальным значением, равным у (£), и с граничным значением на сфере SE1 равным К, в виде v(o, £,,т) = Y(g)-i- v0(o, I, r). (99). Тогда для функции v0 (a, £, т) получается неоднородное уравнение %-+а^(р, g ) ^ + & > , E)-§-=L[T(g)b (ЮО) которое мы должны решить при нулевых начальных и нулевых гранич­ ных условиях. Такое решение, как мы знаем, вне сферы S£ дается форму­ лой: v0(a, £, т ) = — ds q(e, £, s, ц)Ь [т(г))Ыт]. (101) Итак, v(o, £, т) = г (|) — ^ с?5 [ q(e, I 5, Tj)L[Y(Ti)]rfT|. (102) Очевидно, й 2 (а, £, т ) < г ? ( а , £, т). (103) Нам остается, таким образом, оценить лишь функцию v (с>, £, т) при, | g j >• г0 и т — а <^ е. Заметив, что ^[тШО* 1 - 1 rn+i(E) r n(g)j (104V» где У11? /I2 — достаточно большие константы, и принимая во внимание неравенство q(o, | , т, т ] ) < / ? ( а , | , т, г)), (105)' из формулы (102) получаем: I v (a, g, т) ; < у (£) + ^ dv р (a, g, 5, rj) - ^ Т Г у ^ + + ds U ( a , g, * , T , ) - ^ l ? - r f T | . (106). Интегралы, стоящие в правой части неравенства (106), обозначим соот­ ветственно через 1г, 1.2 и оценим отдельно их величины. Мы имеем: Л < Л х е " - 2 - ' ^ as f ^ (a, £, <- !]) — i ,, dr = r i «i '~ w = Л! • e"-2-^ Jrf*.(B„_V (a, ^ , s ) т о ( e " ' 2 ) , (107), где 0 <^ v <^ 1. Отсюда, принимая во внимание неравенство co,j_v(a, £, s)<" •— г
  • 16. 492 Б. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН находим: т 1г < А1 ~^~~ 8-2- [ds+O (8-2). (108) г (Е) J Следовательно, при т — о <; 8 и | £ | > г0 Л « о (е^-а). (109) Аналогично получим, что при т — о <^ 8 и | £ | У> г0 12^0 (8^2). (НО) Таким образом, функция v (a, £, т), мажорирующая на границе сферы £ £ решение 1гх (а, £, т), при | £ | > г0 и т — а ^ 8 имеет порядок о (еп~2). Отсюда следует, что и само решение их (а, £, т) при | £ | > г0 и т — cr ^ e имеет порядок о (&п~2). Несколько изменяя предыдущее построение, можно убедиться, что такая же оценка для щ (о, £, т) имеет место и при т — а ^> е. Лемма доказана. Теперь мы можем доказать, что функция Ф (а, £, т), фигурирующая в формулировке леммы 2, вне сферы любого конечного радиуса с точно­ стью до величин порядка о (8П~2) аппроксимирует решение задачи (63), (64), (65). Иными словами, справедлива следующая ЛЕММА 4. Пусть ф (а, £, т) — решение уравнения (63), удовлетворяю­ щее начальным и^граничным условиям (64), (65), а Ф (а, £, т) — решение уравнения (63), определенное в лемме 2. Тогда для , юбого г0, не зависящего от 8 п/ж | £ | > г0, решение Ф (а, £, т) с точностью [до величин порядка о (еп~2) аппроксимирует решение ф (о, £, т): Ф (а, £, т) - Ф (а, £, т) ^ о (8—2). (111) Доказательство. Обозначим через и (а, £, т) разность функ­ ций ф и Ф: и (а, £, т) = < (а, £, т) — Ф (а, | , т). р (112) Функция и (а, £, т) является решением уравнения (63) и удовлетворяет нулевым начальным условиям. Далее, из формулы (85) видно, что гра­ ничные значения функции и (а, £, т) на сфере Se совпадают с граничны­ ми значениями функции ф0 (о, £, т) -—jp0 (б, £, т). Оценим эти послед­ ние. Для этого запишем разность ф — ф0 в следующем виде: ? (о, 6, т) - фо (а, 6, т) = {Ф (а, Б, т) - ^ 8 - 2 _ | " - + я (I, 8) j j - - ^ g ( a , | , т, ^ ) ^ п - 2 7 _ ^ _ + я(л ? e)]efrj. (ИЗ) Граничные значения слагаемого, заклю еиного в фигурную скобку в правой части формулы (ИЗ), равны нулю (см. § 3). Остается, таким обра­ зом, оценить лишь граничные значения второго слагаемого на сфере Sz (в координатах £ . . . , £п — на эллипсоиде Se).
  • 17. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 493 Так как для потенциала двойного слоя я (3-, е) справедлива оценка (43), то, очевидно, имеем: g(<x, £, т, т]) + я(т), е) rfrj ! (Т]) ^ ?г 2 1 Л! • е ~ • (оп__2 (а, | , т) -|- Л 2 • е"- . соп_! (а, g, т), (114) где А1 и Л2 — константы, а соп„2 (о, g, т) и co n _ 1 (a, £, т) — функции, определенные формулой (21) соответственно при к = п — 2, А = п — 1. Используя теперь неравенства (23), (24), получаем., что граничные зна­ чения второго слагаемого в формуле (113), а следовательно, и граничные значения w (а, т) функции и (а, £, т) удовлетворяют условиям леммы 3. Следовательно, на основании леммы 3, мы можем заключить, что соотно­ шение (111) справедливо. Лемма 4, таким образом, доказана. Упростим полученное приближенное решение Ф (а, £, т), отбросив в нем величины, имеющие при | £ | > г0 порядок о (е п ~ 2 ). Чтобы сделать это, выпишем решение Ф (о, g, т) в явном виде. Вспоминая формулы (70), (71). (80), (85), мы можем написать: Ф (о, I, т) = ф0 (a, g, т) 4- бф 0 (а, £, т) + + ^ds ^ q (а, т ; s, л) fft''— z1' (5)] - Д - [ср0 (о, g, т) + б ф0 (а, £, т)Ыи. (115) Прежде всего ясно, что при 111 > /•„ бф 0 яго(е"-2). (116) Поэтому второе слагаемое в правой части формулы (115) можно отбро­ сить. Несколько сложнее упрощается интеграл, стоящий в правой части формулы (115). Во-первых, можно отбросить член h = ds g(a, £, s, ц) [Ьг — z1'(s)]-?-r [6<p0(s, r,x)dr. (117) В самом деле, |/,K^ds ^{a,l,s,v[)bi-zi'{s) • б ф 0 ( 5 , 1], t ) fi?T|, dr: Но так как [см. формулы (70), (71), (43), (44)] I д г б ф 0 ( 5 , ц, т) < e " - i i ? ( r ] ) , дг где R (т)) в нуле имеет полюс порядка не выше п, то h< 8 " - 1 ~ v d s p (a, I, s, ii) | V — zv (s) I ! B 1 ft) j rfti, (119) где 7/j (т)) имеет теперь в нуле уже полюс порядка не выше п — v (0 <J v <C 1). Таким образом, 1Х « О (8™-2). (120) 2 Известия АН СССР, серия математическая, № 4
  • 18. 494 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Нам остается упростить член т J, = ^ds^q(o, I, s, r) [Ъ1 - zi (в)] - Л [Фо (б-, л , x)]di. (121) Покажем, что при j £ j > г0 т / 2 = ds р (о, g, s, Ti) [6* - г*' (s)] Л - [ф0 (s, л, t)]dri + о(в'-*). (122) Мы имеем: I2 = [jdsip(a, I, s, т)) [ й * _ г * » ] - Л - [ф0 (s, т), т)] + а + ^ s ^ (р (а, £, 5, т]) — g (а, £, 5, т|)] [6* — z1' (s)] JJ [<р0(s, rj, t)] drj + о т + ds p(a, I, s, т]) [6* - zi'(s)} Л - [Фо(*, т|, x)]di. (123) Последнее слагаемое в правой части формулы (123) имеет, очевидно, порядок о (еп—2). Обозначим через и (а, £, т) второе слагаемое. Функция и (а, £, т) при а = т имеет нулевое начальное значение и является в области /? е решением уравнения (63). Так как | - ^ [ ф о ( * , Т1, т ) ] | < е ™ - 2 Д ( т 1 ) , (124) где R(r) имеет полюс порядка не выше п — 1, то граничные значения функции и (о, £, т) оцениваются следующим образом: | и (a, g, т) |E6S£ < М- 8—^ Qn_T (а, g, т) ^т (125) Отсюда, на основании неравенства (25), заключаем, что и(о, 1,т)^<Ь(г), (126) • где б (е) — 0 при г — 0. Следовательно, всюду в области Л£ > > |и(а, £, т) | < б (е) а (а, £, т). (127) Лемма 4 и неравенства (120), (127), а также формула (123) доказывают следующее предложение. ЛЕММА 5. Функция т Ф (а, | , т) = ф0 (<т, I, х) + ds [p(a, I, s, л ) [Ь{ - z*' («)] ^ О ^ т , , (128) где ф0 (a, £, т) определена формулой (77) тг/ж j g | > г0 (г0 — произвольное, не зависящее от е положительное число), с точностью до величин порядка о(еп—2) аппроксимирует решение ф (а, £, т) уравнения (63), удовлетво­ ряющее условиям, (64), (65).
  • 19. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 495 Чтобы подвести итог всем рассмотрениям настоящего параграфа, нам остается вновь возвратиться к старым координатам х и у согласно формулам (59), (60). Проведя соответствующие замены, на основании леммы 5 мы можем сформулировать следующее предложение. ТЕОРЕМА 1. Пусть движение управляемой точки z, имеющей в на­ чальный момент времени G положение z (о), описывается системой диф­ ференциальных уравнений z1 = f (z1, . . . , zn, и1, . . . , ur), i = 1, . . . , п, где (и1, . . . , иг) — управляющие параметры. Пусть в пространстве В переменных z1, . . . , zn движется еще случайная точка Q, плотность пере­ хода которой р (о, х, х, у) удовлетворяет уравнению Колмогорова с по­ стоянными коэффициентами dp i а д2р у i dp A -т£- - - № —г*—.. ч- о —ч- = 0. д 3 дхгдх1 дхг Обозначим через 2 Z шар радиуса е с центром в управляемой точке z, дви­ жущейся вместе с z. Обозначим, далее, через я|) (а, х, т) вероятность того, что случайная точка Qt находящаяся в момент о в положении х, на отрезке времени о <J t <J х будет «накрыта» шаром 2 Z . Тогда вероятность if (а, х, х), являющаяся функционалом управления и (t), представляется при х — z (а) | ^> г0, где г0 — произвольное -положительное, не зависящее от е число, в следуюгцем виде: Ц (сг, х, х) - 8П~2 [ij?0 (о, х, х) +Цг (а, х, х)]+ о (г71-*). Чтобы выписать явные выражения для функций aj)0 (а, х, х) и рг (а, х, т), введем следующие обозначения: а) Хь . . . , Хп — собственные значения матрицы а1Ц б) || dij -~ матрица, обратная матрице || aij ||; в) G (а, х, х, г) = g (G, x — z (G), X, TJ) = . . = Kexpl—: 2 4тг^) —}; [2я(т — с)] г) а — константа, не зависящая от уравнений, описывающих движе­ ние точек z и Q, и определяемая формулой (55) § 3. Тогда П—2 [а. • (я* - zl (в)) (xj — ^ (а))] Т " •S G{G X, х, т|) ^=2"-*% *i (а, *, т) = J efe J p (а, я;, в, у) [Ь1 - **' (s)) ^ W ) dy. Таким образом, теорема 1 дает явное выражение для главного члена вероятности tj) (а, х, х) и, следовательно, для главного члена функцио­ нала (7).
  • 20. 496 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН § 5. Вычисление функционала (7) в общем случае В настоящем параграфе вероятность г|э (а, х, т), а следовательно, и функционал (7) будут вычислены для случая, когда коэффициенты урав­ нения Колмогорова зависят от а и х. Мы предполагаем, что эти коэффи­ циенты удовлетворяют условиям а), б), в), сформулированным в § 2. Схема вычисления в значительной степени воспроизводит схему, которой мы следовали в предыдущем параграфе, поэтому подробно мы будем про­ водить лишь существенно новые построения. Итак, вам нужно решить уравнение + al5 ^ ^^-£ij+bi^x^° (129> при условиях -ф (т, х, т) = 0, (130) я|)(а, Х) t) S o = l. (131) Как и в § 4, с помощью формул (51), (60) приведем эту задачу к за­ даче решения уравнения : § + « i i ( £ + 2 ( a ) , a ) - i ^ r + L64S + 3 ( o r ) , a ) - z ' - ' ( a ) ] J | - = 0 (132) при условиях <р(тЛ, т) = 0, (133) Ф(а, 6, T)| S E = 1. (134) Перепишем уравнение (132) в несколько иной форме: : I J + « у ( * ( " > . ° ) - ^ Г + 1^(6 + z(а), о)-аН*(«), а)1-^Х + + [6*(5 + 2 (а),а)-^(а)]^-=0. (135) Нашим первым шагом будет конструкция некоторого специального реше­ ния q>J (a, £,' т) уравнения • ^ + а « (2 (0), О) - ^ ^ = 0. (136) Для того чтобы получить это специальное решение, перейдем с по­ мощью линейного преобразования от координат I 1 , . . ., | , г к координатам I"1» . • . , Т в которых уравнение (136) запишется в виде §-+Аф„=0. (137) Такое преобразование координат теперь уже зависит от параметра 9. Сфера Sz перейдет, очевидно, в эллипсоид ^(9)1" 1 2 + . • . + М В ) | п , = е2, ( 138 ) где Ях (0), . . ., >„п(0) суть собственные значения матрицы a^(z (0), 0||. Так же как и в предыдущем параграфе, мы можем сконструировать функцию Ф90 = Ф° (*, 1*) + бфо № *)> ( 139 )
  • 21. СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 497 где Ф0 «г, I т) = г - -Щ- - J j(o, I х, л) ^Щ^1^ <**>) которая является решением уравнения (137) и удовлетворяет нулевому начальному условию. Перейдем теперь от [координат £ . . ., gn вновь к координатам £ . . ., |п> и пусть при этом функции 5 Фо' Ф~о' Фо> #9 перейдут соответственно в функции ~е о с ~о е Фо. фо, О фо, g . Мы можем выписать функцию ф0 (a, g, т) в явном виде. Для этого, как и раньше, обозначим через а) (z (8), 8) элементы матрицы, обратной матрице || al'J (z (в), 8) ||, так что а « И в ) , 9)ад.( 2 (в), в) = (141) Тогда ф > , | , Т) = в»"* ^(6) п—2 2 «{,•(«(6), 0] - J «• (а, £, т, Л) ^ • а ( 0 ) - П 1 ( 9 ) . . . М 9 ) f (142) 2 К,-(М9), 0)rf-V] где £ (а, g, т, т)) = j - exp ^ '— 4(T_g) J -(143) - 2 [2я(т-в)] Рассмотрим теперь функцию фо (a, g, т), т. е. построенную нами функ­ цию при значении параметра в. равном о. Функция фо (а, g, т) уже не удовлетворяет уравнению (136), в коэффициентах которого вместо 8 подставлено о Однако очевидна следующая ЛЕММА 1'. Функция Ф (а, g, х) = фо (а, | , т) + бфо, о где фо определена формулой (142), является решением дифференциального уравнения ^ . + ^(,(а),а)^-^.[ф»1^=0 (144) и имеет нулевые начальные значения при а = т. Теперь, как и в предыдущем параграфе, мы можем искать специаль­ ное решение уравнения (132), имеющее нулевые начальные значения, в следующем виде: Ф (а, Е, т) - фо7 (а, g, т) + фх (а, g, т), (145)
  • 22. 498 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН где фо (сх, £, т) — только что построенное решение уравнения (144), а ф1 (<?, £ f) — пока не известная функция. Подставляя Ф (о, £, т) в урав­ > нение (132) и учитывая лемму 1' дляф х (о, £, т), мы получим неоднородное параболическое уравнение %• + & (I + ж {а), о)^-+ [Ь> (Б + г (а), о) - * • » ] | f = = - ( № ( £ > z (а), а) - a» (z (а), о)}8^'1' %) + + lb' (£ + z (a), a) - z»' (a)] a < ( ° ' * ' T > + A. ft» (a, g, T)]e==( j {i46) и начальное условие Ф (т, ё, т) = 0. Х (147) Так как правая часть уравнения (146) имеет при £ = 0 полюс порядка п (а не (д + 1)!), то мы можем почти буквально повторить все рассужде­ ния предыдущего параграфа и доказать лемму, аналогичную лемме 5. ЛЕММА 5'. Функция Ф (а, £, т) - Ф° (о, £, т) + + cfe р (а, 1 + z (а), 5, т) + ^(5)). [а1* (т) + z (s), 5) — а4* (2 (s), 5)] х х + [b {ri + z т ^s) -zi (s)] -^H+ + -^Гф?(*.Л.т)]в=,}^. (148) где фо (сг, 5» т ) определена формулой (142), при | £ j > г0 (г0 — произ­ вольное положительное число, не зависящее от г) с точностью до величин порядка о (вп~2) аппроксимирует решение ф (о, £, т) уравнения (132), удовлетворяющее начальным и граничным условиям (165)—(169). Чтобы формулировать теперь окончательный результат, мы вновь должны перейти к координатам х и у по формулам (51), (60). Тогда из леммы 5 последует теорема, аналогичная теореме 1 предыдущего пара­ графа. Мы не будем здесь выписывать окончательных формул, так как при желании читатель легко это сделает сам. Поступило 29.Х.1960 ЛИТЕРАТУРА 1 К о l m o g o r o f f A.- N-, Uber die analytischcn Methoden in der Wahrscheinlich- keitsrechnung, Math. Ann., 104 (1931), 415—458. 2 С о б о л е в С. Л., Уравнения математической физики, Физматгиз, М-, 1954. 3 Б о л т я н с к и й В. Г., Г а м к р е л и д з е Р. В., П о н т р я г и н Л. С , Тео­ рия оптимальных процессов. I, Известия Ак. наук СССР, серия матем., 24 (1960), 3-42. 4 М и щ е н к о Е . Ф . , П о и т р я г и н Л . С , Одна статистическая задача оптималь­ ного управления, Доклады Ак. наук СССР, 128, № 5 (1959), 390—392.