Коновалов М.Г. «Метод перебора в адаптивном управлении случайными процессами с дискретным временем»

Читать онлайн «Метод перебора в адаптивном управлении случайными процессами с дискретным временем»

Автор Коновалов М.Г.

АКАДЕМИЯ НАУК СССР ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР СООБЩЕНИЯ ПО ПРИКЛАДНОЙ МАТЕМАТИКЕ МЛ. КОНОВАЛОВ МЕТОД ПЕРЕБОРА В АДАПТИВНОМ УПРАВЛЕНИИ СЛУЧАЙНЫМИ ПРОЦЕССАМИ С ДИСКРЕТНЫМ ВРЕМЕНЕМ * ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР *Н СССР УДК 519. 6 Ответственный редактор доктор техн. наук, проф. И. А. Ушаков Многие адаптивные стратегии используют бдин общий принцип, который заключается в организации перебора на некотором конечном или счетном множестве. В работе приведены услрвияг когда такой подход возможен. Продемонстрирована проверка этих условий для конкретного класса объектов управления. ' Рецензенты: Г. А. Агасавдян, Н. С. Васильев QJ Вычислительный центр Академии наук СССР, 1989 Св. план 1939, поз. 91 ПРЕДИСЛОВИЕ В теории адаптивного управления используются три основных приема построения стратегий. Первый заключается в сведении адаптивной задачи к классической путем, все более полной идентификации объекта в процессе управления (характерные работы недавнего периода, использующие идентификационный подход (з, II, 14 9 Я). Два других объединяются в рамках так называемого прямого подхода.

Согласно одному из них адаптивные стратегии строятся в виде рекуррентных алгоритмов квазигра- диентногог типа, осуществляющих поиск оптимальной точки на некотором континуальном множестве. Это множество либо задано изначально, либо появляется в качестве совокупности всех распределений вероятностей на исходном (как правило конечном) наборе вариантов. Детальная разработка этого метода содержится, например, в [ъ]. Остановимся на способе адаптации, идея которого восходит к [13] и который разрабатывался вначале в направлении, известном под названием "поведение автоматов в случайных средах9 (J2, 2, 10]. Суть его вкратце заключается в следующем. Имеется класс цроцессов с независимнми значениями с конечным множеством управлений. Адаптивная стратегия-для этого класса организуется как процесс перебора управлений из заданного конечного множества. При этом продолжительность применения -3- выбранного управления зависит от реакций процесса такш образом, что доля времени, в . течение которого применяются наиболее выгодные управления, стремится к единице. Развитие указанного направления показало, воамокнооть обобщения на все более сложные классы объектов: процессы с независимыми значениями со счетным множеством управлений [5] 9 марковские цепи с конечными [Щ и непрерывными [43 множествами состояний и управлений, случайные последовательности достаточно общего вида [I, 7]. Во всех перечисленных случаях обнаруживается общая ситуация: заданный класс процессов порождает конечное или счетное множество стратегий, которое "перебирается" в процессе управления с "Целью выявления и преимущественного применения наилучшей стратегии. Мы называем такой подход методом перебора, желая подчеркнуть его существенно дискретный характер. В гл. I исходным пунктом является не класс, процессов, а заданное счетное множество стратегий. Построена стратегия, которая в определенном смысле не хуже, чем наилучшая стратегия из этого множества.