АКАДЕМИЯ НАУК СССР
ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР
СООБЩЕНИЯ ПО ПРИКЛАДНОЙ МАТЕМАТИКЕ
МЛ. КОНОВАЛОВ
МЕТОД ПЕРЕБОРА
В АДАПТИВНОМ УПРАВЛЕНИИ
СЛУЧАЙНЫМИ ПРОЦЕССАМИ
С ДИСКРЕТНЫМ ВРЕМЕНЕМ
*
ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР *Н СССР
УДК 519. 6
Ответственный редактор
доктор техн. наук, проф. И. А. Ушаков
Многие адаптивные стратегии используют бдин
общий принцип, который заключается в организации
перебора на некотором конечном или счетном множестве. В работе приведены услрвияг когда такой подход
возможен. Продемонстрирована проверка этих условий
для конкретного класса объектов управления. '
Рецензенты: Г. А. Агасавдян,
Н. С. Васильев
QJ Вычислительный центр
Академии наук СССР, 1989
Св. план 1939, поз. 91
ПРЕДИСЛОВИЕ
В теории адаптивного управления используются три
основных приема построения стратегий. Первый заключается в
сведении адаптивной задачи к классической путем, все более полной
идентификации объекта в процессе управления (характерные
работы недавнего периода, использующие идентификационный
подход (з, II, 14 9 Я). Два других объединяются в рамках так
называемого прямого подхода.
Согласно одному из них адаптивные
стратегии строятся в виде рекуррентных алгоритмов квазигра-
диентногог типа, осуществляющих поиск оптимальной точки на
некотором континуальном множестве. Это множество либо задано
изначально, либо появляется в качестве совокупности всех
распределений вероятностей на исходном (как правило конечном)
наборе вариантов. Детальная разработка этого метода
содержится, например, в [ъ]. Остановимся на способе адаптации, идея которого
восходит к [13] и который разрабатывался вначале в направлении,
известном под названием "поведение автоматов в случайных
средах9 (J2, 2, 10]. Суть его вкратце заключается в следующем. Имеется класс цроцессов с независимнми значениями с конечным
множеством управлений. Адаптивная стратегия-для этого класса
организуется как процесс перебора управлений из заданного
конечного множества. При этом продолжительность применения
-3-
выбранного управления зависит от реакций процесса такш
образом, что доля времени, в . течение которого применяются
наиболее выгодные управления, стремится к единице. Развитие
указанного направления показало, воамокнооть обобщения на все
более сложные классы объектов: процессы с независимыми
значениями со счетным множеством управлений [5] 9 марковские цепи с
конечными [Щ и непрерывными [43 множествами состояний и
управлений, случайные последовательности достаточно общего
вида [I, 7]. Во всех перечисленных случаях обнаруживается
общая ситуация: заданный класс процессов порождает конечное или
счетное множество стратегий, которое "перебирается" в
процессе управления с "Целью выявления и преимущественного
применения наилучшей стратегии. Мы называем такой подход методом
перебора, желая подчеркнуть его существенно дискретный характер. В гл. I исходным пунктом является не класс, процессов,
а заданное счетное множество стратегий. Построена стратегия,
которая в определенном смысле не хуже, чем наилучшая
стратегия из этого множества.