MATLAB.Exponenta
MATLAB и Simulink на русском
Технологии разработки и отладки
		сложных технических систем

Оптимальные и робастные системы управления\Mu-Analysis and Synthesis Toolbox

Веремей Е.И. Пособие "Mu-Analysis and Synthesis Toolbox"

В оглавление книги \ К следующему разделу \ К предыдущему разделу

Глава 1. Элементы теории оптимизации по нормам и

1.5. Задача LQR-оптимального синтеза

Рассмотрим ещё один частный вариант задач оптимизации по норме пространства -- исключительно популярную задачу LQR-оптимального синтеза. Целесообразность её рассмотрения определяется тем, что в отличие от предшествующего параграфа, в качестве основного вычислительного подхода здесь выступает решение матричного алгебраического уравнения Риккати. Заметим, что на этом подходе основаны все инструментальные средства оптимизации по нормам пространств и , реализованные в ППП -Tools. Однако относительная простота LQR задачи позволяет детально обсудить ту роль, которую играет уравнение Риккати во всех задачах данного направления.

Вначале приведём постановку задачи LQR-оптимального синтеза в традиционной форме.

Пусть задана математическая модель объекта управления

, , , , (1.5.1)

где , - матрицы с постоянными компонентами, причем пара является стабилизируемой, - заданный постоянный вектор. Наряду с моделью объекта будем рассматривать уравнение регулятора

,(1.5.2)

где - постоянная матрица. Введём в рассмотрение интегральный квадратичный функционал

,(1.5.3)

заданный на движениях замкнутой системы (1.5.1), (1.5.2). Здесь - знакоположительная, а - положительно определенная симметрическая матрица. Будем считать, что пара является обнаруживаемой.

При этом задача LQR-оптимизации имеет следующий вид:

, (1.5.4)

где - множество матриц размера с постоянными вещественными компонентами, для которых матрица является гурвицевой.

Теперь трансформируем поставленную задачу (1.5.4) к эквивалентной задаче оптимизации по норме пространства . С этой целью запишем математическую модель объекта в изображениях по Лапласу

(1.5.5)

и введём в рассмотрение вспомогательный вектор

. (1.5.6)

Рассматривая вектор как вход, а вектор - как выход LTI-системы, где , в соответствии с формулами (1.5.5) и (1.5.6) представим уравнение объекта управления в tf-форме

или . (1.5.7)

Здесь - соответствующие блоки передаточной матрицы объекта управления от входа к выходу:

. (1.5.8)

Учитывая, что в соответствии с (1.5.2) уравнение регулятора можно представить в виде , получим передаточную матрицу , связывающую вектор с вектором :

. (1.5.9)

Тогда изображение по Лапласу вектора для замкнутой системы имеет вид

.(1.5.10)

Обратим внимание на то, что компоненты вектора являются строго правильными дробно-рациональными функциями, причём, если , эти функции не имеют полюсов в правой полуплоскости.

С формальной точки зрения вектор можно трактовать, как передаточную матрицу LTI-системы со скалярным входом , имеющим единичное изображение по Лапласу. Тогда замкнутая система может быть представлена блоком, изображённым на рис. м.1.

Рис. 1.5.1.

Теперь вновь обратимся к функционалу (1.5.3), обратив внимание на то, что согласно (1.5.6), справедливо равенство

,

откуда следует, что

. (1.5.11)

Однако в соответствии с формулой Парсеваля

(1.5.12)

Тогда, на основании (1.5.11), (1.5.12) имеем

, (1.5.13)

т.е. значение интегрального квадратичного функционала совпадает с квадратом нормы передаточной матрицы как элемента пространства . Это свидетельствует о том, что задача (1.5.4) эквивалентна задаче о минимизации указанной нормы

. (1.5.14)

Итак, задача LQR-оптимального синтеза относится к кругу задач оптимизации по норме пространства . В силу относительной простоты рассматриваемой ситуации это обстоятельство позволяет установить связь задач этого круга с матричными уравнениями Риккати, являющимися основным инструментом поиска оптимальных регуляторов.

Рассмотрим решение LQR задачи, несколько обобщив её начальную постановку. В качестве математической модели объекта управления примем систему линейных уравнений

, , , (1.5.15)

которая рассматривается на конечном отрезке времени . Компоненты матриц и будем считать непрерывно дифференцируемыми функциями на этом отрезке.

Для объекта (1.5.15) будем искать регулятор в виде

, (1.5.16)

рассматривая интегральный квадратичный функционал

, (1.5.17)

заданный на движениях замкнутой системы (1.5.15), (1.5.16). При этом задача LQR-оптимизации имеет следующий вид:

,(1.5.18)

где - множество матриц размера с переменными вещественными компонентами, для которых нулевое положение равновесия замкнутой системы является асимптотически устойчивым по Ляпунову.

Для решения поставленной задачи воспользуемся известным из классического вариационного исчисления необходимым условием экстремума. Это условие состоит в том, что если управление и определяемое им движение системы (1.5.15) являются оптимальными по отношению к функционалу (1.5.17), то они удовлетворяют соответствующей системе дифференциальных уравнений Эйлера.

Мы запишем эту систему в канонической (гамильтоновой) форме, учитывая тот факт, что вместо функционала (1.5.17) можно с очевидностью рассматривать функционал

,(1.5.19)

где - подынтегральная функция, отличающаяся от (1.5.17) только постоянным множителем 1/2.

Тогда указанная каноническая форма будет иметь вид

(1.5.20)

где - n-мерный вектор множителей Лагранжа, - функция Гамильтона, определяемая формулой

.

В системе (1.5.20) использован символ , обозначающий градиент функции H по вектору . Напомним, что компонентами градиента являются значения частных производных от H по соответствующим компонентам вектора .

Заметим, что градиент линейной формы , где - строка, и градиент квадратичной формы , где - симметрическая матрица, вычисляются по формулам

, ,

которые известны из алгебры.

Учитывая последние равенства, преобразуем систему (1.5.20), получая следующие выражения для градиентов функции Гамильтона:

(1.5.21)

В соответствии с равенствами (1.5.21), система дифференциальных уравнений Эйлера (1.5.20) принимает вид

(1.5.22)

Из последнего уравнения в системе (1.5.22) следует, что

(1.5.23)

Равенство (1.5.23) позволяет исключить управление из первых двух уравнений, что приводит систему дифференциальных уравнений Эйлера к следующему виду:

(1.5.24)

Итак, если оптимальное движение известно, то с необходимостью найдётся такой вектор множителей Лагранжа, который совместно с вектором удовлетворяет линейной системе (1.5.24).

Если оптимальное движение не известно, то следует найти решение системы (1.5.24), удовлетворяющее краевым условиям

, ,

где требование доказывается вариационными методами.

После решения данной краевой задачи относительно и по формуле (1.5.23) находится оптимальное управление . Однако при этом мы его получаем только как функцию времени, а не в форме обратной связи (регулятора) (1.5.16), как требуется в исходной постановке.

Тогда при поиске оптимального управления на базе системы (1.5.24) не будем непосредственно её решать, но предположим, что существует такая матрица , что для любого решения системы (1.5.24) при любом выполняется равенство

. (1.5.25)

Заметим, что если такая матрица найдена, то в соответствии с формулами (1.5.23) и (1.5.25), уравнение оптимального регулятора примет вид

.(1.5.26)

Получим необходимое и достаточное условие существования матрицы с указанным свойством. Предположив, что такая матрица существует, продифференцируем тождество (1.5.25), учитывая первое уравнение в системе (1.5.24):

.

Приравнивая правые части последнего равенства и второго уравнения из системы (1.5.24), получим с учётом (1.5.25)

,

откуда следует

.

Поскольку последнее равенство должно выполняться для любых решений системы (1.5.24), соответствующих произвольным начальным условиям , то выражение в квадратных скобках должно быть тождественным нулём. Отсюда следует, что матрица с необходимостью удовлетворяет матричному дифференциальному уравнению

.(1.5.27)

Аналогично доказывается и достаточность: если уравнение (1.5.27) имеет некоторое решение , то выполняется тождество (1.5.25) для решения системы (1.5.24).

Уравнение (1.5.27) называют матричным дифференциальным уравнением Риккати.

Покажем, что если решение уравнения (1.5.27) является симметрической положительно определённой матрицей, то нулевое положение равновесия для системы, замкнутой регулятором (1.5.26), асимптотически устойчиво по Ляпунову.

С этой целью сформируем положительно определённую квадратичную форму

(1.5.28)

и найдём её производную по времени в силу системы (1.5.15):

Учитывая (1.5.26), имеем

,

откуда следует

или, после подстановки из уравнения (1.5.27),

.

Введём вспомогательное обозначение . Тогда имеем

,(1.5.29)

поскольку , .

На основании формул (1.5.28) и (1.5.29) можно утверждать, что введённая квадратичная форма является функцией Ляпунова для замкнутой системы, нулевое положение равновесия которой асимптотически устойчиво.

Теперь возвратимся к исходной постановке (1.5.1) - (1.5.4) LQR задачи. Не приводя доказательства, заметим, что матричное дифференциальное уравнение Риккати (1.5.27) обладает следующим свойством: если матрицы и имеют постоянные по времени компоненты, то при условии его решение стремится к постоянной матрице. Согласно уравнению (1.5.27), эта матрица должна обращать в тождественный нуль его правую часть, т.е. должна быть решением уравнения

. (1.5.30)

В отличие от (1.5.27), уравнение (1.5.30) называют матричным алгебраическим уравнением Риккати. Детальное рассмотрение особенностей и свойств этого уравнения будет осуществлено в следующем параграфе. Здесь лишь отметим, что если найдено положительно определённое симметрическое решение этого уравнения (ниже будет показано, что оно является единственным), то в соответствии с формулой (1.5.26) можно построить регулятор (1.5.2) с матрицей коэффициентов , причём этот регулятор является решением задачи (1.5.4).

Последнее утверждение можно строго доказать, минуя переход от уравнения (1.5.27) к уравнению (1.5.30). Приводимое ниже доказательство построено в соответствии с работой [8] Б. Френсиса.

Вначале докажем следующее вспомогательное утверждение, обозначая символом множество вещественных векторных функций времени, для которых сходится несобственный интеграл :

Лемма 1.5.1. Если несобственный интеграл (1.5.3) сходится для функций , , соответствующих замкнутой системе (1.5.1), (1.5.2) то имеет место соотношение при .

Доказательство. Пусть . Но тогда , поскольку . Введём обозначения и . Поскольку интеграл (1.5.3) можно с очевидностью представить в виде

,

то из его сходимости следует .

Поскольку пара является обнаруживаемой, то найдётся такая матрица , что матрица будет гурвицевой. Но тогда можно сформировать асимптотический наблюдатель для системы (1.5.1):

.(1.5.31)

Поскольку , , а матрица является гурвицевой, то при . При этом в силу известного свойства асимптотического наблюдателя в данном случае имеет место условие , следовательно - при . ■

С использованием приведенной леммы докажем следующее основное утверждение:

Теорема 1.5.1. Матрица коэффициентов оптимального регулятора вида (1.5.2), являющегося решением LQR задачи (1.5.1), определяется формулой , где - симметрическое положительно определённое решение алгебраического уравнения Риккати (1.5.30). При этом оптимальный регулятор обеспечивает минимальное значение функционала (1.5.3) и является единственным.

Доказательство. Пусть - произвольное управление, для которого несобственный интеграл (1.5.3) сходится. Сформируем положительно определённую квадратичную форму и найдём её производную по времени вдоль соответствующего решения уравнений (1.5.1) объекта управления:

Последнее равенство справедливо в силу симметричности . Учитывая, что эта матрица удовлетворяет уравнению Риккати (1.5.30), имеем

(1.5.32)

Теперь воспользуемся формулой для евклидовой нормы вектора-столбца , выполняя следующие преобразования:

откуда имеем .

Подставляя последнюю формулу в (1.5.32), получим

или

.

Последнее равенство проинтегрируем на интервале :

.

Но , поскольку в соответствии с леммой м.1 имеем . Кроме того, , т.е.

.

При этом очевидно, что минимум функционала (1.5.3) достигается тогда и только тогда, когда

,

откуда следуют все утверждения теоремы. ■

Проведенные рассуждения позволяют сформировать следующий алгоритм поиска решения LQR задачи (1.5.4) или эквивалентной ей задачи (1.5.14) минимизации нормы элемента пространства .

Алгоритм 1.5.1.

1. По исходным данным задачи сформировать матричное алгебраическое уравнение Риккати

.

2. Найти положительно определённое симметрическое решение этого уравнения. В данном случае это решение существует и является единственным, что будет показано ниже.

3. Сформировать матрицу коэффициентов оптимального регулятора :

.

4. Вычислить минимальное значение функционала (1.5.3) :

.

В оглавление книги \ К следующему разделу \ К предыдущему разделу


Поиск по сайту:

Система Orphus

Яндекс.Метрика