MATLAB.Exponenta
–Û·Ë͇ Matlab&Toolboxes

Оптимальные и робастные системы управления\Model Predictive Control Toolbox

Е.И.Веремей, В.В.Еремеев. Статья "Введение в задачи управления на основе предсказаний".

Введение.

Одним из современных формализованных подходов к анализу и синтезу систем управления, базирующихся на математических методах оптимизации, является теория управления динамическими объектами с использованием прогнозирующих моделей - Model Predictive Control (MPC).

Этот подход начал развиваться в начале 60-х годов для управления процессами и оборудованием в нефтехимическом и энергетическом производстве, для которых применение традиционных методов синтеза было крайне затруднено в связи с исключительной сложностью их математических моделей.

В настоящее время сфера практического приложения MPC-методов существенно расширилась, охватывая разнообразные технологические процессы в химической и строительной индустрии, легкой и пищевой промышленности, в аэрокосмических исследованиях, в современных системах энергетики и т. д.

Основным достоинством MPC-подхода, определяющим его успешное использование в практике построения и эксплуатации систем управления, служит относительная простота базовой схемы формирования обратной связи, сочетающаяся с высокими адаптивными свойствами. Последнее обстоятельство позволяет управлять многомерными и многосвязными объектами со сложной структурой, включающей нелинейности, оптимизировать процессы в режиме реального времени в рамках ограничений на управляющие и управляемые переменные, учитывать неопределенности в задании объектов и возмущений. Кроме того, возможен учет транспортного запаздывания, учет изменений критериев качества в ходе процесса и отказов датчиков системы измерения.

Существо MPC-подхода составляет следующая схема управления динамическими объектами по принципу обратной связи:

  1. Рассматривается некоторая (относительно простая) математическая модель объекта, начальными условиями для которой служит его текущее состояние. При заданном программном управлении выполняется интегрирование уравнений этой модели, что дает прогноз движения объекта на некотором конечном отрезке времени (горизонте прогноза).

  2. Выполняется оптимизация программного управления, целью которого служит приближение регулируемых переменных прогнозирующей модели к соответствующим задающим сигналам на горизонте прогноза. Оптимизация осуществляется с учётом всего комплекса ограничений, наложенных на управляющие и регулируемые переменные.

  3. На шаге вычислений, составляющем фиксированную малую часть горизонта прогноза, реализуется найденное оптимальное управление и осуществляется измерение (или восстановление по измеренным переменным) фактического состояния объекта на конец шага.

  4. Горизонт прогноза сдвигается на шаг вперед, и повторяются пункты 1 - 3 данной последовательности действий.

Приведенная схема может быть объединена с предварительным проведением идентификации уравнений модели, используемой для выполнения прогноза.

Идея оптимизации прогнозируемого программного движения, составляющая основу MPC-методов, возникла в рамках двух независимых, однако близких по существу подходов. Первый из них, именуемый Dynamics Matrix Control (DMC), развивался усилиями специалистов компании Shell Oil в середине 60-х годов [2], а второй - Model Algorithmic Control (MAC) - был разработан французскими инженерами химической промышленности в конце 60-х [1]. На базе последнего подхода впервые был создан коммерческий пакет программ IDCOM (Identification and Command), который в известной мере послужил прообразом современной программной поддержки методов управления с предсказанием.

В настоящее время MPC-подход находится в стадии интенсивного развития, о чём свидетельствует обширная библиография опубликованных за последние годы научных работ, посвященных данной проблематике. Развитие идей управления с прогнозированием происходит в направлении использования нелинейных моделей, обеспечения устойчивости по Ляпунову контролируемых движений, придания робастных свойств замкнутой системе управления, применения современных оптимизационных методов в реальном масштабе времени и др.

В качестве подробных учебных пособий по теории управления на базе прогнозирующих моделей рекомендуются книги [3] ­- [7].

Пакет прикладных программ Model Predictive Control Toolbox (MPC Tools) представляет собой набор инструментальных средств исследования и проектирования алгоритмов управления в дискретных и непрерывных системах на основе предсказаний динамики их поведения. Сюда включены более 50 специализированных функций для проектирования, анализа и моделирования динамических систем, использующих управление с предсказанием. При этом авторы пакета, учитывая его назначение для начального освоения идеологии MPC-подхода, включили в состав рабочих инструментов только те средства, которые достаточно просты в освоении и в практическом применении. Естественно, пакет совершенно не претендует на полный охват всего современного арсенала MPC-методов. Однако все включенные в него средства вполне соответствуют запросам практики и обладают достаточно высокой вычислительной эффективностью.

Данное пособие предназначено для пользователей, которые начинают работу с ППП Model Predictive Control Toolbox. Дается краткое введение в теорию вопроса, излагается методика использования инструментов пакета, приводятся иллюстративные и содержательные примеры анализа, синтеза и моделирования систем управления с прогнозированием. Как и сам пакет MPC Tools, пособие может использоваться в процессе обучения студентов старших курсов и аспирантов, специализирующихся в области теории управления и её приложений. Однако возможности пакета вполне позволяют привлекать его и для решения реальных практических задач по управлению технологическими процессами и техническими объектами.

1. Управление с прогнозирующими моделями. Элементы теории.

В данной главе приводятся элементарные основы теоретических положений, на которых базируются все инструментальные средства пакета MPC Tools. Изложение начинается с нелинейной задачи в непрерывном времени [8], которая не характерна для данного ППП, однако с методической точки зрения представляет собой достаточно удобный вариант для введения в круг рассматриваемых вопросов.

Далее существенное внимание уделяется базовой задаче пакета - управлению линейным дискретным объектом, модель которого представлена в пространстве состояний, с использованием прогнозирующей модели, как без учета, так и с учетом ограничений на управление и состояние.

Глава завершается рассмотрением вопросов управления линейными дискретными MIMO-объектами, модель которых в исходном варианте представляется реакциями на ступенчатое единичное возмущение.

1.1. Обобщенная нелинейная задача управления с предсказанием

Пусть математической моделью объекта управления служит система обыкновенных нелинейных дифференциальных уравнений вида

, (1.1.1)

где - вектор состояния, - вектор управления, .

Введем в рассмотрение допустимые множества управлений и состояний , полагая, что для любого фиксированного момента времени должны выполняться условия , . Положим, что для любых кусочно-непрерывных функций со значениями из множества функция удовлетворяет условиям существования и единственности решения задачи Коши для системы (1.1.1). Кроме того, будем полагать , т. е. система (1.1.1) обладает нулевым положением равновесия.

В качестве простейшего варианта задания допустимых множеств и можно привести, например, соотношения:

, (1.1.2a)
, (1.1.2b)

где , , , - заданные вещественные числа.

Будем считать, что целью управления объектом (1.1.1) является обеспечение выполнения равенств

, , (1.1.3)

где заданные векторные функции и определяют некоторое желаемое движение объекта.

Введем в рассмотрение понятие качества управления, задавая некоторый функционал

(1.1.4)

на управляемых движениях объекта (1.1.1).

Любая задача оптимального управления состоит в поиске такого управляющего воздействия из некоторого заданного класса (при его задании учитывается допустимое множество U), которое обеспечивает достижение цели (1.1.3) с учетом ограничения и доставляет минимум функционалу (1.1.4).

В настоящее время известны многочисленные варианты типовых задач, конкретизирующих приведенную выше общую формулировку, а также разнообразные подходы к их аналитическому и численному решению. Однако необходимо отметить, что до настоящего времени все эти подходы являются достаточно сложными для практической реализации.

Одной из важнейших причин, затрудняющих практическое использование классических оптимизационных подходов при создании систем управления сложными объектами, является то, что математическая модель (1.1.1), которая исчерпывающим образом представляет динамику реального объекта, в силу множества различных обстоятельств нам неизвестна и, в принципе, не может быть построена.

Для учета этого факта при решении задач оптимального управления в настоящее время используются различные пути, одним из которых является применение теории управления с прогнозирующими моделями. По существу, её основу составляет известное обобщение принципа обратной связи, согласно которому при формировании управляющего воздействия используются измеряемая информация о состоянии объекта.

Для пояснения основных положений теории управления с предсказанием, наряду с математической моделью (1.1.1) объекта управления, будем рассматривать систему дифференциальных уравнений вида

, , (1.1.5)

где - вектор состояния, - вектор управления, . Будем считать, что функция обладает теми же свойствами, что и функция , а векторы и принимают значения из допустимых множеств и соответственно.

Кроме того, допустим, что функция задана таким образом, что для любого допустимого управления векторные функции и , удовлетворяющие системам (1.1.1) и (1.1.5) соответственно, близки между собой по норме для любого .

Систему дифференциальных уравнений (1.1.5) будем называть прогнозирующей моделью по отношению к математической модели (1.1.1) объекта управления.

Целесообразность введения в рассмотрение прогнозирующей модели определяется тем обстоятельством, что любая фиксированная математическая модель вида (1.1.1) лишь приближенно представляет реальный объект. Это связано с наличием ряда неучтенных при ее выводе факторов, которые делают движение реального объекта отличным от решений системы (1.1.1). Сюда относятся неучтенные нелинейности, внешние воздействия, вариации параметров, неучтенная дополнительная динамика и т. д. Будем считать, что модель (1.1.1) в известной мере отражает все эти факторы, однако в процессе функционирования может изменяться, причем эти изменения априори не заданы. В то же время фиксированная модель вида (1.1.5), которая инициализируется в момент текущим состоянием реального объекта, в силу определенной близости к нему при любых вариациях неучтенных факторов, позволяет приближенно спрогнозировать его поведение. Это можно сделать, если найти частное решение системы (1.1.5) при заданном управлении на некотором отрезке времени , причем прогноз будет тем точнее, чем меньше величина . Как правило, прогнозирующая модель выбирается достаточно простой с тем, чтобы ее можно было интегрировать в реальном масштабе времени и непосредственно использовать в контуре управления.

Простейшим частным примером прогнозирующей модели можно считать любой асимптотический наблюдатель, сформированный для системы (1.1.1), которая линеаризована в окрестности своего нулевого положения равновесия при некотором номинальном сочетании факторов неопределенности.

Схему осуществления прогноза можно проиллюстрировать с помощью рис. 1.1.1.

Рис. 1.1.1.

Здесь по оси абсцисс прямоугольной системы откладываются моменты времени , причем за начальный момент принимается . До этого момента объект управления с неизвестной нам точно моделью вида (1.1.1) двигался под воздействием заданного управления , реализуемого системой с обратной связью, и в момент оказался в состоянии .

Зададим некоторое управление как функцию времени на отрезке и проинтегрируем систему (1.1.5) на указанном отрезке с начальным условием . Полученное частное решение будем трактовать как предсказанное поведение (прогноз поведения) объекта управления с горизонтом предсказания .

Сразу же заметим, что в силу естественного отличия динамики реального объекта и прогнозирующей модели их движения на рассмотренном отрезке будут в целом отличаться, а совпадение гарантируется только в начальной точке.

Теперь можно сформулировать математическую задачу о выборе оптимального управления на основе прогноза. Будем считать, что целью управления является обеспечение некоторого заданного поведения модели (1.1.5), определяемого, аналогично (1.1.3), векторными функциями и , , .

Качество процесса управления прогнозирующей моделью будем оценивать функционалом вида

, (1.1.6)

заданным на движениях системы (1.1.5). Здесь символом обозначен так называемый горизонт управления (рис. 1.1.1), т. е. такой момент времени, что

. (1.1.7)

В качестве примера подынтегральной функции функционала (1.1.6) можно привести широко используемую на практике сумму двух квадратичных форм вида

, (1.1.8)

где и - положительно определенные симметрические весовые матрицы.

Поставим задачу о поиске оптимального программного управления для прогнозирующей модели (1.1.5):

, (1.1.9)

где допустимое множество управлений определяется выражением

.

Здесь - множество векторных кусочно-непрерывных функций на отрезке , удовлетворяющих дополнительному условию (1.1.7) постоянства управления на отрезке .

Результатом решения задачи (1.1.9) служит векторная функция

, (1.1.10)

определяющая оптимальное по отношению к (1.1.6) программное управление для прогнозирующей модели (1.1.5). Эта функция обеспечивает минимальное значение функционала

. (1.1.11)

Обратим внимание на тот факт, что, полагая и осуществляя прогноз от точки на бесконечном интервале времени , мы можем найти управление вида (1.1.10), а затем реализовать его в виде для исходного объекта с моделью (1.1.1). Очевидно, что при условии такое управление будет решением задачи оптимизации для реального объекта по отношению к функционалу

. (1.1.12)

Однако выполнение тождества , с учетом указанных выше факторов, определяющих расхождение между моделями (1.1.1) и (1.1.5), невозможно, поэтому реализация программного управления на базе однократного прогноза фактически приводит к значительным отклонениям от оптимального программного движения.

Некоторого улучшения ситуации можно добиться, выполняя многократный прогноз с периодом . При этом оптимальное управление, найденное для прогнозирующей модели на отрезке , непосредственно подается на реальный объект:. Затем осуществляется поиск на отрезке и т. д. Однако и такой подход с очевидностью обладает как минимум двумя недостатками. Во-первых, на каждом отрезке управление будет осуществляться по разомкнутой схеме (без обратной связи), что в ряде случаев недопустимо. Во-вторых, в силу отличия реальной динамики от прогнозируемой, движение под воздействием принятого управления может существенно отличаться от оптимального.

Отмеченное обстоятельство определяет несколько иной вариант реализации найденного оптимального управления: его непосредственное воздействие на объект осуществляется не на всем горизонте прогнозирования , а только на его малой начальной части, т. е. на объект воздействует управление вида

, , (1.1.13)

где величина существенно меньше, чем .

После реализации управления (1.1.10) в момент осуществляется новый прогноз поведения объекта с горизонтом предсказания и решается оптимизационная задача вида (1.1.7), однако уже на отрезке , причем начальным условием для прогнозирующей модели выступает . Результат решения оптимизационной задачи применяется к объекту на отрезке и далее процесс повторяется.

Принято говорить, что приведенный способ оптимизации управления с предсказанием использует прогноз с удаляющимся (подвижным) горизонтом.

По существу, в рамках последнего подхода управление осуществляется по принципу обратной связи с дискретным поступлением информации о текущем состоянии объекта в моменты 0, δ, 2δ, … При этом компоненты вектора состояния могут быть либо непосредственно измерены, либо оценены с помощью наблюдающих устройств по результатам измерений доступных переменных.

Общая схема управления с предсказанием состоит из следующих действий:

  1.  Измерение или оценивание вектора состояния реального объекта.

  2.  Решение оптимизационной задачи (1.1.9) для прогнозирующей модели (1.1.5) с начальным условием по отношению к функционалу (1.1.6).

  3.  Использование найденной оптимальной функции в качестве программного управления на отрезке .

  4.  Замена момента времени на момент и повторение операций, указанных в пунктах 1 - 3.

Приведенная последовательность действий реализуется в системе управления с обратной связью, блок-схема которой представлена на рис. 1.1.2.

Рис. 1.1.2.

Обсудим некоторые свойства управления, реализуемого по представленной выше схеме.

Пусть качество процессов управления оценивается с помощью функционала (1.1.12), т.е. исходная задача оптимизации движения объекта рассматривается на бесконечном интервале времени . Предположим, что мы имеем дело с простейшей ситуацией, когда прогнозирующая модель (1.1.5) тождественно совпадает с исходной моделью (1.1.1). Отметим, что даже в этом случае применение метода последовательного решения оптимизационных задач вида (1.1.9) с удаляющимся горизонтом при любом конечном значении не приводит к точному решению исходной оптимизационной задачи. Это связано с тем, что движение объекта, замкнутого рассмотренной обратной связью, даже при совпадении уравнений будет отличаться от предсказанного оптимального движения на отрезке , что можно наглядно проиллюстрировать с помощью рис. 1.1.3.

Рис. 1.1.3.

Если сделать величину бесконечно большой, то мы получим совпадение прогнозируемого и реального движения в силу принципа оптимальности Беллмана, если только цель управления достижима. Однако при большом горизонте предсказания существенно увеличивается объем вычислений, необходимых для построения оптимального программного управления. Очевидно, что чем меньше величина , тем легче решать оптимизационную задачу (1.1.9) на каждом шаге рассматриваемой схемы управления с предсказанием.

Несовпадение прогнозируемого и реализуемого движений объекта порождают два важнейших следствия [8]. Во-первых, схема управления на базе прогноза с удаляющимся конечным горизонтом принципиально не позволяет достичь минимума функционала (1.1.12), который обеспечивается программным управлением, но лишь в определенной степени позволяет приблизиться к нему. При этом отличие будет тем большим, чем меньше горизонт предсказания . Во-вторых, в силу отличия фактического движения от предсказанного, рассматриваемая схема управления с обратной связью не гарантирует устойчивость первого из них по Ляпунову.

Следует отметить еще одно важное обстоятельство. Даже если информация о состоянии объекта поступает в регулятор непрерывно, то в общем случае для решения оптимизационной задачи (1.1.12), которое, как правило, осуществляется приближенными численными методами, необходимо некоторое конечное время. Следовательно, управление, соответствующее полученному состоянию, будет подано на объект с неизбежным запаздыванием.

Подводя итог рассмотрению обобщенной нелинейной задачи, в качестве выводов укажем на следующие особенности приведенной схемы управления с предсказанием.

  1. В качестве прогнозирующей модели можно использовать нелинейные системы обыкновенных дифференциальных уравнений.

  2. Подход позволяет учитывать ограничения, которые наложены как на управляющие переменные, так и на компоненты вектора состояния.

  3. Подход предусматривает минимизацию функционала, характеризующего качество процесса управления, в режиме реального времени.

  4. Для управления с предсказанием необходимо, чтобы текущее состояние объекта непосредственно измерялось или оценивалось.

  5. Предсказанное поведение динамического объекта в общем случае будет отличаться от его реального движения.

  6. Для работы в реальном масштабе времени необходимо, чтобы решение оптимизационной задачи осуществлялось достаточно быстро, в пределах допустимого запаздывания.

  7. Непосредственная реализация рассмотренной схемы MPC-стратегии не гарантирует устойчивость по Ляпунову движения объекта, что требует принятия специальных мер по её обеспечению.


Поиск по сайту:

Система Orphus

Яндекс.Метрика