Оптимальное управление линейными динамическими системами. Оптимальное управление непрерывными динамическими системами Основной материал. Пусть, рассматриваемая задача оптимального управления непрерывной динамической системой, определяется дифференциальным

Введение. Рыночная экономика в Украине требует новых подходов к управлению: на первый план выходят экономические, рыночные критерии эффективности. Научно-технический прогресс и динамика внешней среды заставляют современные производственные предприятия трансформироваться в более сложные системы, для которых необходимы новые методы управления. Усиление рыночной ориентации предприятий, резкие изменения внешней среды вызывают необходимость разработки конкурентоспособных систем управления, призванных вырабатывать комплексные управленческие решения, а следовательно и более эффективных подходов и алгоритмов решения задач большой размерности.

Работа выполнялась согласно государственной научно-технической программы 6.22 – перспективные информационные технологии и системы планы научной и научно-технической деятельности Одесского ордена Ленина института Сухопутных войск на 2004 год, соответственно к тематике научно-исследовательских работ.

Анализ последних исследований.В настоящее время одним из основных и наиболее эффективных подходов к решению задач управления большой размерности является декомпозиция . Этот подход объединяет группу методов, основанных на разложении исходной задачи большой размерности на подзадачи, каждая из которых существенно проще исходной и решается независимо от других. Связь между отдельными подзадачами осуществляется с помощью «координирующей» задачи, которая тоже проще исходной. Для этого задачу управления приводят к виду, удовлетворяющему требованиям декомпозируемости, основными из которых являются: аддитивность (сепарабельность) целевой функции; блочный характер ограничений; наличие блочных связей. Однако при решении практических задач синтеза оптимального управления большой размерности зачастую сложно удовлетворить перечисленным требованиям. Например, качество работы производственной системы может оцениваться критерием весьма общего типа, который может быть несепарабельным по отношению к задачам управления отдельными подсистемами. Поэтому при проведении исходной задачи управления к виду, удовлетворяющему требованиям декомпозируемости, неизбежны как различные упрощения, аппроксимации, так и различные варианты разбиения задачи на локальные подзадачи, т.е. блоков ограничений и межблочных связей. Все эти факторы влияют как на качество решения, так и на сложность расчетов при поиске оптимального решения.

Ввиду отсутствия до настоящего времени способов качественной оценки влияния перечисленных факторов на качество решения представляется актуальным разработка такого способа решения задачи большой размерности, который бы оставлял определенную свободу в выборе структуры локальных задач, а также удовлетворяющего и оценивающего влияние различных упрощений на качество решений.

Из анализа литературных источников следует, что приемлемые численные методы решения нелинейных задач оптимизации связаны со значительными затратами машинного времени и памяти, а использование линеаризации приводит к потерям качества управления. Поэтому целесообразно, чтобы разрабатываемый новый метод решения задачи сохранял её нелинейный характер, а оптимальное управление определялось в рамках децентрализованной вычислительной структуры.

Объектом исследования являются алгоритмы решения задач управления большой размерности.

Предметом исследований является разработка подхода, основанного на идее эквивалентности или квазиэквивалентности исходной задачи большой размерности и соответствующей блочной декомпозиционной задачи.

Научная задача состоит в разработке алгоритмов, использование которых обеспечивало бы оптимальное управление в рамках децентрализованной структуры, без необходимости итерационного обмена информацией между уровнями управления.

Целью работы является разработка и дополнение элементов прикладной теории и проблемно-ориентированного инструментария оптимизации задач управления большой размерности.

Научная новизна состоит в разработке подхода к синтезу алгоритмов оптимизации задач управления большой размерности в рамках децентрализованной вычислительной структуры, при которой отпадает необходимость в организации итерационного процесса между уровнями управления.

Основной материал. Пусть, рассматриваемая задача оптимального управления непрерывной динамической системой, определяется дифференциальным уравнением

(1)

по критерию

(2)

при

где - n m – мерный вектор управления; - n – мерная функция, составляющая которой непрерывно дифференцируемы относительно аргументов; - выпуклая, дифференцируемая скалярная функция; - заданные соответственно начальный и конечный момент времени.

С целью представления объекта управления (1) в виде ряда взаимодействующих подсистем разложим (1) в ряд Тейлора относительно точки равновесия

где ,

или

(3)

В выражении (3) А и В представляют собой блочно-диагональные части матриц и соответственно, с блоками и .

а и - недиагональные части и соответственно.

Введением вектора взаимосвязи таким образом, что задаваемая в i – тая составляющая определяется выражением

, (4)

можно записать уравнение i – й подсистемы

где - - мерный вектор управления; - - мерный вектор состояния; - n – мерный вектор взаимосвязи.

Предлагаемый декомпозиционный способ синтеза оптимальных управлений состоит в следующем. Составляющую подсистему

и учитывающую взаимосвязь с другими подсистемами, назовем изолированной.

Композиция i – ых i = 1,2,…, Р подсистем представляет модель

(5)

где и - блочно – диагональные матрицы с блоками и соответственно.

Сформулируем критерий

, (6)

где - положительно – полуопределенная блочно – диагональная матрица

с блоками ; - положительно – определенная блочно – диагональная матрица

с блоками , - оптимальное управление.

Матрицы и определим из условия квазиэквивалентности задач (1) – (2) и (5) – (6), которое имеет вид

здесь , ,

где .

Для определения элементов матриц, имеем систему алгебраических уравнений

. (7)

После решения уравнения (7) имеем Р независимых задач оптимизации в связи с блочно – диагональной структурой матриц

Локальное оптимальное управление имеет вид

, (8)

, удовлетворяет линейному дифференциальному уравнению .

, . (9)

Глобальное решение является композицией оптимальных решений

. (10)

Выводы. Таким образом, задача синтеза оптимального управления для исходной задачи большой размерности (1) – (2) сводиться к следующему: формулировка локальных задач оптимизации (5) – (6); определение параметров локальных задач по формулам (3) и (6); решение локальных задач согласно (8) – (9); композиция локальных решений (10).

Потери качества при оптимальном подходе к синтезу приближенно оптимальных управлений можно оценить по формулам, предложенным в .

The new approach to problem solving of control, founded on idea of equivalence an initial problem of large dimension and conforming unitized offcomposite of a problem is offered.

1. Месарович М., Мако Д., Такахара И. Теория иерархических многоуровневых систем. – М.: Мир, 1973.

2. Аэсдон Л.С. Оптимизация больших систем. – М.: Мир, 1975.

3. Альбрехт Э.Г. Об оптимальной стабилизации нелинейных систем. – Прикладная математика и механика, 1961, т. 25.

4. Живоглядов В.П., Кривенко В.А. Способ декомпозиции задач управления большой размерности с несепарабельным критерием качества. Тезисы II Всесоюзной межвузовской конференции «Математическое, алгоритмическое и техническое обеспечение АСУ ТП». Ташкент, 1980.

5. Hassan Mohamed, Sinqh Madan G. The optimization for non – linear systemsusinq a new two level method. “Automatica”, 1976, 12, №4.

6. Mahmoud M.S. Dynamic multilevel optimization for a class of non – linear systems, “Int. J. Control”, 1979, 30, №6.

7. Кривенко В.А. Квазиэквивалентное преобразование оптимизационных моделей в задачах синтеза алгоритмов управления. – В кн.: Адаптация и оптимизация в больших системах. – Фрунзе, 1985.

8. Кривенко В.А. Способ синтеза алгоритмов управления с использованием идеи модификации целевой функции. – Фрунзе, 1985.

9. Румянцев В.В. Об оптимальной стабилизации управляемых систем. – Прикладная математика и механика, 1970, вып. 3.

10. Овезгельдыев А.О., Петров Э.Т., Петров К.Э. Синтез и идентификация моделей многофакторного оценивания и оптимизации. – К.: Наукова думка, 2002.

Ответы на вопросы

Задача динамического наблюдения , которая сначала называлась задачей асимптотического наблюдения , в существующем виде сформулирована американским ученым Д. Люенбергером в 1971 году. Термины «динамическое наблюдение» или «асимптотическое наблюдение» не полностью отражают существо проблемы, которая состоит в решении задачи восстановления вектора состояния динамического объекта (процесса) в специально создаваемой динамической среде на основе доступной информации . Следует заметить, что доступная информация может быть представлена в двух формах: в форме результатов непосредственных измерений и модельной форме динамической среды , генерирующей экзогенное воздействие.

Не всегда удается обеспечить и асимптотический характер процесса наблюдения в силу неполной измеримости переменных и воздействий, наличия неконтролируемых помех, неучтенные факторы модельного и сигнального характера и т.д. В этой связи представляется наиболее корректным использовать понятие «динамическое наблюдающее устройство » (ДНУ), возможно также появление терминологического вульгаризма «наблюдатель ».

Первоначально основной сферой использования ДНУ были динамические системы , в состав которых входят формирователи сигналов управления, использующих информацию в виде прямых и обратных связей по состоянию объекта или источника конечномерного экзогенного воздействия. В настоящее время сфера использования ДНУ заметно расширилась за счет нового поколения измерительных комплексов , которые решают задачу формирования результата измерения в алгоритмической среде ДНУ. Ниже рассматриваются вопросы, связанные с использованием ДНУ в составе формирователей сигналов управления.

В предыдущих разделах рассмотрены алгоритмы формирования сигналов управления, опирающиеся на единую системную концепцию подобия , которая реализовалась в одном случае в методе модального управления динамическим объектом, в другом – методе обобщенного изодромного управления. Прежде, чем решать задачи динамического наблюдения в рамках каждого из этих методов управления дадим общесистемное определение динамическому наблюдающему устройству.

В общесистемной постановке наибольшее количество информации о ходе управляемых процессов (динамических объектов) содержится в векторе состояния, который характеризуется наибольшей по сравнению с другими переменными процесса размерностью. Но состояние есть скрытая (внутренняя) переменная, несущая полную информацию о системном «секрете» процесса, она не должна быть доступна непосредственному измерению в полном объеме. Внешними переменными являются вектор выхода , вектор сигнала управления , вектор ошибки воспроизведения задающего экзогенного воздействия , иногда само воздействие . Информационная среда может быть дополнена моделью источника экзогенного воздействия (МИЭВ).

Теперь можно дать определение динамического наблюдающего устройства (ДНУ).

Определение 16.1 (О16.1). Динамическое наблюдающее устройство представляет собой техническую или алгоритмическую среду , которая реализует функциональное отображение всех доступных непосредственному измерению: компонентов
задающего воздействия
, компонентов
вектора ошибки
, сигнала управления
, компонентов
вектора выхода
, а возможно и компонентов
вектора состояния
в вектор
оценки вектора состояния, обладающий асимптотическим свойством, что представляется записью

где
– матрица в общем случае особого (необратимого) преобразования.

В большинстве практических случаев задача динамического наблюдения решается на парах , а в случаях, когда задача сводится к автономной версии динамической системы – то на векторах выхода
или ошибки
.

Примечание 16.1 (ПР.16.1). Ниже рассматриваются проблемы синтеза динамического модального и динамического обобщенного изодромного управлений , которые решаются на основе агрегирования динамических наблюдающих устройств и устройств формирования сигналов управления, полученных на основе гипотезы о полной измеримости вектора состояния объекта. В этой связи модальное управление и обобщенное изодромное управление, сформированные таким образом (т.е. методами, описанными в разделе 15) в отличие от динамических будем именовать алгебраическим модальным и алгебраическим обобщенным изодромным управлениями.

Рассмотрим случай модального управления. Поставим задачу формирования наблюдающего устройства, позволяющего восстановить вектор
состояния непрерывного динамического объекта, имеющего векторно-матричное описание

Прежде, чем приступить к решению задачи формирования динамического наблюдающего устройства, рассмотрим одну «гипотетическую» ситуацию. Для этого предположим, что , тогда приполной измеримости вектора
вектор
состояния объекта (16.2)при полной его неизмеримости может быть восстановлен в силу соотношения

(16.3)

Нетрудно видеть, что такое наблюдающее устройство следует назвать «статическим», так как оно обладает нулевой динамикой.

На основе рассмотренной «гипотетической» ситуации можно сформулировать следующее утверждение без доказательства.

Утверждение 16.1 (У16.1). Для корректного функционирования динамического наблюдающего устройства, при котором могут быть восстановлены все компонентов вектора
состояния объекта, у которого
, необходимо выполнение условия

где
вектор состояния динамического наблюдающего устройства.

Примечание 16.2 (ПР.16.2). Ситуация, когда имеет место выполнение неравенства , используется в случае, когда процесс измерения вектора
динамического объекта сопровождается заметными помехами так, что на ДНУ возлагаются задачавосстановления вектора состояния объекта с одновременной фильтрацией измерений.

Вернемся к соотношению (16.1) для анализа системной нагрузки, возлагаемой на матрицу подобия
размерности
. Размерность и вид этой матрицы полностью отражает все многообразие вариантов построения динамических наблюдающих устройств, так:

– если
при
и при этом
полной размерности и в базисе наблюдаемого динамического объекта ;

– если
при
и при этом
, то динамическое наблюдающее устройство строитсяполной размерности в базисе, не совпадающем с базисом наблюдаемого динамического объекта , чаще всего это какой-либо канонический базис ;

– если
при
, то динамическое наблюдающее устройство строитсянеполной размерности в произвольном базисе, чаще всего это какой-либо канонический базис ; в этом случае для восстановления всех компонентов вектора состояния объекта используется композиция из измерения вектора выхода и вектора состояния ДНУ, а также матрица, составленная из матриц
.

Динамические наблюдающие устройства полной размерности в базисе исходного объекта строятся на основе следующих системных соображений , содержащихся в следующем утверждении.

Утверждение 16.2 (У16.2). Динамическое наблюдающее устройство вектора
состояния непрерывного объекта управления (16.2), реализующееалгоритм наблюдения , записываемый в векторно-матричной форме

где
вектор состояния ДНУ,
, характеризуется процессом сходимости оценки
к оцениваемому вектору
состояния объекта (16.2), определяемым алгебраическим спектром собственных значений матрицы

. □(16.6)

Доказательство. Для доказательства справедливости сформулированного утверждения введем в рассмотрение вектор
невязки наблюдения , который для общего случая задачи наблюдения имеет представление

, (16.7)

а для рассматриваемого случая в силу равенства
принимает вид

. (16.8)

Нетрудно видеть, что процесс сходимости
к оцениваемому вектору
в форме (16.1) с использованием вектора
невязки наблюдения принимает вид

. (16.9)

Построим модель динамики сходимости процесса наблюдения, используя вектор невязки наблюдения (16.8).Дифференцирование по времени (16.8) с последующей подстановкой в результат дифференцирования соотношений (16.2) и (16.5) дает

что записывается в форме

откуда для вектора
невязки наблюдения можно записать

Примечание 16.3 (ПР.16.3). Если начальные состояния объекта управления (16.2) и ДНУ (16.5), то в силу (16.11) невязка наблюдения
и наблюдаемый вектор
и его оценка
тождественно совпадают, то есть выполняется соотношение

Введем определение динамического модального управления .

Определение 16.2 (О16.2). Динамическим модальным управлением будем называть управление вида (15.48), в котором отрицательная обратная связь по вектору
состояния объекта управления заменена на обратную связь по вектору
оценки вектора
, формируемому в зависимости отреализации матрицы
в силу соотношений:

1. при

(16.12)

2. при (16.13)

3. при (16.14)

Построим теперь алгоритм синтеза динамического модального управления для случая формирования оценки
вектора
состояния объекта вида (16.12), формируемой в среде ДНУ (16.5).

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФИЗИЧЕСКИЙ ФАКУЛЬТЕТ

Кафедра Физико-Математических Методов Управления

ЗАДАНИЯ

на курсовую работу

«Оптимальное управление линейными динамическими системами»

по курсу «Оптимальное управление»

Составитель: проф., д. т. н. Афанасьев В.Н.

Москва 2014

ЦЕЛЬ РАБОТЫ

Математическое конструирование оптимальных линейных систем управления.

СОДЕРЖАНИЕ РАБОТЫ
1. Изучение необходимого теоретического материала по источникам ;
2. Получение аналитического решения задачи;
3. Составление структурной схемы системы управления.
4. Приобретение навыков математического моделирования системы управления с использованием пакета MatLab .

ВРЕМЯ ПРОВЕДЕНИЯ РАБОТЫ

VIII семестр, 4 курс.

Задания выдаются на 5 учебной неделе.

Прием выполненных работ осуществляется на 10 и 11 неделях.

ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ.

ФОРМУЛИРОВКА ЗАДАЧИ

Многие объекты управления могут достаточно точно описываться линейными динамическими моделями. Путем разумного выбора квадратичных критериев качества и квадратичных ограничений в этом случае удается синтезировать весьма удачные управляющие устройства с линейной обратной связью.

Пусть управляемые динамические системы, описываемые линейными дифференциальными уравнениями

(1)

здесь: - состояние системы; - управляющий вход системы; - выход системы. Таким образом, матрицы A (t ), B (t ), C (t ) имеют соответствующие размерности: n x n , n x r , m x n . Предположим, что и на управление не наложено каких-либо ограничений.

Определим назначение системы с физической точки зрения. Пусть - «желаемый» выход системы. Требуется отыскать такое управление u (t ) , при котором ошибка системы

(2)

была бы «малой».

Так как управление u (t ) в рассматриваемой задаче не ограничено, то для того чтобы избежать больших усилий в контуре управления и большого расхода энергии, можно ввести в критерий качества соответствующее требование, учитывающее эти факты.

Часто бывает важно сделать «малой» ошибку в конечный момент переходного процесса.

Перевод этих физических требований в форму того или иного математического функционала зависит от многих причин. В данной главе будет рассматриваться частный класс критериев качества, имеющих следующий вид:

(3)

где F , Q (t ) положительно полуопределенные матрицы размерностью m x m ; R (t ) положительно определенная матрица размерностью r x r .

Рассмотрим каждый член функционала (3). Начнем с. Очевидно, так как матрица Q (t ) положительно полуопределенная, то этот член неотрицателен при любом e (t ) и равен нулю при e (t )=0 . Так как, где q ij (t ) элемент матрицы Q (t ), а e i (t ) и e j (t ) компоненты вектора e (t ), то большие ошибки оцениваются «дороже», чем малые.

Рассмотрим член. Так как R (t ) - положительно определенная матрица, то этот член положителен при любых и «наказывает» систему за большие управляющие воздействия сильнее, чем за малые.

Наконец, . Этот член часто называют стоимостью конечного состояния. Его цель гарантировать «малость» ошибки в конечный момент времени переходного процесса.

Критерий качества (3) удобен математически, и его минимизация приводит к тому, что оптимальные системы оказываются линейными.

Задача оптимального управления формулируется следующим образом: дана линейная динамическая управляемая система (1) и функционал (3). Требуется найти оптимальное управление, т.е. управление, под воздействием которого система (1) двигается таким образом, чтобы минимизировать функционал (3). Поиск решений будет производиться для задач с открытой областью изменений управляющих воздействий и задач, управляющие воздействия в которых принадлежат заданному множеству.

ЗАДАНИЕ
1. Изучить метод построения оптимального управления линейными динамическими системами
2. В соответствии с номером варианта взять условие задачи из приложения
3. Проверить свойства управляемости и наблюдаемости
4. Построить наблюдатель Луенбергера
5. Получить аналитическое решение задачи
6. Нарисовать структурную схему системы оптимального управления
7. Изучить влияние весовых коэффициентов на качество переходных процессов и на значение функционала качества
8. Математическое моделирование системы управления с использованием пакета MatLab

ПРИЛОЖЕНИЕ

Объект управления:

Функционал: .

Вариант № 1

Рассмотреть при:

;

Вариант № 2

Рассмотреть при:

;

Вариант № 3

Рассмотреть при:

;

Вариант № 4

Рассмотреть при:

;

Вариант № 5

Рассмотреть при:

;

Вариант № 6

Рассмотреть при:

;

Вариант № 7

Рассмотреть при:

;

Вариант № 8

Рассмотреть при:

;

Вариант № 9

Рассмотреть при:

;

Вариант № 10

Рассмотреть при:

;

Вариант № 11

Рассмотреть при:

;

Вариант № 12

Рассмотреть при:

;

Вариант № 13

Рассмотреть при:

;

Вариант № 14

Рассмотреть при:

14.1. ;

14.2. .

Вариант № 15

Рассмотреть при

15.1. ;

15.2. .

ЛИТЕРАТУРА

Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления Высшая школа. М., 2003, 616 с.
Афанасьев В.Н. Теория оптимального управления непрерывными динамическими системами. Аналитическое конструирование. М. Физический факультет МГУ 2011, 170 с.
Афанасьев В.Н. Оптимальные системы управления. РУДН. 2007. − 260 с.

Выходные данные сборника:

УПРАВЛЕНИЕ С ПЕРЕМЕННОЙ СТРУКТУРОЙ СЛОЖНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ

Маркин Василий Евгеньевич

канд. техн. наук, доцент МГУ им. адм. Г.И. Невельского, г. Владивосток

Воробьев Алексей Юрьевич

канд. техн. наук, доцент ДВФУ, г. Владивосток

Актуальной задачей современной теории управления является создание высокоэффективных алгоритмов и систем управления для управления сложными динамическими объектами. К классу сложных динамических объектов можно отнести такие объекты, как манипуляционные роботы, подводные аппараты, станки для сложной обработки т. д. Характерными особенностями подобных объектов являются большая размерность математической модели, нелинейности различного вида в математической модели, многосвязность, а также значительная структурная и параметрическая неопределенность, проявляющаяся в процессе функционирования.

Причинами параметрической неопределенности могут быть как динамические свойства самого объекта (например, изменение конфигурации манипулятора приводит к многократному изменению приведенного момента инерции), так и действие среды. Математически такой вид неопределенности можно оценить следующим образом:

где P i - некоторый параметр. В процессе функционирования параметры объекта могут принимать значение из диапазона между минимальным и максимальным значением.

Для синтеза алгоритмов и систем управления сложными динамическими объектами в условиях неопределенности используются различные подходы: адаптивный, робастный, нейросетевой и т. д. В работе в качестве базового используется алгоритм управления с переменной структурой. Работающие с использованием данного алгоритма системы с переменной структурой (СПС) известны достаточно давно как релейные системы с разрывным управлением . Управление с переменной структурой обычно строится в следующем виде:

(2)

где - уравнение поверхности переключения (скольжения) в пространстве состояния R n , содержащем фазовые координаты объекта x 1 ,…x n . Традиционно рассматриваются системы второго порядка, в этом случае пространство состояний вырождается в фазовую плоскость, а поверхность переключения - в линию переключения . Уравнение поверхности (линии) переключения может быть как линейным, так и нелинейным. В простейшем случае линия переключения представляет собой прямую. В этом случае поверхность переключения задается некоторым вектором параметров C размерности (n x 1), где n - порядок системы. Характерная особенность систем с переменной структурой (СПС) - наличие так называемого скользящего режима . Скользящий режим - особый динамический режим системы, движение в котором происходит по поверхности переключения s= 0, построенной в фазовом пространстве R n (рис. 1).

Рисунок1. Скользящий режим в СПС

Основное условие существования скользящего режима определяется следующим образом :

В скользящем режиме система работает в режиме переключений, происходящих теоретически с бесконечно большой частотой. Траектория движения системы теоретически определяется лишь уравнением линии переключения, не зависящим от параметров системы (например, от варьируемой нагрузки). Переходные процессы в скользящем режиме устойчивы и монотонны. Для обеспечения приемлемых динамических свойств системы необходима начальная настройка параметров, для которой традиционно применяется минимаксный метод: вектор параметров c выбирается таким, чтобы при любом наборе начальных условий выполнялось условие существования скользящего режима (3). Иначе говоря, значения коэффициентов линии переключения выбираются с учетом максимального значения изменяющегося параметра p i max (1). Это позволяет обеспечить возникновение скользящего режима при любых начальных условиях. Вместе с тем быстродействие системы (которое также определяется значениями элементов вектора c ) становится невысоким. Это является одним из основных недостатков традиционных СПС. Для увеличения быстродействия применяется адаптация по параметру скользящего режима . Адаптивный алгоритм настройки коэффициента линии переключения c имеет следующий вид:

(4)

где k c - коэффициент пропорциональности, m, m d - соответственно текущее и эталонное значения параметра скольжения .

В работе исследуется адаптивное управление приводом манипуляционного робота. Структурная схема системы автоматического управления приведена на рис. 2.

Рисунок 2 . Структурная схема системы управления приводом степени подвижности

Для реализации принципа переменности структуры в работе применяется релейное управление:

В свою очередь,

, (6)

где c - коэффициент плоскости скольжения (переключения).

Для имитационного моделирования использовался пакет Simulink, входящий в Matlab. Результаты моделирования в виде трехмерной фазовой траектории системы представлены на рис. 3.

Рисунок 3. Фазовые траектории и временные процессы системы третьего порядка: 1 - без адаптации, 2- с адаптацией.

Моделирование показывает существенное улучшение быстродействия при использовании адаптивного управления. Кроме того, имеет место существенное улучшение динамических показателей качества по сравнению с традиционными алгоритмами управления.

Дальнейшее направление исследований - обеспечение большей робастности алгоритмов управления по отношению к параметрам объекта и регулятора. Таким образом, разработаны алгоритмы управления сложным динамическим объектом высокого порядка в условиях существенной параметрической неопределенности. На основе предложенных алгоритмов синтезированы адаптивные системы управления. Проведены численные эксперименты, продемонстрировавшие высокую эффективность предложенных решений.

Список литературы:

1.Дыда А.А., Маркин В.Е. Системы управления с переменной структурой с парными и нелинейно деформируемыми поверхностями переключения. // Проблемы управления. - 2005, № 1. С. 22-25.

2.Маркин В.Е. Субоптимальное по быстродействию управление сложными динамическими объектами в условиях неопределенности. / Труды XIII Байкальской Международной школы-семинара по методам оптимизации. Т. 2 - Иркутск, 2005. С. 177-181.

3.Теория систем с переменной структурой. / Под ред. С.В. Емельянова - М.: Наука, Главная редакция физико-математической литературы, 1970 - 592 с.

4.Уткин В.И. Скользящие режимы в задачах оптимизации и управления. - М: Наука, Главная редакция физико-математической литературы, 1981 - 368 с.

5.Dyda A.A. Design of Adaptive VSS algorithms for Robot Manipulator Controls. Proc. Of First Asia Control Conference. Tokyo, July 27-30, 1994. Pp 1077-1080.

В рассмотренных примерах (задача о загрузке рюкзака и задача о надежности) для описания состояний системы использовалась только одна переменная, одной переменной задавалось и управление. В общем случае в моделях динамического программирования состояния и управления могут быть описаны с помощью нескольких переменных, образующих вектора состояния и управления.

Увеличение количества переменных состояния вызывает рост числа возможных вариантов решения, ассоциированных с каждым из этапов. Это может привести к так называемой проблеме «проклятие размерности», которая является серьезным препятствием при решении задач динамического программирования средней и большой размерности.

В качестве примера рассмотрим задачу о загрузке рюкзака, но уже при двух ограничениях (например, ограничение по весу и по объему):

где , . Поскольку в задаче имеется два вида ресурсов , то необходимо ввести два параметра состояния и . Обозначим , , . Тогда ограничения (1) можно привести к виду:

где . В рекуррентных уравнениях метода динамического программирования для задачи о «ранце» с двумя ограничениями (1):

каждая из функций , является функцией двух переменных. Если каждая из переменных , может принимать 10 2 значений, то функцию приходится табулировать в 10 4 точках. В случае трех параметров при тех же предположениях требуется вычислять 10 8 степени значений функций .

Итак, наиболее серьезным препятствием практического применения динамического программирования оказывается число параметров задачи.

Задача управления запасами.

Задача управления запасами возникает, когда необходимо создать запас материальных ресурсов или предметов потребления с целью удовлетворения спроса на заданном интервале времени (конечном или бесконечном). В любой задаче управления запасами требуется определять количество заказываемой продукции и сроки размещения заказов. Спрос можно удовлетворить путём однократного создания запаса на весь рассматриваемый период времени или посредством создания запаса для каждой единицы времени этого периода. Первый случай соответствует избыточному запасу по отношению к единице времени, второй – недостаточному запасу по отношению к полному периоду времени.

При избыточном запасе требуется более высокие удельные (отнесённые к единице времени) капиталовложения, но дефицит возникает реже и частота размещения заказов меньше. С другой стороны, при недостаточном запасе удельные капитальные вложения снижаются, но частота заказов и риск дефицита возрастают. Для любого из указанных крайних случаев характерны значительные экономические потери. Таким образом, решения относительно размера заказа и момента его размещения могут основываться на минимизации соответствующей функции общих затрат, включающих затраты, обусловленные потерями от избыточного запаса и дефицита.

Эти затраты включают в себя:

1. Затраты на приобретение, которые становятся особо важным фактором, когда цена единицы выражается в виде оптовых скидок в тех случаях, когда цена единицы продукции убывает с возрастанием размера заказа.

2. Затраты на оформление заказа представляют собой постоянные расходы, связанные с его размещением. При удовлетворении спроса в течении заданного периода времени путём размещения более мелких заказов (более часто) затраты возрастают по сравнению со случаем, когда спрос удовлетворяется посредством размещения более крупных заказов (и следовательно, реже).

3. Затраты на хранение запаса, которые представляют собой расходы на содержание запаса на складе (процент на инвестированный капитал, амортизационные расходы и эксплуатационные расходы), обычно возрастают с увеличением уровня запасов.

4. Потери от дефицита, обусловленные отсутствием запаса необходимой продукции. Обычно они связаны с экономическими санкциями со стороны потребителей, потенциальными потерями прибыли. На рис.1 иллюстрируется зависимость рассмотренных видов затрат от уровня запаса продукции. На практике какую-либо компоненту затрат можно не учитывать, если она не составляет существенную часть общих затрат. Это приводит к упрощению моделей управления запасами.

Типы моделей управления запасами.

Большое разнообразие моделей управления запасами определяется характером спроса на продукцию, который может быть детерминированным или вероятностным. На рис.2 приведена схема классификации спроса, принимаемая в моделях управления запасами.

Детерминированный статический спрос предполагает, что интенсивность потребления остаётся неизменной во времени. Динамический спрос - спрос известен, но изменяется в зависимости от времени.

Наиболее точно характер спроса может быть описан посредством вероятностных нестационарных распределений. Однако с математической точки зрения модель значительно усложняется, особенно при увеличении рассматриваемого периода времени.

По существу классификацию на рис.2 можно считать представлением различных уровней абстракции описания спроса.

На первом уровне предполагается, что распределение вероятностей спроса стационарно во времени, т.е. в течение всех исследуемых периодов времени используется одна и та же функция распределения вероятностей. При таком предположении влияние сезонных колебаний спроса в модели не учитывается.

На втором уровне абстракции учитываются изменения спроса от одного периода к другому. Однако при этом функции распределения не применяются, а потребности в каждом периоде описываются средней величиной спроса. Это упрощение означает, что элемент риска в управлении запасами не учитывается. Но оно позволяет исследовать сезонные колебания спроса, которые вследствие аналитических и вычислительных трудностей нельзя учесть в вероятностной модели.

На третьем уровне упрощения предполагается, что спрос в течении любого периода равняется среднему значению известного спроса по всем рассматриваемым периодам, т.е. оценить его постоянной интенсивностью.

Характер спроса является одним из основных факторов при построении модели управления запасами, но имеются и другие факторы, влияющие на выбор типа модели.

1. Запаздывание поставок. После размещения заказа он может быть поставлен немедленно или потребуется некоторое время на его выполнение. Интервал времени между моментом размещения заказа и его поставкой называется запаздыванием поставки. Эта величина может быть детерминированной или случайной.

2. Пополнение запаса. Процесс пополнения запасов может осуществляться мгновенно или равномерно во времени.

3. Период времени определяет интервал, в течение которого осуществляется регулирование уровня запаса. В зависимости от отрезка времени, на котором можно надёжно прогнозировать запас, рассматриваемый период принимается конечным или бесконечным.

4. Число пунктов накопления запасов. В систему управления запасами может входить несколько пунктов хранения запаса. В некоторых случаях эти пункты организованы таким образом, что один выступает в качестве поставщика для другого. Эта схема иногда реализуется на различных уровнях так, что пункт – потребитель одного уровня может стать пунктом – поставщиком на другом. В этом случае имеется система управления с разветвлённой структурой.

5. Число видов продукции. В системе управления запасами может фигурировать более одного вида продукции. Этот фактор учитывается при условии наличия некоторой зависимости между видами продукции. Так, для различных изделий может использоваться одно и тоже складское помещение или же их производство может осуществляться при ограничениях на общие производственные фонды.

Детерминированные модели управления запасами.

1.Детерминированная обобщённая модель определения оптимального размера партии продукции при допущении дефицита.

Рассматривается система управления запасами, когда продукция поступает на склад непосредственно с производственной линии с постоянной интенсивностью единиц продукции в единицу времени. При достижении некоторого уровня объёма запаса Q производство продукции прекращается. Возобновление производства и поставки продукции на склад осуществляется в момент, когда неудовлетворённый спрос достигнет некоторого значения G. Расходование запаса осуществляется с интенсивностью . Известны значения следующих параметров: - стоимость хранения единицы товара на складе в единицу времени; -стоимость организации заказа (одной партии продукции); - убытки от неудовлетворенного спроса (штраф). Требуется найти оптимальный объём партии продукции и интервал времени между точками возобновления поставки по критерию минимума общих затрат от функционирования системы управления запасами.

Графически условия задачи показаны на рис.3.

Из рисунка видно, что пополнение и расходование запаса осуществляются одновременно в течение интервала каждого цикла. Накопленный запас Q полностью расходуется в течение интервала . В течение интервала спрос не удовлетворяется, а накапливается. Неудовлетворённый спрос G покрывается в интервале .

Величина называется полным циклом управления запасом. - предельный запас продукции, G – предельный дефицит продукции.

Очевидно текущий уровень запаса продукции определяется по формуле:

Из треугольника OAB следует:

Аналогично можно определить , и (2)

Из подобия треугольников OAC и CEF можно записать Из равенства следует, что (3)

Выражение (3) с учётом (1) перепишется:

Тогда общая сумма затрат на пополнение, хранение запаса продукции и возможный штраф за неудовлетворительный спрос будет определяться выражением:

Если привести затраты в единицу времени, то выражение для удельных затрат будет иметь вид:

Таким образом, есть функция двух аргументов Q и T, оптимальные значения которых определяются как решение задачи:

Для того, чтобы найти минимум функции двух аргументов, необходимо и достаточно решить систему уравнений:

Это следует из факта, что функция является вогнутой функцией относительно своих аргументов. Решение системы уравнений (5) даёт следующие неотрицательные корни:

Минимум общих затрат в единицу времени составит:

Можно рассмотреть частные случаи.

1. Дефицит продукции не допускается. Решение задачи в этом случае получается из формулы (6)-(8), если положить штраф Тогда С 1 /С 3 =0 и оптимальные значения искомых величин будут:

Этому случаю соответствует график изменения уровня запаса во времени:

2. Пополнение запаса осуществляется мгновенно. В этом случае полагается и соответственно

График изменения уровня запаса имеет вид:

3. Дефицит не допускается, запасы пополняются мгновенно, т.е. . Тогда следует:

Эти формулы называются формулами Уилсона, а величина - экономическим размером партии.

График изменение уровня запаса имеет вид:

Динамические модели управления запасами.

В предыдущих лекциях были рассмотрены статические задачи управления запасами за один период. В ряде таких задач были получены аналитические выражения для оптимального уровня запаса.

В случае, если рассматривается функционирование системы за n периодов, причем спрос непостоянен, приходят к динамическим моделям управления запасами. Эти задачи, как правило, не поддаются аналитическому решению, однако оптимальные уровни запасов на каждый период можно вычислить, применив метод динамического программирования.

Рассматривается задача управления запасами, когда спрос за j-ый период (j=1,n) определяется величиной . Пусть – уровень запаса в начале j-го периода, а - объем пополнения запаса в этом периоде. Пополнение запасов осуществляется мгновенно в начале периода, дефицит продукции не разрешается. Графически условия задачи показаны на рис.1.

Пусть - общие затраты на хранение и пополнение на j-том периоде. Значение задано, а , т.к. в конце функционирования систем запас не нужен.

Требуется определить оптимальные объемы заказов в каждом периоде по критерию минимума суммарных затрат.

Математическая модель задачи будет иметь вид

здесь необходимо определить , которые удовлетворяли бы ограничениям (2)-(6) и минимизировали целевую функцию (1).

В этой модели целевая функция сепарабельная, ограничения (2) имеют рекуррентный вид. И эта особенность модели наталкивает на мысль о возможности применения для ее решения метода динамического программирования. Модель (1)-(6) отличается от стандартной модели динамического программирования наличием условия это условие можно преобразовать следующим образом. Из (2) и (3) следует, что , или можно записать

Тогда из (7) с учетом (4) определяется область возможных значений : или окончательно:

Таким образом, условие (3)-(4) заменяется условием (8), и модель (1),(2),(5)-(6),(8) имеет стандартный вид для метода динамического программирования.

В соответствии с методом динамического программирования решение этой задачи состоит из следующих этапов:

Иследует из ограничения (12)-(14).(j=2,n).

Проводится обратное движение алгоритма, в результате находятся оптимальные значения искомых переменных и . Минимальное значение целевой функции (1) определяется величиной