MATLAB.Exponenta
MATLAB и Simulink на русском
Технологии разработки и отладки
		сложных технических систем

Проектирование систем управления\Fuzzy Logic Toolbox

Демонстрационные примеры

  В оглавление \ К следующему разделу \ К предыдущему разделу

GASDEMO

Иллюстрация применения технологии ANFIS для предсказания топливной эффективности автомобиля

В этом разделе описывается демонстрационная программа gasdemo, иллюстрирующая применение технологии ANFIS для предсказания топливной эффективности автомобиля. Топливная эффективность (MPG - miles per gallon) оценивается как количество миль, проеханных автомобилем на одном галлоне топлива. При выполнении демонстрационной программы gasdemo на экран выводится 10 слайдов. Для управления демонстрацией каждый слайд имеет такие кнопки (см. рис.9.6):

  • Next>> - показ следующего слайда (на первом слайде вместо этой кнопки расположена кнопка Start>> – начало демонстрации слайдов);
  • Prev<< - показ предыдущего слайда;
  • Reset - возврат на первый слайд;
  • AutoPlay - демонстрация слайдов в автоматическом режиме;
  • Info - вывод справочной информации о программе;
  • Close – завершение работы программы.

На первом слайде (рис. 9.6) выводится аннотация программы gasdemo. Для запуска демонстрации необходимо нажать кнопку Start>>.

Рисунок 9.6 – Первый слайд демо-программы gasdemo

На втором и третьем слайде приводится следующее описание задачи. Прогнозирование топливной эффективности автомобиля является типовой задачей нелинейного регрессионного анализа, которое осуществляется на основе значений следующих параметров автомобиля: количество цилиндров, литраж, мощность, масса, ускорение и год выпуска. Экспериментальные данные записаны в файле auto-gas.dat, фрагмент которых показан на третьем слайде. Эти данные также доступны через веб-репозитарий задач автоматического обучения Калифорнийского университета в Ирвине (http://www.ics.edu/~mlearn/MLRepository.html). Выборка содержит данные об автомобилях различных фирм, логотипы которых показаны на втором слайде. На третьем слайде также указано, что для построения модели топливной эффективности выборка экспериментальных данных разделена на обучающую (нечетные строки файла) и тестирующую (четные строки).

Слайды с четвертого по шестой описывают выбор наилучшего набора входных атрибутов с помощью функции exhsrch. На четвертом слайде приведено описание процедуры оценки информативности входных атрибутов на основе грубых моделей “вход-выход”. Слайд сопровождается дополнительным графическим окном (рис. 9.7), в котором приводятся результаты тестирования шести синтезированных моделей “вход-выход”. В этом окне используются следующие обозначения: Weight – масса автомобиля; Disp – литраж; Power – мощность; Cylinder – количество цилиндров; Year – год выпуска; Acceler – ускорение; маркер в виде окружности (звездочки) – значения корня квадратного из средней квадратической невязки на обучающей (тестирующей) выборке. Как видно из графика, наиболее информативным является атрибут масса автомобиля, а вторым по рангу – литраж. Дополнительное графического окно появляется как результат выполнения команды exhsrch(1, trn_data, chk_data, input_name); . Численные значения невязок выводятся в рабочую область MatLab. Невязки на обучающей и тестирующей выборках одного порядка, что позволяет предположить об отсутствии эффекта переобучения. Следовательно, можно попытаться добавить еще одну входную переменную. Интуитивно, мы могли бы просто выбрать массу и литраж автомобиля, так как для этих атрибутов значения ошибок обучения минимальны. Однако такой директивный подход не гарантирует того, что построенная двухвходовая ANFIS-модель обеспечит максимальную точность прогнозирования.

Рисунок 9.7 – Ранжирование важности входных атрибутов

На пятом слайде приведено описание процедуры оценки информативности пар входных атрибутов. Слайд сопровождается дополнительным графическим окном, в котором приводятся результаты тестирования 15-ти синтезированных моделей “два входа – один выход”. Дополнительное графического окно появляется как результат выполнения команды input_index = exhsrch(2, trn_data, chk_data, input_name); . Как видно из графика, наиболее информативной является пара атрибутов масса автомобиля и год выпуска, что не противоречит здравому смыслу. Разница невязок на обучающей и тестирующей выборках увеличивается, что сигнализирует о приближении эффекта переобучения.

На шестом слайде приведено описание процедуры оценки информативности троек входных атрибутов. Слайд сопровождается дополнительным графическим окном, в котором приводятся результаты тестирования 20-ти синтезированных моделей “три входа – один выход”. Как видно из графика, наиболее информативной является тройка атрибутов: масса автомобиля, ускорение и год выпуска. Заметим, что минимальная невязка как на обучающей, так и на тестирующей выборке существенно не уменьшилась по сравнению с наилучшей моделью “два входа – один выход”. Следовательно, добавление нового атрибута к паре входных переменных масса автомобиля и год выпуска не слишком повышает точность прогнозирования топливной эффективности автомобиля. Для обеспечения лучших генерализирующих свойств предпочтительно использование более простых моделей, поэтому для дальнейших исследований выбирается модель “два входа – один выход”.

На седьмом слайде изображена поверхность “входы - выход” (рис. 9.8) для лучшей двухвходовой ANFIS-модели, т.е. для модели, которая обеспечивает прогнозирование топливной эффективности автомобиля на основе информации об его массе и годе выпуска. На этом слайде хорошо видно, что поверхность “входы-выход” является нелинейной и монотонной, причем прогнозируемый уровень топливной эффективности уменьшается с увеличением массы автомобиля, и возрастает с увеличением года выпуска. Для рассматриваемой ANFIS-модели значения RMSE (Root Mean Squared Error – квадратный корень из средней квадратической невязки) на обучающей и тестирующей выборках равны 2.766 и 2.995, соответственно. Для сравнения, обычная линейная регрессионная модель, которая использует в качестве входных переменных все атрибуты, обеспечивает значения RMSE 3.452 и 3.444 на обучающей и тестирующей выборках, соответственно.

Рисунок 9.8 – Поверхность “входы – выход” для наилучшей нечеткой модели после одной итерации обучения

На восьмом слайде приведены результаты обучения выбранной двухвходовой модели. На предыдущих этапах модели-кандидаты обучались с помощью функции exhsrch только на протяжении одной итерации ANFIS-алгоритма. Это было сделано для того, чтобы быстро выбрать подходящее множество входных переменных модели. Сейчас, когда входные переменные выбраны, можно потратить больше времени на обучение нечеткой модели прогнозирования топливной эффективности. На восьмом слайде приведены кривые обучения ANFIS-модели в виде зависимостей ошибок обучения (зеленая кривая) и тестирования (красная кривая) от количества итераций алгоритма. Минимум ошибки тестирования достигается в районе 45-й итерации алгоритма (см. рис. 9.9). Точка минимума отмечена на графике окружностью. Заметим, что после 50-й итерации ошибка тестирования начинает возрастать, что указывает на эффект переобучения, т.е. на потерю моделью свойств обобщения.

Рисунок 9.9 – Кривые обучения нечеткой модели

На девятом слайде показана поверхность “входы-выход” (рис.9.10) нечеткой модели с минимальной ошибкой тестирования. Для этой модели ошибки на обучающей и тестирующей выборках меньше, чем для первоначальной. Однако при рассмотрении дальнего угла поверхности обнаруживается парадоксальный эффект - для новых моделей топливная эффективность возрастает с увеличением массы автомобиля. Такое противоречие объясняется отсутствием необходимого количества данных из этой области в обучающей выборке.

Рисунок 9.10 – Поверхность “входы – выход” для нечеткой модели с минимальной ошибкой тестирования

На десятом слайде (см. рис. 9.10) приведено распределение данных из обучающей (зеленные окружности) и тестирующей (красные крестики) выборок. Как видно из рисунка, в правом верхнем углу факторного пространства отсутствуют экспериментальные данные. Это и является причиной описанного выше парадоксального вида поверхности ANFIS-модели. Поэтому, используя модели, синтезированные с помощью ANFIS (как, впрочем, и с помощи любой другой технологии автоматического обучения) необходимо помнить, что они могут адекватно описывать лишь закономерности, представленные репрезентативными выборками данных.

Рисунок 9.11 – Распеределения данных из обучающей и тестирующей выборок

  В оглавление \ К следующему разделу \ К предыдущему разделу


Поиск по сайту:

Система Orphus

Яндекс.Метрика