MATLAB.Exponenta
MATLAB и Simulink на русском
Технологии разработки и отладки
		сложных технических систем

uot;Проектирование систем управления\Fuzzy Logic Toolbox

Демонстрационные примеры

  В оглавление \ К следующему разделу \ К предыдущему разделу

IRISFCM

Иллюстрация возможности применения нечеткого c-means алгоритма для задачи кластеризации ирисов

Описание:

В этом разделе описывается демонстрационная программа irisfcm, предназначенная для иллюстрации возможности применения нечеткого c-means алгоритма для задачи кластеризации ирисов.

Задача классификации ирисов была предложена Р. Фишером в 1936 году. С тем пор она часто используется в качестве полигона для тестирования различных методов распознавания образов, машинного обучения, экстракции знаний, статистического и интеллектуального анализов данных и т.п. Задача класификации ирисов ставится следующим образом. По известным значениям четырех признаков цветка необходимо отнести ирис к одному из трех классов: 1 - Iris Setosa, 2 - Iris Versicolor; 3 - Iris Virginica. Признаками ирисов, которые используются для принятия решения являются: x1 - длина чашелистика; x2 - ширина чашелистика; x3 - длина лепестка; x4 - ширина лепестка. Исходные данные для классификации ирисов записаны в файле iris.dat . Файл содержит 150 строк, каждая из которых соответствует одному ирису. Информация об ирисе представлена пятеркой чисел - первые четыре числа соответствуют значениям признаков, а пятое число – классу ириса.

На рис. 1 приведены 2D-диаграммы распределения ирисов по классам. Ирисы класса Iris Setosa изображены синими точками, ирисы класса Iris Versicolor - зелеными точками и ирисы класса Iris Virginica – красными точками. Как видно из рисунка ирисы Iris Setosa линейно отделимы от остальных классов ирисов по признаку длина лепестка или ширина лепестка, а также по любому набору из двух признаков. В тоже время ирисы оставшихся классов Iris Versicolor и Iris Virginica неотделимы линейно один от другого ни по одному из шести возможных наборов из двух признаков.

Задача кластеризации ирисов состоит в нахождении центров кластеров, т.е. в определении значений признаков типовых ирисов каждого класса. Для этого демо-программа irisfcm использует нечеткий c-means алгоритм, реализованный функцией fcm. При кластерном анализе используются следующие параметры нечеткого c-means алгоритма:

  • экспоненциальный вес – 2.0;
  • количество кластеров –3;
  • максимальное количество итераций алгоритма – 100;
  • минимально допустимое значение улучшения целевой функции за одну итерацию – 0.000001.

Во время работы демо-программа irisfcm на экран выводится следующая информация:

  1. центры кластеров на каждой итерации алгоритма. Центры кластеров выводятся в виде цифр ‘1’, ‘2’ и ‘3’ на 2D- диаграммы распределения ирисов по классам. На рис. 1 изображены центры кластеров, найденные в результате выполнения нечеткого с-means алгоритма. Обратим внимание на то, что ‘1’ соответствует типовому ирису класса Iris Virginica, ‘2’ - Iris Setosa, ‘3’ - Iris Versicolor;
  2. график значений целевой функции на итерациях алгоритма (рис. 2);
  3. значения целевой функции на каждой итерации алгоритма.

Рисунок 1. Кластерный анализ ирисов

Рисунок 2. Зависимость качества кластеризации от количества итераций алгоритма

  В оглавление \ К следующему разделу \ К предыдущему разделу


Поиск по сайту:

Система Orphus

Яндекс.Метрика