Синтез нечетких правил принятия решений с разделяющими гиперповерхностями и многомерными эталонами
При использовании геометрических методов классификации вводят понятие расстояния между объектами классов, которые определены координатами точек в многомерном пространстве информативных признаков.
Это позволяет ввести расстояние между произвольными точками многомерного пространства и эталонными структурами, например, расстояние Махаланобиса. Если это расстояние рассматривать как нечеткую переменную, которая позволяет высказать суждение о принадлежности того или иного объекта к определенному классу, то этот процесс можно формализовать посредством построения функций принадлежности к исследуемому классу (области) состояний, определяемых как мера близости в многомерном пространстве признаков неизвестного образца к исследуемому классу. Базовыми переменными при этом являются вводимые расстояния неизвестного образца до эталонной структуры, например, расстояние Махаланобиса или Евклидово расстояние.Если в многомерном пространстве признаков существует разделяющая гиперповерхность между парами альтернативных классов вида Y — Fω( A, X) , то функция принадлежности к классу может быть определена на базовой переменной Dопределяемой как мера близости от объекта с координатамиX - (x1,x2,...,xw) до этой поверхности, где x1,...,xw- координаты объекта в многомерном пространстве размерностью п. Вектор А - (α1,...,ап) определяет положение разделяющей поверхности в многомерном пространстве, определяемом координатами x1,...,xn. Этот вектор можно рассматривать как вектор настраиваемых параметров, определяемый в процессе обучения по критерию минимума ошибки классификации на объектах обучающей выборки. При выборе формы и
параметров функций принадлежности
следует исходить из того
факта, что для неизвестных образцов, лежащих вблизи эталонных структур класса щ , функция принадлежности возрастает.
В такой интерпретации функцию принадлежности, вычисленную в конкретной точке
можно рассматривать как коэффициент уверенности
в гипотезе ωl, то есть:
Если каждый класс ωfпредставляется одним эталоном, например своим математическим ожиданием, то принятие решения о классификации может осуществляться с помощью операции max:
При использовании нескольких эталонов осуществляется агрегация функций принадлежности для каждого эталона. Например, если все эталоны класса равноправны, то агрегация по эталонам одного класса осуществляться с использованием операции max:
Проведенные нами исследования показали, что при решении задач разведочного анализа удобно использовать различные типы гистограмм, которые выделены нами в две группы.
Первая группа - традиционные гистограммы, принятые в статистическом анализе. Они строятся на шкалах, совпадающих с
152 классификационными признаками xi. Вторая группа - гистограммы, которые отражают распределение исследуемых классов на шкалах, определяемых как меры близости до эталонных многомерных структур (точек, гиперплоскостей, гиперкубов, гиперпараллелепипедов, гиперсфер и т.д.). Назовем такие гистограммы дистальными гистограммами. При их построении шаг разрешения шкал dможно выбрать согласно формулы Стреджесса
где rmax- расстояние между наиболее удаленными объектами обучающей выборки на шкале d; п - количество объектов обучающей выборки.
Величина q-го столбца дистальной гистограммы определяется отношением числа объектов попадающих в интервале d + ∆dк величине п.
Синтез нечетких решающих правил с использованием информации о геометрической структуре классов представлен в работах [1, 76, 14, 215, 216] и реализован в STATISTICA 6.
В [115] подробно описан алгоритм синтеза нечеткого решающего правила относительно линейной разделяющей поверхности (ЛРП) с использованием дистальной гистограммы меры доверия экспертов к используемому пространству информативных признаков МД(х), меры недоверия к используемому типу решающего правила (МНД (R)) и меры недоверия получаемой информации МНД(Р). Показывается, как учесть показатели диагностической чувствительности и специфичности при выборе параметров соответствующих функций принадлежности.
Одним из способов уменьшения ошибок классификации при использовании линейной разделяющей поверхности (ЛРП) являются ограничения области исследования эталонными гиперструктурами, содержащими в себе объекты исследуемых классов, например,
использование двух гиперпараллепипедов содержащих в себе объекты исследуемых классов ωlи ωr.. Процесс определения параметров таких гиперпараллепипедов по гистограммам классов ωiи ωrпостроенным по осям информативных признаков представлен на рисунке 3.4.
Рисунок 3.4 - Формирование границ ограничивающих эталонных структур для классов ωtи ωr
Нахождение объектов исследуемых классов внутри ограничивающих гиперпараллелепипедов определяются границами гистограмм в виде условия типа:
где верхний индекс * говорит о принадлежности объекта к выделяемым гиперпараллелепипедам.
Введем логические переменные Q(и Qrтакие, что:
154
С учетом (3.32) выражение (3.31) трансформируется в выражение типа
С учетом (3.32) уточненные функции принадлежности можно определять выражениями:
Переходя в (3.33) от четких условий, ограничивающих гиперкубы к признаковым функциям принадлежности и учитывая, что исследователей чаще всего интересует принадлежности исследуемых объектов к классу ωl, а не к альтернативным классам ωrполучаем
В последнем выражении функции принадлежности могут быть определены экспертами с использованием только их представлений об особенностях используемого признакового пространства и об особенностях
исследуемых классов состояний, а может быть использован механизм синтеза функций принадлежности рассмотренный относительно ЛРП с использованием методов разведочного анализа.
Уменьшить количество ошибок можно за счет использования более сложных разделяющих поверхностей, например, кусочно-линейных.
Рисунок3.5 иллюстрирует такую ситуацию для пространства признаков {x1, x2}.
Предположим, что для классов ωeи ωrв соответствии с рекомендациями, описанными выше, получена ЛРП с номером 1. Зона пересечения классов относительно ЛРП 1 определяется линейными поверхностями 2 и 3. Области классов ωeи ωrформирующие ошибку , классификации, показаны на рисунке 3.5 штриховкой.
Рисунок 3.5 - Вариант кусочно- линейной классификации
Далее осуществляем итерационный процесс формирования новых обучающих выборок путем удаления из исходной правильно классифицируемых объектов и формирования новых разделяющих гиперплоскостей для разделения классов ω t,и ωrс помощью очередной ЛРП (рис. 3.5).
Из рисунка 3.5 видно, что часть объектов, попадающая в зону пересечения образованная разделяющей поверхностью 1, надежно классифицируется поверхностью 4 [115].
Например, при наличии двух ЛРП с номерами 1 и 4 решение о классификации, например, по классу ωtпринимается в соответствии с выражением
При наличии m линейных разделяющих плоскостей с номерами j = 1,...,mуверенность в классификации ωtопределяется функций принадлежности получаемой из выражения [115]
Уверенность в классификации ωrопределяется выражением:
Предпочтение по классам ωfи ωrотдается в соответствии с простым правилом
Предложенный метод синтеза нечетких кусочно-линейных разделяющих поверхностей может быть использован при построении искусственных нейронных сетей, поскольку их первый слой с точки зрения
геометрического представления в пространстве признаков представляет собой кусочно-линейный аппроксиматор [26, 30].
В отличие от известных гибридных нейронных сетей в предлагаемой схеме принятия решений после операции суммирования реализуется не пороговая функция, а осуществляется вычисление соответствующей функции принадлежности [115], поэтому назовем предлагаемую схему кусочнолинейным нечетким классификатором. Вариант структуры такого
классификатора на два класса^ и ωeприведен на рисунке 3.6.
Рисунок 3.6 - Вариант структуры кусочно-линейного нечеткого классификатора
158
вычисляют значения соответствующих функций принадлежности.
Блоки min выполняю операции (3.38) и (3.39), а схема сравнения (СС) реализует правило типа (3.40). Если классификация многоальтернативана, то в схему рис. 3.6 добавляются соответствующие блоки вычисления типа выражения (3.40). Схема сравнения может быть выполнена в виде вычитателя и элемента сравнения.
Для обучения кусочно-линейного нечеткого классификатора предлагается алгоритм, схема которого приведена на рисунке 3.17. Работает алгоритм следующим образом. Определяются классы объектов в исследуемой системе, формируется пространство нормированных информативных признаков X, создаются обучающие выборки для основного ωfи альтернативного класса ωr(блоки 1,2).
В блоке 3 определяется первоначальное положение ЛРП относительно классовωfи ωr. В блоках 4, 5, рис. 3.7 осуществляется коррекция положения разделяющей гиперплоскости Y. Построение дистальных гистограмм распределения классов ωtи ωrпо шкале Yосуществляется в блоке 6. Определение опорных точек и построение соответствующих функций принадлежности μω{Y) и μω (Y) в блоке 7. В блоках 9, 10, 11 строятся ограничивающие зоны принятия классификационных решений [115].
Введя ограничения с помощью дополнительных параллельных гиперплоскостей или гиперпараллелепипедов, относительно координаты рассчитывается ошибка классификации для всех полученных разделяющих гиперплоскостей (блок 12). Если ошибка устраивает экспертов (ошибка R меньше выбранной допустимой ошибки (блок 13), то переходим к построению классификационного решающего правила для другой основной диагностической гипотезы.
Рисунок 3.7 - Алгоритм синтеза нечетких кусочно-линейных решающих правил (начало)
160
Рисунок 3.7 - Схема алгоритма синтеза нечетких кусочно-линейных решающих правил (окончание)
Если решающие правила для всех исследуемых классов состояний получены, то работа алгоритма заканчивается (блок 18). В противном случае вышеперечисленные процедуры повторяется для вновь выбранного класса.
Если вновь вводимые кусочно-линейные разделяющие плоскости (КЛРП) продолжают улучшать качество классификации и не исчерпаны ресурсы алгоритма (блок 14), то определяются объекты, формирующие зоны пересечения классов на шкале Y,которые включаются в новую обучающую выборку, относительно которой строится новая ЛРП (блоки 15, 16, 17). В [115] представлено несколько вариантов построения функций принадлежности относительно эталонных структур различных типов.
Еще по теме Синтез нечетких правил принятия решений с разделяющими гиперповерхностями и многомерными эталонами:
- Синтез гибридных нечетких решающих правил принятия решений на основе логики Л. Заде и Е. Шотрлифа
- 3.5 Синтез нечетких правил принятия решений на основе идеологии метода групповые учета аргументов
- Обоснование подхода к синтезу нечетких гибридных решающих правил
- Метод синтеза гибридных нечетких решающих правил прогнозирования возникновения и развития гангрены нижних конечностей
- 2.2. Метод синтеза нечетких решающих правил прогнозирования и ранней диагностики работников агропромышленного комплекса, контактирующих с ядохимикатами.
- Синтез нечетких решающих правил прогнозирования и ранней диагностики заболеваний нервной системы.
- Синтез правил нечеткого вывода с использованием теории измерения латентных переменных
- Нечеткие модели принятия решений в медицинских диагностических системах
- Синтез нечетких решающих правил прогнозирования и ранней диагностики заболеваний иммунной системы.
- 3.2. Синтез гибридных нечетких решающих правил прогнозирования возникновения профессиональных заболеваний работников агропромышленного комплекса, занятых в растениеводстве.
- Модуль принятия решений по ишемическому риску на основе нечеткого логического вывода
- Обзор математических методов прогнозирования, особенности использования нечеткой логики принятия решений при мочекаменной болезни
- Методы и алгоритмы принятия решений в медицинских системах интеллектуальной поддержки принятия решений
- 37. Психология принятия решения. Феномен риска в теории принятия решений.
- Структурно - функциональная модель принятия решений для дублирующих решениях и ассоциативном выборе
- Использование методов разведочного анализа для оценки структуры данных с целью выбора формы и параметров нечетких решающих правил
- 2.2. Метод синтеза нечетких математических моделей прогнозирования и ранней диагностики профессиональных заболеваний работников электроэнергетики.
- Эталон решения
- Эталон решения
- Эталон решения