Синтез нечетких правил принятия решений с разделяющими гиперповерхностями и многомерными эталонами

При использовании геометрических методов классификации вводят понятие расстояния между объектами классов, которые определены координатами точек в многомерном пространстве информативных признаков.

Это позволяет ввести расстояние между произвольными точками многомерного пространства и эталонными структурами, например, расстояние Махаланобиса. Если это расстояние рассматривать как нечеткую переменную, которая позволяет высказать суждение о принадлежности того или иного объекта к определенному классу, то этот процесс можно формализовать посредством построения функций принадлежности к исследуемому классу (области) состояний, определяемых как мера близости в многомерном пространстве признаков неизвестного образца к исследуемому классу. Базовыми переменными при этом являются вводимые расстояния неизвестного образца до эталонной структуры, например, расстояние Махаланобиса или Евклидово расстояние.

Если в многомерном пространстве признаков существует разделяющая гиперповерхность между парами альтернативных классов вида Y — F_ω( A, X) , то функция принадлежности к классу может быть определена на базовой переменной Dопределяемой как мера близости от объекта с координатамиX - (x₁,x₂,...,x_w) до этой поверхности, где x₁,...,x_w- координаты объекта в многомерном пространстве размерностью п. Вектор А - (α₁,...,а_п) определяет положение разделяющей поверхности в многомерном пространстве, определяемом координатами x₁,...,x_n. Этот вектор можно рассматривать как вектор настраиваемых параметров, определяемый в процессе обучения по критерию минимума ошибки классификации на объектах обучающей выборки. При выборе формы и

параметров функций принадлежностиследует исходить из того

факта, что для неизвестных образцов, лежащих вблизи эталонных структур класса щ , функция принадлежности возрастает.

В такой интерпретации функцию принадлежности, вычисленную в конкретной точке

можно рассматривать как коэффициент уверенности

в гипотезе ω_l, то есть:

Если каждый класс ω_fпредставляется одним эталоном, например своим математическим ожиданием, то принятие решения о классификации может осуществляться с помощью операции max:

При использовании нескольких эталонов осуществляется агрегация функций принадлежности для каждого эталона. Например, если все эталоны класса равноправны, то агрегация по эталонам одного класса осуществляться с использованием операции max:

Проведенные нами исследования показали, что при решении задач разведочного анализа удобно использовать различные типы гистограмм, которые выделены нами в две группы.

Первая группа - традиционные гистограммы, принятые в статистическом анализе. Они строятся на шкалах, совпадающих с

152 классификационными признаками xi. Вторая группа - гистограммы, которые отражают распределение исследуемых классов на шкалах, определяемых как меры близости до эталонных многомерных структур (точек, гиперплоскостей, гиперкубов, гиперпараллелепипедов, гиперсфер и т.д.). Назовем такие гистограммы дистальными гистограммами. При их построении шаг разрешения шкал dможно выбрать согласно формулы Стреджесса где r_max- расстояние между наиболее удаленными объектами обучающей выборки на шкале d; п - количество объектов обучающей выборки.

Величина q-го столбца дистальной гистограммы определяется отношением числа объектов попадающих в интервале d + ∆dк величине п.

Синтез нечетких решающих правил с использованием информации о геометрической структуре классов представлен в работах [1, 76, 14, 215, 216] и реализован в STATISTICA 6.

В [115] подробно описан алгоритм синтеза нечеткого решающего правила относительно линейной разделяющей поверхности (ЛРП) с использованием дистальной гистограммы меры доверия экспертов к используемому пространству информативных признаков МД(х), меры недоверия к используемому типу решающего правила (МНД (R)) и меры недоверия получаемой информации МНД(Р). Показывается, как учесть показатели диагностической чувствительности и специфичности при выборе параметров соответствующих функций принадлежности.

Одним из способов уменьшения ошибок классификации при использовании линейной разделяющей поверхности (ЛРП) являются ограничения области исследования эталонными гиперструктурами, содержащими в себе объекты исследуемых классов, например,

использование двух гиперпараллепипедов содержащих в себе объекты исследуемых классов ω_lи ω_r.. Процесс определения параметров таких гиперпараллепипедов по гистограммам классов ω_iи ω_rпостроенным по осям информативных признаков представлен на рисунке 3.4.

Рисунок 3.4 - Формирование границ ограничивающих эталонных структур для классов ω_tи ω_r

Нахождение объектов исследуемых классов внутри ограничивающих гиперпараллелепипедов определяются границами гистограмм в виде условия типа:

где верхний индекс * говорит о принадлежности объекта к выделяемым гиперпараллелепипедам.

Введем логические переменные Q₍и Q_rтакие, что:

154

С учетом (3.32) выражение (3.31) трансформируется в выражение типа

С учетом (3.32) уточненные функции принадлежности можно определять выражениями:

Переходя в (3.33) от четких условий, ограничивающих гиперкубы к признаковым функциям принадлежности и учитывая, что исследователей чаще всего интересует принадлежности исследуемых объектов к классу ω_l, а не к альтернативным классам ω_rполучаем

В последнем выражении функции принадлежности могут быть определены экспертами с использованием только их представлений об особенностях используемого признакового пространства и об особенностях

исследуемых классов состояний, а может быть использован механизм синтеза функций принадлежности рассмотренный относительно ЛРП с использованием методов разведочного анализа.

Уменьшить количество ошибок можно за счет использования более сложных разделяющих поверхностей, например, кусочно-линейных.

Рисунок

3.5 иллюстрирует такую ситуацию для пространства признаков {x₁, x₂}.

Предположим, что для классов ω_eи ω_rв соответствии с рекомендациями, описанными выше, получена ЛРП с номером 1. Зона пересечения классов относительно ЛРП 1 определяется линейными поверхностями 2 и 3. Области классов ω_eи ω_rформирующие ошибку , классификации, показаны на рисунке 3.5 штриховкой.

Рисунок 3.5 - Вариант кусочно- линейной классификации

Далее осуществляем итерационный процесс формирования новых обучающих выборок путем удаления из исходной правильно классифицируемых объектов и формирования новых разделяющих гиперплоскостей для разделения классов ω _t,и ω_rс помощью очередной ЛРП (рис. 3.5).

Из рисунка 3.5 видно, что часть объектов, попадающая в зону пересечения образованная разделяющей поверхностью 1, надежно классифицируется поверхностью 4 [115].

Например, при наличии двух ЛРП с номерами 1 и 4 решение о классификации, например, по классу ω_tпринимается в соответствии с выражением

При наличии m линейных разделяющих плоскостей с номерами j = 1,...,mуверенность в классификации ω_tопределяется функций принадлежности получаемой из выражения [115]

Уверенность в классификации ω_rопределяется выражением:

Предпочтение по классам ω_fи ω_rотдается в соответствии с простым правилом

Предложенный метод синтеза нечетких кусочно-линейных разделяющих поверхностей может быть использован при построении искусственных нейронных сетей, поскольку их первый слой с точки зрения

геометрического представления в пространстве признаков представляет собой кусочно-линейный аппроксиматор [26, 30].

В отличие от известных гибридных нейронных сетей в предлагаемой схеме принятия решений после операции суммирования реализуется не пороговая функция, а осуществляется вычисление соответствующей функции принадлежности [115], поэтому назовем предлагаемую схему кусочнолинейным нечетким классификатором. Вариант структуры такого

классификатора на два класса^ и ω_eприведен на рисунке 3.6.

Рисунок 3.6 - Вариант структуры кусочно-линейного нечеткого классификатора

158

вычисляют значения соответствующих функций принадлежности.

Блоки min выполняю операции (3.38) и (3.39), а схема сравнения (СС) реализует правило типа (3.40). Если классификация многоальтернативана, то в схему рис. 3.6 добавляются соответствующие блоки вычисления типа выражения (3.40). Схема сравнения может быть выполнена в виде вычитателя и элемента сравнения.

Для обучения кусочно-линейного нечеткого классификатора предлагается алгоритм, схема которого приведена на рисунке 3.17. Работает алгоритм следующим образом. Определяются классы объектов в исследуемой системе, формируется пространство нормированных информативных признаков X, создаются обучающие выборки для основного ω_fи альтернативного класса ω_r(блоки 1,2).

В блоке 3 определяется первоначальное положение ЛРП относительно классовω_fи ω_r. В блоках 4, 5, рис. 3.7 осуществляется коррекция положения разделяющей гиперплоскости Y. Построение дистальных гистограмм распределения классов ω_tи ω_rпо шкале Yосуществляется в блоке 6. Определение опорных точек и построение соответствующих функций принадлежности μ_ω{Y) и μ_ω (Y) в блоке 7. В блоках 9, 10, 11 строятся ограничивающие зоны принятия классификационных решений [115].

Введя ограничения с помощью дополнительных параллельных гиперплоскостей или гиперпараллелепипедов, относительно координаты рассчитывается ошибка классификации для всех полученных разделяющих гиперплоскостей (блок 12). Если ошибка устраивает экспертов (ошибка R меньше выбранной допустимой ошибки (блок 13), то переходим к построению классификационного решающего правила для другой основной диагностической гипотезы.

Рисунок 3.7 - Алгоритм синтеза нечетких кусочно-линейных решающих правил (начало)

160

Рисунок 3.7 - Схема алгоритма синтеза нечетких кусочно-линейных решающих правил (окончание)

Если решающие правила для всех исследуемых классов состояний получены, то работа алгоритма заканчивается (блок 18). В противном случае вышеперечисленные процедуры повторяется для вновь выбранного класса.

Если вновь вводимые кусочно-линейные разделяющие плоскости (КЛРП) продолжают улучшать качество классификации и не исчерпаны ресурсы алгоритма (блок 14), то определяются объекты, формирующие зоны пересечения классов на шкале Y,которые включаются в новую обучающую выборку, относительно которой строится новая ЛРП (блоки 15, 16, 17). В [115] представлено несколько вариантов построения функций принадлежности относительно эталонных структур различных типов.

<< | >>

↑

Источник: Шуткин Александр Николаевич. МЕТОДОЛОГИЯ СИНТЕЗА ГИБРИДНЫХ КЛАССИФИКАТОРОВ ДЛЯ ПРОГНОЗИРОВАНИЯ СОСТОЯНИЯ ЗДОРОВЬЯ И ПРОФЕССИОНАЛЬНОЙ ПРИГОДНОСТИ ПРИ РАБОТЕ В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ. Диссертация на соискание ученой степени доктора технических наук. Курск - 2018. 2018

Еще по теме Синтез нечетких правил принятия решений с разделяющими гиперповерхностями и многомерными эталонами:

- Медицинские приборы и аппараты -

- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -