Модуль принятия решений на основе бустинга

Для разработки модуля прогнозирования возникновения ПКРна основе бустинга был использован линейный дискриминантный анализ. Идея использования линейного дискриминантного анализа для прогнозирования ПКР заключается в следующем.

Имеется 2 группы водителей, у одних из которых высокий риск заболеванияПКР (группа А), у других низкий (группа В). Каждый из водителей в этих группах обследуется в отношении влияния на него комплекса, состоящего из «факторов риска. В абстрактном «-мерном пространстве

геометрические центры обеих групп будут отстоять друг от друга на определенном расстоянии. По величине этого расстояния можно судить о статистической достоверности различия группЛи В. Обследовав конкретного водителя по факторам риска, можно вычислить, по какую сторону разделяющей гиперплоскости (дискриминатора) располагается точка, отражающая положение испытуемого в //-мерном пространстве. Расстояние этой точки до центров групп отражает степень ее принадлежности к каждой из них. Графическая интерпретация данной идеи приведена на рисунке 3.4.

Рисунок 3.4 -Схема дискриминантного анализа:

К - центр группыЛ(наблюдения обозначены точками);

S - центр группы В (наблюдения обозначены кружочками);

KS - расстояние Махаланобиса; С - зона неопределенности;

У - дискриминатор

Для вычисления дискриминантных функций, характеризующих гиперплоскость, используется обучающая выборка. Она также формируется из 2 групп водителей - Л и В. Следует подчеркнуть, что в группе Aфакторы риска

выясняются на момент, предшествующий началу заболевания, т.е. анамнестически.

Так как в нашем случае имеется всего два прогноза:А (неблагоприятный прогноз - возникновение заболевания)и ^(благоприятный прогноз - отсутствие заболевания), то проекция разделяющей линии выражается двумя классифицирующими функциями fA(x_i), fB(x_i).

где x_i- факторы риска, a_i, b_i- коэффициенты, с_А, с_В- константы дискриминантных функций.

Вероятность того или иного прогноза трактуется как вероятность попадания (классификации) точки, представляющей исследуемого в пространстве факторов риска, в область, соответствующую данному прогнозу. Вероятность прогноза P_L(xi),соответствующая наибольшей классифицирующейфункции

fL(x_j), рассчитывается по формуле:

где е - основание натурального логарифма, S - индекс классифицирующей функции (в нашем случае - А или В).

В случае различения двух исходов PA(x_i) = 1 - P_β(x_i).

Для оценки достоверности различения двух прогнозов при выбранном перечне факторов риска используется расстояние D²- Махаланобиса между

центрами областей Л и В. Его можно заменить χ²- статистикой Пирсона и сравнить с табличным значением.

Для построения прогностической модели целесообразно использовать не все факторы риска, а только те, которые дают наилучшие результаты классификации. Линейный дискриминантный анализ дает наилучшие результаты в том случае, когда характер распределения переменных нормальный (Гауссовский). Однако медицинские симптомы и признаки выражаются дискретными величинами, характер распределения которых отличается от нормального. Между тем, судя по многочисленным исследованиям, результаты классификации наблюдений оказываются достаточно хорошими. Это обусловлено тем, что вместо допущения нормальности распределения признаков можно принять менее жесткое требование - нормальность распределения самой дискриминантной функции.

Дискриминантный анализ позволил проследить характер влияния на результаты прогнозирования последовательного включения той или иной группы факторов риска.

С помощью такого приема можно оценить прогностическую ценность комплексов показателей.

Схема алгоритма формирования бустинга на основе дискриминантного анализа представлена на рисунке 3.5. Сущность бустинга состоит в том, что обучающая выборка (множество .4Uβ) разбивается на ряд подмножеств, для каждого из которых определяется своя дискриминантная функция f _iи свое пространство информативных признаков ИП _i.

Структурная схема модуля бустинга, на основе которой принимается окончательное решение, представлена на рисунке 3.6. Агрегация решений слабых классификаторов f . осуществляется посредством обучаемой нейронной сети

NET.

Рисунок 3.5 - Схема алгоритма бустинга

Алгоритм формирования бустинга работает следующим образом. Формируем множество А, в которое входят объекты обоих классов (А=АиВ). Строим первую дискриминантную функцию (первый слабый классификатор) блок 3 и в блоке 4 оптимизируем признаковое пространство. Признаковое пространство оптимизируем до тех пор, пока наблюдается улучшение качества классификации (блок 5).

Рисунок 3.6 - Структурная схема модуля бустинга

Если качество классификации прекращает улучшаться, то переходим к построению следующей дискриминантной функции (слабому классификатору). Перед этим отправляем предыдущий слабый классификатор и соответствующее ему пространство информативных признаков в базу данных (блок 6), и получаем обучающую выборку для формирования следующего слабого классификатора путем исключения из текущейтех образцов, которые правильно классифицированы предыдущим слабым классификатором (блоки 7 и 8).

Этот процесс будет повторяться до тех пор, пока не будет правильно классифицированы все образцы исходной обучающей выборки.

3.3

<< | >>

↑

Источник: Старцев Евгений Александрович. НЕЧЕТКИЕ НЕЙРОСЕТЕВЫЕ МОДЕЛИ В ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКЕ ПРОГНОЗИРОВАНИЯ ЗАБОЛЕВАНИЙ ВОДИТЕЛЕЙ ТРАНСПОРТНЫХ СРЕДСТВ ЭКСТРЕННЫХ СЛУЖБ. Диссертация на соискание ученой степени кандидата технических наук. КУРСК- 2018. 2018

Еще по теме Модуль принятия решений на основе бустинга:

- Медицинские приборы и аппараты -

- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -