Построение модели классификации с применениемдискриминантного анализа
Как было отмечено в предыдущем параграфе, поскольку классы заданы небольшим количеством объектов и имеют признаковые описания, для построения модели классификации наиболее приемлемым видится применением подхода, основанного на статистической классификации, который также называют дискриминантным анализом.
Применение дискриминантного анализа позволяет определить комбинацию признаков, наилучшим образом разделяющих группы объектов с минимальной вероятностью ошибки. Допустимый уровень ошибки второго рода, который был установлен путём проведения экспертного анализа с привлечением ведущих врачей-специалистов в области диагностики микроциркуляторных нарушений (Приложение А), должен составлять менее 0,2.Алгоритм дискриминантного анализа рассматривает многомерное пространство признаков изучаемых объектов, при этом отличительной особенностью данногоподхода является формирование правила, которое в наибольшей степени отражает различия между группами объектов и с применением которого новые объекты совокупности относятся к одному из существующих классов. Для формирования данного правила применён канонический дискриминантный анализ, результатом которого является дискриминантная функция, которая имеет вид [192]: где X= (x1,..., xn ) - вектор значений дискриминантных переменных;
f (x) = Σ
arX
+ c
•>
(3.2)
A = (a1,..., an) - вектор коэффициентов дискриминантной функции;
n- количество рассматриваемых переменных;
с - свободный член (константа).
Одной из главных трудностей дискриминантного анализа является выбор вида дискриминантной функции, а также дискриминантных переменных, наилучшим образом разделяющих рассматриваемые множества.
При проведении дискриминантного анализа должны выполняться следующие требования [191, 198]:
1) численное представление дискриминантных переменных;
2) линейная независимость дискриминантных переменных и статистическая значимость различия их значений;
3) нормальное распределение разделяемой на классы многомерной величины;
4) число объектов наблюдения должно превышать число дискриминантных переменных, как минимум, на два.
С целью определения дискриминантной функции, которая позволила бы максимально разделить рассматриваемые группы объектов с минимальной ошибкой классификации, рассмотрен набор дискриминантных переменных. Поскольку, как было описано в главе 1, нарушения микроциркуляторного русла в первую очередь проявляются в сбое функционирования регуляторных механизмов микрососудов, расстройствах микроциркуляции крови и в архитектурной дезорганизации микрососудов, для выявления данных нарушений, что также подтверждено результатами экспериментальных исследований на этапе обоснования принципа получения диагностической информации (Глава 2), наиболее приемлемым и достаточным видится применение метода ЛДФ. Поэтому в качестве x1... хп рассмотрены измеренные и рассчитанные параметры ЛДФ-сигналов в БТ1, БТ2 и БТ3, которые удовле-
136 творяют принципам статистической независимости и значимости различий значений в исследуемых группах, которая была подтверждена на этапе обоснования принципа получения диагностической информации (Глава 2).
В качестве χприменялся показатель микроциркуляции крови (Im), в качестве х2- максимальная амплитуда колебаний периферического кровотока в одном из частотных диапазонов (эндотелиальном (Аэ), нейрогенном (Ан), миогенном (Ам), дыхательном (Ад) и сердечном (Ас)), рассчитываемая из вейвлет-анализа ЛДФ-сиг- налов. Проверка гипотезы о законе распределения многомерной величины с применением непараметрического критерия Колмогорова-Смирнова [198] подтвердила соответствие случайного значения каждой из дискриминантных переменных внутри рассматриваемых групп нормальному закону распределения.
Исходные матрицы переменных для 1-й и 2-й групп имели вид:
где p1, p2- количество объектов в 1-й и 2-й группах, при этом p1- 32, p2- 60.
Коэффициенты дискриминантной функции α1... вычислялись по формуле:
где
- векторы средних значений дискриминантных переменных в 1 -й и
2-й группах;
А* - совместная ковариационная матрица;
А*1 - матрица, обратная совместной ковариационной матрице.
Установлено, что переменные в группах X1и Х2 для уровня значимости α=0,05 описываются бинормальным распределением с параметрами вектора средних значений дискриминантных переменных
и параметрами рассеяния σ1, σ2и р. Для
бинормального распределения матрица ковариаций вычисляется как [197]:
(3.5)
Совместная ковариационная матрица У. при этом вычислялась как сумма ковариационных матриц для первой и второй групп.
Свободный член в (3.2), определяющий границу, которая разделяет в частном случае две рассматриваемые группы, рассчитывался по формуле:
Был произведен расчёт вектора коэффициентов дискриминантной функции и её свободного члена для каждой из комбинаций дискриминантных коэффициентов, определён вид дискриминантной функции.
В таблице 3.1 представлены векторы средних значений дискриминантных переменных
и параметры рассеяния σ1, σ2и р для исследуемых групп.
Таблица 3.1 - Векторы средних значений дискриминантных переменных
и параметры рассеяния σ1, σ2и р для исследуемых групп 
Продолжение таблицы 3.1
Рассчитанные матрицы ковариаций для контрольной и основной групп и матрица, обратная совместной ковариационной матрице, полученные для комбинации дискриминантных переменных, представлены в таблице 3.2.
Таблица 3.2 - Матрицы ковариаций для контрольной и основной групп и мат-
рица, обратная совместной ковариационной матрице
В таблице 3.3 представлены рассчитанный вектор коэффициентов, свободный член, а также общий вид дискриминантной функции, полученные для комбинации дискриминантных переменных исследуемых групп.
Таблица 3.3 - Вектор коэффициентов А, свободный член cи общий вид дис
криминантной функции
С применением выбранного подхода (канонического дискриминантного анализа) для набора дискриминантных переменных определён общий вид дискриминантных функций, на которых будет базироваться итоговая модель классификации.
3.3