Обзор математических методов принятия врачебных решений с учетом специфики легочных заболеваний

Методы, которые основаны на оценке и преобразовании гистограммы цифровых снимков, получили широкое распространение в различных областях, связанных с обработкой графики, например, системы распознавания образов, рентгенология, анализ изображений в полиграфии и подготовка перед печатью [151].

Данные методы реализованы в средствах программного обеспечения по работе с цифровыми изображениями, которые позволяют по гистограмме цифрового изображения определить распределение светлот в его тоновом диапазоне. Такой анализ является оперативным и позволяет правильно выбирать

стратегию коррекции изображения. Кроме распределения светлот на гистограмме имеется возможность контроля и структурных свойств изображения, например, шумы, наличие контуров на снимке, но эти методы не распространены в программном обеспечении из-за необходимости прибегать к статистическому анализу гистограммы для получения наиболее достоверных результатов [151]. Гистограмма также позволяет изменить яркость изображения, его контраст и площадь, которую занимают светлые, темные и другие яркостные элементы, и, наконец, определить, где на плоскости изображения находятся отдельные области (объекты), соответствующие тем или иным диапазонам значений яркости. Гистограммными преобразованиями снимка называют преобразования двумерных функций яркости, которые описаны формулой:

где, fр - функция отображения яркости, которая не зависит от положения пикселя (х, у). Например, простейшим гистограммным преобразованием снимка является линейное преобразование яркости, функция отображения яркости которого будет иметь вид:

где a- коэффициент, который определяет изменение контраста снимка, b- коэффициент, который определяет изменение средней яркости снимка, I- непосредственно яркость в рассматриваемой точке снимка.

Β случае дискретных цифровых изображений функция отображения яркости принимает вид так называемой таблицы отображения яркости

Гистограммная

обработка изображения при помощи этой таблицы выполняется следующим образом:

где,- пиксель изображения с координатамиа LUT -

целочисленный массив размером 256 элементов 8-битного изображения и длинной 65536 элементов для 16-битного изображения.

Анализ проекций. Проекцией снимка на ось является интеграл интенсивности пикселов изображения, которые взяты в направлении, перпендикулярном данной оси. Простейшим случаем проекции двумерного изображения являются вертикальная проекция на ось X, которая представляет собой сумму интенсивностей пикселов по столбцам снимка:

А также горизонтальная проекция на ось Y, рассчитанную по строкам снимка:

Β общем случае рассматривается проекция изображения на любую ось. Пусть направление оси задано единичным вектором с координатамиТогда

проекция изображения на ось E:

После формирования массива проекции, его анализ осуществляется стандартными средствами и позволяет выделять особые точки функции проекции, соответствующие вертикальным или горизонтальным контурам различных объектов, которые присутствуют на снимке.

Преобразование Хафа - алгоритм, который позволяет находить на монохромном изображении плоские кривые, принадлежащие к определенному

классу фигур на основании процедуры голосования. Данная процедура применяется к пространству параметром, из которого возникают объекты фигур по локальному максимуму в накопительном пространстве. Назначение преобразования - решить проблему группировки граничных точек путем применения конкретной процедуры голосования к набору параметризованных объектов изображения. Пусть дана группа кривых на плоскости, которая задана параметрическим уравнением:

где F-функция, a₁,a₂,...,a_n- параметры семейства кривых, x,у - координаты на плоскости. Параметры кривых образуют, так называемое, фазовое пространство, каждая точка которого (определенные значения параметров α₁, a₂,..., a_n) принадлежит некоторой кривой. Из-за дискретного компьютерного представления и входных данных (снимка), необходимо преобразовать непрерывное фазовое пространство в дискретное. Для этого в фазовом пространстве вводится сетка, которая разбивает его на ячейки, каждая из которых соответствует набору кривых с близкими значениями параметров. Каждой ячейки пространства ставится в соответствие число (счетчик), которое указывает количество точек интереса на снимке, принадлежащих хотя бы одной из кривых, соответствующих данной ячейке. Анализ счетчиков ячеек позволяет найти на снимке кривые, которым принадлежит наибольшее количество точек интереса.

Текстурная сегментация, в частности метод текстурных дескрипторов. Анализ текстуры сравним с анализом структуры твердых тел. Физики в области твердых тел должны уметь определять повторяющуюся структуру и распределение атомов в элементарной ячейке. Анализ структуры усложнен тем, что и структуры, и периодическое повторение могут проявлять существенные случайные флуктуации.

Одним из методов, применяемых для описания текстуры, является использование статистических характеристик, которые определяются по

гистограмме яркости всего изображения и его области. Пусть z- случайная величина, которая соответствует яркости участка снимка, а

гистограмма, где Lозначает количество различных уровней яркости. Тогда центральный момент порядка nслучайной величины zравен:

где m- среднее значение z(средняя яркость изображения):

Из (8) и (9) очевидно, что μ_ϋ=1 и μ = 0 . Для описания текстуры особенно важно, чтобы дисперсиякоторая является мерой яркостного контраста.

Это возможно использовать для построения дескрипторов относительной гладкости. Например:

равно нулю для областей с постоянной яркостью, то есть там, где дисперсия также равно нулю и стремится к 1 для больших значений

Еще одной характеристикой является асимметрия:

Однородность:

И средняя энтропия:

Для снимка однородность ^u =¹тогда, когда все его элементы имеют одинаковую яркость и уменьшаются по мере роста яркостных различий.

Энтропия характеризует изменчивость яркости изображения. Она равна 0 там, где яркость постоянна и максимальна в случае возрастания z .

Задачи классификации также возможно решить с помощью методов дискриминантного анализа, включающие в себя методы классической статистики. Раздел математической статистики, который занимается разработкой методов для решения задач дискриминации по конкретным признакам называется дискриминантным анализом [23, 91, 92]. Основным показателем, с помощью которого можно оценить эффективность метода дискриминантного анализа называют точность классификации. Он определяется на основе доли верно классифицированных объектов на основе прогностического уравнения. [93].

Β случае, если выборка объектов является многочисленной, то для классификации наблюдений применяется подход, в котором исследователем анализируется часть данных, а для остальных применяется прогностическое уравнение. Говоря другими словами, осуществляется перекрестная верификация. Β дискриминантном анализе имеются методы поэтапного выбора переменных, которые помогают сделать выбор прогнозируемых переменных [24].

Β теории анализа многомерных данных присутствуют методы, которые реализуют построение линейных дискриминантных функций, которые помогают поддерживать минимум критерия средней вероятности ошибочной классификации в определйнных случаях.

Например, когда существует два класса ω₁и®₂, то методы построения линейных дискриминантных функций должны опираться на два предположения [4].

Что касается первого предположения, то области D₁и D₂, в которых концентрируются объекты jn двух классов, могут быть разделены (р-І)-мерной гиперплоскостью:

Коэффициенты уравнения ω_iмогут быть интерпретированы в качестве параметров, которые указывают наклон гиперплоскости по отношению к координатным осям, а коэффициенты ω₀называются порогом, которые указывают расстояние от гиперплоскости до начала координат.

Во втором оценивается критерий качества разграничения областей D₁и D₂ гиперплоскостью у( х)+ w₀ = 0.

Рассчитывать вектор оптимальных весовых коэффициентов w можно по формуле:

где m_i- это вектор усредненных значений признаков для класса ω·

В случае, когда объекты каждого из классов имеют многомерное нормальное распределение с идентичной ковариационной матрицей S и одинаковыми векторами средних значений m_i, тогда пороговое значение ω₀, минимизирующий критерий средней вероятности ошибки, будет рассчитываться по следующей формуле:

Искусственные нейронные сети (ИНС) широко используются в науке и технике и применяются в различных областях химии, физики и биологии. Они

являются отличным методом решения задач обнаружения изображений с проблемами, в которых исследуемые данные не содержат больших объемов данных, а существующие данные имеют громкий шум [20, 97, 98, 99, 100].

Благодаря значительной пластичности входных данных, ИНС оказались полезными при анализе образцов крови и мочи пациентов с диабетом (Catalogna et

al. 2012, Fernandez de Canete et al. 2012), диагностике туберкулеза (Er et al. 2008, Elveren and Yumusak 2011), классификация лейкозов (Dey et al. 2012), анализ сложных выпотных образцов (Barwad et al. 2012) и анализ изображений на рентгенограммах или даже живой ткани (Barbosa et al. 2012, Saghiri et al. 2012).

ИНС - это математическое представление нейронной архитектуры человека, отражающее его способности к обучению и обобщению [101, 102, 138]. По этой причине ИНС относятся к области искусственного интеллекта. ИНС широко применяются в исследованиях, потому что они могут моделировать сильно нелинейные системы, в которых связь между переменными неизвестна или очень сложна.

Математическое обоснование. Нейронная сеть образована серией «нейронов» (или «узлов»), которые организованы в слои. Каждый нейрон в слое связан с каждым нейроном в следующем слое через взвешенное соединение. Значение веса

w. указывает на силу связи между i-м нейроном в слое и j-м нейроном в следующем. Структура нейронной сети состоит из «входного» слоя, одного или нескольких «скрытых» слоев и «выходного» слоя [21]. Количество нейронов в слое и количество слоев сильно зависит от сложности исследуемой системы. Следовательно, должна быть определена оптимальная архитектура сети. Общая схема типичной трехслойной архитектуры нейронной сети приведена на рисунке 1.2 [29, 30].

Рисунок 1.2 - Общая структура нейронной сети с двумя скрытыми слоями. w . - вес

связи между 1-м и j-м узлом.

Нейроны во входном слое получают данные и передают их нейронам в первом скрытом слое через взвешенные связи. Здесь данные математически обрабатываются, и результат передается нейронам в следующем слое. В конечном счете, нейроны в последнем слое обеспечивают выход сети. J-й нейрон в скрытом слое обрабатывает входящие данные (у) посредством (i) вычисления взвешенной суммы и добавления члена смещения (#.) в соответствии с уравнением 17:

Пеобразование net_jчерез подходящую математическую «передаточную функцию» и передача результата нейронам в следующем слое. Доступны различные перадаточные функции (Zupan and Gastelger, 1999); тем не менее, чаще всего используется сигмовидная:

Обучение. Математический процесс, посредством которого сеть достигает «обучения», может в основном игнорироваться конечным пользователем [22]. Таким образом, сеть можно рассматривать как «черный ящик», который получает вектор с m входами и предоставляет вектор с n выходами (рисунок 1.3) [31, 32].

Рисунок 1.3 -Детали элементов ввода и вывода, относящиеся к диагностике на основе нейронной сити (архитектура часто скрыта и обозначается, как черный ящик).

Сеть обучается на серии «примеров», которые образуют «учебную базу

Рисунок 1.4 - Пример структуры учебной базы данных. Каждая строка относится к другому пациенту, помеченному цифровым кодом. Элемент da^ta_k,_i относится к i-м медицинским данным (симптом, лабораторные данные и т. д.) k-го пациента.

Это достигается путем итеративного изменения значений весов соединений ( w) в соответствии с подходящим математическим правилом, называемым У

алгоритмом обучения. Значения весов изменяются с использованием метода наискорейшего спуска, чтобы минимизировать подходящую функцию, используемую в качестве критерия остановки тренировки. Одной из наиболее часто используемых функций является невязка суммы квадратов, заданная уравнением 20:

где- фактический и сетевой j-й вывод, соответствующий і-му

входному вектору соответственно. Текущее изменение веса на данном слое дается формулой 21:

где η- положительная постоянная, называемая скоростью обучения. Чтобы добиться более быстрого обучения и избежать локальных минимумов, используется дополнительный термин и уравнение 21 становится:

где μ - член «импульса», а- изменение веса-го цикла

обучения. Скорость обучения контролирует скорость обновления веса в соответствии с новым изменением веса, а импульс действует как стабилизатор, осознавая предыдущее изменение веса.

Функция, заданная уравнением 20 также используется в качестве критерия для оптимизации архитектуры сети, поскольку она зависит от количества скрытых слоев и количества нейронов в них. Чтобы найти оптимальную архитектуру, наиболее распространенным подходом является построение графика значения E (уравнение 20), как функции от количества узлов в скрытом слое (q). Пример такого графика приведен на рисунке 1.5.

Рисунок 1.5 - Пример графика, используемого для выбора оптимального количества узлов в данном скрытом слое. Указано, что слишком большое количество узлов может привести к переобучению.

С увеличением q - E уменьшается. Однако после оптимального значения q улучшение довольно слабое. Обычно оптимальное значение q находится из точки пересечения двух ветвей графика. После того, как найдена оптимальная архитектура нейронной сети, процесс обучения выполняется до тех пор, пока не будет достигнуто надлежащее минимальное значение E. После этого сеть проверяется на примерах, которые ранее не использовались на этапе обучения. Этот процесс называется проверкой. Наконец, сеть может использоваться для прогнозирования выходов для новых входных векторов [33, 34].

Структура учебной базы данных. Как указано выше, сеть должна быть обучена с использованием подходящей базы данных. База данных представляет собой таблицу (или матрицу) данных, касающихся пациентов, для которых диагноз

(положительный или отрицательный) об определенном заболевании уже известен. Каждый ряд матрицы относится к одному пациенту. Первые m элементов строки являются медицинскими данными, а последние n элементов представляют выходные данные (диагноз). Термин «медицинские данные» указывает на биохимический, ядерный магнитный резонанс (ЯМР), лабораторные данные, а также симптомы и другую информацию, предоставленную медицинским специалистом. Пример такой обучающей матрицы с одной выходной переменной (n = 1), которая может принимать два возможных значения (положительное или отрицательное), приведен на рисунке 1.4.

Обзор нейронных сетей в медицинской диагностике. Нейронные сети применялись при диагностике: колоректального рака (Spelled et al. 2012), поражений рассеянного склероза (Mortazavi et al. 2012a, b), рака толстой кишки (Ahmed 2005) , (iv) заболевание поджелудочной железы (Bartosch-Harlid et al. 2008), (v)

гинекологические заболевания (Siristatidis et al. 2010) и ранний диабет

(Shankaracharya et al. 2010). Кроме того, нейронные сети также применялись при анализе данных и диагностической классификации пациентов с неисследованной диспепсией в гастроэнтерологии (Pace and Savarlno 2007) и при поиске биомаркеров (Bradley 2012). Новая, общая, быстрая и адаптивная система диагностики заболеваний была разработана на основе ИНС квантования векторов обучения. Этот алгоритм является первым предложенным адаптивным алгоритмом и может применяться для совершенно разных заболеваний, что подтверждается точностью классификации 99,5%, достигнутой при раке молочной железы и щитовидной железы. Рак, диабет и сердечно-сосудистые заболевания относятся к числу наиболее серьезных и разнообразных заболеваний. Объем данных, поступающих от инструментального и клинического анализа этих заболеваний, достаточно велик, и поэтому разработка инструментов для облегчения диагностики имеет большое значение.

Искуственные нейронные сети представляют собой мощный инструмент, помогающий врачам проводить диагностику и другие принудительные меры. В этом отношении ИНС имеют ряд преимуществ, в том числе:

- способность обрабатывать большой объем данных;

- снижение вероятности пропуска соответствующей информации;

- сокращение времени диагностики. ИНС оказались пригодными для удовлетворительной диагностики различных заболеваний.

Кроме того, их использование делает диагностику более надежной и, следовательно, повышает удовлетворенность пациентов. Однако, несмотря на их широкое применение в современной диагностике, их следует рассматривать только как инструмент, способствующий принятию окончательного решения клиницистом, который в конечном итоге отвечает за критическую оценку выхода нейроннной сети. Методы обобщения и уточнения информативных и интеллектуальных данных постоянно совершенствуются и могут в значительной степени способствовать эффективной, точной и быстрой медицинской диагностике.

Для компьютерной реализации диагностической модели была выбрана система Matlab с интеграцией в среду Мїсгозой Visual C# с помощью библиотеки, содержащей в себе обученную нейронную сеть [35]. В результате была построена модель дифференциальной диагностики заболеваний легких, которая с определенной точностью может отнести индивида к определенной группе из представленных.

1.3

<< | >>

↑

Источник: Васильченко Владислав Алексеевич. ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕССОВ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ В РАМКАХ БИОТЕХНИЧЕСКОЙ СИСТЕМЫ ДИАГНОСТИКИ И ЛЕЧЕНИЯ ПУЛЬМОНОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ. Диссертация на соискание ученой степени кандидата технических наук. Воронеж - 2019. 2019

Еще по теме Обзор математических методов принятия врачебных решений с учетом специфики легочных заболеваний:

- Приборы, системы и изделия медицинского назначения -

- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -