Нейросетевая модель распознавания

Современные компьютерные томографы (ΚΤ) имеют возможность производить снимки с высоким пространственным разрешением. Время такого обследования занимает считанные минуты.

Однако процесс обработки и анализа снимков, а также получение заключения требуют гораздо больше времени. Более того, анализ изображения компьютерного томографа требует высокой квалификации врача.

В связи с этим становится актуальной задача повышение качества и скорости проведения обследований путем автоматизации процесса анализа изображений ΚΤ с помощью программного комплекса.

Первоочередной задачей алгоритмизации процесса распознавания состояний физиологических объектов является определение их нормального строения, а также возможных вариантов отклонения от нормы.

Изображение органов на снимках компьютерного томографа представляется в виде участков низкой плотности (темный цвет) и участков высокой плотности (светлый цвет).

Анализ изображения позволяет выделить обследуемый орган, а также сосуды, мышечную и костную ткань (рисунок 3.1).

В настоящий момент уже проведена обширная работа по разработке алгоритмов и методик обработки изображений для явного выделения отличительных признаков, характерных для пациентов [58, 59].

Рисунок 3.1 - Снимок человека, сделанный с помощью компьютерного томографа

Тем не менее, все эти процессы связаны со значительными затратами времени и усилий. Для дальнейшего повышения точности предсказаний требуются огромные объемы маркированных данных. Обработка изображений и выделение отличительных признаков в наборах данных изображений - весьма сложный и длительный процесс.

Интерпретация рентгеновских снимков для диагностики патологий легких - достаточно трудоемкий процесс, вследствие чего в диагнозах часто бывают разночтения.

Поэтому возникла идея создания алгоритма машинного обучения, способного ставить точные диагнозы на основе сотен тысяч изученных снимков [60].

Рентгенография грудной клетки в настоящее время является лучшим доступным методом диагностики пневмонии [61], которая играет значительную роль в клинической помощи [62] и эпидемиологических исследованиях [63]. Однако обнаружение пневмонии на рентгеновских снимках грудной клетки является сложной задачей, которая зависит от наличия экспертов-радиологов.

Выявление какой-либо закономерности в расположении того или иного рисунка исследуемого органа является главной задачей процесса диагностики.

Возникновение пневмонии в рентгеновских снимках часто расплывчато, может перекрываться с другими диагнозами, и может имитировать многие другие доброкачественные аномалии. Эти особенности вызывают значительные расхождения среди радиологов в диагностике пневмонии [68].

Алгоритм сверточной нейронной сети Chexnet, разработанный учеными из Стэнфордского университета, локализует патологии, идентифицируя их с помощью карт активации класса, которые выделяют области на снимке наиболее важные для классификации конкретных патологий [6]. CheXnet правильно обнаруживает пневмонию, а также локализует области изображения, наиболее показательные для патологии.

Модель ChexNet представляет собой свернутую нейронную сеть на 121 слой, которая получает снимок грудной клетки и выводит вероятность пневмонии с тепловой картой, локализующая области изображения, наиболее показательные для пневмонии.

Использовались методы глубокого обучения и пакетной нормализации. Суть метода состоит в том, что некоторым слоям нейронной сети на вход подаются данные, которые предварительно обработаны и имеют нулевое математическое ожидание и единичную дисперсию[65, 66].

Выборку из 420 снимков из ChestX-ray14 анализировали 4 высококвалифицированных радиолога и разработанная нейронная сеть. У радиологов был опыт 4, 7, 25 и 28 лет соответственно. Радиологи не имели доступа к какой-либо информации о пациенте или информации о распространенности заболевания в данных.

Обнаружение пневмонии при рентгенографии грудной клетки сильно затруднительно для радиологов.

Было установлено, что алгоритм превышает среднюю эффективность радиолога в задаче обнаружения пневмонии. Также был проведен анализ сравнения CheXNet с другими алгоритмами по диагностике на основе базы снимков ChestX- ray14. Сравнение на основе метрики F-меры [67], которая основана на точности и полноте оцениваемой модели, приведено в таблице 3.1. CheXNet достигает значения F-меры 0,435 (95% CI I 0.387, 0.481), что выше, чем средний радиолог 0,387 (95% CI I 0.330, 0.442).

Нейросеть DenseNet, на основе которой построена CheXNet, улучшает поток информации и градиентов через сеть, делая оптимизацию очень глубоких сетей. Далее производится замена полносвязного слоя на тот, у которого есть один выход, после чего применяется сигмоидная нелинейность. Весы сети инициализируются весом от модели, предварительно рассчитанной на ImageNet [69]. Обучение сети происходит с помощью метода стахостической оптимизации Адам со стандартными параметрами (β1 = 0,9 и β2 = 0,999) [70] и использованием мини-групп из 16 снимков. Начальная скорость обучения устанавливается - 0,001, которая уменьшается в 10 раз каждый раз, когда возникают потери на данном этапе, и выбирается модель с наименьшей ошибкой.

Таблица 3.1 - Сравнение радиологов и сверточной нейронной сети CheXNet по F-мере

F-мера (95 % CI)
Радиолог 1	0.383 (0.309, 0.453)
Радиолог 2	0.356 (0.282, 0.428)
Радиолог 3	0.365 (0.291, 0.435)
Радиолог 4	0.442 (0.390, 0.492)
Средний показатель радиологов	0.387 (0.330, 0.442)
CheXNet	0.435 (0.387, 0.481)

Для обучения использовался набор из данных ChestX-ray14, созданный Wang в 2017 году, который содержит 112120 снимков с 30805 уникальными пациентами.

Wang анализирует каждое изображение на предмет 14 различных патологий с использованием методов автоматического извлечения данных на радиологических отчетах [64].

Затем устанавливаются снимки, на которых пневмония является одной из аннотированных патологий, в качестве положительных примеров, а все другие изображения обозначаются, как отрицательные примеры.

Для задачи обнаружения пневмонии случайным образом разбивается набор данных на обучение (28744 пациентов, 98637 изображений), подтверждения (1672 пациента, 6351 изображение) и теста (389 пациентов, 420 изображений). Между наборами нет пересечения пациентов. Прежде чем вводить изображения в сеть, они были уменьшены до размера 224?224 пикселя и нормализовались в зависимости от среднего и стандартного отклонения изображений в наборе обучения ImageNet. Данные обучения были дополнены случайными горизонтальными переворачиванием снимков. Β таблице 3.2 приведены результаты исследований, подтверждающие, что CheXNet превосходит лучшие опубликованные результаты по всем 14 патологиям в наборе данных ChestX-ray14 [64].

Таблица 3.2 - Результаты исследований

Паталоги	Сеть, разработанная Ванг и другими	Сеть, разработанная Яо и другими	CheXNet
Ателектаз	0.716	0.772	0.8094
Кардиомегалия	0.807	0.904	0.9248

Продолжение таблицы 3.2

Плевральный выпот	0.784	0.859	0.8638
Инфильтрация	0.609	0.695	0.7345
Опухоль	0.706	0.792	0.8676
Узлообразование	0.671	0.717	0.7802
Пневмония	0.633	0.713	0.7680
Пневмоторакс	0.806	0.841	0.8887
Консолидация тканей	0.708	0.788	0.7901
Эдема	0.835	0.882	0.8878
Эмфизема	0.815	0.829	0.9371
Фиброз	0.769	0.767	0.8047
Плевральное утолщение	0.708	0.765	0.8062
Грыжа	0.767	0.914	0.9164

На графике, изображенном на рисунке 3.5, показатели качества диагностики четырёх отдельных врачей представлены оранжевыми крестиками, их усреднённый результат - зеленым крестиком, а результаты ChexNet - синей кривой, отображающей изменение пороговых значений, используемых для диагностики.

Рисунок 3.5 - Сравнение результатов выполнения алгоритма CheXNet

и радиологов

Были определены два ограничения для этого сравнения. Во-первых, только фронтальные рентгенограммы были представлены радиологам и нейронной сети.

Во время диагностики было установлено, что до 15% точных диагнозов требуют бокового снимка; поэтому ожидается, что эта настройка обеспечивает заниженную оценку производительности. Во-вторых, ни нейронной модели, ни радиологам не разрешалось использовать историю болезни, которая, как было показано ранее, снижает диагностическую эффективность радиолога при интерпретации рентгенограмм грудной клетки (например, при легочной аномалии с лихорадкой и кашлем пневмония была бы более подходящей, чем инфильтрация или консолидация тканей) [71, 73].

Возникла идея разработки подобного механизма анализа снимков на основе более современных рентгеновских снимки органов - снимков компьютерной томографии, которые получают с помощью сложного программно-технического комплекса, имеющего сверхчувствительные детекторы для регистрации рентгеновского излучения, рентгеновские излучатели, обширный пакет программного

обеспечения, позволяющий получить снимки с высоким пространственным разрешением [150].

За основу был взят алгоритм сверточной сети Densenet, глубина которого составляет 201 слой. Β него были внесены изменения в виде применения функции активации ReLU (сокращение отангл.Tedified linear unit), которая позволяет существенно ускорить процесс обучения и одновременно с этим значительно упростить вычисления (за счёт простоты самой функции). По состоянию на 2017 год эта функция и её модификации (Ndisy ReLU, Leaky ReLU и другие) являются наиболее часто используемой функцией активации в глубоких нейросетях, в частности, в свёрточных.

Также, для обеспечения максимального потока информации между слоями в сети, были соеденены все слои напрямую друг с другом (с соотвествующими разме- рыми карт харатерных признаков). Важным отличием от DensNet также является то, что переда передачей в следующий слой не происходит объединения признаков посредством сумммирования, а происходит объединенния посредством соединения их.

Рисунок 3.6 - 5-слойный dense блок со скоростью роста k = 4.

Следовательно, слой l^thимеет lвходов, состоящий из карт признаков всех предыдущих сверточных блоков.

Его собственные карты свойств передаются всем

последующим слоям. Это приводит к

L( L +1)

соединениям в L-слойной сети, вме

сто Lсоединений, как в традиционной архитектуре.

Возможно, нелогичным эффектом Dense-соединений является то, что требуется меньше параметров, чем в традиционных сверточных сетях, поскольку нет необходимости переобучать карты признаков. Традиционные архитектуры прямой связи можно рассматривать как алгоритмы с состоянием, которое передается от слоя к слою. Каждый уровень считывает состояние с предыдущего уровня и записывает на последующий уровень. Он изменяет состояние, но также передает информацию, которую необходимо сохранить. Некоторые варианты DenseNets показывают, что многие слои вносят очень небольшой вклад и фактически могут быть случайно отброшены во время обучения. Это делает состояние DenseNets схожим с (развернутыми) рекуррентными нейронными сетями, но число параметров DenseNets существенно больше, поскольку каждый слой имеет свои веса. Предлагаемая модифицированная архитектура DenseNet четко различает информацию, которая добавляется в сеть, и информацию, которая сохраняется. В архитектуре DenseNet были установлены узкие слои (например, 12 фильтров на слой). При этом, добавляя лишь небольшой набор карт характеристик к «коллективным знаниям» сети и оставляя неизменными карты характеристик, окончательный классификатор принимает решение на основе всех карт принзнаков в сети. Помимо лучшей эффективности параметров, одним большим преимуществом модифицированной DenseNets является улучшенный поток информации и градиентов по всей сети, что облегчает их обучение. Каждый слой имеет прямой доступ к градиентам из функции потерь и исходного входного сигнала, что ведет к неявному глубокому надзору.

Рисунок 3.6 иллюстрирует компоновку модифицированной DenseNet. Следо

вательнослой получает карты признаков всех предыдущих уровней х₀,...,х_мв

качестве входа:

(26)

где, [χ₀,χ₁...,χ₁] относится к объединению карт объектов, созданных в слоях

0,..., l-1.

Композитная функция. Определение H₁происходит, как составная функция трех последовательных операций: пакетная нормализация (batch normalization (BN)), применение функции ReLU (rectified linear unit) и свертки 3x3(Conv).

Слои пулинга. Операция конкатенации, используемая в формуле (26) не является жизнеспособным, когда размер карт характеристик изменяется. Однако существенной частью сверточных сетей являются слои понижающей дискретизацию, которые изменяют размер карт признаков. Для облегчения понижающей дискретизации в модифицированной архитектуре, сеть разделяется на несколько dense-блоков - рисунок 3.7.

Рисунок 3.7 - Пример модифицированной DenseNet с тремя Dense блоками. Слои между двумя смежными блоками называются переходными слоями и изменяют размеры карты объектов посредством свертки и объединения

Оои между блоками называются переходными слоями, которые выполняют свертку и объединение. Переходные слои, используемые в алгоритме диагностики, состоят из пакетного нормализационного слоя и сверточного слоя 1 x1, за которым следует средний пулирующий слой 2x2.

Скорость роста. Если каждая функция H₁предоставляет kкарт признаков, то отсюда следует, что I^thслой имеекарт признаков, где k₀- количество

каналов во входном слое. Важным отличием модицифированного DenseNet является то, что он может имеет очень узкие слои, например, k = 12. Параметр k называется скоростью роста сети. Относительно небольшая скорость роста достаточна для получения достоверных результатов. Одним из объяснений этого является то, что каждый уровень имеет доступ ко всем предшествующим картам характеристик в своем блоке и, следовательно, к «коллективным знаниям» сети. Можно рассматривать карты признаков как глобальное состояние сети. Каждый слой k добавляет к этой карте свои собственные карты объектов. Скорость роста определяет, сколько новой информации каждый слой вносит в глобальное состояние. После однократного записывания глобального состояния, к нему можно получить доступ из любой точки сети,и, в отличие от традиционных сетевых архитектур, нет необходимости копировать его из слоя в слой.

Свертка. Чтобы еще больше улучшить компактность модели, требуется уменьшить количество карт признаков на переходных слоях. Если dense блок содержит mкарт признаков, то следующему переходному слою необходимо сгенерировать выходные θmкарты признаков, где 0

<< | >>

↑

Источник: Васильченко Владислав Алексеевич. ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕССОВ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ В РАМКАХ БИОТЕХНИЧЕСКОЙ СИСТЕМЫ ДИАГНОСТИКИ И ЛЕЧЕНИЯ ПУЛЬМОНОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ. Диссертация на соискание ученой степени кандидата технических наук. Воронеж - 2019. 2019

Еще по теме Нейросетевая модель распознавания:

- Приборы, системы и изделия медицинского назначения -

- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -