Нейросетевая модель распознавания
Современные компьютерные томографы (ΚΤ) имеют возможность производить снимки с высоким пространственным разрешением. Время такого обследования занимает считанные минуты.
Однако процесс обработки и анализа снимков, а также получение заключения требуют гораздо больше времени. Более того, анализ изображения компьютерного томографа требует высокой квалификации врача.
В связи с этим становится актуальной задача повышение качества и скорости проведения обследований путем автоматизации процесса анализа изображений ΚΤ с помощью программного комплекса.
Первоочередной задачей алгоритмизации процесса распознавания состояний физиологических объектов является определение их нормального строения, а также возможных вариантов отклонения от нормы.
Изображение органов на снимках компьютерного томографа представляется в виде участков низкой плотности (темный цвет) и участков высокой плотности (светлый цвет).
Анализ изображения позволяет выделить обследуемый орган, а также сосуды, мышечную и костную ткань (рисунок 3.1).
В настоящий момент уже проведена обширная работа по разработке алгоритмов и методик обработки изображений для явного выделения отличительных признаков, характерных для пациентов [58, 59].
Рисунок 3.1 - Снимок человека, сделанный с помощью компьютерного томографа
Тем не менее, все эти процессы связаны со значительными затратами времени и усилий. Для дальнейшего повышения точности предсказаний требуются огромные объемы маркированных данных. Обработка изображений и выделение отличительных признаков в наборах данных изображений - весьма сложный и длительный процесс.
Интерпретация рентгеновских снимков для диагностики патологий легких - достаточно трудоемкий процесс, вследствие чего в диагнозах часто бывают разночтения.
Поэтому возникла идея создания алгоритма машинного обучения, способного ставить точные диагнозы на основе сотен тысяч изученных снимков [60].Рентгенография грудной клетки в настоящее время является лучшим доступным методом диагностики пневмонии [61], которая играет значительную роль в клинической помощи [62] и эпидемиологических исследованиях [63]. Однако обнаружение пневмонии на рентгеновских снимках грудной клетки является сложной задачей, которая зависит от наличия экспертов-радиологов.
Выявление какой-либо закономерности в расположении того или иного рисунка исследуемого органа является главной задачей процесса диагностики.
Возникновение пневмонии в рентгеновских снимках часто расплывчато, может перекрываться с другими диагнозами, и может имитировать многие другие доброкачественные аномалии. Эти особенности вызывают значительные расхождения среди радиологов в диагностике пневмонии [68].
Алгоритм сверточной нейронной сети Chexnet, разработанный учеными из Стэнфордского университета, локализует патологии, идентифицируя их с помощью карт активации класса, которые выделяют области на снимке наиболее важные для классификации конкретных патологий [6]. CheXnet правильно обнаруживает пневмонию, а также локализует области изображения, наиболее показательные для патологии.
Модель ChexNet представляет собой свернутую нейронную сеть на 121 слой, которая получает снимок грудной клетки и выводит вероятность пневмонии с тепловой картой, локализующая области изображения, наиболее показательные для пневмонии.
Использовались методы глубокого обучения и пакетной нормализации. Суть метода состоит в том, что некоторым слоям нейронной сети на вход подаются данные, которые предварительно обработаны и имеют нулевое математическое ожидание и единичную дисперсию[65, 66].
Выборку из 420 снимков из ChestX-ray14 анализировали 4 высококвалифицированных радиолога и разработанная нейронная сеть. У радиологов был опыт 4, 7, 25 и 28 лет соответственно. Радиологи не имели доступа к какой-либо информации о пациенте или информации о распространенности заболевания в данных.
Обнаружение пневмонии при рентгенографии грудной клетки сильно затруднительно для радиологов.
Было установлено, что алгоритм превышает среднюю эффективность радиолога в задаче обнаружения пневмонии. Также был проведен анализ сравнения CheXNet с другими алгоритмами по диагностике на основе базы снимков ChestX- ray14. Сравнение на основе метрики F-меры [67], которая основана на точности и полноте оцениваемой модели, приведено в таблице 3.1. CheXNet достигает значения F-меры 0,435 (95% CI I 0.387, 0.481), что выше, чем средний радиолог 0,387 (95% CI I 0.330, 0.442).
Нейросеть DenseNet, на основе которой построена CheXNet, улучшает поток информации и градиентов через сеть, делая оптимизацию очень глубоких сетей. Далее производится замена полносвязного слоя на тот, у которого есть один выход, после чего применяется сигмоидная нелинейность. Весы сети инициализируются весом от модели, предварительно рассчитанной на ImageNet [69]. Обучение сети происходит с помощью метода стахостической оптимизации Адам со стандартными параметрами (β1 = 0,9 и β2 = 0,999) [70] и использованием мини-групп из 16 снимков. Начальная скорость обучения устанавливается - 0,001, которая уменьшается в 10 раз каждый раз, когда возникают потери на данном этапе, и выбирается модель с наименьшей ошибкой.
Таблица 3.1 - Сравнение радиологов и сверточной нейронной сети CheXNet по F-мере
| F-мера (95 % CI) | |
| Радиолог 1 | 0.383 (0.309, 0.453) |
| Радиолог 2 | 0.356 (0.282, 0.428) |
| Радиолог 3 | 0.365 (0.291, 0.435) |
| Радиолог 4 | 0.442 (0.390, 0.492) |
| Средний показатель радиологов | 0.387 (0.330, 0.442) |
| CheXNet | 0.435 (0.387, 0.481) |
Для обучения использовался набор из данных ChestX-ray14, созданный Wang в 2017 году, который содержит 112120 снимков с 30805 уникальными пациентами.
Wang анализирует каждое изображение на предмет 14 различных патологий с использованием методов автоматического извлечения данных на радиологических отчетах [64].Затем устанавливаются снимки, на которых пневмония является одной из аннотированных патологий, в качестве положительных примеров, а все другие изображения обозначаются, как отрицательные примеры.
Для задачи обнаружения пневмонии случайным образом разбивается набор данных на обучение (28744 пациентов, 98637 изображений), подтверждения (1672 пациента, 6351 изображение) и теста (389 пациентов, 420 изображений). Между наборами нет пересечения пациентов. Прежде чем вводить изображения в сеть, они были уменьшены до размера 224?224 пикселя и нормализовались в зависимости от среднего и стандартного отклонения изображений в наборе обучения ImageNet. Данные обучения были дополнены случайными горизонтальными переворачиванием снимков. Β таблице 3.2 приведены результаты исследований, подтверждающие, что CheXNet превосходит лучшие опубликованные результаты по всем 14 патологиям в наборе данных ChestX-ray14 [64].
Таблица 3.2 - Результаты исследований
| Паталоги | Сеть, разработанная Ванг и другими | Сеть, разработанная Яо и другими | CheXNet |
| Ателектаз | 0.716 | 0.772 | 0.8094 |
| Кардиомегалия | 0.807 | 0.904 | 0.9248 |
Продолжение таблицы 3.2
| Плевральный выпот | 0.784 | 0.859 | 0.8638 |
| Инфильтрация | 0.609 | 0.695 | 0.7345 |
| Опухоль | 0.706 | 0.792 | 0.8676 |
| Узлообразование | 0.671 | 0.717 | 0.7802 |
| Пневмония | 0.633 | 0.713 | 0.7680 |
| Пневмоторакс | 0.806 | 0.841 | 0.8887 |
| Консолидация тканей | 0.708 | 0.788 | 0.7901 |
| Эдема | 0.835 | 0.882 | 0.8878 |
| Эмфизема | 0.815 | 0.829 | 0.9371 |
| Фиброз | 0.769 | 0.767 | 0.8047 |
| Плевральное утолщение | 0.708 | 0.765 | 0.8062 |
| Грыжа | 0.767 | 0.914 | 0.9164 |
На графике, изображенном на рисунке 3.5, показатели качества диагностики четырёх отдельных врачей представлены оранжевыми крестиками, их усреднённый результат - зеленым крестиком, а результаты ChexNet - синей кривой, отображающей изменение пороговых значений, используемых для диагностики.
Рисунок 3.5 - Сравнение результатов выполнения алгоритма CheXNet
и радиологов
Были определены два ограничения для этого сравнения. Во-первых, только фронтальные рентгенограммы были представлены радиологам и нейронной сети.
Во время диагностики было установлено, что до 15% точных диагнозов требуют бокового снимка; поэтому ожидается, что эта настройка обеспечивает заниженную оценку производительности. Во-вторых, ни нейронной модели, ни радиологам не разрешалось использовать историю болезни, которая, как было показано ранее, снижает диагностическую эффективность радиолога при интерпретации рентгенограмм грудной клетки (например, при легочной аномалии с лихорадкой и кашлем пневмония была бы более подходящей, чем инфильтрация или консолидация тканей) [71, 73].Возникла идея разработки подобного механизма анализа снимков на основе более современных рентгеновских снимки органов - снимков компьютерной томографии, которые получают с помощью сложного программно-технического комплекса, имеющего сверхчувствительные детекторы для регистрации рентгеновского излучения, рентгеновские излучатели, обширный пакет программного
обеспечения, позволяющий получить снимки с высоким пространственным разрешением [150].
За основу был взят алгоритм сверточной сети Densenet, глубина которого составляет 201 слой. Β него были внесены изменения в виде применения функции активации ReLU (сокращение отангл.Tedified linear unit), которая позволяет существенно ускорить процесс обучения и одновременно с этим значительно упростить вычисления (за счёт простоты самой функции). По состоянию на 2017 год эта функция и её модификации (Ndisy ReLU, Leaky ReLU и другие) являются наиболее часто используемой функцией активации в глубоких нейросетях, в частности, в свёрточных.
Также, для обеспечения максимального потока информации между слоями в сети, были соеденены все слои напрямую друг с другом (с соотвествующими разме- рыми карт харатерных признаков). Важным отличием от DensNet также является то, что переда передачей в следующий слой не происходит объединения признаков посредством сумммирования, а происходит объединенния посредством соединения их.
Рисунок 3.6 - 5-слойный dense блок со скоростью роста k = 4.
Следовательно, слой lthимеет lвходов, состоящий из карт признаков всех предыдущих сверточных блоков.
Его собственные карты свойств передаются всемпоследующим слоям. Это приводит к
L( L +1)
2
соединениям в L-слойной сети, вме
сто Lсоединений, как в традиционной архитектуре.
Возможно, нелогичным эффектом Dense-соединений является то, что требуется меньше параметров, чем в традиционных сверточных сетях, поскольку нет необходимости переобучать карты признаков. Традиционные архитектуры прямой связи можно рассматривать как алгоритмы с состоянием, которое передается от слоя к слою. Каждый уровень считывает состояние с предыдущего уровня и записывает на последующий уровень. Он изменяет состояние, но также передает информацию, которую необходимо сохранить. Некоторые варианты DenseNets показывают, что многие слои вносят очень небольшой вклад и фактически могут быть случайно отброшены во время обучения. Это делает состояние DenseNets схожим с (развернутыми) рекуррентными нейронными сетями, но число параметров DenseNets существенно больше, поскольку каждый слой имеет свои веса. Предлагаемая модифицированная архитектура DenseNet четко различает информацию, которая добавляется в сеть, и информацию, которая сохраняется. В архитектуре DenseNet были установлены узкие слои (например, 12 фильтров на слой). При этом, добавляя лишь небольшой набор карт характеристик к «коллективным знаниям» сети и оставляя неизменными карты характеристик, окончательный классификатор принимает решение на основе всех карт принзнаков в сети. Помимо лучшей эффективности параметров, одним большим преимуществом модифицированной DenseNets является улучшенный поток информации и градиентов по всей сети, что облегчает их обучение. Каждый слой имеет прямой доступ к градиентам из функции потерь и исходного входного сигнала, что ведет к неявному глубокому надзору.
Рисунок 3.6 иллюстрирует компоновку модифицированной DenseNet. Следо
вательно
слой получает карты признаков всех предыдущих уровней х0,...,хмв
качестве входа:
(26)
где, [χ0,χ1...,χ1] относится к объединению карт объектов, созданных в слоях
0,..., l-1.
Композитная функция. Определение H1происходит, как составная функция трех последовательных операций: пакетная нормализация (batch normalization (BN)), применение функции ReLU (rectified linear unit) и свертки 3x3(Conv).
Слои пулинга. Операция конкатенации, используемая в формуле (26) не является жизнеспособным, когда размер карт характеристик изменяется. Однако существенной частью сверточных сетей являются слои понижающей дискретизацию, которые изменяют размер карт признаков. Для облегчения понижающей дискретизации в модифицированной архитектуре, сеть разделяется на несколько dense-блоков - рисунок 3.7.
Рисунок 3.7 - Пример модифицированной DenseNet с тремя Dense блоками. Слои между двумя смежными блоками называются переходными слоями и изменяют размеры карты объектов посредством свертки и объединения
Оои между блоками называются переходными слоями, которые выполняют свертку и объединение. Переходные слои, используемые в алгоритме диагностики, состоят из пакетного нормализационного слоя и сверточного слоя 1 x1, за которым следует средний пулирующий слой 2x2.
Скорость роста. Если каждая функция H1предоставляет kкарт признаков, то отсюда следует, что Ithслой имее
карт признаков, где k0- количество
каналов во входном слое. Важным отличием модицифированного DenseNet является то, что он может имеет очень узкие слои, например, k = 12. Параметр k называется скоростью роста сети. Относительно небольшая скорость роста достаточна для получения достоверных результатов. Одним из объяснений этого является то, что каждый уровень имеет доступ ко всем предшествующим картам характеристик в своем блоке и, следовательно, к «коллективным знаниям» сети. Можно рассматривать карты признаков как глобальное состояние сети. Каждый слой k добавляет к этой карте свои собственные карты объектов. Скорость роста определяет, сколько новой информации каждый слой вносит в глобальное состояние. После однократного записывания глобального состояния, к нему можно получить доступ из любой точки сети,и, в отличие от традиционных сетевых архитектур, нет необходимости копировать его из слоя в слой.
Свертка. Чтобы еще больше улучшить компактность модели, требуется уменьшить количество карт признаков на переходных слоях. Если dense блок содержит mкарт признаков, то следующему переходному слою необходимо сгенерировать выходные θmкарты признаков, где 0
Еще по теме Нейросетевая модель распознавания:
- Нейросетевая модель процесса диагностики на основе данных лабораторного анализа
- Графическая модель распознавания объекта
- 3.6 Разработка системной модели распознавания состояния ПЖ и алгоритма кластеризации переднего плана видеокадра ТАУЗИ и ТРУЗИ
- Задачи распознавания образов, анализа и распознавания изображений
- Распознавание
- Нарушения процесса распознавания
- Проблема распознавания изображений
- Поздние стадии распознавания
- Программное обеспечение анализа и распознавания изображений нейронов
- Ранние этапы процесса распознавания
- Постановка, классы и дескриптивные элементы задач распознавания изображений
- Параграф девятый. Распознавание дней кризиса, когда это сомнительно
- 1.3. Методы распознавания образов и нечеткая логика в задачах прогнозирования и медицинской диагностики
- Распознавание естественных объектов и обработка по принципу «сверху вниз»
- Автоматизация распознавания геометрического образа 1' контура сечения
- Параграф тринадцатый. Вздутие в матке2 и распознавание его
- Параграф третий. Способы распознавания состояния сердца
- Молекулярные механизмы распознавания, адгезии и миграции клеток крови