Постановка, классы и дескриптивные элементы задач распознавания изображений
В настоящее время принято выделять три функциональные группы задач, возникающих в процессе работы с изображениями: задачи обработки изображений, задачи анализа изображений и задачи распознавания изображений.
Отнесение той или иной задачи к той или иной группе является в некотором смысле субъективным, поскольку в силу специфики предметной области некоторые задачи, входящие в одну из указанных групп, могут относиться к другим группам. Иногда разграничение делается по тому принципу, что к задачам обработки изображений относятся задачи, в которых как входной, так и выходной информацией служат изображения, в то время как задачей анализа изображений является построение двухмерной модели изображения и вычисление специфических характеристик или признаков, необходимых для ее построения.Для разбиения задач на группы внутри каждой из трех выделенных категорий может быть использована тематическая и техническая классификации (Гуревич, Трусова, 2009). К тематическим задачам относятся задачи, определяющие цель преобразований изображения, а также задачи, которые соответствуют основным видам решений, которые принимаются по информации, представленной в виде изображений. Технические задачи - это элементарные задачи, необходимые для решения тематических задач.
Целью цифровой обработки изображений, как правило, является повышение качества изображений для улучшения его визуального восприятия человеком, обработка изображений для их хранения, представления и передачи в системах машинного зрения или преобразование изображений таким образом, чтобы повысить эффективность их дальнейшего анализа и распознавания.
Ниже перечислены тематические задачи обработки изображений.
1) сжатие изображений - сокращение объема данных, требуемого для представления изображений;
2) улучшение качества изображений - задача, целью которой является либо улучшение визуального восприятия изображения (выявление плохо различимых деталей или подчеркивание интересующих характеристик на изображении, например повышение контраста изображения), либо преобразование его в форму, более удобную для визуального или машинного анализа; при этом не делается попытки приблизить воспроизводимое изображение к некоторому идеализированному оригиналу (это цель задачи восстановления изображений); в некоторых случаях искаженное изображение субъективно воспринимается лучше, чем неискаженный вариант (Pratt, 2007);
3) восстановление изображений - коррекция изображений (устранение геометрических и других искажений, полученных, например, в процессе получения изображений).
К техническим задачам обработки изображений относятся следующие:
1) преобразования, заключающиеся в применении к изображениям арифметических операций (например, сложение, вычитание и т.д.);
2) геометрические преобразования изображений (евклидовы, аффинные, проективные, полиномиальные преобразования и т.д.);
3) яркостная и цветовая коррекция изображений;
4) преобразование контраста изображений;
5) преобразование гистограммы изображений (например, выравнивание или «растягивание» гистограммы);
6) усиление яркостных переходов на изображении;
7) удаление (подавление) шума на изображении;
8) фильтрация изображений;
9) сглаживание изображений;
10) повышение резкости изображений;
11) бинаризация тоновых изображений;
12) кодирование изображений;
13) дискретизация и квантование изображений.
Классификация задач обработки изображений представлена на рис. 1.
Под анализом изображения понимается применение к нему системы преобразований, обеспечивающей извлечение из изображения полезной информации о свойствах изображаемого объекта или процесса. Результатом анализа изображений является приведение изображения к виду, удобному для распознавания, т.е. построение формального описания - модели изображения (Гуревич, 2008).
Ниже перечислены тематические задачи анализа изображений:
1) выделение непроизводных элементов, групп пикселов - обнаружение углов,
Рис. 1. Задачи обработки изображений
яркостных переходов, границ областей, локальных окрестностей, областей, кривых и т.д.;
2) сегментация изображений - разбиение изображения на однородные области или выделение областей с заданными свойствами;
3) построение описаний выделенных непроизводных элементов, групп пикселов;
4) выбор, выделение и вычисление значений признаков изображений, признаков фрагментов изображений или признаков групп пикселов, используемых при построении моделей изображений;
5) построение и описание моделей изображений;
6) описание двухмерных объектов на изображении;
7) реконструкция изображений - восстановление изображений в целом по их фрагментам; восстановление фрагментов изображения (и объектов) на основе непроизводных элементов и признаков, восстановление пропущенных кадров в последовательности изображений.
К техническим задачам анализа изображений относятся следующие:
1) связывание и классификация яркостных переходов;
2) прослеживание, группировка и представление границ областей;
3) построение остова области;
4) выделение, заполнение и анализ контуров;
5) сегментация кривых;
6) разбиение, заполнение, классификация и представление областей.
Классификация задач анализа изображений представлена на рис. 2.
Задачей распознавания изображений является отнесение изображения, его фрагментов или представленных на нем объектов к некоторому классу, либо разбиение множества изображений, его фрагментов или представленных на нем объектов на несколько классов. Иногда в состав задачи распознавания включают приведение изображения к виду, удобному для распознавания, причем на этапе собственно распознавания в качестве исходной информации выступают модели и представления изображения, его фрагментов или воспроизведенных на нем объектов.
В качестве тематических задач распознавания, возникающих при работе с исходной информацией, представленной в виде изображении, выделяют следующие (Журавлев, Гуревич, 1989):
1) преобразование и оценивание моделей и представлений изображений;
2) сопоставление двух изображений в целом для установления их принадлежности к одному классу;
3) сопоставление изображения в целом с набором или серией последовательных (по времени) изображений, представляющих некоторый класс изображений (цель - та же, что и в задаче 2);
4) задачи (2) и (3) для случая нескольких классов;
5) поиск на предъявленном на распознавание изображении некоторой регуляр- ности/нерегулярности (объекта, ситуации), на которую следует обратить внимание, хотя она и не задавалась в априорном перечне эталонов;
Рис. 2. Задачи анализа изображений
6) поиск на предъявленном на распознавание изображении регулярности/не- регулярности/фрагмента заданного вида;
7) разбиение множества изображений на непересекающиеся подмножества (задача автоматической классификации);
8) выбор и формирование траектории задачи распознавания изображений (в постановке задачи распознавания со стандартной обучающей информацией);
9) решение задач (2)-(8) в случаях наличия на изображениях динамических объектов, сложной фоновой обстановки (в т.ч.
динамических и статических помех) и с учетом способа получения, формирования и представления изображений.К техническим задачам распознавания изображений относятся:
1) приведение изображения к виду, удобному для распознавания:
а) оценка информативности и адекватности признаков, использованных при построении модели изображения, фрагментов изображения или представленных на нем объектов;
б) определение и оценивание статистических характеристик признаков изображения, фрагментов изображения или представленных на нем объектов;
в) оценка адекватности модели изображения, фрагментов изображения или представленных на нем объектов;
2) выбор модели алгоритмов распознавания для использования при решении предъявленной задачи распознавания;
3) выбор алгоритма в выбранной модели алгоритмов;
4) адаптация, обучение и модификация выбранного алгоритма применительно к предъявленной задаче распознавания;
5) комбинирование алгоритмов с целью решения предъявленной задачи распознавания и построение алгоритмической схемы, обеспечивающей решение задачи.
Классификация задач распознавания изображений представлена на рис. 3.
В рамках проблемы обработки, анализа и распознавания изображений существуют многочисленные классификации разработанных и используемых методов работы с изображениями, исходя из некоторых общих свойств, так, например, ме-
Рис. 3. Задачи распознавания изображений
тоды сжатия изображений обычно делят на методы сжатия без потерь и методы сжатия с потерями; методы восстановления изображений - на стохастические и детерминированные; пространственные и частотные; адаптивные и неадаптивные; одношаговые, итерационные и рекурсивные; методы фильтрации изображений - на линейные и нелинейные и т.д.
Наиболее естественным является разбиение методов на группы в соответствии с тем, для решения какой задачи или задач тот или иной метод может быть использован. Приведенная выше классификация задач обработки, анализа и распознавания изображений является надежной основой для построения базовой непротиворечивой классификации методов, т.е. каждой выделенной задаче ставится в соответствие группа методов, используемых для ее решения, например, методы фильтрации изображений, методы обнаружения яркостных переходов и т.д.
Одним из наиболее существенных необходимых условий «обоснованного» решения задач анализа и распознавания изображений является построение формального описания исходных данных, в основе которого лежат дескриптивные элементы описания (в классической задаче распознавания - признаковое пространство): их выбор, формирование, вычисление значений, установление логических, функциональных и статистических зависимостей и отношений между дескриптивными элементами, оценивание их информативности. На рис. 4 приведена классификация признаков, обычно используемых в качестве дескриптивных элементов в задачах распознавания.
4.
Еще по теме Постановка, классы и дескриптивные элементы задач распознавания изображений:
- Задачи распознавания образов, анализа и распознавания изображений
- Автоматизация анализа изображений в исследованиях мозга: постановка задач, математические основы, информационные технологии
- Проблема распознавания изображений
- Программное обеспечение анализа и распознавания изображений нейронов
- Анализ концептуальной метамодели и постановка творческих задач.
- Постановка задач
- Постановка задачи на исследование
- Цель и постановка задач исследования
- 1.3. Методы распознавания образов и нечеткая логика в задачах прогнозирования и медицинской диагностики
- Аналитический обзор и постановка задачи на исследование
- Постановка проблемы и ее связь с важными научнопрактическими задачами.
- Постановка этапов и задач исследования работы трибосопряжения эндопротеза тазобедренного сустава
- Результаты оценки физического развития старшеклассников общеобразовательных классов и классов с медико-биологической профилизацией
- Нейросетевая модель распознавания
- Распознавание