Методы и модели построения виртуальных потоков
Идея построения виртуального потока (ВП) состоит в следующем. Если данные в системе носят поточный характер, сущность которого заключается в том, что имеется множество каналов источников как векторных, так и скалярных
данных (рисунок 3.1), сгруппированных по некоторому принципу, с учетом априорной информации о их информативности, а затем сжатых, вплоть до скаляра, по некоторому формальному методу, то к имеющимся потокам может быть добавлен еще один поток - ВП, представленный своим выходом, сформированным на базе уже имеющихся потоков [14, 44, 45].
Получив модель ВП, можем генерировать данные в этом потоке и объединять их с данными реальных потоков, которые были получены посредством экспериментальных исследований на натуральных объектах (рисунок 3.1).
Рисунок 3.1 - Структура гетерогенного решающего модуля с поточными данными
Для построения системной надстройки, реализующей работу с ВП данных и интеграцию их в данные натурного эксперимента, необходим как соответствующий инструментарий, так и методы, и алгоритмы, позволяющие реализовать модель виртуального потока. В качестве инструментария для формирования ВП используем решающие модули, построенные на различных парадигмах принятия решений - гетерогенные решающие модули. Экспертные знания интегрируются в гетерогенный решающий модуль в виде нечеткого (нечетких) решающего модуля. На выходе нечеткого решающего модуля имеем скалярную величину, которую принято называть коэффициентом уверенности по данному сегменту информативных признаков или частным коэффициентом уверенности [6]. Агрегирование частных коэффициентов уверенности
осуществляется на основе обучаемого классификатора, в качестве которого выступает НС.
Полнота признакового пространства и релевантность самих признаков определяется только экспертом (ЛПР).
Поэтому в структуру рисунок 3.1 целесообразно внести дополнительные связи, которые бы позволили придать больший вес статистическим данным в общем процессе формирования гетерогенного решающего модуля.Полагаем, что есть хотя бы один сегмент информативных признаков N+1, который включает хотя бы один информативный признак, коэффициент уверенности по которому (по сегменту N+1) KyN+1,существенно влияет на качество принимаемых решений. Следовательно, необходима процедура, которая позволит сформировать вектор
для обучающей выборки
где
M- число образцов в обучающей выборке, N- число входов нейронной сети на рис. 1, i- номер образца в обучающей выборке, j - номер входа агрегирующей нейронной сети
«Включение» или «выключение» дополнительного (виртуального) входа осуществлялось посредством управления вариативностью данных, поступающих на него как в процессе обучения, так и при неизвестном образце. Если вариативность входа отсутствует, то он не оказывает влияние на принадлежность объекта к одному из двух альтернативных классов, а, следовательно, и на
результаты классификации [14].
Качество классификации оцениваем через показатели диагностической чувствительности (ДЧ) и диагностической специфичности (ДС). Если количество объектов в тестовом наборе равно M,из них Mp- количество «положительных» объектов, а Mn- количество объектов «отрицательных», причем M=Mp+Mn. Пусть количество ложных пропусков FN,а ложных обнаружений FP,тогда можем подсчитать количество верных обнаружений ТР и верных пропусков TN: TP = Mp - FN; TN = Mn - FP.
На контрольной выборке рассчитываются характеристики классификатора - чувствительность Seи специфичность Sp:
Для количественного определения влияния дополнительного входа на качество классификации нейронной сети целесообразно два показателя (3.4) и (3.5) выразить в виде одного показателя. В качестве такого показателя часто используют диагностическую эффективность (ДЭ). Однако у этого показателя имеется существенный недостаток, связанный с тем, что в результате простого объединения всех ошибок путем манипуляции соотношений положительных и отрицательных объектов в выборке этот показатель можно сделать достаточно большим. При этом классифицирующая система может быть полностью неработоспособна, например, иметь показатель (3.4) или (3.5) равным нулю. Поэтому введем интегральный показатель качества классификации S, способ вычисления которого поясняет рисунок 3.2.
76
Рисунок 3.2 - Определение интегрального показателя качества классификации
На рисунке 3.2 показатели качества классификации определяются кружками черного цвета. Кружки, вписанные в прямоугольник, это результаты классификации по выборкам из одной и той же генеральной совокупности. Для того, чтобы не загромождать рисунок, в прямоугольнике показаны только четыре кружка, которые определяют координаты и размер прямоугольника (лежат на нижней, верхней, правой и левой границах).
Показатель S'определяет площадь заштрихованных прямоугольников, координаты которых определяют левые нижние углы прямоугольников, описывающие черные кружки. Для i-й выборки или группы выборок из одной и той же генеральной совокупности интегральный показатель качества классификации определяется по формуле
где
определяются координатами описывающих прямоугольников.
Экспериментально путем исследования искусственно сформированных выборок было установлено, что ввод («включение») дополнительного
информативного признака (входа) в двухвходовой нейронной сети прямого распространения может повысить точность двух альтернативной классификации на 100% и выше, при разнице первых моментов у третьего признака всего лишь на 10%.
Для проведения этих экспериментальных исследований было создано в среде MATLAB программное обеспечение, позволяющее генерировать виртуальные классы в заданном пространстве ИП, и осуществлять визуализацию распределения классов в пространстве ИП в двумерном или трехмерном пространствах [38, 97, 112]. Для проверки качества классификации нейронной сети NETгенерировалась контрольная выборка, компоненты векторов образцов которой имеют те же самые параметры распределения, что и обучающая выборка [81]. Для оценки степени управляемости показателями качества классификации НС посредством виртуального входа рассмотрим графики зависимости показателя качества классификации (3.6) от величины дисперсии виртуального входа, представленные на рисунок 3.3. Управляемость величиной Sпосредством изменения дисперсии виртуального потока исследовалась при различных размерностях пространства информативных признаков 3, 5 и 7.
Рисунок 3.3 - Влияние дисперсии виртуального входа на качество классификации нейронной сети прямого распространения при размерности пространства информативных признаков три, пять и семь
Представленные на рисунке 3.3 зависимости показывают, что для широкого значения размерностей пространства информативных признаков может быть подобрана дисперсия ВП, которая позволяет управлять показателем качества классификации НС в широком диапазоне. При этом управляемость показателя качества классификации снижается с ростом пространства информативных признаков, откуда следует, что при увеличении размерности пространства информативных признаков необходимо увеличивать число виртуальных потоков.
3.2
Еще по теме Методы и модели построения виртуальных потоков:
- 4.2 Метод синтеза виртуального потока для нейронной сети прямого распространения
- Метод синтеза аппроксиматоров, формирующих виртуальный поток на основе обучаемой нейронной сети
- 4.4 Метод построения универсального аппроксиматора на основе МГУА- моделей
- Гибридные решающие модули для формирования виртуальных потоков
- Структурно-функциональные решения организации виртуальных потоков для двух альтернативных выборок
- Виртуальные потоки на основе биоимпедансных исследований
- Виртуальные потоки в гетерогенных решающих модулях прогнозирования сердечно - сосудистых осложнений
- Разработка метода построения гибридных нечетких моделей для прогнозирования возникновения и осложнений артериальной гипертензии у водителей транспортных средств с учетом энергетических характеристик биоактивных точек
- Порядок построения модели
- Методологические проблемы создания виртуальных моделей