ОПТИМИЗАЦИЙ СОСТАВА ПРИЗНАКОВ И ВЫБОР НАИЛУЧШЕГО РЕШАЮЩЕГО ПРАВИЛА
12.4.1. Оптимизация состава признаков. Для сокращения числа признаков используются пошагово-оптимальное сокращение набора признаков, пошагово-оптимальное наращивание набора признаков, пошагово-оптимальное удаление-добавление признаков.
Последняя программа, начиная работу от определенного наборапризнаков, добавляет и (или) удаляет по одному признаку и выбирает на каждом шаге такое из этих действий, которое наилучшим образом сказывается на качестве распознавания модифицированного алгоритма. Результатом этапа является определение подмножества признаков, существенно меньшего, чем исходное, но дающего тот же или лучший результат и выбор наилучшего решающего правила.
12.4.2. Скользящий контроль. По ходу работы возникает много версий решающего правила. Все их надо сравнить в поисках наилучшего. Первое, самое простое, сравнение делается по уровню гипердиагностики при стандартизованном числе опасных ошибок. Однако здесь измерения делаются на материале обучения. Это не совсем корректно и может давать заниженный уровень ошибок, который не подтвердится при дальнейшей эксплуатации. При необходимости более объективного сравнения предлагается в случае отсутствия специальной проверочной группы теоретически обоснованный, но и значительно более дорогой в вычислительном отношении метод скользящего контроля. Суть его состоит в том, что из имеющегося массива изымается одно наблюдение (один больной). На оставшихся синтезируется новое решающее правило с заданным диагностическим порогом (выбирается обычно порог, дающий заданную долю опасных ошибок). Исключенное единственное наблюдение используется в качестве «группы проверки». Затем это наблюдение возвращается в массив, из которого извлекается другое наблюдение. Все повторяется до тех пор, пока все наблюдения не побывают поочередно в роли проверочных. Затем учитывается суммарное число опасных и перестраховочных ошибок. Соответственно формулируется результат проверки, который моделирует проверку на контрольной выборке.
12.4.3. Исследование альтернативных методов расчета ДБ. Существует много методов расчета ДБ для линейных решающих правил, помимо байесова. Все их исследовать, конечно, невозможно; однако предлагается набор программ: 1) для расчета ДБ по схеме рекуррентного исправления ошибок с постоянным коэффициентом коррекции; 2) для пошагового сокращения числа признаков с параллельным пересчетом ДБ на каждом шаге; 3) скользящий контроль распознающих правил.
12.4.4. Проверка на независимой контрольной группе. Завершающим этапом работы должна быть проверка итогового алгоритма на независимой контрольной группе, которая не была известна исследователю в процессе построения алгоритма. Ошибки должны быть проанализированы экспертом; только после успешной проверки алгоритм может быть рекомендован для практического опробования.
Примеры использования описанного пакета рассмотрены в гл. 13 и 17.
Еще по теме ОПТИМИЗАЦИЙ СОСТАВА ПРИЗНАКОВ И ВЫБОР НАИЛУЧШЕГО РЕШАЮЩЕГО ПРАВИЛА:
- Оптимизация состава питательных сред
- Параграф восьмидесятый. Признаки, даваемые густотой состава и мутностью мочи
- Параграф восемьдесят пятый. Признаки, вызываемые совокупностью различных указаний по цвету и составу, и первый из них — маслянистая моча
- Объект и методы исследования. Выбор пространства информативных признаков
- Выбор мощности ультразвука - выбор хирурга
- Метод синтеза решающего модуля для классификации текущего состояния сложной системы в пространстве «резерв СФЕ - ресурс СФЕ»
- Выбор профессии. Возможные затруднения при выборе профессии
- Возможности оптимизации остеогенеза.
- Некоторые замечания об оптимизации медицинских технологических процессов
- 2.методы оптимизации группового принятия решений.
- 4.4. Оптимизация маркетинговой деятельности
- Оптимизация доставки аэрозолей
- Этап 4. Описание и оптимизация процессов.
- Возможные пути оптимизации лаборатории ВРТ
- Глава 9. Общее управление и оптимизация издержек больницы
- 2.4. ЛИПИДНЫЙ СОСТАВ МЕМБРАН