РАЗРАБОТКА РАСПОЗНАЮЩЕГО АЛГОРИТМА
13.2.1. Отбор исходных данных. Исходными данными послужили карты вызова СП. ГТФМИ отбирались по специальному журналу для их регистрации в РО Л НИИ ДИ, куда госпитализируют в Ленинграде всех больных с этим диагнозом.
В разработку взяли все те случаи, для которых удалось найти карты вызова СП с заполненными ФИБ-36 на обороте. В итоге мы располагали картами СП для 114 случаев ГТФМИ из 237, прошедших за 1981 — 1985 гг. через РО ЛНИИДИ. В качестве группы больных обучающей выборки, не имевших ГТФМИ, взяли 264 больных, в основном, впоследствии побывавших в РО, с тяжелыми инфекционными УС. Для всех них был собран катамнез — выписной диагноз того отделения, куда СП доставила ребенка либо куда он был переведен. Для поиска использовали автоматизированный регистр УС системы УКАС-Д. Таким образом, общая численность обучающей выборки составила 378 больных.Затем был проведен анализ контингента тяжелых инфекционных больных СП но отчету 20-й подстанции СП за 1983 г. По диагнозам врачей СП были выделены состояния, описанные в табл. 13.1. Именно по этим состояниям определялись априорные вероятности отдельных состояний в обучающей выборке.
13.2.2. Выбор признаков. Всеми исполнителями работы, включая экспертов — сотрудников ЛНИИДИ М. А. Дадиомову, М. Н. Сорокину, был составлен первичный ФИБ. В него вошли все признаки, которые могли представлять интерес для диагностики и которые была надежда выявить из карт вызова педиатрической СП, содержащих ФИБ-36. Часть признаков бралась из формализованной части ФИБ, другую пытались «выуживать» из текстового описания врача. Следует отметить, что по отношению к МИ в формализованной части отсутствовали важные признаки, что серьезно ухудшило качество исходных данных, так как в них появилось много пропусков и элемент субъективности. В целом исходные данные следует оценить как недостаточно качественные (отметим попутно, что это — типичная ситуация для начальных стадий подобных разработок).
13.2.3. Кодирование исходных данных. Кодирование данных из карты вызова по формату первичного ФИБ для ГТФМИ оказалось чрезвычайно трудоемкой
Перечень и априорные вероятности дифференцируемых состояний (анализ контингента госпитализированных педиатрической СП инфекционных больных за 1983 г.)
| Группа заболеваний (состояний) | Верифи катор | Число случаев | Априорные вероятности, % |
| ГТФМИ | 7 | 56 | 1,3 |
| Другие формы МИ | 6 | 333 | 7,6 |
| Неменингококковые нейроинфек | 5 | 1086 | 24,8 |
| ции ОРВИ, пневмонии, ангины, плев | 4 | 2652 | 60,6 |
| риты Кишечные инфекции, гастриты | 3 | 70 | 1,6 |
| Детские инфекции | 2 | 136 | 3,1 |
| Прочие | 1 | 42 | 1,0 |
| Всего | - | 4375 | 100 |
операцией. Оно было выполнено врачами СП В. П. Антоновой и Е. Я. Безман; на каждую карту уходило не менее 15 мин. Основная трудность заключалась в поиске ответов на вопросы кодировочного листа в неформальном тексте врача СП.
13.2.4. Первичный анализ: выбор признаков, выбор градаций и вычисление ДБ.
Из 70 признаков кодировочного листа диагностическими было 53 (8 признаков несли сопутствующую информацию, 9 характеризовали состояние после лечения СП).
По 7 из 53 диагностических признаков данных оказалось слишком мало, хотя среди них были априорно очень важные (озноб, температура конечностей). Для двух признаков различия между ГТФМИ и не ГТФМИ оказались недостоверными и, вдобавок, нелогичными, что мы объясняем некачественными данными. У 9 признаков информативность оказалась низкой. В итоге осталось 37 признаков из первоначальных 53, которые и были использованы для построения распознающего алгоритма.При выборе градаций признаков преследовались две цели: 1) получить наибольшую информативность при условии статистической значимости различий между классами; 2) обеспечить соответствие результатов медицинским знаниям.
Для качественных признаков основная работа заключалась в таком объединении соседних градаций, чтобы удовлетворить поставленным целям. Для количественных признаков (артериальное давление, температура тела, частота пульса и др.) были построены сравнительные распределения и выбраны диапазоны. При этом анализировались сами признаки, признаки в сопоставлении с температурой тела (двумерные), признаки с учетом температуры тела, рассчитанные в процентах от возрастной нормы. Состав группы обучения отличался от истинных априорных вероятностей, которые, однако учитывались при расчетах.
При постановке задачи, отборе признаков, их градаций, при выборе именно угрозометрической модели было учтено большое число соображений, которые относятся к врачебным знаниям. В процессе вычисления ДБ и поиска лучшего набора признаков и градаций происходило пополнение базы знаний, в частности уточнение количественных характеристик признаков.
13Л. АНАЛИЗ ПОЛУЧЕННОГО ИСХОДНОГО РЕШАЮЩЕГО ПРАВИЛА
После расчета ДБ по отобранным признакам с установленными градациями фактически был получен исходный вариант решающего правила. Это правило использовало 37 признаков. Для оценки его качества была проведена проверка («экзамен») на самой группе обучения и проверка методом скользящего контроля, определившая доли верных ответов, опасных и перестраховочных ошибок.
Однако гипердиагностика в этой задаче принципиально двоякая: 1) ВГД — это те случаи, когда правило дает ответ «ГТФМИ», а на самом деле имеет место совсем другое заболевание — не нейроинфекция. Таким больным не показана вся предписанная при ГТФМИ терапия, их не надо везти в Л НИИ ДИ. Таким образом, эти ошибки объективно вредны, хотя и не опасны для жизни; 2) ОГД включает как ВГД, так и те случаи, когда правило дает ответ «ГТФМИ» для больных, в действительности имеющих МИ негипертоксической формы или другую нейроинфекцию (НВГД). Для этих больных перестраховка нежелательна, но и не столь страшна — их все равно надо везти в ЛНИИДИ, а терапия им не повредит.В нашем случае во всех анализировавшихся вариантах диагностический порог устанавливался на уровне 6% опасных ошибок, что соответствует 7 больным из 114 ГТФМИ в группе обучения. Эти 7 больных по экспертной оценке специалистов ЛНИИДИ и СП в принципе не могли быть правильно диагностированы по имеющимся в карте данным. Здесь были либо слишком ранние стадии или атипичные формы, либо некачественное заполнение карт врачом СП. Во всех этих случаях врачебная диагностика СП также содержала грубые ошибки. Было признано, что ошибки диагностики на этих картах неизбежны. Исходный вариант алгоритма с 37 признаками имел характеристики, приведенные в столбце 3 табл. 13.2.
Напомним, что между числом опасных (недооценочных) и перестраховочных (гипердиагностических) ошибок имеется простая связь: изменяя диагностический порог, можно снизить число опасных ошибок, но соответственно возрастет число перестраховок. Указанные в табл. 13.2 соотношения этих двух видов ошибок предлагаются как наилучшие, но могут быть выбраны и другие.
Для сравнения была проанализирована врачебная диагностика больных с верифицированным диагнозом ГТФМИ. Под «неполным объемом терапии ГТФМИ» понимается выполнение всех мероприятий, указанных в методических рекомендациях, кроме инфузионной терапии. Полученные оценки приведены в табл. 13.3.
Таблица 13.2
Характеристики решающих правил в сравнении с врачебной диагностикой
| Верифицированные диагнозы и объем выборок, принятый за 100% | Вид характеристики | Исходный вариант правила | Итоговый вариант правила | Врачебная оценка с использованием ФИБ-36 | |
| Проверка на группе обучения | Скользя щий контроль | ||||
| 1 | 2 | 3 | 4 | 5 | 6 |
| Число признаков | 37 | 1 | 4 | ||
| ГТФМИ 114 | Опасные ошибки (от всех | 6,1 | 6,1 | 7,9 | 36* |
| больных (100%) | ГТФМИ), % | ||||
| Не ГТФМИ 264 | ОГД (от всех не | 15,6 | 8,6 | 9,3 | 7 |
| больных (100%) | ГТФМИ), % | ||||
| В том числе ВГД (от всех не | 4,6 | 3,6 | 3,7 | 0 | |
| ГТФМИ), % | |||||
* Опасной ошибкой считался также диагноз МИ без диагноза ГТФМИ и без терапии хотя бы в неполном объеме, необходимой при ГТФМИ в догоспитальном периоде.
Развернутое сравнение врачебной и формализованной диагностики по всем больным группы обучения с ГТФМИ (скользящий контроль)
Анализ результатов сравнения (табл.
13.2 и 13.3) показывает, что врачи допускают 36% опасных недооценок (от числа ГТФМИ) и около 7% ОГД (от числа не ГТФМИ). ВГД среди больных с не МИ вообще не было. Формализованная диагностика в сравнении с врачебной пропускает значительно меньше ГТФМИ, но дает значительно больше перестраховок (такое соотношение более целесообразно, учитывая опасность ГТФМИ).13.4.
Еще по теме РАЗРАБОТКА РАСПОЗНАЮЩЕГО АЛГОРИТМА:
- Билет 19.Технологический алгоритм разработки теста.
- 3.6 Разработка системной модели распознавания состояния ПЖ и алгоритма кластеризации переднего плана видеокадра ТАУЗИ и ТРУЗИ
- 2.1.1 Паттерн-распознающие рецепторы
- Алгоритм принятия диагностического решения
- алгоритмы сжатия видеоинформации
- 3.3 Алгоритм управления процессами принятия решений
- Алгоритм TDIDT.
- Перспективы дальнейшей разработки темы
- Алгоритм управления системы поддержки принятия решений.
- Синтез алгоритмов функционирования подсистем первичной и вторичной обработки
- Разработка конструкции трикотажного шлема
- 3.3 Алгоритм управления процессами принятия решений
- Разработка пористых полимерныхматриксов-носителей для нейротрансплантатов
- Разработка электродной системы