<<
>>

МЕТОДИКА РАБОТ ПО ПОСТРОЕНИЮ РАСПОЗНАЮЩИХ АЛГОРИТМОВ

12.2.1. Выбор диагностических признаков и их градаций. Наилучший известный нам способ решения этой задачи — методика диагностических игр И. М. Гельфанда [76]. В процессе каждой диагностической игры идет диагностика одного больного из группы обучения, когда эксперт (клинический специалист

высокой квалификации) получает информацию только от ведущего, а ведущий тщательно фиксирует вопросы эксперта и их последовательность.

На этом этапе необходимо установить градации для качественных признаков, учитывая следующие соображения: 1) градации следует устанавливать возможно подробнее, но их число не должно превышать 10, включая 0 («неизвестно»); 2) формулировка каждой градации должна быть точной и исчерпывающей, любой специалист должен понять ее однозначно; 3) количественные признаки на этом этапе разбивать на градации не надо.

12.2.2. Проектирование структуры записи файла массива обучения (массив контроля будет точно такой же структуры).

В начале записи должны идти 3 числа, хранящие идентификацию наблюдения. Рекомендуется, чтобы все наблюдения массивов обучения и контроля имели сквозную последовательную нумерацию от единицы, отраженную в первом из чисел, а второе и третье числа хранили номера первичных документов (например, номера ФИБ и момента наблюдения).

После верификатора (одного или нескольких), расположенного за идентифицирующей частью, следует расположить все качественные признаки в порядке их нумерации. Вслед за качественными признаками надо предусмотреть поля для номеров градаций всех количественных признаков. После этого в записи следует оставить запас для последующего расширения.

Далее отводится место для количественных признаков в порядке их нумерации по кодировочному листу и запасное место для новых признаков или вычисляемых (производных) величин. В конце записи можно разместить любые дополнительные данные.

12.2.3.

Описание записей, создание файла и подготовка файла расшифровок.

По определенной структуре записи создается описание записи в формате фобрина. Имена для полей разумно выбирать короткие, чтобы распечатка помещалась в строку листинга. Создается словарь фобрина, в него вносится описание записи, домена; создается последовательный файл, под него распределяется место согласно оценке требуемого объема.

По первичному ФИБ сразу создается файл расшифровок, содержащий номера и тексты качественных признаков и их градаций. Файл расшифровок будет использован многими программами комплекса для расшифровки признаков в распечатках.

12.2.4. Подготовка управляющего файла. Создается управляющий файл, используемый всеми программами комплекса. Этот файл содержит 16 строк, хранящих настройку программ на конкретную ситуацию. Важно отметить, что каждая из программ комплекса берет из управляющего файла только те данные, которые ей нужны; присутствие всех строк в нем, однако, обязательно.

Обозначения, принятые для верификатора, должны следовать принципу монотонности; все «легкие» должны иметь верификаторы меньшие, чем все «средние»; все «средние», в свою очередь, — меньшие, чем все «тяжелые». Таким образом, весь диапазон значений верификатора от 1 до 9 разделяется на 3 поддиапазона в естественном порядке снизу вверх: легкие, средние, тяжелые. Границы поддиапазонов и указываются в программе.

12.2.5. Кодировка массивов обучения. £сли исходным материалом являются истории болезни или другие подобные документы, то это - технически самый трудоемкий этап работы, причем в условиях низкого качества медицинской документации его должен выполнять специалист-медик.

12.2.6. Ввод массивов в файлы. Ввод информации с заполненных бланков в файл может производиться разными путями, которые здесь не рассматриваются. В любом случае результатом этапа является загруженный файл обучения. Его следует выверить и внести все необходимые исправления, после чего он готов для работы.

12.3.1.

Выбор границ интервалов и вычисление номеров градаций для количественных признаков. Для этого предназначена соответствующая программа. Программа обрабатывает файл обучения и строит 2 распределения количественного признака, отдельно для состояний А і (легких) и А2 (тяжелых) в одних осях. Границы диапазона и число интервалов запрашиваются в диалоге. Для каждого интервала явно отмечается, какие больные здесь превалируют (легкие или тяжелые) и насколько, а также ДБ, информативность и достоверность в том виде, в каком они будут вычислены после вычленения этого интервала в отдельную градацию. Анализ этих результатов позволяет разумно выбрать границы интервалов градаций. Это можно сделать также в соответствии с рекомендациями разделов

9.4.1, 9.4.2, 9.7 и 10.6.3, для чего существует специальная программа.

Для каждого количественного признака в записи существует 2 поля: в одном хранится его абсолютное значение, а в другом — номер градации (в области качественных признаков). Заполнение поля номера градации должно производиться автоматически.

После выбора градаций количественных признаков необходимо дополнить файл расшифровок вновь полученными текстами названий градаций, в том числе для признаков, вычисляемых по определенным формулам на основе первичных данных.

12.3.2. Первичный анализ материала. Первичный анализ материала выполняется специальной программой. Она обрабатывает массив обучения и для каждой градации каждого качественного признака подсчитывает число попавших в эту градацию «легких» и «тяжелых» наблюдений. На основе этих количеств определяются процентные соотношения, ДБ, информативность, достоверность по ТКФ. «Средние» здесь считаются «легкими». Изучение результатов дает возможность получить представление о характере материала обучения, роли отдельных признаков и отдельных градаций в различении классов. Выполняется ранжирование признаков по информативности. Малоинформативные признаки исключаются.

Затем обеспечивается создание нового файла обучения. Для описания требуемой перекодировки составляется заказ, в котором описаны новый порядок качественных признаков и способ перекодировки градаций.

12.3.3. Расчет ДБ и анализ качества первой версии алгоритма. Полученный новый файл обучения опять обрабатывают и вновь анализируют результаты; при необходимости подправляют файл перекодировки, расшифровок и вновь повторяют этап перекодировки — до тех пор, пока результаты не станут удовлетворительными. В результате получен набор ДБ, составляющий первую версию распознающего алгоритма.

Для анализа качества распознавания каждой построенной версии алгоритма распознавания могут быть использованы программы построения графиков ошибок и программы проверки. Эти программы позволяют построить функции зависимости опасных и гипердиагностических ошибок от значения сумм ДБ (см. рис. 10.3, стр. 96), выбрать порог, найти все ошибочно распознаваемые карты и распечатать расшифрованные значения их признаков. Анализ ошибок может помочь выявить направления совершенствования алгоритма.

12.4.

<< | >>
Источник: Гублер Е. В.. Информатика в патологии, клинической медицине и педиатрии.—Л.: Медицина,1990.— 176 с.. 1990

Еще по теме МЕТОДИКА РАБОТ ПО ПОСТРОЕНИЮ РАСПОЗНАЮЩИХ АЛГОРИТМОВ:

  1. МЕТОДИКА РАБОТ ПО ПОСТРОЕНИЮ РАСПОЗНАЮЩИХ АЛГОРИТМОВ
  2. ОГЛАВЛЕНИЕ
  3. БИБЛИОГРАФИЧЕСКИЙ СПИКОК
  4. БИБЛИОГРАФИЧЕСКИЙ СПИСОК
  5. библиографический список.
- Pediatrics - Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -